協同過濾

協同過濾

用于産品感興趣的分析
協同過濾常常被用于分辨某為特定顧客可能感興趣的東西,這些結論來自于對其他相似顧客對哪兒些産品感興趣的分析。協同過濾以其出色的速度和健壯性,在全球互聯網領域炙手可熱。[1]協同過濾推薦(CollaborativeFilteringrecommendation)是在信息過濾和信息系統中正迅速成為一項很受歡迎的技術。最著名的電子商務推薦系統應屬亞馬遜網絡書店,顧客選擇一本自己感興趣的書籍,馬上會在底下看到行“CustomerWhoBoughtThisItemAlsoBought”,亞馬遜是在“對同樣一本書有興趣的讀者們興趣在某種程度上相近”的假設前提下提供這樣的推薦,此舉也成為亞馬遜網絡書店為人所津津樂道的一項服務,各網絡書店也跟進做這樣的推薦服務如台灣的博客來網絡書店。
  • 中文名:協同過濾
  • 外文名:Collaborative Filtering recommendation
  • 别名:
  • 表達式:
  • 提出者:
  • 适用領域:
  • 簡介:電子商務推薦系統的一種主要算法
  • 優點:快速生成高質量的推薦效果

算法簡介

電子商務推薦系統的一種主要算法。

協同過濾推薦(CollaborativeFilteringrecommendation)是在信息過濾和信息系統中正迅速成為一項很受歡迎的技術。與傳統的基于内容過濾直接分析内容進行推薦不同,協同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,形成系統對該指定用戶對此信息的喜好程度預測。

與傳統文本過濾相比,協同過濾有下列優點:

(1)能夠過濾難以進行機器自動基于内容分析的信息。如藝術品、音樂;

(2)能夠基于一些複雜的,難以表達的概念(信息質量、品位)進行過濾;

(3)推薦的新穎性。

正因為如此,協同過濾在商業應用上也取得了不錯的成績。Amazon,CDNow,MovieFinder,都采用了協同過濾的技術來提高服務質量。

缺點是:

(1)用戶對商品的評價非常稀疏,這樣基于用戶的評價所得到的用戶間的相似性可能不準确(即稀疏性問題);

(2)随着用戶和商品的增多,系統的性能會越來越低;

(3)如果從來沒有用戶對某一商品加以評價,則這個商品就不可能被推薦(即最初評價問題)。

因此,現在的電子商務推薦系統都采用了幾種技術相結合的推薦技術。

案例:AMAZON個性化推薦系統先驅(基于協同過濾)

AMAZON是一個虛拟的網上書店,它沒有自己的店面,而是在網上進行在線銷售。它提供了高質量的綜合節目數據庫和檢索系統,用戶可以在網上查詢有關圖書的信息。如果用戶需要購買的話,可以把選擇的書放在虛拟購書籃中,最後查看購書籃中的商品,選擇合适的服務方式并且提交訂單,這樣讀者所選購的書在幾天後就可以送到家。

AMAZON書店還提供先進的個性化推薦功能,能為不同興趣偏好的用戶自動推薦盡量符合其興趣需要的書籍。AMAZON使用推薦軟件對讀者曾經購買過的書以及該讀者對其他書的評價進行分析後,将向讀者推薦他可能喜歡的新書,隻要鼠标點一下,就可以買到該書;AMAZON能對顧客購買過的東西進行自動分析,然後因人而異的提出合适的建議。讀者的信息将被再次保存,這樣顧客下次來時就能更容易的買到想要的書。此外,完善的售後服務也是AMAZON的優勢,讀者可以在拿到書籍的30天内,将完好無損的書和音樂光盤退回AMAZON,AMAZON将原價退款。當然AMAZON的成功還不止于此,如果一位顧客在AMAZON購買一本書,下次他再次訪問時,映入眼簾的首先是這位顧客的名字和歡迎的字樣。

算法細分

item-basedCF

基于item的協同過濾,通過用戶對不同item的評分來評測item之間的相似性,基于item之間的相似性做出推薦;

user-basedCF

基于user的協同過濾,通過不同用戶對item的評分來評測用戶之間的相似性,基于用戶之間的相似性做出推薦;

發展簡史

以下就“協同過濾”發展曆史上幾個重要的裡程碑做相關闡述:

Tapestry(1992)

這是最早應用協同過濾系統的設計,主要是解決Xerox公司在PaloAlto的研究中心資訊過載的問題。這個研究中心的員工每天會收到非常多的電子郵件卻無從篩選分類,于是研究中心便發展這項實驗性的郵件系統來幫助員工解決這項問題。其運作機制大緻如下:

個人決定自己的感興趣的郵件類型;個人旋即随機發出一項資訊需求,可預測的結果是會收到非常多相關的文件;從這些文件中個人選出至少三筆資料是其認為有用、會想要看的;系統便将之記錄起來成為個人郵件系統内的過濾器,從此以後經過過濾的文件會最先送達信箱;以上是協同過濾最早的應用,接下來的裡程碑為GroupLens。

GroupLens(1994)

這個系統主要是應用在新聞的篩選上,幫助新聞的閱聽者過濾其感興趣的新聞内容,閱聽者看過内容後給一個評比的分數,系統會将分數記錄起來以備未來參考之用,假設前提是閱聽者以前感興趣的東西在未來也會有興趣閱聽,若閱聽者不願揭露自己的身分也可以匿名進行評分。和Tapestry不同之處有兩點,首先,Tapestry專指一個點(如一個網站内、一個系統内)的過濾機制;GroupLens則是跨點跨系統的新聞過濾機制。再來,Tapestry不會将同一筆資料的評比總和起來;GroupLens會将同一筆資料從不同使用者得到的評比加總。

GroupLens具有以下特點:開放性:所有的新聞閱聽者皆可使用,雖然系統委托BetterBitBureau設計給分的系統,但若有不同的評分機制也适用于GroupLens。方便性:給分并不是一件困難的事情且溝通上非常方便,評分結果容易诠釋。規模性:有可能發展成大規模的系統,一旦發展成大規模,儲存空間與計算成本問題顯得相當棘手。隐密性:如果使用者不想讓别人知道他是誰,别人就不會知道。由此可以看出,現今網絡各個推薦系統的雛形已然形成,在GroupLens之後還有性質相近的MovieLens,電影推薦系統;Ringo,音樂推薦系統;VideoRecommender,影音推薦系統;以及Jster,笑話推薦系統等等。乃至于今日的YouTube、aNobii皆是相似性值得網絡推薦平台,較不同的是經過時間推移,網絡越來越發達,使用者越來越多,系統也發展得越來越嚴密。

電子商務的推薦系統

最著名的電子商務推薦系統應屬亞馬遜網絡書店,顧客選擇一本自己感興趣的書籍,馬上會在底下看到一行“CustomerWhoBoughtThisItemAlsoBought”,亞馬遜是在“對同樣一本書有興趣的讀者們興趣在某種程度上相近”的假設前提下提供這樣的推薦,此舉也成為亞馬遜網絡書店為人所津津樂道的一項服務,各網絡書店也跟進做這樣的推薦服務如台灣的博客來網絡書店。另外一個著名的例子是Facebook的廣告,系統根據個人資料、周遭朋友感興趣的廣告等等對個人提供廣告推銷,也是一項協同過濾重要的裡程碑,和前二者Tapestry、GroupLens不同的是在這裡雖然商業氣息濃厚同時還是帶給使用者很大的方便。以上為三項協同過濾發展上重要的裡程碑,從早期單一系統内的郵件、文件過濾,到跨系統的新聞、電影、音樂過濾,乃至于今日橫行互聯網的電子商務,雖然目的不太相同,但帶給使用者的方便是大家都不能否定的。

相關詞條

相關搜索

其它詞條