TrustRank算法:TrustRank算法-中文百科頻道

算法簡介

TrustRank算法是來比較受關注的基于鍊接關系的排名算法。TrustRank可以翻譯為“信任指數”。

TrustRank算法

TrustRank算法最初來自于2004年斯坦福大學和雅虎的一項聯合研究，用來檢測垃圾網站，并且于2006年申請專利。TrustRank算法發明人還發表了一份專門的PDF文件，說明TrustRank算法的應用。感興趣的讀者可以在下面這個網址下載PDF文件：

TrustRank算法并不是由Google提出的，不過由于Google所占市場份額最大，而且TrustRank在Google排名中也是一個非常重要的因素，所以有些人誤以為TrustRank是Google提出的。更讓人糊塗的是，Google曾經把TrustRank申請為商标，但是TrustRank商标中的TrustRank指的是Google檢測含有惡意代碼網站的方法，而不是指排名算法中的信任指數。

基于這個假設，如果能挑選出可以百分百信任的網站，這些網站的TrustRank評為最高，這些trustrank最高的網站所連接的網站信任指數稍微降低，但也會很高。與此類似，第二層别信任的網站鍊接出去的第三層網站，信任度繼續下降。由于種種原因，好的網站也不可避免的會接到一些垃圾網站，不過離第一層網站點擊距離越近，所傳遞的信任指數就越高，第一級網站點擊距離越遠，信任指數将依次下降。這樣trustrank算法，就能給所有網站計算出相應的信任指數，離第一層網站越遠，成為垃圾網真的可能性就越大。

算法描述

計算TrustRank值首先要選擇一批種子網站，然後人工查看網站，設定一個初始TrustRank值。挑選種子網站有兩種方式，一種是選擇導出鍊接最多的網站，因為TrustRank算法就是計算指數随着導出鍊接的衰減，導出鍊接多的網站，在某種意義上可以理解為“逆向PR值”比較高。

另一種挑選種子網站的方法是選PR值高的網站，因為PR值越高，在搜索結果頁面出現的概率就越大，這些網站才正是TrustRank算法最關注的、需要調整排名的網站，那些PR值很低的頁面，在沒有TrustRank算法時排名也很靠後，計算TrustRank意義就不大了。

根據測算，挑選出兩百個左右網站作為種子，就可以比較精确地計算出所有網站的TrustRank值。

計算TrustRank随鍊接關系減少的公式有兩種方式。一種是随鍊接次數衰減，也就是說如果第一層頁面TrustRank指數是100，第二層頁面衰減為90，第三層衰減為80。第二種計算方法是按導出鍊接數目分配TrustRank值，也就是說，如果一個頁面的TrustRank值是100，頁面上有5個導出鍊接，每個鍊接将傳遞20%的TrustRank值。衰減和分配這兩種計算方法通常綜合使用，整體效果都是随着鍊接層次的增加，TrustRank值逐步降低.

得出網站和頁面的TrustRank值後，可以通過兩種方式影響排名。一種是把傳統排名算法挑選出的多個頁面，根據TrustRank值比較，重新做排名調整。另一種是設定一個最低的TrustRank值門檻，隻有超過這個門檻的頁面，才被認為有足夠的質量進入排名，低于門檻的頁面将被認為是垃圾頁面，從搜索結果中過濾出去。

雖然TrustRank算法最初是作為檢測垃圾的方法，但在的搜索引擎排名算法中，TrustRank概念使用更為廣泛，常常影響大部分網站的整體排名，TrustRank算法最初針對的是頁面級别。在搜索引擎算法中，TrustRank值也通常表現在域名級别，整個域名的信任指數越高，整體排名能力就越強。

TrustRank算法

算法簡介

算法描述

相關詞條

相關搜索

其它詞條