TrustRank 算法
  • 更新时间:2024-11-29 01:32:59
  • 网站建设
  • 发布时间:1年前
  • 533

TrustRank 算法

TrustRank是近年来比较受关注的一种基于链接的排名算法。 TrustRank可以翻译为“信任指数”。

TrustRank算法最初来自于2004年斯坦福大学和雅虎的联合研究,用于检测垃圾网站,并于2006年获得专利。TrustRank算法的发明者还专门发表了一份PDF文档解释TrustRank算法的应用。感兴趣的读者可以在以下网址下载PDF文件:http://www.vldb.org/conf/2004/Rs15P3.PDF

TrustRank算法并不是Google提出的,但是由于Google的市场占有率最大,TrustRank也是Google排名中很重要的一个因素,所以有人误认为TrustRank是Google提出的。更让人迷惑的是,谷歌曾经申请过TrustRank作为商标,但TrustRank商标中的TrustRank指的是谷歌检测含有恶意代码的网站的方法,而不是排名算法中的信任指数。

TrustRank 算法基于一个基本假设:好网站(北京网站制作)很少链接到坏网站。反之则不然,也就是说,坏网站很少链接到好网站的说法是不正确的。相反,很多垃圾网站会链接到权威度高、信任度高的网站,企图提高自己的信任度。

基于这样的假设,如果我们能够选择能够100%信任的网站,那么这些网站的TrustRank将是最高的,而这些TrustRank最高的网站所链接的网站仍然会非常高,即使索引是略低。同样,二级可信网站链接的三级网站的信任度继续下降。由于种种原因,好的网站难免会链接到一些垃圾网站,但点击距离越接近一级网站,传递的信任指数越高,点击距离越远,信任度越高。指数会更高。会依次下降。这样,通过TrustRank算法,可以为所有网站计算出相应的信任指数。离一级网站越远,成为垃圾网站的可能性就越大。

计算TrustRank值,首先需要选择一批种子网站,然后人工检查网站设置一个初始TrustRank值。选择种子网站有两种方法。一种是选择外向链接最多的网站,因为TrustRank 算法计算外向链接衰减的指数。导出链接多的网站,某种意义上可以理解为具有比较高的“反向PR值”。

另一种选择种子网站的方法是选择PR值高的网站,因为PR值越高,出现在搜索结果页面的概率就越大。这些网站是TrustRank算法最关注、需要调整排名的网站。那些PR值很低的页面在没有TrustRank算法的情况下排名也很低,TrustRank的计算意义不大。

据测算,通过选取约200个网站(高端建站)作为种子,可以更准确地计算出所有网站的TrustRank值。

TrustRank随链接关系递减的公式有两种计算方式。一种是随着链接数衰减,也就是说,如果第一层页面的TrustRank指数为100,第二层页面衰减到90,第三层衰减到80。第二种计算方法是赋值TrustRank值是根据出链数来计算的,即如果一个页面的TrustRank值为100,页面上有5个出链,每个链接将传递TrustRank值的20%。衰减和分配这两种计算方法通常结合使用,总体效果是TrustRank值随着链路级别的增加而逐渐降低。一旦推导出网站的页面和TrustRank 值,排名就会受到两种方式的影响。一种是根据TrustRank值对传统排名算法选择的多个页面进行比较,重新调整排名。另一个是设置一个最小的TrustRank 值阈值。只有超过此阈值的页面才被认为具有足够的质量进入排名。低于阈值的页面将被视为垃圾页面并从搜索结果中过滤掉。

虽然TrustRank算法最初是作为一种检测垃圾邮件的方法,但在目前的搜索引擎排名算法中,TrustRank的概念被更广泛地使用,往往会影响大多数网站的整体排名。 TrustRank 算法最初是针对页面级别的。现在在搜索引擎算法中,TrustRank值通常是在域名层面上表示的。整个域名的信任指数越高,综合排名能力越强。

我们专注高端建站,小程序开发、软件系统定制开发、BUG修复、物联网开发、各类API接口对接开发等。十余年开发经验,每一个项目承诺做到满意为止,多一次对比,一定让您多一份收获!

本文章出于推来客官网,转载请表明原文地址:https://www.tlkjt.com/web/13778.html
推荐文章

在线客服

扫码联系客服

3985758

回到顶部