当互联网用户用搜索引擎寻找信息时,搜索引擎会上千万个页面中筛选出符合你搜索主题的相关页面,并根据网页相关度进行排名。
当然搜索引擎也并不是完美的,有时候某些与搜索关键字没有关系的网页通过某种作弊手段也可以排在搜索结果页面的前面,但总的来说搜索引擎功能是非常强大的。
正像搜索引擎蜘蛛程序的创始人Brian Pinkerton所说 “你可以想象一下当你走到图书管理员面前只对她说”旅游“的话,他一定会很茫然的看着你。”
这只是一个比方。在现实生活中,图书管理员并不会傻傻的看着你,而是会更加详细地问你相关的问题以便更好了解你所需要的图书。
但是搜索引擎毕竟不是人,他没法象图书管理员那样来问你进一步的问题,也不能依靠过去的经验来判断。
那么搜索引擎是如何从上百万的网页中筛选出和搜索内容相关的网页呢?搜索引擎也有一系列的规则,也就是通常所说的算法。尽管大型搜索引擎算法的具体内容是商业机密不可能当众公布,但是大致也遵循以下几个原则。
关键词在网页中的位置和密度
排名算法中最重要的一条就是关键词在网页中的位置和密度。
还记得以上提到过的图书管理员的例子吗?我们可以继续来看一下:当图书管理员想要找出匹配你“旅行“的相关图书时。他们首先会看这本书的名称。而搜索引擎遵循的是一样的道理,如果你网页中的被搜索关键词的位置在TITLE标签里的话,那么它被搜索引擎收录的几率远远高于放在标题里的关键词。
搜索引擎还会检索是否搜索关键词出现在网页的标题处或是文本内容的前几段。通常排名靠前的网页都是在网页右上角放搜索关键词的。
关键词密度是另外一个重要因素。搜索引擎会根据网页的文本字数来分析关键词的密度。搜索引擎认为关键词密度较高的网页与搜索关键词有更大的相关性。
属于自己的特色
大部分搜索引擎算法遵循的规律都大致相同,但是每个搜索引擎都有其各自的特点,因此当你用同一个关键词去不同的搜索引擎搜索时,你会得到完全不同的搜索结果。
因为一些搜索引擎会收录比其他搜索引擎更多的网页,有些则是收录网页的频率比较高。而搜索结果的不同也表明了没有两个搜索引擎会收录完全相同的网页。
如果搜索引擎认为某些网站实行了作弊行为,他会对网站做出惩罚或不再将它收录。最常见的作弊手段就是在一个页面上写满许许多多的关键字来提高关键字的密度企图在搜索结果页面中排名靠前,搜索引擎侦查作弊网站的方法很多,其中包括来自于用户的投诉。
网站外部原则
搜索引擎对于那些惯使用作弊手段来提高网站排名的站长非常有经验了。有些精通算法的站长甚至于千方百计去的寻找“逆向工程师 “去破解搜索引擎所使用的关键词位置/密度系统。基于这个原因,所有的大型搜索引擎都使用网站外部原则。
网站外部的因素是站长无法轻易影响的。其中最主要的就是网站链接分析,搜索引擎通过分析网页之间的互相链接,它可以判断网页的内容、重要性以及在搜索结果页面中的排名。此外,搜索引擎还会鉴别出那些企图依靠先进技术来实现伪造链接的网站。
另一个网站外部因素就是点击率的检测。简单的来说就是搜索引擎会观察用户点击搜索结果页面的情况。它会逐渐降低那些排名靠前但是点击率少的网站,提高排名靠后但是点击率高的网站,通过这个方法,让那些虚假链接的网站无处遁形。 |