揭秘搜索引擎优化过程中的反SEO作弊研究
SEO简称为搜索引擎优化。其主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,知识兔从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。
在国外,SEO开展较早,那些专门从事SEO的技术人员被Google称之为searchengineoptimizers(SEOers)。由于Google是目前最大的搜索引擎分享商,Google也成为了全世界SEOers的主要研究对像。为此Google官方网站专门有一页介绍SEO,并表明 Google对SEO的态度。
SEO的出现最早是研究搜索同HACK找寻漏洞的技术发展中引渡过来的,一部分人发现了这个可以左右搜索排名的机制问题,而在世界顶级搜索引擎Google的飞速发展及排名算法机制不断更新的情况下,SEO技术及队伍也在近些年来飞速发展和壮大,人们对它的认可和重视也与日俱增。
一、SEO作弊
1、什么是seo作弊
搜索引擎作弊,或称为SEO作弊、SEOSpam、搜索引擎垃圾等,是指为了提高在搜索引擎中展现机会和排名的目的,欺骗搜索引擎的行为。
2、如何作弊
由于技术型搜索引擎在网站排名过程中完全由蜘蛛程序自动完成,没有人工参与,这为那些针对排名原理而采用欺骗蜘蛛程序的手段分享了成功的可能性。在SEO的发展过程中,一直伴随着关于作弊方法的讨论,成为业界关注的话题。成为SEO必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段
a)、关键字堆砌。为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及URL地址等地方重复书写某关键词的行为(stuffing)。
b)、虚假关键词。通过在META中设置与网站内容无关的关键词,如在title中设置热门关键词,知识兔以达到误导用户进人网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
c)、隐形文本/链接。为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索弓I擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐藏链接是在隐形文本的基础上,在其他页面添加指向目标优化页的行为。
d)、重定向(re-direct)。使用刷新标记(metarefresh)、CGI程序、Java、JavaScript或其他技术,当用户进人该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
e)、偷换网页。也称诱饵行为(bait-&-switch),是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
f)、复制站点或内容。通过复制整个网站或部分网页内容并分配以不同域名和服务器,知识兔以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜像站点(miiwsites)是此中典型。
g)、桥页/门页(bridge/doorway/portal/entry)。计对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态人口,或为不同的关键词建立不同内页也会用到类似方法。但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而巳。
h)、隐形页面(cloakedpage)。指同一个网址下对不同的访问者选择性地返回不同的页面内容,搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
i)、重复注册。违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
j)、垃圾链接。加人“链接工厂”(亦称大量链接机制)是由大量网页交叉链接而构成的一个网络系统。一个站点加入“链接工厂”后,它可得到来自该系统中所有网页的链接,同时作为交换,它需要“奉献”自己的链接,知识兔以此方法来提升链接得分。
二、搜索引擎反作弊
1、为什么?索引擎要反作弊
对于上述提到的搜索引擎作弊行为,几乎所有搜索弓I擎都是反对的。SEOspam的破坏性是相当巨大的,它不仅直接破坏了搜索引擎网站赖以生存的关键所在,即每日数以亿计的用户搜索体验,同时也破坏了搜索引擎获得收益的主要来源,如竞价排名以及相关广告。
搜索引擎反作弊类同于互联网的病毒与反病毒。因此,作为搜索引擎,对待垃圾和作弊网站的态度也是高度一致:惩罚或者删除。几乎所有的?索引擎官方站点也公布了一些原则,对作弊行为进行鉴定,并给出了对应的惩罚措施。比如2005年3月26日凌晨4点,忍无可忍的Google突然发力,将一大批spam 站点清除。(近期关注度较高的6.25和6.28百度针对低质量站点进行反作弊调整就K掉了很多低质和作弊站点,有兴趣的可以看下《2012.8.25百度再次大面积k站之浅谈》《百度官方公告算法再次升级,将影响作弊站点收录及低质站点的排序》)
2、反作弊
搜索引擎作弊其实不仅仅是损害了搜索引擎拥有者的利益。从长远看,如果知识兔网站的本身质量并没有提高,而是通过搜索引擎作弊来吸引浏览者,那么网站最终还是得不到用户的青睐,无法留住浏览者,最终受到伤害的还是网站本身。
虽然通过技术手段不可能完全杜绝各种搜索引擎作弊行为,但还是能够有效减少这些行为。解决办法如下:
a)、加强页面内容的智能判断。对于关键字堆砌和虚假关键字这两种作弊行为,应加强智能判断。例如从页面的〈body〉