SEO实战密码——60天网站流量提高20倍(txt+pdf+epub+mobi电子书下载)


发布时间:2021-04-12 10:16:50

点击下载

作者:昝辉

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

SEO实战密码——60天网站流量提高20倍

SEO实战密码——60天网站流量提高20倍试读:

前言

这一切都是因为SEO。

2006年4月,我开始写“SEO 每天一贴”博客。开始写时没有什么特别的目的,只是想记录、分享自己的一点SEO心得。从2003年起我就以网络为生,主要就是靠SEO推广网站。国外SEO人员写博客、分享经验很普遍,所以我就想把自己了解的一些知识、经验写下来。说实话,那时候对国内SEO行业一无所知。后来我了解到,2006年时国内很少有人公开分享SEO技巧。也许正因如此,“SEO每天一贴”很快成为国内被引用、转载和抄袭最多、最受欢迎的SEO博客。

2006年6月,Robin、小鹏、石头和我,四个没见过面的SEO爱好者,共同发起成立SEO研究团队“点石互动”,掀起国内研究、分享SEO的热潮。

今天,点石论坛已经没有了当初的热闹,我的博客因为写书而停写很久了,被我们传染而开始写SEO博客的人也大多停止更新了。但回想过去几年,可以清楚地看到,SEO从一个大家热烈讨论的话题变成所有网站的基本要求,喧嚣过去,SEO观念已深入到所有做网站的人的脑海里。

在博客上分享SEO毕竟不可能很系统、详细,很多人希望我写一本SEO书。本来我觉得SEO内容网上已经很多了,而且搜索行业变化太快,信息容易过时,所以出版社找我写书时,我写出了《网络营销实战密码》,而不是一本SEO书。但几个原因促使我还是写了这本《SEO实战密码——60天网站流量提高20倍》。

首先,虽然SEO概念普及了,但在很多人眼里,SEO 和作弊、欺骗是一回事儿。这是对SEO的极大误解。写一本书,详细介绍健康的、正规的白帽 SEO,才能让更多的人知道什么是真正的SEO。

其次,我在出版上一本书《网络营销实战密码》时一再强调,那不是一本SEO书,但还是有很多读者抱怨SEO内容太少,可能大家印象里Zac这个名字和SEO联系太深了。写这本专门讨论SEO的书,也是为了弥补上一本书给读者带来的缺憾。

再次,搜索和SEO行业变化是很快,但SEO的很多原则并没什么变化,甚至可以说,五六年来,SEO 基本思路和方法都没有本质变化。这使我确信,现在写出来的SEO原则和大部分技巧在未来几年不会过时。新工具、新技巧可以在博客里和本书再版时更新。

最后,看过几本SEO书及网上很多新手的反馈意见后觉得,一些刚开始学SEO的人需要一个手把手示范的过程。小范围单独指导是个方法,但无法扩展,要对更多人有益,还是得靠书籍。所以本书包含了一个非常详细、篇幅近6万字的真实案例。这是本书独特的地方,在其他地方还没有见到过这样的案例。

本书详细、系统地介绍了正规、有效的SEO实战技术,包括关键词研究、网站架构优化、页面优化、外链建设、效果监测及策略修正,以及作弊与惩罚、排名因素列表等专题。

第1章简单讨论为什么要做SEO。

第2章介绍搜索引擎工作原理,为深入了解SEO打下良好基础。

第3章讨论竞争研究,包括对关键词、竞争对手及自己网站的深入研究。

第4、5两章介绍站内优化,包括网站结构和页面优化。

第6章探讨外部链接建设。

第7章介绍SEO效果监测及策略调整。

第8章介绍SEO作弊及搜索引擎惩罚。

第9、10两章讨论不好归类的一些专题,包括SEO观念、垂直搜索的排名等。

第11章介绍常用的SEO工具。

第12章简单讨论SEO项目管理中需要注意的问题。

第13章是Google和百度排名因素调查及列表,供SEO人员快速参考。

第14章是一个详细的正在进行中的真实案例。

附录是SEO术语。

我相信这本书不仅对需要做SEO的人有帮助,如个人站长、公司SEO或网络营销人员、SEO服务公司人员,对所有与网站有关的人都有参考价值,如网站设计人员、程序员、大专院校网络营销和电子商务专业学生、网络公司技术和营销团队、传统商业公司电子商务团队等,因为SEO已经是对所有网站的基本要求。

读者可以访问实战密码系列书专用网站 http://www.zaccode.com,分享SEO心得,提出问题,交流SEO技巧。

感谢Google反垃圾组负责人Matt Cutts为本书写序,以及中日韩文反垃圾组负责人朱建飞的热情帮助。

感谢电子工业出版社李冰等编辑对本书进度一拖再拖的理解,以及在写书过程中的所有支持。

感谢很多SEO同行一直以来无私与我分享案例、数据、发现。感谢读者和SEO爱好者们在我写书过程中的精神支持,你们的询问、鼓励、耐心在我一年多的写作时间中一直陪伴着我。

最后,感谢家人的支持、理解,尤其感谢我太太,在照顾我生活的同时还要帮我整理所有书稿。作者2010年10月8日第1章为什么要做SEO这将是非常简短的一章。如果您已经知道SEO对网站成功的意义,可以直接跳到第2章,开始学习SEO具体方法。1.1什么是SEO

SEO是英文Search Engine Optimization的缩写,中文意译为“搜索引擎优化”。

简单地说,SEO是指从自然搜索结果获得网站流量的技术和过程。

复杂但更严谨些的定义:

SEO 是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中的关键词自然排名,获得更多流量,从而达成网站销售及品牌建设的目标。

SEO的完整意义和过程,随着读者阅读本书会越来越清晰。这里只对定义做简单说明。

在某种意义上看,SEO是和搜索引擎博弈的过程。做SEO,虽然不需要会编程,也不需要了解搜索引擎的技术细节,但理解搜索引擎的基本工作原理是必需的,不然只能是知其然,而不知其所以然,不能从根本上理解SEO技巧。了解搜索引擎原理,很多看似“新”的问题都可以迎刃而解。

网站的优化包括站内和站外两部分。站内优化指的是站长能控制的所有网站本身的调整,如网站结构、页面HTML代码。站外优化指的是外部链接建设及行业社群的参与互动,这些活动不是在网站本身进行的。

SEO的研究对象是搜索引擎结果页面上的自然排名部分,通常在页面左侧,所以有百度左侧排名、Google左侧排名等说法,与付费的搜索广告没有直接关系。

获得和提高关键词自然排名是SEO效果的表现之一,但最终目的是获得搜索流量,没有流量的排名是没有意义的。因此,关键词研究(针对有人搜索的关键词优化)、文案写作(吸引用户点击)十分重要。进一步说,SEO追求的是目标流量,能最终带来赢利的流量。

网站的最终目标是完成转化,达到直接销售或品牌建设的目的。SEO、排名、流量都是手段。SEO是网络营销的一部分,遇到与用户体验、业务流程等有冲突的情况时,一切以完成最多转化为最高原则,切不可为SEO而SEO。1.2为什么要做SEO

亲身做过网站的人都很清楚SEO的重要性。不排除有极小一部分网站不希望有人来看,比如我和太太给女儿写的博客,我们从不向别人提起,只有少数几个至亲好友知道,那几乎算是我们的私人日记,并不想让更多人看到。但99.9%的网站是希望有人来看的,而且人越多越好。不管网站赢利模式和目标是什么,有人来访问是前提。

而SEO是给网站带来访问者的最好方法,没有“之一”。

虽然也有其他网站推广方法,运用得当时效果非凡。但总体来说,没有其他方法像SEO一样这么吸引人:

• 搜索流量质量高。其他方法是把网站推到用户眼前,用户本没有访问你的网站的意图。来自搜索的用户是在主动寻找你的网站,目标非常精准,转化率高。

• 性价比高。SEO 绝不是免费的,但确实是成本相对较低的,尤其是站长自己掌握SEO技术时。

• 可扩展性。只要掌握了关键词研究和内容扩展方法,网站可以不停地增加目标关键词及流量。

• 长期有效。网络广告、PPC 一旦停止投放,流量立即停止。事件营销效果明显,但话题过去,流量也就消失。而只要不作弊,搜索排名一旦上去,可以维持相当长时间,流量源源不断。

• 提高网站易用性,改善用户体验。SEO 是很少的(如果不是唯一的话)必须修改网站才能实现的推广方法之一,而SEO对页面的要求很多是与易用性相通的。

还没有亲手做过网站的读者,要明白为什么要做SEO,其实也很简单,跟着下面这个逻辑:

• 近几年网络购物发展突飞猛进,非互联网圈子的人也知道网络是个刚刚开始被开采的金矿。

• 搜索引擎是网民寻找、比较、确定商品的最重要渠道,是电子商务的主要驱动力之一。

• 搜索引擎不是站长开的,不是你想排到前面就排到前面。想办法把自己的网站排名提高、获得搜索流量,这就是SEO。

根据艾瑞网的调查,2009年中国网络购物交易规模为2483.5亿元,同比增长93.7% 。2007年和2008年增长都在100%以上,如图1-1所示。

网络购物占社会消费品零售总额的比例也在不断提高中,如图1-2所示。图1-1 中国网购市场规模图1-2 中国网购占社会消费品零售总额比例

这么大的网购规模代表了强劲需求,网民不在你的网站买,就得在别的网站买,谁进入用户视野,谁就赢得更多的付费客户。

那么,网民是怎样研究、比较产品和商家的呢?

中国互联网信息中心2010年7月发布《第26次中国互联网络发展状况统计报告》,网民最常见的网络应用如图1-3所示。图1-3 最常见的网络应用

除了听音乐、看新闻,用户最常用的就是搜索引擎,超过即时通信和电子邮件。从某种意义上说,搜索引擎已经成为一种习惯,一种生活方式,成为很多人获取信息的最重要方式。有了搜索引擎,我甚至都不用字典了,遇到记不清的单词,上 Google 输入印象中的拼法,Google就会告诉我正确拼法。

艾瑞的统计也表明,中国搜索引擎用户覆盖率已经达到80%以上,如图1-4所示。图1-4 搜索引擎用户覆盖率

根据互联网数据中心DCCI发布的报告,网民日常消费信息网上来源排在第二的是搜索引擎,如图1-5所示。图1-5 网民日常消费信息网上来源

国外的网络购物更是主要由搜索引擎驱动。网络分析公司Compete于2010年2月做了一项问卷调查,其中一个问题是“网上购物时你最常用哪个工具?”结果如图1-6和表1-1所示。图1-6 网上购物时最常用的工具表1-1 网上购物时最常用的工具

搜索引擎是用户网购时最常用的工具,5个人里就有3个说他们网上购物时总是或经常使用搜索引擎,远远超出其他工具或网站。对英文网站有了解的都知道,欧美用户更依赖搜索引擎,遇到任何问题,首先想到的就是上搜索引擎搜索。

越来越多的网站认识到搜索流量的重要性,这也体现在搜索引擎市场规模的快速增长上。2009年中国搜索引擎市场规模达69.5亿元,相比2008年的50.3亿元,年同比增长38.2%,如图1-7所示。图1-7 中国搜索引擎市场规模

由于经济危机,2009年增长已经算是缓慢,2002年到2008年的增长率都远远超过38.2%。

搜索引擎占网络广告总规模比例也在不断增长中,这说明一部分广告主将预算更多地倾斜至性价比更高的搜索营销上,如图1-8所示。

图1-7、图1-8的搜索引擎市场规模指的是搜索广告(PPC)部分,而不是SEO的投入。搜索广告营收可以从搜索引擎和广告主公司获得较为准确的数字,但SEO的投入分散在大大小小的公司及个人站长上,又包含很多无形的投入,难于计算。

搜索引擎不仅驱动电子商务,对传统线下销售也有巨大影响。2007年7月,雅虎和市场调查公司comScore发布了一项2006年4月至2007年1月所做的跟踪调查,结果表明,搜索极大地促进了线下销售。当消费者接触到来自搜索的产品促销信息时,每在线上花1美元,就会在线下花16美元。而没有接触搜索信息的消费者,每在线上花1美元,会在线下花6美元。

相信很多读者也有这种经历:线上研究对比,线下购买。因此,就算是最传统的线下生意,无法线上销售,能被用户在搜索引擎找到,也至关重要。图1-8 搜索引擎占网络广告市场比例1.3搜索引擎简史

随着互联网的发展,搜索引擎的出现是必然的。就像传统图书馆一样,收藏的书籍、文件多了,必然出现管理、查找困难,索引和搜索就成为必需的了。实际上,搜索引擎原理在很大程度上源于传统文件检索技术。

网上资源数量远超出我们个人所能想象与掌控,没有搜索引擎,我们几乎无法有效利用这些资源,也就没有互联网的今天。

当今社会化媒体如日中天,诸如Facebook、Twitter等应用的使用人次、网站流量、社会影响力已经达到甚至超过Yahoo! 、Google等互联网巨人。有这样一种倾向和观点,网民现在寻找信息更多地是靠Facebook、Twitter,而不是搜索引擎。也许搜索引擎已经过时了?

其实大可不必担心。也许Google、百度会没落,会消失,但搜索引擎不会。就算依靠Facebook、Twitter,或者以后出现的什么新网络服务寻找信息,用户要寻找信息时,一样要在搜索框输入关键词,这还是搜索,只不过搜索信息来源可能从搜索引擎收录的页面数据库变成Facebook、Twitter内部数据库,排名算法从页面相关性、链接变成会员、好友的推荐程度,但数据来源及算法的改变都不能改变用户对搜索的需要,也不会改变搜索的基本形式。

只要搜索存在,就有哪条信息排在前面的问题,就有SEO的存在。也许搜索引擎这个名字变了,SEO也只是需要改个名字而已。

搜索是近20年互联网变化最快的领域之一,这种变化不仅体现在搜索技术突飞猛进和对网络经济的巨大推动上,搜索引擎本身的合纵连横、兴衰起伏也是精彩纷呈,常令人有眼花缭乱、瞠目结舌之感。

了解搜索引擎的发展历史有助于SEO人员理解搜索引擎营销的发展、变革,对未来有更准确的预期。本节就简要列出搜索引擎发展史上的重要事件,其中很多事件对今天搜索以及SEO行业的形态有至关重要的影响。

1990年

第一个互联网上的搜索引擎 Archie出现,用于搜索 FTP 服务器上的文件。当时基于HTTP协议的Web还没有出现。

1993年

6月,第一个Web搜索引擎World Wide Web Wanderer出现,只收集网址,并没有索引文件内容。

10月,第二个Web搜索引擎ALIWEB出现,开始索引文件元信息(也就是标题标签等信息),也还没有索引文件主体内容。

1994年

1月,Infoseek创立,其搜索服务稍后才正式推出。Infoseek是早期最重要的搜索引擎之一,允许站长提交网址是从Infoseek开始的。百度创始人李彦宏就是Infoseek的核心工程师之一。

4月,Yahoo!由David Filo和 Jerry Yang(杨致远)创立。当时还没有注册yahoo.com域名,网站建在斯坦福大学的域名上。Yahoo!最初不是真正的搜索引擎,而是人工编辑的网站目录,创始人亲自把收集到的有价值的网站列在Yahoo!目录中。当网站数量还不大时,可以实现人工编辑,既为用户提供方便,又保证了信息质量,Yahoo!迅速成长为网络巨人。

4月,第一个全文搜索引擎(索引文件全部内容)WebCrawler推出。起初是华盛顿大学的一个研究项目。1995年被美国在线AOL收购,1996年又被Excite收购。2001年停止研发自己的搜索技术,网站成为元搜索引擎(整合、显示多个第三方搜索引擎结果,被称为元搜索引擎)。

6月,Lycos创立,迅速成为最受欢迎的搜索引擎之一。

1995年

1月,yahoo.com域名注册。4月,Yahoo!公司正式成立。

12月,Excite搜索引擎正式上线,成为早期流行的搜索引擎之一。2001年其母公司破产,被InfoSpace购买。2004年被Ask Jeeves收购。

12月,AltaVista 创立,迅速成为最受欢迎的搜索引擎,堪称当时的Google。 AltaVista在搜索领域做了很多开创性工作,页面排名以站内因素为主。站长提交网址后收录非常迅速。

12月,Infoseek 成为网景浏览器的默认搜索引擎。网景,Netscape,当时浏览器市场的绝对统治者,曾占市场份额的90%以上。后来随着免费的微软 IE 浏览器推出而衰落, 2008年正式停止研发和技术支援。

1996年

3月,Google作为创始人Larry Page和Sergey Brin 在斯坦福大学的研究项目开始,当时的名称是BackRub,2007年才改名为Google。

4月,Yahoo!上市。

5月,Inktomi创立,是早期重要的搜索技术提供商,本身并没有供用户使用的搜索网站或界面,而是专门提供搜索技术给其他公司。Inktomi最先开始付费收录,后来被Google等的成功证明行不通。

5月,Hotbot创立,开始时使用Inktomi数据。1998年被Lycos收购,后来转型为元搜索引擎,显示来自Google、FAST、Teoma和Inktomi的结果。也是初期颇流行的搜索引擎之一。

11月,Lycos收录6千万文件,成为当时最大的搜索引擎。与今天搜索引擎数据库相比,小巫见大巫。

1997年

4月,Ask Jeeves上线,2006年改名为Ask,是唯一一个至今仍实质存在并有一定市场份额的早期搜索引擎。创立时标榜的特点是“自然语言”搜索,用户可以用问句形式搜索。起初雇用大量编辑进行人工编辑搜索结果,显然(至少今天看来很显然)这种模式行不通,后来不得不使用其他搜索引擎数据。

1998年

2月21日,GoTo(后来改名为Overture)正式开始Pay For Placement(出售搜索结果位置)服务,谁付的钱多,谁就排在前面。在当时饱受非议,是后来所有主流搜索引擎最主要收入来源PPC的始祖。

Direct Hit创建,搜索结果的用户点击率是其排名因素的重要部分,Direct Hit因此流行一时,但很快也因此造成搜索质量大幅下降。今天搜索引擎算法中引入用户浏览数据,早在初期搜索引擎就有探索并留下了教训,处理不好,就会被作弊者利用。

1998年中,迪斯尼成为Infoseek的控股公司,将Infoseek转型为门户。早期搜索引擎没有明确赢利模式,遇到搜索质量下降、没有收入等困难时,常常采用转型为门户的方法,寄希望于像 Yahoo!那样赚网络显示广告的钱,但几乎没有成功转型的例子。这为 Google等后来者坚持提高搜索技术、坚持简洁的搜索核心业务提供了前车之鉴。

同样在1998年,AltaVista被卖给Compaq,1999年10月Compaq也将AltaVista转型为门户,AltaVista走向没落。

1998年中,Yahoo!放弃1996年开始使用的AltaVista ,转而使用Inktomi 的搜索数据。早期Yahoo!只在其目录中没有用户寻找的网站时才显示来自真正搜索引擎的数据。

9月,Google公司正式成立。

MSN搜索推出,不过微软很长时间没有重视搜索引擎,一直到2004年,MSN Search都在使用其他提供商的搜索数据和技术。

1999年

5月,AllTheWeb.com创建,是搜索技术公司FAST展示其技术的平台。

6月,Netscape放弃Excite,开始使用Google搜索数据,对Google来说是个里程碑。

1999年中,迪斯尼将 Infoseek 流量转入 Go.com,曾经流行一时的搜索引擎 Infoseek消失。Go.com几经波折,目前无声无息。

Lycos停止自己的搜索技术,开始使用AllTheWeb 数据。

2000年

1月,Ask Jeeves以5亿美元收购搜索引擎Direct Hit,但并没有进一步发展。2002年初Direct Hit正式结束。

1月18日,百度成立。起初作为搜索技术提供商向其他网站提供中文搜索服务和数据。

5月,Lycos被西班牙公司Terra Networks收购,改名为Terra Lycos。互联网泡沫破灭后,Terra Lycos渐渐式微。

7月,Yahoo!开始使用Google搜索数据,以自己当时最强大的网上品牌和流量培养出日后最强大的竞争对手。

2000年中,GoTo.com基本放弃用自己网站吸引用户的做法,开始向多家搜索引擎及网站提供付费搜索服务,包括MetaCrawler.com, DogPile.com, Ask Jeeves, AOL, Netscape等。这可能是GoTo.com(后来的Overture)的重大失误之一,一个具开创意义的模式,其品牌名称却没能被普通用户知道,也因此无法与Google这种家喻户晓的品牌抗衡。

10月,Google推出AdWords,以CPM模式,也就是按显示付费,提供搜索广告服务。这个模式并不成功。

2001年

9月,Ask Jeeves收购Teoma,一个与Google一样重视链接的搜索引擎,曾经被认为是可能与Google抗衡的搜索引擎之一。

10月,百度作为搜索引擎正式上线,直接独立提供搜索服务。中文搜索迅速进入百度时代。

2002年

3月,Google Adwords推出PPC形式,也就是按点击付费,成为今天Adwords的主流。PPC搜索广告由Overture发明,由Google发扬光大。从PPC开始,Google Adwords才真正被客户接受和广泛使用,Google成为充分利用搜索的网上赚钱机器。

5月,美国在线AOL放弃Inktomi ,开始使用Google搜索数据。

10月,Yahoo!放弃在用户搜索时先返回 Yahoo!目录中数据的做法,完全改为显示Google搜索数据。Yahoo!目录至今还是最重要的网站目录。

12月,Yahoo!收购苦于没有良好赢利模式的Inktomi,为2003年一系列收购和整合拉开序幕。Yahoo!显然希望拥有自己的搜索技术,而不想继续依赖其他搜索引擎如Google。

2003年

2月18日,Overture宣布收购AltaVista 。除了广告平台,Overture也拥有了自己的搜索技术。

2月25日,Overture宣布收购FAST的搜索技术部门,FAST拥有AllTheWeb.com,也向另一个著名的搜索网站Lycos提供搜索数据。Overture因此拥有了当时两大主要搜索技术公司。

3月,Google推出后来被称为Adsense的内容广告系统,向其他内容网站提供广告服务,成为很多网站的主要收入来源之一。

7月,Yahoo!宣布以16亿美元收购Overture,将除了Google之外的几乎所有主流搜索技术(Inktomi 、AltaVista、FAST)收归旗下。可惜,随着2010年Yahoo!放弃自己的搜索技术,转而使用微软必应,Yahoo!以前收购的及自己在此基础上研发多年的搜索技术全部无疾而终。Overture的PPC广告平台被整合、改名为Yahoo! Search Marketing。

2003年,微软MSN开始开发自己的搜索引擎技术。此前,MSN网站一直使用 Inktomi等搜索技术提供商的搜索数据。

2004年

2月,正如所有人预料的,Yahoo!在收购了几大搜索公司后推出自己的搜索引擎,不再使用Google数据和技术。

8月,Google上市。

11月,微软推出自己的搜索引擎MSN Search,不再使用第三方搜索服务。三雄鼎立时期开始。

2005年

8月,百度上市。

2006年

5月,微软推出类似于Google Adwords的广告系统AdCenter 。

9月,MSN Search改名Live Search,实际上MSN网络品牌全部改为Live,并做了大量推广。不过并没有显著提高微软在搜索市场的份额,Google仍然一枝独秀。

2007年

3月,Google也开始提供类似网站联盟的按转化付费的广告形式。4月,Google收购传统网络广告公司DoubleClick,进入更广泛的网络广告领域。

2009年

6月,微软Live Search 改名为必应(Bing)。

7月29日,微软和Yahoo!达成历史性协议,Yahoo!将逐步放弃自己的搜索技术,使用Bing数据。此前几年,Yahoo!始终挣扎在困境中,CEO几度更换,大股东内讧,搜索市场份额不断下降。终于,Yahoo!被自己亲手培养的Google彻底打败在搜索战场。Yahoo!曾经是英雄,但Yahoo!时代正式结束了。

2010年

8月25日,Yahoo!开始使用Bing搜索数据。

2003年至2010年,搜索领域的技术革新不断,以Google为代表的搜索引擎推出了整合搜索、个人化搜索、实时搜索、地图服务、线上文件编辑、网站统计、浏览器、网管工具、超大容量电子邮件、即时通信等,总体上看,通常是 Google 推出新服务,其他搜索引擎很快跟进。

国内,百度也创建了百科、知道、贴吧等独特服务。

但搜索引擎服务商没有大的变化。国际上,始终是Google独大,Yahoo!第二,占有不大不小的份额,微软Live/Bing第三,苦苦追赶而不得。2009年微软推出Bing及与Yahoo!签署协议后,Bing的市场份额开始慢慢上升,蚕食了原来Yahoo!的市场。

据NetMarketShare统计,2010年8月全球搜索引擎市场份额分布如图1-9所示。图1-9 2010年8月全球搜索引擎市场份额

Google 占据84.73%,居于绝对领先地位。由于中国用户数的庞大,百度搜索量排在第三位,但除中国外,其他国家很少使用百度。

美国市场一直是全球搜索引擎风向标。据HitWise统计数字,2010年各搜索引擎市场份额变化情况如表1-2所示。表1-2 2010年美国搜索引擎市场份额

不同市场调查公司采样不同,计算方法不同,得出的数据也有差别。同样是美国8月份数字,Nielsen公司的数据是Google 占65% , Bing 已经超过Yahoo ,以13.9% 的市场份额上升为第二名,Yahoo 为 13.1% 。而comScore 的报告又显示8月份 Google 在美国的市场份额为 65.4%,呈下降趋势,Yahoo 为17.4%,比前几个月还有增长,Bing 为11.1%,也略有增长。

由于8月底Yahoo!已经开始使用Bing数据,Bing实际上已经占据美国搜索市场的20%以上份额,三雄鼎立结束,两雄争霸开始了。目前 Google 还遥遥领先,也没有市场被挖角的迹象。

在中文搜索市场,百度独大,Google第二。2010年Google退出中国风波后,Google在中文搜索市场份额小幅下降。

据艾瑞网公布的数字,2010年第二季度,按网页搜索量计算,百度在中国搜索引擎市场占有80.2%份额,Google下降至14.1%,如图1-10所示。图1-10 2010年中国搜索市场份额

按营收计算,百度占70.8%, Google占27.3%。Google每次搜索产生的收入高于其他搜索引擎,如图1-11所示。

搜索领域变化很快。就在本书最终完稿时(2010年9月),百度推出了开放平台,用户不离开百度搜索结果页面就可以使用某些应用如小游戏。Google 推出了“Google Instant”,用户正在输入搜索词时(还没有按搜索按钮或Enter键)就可以看到搜索结果。这些都将影响用户搜索模式,对SEO有什么长远影响还有待观察。图1-11 2010年中国搜索引擎市场营收份额第2章了解搜索引擎

一个合格的SEO必须了解搜索引擎基本工作原理。很多看似令人迷惑的SEO原理及技巧,其实从搜索引擎原理出发,都是自然而然的事情。

为什么要了解搜索引擎原理?

说到底,SEO是在保证用户体验的基础上尽量迎合搜索引擎。与研究用户界面及可用性不同的是,SEO既要从用户出发,也要站在搜索引擎的角度考虑问题,才能清晰地知道怎样优化网站。SEO人员必须知道:搜索引擎要解决什么问题,有哪些技术上的困难,有什么限制,搜索引擎又怎样取舍。

从某个角度来说,SEO人员优化网站就是尽量减少搜索引擎的工作量、降低搜索引擎的工作难度,使搜索引擎能更轻松、快速地收录网站页面,更准确地提取页面内容。不了解搜索引擎工作原理,也就无从替搜索引擎解决一些SEOer力所能及的技术问题。当搜索引擎面对一个网站,发现要处理的问题太多、难度太大时,搜索引擎可能就对这样的网站敬而远之了。

很多SEO技巧是基于对搜索引擎的理解。下面举几个例子。

我们都知道网站域名和页面权重非常重要,这是知其然,很多人不一定知其所以然。权重除了意味着权威度高、内容可靠,因而容易获得好排名外,获得一个最基本的权重,也是页面能参与相关性计算的最基本条件。一些权重太低的页面,就算有很高的相关性也很可能无法获得排名,因为根本没有机会参与排名。

再比如很多SEO er津津乐道的“伪原创”。首先,抄袭是不道德甚至违法的行为,把别人的文章拿来加一些“的、地、得”,段落换换顺序就当成自己的原创放在网站上,这是令人鄙视的抄袭行为。理解搜索引擎原理的话,就会知道这样的伪原创也不管用。搜索引擎并不会因为两篇文章差几个字、段落顺序不同,就真的把它们当成不同的内容。搜索引擎的权重算法要先进、准确得多。

再比如,对大型网站来说,最关键的问题是解决收录。只有收录充分,才能带动大量长尾关键词。就算是有人力、财力的大公司,当面对几百万几千万页面的网站时,也不容易处理好充分收录的问题。只有在深入了解搜索引擎蜘蛛爬行原理的基础上,才能尽量使蜘蛛抓得快而全面。

上面所举的几个例子,读者看完搜索引擎原理简介这一节后,会有更深入的认识。2.1搜索引擎与目录

早期的SEO资料经常把真正的搜索引擎与目录放在一起讨论,甚至把目录也称为搜索引擎的一种,这种讲法并不准确。

真正的搜索引擎指的是由蜘蛛程序沿着链接爬行和抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框输入关键词后,搜索引擎排序程序从数据库中挑选出符合搜索关键词要求的页面。蜘蛛的爬行、页面的收录及排序都是自动处理。

网站目录则是一套人工编辑的分类目录,由编辑人员人工创建多个层次的分类,站长可以在不同分类里提交网站,目录编辑在后台审核所提交的网站,将网站放置于相应的分类页面。有的时候编辑也主动收录网站。典型的网站目录包括雅虎目录、开放目录、好123等。

目录并不是本书中所讨论的SEO所关注的真正的搜索引擎。虽然网站目录也常有一个搜索框,但目录的数据来源是人工编辑得到的。

搜索引擎和目录两者各有优劣。

搜索引擎收录的页面数远远高于目录能收录的页面数。但搜索引擎收录的页面质量参差不齐,对网站内容和关键词提取的准确性通常也没有目录高。

限于人力,目录能收录的通常只是网站首页,而且规模十分有限,不过收录的网站通常质量比较高。像雅虎、开放目录、好123这些大型目录,收录标准非常高。目录收录网站时存储的页面标题、说明文字都是人工编辑的,比较准确。

搜索引擎数据更新快,而目录中收录的很多网站内容十分陈旧,甚至网站可能已经不再存在了。

雅虎目录、搜狐目录等曾经是用户在网上寻找信息的主流方式,给用户的感觉与真正的搜索引擎也相差不多。这也就是目录有时候被误称为“搜索引擎的一种”的原因。但随着 Google 等真正意义上的搜索引擎发展起来,目录的使用迅速减少,现在已经很少有人使用网站目录寻找信息了。现在的网站目录对SEO的最大意义是建设外部链接,像雅虎、开放目录、好123等都有很高的权重,可以给被收录的网站带来一个高质量的外部链接。2.2搜索引擎面对的挑战

搜索引擎系统是最复杂的计算系统之一,当今主流搜索引擎服务商都是有财力、人力的大公司。即使有技术、人力、财力的保证,搜索引擎还是面临很多技术挑战。搜索引擎诞生后的十多年中,技术已经得到了长足的进步。我们今天看到的搜索结果质量与10年前相比已经好得太多了。不过这还只是一个开始,搜索引擎必然还会有更多创新,提供更多、更准确的内容。

总体来说,搜索引擎主要会面对以下几方面的挑战。

1.页面抓取需要快而全面

互联网是一个动态的内容网络,每天有无数页面被更新、创建,无数用户在网站上发布内容、沟通联系。要返回最有用的内容,搜索引擎就要抓取最新的页面。但是由于页面数量巨大,搜索引擎蜘蛛更新一次数据库中的页面要花很长时间。搜索引擎刚诞生时,这个抓取周期往往以几个月计算。这也就是Google在2003年以前每个月有一次大更新的原因所在。

现在主流搜索引擎都已经能在几天之内更新重要页面,权重高的网站上的新文件几小时甚至几分钟之内就会被收录。不过,这种快速收录和更新也只能局限于高权重网站。很多页面几个月不被重新抓取和更新,也是非常常见的。

要返回最好的结果,搜索引擎也必须抓取尽量全面的页面,这就需要解决很多技术问题。一些网站并不利于搜索引擎蜘蛛爬行和抓取,诸如网站链接结构的缺陷、大量使用Flash、JavaScript 脚本,或者把内容放在用户必须登录以后才能访问的部分,都增大了搜索引擎抓取内容的难度。

2.海量数据存储

一些大型网站单是一个网站就有百万千万个页面,可以想象网上所有网站的页面加起来是一个什么数据量。搜索引擎蜘蛛抓取页面后,还必须有效存储这些数据,数据结构必须合理,具备极高的扩展性,写入及访问速度要求也很高。

除了页面数据,搜索引擎还需要存储页面之间的链接关系及大量历史数据,这样的数据量是用户无法想象的。据说 Google 有几十个数据中心,上百万台服务器。这样大规模的数据存储和访问必然存在很多技术挑战。

我们经常在搜索结果中看到,排名会没有明显原因地上下波动,甚至可能刷新一下页面,就看到不同的排名,有的时候网站数据也可能丢失。这些都可能与大规模数据存储的技术难题有关。

3.索引处理快速有效,具可扩展性

搜索引擎将页面数据抓取和存储后,还要进行索引处理,包括链接关系的计算、正向索引、倒排索引等。由于数据库中页面数量大,进行PR之类的迭代计算也是耗时费力的。要想及时提供相关又及时的搜索结果,仅仅抓取没有用,还必须进行大量索引计算。由于随时都有新数据、新页面加入,因此索引处理也要具备很好的扩展性。

4.查询处理快速准确

查询是普通用户唯一能看到的搜索引擎工作步骤。用户在搜索框输入关键词,单击“搜索”按钮后,通常不到一秒钟就会看到搜索结果。表面最简单的过程,实际上涉及非常复杂的后台处理。在最后的查询阶段,最重要的难题是怎样在不到一秒钟的时间内,快速从几十万、几百万,甚至几千万包含搜索词的页面中,找到最合理、最相关的1000个页面,并且按照相关性、权威性排列。

5.判断用户意图及人工智能

应该说前4个挑战现在的搜索引擎都已经能够比较好地解决,但判断用户意图还处在初级阶段。不同用户搜索相同的关键词,很可能是在寻找不同的东西。比如搜索“苹果”,用户到底是想了解苹果这个水果,还是苹果电脑?还是电影《苹果》的信息?没有上下文,没有对用户个人搜索习惯的了解,就完全无从判断。

搜索引擎目前正在致力于基于用户搜索习惯及历史数据的了解上,判断搜索意图,返回更相关的结果。今后搜索引擎是否能达到人工智能水平,真正了解用户搜索词的意义和目的,让我们拭目以待。2.3搜索结果显示格式

让我们先稍微深入地了解一下搜索结果的展现形式。2.3.1 搜索结果页面

用户在搜索引擎搜索框中输入关键词,单击“搜索”按钮后,搜索引擎在很短时间内返回一个搜索结果页面。如图2-1所示是Google的搜索结果页面,也是比较典型的搜索结果页面排版格式。

页面主体有两部分最主要,一是广告,二是自然搜索结果。如图2-1所示,页面右侧8个结果及左侧最上面的一个结果,都标注为“赞助商链接”,这就是广告。绝大部分网民都比较清楚右侧显示的是广告,所以右侧赞助商链接没有加特殊底色。页面左侧上部的广告链接使用浅黄色底色,可以和下面的自然搜索结果清楚地分开。右侧广告最多有8个,上部广告可以多至3个。

搜索广告在网络营销行业经常称为PPC,由广告商针对关键词进行竞价,广告显示广告商无须付费,只有搜索用户点击广告后,广告商才按竞价价格支付广告费用。PPC是搜索营销的另一个主要内容。

搜索结果页面左侧广告下面,占据页面最大部分的就是自然搜索结果。通常每个页面会列出10个自然搜索结果。用户可以在账户设置中选择每页显示100个搜索结果。每个搜索结果的格式后面再做介绍。

页面最左上角是垂直搜索链接,用户点击后可以直接访问图片、视频、地图等搜索结果。

搜索框右下方显示满足搜索关键词的结果总数,例如图2-1中所显示的19 600 000条结果。这个搜索结果数是研究竞争程度的依据之一。

自然搜索结果下面显示相关搜索。搜索引擎根据用户搜索数据,列出相关的其他搜索词。图2-1 Google的搜索结果页面

页面最下面又是一个赞助商广告,与页面顶部的广告相同。页面左侧顶部及左侧底部的广告,并不是每次搜索有广告商竞价时都会出现,只有点击率和质量分数达到一定水平的广告才会出现在左侧顶部或底部。

SEOer最关注的是占据页面主体的自然搜索结果。统计数据显示,自然搜索结果总点击访问数要远远大于广告点击数。但是企业花费在SEO上的费用却远远低于花费在搜索广告上的费用。这既是SEO的尴尬,也是最大的机会。掌握了SEO流量,才能掌握最大搜索流量。

我们再来看百度搜索结果页面,如图2-2所示。图2-2 百度的搜索结果页面

百度搜索结果页面与Google大致相同,区别在于广告部分的显示方法。如图2-1所示,右侧也是最多8个广告,不过并没有标注为赞助商链接或加其他提示文字。左侧最上面标注为“推广链接”的结果也是广告,这是百度启用凤巢系统后显示的广告。不过这几个广告只加了非常浅的灰色背景,不注意看几乎无法与下面的自然搜索结果区分开来。

有的关键词搜索没有触发凤巢系统广告,还会继续显示传统百度广告,如图2-3所示。图2-3 传统百度搜索广告

传统百度左侧广告既没有明确标注为推广链接,也没有使用任何背景颜色,与下面的自然搜索结果更不容易分辨。唯一能分辨出上面3个是广告的,是结果列表最后一行最右侧标有“推广”两个字。百度广告结果在背景颜色、文字标注上,都比较难以与自然结果区分。SEO人员当然很清楚这两者之间的区别,普通网民却难以察觉,尤其是百度传统左侧广告。这也是百度搜索结果常为人诟病的原因之一。2.3.2 经典搜索结果列表

我们再来看看每一个搜索结果页面的展现格式。如图2-4所示是百度的搜索结果列表,主要分三部分。图2-4 最常见的搜索结果列表格式

第一行是页面标题,通常取自页面HTML代码中的标题标签(Title Tag)。这是结果列表中最醒目的部分,用户点击标题就可以访问对应的网页。可见页面标题标签的写法,无论对排名还是对点击率都有重要意义。

第二行、第三行是页面说明。页面说明有的时候取自页面 HTML 中的说明标签(Description Tag),有的时候从页面可见文字中动态抓取相关内容。显示什么页面说明文字是用户查询时才决定的。

某些与日期有明确联系的页面,Google会在说明文字最前面显示日期,省略号后再显示页面说明。如博客帖子这类有明确发布日期的页面,如图2-5所示。图2-5 Google搜索结果列表中显示日期

第四行显示三个信息。最左侧是网址,用户可以看到页面来自哪个网站,以及目录、文件名信息。

中间是百度数据库中页面最后更新的日期。

然后是百度快照链接,用户可以点击快照,查看存储在百度数据库中的页面内容。当页面被删除或者有其他技术问题导致不能打开网站时,用户至少还可以从快照中查看想要的内容。

用户所搜索的关键词在标题及说明部分都用红色高亮显示。用户可以非常快速地看到页面与自己搜索的关键词相关性如何。如图2-6中的“SEO”这三个字母。图2-6 搜索词在Google中文搜索结果列表中高亮显示

Google结果列表与百度大致相同,几处小的区别如下:

• 搜索关键词在URL中出现时加粗显示,如图2-6中的SEO三个字母。

• URL右侧的页面最近更新时间不是按日期显示的,而是显示为几小时前。

• 网页快照链接后面有时还有一个“类似结果”链接。用户点击类似结果后可以看

到与这个页面相似的其他网页。

• Google 英文结果列表与中文还有一个区别,就是搜索关键词在标题及说明部分不是红色高亮显示的,而是加粗显示的,如图2-7所示。

红色高亮显示应该是Google为适应中国用户搜索习惯所做的变化。

2010年4月份,本章初稿完成后,笔者又发现百度也在试验将URL中的关键词加粗,但不是所有URL中的关键词都会加粗,如图2-8所示。图2-7 搜索词在Google英文搜索结果列表中加粗显示图2-8 搜索词在百度列表中URL目录部分加粗显示

上面讨论的是最经典的结果列表格式。搜索引擎近几年也在不停尝试不同格式的搜索结果格式,尤其是Google,推出了很多特色结果列表,下面选几个主要的进行简单介绍。2.3.3 整合搜索结果

在前面的 Google 搜索结果页面抓图中,大家就能看到两个整合搜索结果:中间的资讯结果和页面底部的博客搜索结果。根据搜索关键词的不同,Google还经常把其他垂直搜索结果混合在正常网页搜索结果中,比如图片结果、视频结果,如图2-9和图2-10所示。图2-9 图片搜索结果图2-10 视频搜索结果

百度也有类似的整合搜索结果,主要以新闻内容为主,其他则很少见到,如图2-11所示。图2-11 百度的新闻搜索结果2.3.4 缩进列表

缩进列表(Indented Listing)是指当搜索结果页面上应该出现两个来自同一网站的页面时,比如第一位和第八位,按照正常排名算法是来自同一网站的两个页面,Google不是把它们排在第一和第八位,而是把两个结果连在一起排在第一和第二位,第二位的结果向右侧缩进三个字的空间,如图2-12所示。这样的列表格式非常有助于提高点击率。2.3.5 全站链接

对某些权重比较高的网站,当用户搜索一个关键词,这个网站的结果是最权威的内容来源时,Google除了正常结果列表外,还会显示最多四行、两列共8个内页链接,称为全站链接(Sitelinks),如图2-13所示。图2-12 缩进列表图2-13 全站链接

这无疑为权重高的网站提供了多几倍的访问入口,视觉上的醒目也大大提高了点击率。2.3.6 迷你全站链接

权重高的网站在某些情况下还会显示迷你全站链接(Mini Sitelinks),不是4行8个,而是1行4个链接。显示的内页与上面说的全站链接是一样的,取其中前面4个,如图2-14所示。图2-14 迷你全站链接2.3.7 One-box

某些关键词会触发Google One-box结果,直接在搜索结果页面上显示相关信息,用户不用点击到其他网站上查看。如图2-15显示搜索“北京银行”时显示的股价One-box。图2-15 Google的One-box2.3.8 富摘要

某些使用RDFa或Microdata 格式标签的页面,Google可能还会在标题下面以灰色文字加一行富摘要(Rich Snippet),如图2-16所示的论坛帖子页面还显示出帖子个数、作者数及更新日期。图2-16 Google的富摘要

这样的排版格式无疑也会提高关注度和点击率。在富摘要中显示合适的信息,有助于说服用户点击结果,比如显示产品价格、用户评分、用户评论数目等。

百度也有类似显示方式,如图2-17所示。图2-17 百度的富摘要2.3.9 面包屑导航

Google最近又在结果列表中大规模使用面包屑导航。原本显示一个网址的地方,改为面包屑导航格式,其中的每一个分类链接都指向网站上相应的分类页面,如图2-18所示。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载