很多人知道要做SEO排名,让用户透过搜索得知你的产品。这主要的战场就在 Google 搜索引擎上。在撰写内容、制定关键词策略和SEO排名之前,对于谷歌搜索了解以下三个重要概念,将事半功倍,在策略上拥有更大的胜算,打败竞争对手。
这三个概念分别是:
检索(Crawl)
索引(Index)
演算(Algorithm)
「检索」是 Google 官方文件给的正式称呼,通常我们称之为「爬取」。
在检索阶段,Google 通过追踪链接、读取网站地图(Sitemap)等多种方法来发现网址。Google 这样做的目的是寻找新的网页并为这些网页建立索引。
然而,网站要成功被 Google 索引(收录),需要符合一些相关规则,或是通过你提交的文件告诉 Google 哪些网页可以被索引。
这份文件叫做「Robots.txt」。
每个网站都需要有这份文件,它就像是一个网站的导览地图,告诉 Google 哪些地方可以爬取,哪些地方不行。
下面举例的场景是多国语系的网站。例如,在台湾,当地母语为中文,你的Robots.txt可以告诉 Google 尽量避免爬取美国版本的网站。
这个范例中,Disallow:/us/ 指示 Googlebot 不得爬取位于 /us/ 目录下的美国版本网站内容。其他爬虫仍然可以访问整个网站。
「索引」是 Google 正式官方文件的称呼,我们通常称它为「收录」。成功被索引的网页,会收录于搜索结果当中。想打SEO排名战,当然要让你的网站被成功索引,让潜在用户透过搜索找到你。网站上线第一件事:检查 Google 是否有收录你 验证方法很简单,直接在搜索列打:site:(你的网址),如果有就会显示啰。例如:site:www.randengseo.com
如果没被收录,可能有以下常见原因:
尽管 Google 会自动检索世界上大部分的网站,但仍然有一些例外情况。你可以主动邀请 Google 收录你的网站,其中一个方法是提交网站地图(Sitemap)给 Google,而 Google Search Console 这个工具能够协助你顺利提交。
Sitemap 和 Robots.txt 的关系
网站地图(Sitemap)是一个档案,搜索引擎如 Google 会读取这个档案,了解你的网站结构和内容。因此,维护和更新完整的网站地图对于谷歌的检索是很重要的。
而Robots.txt 是一份文字文件,你可以在其中加入 Sitemap 的位置,或者直接使用 Google Search Console 提交你的 Sitemap,这样有助于你的网页被检索。
Robots.txt 和 Noindex 的差异:Robots.txt 只能告诉 Google 哪些页面可以或不可以爬取,但无法决定哪些内容要不要被索引(收录)到 Google。
如果你希望某些内容不被索引,就需要使用 noindex 指令。noindex 类似于你的网站政策,通常放在特定的页面上。
noindex 的常见使用情境:
用户会员账户的个人仪表板。
结帐画面。
已经下架的商品页面。
用户的电子凭证页面。
三、演算(Algorithm)- 提供最佳搜索结果
搜索引擎的目的是在最短的时间内提供最符合用户需求的相关结果。
在 Google 搜索引擎中,有三大核心算法,它们分别是「Panda」、「Penguin」和「Hummingbird」。这些算法的目的是不断改进搜索结果的质量,提供更符合用户需求的相关内容。
1.Panda(熊猫)算法:
Panda 算法于2011年首次推出,旨在评估网站的内容质量。它主要针对低质量内容、重复内容、复制内容和低价值的内容进行惩罚,同时倾向于推荐高质量、原创且有价值的内容。Panda 算法也考虑用户的反馈,例如用户的反馈、点击行为和停留时间等指标。
为了适应 Panda 算法,你应该着重提供原创、有价值且吸引人的内容,避免复制、重复或低品质的内容,并持续优化用户体验。
2.Penguin(企鹅)算法:
Penguin 算法于2012年首次推出,其主要目标是对抗垃圾链接(spammy links)和不自然的链接行为。这些垃圾链接可能是由于购买链接、过度使用关键字锚文本、大量低质量链接等方式产生的。Penguin 算法分析网站的链接配置,并对违规行为进行惩罚,降低相关网站的排名。
为了适应 Hummingbird 算法,你应该注重使用自然语言和长尾关键词,提供相关且有价值的内容,并理解用户的搜索意图,以便更好地满足他们的需求
3.Hummingbird(蜂鸟)算法:
Hummingbird 算法于2013年推出,它的目标是改进搜索引擎对于长尾关键词和自然语言搜索的理解能力。这个算法着重于理解用户的意图,而不仅仅是关键词的匹配。它考虑到整个搜索句子的上下文,并提供更精确和相关的搜索结果。
为了适应 Hummingbird 算法,你应该注重使用自然语言和长尾关键词,提供相关且有价值的内容,并理解用户的搜索意图,以便更好地满足他们的需求。
如今网站生成的速度越来越快、越来越多,以往常讨论到的算法类型可以明白,但不需过度针对和钻研,目前谷歌算法的技术已进展到相当成熟的地步,不论是熊猫、企鹅或其他算法,都能够做到「即时爬取」、「即时检索」的地步,因此现在统称为「核心算法」。
在这样的情形下,我们该专注的,是提供优质的内容给用户,并尽量保持在技术上方便 Google 算法共同合作的协调性。(sitemap, Robot.txt 等文件、网站政策和架构清楚。)
了解 Google 搜索引擎运作的原则,相信能在你生产内容、拟定内容策上有更清楚和全面的概念,拥有良好的地基,后端内容的排名战将打得更加精确、有效率。
优网科技,优秀企业首选的互联网供应服务商
优网科技秉承"专业团队、品质服务" 的经营理念,诚信务实的服务了近万家客户,成为众多世界500强、集团和上市公司的长期合作伙伴!
优网科技成立于2001年,擅长网站建设、网站与各类业务系统深度整合,致力于提供完善的企业互联网解决方案。优网科技提供PC端网站建设(品牌展示型、官方门户型、营销商务型、电子商务型、信息门户型、DIY体验、720全景展厅及3D虚拟仿真)、移动端应用(手机站、APP开发)、微信定制开发(微信官网、微信商城、企业微信)、微信小程序定制开发等一系列互联网应用服务。