作为SEOer,你了解搜索引擎吗?

假如你真的想学习SEO,那么我建议你一定要了解搜索引擎。这里我说的意思不是让你非得去学程序,但是,了解搜索引擎是怎么运作的,是非常有必要的。很多时候,我们都是知其然,而不知其所以然。下面,这是我在看《SEO实战密码》第三版做的笔记,同时也掺杂了一些个人看法,假如有不对的地方,希望大家能够帮忙指出。

搜索引擎的工作过程大体上可以分为三个过程:

搜索引擎的工作过程

(1)爬行和抓取:搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面HTML代码,存入数据库。

当搜索引擎向服务器发送给一个请求时,服务器接收请求以后,便会根据请求把网站发送给搜索引擎,接下来搜索蜘蛛就开始爬取你的网站,在开始爬取之前,它会舍弃页面的JS、CSS、和一些标签,当然,它也会保留下头部文件里面的title、description、keyword,还有超链说明和图片描述(这里也提示了我们,以后图片一定要加文字说明),然后抓取本文,然后保存到数据库里面。

(2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理,以备排名程序调用。

搜索引擎会对抓取来的内容进行分词,百度分词大概分为3种技术:字符串匹配的分词方法、词义分词法、统计分词法。在这期间搜索引擎还需要对页面进行去重处理,也就是把相同的内容舍弃掉,所以假如你是完全复制粘贴的话,一般情况下是不会被搜索引擎所收录的,除非是建立镜像。

(3)排名:用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。

当用户在搜索引擎输入关键词的时候,搜索引擎会快速根据用户提供的关键词检索数据库,然后匹配相关性强,可信度高的内容然后按照大家平时看到的页面格式生成页面。也就是说,当你在搜索引擎里面打出一个字或者词,背后的搜索引擎都在运作着亿万级别的数据和程序。

其实搜索引擎就如同图书馆里面的检索工具,当图书馆里收藏的书籍越来越多时,我们寻找起来就会很麻烦,所以也就有了图书管理系统。我想这么说或许会更容易理解一些。

在我看来,SEO真的是一门复杂的功课,因为它的相关性很强,无论是网络协议,建站技术,搜索引擎还是内容的编辑,这些都是影响我们最后的优化。假如现在的你对于SEO还是没有方向,那么我建议你从看书开始,或许现在有很多网上教程,视频。但是很多东西他们只是告诉你一个大概,这里面的所以然你依旧不懂,所以学了以后你还是一脸懵逼。

奋斗吧

假如你让我推荐几本书,那么我想告诉你,搜索引擎就是你的“图书管理系统”。从此刻开始,收起心里的那点小懒惰,以后你会感谢现在奋斗的自己,共勉!

陈健的个人博客,记录生活所见所感、学习笔记。专注于Web前端_SEO教程_读书心得。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

返回主页看更多
狠狠的抽打博主 支付宝 扫一扫