搜索引擎原理篇
概括
古人云,知自知彼,方能百战不殆,做seo也是如此:我们只有研究透了对方的整体实力,找出他们的优势与弱点,避其锋芒,专攻要害,才能战必胜,这就是是做seo之道。北京百度优化认为,我们想要在seo做的青出于蓝而胜于蓝,唯有了解了搜索引擎的工作原理,才能发掘和创造更多的seo优化技巧!
古人云,知自知彼,方能百战不殆,做seo也是如此:我们只有研究透了对方的整体实力,找出他们的优势与弱点,避其锋芒,专攻要害,才能战必胜,这就是是做seo之道。北京百度优化认为,我们想要在seo做的青出于蓝而胜于蓝,唯有了解了搜索引擎的工作原理,才能发掘和创造更多的seo优化技巧!
举个例子,一些男生很羡慕明星的人鱼线、八块腹肌,就会上网搜索一些能够快速健身、塑型的方法,这类词不外乎就是“健身”、“腹肌”。细心的人一定会发现,第一次搜索这类词的时候,搜索结果会逐渐刷新出来,当你复制这个词再搜索一次,搜索结果立马就刷新出来了,不管以后尝试了多少次,搜索结果都是秒刷出来。这就是搜索引擎的工作原理:搜索引擎接到用户的的搜索指令后,它首先调用缓存,如果用户以前没有搜索过同类词,就会去数据库读取;如果用户搜索过,就直接从缓存读取,工作量的不同造成了搜索结果展现速度的不同。说的再直白点,就是第一次走迷宫,肯定花很多时间,但是,当你第二次去走的时候,轻车熟路,耗时肯定短。这就是搜索引擎的工作原理。
搜索引擎的工作原理需要这下面的四大系统去配合
1、下载体系
顾名思义,就是把网站的所有网页采集下载下来,建立一个仓库,并储存下来。下载系统采用多线程方式工作,而每一个线程就是依靠很多的spiders去抓取收录。当搜索引擎下载网页的时候,会建立两张不同的表,一张记录拜访过的网站,另一张记录没有拜访过的网站,这样的好处是,当spider抓取某个外部连接的页面的url的时候,如果发现已经存在访问的列表里了,spider就会丢弃这个url,不再访问,减少工作量,提高搜索引擎的工作效率。
搜索引擎不会将所有的网页都会抓取过来,所以它只会选取重要的页面优先抓取,重要的页面需要具备以下条件:
1)、我用外链多,入度大,被引用的多;
2)、网页的镜像度高;
3)、网页的上层页面入度大;
4)、网页的目录深度小。
优先抓取的重要性网页,会被给于一个很好的排名。一个稳定、高效的下载系统是搜索引擎提供服务的根基。
2、分析系统
搜索引擎不是人,不能通过眼睛去阅读页面的内容,只能通过分析系统去大概了解网站的展示内容是包含违法信息,如果是带有违法信息的页面,会自动过滤掉,或者给予这类页面一个坏的排名,防止用户搜索出来这类垃圾信息,影响搜索引擎信誉度。
搜索引擎虽然看不懂网页,但是她会对网页进行切词,即将一个长句子分解成若干个词语,比如“百度优化哪家好。”,搜索引擎会把这句话拆分成“百度优化,哪家,好”。然后自动过滤掉一些高频词,比如语气助词等,余下的词就建成一个索引。通过切词,搜索引擎把网页转化成一个词集合,才能对网页建立索引,才能在用户的搜索结果中展现。
3、建立索引
通过分析系统的“切词”,网页已经不再是网页了,变成了一堆关键词,然后将这些词按照先后顺序排列好,建立索引,就能提高搜索引擎的检索效率了。
关键词排序的算法:
1)、基于内容的排序算法。内容排序算法是根据词频、关键词出现的位置来判定的,在搜索引擎允许的范围内,词频越高就更有利于更好地排名。
2)、基于超链接分析的排序算法。超链接分析的排序算法,弥补了内容排序算法的不足,防止恶意堆砌关键词的行为。
3)、竞价排名。竞价排名是搜索引擎公司的盈利手段,只要商户支付钱,就能获得好的排名,不含任何的技术含量,效果立竿见影。
4、查询服务
当用户在搜索引擎输入相关关键词获取想要的资料的时候,搜索引擎就会将事先建立好的与用户查询相匹配的索引(搜索结果)展示出来。
以上就是搜索引擎的工作原理,今天北京百度优化就跟大伙讲到这里,明天将给大家讲解的是seo的必备基础知识篇,您可以关注威斯尼斯人wns145585官网:,获取更多精彩的seo知识。