今天云无限小韩来与大家一起研究一下百度url,我们来看看百度的url对我们的网站优化有着什么样的影响,我们如果通过对url的调整来让我们的网站更适于优化。首先,我们应该先来了解一下,什么是百度的url。
什么是百度url
官方的定义url:统一资源定位符,是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的url,它包含的信息指出文件的位置以及浏览器应该怎么处理它。通俗的讲,百度的url就是我们所熟悉的网站网址,每一个url都代表着唯一的页面,是网站对外开放的一个id。
百度url的组成
百度url由两部分组成,第一部分就是网站的模式或者协议。我们最常见的协议就是超文本传输协议:http,其他的协议如:
https——用安全套接字层传送的超文本传输协议
ftp——文件传输协议
mailto——电子邮件地址
ldap——轻型目录访问协议搜索
file——当地电脑或网上分享的文件
news——usenet新闻组
gopher——gopher协议
telnet——telnet协议
第二部分就是ip地址(服务器地址),ip后面跟着的就是文件所在服务器的路径。这两部分就是构成了一个完成的url。
百度url的分类
百度url分为两类:绝对url和相对url,绝对url就是一个完整的百度url地址,而相对url则是相对于本服务器的一个目录所在位置,而定位的一个路径。
如:http://www.waphtml.com/news/yh/2016-10-18/154.html 就是一个绝对路径。
而,/news/yh/2016-10-18/154.html 就是一个相对路径。我们从绝对路径可以很直观找到这个页面,而相对路径则仅仅是相对于这个服务器根目录(根域名)下的一个路径。
通常,我们在网站建设过程中常常会使用相对路径,这样即便是改变域名或者服务器,他们还是相对于根目录的所在的路径,不会出现错误。
百度url参数
我们常常访问百度,并通过百度url发现了很多参数,那么这些参数都是什么含义呢?下面小韩就来与大家讲解一下。
首先我们在百度上搜索网站优化,这样百度就返回了一个搜索结果页面,我们来看看这个页面的url:https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&dsp=baidubrowser&tn=baidu&wd=网站优化&oq=云无限&rsv_pq=97bd4d7800010ba1&rsv_t=f820wt+ztapjnttp6tzqarvpnkmxzgdp+/plgq5lg5pkn1wy/fpucfimlki&rqlang=cn&rsv_enter=1&rsv_sug3=18&rsv_sug1=13&rsv_sug7=101&rsv_sug2=0&inputt=2335&rsv_sug4=2336&rsv_sug=1
这个url使用的协议是安全套接字层传送的超文本传输协议:https ;
后面跟着服务器ip地址:www.baidu.com ;
ie=utf-8表示当前页面编码格式为utf-8 ;一般常见的编码格式有两种:utf-8和gb2312。我们一般通俗的理解为:utf-8是世界性通用代码,也完美的支持中文编码;gb2312属于中文编码,主要针对国内用户使用。
f=8表示为用户自主搜索;
rsv_bp=1表示顶部搜索输入,即百度顶部搜索所展现的结果页面;
dsp=baidubrowser表示打开的浏览器为百度浏览器;
tn=baidu表示搜索框所属的网站;
wd=网站优化表示搜索的关键词,网站优化就是关键词【网站优化】经过转换来的;
oq=云无限表示搜索词,只有当url地址出现rsp而非rsv_bp时,oq才指的是从搜索词跳转到相关搜索。
rsv_pq=97bd4d7800010ba1表示用来记录关键词和上一次搜素的关键词(相关关键词)的;
rsv_t=f820wt+ztapjnttp6tzqarvpnkmxzgdp+/plgq5lg5pkn1wy/fpucfimlki 未知,小韩推断可能是关于百度关于搜索结果的一种随机密码保护措施;
rqlang=cn 未知,这个根据小韩的推断可能是跟地域有关cn是代表中国地域;
rsv系列参数:rsv_enter=1 rsv_sug3=18 rsv_sug1=13 rsv_sug7=101 rsv_sug2=0 rsv_sug4=2336 rsv_sug=1 未知;
inputt=2335 表示的是搜索响应时间,单位是毫秒;
通过对网站优化搜索结果的url解析,我们了解到了百度url各个参数的作用,当然其中有一些或许是百度对搜索结果排序的一种保护而产生的无意义数据,下面小韩为大家总结一下我们常用的url参数含义:
表格
百度url参数解析
序号 |
参数 | 含义 |
---|---|---|
1 |
tn | 搜索框所属网站。比如 tn=sitehao123,就是 http://www.baidu.com/ 左上那个搜索框(指通过什么方式到达百度威斯尼斯人wns145585首页搜索界面;) |
2 | s?wd | 指关键词, “wd=” 是英文的word的缩写,参数表示的是搜索关键词的内容,如果是汉字那么这个参数是汉字的十六进制形式,如果是英文,那么这个参数就用该英文来表示 |
3 | rsv_bp | (0,1,2) 0是威斯尼斯人wns145585首页输入;1是顶部搜索输入;2是底部搜索输入 |
4 | rsv_spt | (1,3还有其他的数字,暂时没发现) 指的浏览器内核;表示威斯尼斯人wns145585首页搜索类型,1表示新版百度威斯尼斯人wns145585首页搜索(先要登录百度帐号),2表示百度实时热点搜索(先要登录百度帐号),3表示传统百度威斯尼斯人wns145585首页搜索。 |
5 | rsv_ers | xn* (*取0或1) 指的是搜索词后,翻页出现对应的相关搜索,从0开始。如果在url里已经是0的话,那对应的相关搜索就从1开始(这个参数还有很多密,这个只是初步测试) |
6 | rsp | 指的是相关搜索排序(从0开始) |
7 | sug | 这个参数只有在你修改下拉框文字时才会出现,指的是下拉框出现的关键词 |
8 | oq | 指的是你在输入搜索词时,输入一半,选择了下拉框之前输入的词;oq= 指的是搜索词,只有当url地址出现rsp而非rsv_bp时,oq才指的是从搜索词跳转到相关搜索。 |
9 |
inputt | 从你打开百度威斯尼斯人wns145585主页,在对话框输入数据的时候开始计时,到你点击百度一下的时间计算。(只有在顶部搜索,威斯尼斯人wns145585首页搜索才会出现)。 |
10 | s?bs | 指的是上一次搜索的词,通俗点说就是在搜某一个关键词后再次搜索其它关键词的意思。bs=这个参数是百度用来判断某个关键词的相关关键词而设置的,也就是百度通过用户的搜索行为来判断某个关键词的相关关键词.(maybe before search) |
11 | f | (1,3,8) 也许还有其他的,暂时发现就这3种,1指的是相关搜索,表示用户选择了搜索页面最下面的“相关搜索”中的某个关键词。;3下拉框搜索 表示用户输入一定的词语之后出现“联想词语”,用户最终用鼠标选择了某个关键词;或用键盘选择了某个关键词后直接按回车。;8用户自主搜索,表示用户直接点击“百度一下”按键(有bs变量时才出现f=8) |
12 | ieinput encoding | 输入编码,主要分为utf-8和gb2312。我们一般通俗的理解为:utf-8是世界性通用代码,也完美的支持中文编码;gb2312属于中文编码,主要针对国内用户使用。 |
13 | ct | 语言限制。0-所有语言,1-简体中文网页,2-繁体中文网页;其它不确定或者无效或。默认值为0. |
14 | rn | 每页包含的搜索结果数目。默认值为10 |
15 | pn | 搜索结果的页码,从零开始计数。即pn = ${结果页码-1}*rn。 |
16 | lm | 搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。 |
17 | q1 | 包含以下的全部的关键词 |
18 | q2 | 包含以下的完整关键词 |
19 | q3 | 包含以下任意一个关键词 |
20 | q4 | 不包括以下关键词 |
21 | q5 | 关键词位置,为空表示网页的任何地方,1表示仅网页标题中,2表示仅网页url网址中。 |
22 | q6 | 限定在某个指定的网站,比如q6=http://www.baidu.com,表示仅在http://www.baidu.com中 |
23 | dq | 不建议使用该参数.查询内容来原的地区限制. 具体值有百度确定.默认值为空.试了一下,使用这个参数的效果很差. |
24 | cl | 百度提交的搜索类型(class),cl=3为网页搜索,cl=2为百度新闻 |
25 | ft | 搜索的文档格式,pdf、doc、xls、ppt、rtf等,默认值为空。 |
26 | lm | 限定要搜索的网页的时间,值为0、1、7、30、360,以天为单位,例如搜索最近一个月的网页,lm=30。默认值为0,表示没有时间限制。 |
百度url结尾带不带“/”对优化的影响
有一种说法是百度蜘蛛认为带“/”和不带“/”是两个不同的网页,但网站实际展示内容相同,这样肯定会对seo产生不利影响(一个页面,一个url),为规避不利,则应选定一个url,其他urlz做301处理。
另一种说法表示带/的一般被认为是一个目录,而不带的则被判断为一个文件。也就是目录与文件的区别,网址末尾加了反斜杠会直接告知浏览器现在指向的是一个目录,目录的话会直接读取index等默认文件。如果没有带/则会首先尝试读取当前目录下的一个文件,如果没有这个文件则会查询与此文件名相同的一个目录,然后在查询这个目录下的默认文件,最后展现出来,这样一来就增加了一个查询相应的时间。出于对网站优化的考虑,网站带上/可以避免网站权重的流失,其效果与301跳转相似。
百度url优化的三种形式
第一:权重目录形式:优化全站快速提升排名首选
如果一个网站需要应用这样的形式的话,那么最好这个网站的内容全部都是原创,不能有伪原创。因为目录形式的url容易分散网站的权重,目录比文章权重要高。在每个页面弄一个直接到威斯尼斯人wns145585首页的链接,那么页面的权重越高,分给威斯尼斯人wns145585首页的权重也就越高,虽然分散网站的权重,但同样每个页面所分出来的权重也可以更快的提升网站威斯尼斯人wns145585首页的权重,并且内页权重要高于其他站,也就是说如果优化这种形式的url内页,势必会比优化文件形式表现的url容易的多。
第二:全文件名形式:威斯尼斯人wns145585首页优化首选
网站所有页面的url规格都是文章形式,这样便于收录,同样也让整个网站的权重全部集中在威斯尼斯人wns145585首页,内页分到权重相对于而言没有太多,相对于而言,对网站威斯尼斯人wns145585首页关键字的排名有所帮助,把所有需要优化的关键词设定在威斯尼斯人wns145585首页能够更快的提升关键词排名,威斯尼斯人wns145585首页赋予关键词的权重高于一般网站。
第三:目录和文件名同时出现:常规优化方法
这样的形式,就是只留威斯尼斯人wns145585的产品中心的产品目录和新闻中心(就是经常更新内容文章的目录)url已目录的形式,但是单个产品页面也就是最终页面url还是已文章的形式。这样的话一些产品目录的页面权重就比较高了,容易提升网站关键字的排名。而新闻页面之所以也这样做,是因为内容方面基本上都是伪原创的,让新闻页面的权重高点,也可以提升网站的收录。
需要注意的是切勿频繁的更换网站url,否则很可能会出现快照不更新或者网站内容不收录的现象,严重时还会造成网站降权。
百度url在网站优化中的小技巧
1、百度对url长度的最高要求为1024个字节;
2、动态和静态url对于百度来说没有差别,更没有歧视;
3、百度会忽视url链接#号后面的内容;
4、适当提交url会更有利于蜘蛛的抓取和页面的收录。
虽然动态和静态 url 百度不会有歧视,但是事实表明静态页面会更容易被搜索引擎收录,说明搜索引擎对静态页面会更加的友好。
百度url优化建议工具
早在2011年百度站长平台就提供了这么一个rul优化建议工具,可以快速检测url是否存在问题并提出相应的建议。这里的url是教宽泛的概念,包括网址和及其所在页面的一些要素,如title信息、meta信息、图片alt信息、flash文字信息、frame和iframe框架结构等。我们要善于使用这些工具来帮助我们进行网站优化。
百度搜索引擎关于url优化的建议
1、链接统一
网站中每一个独立页面,只对应使用一个url链接。如果网站内多个url连接,可以访问同一个页面,那么将面临以下危险。
a.搜索引擎难以识别主次,甚至放弃对该内容的抓取。
b.用户可能分享同一页面的多个url,这非常不利于seo优化。
网站如果已经出现这种情况如何解决?
a.在系统中只使用正常形式url,不让用户接触到非正常形式的链接。
b.不把session id、统计代码等不必要的内容放在url中。
c.不同形式的链接,301永久跳转到正常形式。
d.防止用户输错而启用的备用域名,301永久跳转到主域名。
e.使用robots.txt禁止baiduspider抓取您不想向用户展现的形式。
2、用户体验
网站中包含的url链接,通常以锚文本形式出现,此时也同样涉及用户体验。通常友好的表现形式为:通过对当前链接的描述性文字分析,用户能够预测即将访问页面的主要内容。可以试着假设一个场景,现在你正打算点击一个“网站优化”的锚文本链接,当正式访问之前心里预测的内容是什么?
3、url层次
在seo技术领域常说“较短的url链接、有利于搜引抓取”的确如此,换个角度想太长的url链接,不仅外观看上去浑浊,同时还可能影响页面打开速度,间接也是不利于用户体验的表现。
4、动态链接
网站中的url链接动态或静态,都不影响搜索引擎抓取,但建议尽量减少动态url中包含的变量参数,这样即有助于减少url长度,也可以减少让搜索引擎掉入黑洞的风险。
5、文件及目录名具有描述性
对于网站分类url来说,目录应该具备一定的描述性,就是在用户看到你的url链接,就大概知道里面会是什么内容。
6、字母全部小写
字母小写的主要原因有如下:
1,全部小写方便人工输入,不会因为大小写而犯错
2,有的服务器是区分大小写的,比如linux服务器
3,robots.txt也是区分大小写的,一个字母的问题,可能就会导致真个目录不被收录。
7、连词符使用
在目录或文件名中单词之间一般建议使用短横线(-)分隔,不要使用下划线或者其他符号和字母,因为搜索引擎吧url中的短横线当做空格,而下划线则被忽略。
8、分类使用形式
大部分cms系统都可以分类页面设置为目录形式或文件形式,就拿dedecms来说,目录形式的默认文件为index.html,然后在这个目录下面有列表页和文章也,这样就会导致列表第一页和默认的index.html内容相同,也就是说同一个页面会有两个不同的url,这样是不利于收录的。站长可以选择其中一种。
百度url提交通道优化升级
在百度搜索框中输入我们的url,如果我们的url没有被百度收录,则会出现一个提交到百度的链接,点击到百度站长平台进行提交,可以更方便百度蜘蛛进行抓取,促进网站收录。即便不能保证被百度索引收录,至少这是一个比较好的开始。
注:站长平台不保证提交后一定会收录,系统会对所有提交的url进行质量筛选,符合百度收录标准的url将被百度收录。
通过小韩为大家介绍,相信大家对百度url一定有了更深的了解了吧!的过程就是各种细节的灵活运用,这仅仅是小韩对url的理解,相信还有更多精彩的内容需要我们来进行学习的,穷则变、变则通、通则久、否极则泰来,把不规范的规范化,把不利之处转化为有利的影响,这就是网站优化的真正意义所在。优化两个字正是对应了一个“变”、一个“通”!欢迎大家来与小韩进行学习交流,三人行则必有我师焉:qq
让百度搜索引擎快速发现你、收录你:做到秒收录不是梦
1、百度收录提交:http://zhanzhang.baidu.com/linksubmit/url 输入想要收录的网址,点提交按钮:这个收录仅仅是请求百度记录一条记录,虽然被记录了,但是由于需要抓取、收录的网站很多,需要一定的时间周期,一般是15天内收录为正常周期(如果想快速收录或秒收请把下面几种收录方法都用上),假如15天内没有收录,说明你的网站存在搜索引擎不喜欢的问题,例如:该域名曾经被百度处罚或加入黑名单;或者该域名下的网站内容属于非法的;或者该域名网站优化过度等问题;百度提交收录如下图:
2、百度自动推送方法:将以下代码复制到网站html代码之间,一般放到html代码之上,如图:
3、百度主动推送(实时)
首先打开百度站长工具:http://zhanzhang.baidu.com/linksubmit/index 选择主动推送(实时)选项卡,点击“修改准入密钥”更新自己的密钥id
这个功能适合懂开发的人员,大家可以了解,具体操作步骤:必须是先注册百度站长账号,然后添加网站,选择主动推送的域名,更新密钥id,然后根据生成的接口和适合自己网站的推送方式进行,百度站长一共提供了四个推送案例,分别是:curl推送、post推送、php推送、ruby推送,最常用的是“post推送”如果大家不了解,可以不采用这个方法了,直接采用自动推送方式即可;
4、云优化软件提交:属于数据包反馈请求的一种方式
打开云优化软件-seo工具-新站快速收录,这个方法是收录最快速的方法之一,主要是通过数据包请求给百度,让优先抓取和收录该网站;
5、自助外链记录
直观的理解就是将该网站的url文本链,留到各大公共媒体上,这样百度收录更新这些公共媒体网站时,通过url匹配识别,凡是没有收录和更新的网站都会列到百度收录库里,这样操作跟容易被百度及时发现及时抓取;操作方法如下:
打开seo外链自主发布地址:http://seo.addpv.com/superlink/ 输入要收录或更新的网址,点击“开始自动增加外链”按钮
6、高质量外链引导
去知名公共媒体留下您网站url超链接;由于知名的bbs、博客、空间等被百度抓取的频率很高,当抓取对方时发现新链接,百度会优先更新该链接,例如:站长站、a5、搜外等更新频率高的公共媒体;
7、高质量友链引导
友链是衡量网站质量高低的一个因素,例如:马云说:云优化是我投资的,那么很多人都会相信,云优化被马云投资了,如果云优化说:马云投资了我们,估计大部分人是不相信的,假如马云说投资了云优化,云优化也发布了马云投资的公告,这就形成事实了,所以高质量友链首先是双向的,并且是信誉提升的关键,因为高质量友链更有利与搜索引擎抓取和赋予评级;很多站长主要是高质量友链资源匮乏,这才是无法做到秒收的根本原因。
8、cookie记录:这个方式非常难,大家只做了解
cookie是由服务器端生成,发送给user-agent(一般是浏览器),浏览器会将cookie的key/value保存到某个目录下的文本文件内,往往可以记录用户登陆及访问记录等,那么我们就可以模拟修改cookie让百度更好的抓取url记录
如果站内优化到位,站外高质量外链和友链是排名出现和排名提升的一个基础,也重中之重,由于搜索引擎里url是海量的数据,想通过最短时间帅选精准的结果是非常难的一件事,那么搜索引擎解决搜索效率和精准结果必须靠url评级 索引进行;所谓的索引就是百度有很多排名更新的服务器,排名是在每周进行更新后建立的索引,所以说:搜索引擎检索的结果其实是预先索引好的排名结果。
百度两项核心专利技术是超链分析技术与投票算法,超链分析 技术是将收录页面里的超链接锚文本进行了分析处理,锚文本用来衡量网页相关性;超链接指向用来衡量url评级。url评级高低取决于链接所在的网站是否是权威性的,例如sina、souhu、163知名网站存在你网站的链接回路,那么您网站url评级肯定会大增,百度搜索结果20名外的词靠高质外链;前两页靠投票算法;更多细节大家可以参考http://www.seodo.cn/askdetial/10023