当前位置: 首页 » 资讯 » SEO宝典 » 正文

禁止收录与跟踪--Robots 文件优化

放大字体  缩小字体 发布日期:2018-02-09  浏览次数:163
核心提示:网站 Robots文件是一个文本文件,一般以 robots.txt形式,存放在网站根目录下。如图 5.7图 5.7搜索引擎在抓取网站内容时,都会先

网站 Robots 文件是一个文本文件,一般以 robots.txt 形式,存放在网站

 

 

目录下。如图 5.7

  

 

5.7

 

搜索引擎在抓取网站内容时,都会先在根目录寻找是否有 robots.txt 文件,

 

因为 Robots 就是网站和搜索引擎的一个协议。网站不希望搜索引擎抓取的内

 

容,搜索引擎是不会抓取的,而网站需要抓取的内容可以写出来,也可以不写。

 

User-agent:该项的值用于描述搜索引擎蜘蛛的名字。如果该项的值设为*,

 

则该协议对任何搜索引擎都有效。不同的搜索引擎名称也是不一样的。

 

Disallow:拒绝收录,阻止搜索引擎蜘蛛抓取的内容。

 

Allow:允许收录,即同意搜索引擎蜘蛛检索和收录的内容。

 

举例:

 

网站目录下所有文件均能被所有搜索引擎蜘蛛访问

 

User-agent: *

 

Disallow:

 

禁止所有搜索引擎蜘蛛访问网站的任何部分

 

User-agent: *

 

Disallow: /

 

禁止所有的搜索引擎蜘蛛访问网站的几个目录

 

User-agent: *

 

Disallow: /a/

 

Disallow: /b/

 

只允许某个搜索引擎蜘蛛访问(百度)

 

User-agent: baiduspider

 

Disallow:

 

 
 
[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 
0相关评论

 
推荐图文
推荐资讯
点击排行