Typecho博客设置robots文件

Typecho博客设置robots文件

xiongmao

2021-10-30 / 9 评论 / 1,559 阅读 / 正在检测是否收录...

10/30

温馨提示：

本文最后更新于2021年11月21日，已超过1229天没有更新，若内容或图片失效，请留言反馈。

什么是Robots协议(robots.txt)？

　　Robots协议（也称为爬虫协议、机器人协议等）全称是“网络爬虫排除标准”（Robots Exclusion Protocol），是国际互联网界通行的道德规范，Robots是站点与spider沟通的重要渠道站点通过robots告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯.因其不是命令，故需要搜索引擎自觉遵守

robots.txt如何奏效呢？

　　搜索引擎机器人访问网站时，首先会寻找站点根目录有没有 robots.txt文件，如果有这个文件就根据文件的内容确定收录范围，如果没有就按默认访问以及收录所有页面。

另外，当搜索蜘蛛发现不存在robots.txt文件时，会产生一个404错误日志在服务器上，从而增加服务器的负担，因此为站点添加一个robots.txt文件还是很重要的。

百度也会严格遵守robots的相关协议，要注意区分你不想被抓取或收录的目录的大小写，百度会对robots中所写的文件和你不想被抓取和收录的目录做精确匹配，否则robots协议无法生效。

robots.txt基本语法

描述希望被访问的一组URL
即：设定允许访问的部分，不过因为默认是全部允许的，这个语法通常是配合disallow使用的，用它来完成如“除了xxx.html该目录下全部不能访问”这样的设定。要注意的是allow和disallow的顺序是有讲究的，搜索引擎会以它先看到的规则为判断标准。

如何辨别自己网站是否配置了robots.txt呢？

第一种方法：访问网址 http(s):你的域名/robots.txt即可
第二种方法：通过 [百度站长工具] 来检测

如何正确编写一个保护网站隐私的robots.txt呢？

我们想要的效果是：

要求所有搜索引擎遵循我的这个协议
禁止蜘蛛抓取我的后台地址和Typecho的安装路径
指引蜘蛛去抓取我的Sitemap

那么我们可以这样写，在网站根目录下新建一个robots.txt文件，内容如下：

检测效果图

本文共 758 个字数,平均阅读时长 ≈ 2分钟

打赏

注意：本站资源多为网络收集，如涉及版权问题请及时与站长联系，我们会在第一时间内删除资源。

您购买的只是资源，不提供解答疑问和安装服务。

本站用户发帖仅代表本站用户个人观点，并不代表本站赞同其观点和对其真实性负责。

本站资源大多存储在云盘，如发现链接失效，请及时与站长联系，我们会第一时间更新。

转载本网站任何内容，请按照转载方式正确书写本站原文地址

版权属于： xiongmao

本文链接： https://bykjvip.com/213.html

文章转载：

作品采用：本文版权内容属于《 xiongmao 》转载请标明出处

小熊猫 Lv.3

·Android · Google Chrome

沙发

小熊猫测试

2021-10-30 回复删除垃圾

阳 Lv.1

上海 ·iPhone · Safari

板凳

拿走

2021-12-05 回复删除垃圾

sdg Lv.1

·Windows 10 · FireFox

地毯

试一下

2021-12-07 回复删除垃圾

马云 Lv.1

深圳 ·Windows 10 · Google Chrome

第4楼

服了天天偷文章

2021-12-10 回复删除垃圾

小熊猫1 Lv.3
XX ·Android · Google Chrome

@ 马云

你真厉害，我花两个小时才测试好，来个偷文章，脑子累兄弟

2021-12-10 回复删除垃圾

aas Lv.1

XX ·Android Pie · QQ Browser

第5楼

2022-02-02 回复删除垃圾

小妖王 Lv.1

·Android · QQ Browser

第6楼

6666

2022-03-03 回复删除垃圾

啧啧啧 Lv.1

东莞 ·Android · QQ Browser

第7楼

2022-03-23 回复删除垃圾

阿兴 Lv.1

XX ·Android · Google Chrome

第8楼

看看

2022-06-15 回复删除垃圾

什么是Robots协议(robots.txt)？

robots.txt如何奏效呢？

robots.txt基本语法

如何辨别自己网站是否配置了robots.txt呢？

如何正确编写一个保护网站隐私的robots.txt呢？

免费typecho主题模板----原版

免费typecho主题(joe)模板----持续更新

评论 (9)

小熊猫

绿水本无忧，因风皱面

青山原不老，为雪白头