首页
壁纸
Search
1
免费typecho主题(joe)模板----持续更新
4,595 阅读
2
网站美化,功能教程(CSS美化教程)
2,819 阅读
3
【小熊猫blog】一键生成表白源码
2,295 阅读
4
免费typecho主题模板----原版
2,188 阅读
5
网站底部好看的装修代码
1,802 阅读
源码下载
网站源码
新闻资讯
网站优化
技术教程
值得一看
网站美化
主题模板
typecho主题插件
wordpres主题插件
登录
Search
标签搜索
服务器
博客
网站
32yun博客
问题
情感
百度
url
熊猫
type
宝塔
主题
Linux
PHP
链接
文章
首页
tabs-pane
tabs
hide
小熊猫
累计撰写
99
篇文章
累计收到
386
条评论
今日撰写
0
篇文章
首页
栏目
源码下载
网站源码
新闻资讯
网站优化
技术教程
值得一看
网站美化
主题模板
typecho主题插件
wordpres主题插件
页面
壁纸
用户登录
登录
搜索到
1
篇与
robots.txt
的结果
2021-10-30
Typecho博客设置robots文件
{mtitle title="小熊猫博客爱分享"/}什么是Robots协议(robots.txt)? Robots协议(也称为爬虫协议、机器人协议等)全称是“网络爬虫排除标准”(Robots Exclusion Protocol),是国际互联网界通行的道德规范,Robots是站点与spider沟通的重要渠道站点通过robots告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯.因其不是命令,故需要搜索引擎自觉遵守robots.txt如何奏效呢? 搜索引擎机器人访问网站时,首先会寻找站点根目录有没有 robots.txt文件,如果有这个文件就根据文件的内容确定收录范围,如果没有就按默认访问以及收录所有页面。另外,当搜索蜘蛛发现不存在robots.txt文件时,会产生一个404错误日志在服务器上,从而增加服务器的负担,因此为站点添加一个robots.txt文件还是很重要的。百度也会严格遵守robots的相关协议,要注意区分你不想被抓取或收录的目录的大小写,百度会对robots中所写的文件和你不想被抓取和收录的目录做精确匹配,否则robots协议无法生效。robots.txt基本语法{alert type="success"}注意:robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写{/alert}{card-default label="User-agent" width="1"}描述搜索引擎robot的名字即 : 你可以指定该规则只对baidu 或者google 或者其它指定搜索引擎有效 可用通配符 *表示全部{/card-default}{card-default label="Disallow:" width="1"}描述不希望被访问的一组URL即:设定禁止访问的部分,可以用完整url,也可以用相对路径,可以是单个目文件,也可以是整个文件夹,也可以用通配符限定指定类型{/card-default}{card-default label="Allow:" width="1"}卡片内容{/card-default}描述希望被访问的一组URL即:设定允许访问的部分,不过因为默认是全部允许的,这个语法通常是配合disallow使用的,用它来完成 如“除了xxx.html该目录下全部不能访问”这样的设定。 要注意的是allow和disallow的顺序是有讲究的,搜索引擎会以它先看到的规则为判断标准。{card-default label="Sitemap:" width="1"}指示蜘蛛去爬取网站的sitemap文件{/card-default}{card-default label="通配符:" width="1"}"$" 匹配行结束符;"*" 匹配0或多个任意字符{/card-default}如何辨别自己网站是否配置了robots.txt呢?第一种方法:访问网址 http(s):你的域名/robots.txt即可第二种方法:通过 [百度站长工具] 来检测如何正确编写一个保护网站隐私的robots.txt呢?我们想要的效果是:要求所有搜索引擎遵循我的这个协议禁止蜘蛛抓取我的后台地址和Typecho的安装路径指引蜘蛛去抓取我的Sitemap那么我们可以这样写,在网站根目录下新建一个robots.txt文件,内容如下:{tabs}{tabs-pane label="方法一"}隐藏内容,请前往内页查看详情{/tabs-pane}{tabs-pane label="方法二"}隐藏内容,请前往内页查看详情{/tabs-pane}{/tabs}检测效果图
2021年10月30日
1,560 阅读
9 评论
1 点赞