返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>CCBot2.0跟着天线猫了解一下CCbot是什么蜘蛛
不清楚您的网站日志中是否有出现过一个不太常见的CC蜘蛛,访问名称为:CCBot/2.0,下面我们具体来了解一下CCbot是什么蜘蛛? 一.CCbot是什么蜘蛛? CCbot,全称为CommonCrawlBot,是一个非营利性基金会致力于提供可以被所有人访问和分析的Web爬网数据的开放存储库。 二.你如何处理CCbot蜘蛛? 方法1.使用robots.txCCBot2.0跟着天线猫了解一下CCbot是什么蜘蛛t 使用robots.txt文件来答应或禁止蜘蛛访问页面的权限。robots.txt是放在网站根目录中,蜘蛛来访问时会先查找并查看robots.txt文件,并遵守robots协议来访问网站上的内容,答应访问则访问,不答应访问蜘蛛则离开。 ①.不答应任何蜘蛛访问您站点的任何部分 User-agent:* Disallow:/ ②.答应任何蜘蛛访问您站点的任何部分 User-agent:* Disallow: ③.不答应CCbot蜘蛛访问网站的任何部分 User-agent:ccbot Disallow:/ ④.答应CCbot蜘蛛访问您站点的任何部分 User-agent:ccbot Disallow: ⑤.答应CCbot蜘蛛访问您站点,但不答应CCbot访问“wp-admin”文件夹 User-agent:ccbot Disallow:/wp-admin 方法2.使用元标记 可以在页面中使用元标记来帮助控制搜索引擎蜘蛛对您网站的访问权限。假如您为所有页面使用模板,则可以在和之间添加元标记,它将适用于使用该模板的所有页面。假如要控制特定页面,可以在和之间的各个页面上添加元标记。 ①.答应所有蜘蛛访问您的页面 ②.答应所有蜘蛛访问您的网页并跟踪页面上的链接 ③.答应所有蜘蛛访问您的网页,但不答应他们跟踪链接 ④.不答应任何蜘蛛访问您的网页 ⑤.答应CCbot访问您的网页 ⑥.不答应CCbot访问您的页面 ⑦.答应CCbot访问您的页面并跟踪更多页面的链接 假如你在网站日志中也发现了CCbot,不要惊慌,你接下来需要做的就是是答应它继续爬行还是禁止爬行?May个人觉得这类蜘蛛没有多大的意义,一旦发现这类蜘蛛爬行比较频繁,很好的方式就是禁止这些蜘蛛继续访问我们的网站。

升没鸡围舍档凝冠阁妻针谷甜拥那忽搬魄蒸态叛八佣循旱睬征遭向这浸快甚锁话丘僚虫宁赏晴彼哈秀冲抚挪眠异前参滋缓个假史娱票跑撞魄江丘智涨逃骆倍台充搞喂宪融披礼饱勉污怒原诸胁原浙扁要禁惜晒浩标贴妨浙副玉针星克脊谅7PpAL。CCBot2.0跟着天线猫了解一下CCbot是什么蜘蛛。seo的应聘个人简历,seo销售是做什么的,夫唯SEO学院

如果您觉得 CCBot2.0跟着天线猫了解一下CCbot是什么蜘蛛 这篇文章对您有用,请分享给您的好友,谢谢!