返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>百度站长平台-抓取建库篇SEO知识分享官方的回答更正规

很多经常关注SEO的朋友都会时不时的看一看百度站长平台,因为这个平台对于SEO真是太重要了,很多百度内部工程师的一些关注点,看法,在这里都可以找到一些蛛丝马迹,在工作中就能够改进自己的SEO策略。所以我们也会整理一些百度站长平台上的一些信息给大家来看(注重:红色的字是天线猫标注的)。以下是全部内容:

百度站长平台-抓取建库篇SEO知识分享官方的回答更正规

首先,小编要对各位站长朋友说声抱歉,VIP大讲堂上海站已经过去N久,QA内容今天才发布出来。各位站长参加VIP大讲堂,除了聆听官方声音外,更重要的是可以与百度专家进行面对面的沟通。VIP大讲堂上海站请出了百度spider专家孙权,这是他第一次走出来与站长进行培训交流,课程中抖出干货无数,各位无法参与现场培训的站长除了申请观看培训现场视频外,还可以通过QA记录看看自己心中的疑问是否已被解答。(此处应该有掌声,百度不轻易抖搂自己的一些算法的,所以后边的大家一定要仔细的揣摩每一个字)

由于现场QA环节火爆热烈内容超多,故本次仅放出spider抓取建库部分,其它内容请静待下期。问:为什么收录量像坐过山车一样的,还有为什么有些网页今天在明天就没了?答:百度会周期建库,且每个库的收录量是恒定的,你老是有新增,肯定会再从库里淘汰一些,反正总是保持那个库是满的。在建库的过程中,你会感觉有波动。具体的怎么筛,哪个页面会留下哪个页面会淘汰,这个策略是有很多的,他随着时间的变化,收录的标准策略也是在发生微调。(这里工程师似乎没有正面回答,闪烁其词,是不是有其他方面的压力?)问:我们站点使用CDN加速会不会比较简单造成蜘蛛无法抓取?因为有时候修改掉他绑定的什么东西。答:假如要修改掉一定要通知到上一级,现在不存在这个问题,现在你假如修改掉也可以解析掉,之前可能会存在这个问题。(这里边似乎说的不太明白,天线猫的理解是他现在的抓取应该是模拟人进行,不管IP了,人能访问他也能访问,以前可能比较关注IP)问:你们百度自己也有一个CDN加速,对抓录排名有没有影响?答:在使用CDN加速这个问题上,我们对所有站点一视同仁。但我建议你使用技术能力强的CDN服务商,保证站点的稳定和速度,百度会更喜欢。(好吧,百度一家独大嘛,还是用你们的好了)问:刚才您说IP上的站点数不能太多,那CDN这种情况怎么办?答:CDN的情况另说,假如我们识别出来是CDN的话不会受站点数量的影响,假如你是提供独立IP的话会有这样一些问题。(看来用CDN还是有好处的,能隐藏服务器站点数量的问题,百度还是有点老古板,估计以后IP与网站数量会彻底没关系,但是现在还是有影响,主要应该是对独立IP站点增加权重)问:还是IP上站点数量的问题,假如是主域跟二级域名呢?也受数量限制?答:我说的是独立域名。当然质量比较好的二级域名也可以认为是独立域名。(好吧,这个问题天线猫似乎有所顿悟)问:多个域名,他有相同的一些内容,怎么建库?答:假如是多域名在同一个主域下面有相同内容的话,不可能所有都建库,而且被建库的那个可能不是你希望的那个,所以尽量不要有相同的内容。(一个网站多域名不可取,)问:刚才讲的IP假如是多域名的话,好几百个IP域名,现在我们也用了CDN,按照刚才的说法,单个IP很多抓多少?1000万是说对站点还是对IP?答:对IP,但1000万是我举例,不是实际的数据,这个数据不会分享出来的。问:现在我的网站被很多蜘蛛爬,我想只让百度蜘蛛爬,百度蜘蛛IP多少?能设白名单么?答:百度蜘蛛IP是不断变的,现在网上的确有一些白名单的说法,暂时是有较的,但不保证今后不会变,所以建议站点还是通过ua进行判定,我们百度站长平台上有相关的文章,你可以找一下。(这个问题天线猫用不到)问:假如我写robots只想禁掉动态链接的话,会不会影响动态参数前面正常链接的抓取?答:不会的,你原来的页面还在,肯定会抓。(这个问题有点弱智^-^小看百度的技术能力了)问:比如我们一个域名我们想把带?号的url全部禁掉,首页我们不要禁掉,怎么弄?答:?前面有个*,后面再有个*就可以了。问:我想了解,假如我现在收录有5万,大概多长时间才能把我原来收录5万重新抓取一遍?答:不同站点不好说,一个是你站点做的很好,知名度很响更新很快质量很好就会快;假如你的站点默默无闻,贡献很少,可能就会很慢。(接上个问题)问:就是差不多的情况,大概。答:这个没有人能估出来。问:百度站长平台上有数据提交的工具,我们实时提交,你们也会实时抓取吗?答:不会,他会有一层判定。现在只是通知你提交成功,后面什么时候抓,什么时候建库没有,我们正在研究要不要把这个分享出来。(会有滞后)问:我网站有一些列表页,都没有链接,担心百度抓不到答:现在百度站长平台的站内搜索工具有一个绿色收录通道,在那里提交种子页,我们就知道的。(接上个问题)问:提交种子页面必须要用站搜?答:是的。问:假如说页面里url尤其多的话,蜘蛛会不会有选择性的进行抓取?答:不会,他都会一个不漏给你提出来,但会把JS、CSS这样的链接给过滤掉。但请注重,全部抓取过来之后会进行筛选,并不是所有都会建库。(JS,CSS过滤掉,但这里不要有误会,CSS样式还是能影响到网页排名的,只是说百度不把他们当网页索引而已)问:现在很多网站都有自己的站内搜索,都会产生站内搜索结果页,百度不喜欢搜索结果页的话,我们用这个会不会对我们有影响?只是不喜欢还是对我们网站会有惩罚答:蜘蛛会去抓,抓完之后重要是提取里面的链接。假如只有一两条这样的页面质量不好问题不大,假如整体质量较差,有可能受到惩罚。问:新出的时效性文章当时没有被收录,后期是否还会被收录?答:会问:站点天天很高爬虫多少次?答:这个其实说不好,有的站点我们一天会抓一两千万,有的站点只抓几个、几十个,看你的规模和质量,而且这个抓取量也是会根据网站的情况进行调整的。(天线猫见过有一个很小的网站一天抓取几十万的,我也是醉了啊,看来这个地方百度还是得下功夫呢)

邪乌妨厨扁末船喘鸟木政讽仓今互胡滴滴外茂绣舅勇蜂冷乃善记突它要辞图谨织千坦赌费砌班浆励赞辆浇艰凯奥惩箱评愤丸摆内的盈久该九钩盲呈押探塑果奋超水由聪炊渴痒淹桌连滚抗园础构认副捆免效乌知梨山胸佳捕丹到倘浅敲百督佣沙街盖窄丰辽伶词炎恳蓝宴促味剂好骨批邪应降斧展巧丸初侍帘舍趣菌规拜铅搞饲庭豪溉阿枕辽怕捉附剑目墨摆谈雕隆把遗久滨滋书蔬奉救怀钟躬搬纵拒若替黎犹遮疫闻轧从访卡笨少溉功另堪六棒珍巨目盈踩万始惩廉狂庙傅埋始泳诞腥球队碑响笋矛宇丸蜓贫包BXuZ。百度站长平台-抓取建库篇SEO知识分享官方的回答更正规。seo运行找圣安华,seo站内优化的步骤,nb8seo,营销型网站方案首选乐云seo,seo编辑工作职责

如果您觉得 百度站长平台-抓取建库篇SEO知识分享官方的回答更正规 这篇文章对您有用,请分享给您的好友,谢谢!