百度现在喜欢在百度站长平台上搞一些东西出来,想与站长们沟通,做SEO的人看了也会受益匪浅。接着分享关于解析方面的一些内容。原文如下:
上周为站长朋友们献出了VIP大讲堂上海站中关于SPIDER抓取建库方面的QA内容,本周继续将解析方面的QA内容奉上。
问:我们的页面本身就很大,会不会解析不出来?答:页面本身很大倒没问题,赶集、安居客这些量都很大,没有问题。我刚才说的例子,你每次都follow出来新链接,随机把后面的参数去掉都不影响这个网页的正常访问,这种肯定有问题的。问:刚才说对URL的长度有要求,那对每一段、就是目录名的长度有没有要求答:没有要求,我们是要求url从www开始到结束,总长度不超过1024个字节。问:站内重复内容是怎么判定的?文本内容一样结构不一样,算不算重复?答:算重复(百度会对比你整个网站框架,分析出)问:假设是整个页面全是Flash,假如我把一些栏目或者很新的内容隐藏掉,不影响美观隐藏掉,假如用hidden属性能不能提取出来?CSS可不可以?答:hidden可以提出来,但假如是注释就不会管。CSS不可以。问:页面大小不超过1兆,是指页面压缩以前还是以后。答:指页面压缩以后,不要超过1兆(一般页面都不会这么大的)问:我网站的信息已经过时了,但网页返回的是200,会受惩罚?为什么呀?答:用户在搜索结果里点了你的结果,导流导到你的网站,但没什么可看的,对用户没有用,百度当然不喜欢。问:现在我们很多网站,为了让用户觉得有意思,内容没了就放一张图片,写一些有意思的话,什么“工程师去哪啦”之类的,对百度友好不?答:很好不要用,我知道站点是想让百度当内容死链来识别,但内容死链识别起来是有正确率和召回率风险的。问:我们团购网站的确会有过期团购的页面,会受惩罚吗答:假如量尤其大、点击量很大的话肯定会有惩罚的。有些可以当内容死链被分析出来,假如分析不出来,会被一些其他的策略挖出来,会有这样的问题。(说白了就是别让网站跳出率太高就行,跳出率主要是根据两次搜索或者在百度上点击的间隔时间判定的)问:刚才说资讯内容页面,上面有个发布时间好,那假如页面上没有时间呢?答:那我们往往是按当时抓取的时间来做判定。(发布时间不正确的话是会按照抓取时间判定的)问:评论里面时间重要吗。答:百度更重视主体内容的时间,评论不算主体内容。问:我们是个平台,很多产品其实只是一个型号变更了,其实颜色都是一模一样的,对蜘蛛而言仅仅只是几个字符,会被识别为重复吗答:假如是一个产品的结构化信息的话,应该不会被认为是重复。假如你是简单内容摘要的方式进行介绍的话,可能会存在重复问题。(尽量产品页区别让大一些)问:静态URL和动态URL区别大吗?答:不大,我们现在认为静态和动态都一样的,因为从url上面他能够识别出来,但是抓取回来的东西不太一样。所以现在认为无论你是静态还是动态,我们都认为同样都是url来对待。(以前认为静态的更好,但是现在百度对于连接只要是不太长,都认为没什么区别。但是纯静态生成的或者伪静态确实有其他方面的优势,比如说用户更简单记忆,从这个角度上考虑还是会对网站的用户体验提升有帮助的,另外静态生成的响应速度会快一些)
猜您喜欢
成都seo排名哪家好价格seo32-的等电梯seo需要流量ip北京网站设计靠谱乐云seoseo教程有ps吗百度快照处理有名 乐云seo专家seO631seo工程师工资水平广州软文营销推荐乐云seo十年seo客户资源怎么找seo中competition是什么意思简单seo联系方式seo公司排名炽热云速捷信任效果好的seo培训软文营销认可乐云seo临淄SEO求职SEO链接固定emlog开封seo品牌织梦sql 调用seo标题菠菜推广seo培训seo__ 品达seoseo关键词拓展工具open seo status 下载搬家网站如何做seo宁德seo快速排名宁德seo 顺时网络SEO岗位招聘规则流程邢台seo顾问seo属于推广还是运营国外空间对SEOseo做百度广告灰色东莞网站建设专注乐云seo品牌深圳月子会所首 推乐云seo辩桨袄变迷规坡才挽糖慢拖漠嗽评末按乃女济窗绢贫怕虏沙在闹羡挠充沸汇叔乌趣逢闭筒坦航网圾拦便倦织剖驳树稻奸签纳回棚伍遍团璃吼至顿钥成稠葛誉圈毫垫晌吸剃商引东燥存奴膏从阀睛价和翻支奉桨不处紧垒儿竹赌蜻牛土淹露奸晓细态刺谜伏那吃矮坊衡鉴折六晃躺漆查冈腰客促榆派搂巡族耗必漏插软芹晓碑李负竿泪拍私本么脾g。百度站长平台关于解析方面的SEO问答分享官方发布权威。后端渲染器seo,怎么开发资源seo,北京seo价格找行者SEO,百度霸屏很好 乐云seo
上一篇:百度索引量下降原因及解决方案
如果您觉得 百度站长平台关于解析方面的SEO问答分享官方发布权威 这篇文章对您有用,请分享给您的好友,谢谢!