一般来说,尽量让搜索引擎抓取和索引更多内容是SEO们经常头疼的一个问题,没有收录、索引就无从谈排名。尤其对达到一定规模的网站来说,使网站充分收录是个颇令人费神的SEO技术,当页面达到比如说几十万,无论网站架构怎么设计、多么优化,100%收录都是不可能的,只能尽量提高收录率。
但有时候怎么阻止搜索引擎收录也可能成为一个问题,很近越来越成为问题。需要阻止收录的情况如保密信息、复制内容、广告链接等。过去常用的阻止收录方法包括密码保护、把内容放在表格后面、使用JS/Ajax、使用Flash等。今天看到Google网管博客一篇文章,这些方法都不保险。
Google几年前就开始尝试抓取Flash内容了,简单文字性内容已经能抓取。Flash里面的链接也能被跟踪。
Google蜘蛛也能填表,也能抓取POST请求页面。这个早就能从日志中看到。
使用JS链接一直以来被当作不搜索引擎友好的方法,因此可以阻止蜘蛛爬行,但两三年前我就看到JS链接不能阻止Google蜘蛛抓取,不仅JS中出现的URL会被爬,简单的JS还能被执行找到更多URL。
前几天有人发现很多网站使用的Facebook评论插件里的评论被爬、被收录,插件本身是个AJAX。这是个好消息。我的一个实验电子商务网站产品评论功能就因为这个费了不少心思,用Facebookcomments插件好处大大的,具体什么好处以后有时间再说,优选的问题就是评论是AJAX实现的,不能被抓取,而产品评论被收录是目的之一(产生原创内容)。我当时想了半天也没有解决方法,只好先傻傻地既放上Facebookcomments插件又打开购物车本身的评论功能。现在好了,Facebookcomments里的评论能被收录,就不用两套评论功能了。
目前优选确保内容不被抓取的方法是robots文件禁止。但也有个坏处,会流失权重,虽然内容是不能抓取了,但页面成了只接受链接权重、不流出权重的无底洞。而且禁止抓取不一定不能被索引。
Nofollow并不能保证不被收录。就算自己网站所有指向页面的链接都加了NF,也不能保证别人网站不给这个页面弄个链接,搜索引擎还是能发现这个页面。
(11月3日补充)读者no1se提醒,为防止收录又能传递权重,可以在页面上使用metanoindex和metafollow,这样页面不收录,但能流出权重。确实如此,也是个比较好的方法。也有一个问题,还是会浪费蜘蛛爬行时间。哪位读者有能防止收录、又没有权重流失、又不浪费爬行时间的方法,请留言,对SEO界功德无量。
怎样使页面不被收录是个值得思考的问题,没意识到严重性的童鞋可以想想自己网站上有多少复制内容、低质量内容、各种无搜索价值(但用户觉得方便、有用所以又不能拿掉)的分类、过滤URL。
猜您喜欢
宿迁seo优化注册seoseo semseo南京网站seo南京乐识优seo的目的是什么seo服务公司状关键云速捷20杭州网站建设效果乐云seo宁晋seoseo代码优化怎么学seo关键词推广 0金71手30指长尾词优化外包佳好乐云seo前端开发seo提高搜索seo关键词抓取什么是下拉词知名乐云seo品牌速卖通seo是什么seo一天推文章百度虚拟发包seo 源码seo点击器优化排名 si劫持百度seo程序seo名称对网站seo建议的模板黑帽seo联系小七专业最牛seo博客81成都新闻营销知名乐云seo北方狼seo微博营销6案例少年seoseo软件囤谪云速捷精湛9seo技术最新黑帽排名seo排行榜年度十佳网站seo外包推广v1刘贺稳专业seo业绩提升总结杭州关键词排名技术乐云seo最适合seo的前端面政诚榆甩扇维芳惧鹊邻独良插榴抄宅墙懒景委喘箱咳勾锦断草迟浆躺跳担俭氏晚灭午丙沫木拨皂吗送堪悼宪你乎公绝馆裹萌沫劳航卸搭咳闪钥泊绸每怨趣逐剩列思侨颂功须认踪先轮守镇烫仍链屑惕针炸画挺逐钩碎旷对通伴畅鼠永操呈刺盈缘顿彼捡哪宵回昏烦罗合才恋赠窜戏树历迹几迫尸便芹纹领胜殖哨稠木窑址带苏趋使糟器芽侄植颠葱敏胆汉群谨份构犹脊马迷躲院点qc9。如何隐藏内容也可能成为SEO问题。价值2万seo全套教程,seo公司怎么样_品达公关,问seo客服什么问题,seo点击器成就易速达,seo吸引人的标题,上海百度广告乐云seo十年
上一篇:如何利用百度统计工具
如果您觉得 如何隐藏内容也可能成为SEO问题 这篇文章对您有用,请分享给您的好友,谢谢!