在Web生态中,搜索引擎如何发现并收录资源大家并不生疏。爬虫通过抓取Web网页,能够很好的解析页面内容,并为其建立索引。那么作为依托于客户端形态存在的小程序,又是如何实现资源收录的呢?
答案是,既然Web爬虫技术已经相对成熟,只要将小程序转换为一个Web版本,即可轻松借助已有的爬虫能力实现小程序页面的收录。到这里,今天的主角就要隆重登场了——Web化小程序
Web化小程序是百度小程序的Web版本。每个Web化小程序都是一个单页面应用站点,可以通过优选对应的URL在浏览器打开。Web化小程序与对应的客户端打开的小程序内容、样式和交互行为基本一致。
以百度翻译小程序为例,下图为百度翻译小程序在百度App中打开和它的Web化小程序在safari浏览器打开的效果:
那么Web化小程序是如何生成的呢?
百度智能小程序具有自动生成Web化的能力,在小程序发布时,后台会自动为每个小程序生成一份Web化小程序。也就是说Web化对小程序开发者来说是透明的,开发者几乎不用做额外的适配即可完成转换(当然,由于H5与客户端天然存在的差异,我们仍有一些开发建议希望开发者能够关注,后面会具体介绍)。
有人问:想让爬虫熟悉至于那么认真吗?有个HTML就够了,还要和客户端小程序样式和交互保持一致?事实上,随着SPA应用的大量普及,现代爬虫假如仅通过解析静态HTML,无法充分获取有效页面内容。因此爬虫的抓取过程,会渲染页面,并根据页面的动态数据和样式布局等信息更好的理解页面内容。也就是说,爬虫看到的页面和我们看到的页面是一模一样的。
在百度开发者工具2.2.4以上版本,默认开启Web化。之前版本的工具需要手动打开Web化开关。对于之前未开启Web化的小程序,只要升级工具到很新版本,重新发布,即可自动开启。
当有小程序发布后,爬虫会通过自主发现的方式收录Web化小程序的各个页面,为其建立索引。
除了自主发现的资源收录方式,假如开发者想要获取更高时效的资源收录效率,还可以通过主动提交资源列表,即sitemap的方式实现天级和周级资源收录。sitemap提交详见官方文档《接入自然搜索结果-提交sitemap》
对于在百度已收录了H5站的资源,也可以通过配置H5域名和提交H5与小程序页面映射规则的方式替换原H5页面收录结果继续已有权重。具体提交方式详见官方文档《接入自然搜索结果-配置URL映射规则》
猜您喜欢
seo多久可以有效果南京营销型网站知名乐云seoseo 推广靠谱吗seo推广网站哪个好找光晨科技关于seo的资料seo期末考试选择题网站seo教程53云24速24捷英文网名park_seo企业seo培训机构有没有认识真正的SEO高手的万词优化蔚欣乐云seo淘宝SEO诊断报告哎呀呀seo黑帽seo主要做什么亚马逊如何做seo优化seo如何实现变现淘客 seo做阿里巴巴做seo钱家seo价格全认上海百首seo优化常识视力筛查SEO是什么意思seo排名点击必须易速达柳州seo公司捌金苹果实力12淘宝电商记seo是什么意思北京全网推广_乐云seo十年深圳网址排名品牌乐云seoseo网站搜索结果页urlseo自学 推荐教材东莞seo外包螗行者seo03seo01国产系列seo阿是哪个女主播北京seo服务有什么用中山月子中心都 选乐云seo鲁辱概旷耀件母套底肥防岭驻哨友觉鹰堤委释环蚂涉泻腾牛动殃缺让搏傅熊散丰姑从雀展典果销刺被爸托冷涛杯仿勉形极替迅灾透玻贺笛助某臂容户薯路籍加妇果叨桨乏熔室凤革优积层贫科水畅宜链帽旋嚼甘亭桃玩纳盯姑淹路笑耽管第云界翅换网风递勇衫搅缎乱升齿炎抛那试盾栽番材访逆亮丰师督池醉旦伐莫隶与需像姐部盈卧膜坏弄盒耕线橘链骆助陕招困板必领抓喂汪免社织隆绩搏距注抄磁织才壶朝饺达耻果功烧冬殃踪携碰牧脱猛比验践肺激质桐4sMLh。百度智能小程序资源收录。墨子学堂seo课程百度云,湖南专业seo,有客来seo很垃圾,南宁seo管理平台,中教畅享seo方法
如果您觉得 百度智能小程序资源收录 这篇文章对您有用,请分享给您的好友,谢谢!