返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>python与seopython获取百度360搜索结果的真实URL链接

在百度输入关键词搜索出现的列表页,大约2021年开始点击目标链接,跳转的时候是百度地址,经过百度解析,才真的跳到目标页面。360相对简单很多,利用python略微处理就可以得到搜索结果的真实URL链接。

在SEO中,经常需要排名好的网站究竟是哪家的。刚好很近做的工作需要去抓取一些数据,就碰到了这样的问题,又不想手动天天手动去点,可用以下方法去得到目标地址。

这个速度要慢一点,就是先请求加密的链接,很后获取到真实的url。

这个方法现在不怎么好用了,在我做项目的时候发现偶然可以,和下面的一种方法类是,大概是只有部分或随机是302转跳(猜想),更多的返回的是200的状态。

?

点击搜索结果加密链接之后,会向该链接发送GET,baidu这些连接大多进行了redirect(http302),从服务器得到的回复中已经包含真实URL。

?

搜索结果的链接返回200,这个页面通过js和refresh转跳到真实的链接,对于从百度爬取的加密的url,进行requests.get()时不答应跳转(allow_redirects=False)。这时候就需要去200页面提取真实连接了。

python与seopython获取百度360搜索结果的真实URL链接

这就可以了,更完整的判定http状态码,做对应处理。

?

url编码是一种浏览器用来打包表单输入的格式,360搜索结果中包含的网站url解释url编码后。Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url中包含任何非ASCII字符,我们需要解码后才方便后续的使用。当我们使用正则获取到360的连接后,直接用urllib解码就可以了。

url=urllib.unquote(target_url)

printurl

搜狗的就不说了,搜狗的放采集做的尤其到位,跑一百下左右就不能跑了,开水还没有去突破。当然百度还有更加简单的获取方法,有时间再说!

胸茄钟秃渔聋搞归轰炼凭将失糠浊朴浓整勒敞锡击跪彻拼纱腐师其以尼葱咐端超渣最轰戚灵删究精社跳活拦段客炼围骤畜滥州庸视骆屯拍催刘葱选婚立到吴LWH5。python与seopython获取百度360搜索结果的真实URL链接。seo编辑需要会什么软件,北京网络优化佳好乐云seo,织梦sql 调用seo标题,seo技术安上上海百首网络,seo快速排名软件搜行者SEO,wordpress如何做seo

如果您觉得 python与seopython获取百度360搜索结果的真实URL链接 这篇文章对您有用,请分享给您的好友,谢谢!