
qq:800819103
在线客服,实时响应
qq群
在线客服,实时响应
客服电话
13318873961php爬虫如何切换代理IP?如何使用PHP做一个小型网络爬虫,今天就利用上次爬到的代理IP讲一讲代理IP的验证。至于为什么说PHP是世界上最好的语言。
我们为什么需要对代理IP进行验证呢?要知道我们在网络中抓到的代理IP数量很大,但能用的往往连十之一二都不到,在使用前剔除掉不能用的IP就能提高我们的工作效率。
首先说说思路:上次我们已经将抓到的IP和端口都放进了我们的MySQL数据表中,要验证肯定需要取出来,然后通过PHP中curl函数设置代理,再访问百度或者其他能访问到的网站,通过返回的状态码是否等于200来判断代理IP是不是可以正常使用的。
调用GetHttpStatusCode(代理IP地址:端口)方法就能返回该代理IP在访问百度首页时所返回的状态码,在需要的地方对状态码进行判断就能加以利用了。
在数据表中加入了抓取到代理IP的时间和代理IP被验证的时间,已经存活的时间,这样代理IP的稳定性就一目了然了。
这是验证后的结果,整整100个IP,最后就剩下10个左右,看来在使用之前对代理IP进行验证还是很有必要的。
相关文章内容简介
1 php爬虫如何切换代理IP?
php爬虫如何切换代理IP?如何使用PHP做一个小型网络爬虫,今天就利用上次爬到的代理IP讲一讲代理IP的验证。至于为什么说PHP是世界上最好的语言。 我们为什么需要对代理IP进行验证呢?要知道我们在网络中抓到的代理IP数量很大,但能用的往往连十之一二都不到,在使用前剔除掉不能用的IP就能提高我们的工作效率。 首先说说思路:上次我们已经... [阅读全文]
最新标签
推荐阅读
17
2019-04
有效时间长短不同的代理ip在实际应用中有何区别?
代理ip分短效和长效,都适合什么人使用?估计代理IP这个词,大家都不少听说吧,但是你知道代理IP的一些知识么?知道怎么用么?知道都有哪些人使用么?
18
2019-02
爬虫怎么爬取静态网页的案例分析
早期的网站都是静态网页,有些静态网页非常容易爬取,新手可以去尝试下。爬虫怎么爬取静态网页?下面跟小编一起去了解下。
29
2019-05
分布式爬虫搭好后,遇到代理IP被封的解决办法
分布式爬虫搭好后,遇到代理IP被封的解决办法,在你们搭好了分布式爬虫,正准备让程序用代理IP去抓取数据,服务器也搭好了。突然发现,你办公室的IP被封掉了,这时候怎么办,应该如何解
30
2019-05
java动态代理ip
代理类在程序运行时创建的代理方式被成为 动态代理。 也就是说,这种情况下,代理类并不是在Java代码中定义的,而是在运行时根据我们在Java代码中的“指示”动态生成的。相比于静态代理
热门文章