来源:不言 发布时间:2019-03-23 16:07:19 阅读量:1316
本篇文章给大家带来的内容是关于php cur中常用的5个代码示例介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
我用php ,curl主要是抓取数据,当然我们可以用其他的方法来抓取,比如fsockopen,file_get_contents等。但是只能抓那些能直接访问的页面,如果要抓取有页面访问控制的页面,或者是登录以后的页面就比较困难了。
1,抓取无访问控制文件
1 2 3 4 5 6 7 8 |
|
2,使用代理进行抓取
为什么要使用代理进行抓取呢?以google为例吧,如果去抓google的数据,短时间内抓的很频繁的话,你就抓取不到了。google对你的ip地址做限制这个时候,你可以换代理重新抓。
1 2 3 4 5 6 7 8 9 10 11 |
|
3,post数据后,抓取数据
单独说一下数据提交数据,因为用 curl的时候,很多时候会有数据交互的,所以比较重要的。
1 2 3 4 5 6 7 8 9 10 11 |
|
在 upload.php文件中,print_r($_POST);利用curl就能抓取出upload.php输出的内容Array ( [name] => test [sex] => 1 [birth] => 20101010 )
4,抓取一些有页面访问控制的页面
以前写过一篇,页面访问控制的3种方法有兴趣的可以看一下。
如果用上面提到的方法抓的话,会报以下错误:
1 2 |
|
这个时候,我们就要用CURLOPT_USERPWD来进行验证了
1 2 3 4 5 6 7 8 9 10 11 12 |
|
5,模拟登录到sina
我们要抓取数据,可能是登录以后的内容,这个时候我们就要用到curl的模拟登录功能了。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
|