$urls
=
array
();
for
(
$i
=1;
$i
<=5;
$i
++){
$urls
[] = '
http://***/s?wd=shili&pn=
'.((
$i
-1)*10).'&ie=utf-8';
}
$option
[CURLOPT_USERAGENT] = 'Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101
Firefox/19.0';
$htmls
= get_htmls(
$urls
,
$option
);
foreach
(
$htmls
as
$html
){
echo
$html
;
//这里得到 html 就可以进行数据处理了
}
模拟常用的 post 请求:
写一个 post.php 文件如下:
复制代码 代码如下:
if
(isset(
$_POST
['username']) && isset(
$_POST
['password'])){
echo
'用户名是: '.
$_POST
['username'].' 密码是: '.
$_POST
['password'];
}
else
{
echo
'请求错误!';
}
然后调用如下:
复制代码 代码如下:
$url
= '
http://localhost/yourpath/post.php
';//这里是你的路径
$options
=
array
();
for
(
$i
=1;
$i
<=5;
$i
++){
$option
[CURLOPT_POSTFIELDS] = 'username=user'.
$i
.'&password=pass'.
$i
;
$options
[] =
$option
;
}
$htmls
= get_htmls(
$url
,
$options
,'post');
foreach
(
$htmls
as
$html
){
echo
$html
;
//这里得到 html 就可以进行数据处理了
}
这样这个 get_htmls 函数也基本能实现一些数据采集的功能了