background image

 

$urls

 = 

array

();

for

(

$i

=1; 

$i

<=5; 

$i

++){

$urls

[] = '

http://***/s?wd=shili&pn=

'.((

$i

-1)*10).'&ie=utf-8';

}

$option

[CURLOPT_USERAGENT] = 'Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101 

Firefox/19.0';

$htmls

 = get_htmls(

$urls

,

$option

);

foreach

(

$htmls

 

as

 

$html

){

echo

 

$html

;

//这里得到 html 就可以进行数据处理了

}
 
模拟常用的 post 请求:
写一个 post.php 文件如下:

 

复制代码 代码如下:
 

if

(isset(

$_POST

['username']) && isset(

$_POST

['password'])){

echo

 '用户名是: '.

$_POST

['username'].' 密码是: '.

$_POST

['password'];

}

else

{

echo

 '请求错误!';

}
 
然后调用如下:

 

复制代码 代码如下:
 

$url

 = '

http://localhost/yourpath/post.php

§

';//这里是你的路径

$options

 = 

array

();

for

(

$i

=1; 

$i

<=5; 

$i

++){

$option

[CURLOPT_POSTFIELDS] = 'username=user'.

$i

.'&password=pass'.

$i

;

$options

[] = 

$option

;

}

$htmls

 = get_htmls(

$url

,

$options

,'post');

foreach

(

$htmls

 

as

 

$html

){

echo

 

$html

;

//这里得到 html 就可以进行数据处理了

}
 
这样这个 get_htmls 函数也基本能实现一些数据采集的功能了