background image

php html 解析器 Simple HTML Dom 使用说明

本文章来给大家介绍一下关于

Simple HTML Dom 解析器的使用方法详解,有需要了解的

同学不防进入参考。
1. 开始使用
首先下载解压缩,然后将

simple_html_dom.php 文件包含进要编写的脚本文件中,加载要处

理的

html,支持三种模式的 html 加载,分别是『从 url 中加载,从字符串中加载,从文件中

加载』。
代码如下
<?php
require_once('simple_html_dom.php');
//从 url 加载
$html = file_get_html('http://www.hzhuti.com');
//从字符串加载
$html = str_get_html('<html><body>Hello World!</body></html>');
//从文件中加载
$html = file_get_html('example.htm');
从字符串加载网上文件需要先从网络下下载,使用

cURL 比较好一些,需要在 php 配置文

件中打开

php 扩展 php_curl。

$url = 'http://www.111cn.net';
$ci = curl_init();
curl_setopt($ci,CURLOPT_URL,$url);
curl_setopt($ci, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ci, CURLOPT_SSL_VERIFYHOST, false);
curl_setopt($ci, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
2. 查找 html 元素
使用

find 函数查找,返回包含对象的数组,常见的查找如下。

代码如下
//查找超链接元素
$alink = $html->find('a');
//查找第 n 个连接元素
$alink = $html->find('a',5);
//查找 id 为 main 的 div
$mainDiv = $html->find('div[id=main]');
//查找所有定义了 id 的 div
$idDiv = $html->find('div[id]');
//查找所有定义了 id 的元素
$idAll = $html->find('[id]');
//查找样式类为 info 的元素
$classInfo = $html->find('.info');
//支持嵌套子元素查找
$ret = $html->find('ul li');
//查找多个 html 元素