php用file_get_content获取内容后还要用preg_match写正则,不好处理数据,用这个simple_html_dom之后解析html文档就相当方便了.
先引入文档定义好的一些函数
include('simple_html_dom.php');
然后用file_get_html函数获取url内容,其实返回一个可以处理的对象
$html = file_get_html('http://blog.deni.xin/');
接下来就可以处理所获得的想要的数据了
for($i=0;$i<8;$i++){
$title=$html->find('article.excerpt header h2',$i)->text();//获取第一个article下的h2的文本
$desc=$html->find('article.excerpt p.note',$i)->text();
$picurl=$html->find('article.excerpt div.focus a img',$i)->__get("src");//获取attr属性,类型jquery的attr()
if($picurl=="http://blog.deni.xin/wp-content/themes/d8/img/thumbnail.png"){
$picurl=soimg($title);
}
$url=$html->find('article.excerpt header h2 a',$i)->__get("href");
$articles[$i]=array('Title'=>$title,
'Description'=>$desc,
'PicUrl'=>$picurl,
'Url'=>$url);
}
$html->clear();
$this->replyNews($articles);

转载请注明:稻香的博客 » php用simple_html_dom获取解析html文档