php用simple_html_dom获取解析html文档

php用file_get_content获取内容后还要用preg_match写正则,不好处理数据,用这个simple_html_dom之后解析html文档就相当方便了.

先引入文档定义好的一些函数

include('simple_html_dom.php');

然后用file_get_html函数获取url内容,其实返回一个可以处理的对象

$html = file_get_html('http://blog.deni.xin/');

接下来就可以处理所获得的想要的数据了

 for($i=0;$i<8;$i++){
 $title=$html->find('article.excerpt header h2',$i)->text();//获取第一个article下的h2的文本
 $desc=$html->find('article.excerpt p.note',$i)->text();
 $picurl=$html->find('article.excerpt div.focus a img',$i)->__get("src");//获取attr属性,类型jquery的attr()
 if($picurl=="http://blog.deni.xin/wp-content/themes/d8/img/thumbnail.png"){
 $picurl=soimg($title);
 }
 $url=$html->find('article.excerpt header h2 a',$i)->__get("href");
 $articles[$i]=array('Title'=>$title,
 'Description'=>$desc,
 'PicUrl'=>$picurl,
 'Url'=>$url);
    }
 $html->clear();
 $this->replyNews($articles);

转载请注明：稻香的博客 » php用simple_html_dom获取解析html文档

php用simple_html_dom获取解析html文档

与本文相关的文章

Hi，您需要填写昵称和邮箱！