请问php采集程序能否抓取外部网页上一个dom的内容

来源:百度知道 编辑:UC知道 时间:2024/06/04 15:41:01
比如我想抓取一个id=xxx的div及其innerHTML,但是因为里面有嵌套,写正则表达式来分析太难了,不知道能不能直接用dom提取?

$url="http://sports.sina.com.cn//nba/";
$fp=@ fopen($url,"r") or die("超时");
$fcontents=file_get_contents($url);
// echo $fcontents;
eregi($reg,$fcontents,$rg);
// echo count($rg);
echo $rg[0];

如果是php 5的话,可以用它的dom扩展

用法如下:

$doc = new DOMDocument();
$doc->load( $url );
$get_someone = $doc->getElementsByTagName( 'xxx' );

xml下我测试成功,html下没人要求过,所以没试过,你可以试试。

一般都可以的。