请问php采集程序能否抓取外部网页上一个dom的内容
来源:百度知道 编辑:UC知道 时间:2024/06/04 15:41:01
比如我想抓取一个id=xxx的div及其innerHTML,但是因为里面有嵌套,写正则表达式来分析太难了,不知道能不能直接用dom提取?
$url="http://sports.sina.com.cn//nba/";
$fp=@ fopen($url,"r") or die("超时");
$fcontents=file_get_contents($url);
// echo $fcontents;
eregi($reg,$fcontents,$rg);
// echo count($rg);
echo $rg[0];
$url="http://sports.sina.com.cn//nba/";
$fp=@ fopen($url,"r") or die("超时");
$fcontents=file_get_contents($url);
// echo $fcontents;
eregi($reg,$fcontents,$rg);
// echo count($rg);
echo $rg[0];
如果是php 5的话,可以用它的dom扩展
用法如下:
$doc = new DOMDocument();
$doc->load( $url );
$get_someone = $doc->getElementsByTagName( 'xxx' );
xml下我测试成功,html下没人要求过,所以没试过,你可以试试。
一般都可以的。