用python来做一个程序
来源:百度知道 编辑:UC知道 时间:2024/06/07 21:59:31
取得指定的一个网页,并输出其中所有的链接。
import HTMLParser
import urllib
import sys
#定义HTML解析器
class parseLinks(HTMLParser.HTMLParser):
def handle_starttag(self, tag, attrs):
if tag == 'a':
for name,value in attrs:
if name == 'href':
print value
print self.get_starttag_text()
#创建HTML解析器的实例
lParser = parseLinks()
#打开HTML文件
lParser.feed(urllib.urlopen( \
"http://www.python.org/index.html").read())
lParser.close()