如何从网也上提取信息,尤其是链接页面的信息

来源:百度知道 编辑:UC知道 时间:2024/06/12 04:20:57
如何从网也上提取信息,尤其是链接页面的信息,请那位大侠指点一下,最好是这方面的程序代码,思路我是有,主要是不清楚如何实现.
这个看源代码是很简单的,我主要是想通过源代码(或者其它方式)能够提取网页里面的相关信息,就如同在知道里面的"问题提问时间""回答的用户""用户等级""回答时间"等这些内容,需要每条信息的把这些内容提取出来,存储到excel表格中去.主要是涉及两个方面的内容:1.如何提取这些信息.第一页的信息(如问题提问时间)和相关链接页面中的信息(""回答的用户""用户等级""回答时间").2如何实现翻页
思路我是有的,主要是如何代码实现,如果那位大侠有高招,悬赏分课题提高到100分,或者更高.
我要提取的是公共信息,就是打开源代码可以看到的信息内容,不是网站加密的隐私信息,当然这些信息通过手工方式直接从页面一条一条的提取也是可以,不过速度太慢.因为我虽然对计算机有一定研究,但不是专业程序员,所以思路是有的,主要是实现,所以还是请有实践编程经验的大侠指点.如果有那位朋友能帮我解决这个问题,最好是代码实现,还剩的370多分都给也没什么

真正懂的是不是没有上百度知道的,看来我这100分真是要浪费了?

打开网页:查看--->源文件
“想通过源代码(或者其它方式)能够提取网页里面的相关信息”
这个是不大现实的,你想想网站的所有代码你如果都能看见的话,那网站的保密性何在????
一个好的网站你要看的只是网页上显示的内容(查看--->源文件),其他的你是看不见的

只想看看信息的话就看看源文件.如果要源码的话网上也有很多.
拿到网站的WEBSHELL 就什么都有了!