如何用java取得登陆以后页面的html代码

来源:百度知道 编辑:UC知道 时间:2024/06/23 18:04:11
如果有一个网站的页面需要登陆后才能访问,如何通过java先发送登陆请求,然后再取得登陆后页面的html源码?
我要做的是使用Socket或者HttpURLConnection取得需要登陆后的页面网页代码,不是做J2EE工程的登陆验证如何来实现。最终目的是取得登陆后页面以及其它登陆后访问页面的html源码

这个跟过滤器一点关系都没有,filter是用来过滤请求的,我是想取得需要登陆验证后页面的html源码

非常感谢kaixinwoo,我的问题的确是跟爬虫有点关系,过滤器是用来过滤当前web服务的请求,而我要做的是去抓取其它服务器的页面,这个实在是跟过滤器没有一点的关系。如果有大侠认为过滤器可以解决这个问题,请给出解决方案。

给出java解决方案的再追加200分。

你到百度搜索下
java过滤器

什么意思 我都乱了
filter不是光光是过滤请求的

问题补充:
http://download.csdn.net/source/240782
这个是java爬虫的例子

如果单说取html代码的话 我记着好像j用ava.net.*下有这么一个方法 填入你所需要获得代码的网址 然后输入到字节流

在把它随便输出到别的地方看
以前做过,可能跟你说的不一样

package ch06;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileWriter;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.net.URL;
import java.net.URLConnection;

public class GetURL {

public static void main(String [] args){
try {
inFile(getURL("http://www.sina.com"),"D:/b.html");
} catch (Exception e) {
// TODO 自动生成 catch 块
e.printStackTrace();<