在.net下如何提取PDF的文字并检索相关数据

来源:百度知道 编辑:UC知道 时间:2024/06/19 23:45:43
如题
需要什么插件或者工具,思路又是怎样的
万分感谢

FileStream ReadPdf = new FileStream(@"d:\books\vb.net\test.pdf", FileMode.Open);
long FileSize;
FileSize = ReadPdf.Length;
byte[] Buffer = new byte[(int)FileSize];
ReadPdf.Read(Buffer, 0, (int)ReadPdf.Length);
ReadPdf.Close();


FileStream CreatePdf = new FileStream(@"d:\books\vb.net\test1.pdf", FileMode.Create);
CreatePdf.Write(Buffer,0,Buffer.Length);
CreatePdf.Close();

希望能帮带你的忙~告一段落~谢谢~

如果了解PDF格式,可以自己编写解析代码,格式资料可以在Adobe或其他网站上下载。
而且网络上有提供类库的,如搜索pdflib。

希望http://pdfhome.hope.com.cn/Article.aspx?CID=bf51a5b6-78a5-4fa3-9310-16e04aee8c78&AID=2d664914-c844-4b2c-9e60-cc334d328753