请问有什麽软件可以批量提取网页中的电话号码(非只能13、15开头号码)

来源:百度知道 编辑:UC知道 时间:2024/06/24 04:50:06
我需要可以批量提取网页中号码的软件,我要提取加拿大那边的号码,试过很多软件,都只能提取中国的,不能提取国外的,我用Phone Numbers Ext v2.0提取已下载的网页,又经常会死当,无论是网页或文本的都可以,只要使用正常不会像Phone Numbers Ext v2.0经常提取到一半出错的就行了。谢谢。
我是要提取电话号码的,请不要给我提取邮件的,谢谢。我有数万个网页,不可能一页一页去处理。 请不要给我无意义的答案,我没满意答案,也不会随便选一个给分的。
或介绍我可以批量提取电话的软件,我需要提取的格式是像(780)938-4895 这样的

推荐Replace Pioneer来做,能准确按需要提取,以提取(780)开头的号码为例,详细步骤:

1. 按ctrl-h打开Replace窗口
* 在Search for Pattern输入:
"\(780\)[\d\-]+"(不带双引号)
* 在Replace with Pattern输入:
"$match\n"(不带双引号)
* 去掉Print Unmatch Unit前面的勾
* 把屏幕下方,in page和out page中间的>号改选成>> Append,表示追加模式。

2. 点击Batch Replace按钮打开Batch Runner菜单。
3. 点击Pick Files选中需要处理的html文件,如果文件过多,可以用Search Files按钮搜索待处理文件。
4. 选中Set output filename,把右边的${FILENAME}删除(清空).
5. 点击Batch Replace即可把各文件里的(780)开头的号码全部提取到P1页,完成后选中P1页按ctrl-s存盘即可,后期还可以用Replace Pioneer进行删除重复行的工作。

注:
1. 如需提取其他号码,可自行修改(780)为其他值。
2. 第4步一定要清空${FILENAME},否则输出会直接写到原文件里。
3. 如果文件过多,可以考虑分次进行,或者把100个文件为一组合并为一个文件后再处理可能会提高速度。

安装过 excel吧? 在菜单栏里 选用excel表剪辑 保存为ecxle后 用函数就可以提取 判断加拿大的区号 如果有就保存到单元格