求助批处理高手,关于文本文件查找截取字符改名,并删除指定字符以外的字符

来源:百度知道 编辑:UC知道 时间:2024/06/25 09:39:53
批处理高手帮个忙,我要编个批处理程序,实现:
1.在某目录下,查找所有txt文件中的字符“http://a.b.com/d.do?page=”,后面是页码1~1000,每个txt文件中page=后面的页码不同,以此页码重命名为“页码.txt”。
2.在某目录下所有的txt文件中,截取字符“start_here”和“end_here”之间的内容,其他内容删除,保存文件。
3.按页码(文件名)顺序把某目录下所有的txt文件合并到一个文本文件total.txt中。
关键是前两步,由于要处理的文件有几千个,总容量有300M多,不删除重复内容精简的话招架不住。
在次先多谢了!
最好是用Windows自带的编程,如bat。

REM 3个步骤写了3个脚本:1.vbs, 2.vbs 和 3.bat。

REM ----------------------------------------------------------------
REM 1.vbs

sFolder = "C:\test"
sKey = "http://a.b.com/d.do?page="

Set oFSO = CreateObject("Scripting.FileSystemObject")
Set oFolder = oFSO.GetFolder(sFolder)
Set oReg = New RegExp
oReg.Pattern = Replace(Replace(sKey, ".", "\."), "?", "\?") & "(\d+)"
For Each oFile In oFolder.Files
p = oFile.Path
If LCase(oFSO.GetExtensionName(p)) = "txt" Then
s = oFSO.OpenTextFile(p).ReadAll()
If oReg.Test(s) Then
oFile.Move sFolder & "\" & oReg.Execute(s)(0).Submatches(0) & ".txt"
End If
End if
Next

WSH.Echo "OK!"

REM ---------------------------