谁知道chm电子书反编成txt文件中的一大串字母怎么去掉啊

来源:百度知道 编辑:UC知道 时间:2024/06/23 16:30:03
就是类似这种东西
document.write(" <p align=center style='FONT-SIZE:13.5pt;font-family:宋体'><b><a name='2-16'></b><p>");

document.write

反编电子书得到的TXT文本.用排版批量删除.因为脚本要用到正则表达式而本人不会.使用找人帮忙了

  1 document.write(" <p align=center style='FONT-SIZE:13.5pt;font-family:宋体'><b><a name='
  2 </b><p>");
  3 document.write ('
  4 <p><p>')document.write(" <p align=center style='FONT-SIZE:13.5pt;font-family:宋体'><b><a name='
  5 <p><p>
  6 1-0
  7 1'>
  8 第前隔2行
  如<center><img src=../txt/662371.gif></center>第二卷 巫、道相争成主角,一朝兴盛一朝衰

  换成<center><img src=../txt/662371.gif></center>

  第二卷 巫、道相争成主角,一朝兴盛一朝衰

  一共8个.要替换删很麻烦.所以希望能转化成正则表达式或者做成排版脚本也可以.

  部分脚本例子

  411: //起点1
  document.selection.Replace("^\\n","",nFlags);
  document.selection.Replace("^ (.+)\\n \\(起.+更新时间:.+","\\n\\n\\1",nFlags)