C#中将html转换为xml的实现

来源:百度知道 编辑:UC知道 时间:2024/09/22 18:45:09
不是用软件去转换,要自己设计算法来实现。
需要详细的算法描述,最好有源码。

其实html中table本身就是xml格式的,只是现在需要把表格的标签生成到一个纯xml文件。
具体实现方法如下:
1、后台办法:
string xml = "<?xml version=\"1.0\" encoding=\"utf-8\" ?>" + tablename.InnerHtml;

2、前台取法:
前台直接使用Jquery更方便
var xml = "<?xml version=\"1.0\" encoding=\"utf-8\" ?>" +$("tablename").html();
表格代码如下
[code=html] <table id="tablename" runat="server" >
<tr>
<td></td>
</tr>
</table>[/code]

后台需要加上这两个 id="tablename" runat="server"

我给你些我的建议吧

HTML的语法格式比XML宽松多了,真正XML格式的网页是XHTML,也就是下一代HTML,他的格式和XML差不多,很严谨的。

如果你不想利用某些HTML和XML互转工具,自己编的话,有一定难度。

1.HTML的节点可以没末节点,你需要不停扫描<,>,/,这三个符号以检查是否漏掉末节点,并补充。
2.HTML节点还可以不规则嵌套,你需要对已读入节点进行顺序存储,或用栈的数据结构来存储,并验证其层次正确性,最终正确顺序的节点,期间还得缓存节点值,或属性值。
3.HTML不同于XML,许多HTML节点有特殊的意义,许多HTML节点比如<b>,