中文字符转换

来源:百度知道 编辑:UC知道 时间:2024/05/22 23:11:42
在各种搜索引擎中打中文字后,地址栏里会有%**%**,比如Baidu就是wd=%**%**,那也就是说每个中文字都会转换成%**%**,而且*是['0'..'9','A'..'F']中的,那么我要知道从%00%00到%FF%FF的所有转换,谁能给我个回答.表格,文本,或者程序都行(能不是程序就不是程序,我对现在的杀毒软件不自信,还不如我来杀)
最好给个列表,1页256个

如果你懂得ASP的话,很容易解释那串编码的来源:
在ASP中Server对象有个函数是URLEncode,它的功能是将汉字编码转换成URL专用格式。
str=server.URLEncode("瘪三")
之后str的值就是%B1%F1%C8%FD了。
这就是%B1%F1%C8%FD的来源。
URLEncode的算法和二楼解释一样:
把汉字转化为ASCII,然后转化为16进制,将其每阁两字符加%

至于目的,和1楼的说法相似。
汉字通过URL直接传常出现意想不到的错误,所以用这个东西。
下面的一个简单示例程序可以输出某个汉字的GB2312编码,不过在TC下不支持输入中文,你可以用VC或者Dev-CPP编译。(下面程序没有编写容错的代码,只是为了简单说明一下)
main()
{
char buf[3];
scanf("%s",buf); //输入一个汉字,如果多于一个汉字会出错
printf("%x%x\n",buf[0]&0xFF,buf[1]&0xFF);
//跟0xFF做&运算是为了确保输出正数
return 0;

你错了,那个不是什么格式转换,而是正则表达式
正则表达式用于查看字符的匹配情况,现在很多搜索引擎都是用正则表达式的。关于正则表达式的使用规则很简单,你这要随便搜一下就可以了,保证你能在半天内掌握,甚至2~3个小时就够了

保存为html文件,运行就可以转换了

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> URLDecode </TITLE>
<META NAME="Generator" CONTENT="EditPlus">