OFFICE WORD的doc文件是采用哪种编码格式的?

来源:百度知道 编辑:UC知道 时间:2024/05/30 23:49:19
是Unicode格式吗?如果不是,怎样在不丢失内容的前提下转为Unicode格式?Excel文件是同样的情况吗?
有没有相关链接可以参考一下?

是的。
从BIFF8开始,Word 和Excel 在二进制文件中是按照Unicode (UTF-16)格式存储的。

现在的Office Word文档,都是docx格式的。
一、编码原理。
用两个文本文档,一个用来放文本信息,另一个用来配置个里面的格式,比如字体,大小等。这样用两个文本文件就能实现doc格式类似的功能,所以很节省体积。
二、其优点。
当我们创建一个空的文档文件的时候,我们发现,doc格式是25KB左右,而docx是0字节,所以呢我们就知道了doc格式的配置文件至少要有23KB,对于只有一页的文件你才有多少文字啊,docx就能节省很多的空间了。
节省体积有什么用呢?对于我们一般的电脑而言却是没有什么大用处,但是对于服务器、图书馆来说可有用途大了,docx至少能节省一半的空间(图片少的时候更明显)这样图书馆的电子书就能多一倍,对于这类电脑而言是何等的恐怖……
三、docx与doc的区别还有一个,就是响应速度。
比如很多特效之类的东西只要修改配置文件就可以了,而不用像doc那样反复修改那个大文件。现在docx已经开始替代doc格式了,但是还是很多地方doc格式是统治地位的,如果真是要紧急打开docx格式可以用win7记事本。

试试在另存为时,采用“带格式的文本文件”选项。