什么是HTML文档格式?

来源:百度知道 编辑:UC知道 时间:2024/05/17 11:13:13

HTML,这四个垄断了整个互联网的字母,它的字面意思是,超文本标记语言(Hyper Text Markup Language)。但实际上,与其说它是一种语言,还不如说它是一种文档格式来得更准确,就和如同.doc代表一种文档格式一样。

HTML和Word文档格式(.doc)的区别,除了他们的用途不同(前者用于Web网页,后者用于桌面文字处理)之外,还有一个形式上的区别,HTML是纯文本的,用文本来标记一切,可以用任何文本编辑器来编辑,而.doc是二进制文件,必须用特定的编辑器才能阅读和编辑。

HTML采用纯文本的方式,大概由自身的特定历史原因,一来是为了跨平台的需要,记得n年前我第一次看到HTML这几个字母的时候,跟在他后面的介绍性文字就特别强调了跨平台这点。二来最开始的Web网页,也基本上只有文字,很少有图片,更没有语音和视频。

纯文本的HTML带来不少方便,例如可以随手编辑修改,不需要任何工具软件。但同时,也带来很多麻烦,例如在网页中加入图片的时候,我们得把图片单独保存,还得给图片取个名字,然后在HTML中引用。给一个图片取个名字不难,给一大堆图片取名字就麻烦了,所以我们看到很多图片的名称都是字母、下划线、数字等好长一串。很显然,这不如Word方便,在Word中只需要插入或者粘贴一张图片就行了,既不需要关心这张图片如何存储,也不需要关心它叫什么名字。

更重要的是,在Word中,如果你把这张图片删除,他就实实在在的消失了。而HTML,可能你在网页上已经看不到图片,但实际上这张图片仍然保存在某个文件夹中。事实上,全世界的网络服务器上有数不胜数的没有被任何网页使用的图片以及其他多媒体文件,原因只有一个,网页编写人员在网页上删除某个图片时,并没有找到相应的文件夹把图片真正删除。这是非常常见的情况,因为文档管理实际上是非常繁琐和复杂的事情,很难有几个人能够进行真正有效的管理,这就造成网络服务器上有大量的冗余文档。

另一个问题是,纯文本作为一种文档格式,显然不如二进制格式那样灵活,能表达各种复杂的格式。所以到目前为止,我们还没有看到任何一款HTML编辑器能够像Word那样方便,不管是久负盛名的Dreamweaver还是微软