background image

                 XML 数字化工作流程的关键技术
  现在印刷行业比较热门的格式无疑是

PDF 与 JDF。由于 PDF 的应用比较广泛,阅读和

制作

PDF 文件也都是日常事务中涉及比较多的方面,人们对 PDF 的认识比较深入。相比较

而言,人们对

JDF 的了解就很少了,大多数只停留在肤浅的理论方面,而且由于印刷业的

数字化工作流程并没有完全实现,人们对

JDF 的认识更好像是雾里看花。本文主要介绍 JDF

的元语言

XML 的一些特点以及对印件的描述,旨在使读者了解 XML 在数字化工作流程中

的作用。

   

XML 的 特 点     1.SGML 简 介     说 到 XML , 就 必 须 说 到 SGML  (Standard 

Generalized Markup Language) 。SGML 最初是由 IBM 开发的一种用于排版的符号化语言。经
过若干年的发展,

1984 年国际标准化协会(ISO)开始对此提案进行讨论,并于 1986 年正

式承认

SGML 为国际标准规范(ISO8879)。

  

SGML 实际上是一种通用的文档结构描述的符号化语言,主要用来定义文献模型的逻

辑和物理类结构。一个

SGML 语言文件由三部分组成,即语法定义、文件类型定义

DTD(Definition Type Document)和文件实例。语法定义部分定义了文件类型定义和文件实
例的语法结构;文件类型定义部分定义了文件实例的结构和组成结构的元素类型;文件实
例是

SGML 语言程序的主体部分。在 SGML 的实际使用中,每一个特定的 DTD 都定义了一

类文件。因此,人们习惯上把具有某一特定

DTD 的 SGML 语言,称为某某符号化语言。这

SGML 就成了那些派生语言的元语言。

  

2.HTML 的缺点  HTML(Hypertext Markup Language)是 SGML 的一个实例,它的

DTD 作为标准被固定下来,因此,HTML 不能作为定义其他符号化语言的元语言。HTML
以简单精练的语法、极易掌握的通用性与易学性成为了

Web 上的通用语言。但随着网络规模

的不断扩大,

HTML 的缺点也日益显现出来。

  

HTML 是一种固定格式的超文本标记语言,因其格式固定,故难以扩展,这就造成了

网络的交互操作性很差。同时

HTML 由于语义性差,使之在电子数据交换、数据库、搜索引

擎、超链接等方面都存在很大的不足。而且

HTML 缺乏对空间立体描述,处理图形、图像、音

频、视频等多媒体的能力较弱,图文混排功能简单,不能表示多种媒体的同步关系。
  

3.XML 的主要特点  为了克服 HTML 的弊端,1996 年,W3C(World Wide Web 

Consortium)联合 SGML 专家组成 SGML 工作组,对 SGML 进行裁剪,形成 SGML 的精简
子集,这就是现在人们所知的

XML(Extensible Markup Language),它是一种扩展性标记

语言,用来创建定义类似

HTML 的标记语言,然后再用这个标记语言来显示信息。

  

XML 具有可扩展性,用户可根据不同的用途自定义标记格式,创造出自己的一套标记

语言,所以

XML 最适合作为数据交换的标准。

XML 是“定义语言的语言”,即是一种元语言。由于 XML 具有元语言的功能,所以它可以成
为描述电子商务数据、多媒体演示数据、数学公式等各种各样数据应用语言的基础语言。用
XML 可以对数据关系进行定义,形成特有的标准,因此各行各业都在建立自己的行业化标
准,以应用于网络上来处理电子商务。

JDF 就是以 XML 为基础生成的数字化工作流程的格

式,其他的如

eBook(电子书)、NewsML(新闻媒体)、MathML(数学表达式)、CML

(化学)、

cXML(电子商务)、FpML(金融)、SMIL(多媒体演示)、BML(卫星数据传

送)等。
  

XML 还可以作为数据仓储,一个 XML 文件就是一个小的数据库,通过对数据关系的

定义形成各种关系、属性的数据,实现数据交换、上下文检索、多媒体传输等。

  

XML 的重要性  随着印刷的系统化、标准化和流程化技术的发展日趋成熟,印刷作