第二节 页面描述语言

一、页面描述语言

页面描述语言(Page Description Language,PDL)是对页面内的各种信息元素的属性、特征、行为以及页面元素之间的相互关系进行描述的计算机语言。

页面描述语言所提供的是页面内容的一种高层次描述信息。总体上,它一般并不直接针对某种具体的设备。同一个由页面描述语言构成的文件可以在不同的记录设备上输出成像。记录输出的页面在分辨力、颜色模式和质量上有差异,但在页面的幅面、结构和内容上是完全相同的。

常见的页面描述语言有Adobe公司的PostScript、HP公司的PCL以及方正公司的BD排版语言等。在图文信息处理和印刷复制领域中,这些页面描述语言曾经或正在发挥着重要作用。

二、页面描述语言的特性

1.页面描述语言的设备无关性

页面描述语言的基本任务是以计算机语言形式表示页面信息。

构建和描述页面的基础之一是建立页面坐标系,以表明页面元素的位置、尺寸等参数。页面坐标系可以建立在与设备坐标相关的坐标系上,也可以建立在设备无关的数学坐标系上。

建立数学直角坐标系,给定坐标原点、坐标轴方向、尺寸单位,以数学坐标系为基础,所标明的位置和尺寸等参数是与设备无关的。

Adobe公司的PostScript语言就以设备无关的直角坐标系为基础,以1/72英寸(磅)作为尺寸单位。显然,其位置坐标与设备分辨率等特性无关,页面元素的位置、尺寸不会随设备分辨率变化。与此相反,如果按某种记录成像设备的记录行/列数给出尺寸、以行/列号表明某一位置点的坐标,这样的参数是设备相关的,页面元素的位置、尺寸与分辨率设置有关,其通用性较差。

图6-2显示了页面中的一个文字元素起点位置在各种坐标系下的描述,以及在不同的设备分辨率下的状况。图中,坐标系的原点为左下角点,在一个A4幅面尺寸的页面上,数学坐标系下,距离左下角点(1英寸,10英寸)即(72磅,720磅)的位置上出现约58磅的隶书字体“页面描述语言”。如果采用设备坐标系,设备的记录分辨率分别为2400dpi和600dpi。对同样的输出位置,相关的描述分别为:在距离左下角原点(2400,24000)或(600,6000)像素行列的位置上出现该字符串。如果设备的坐标原点位置改变,则同一位置的坐标数据也会随之变化,由此可见两类描述方式的差异。

图6-2

除坐标体系与设备无关以外,在颜色的描述上,高层次的页面描述语言支持“设备无关颜色空间”,可以用色度数据对信息元素的色彩进行描述,达到色彩传递与设备无关的目标。

2.页面元素描述方式

对页面内各种图文信息的特征进行描述时,有两种方式。

①静态描述方式(“静态格式”):给出一些较为固定的描述和操作语句,采用这些语句明确给定某一图文元素的位置坐标、尺寸、形状、颜色等参数,完成对信息元素的描述。

②编程描述方式(“动态格式”):给出一些编程语句,通过赋值、计算、循环、条件判别等多种运算,以基础数据作为基础,通过程序运行逐步获得页面元素的具体参数而完成描述。

第一种方式具有简单明确、便于处理的优点,但对某些复杂对象的描述能力不足或较为烦琐。第二种方式的优点是描述能力强,但页面对象的具体描述需要通过运算逐步获得,增加了解释和还原成像的复杂度。

如果页面中需要出现大量同类元素(如大量圆形错位排列),静态方式必须对每个元素进行描述,需要较多语句,而编程模式则可以通过循环、计算等少量语句完成描述。

在页面描述语言中,一般都包含很多静态方式的描述指令,在PostScript页面描述语言中具有静态和动态两种方式的描述指令。

3.页面描述语言的操作指令概述

页面描述语言具有大量描述指令。总体上,页面描述语言可以具有四大类指令,即计算和处理指令、图形处理操作指令、资源操作指令、其他指令。

以典型的页面描述语言PostScript为例,其指令类型有如下22种子类型。

(1)计算和处理指令

a.算术和数学操作符:各种数学计算。

b.关系、逻辑、位操作符:用于变量间的关系判断、与或非等逻辑判别、数据按位操作等。

c.堆栈控制操作符:负责数据在堆栈中的各种操作。

d.数组操作符:对数组的各种处理。

e.串操作符:负责对符号串进行组合、拆分、查找等多种处理。

f.程序流程控制操作符:负责页面描述程序的循环、跳转等。

g.字典操作符:字典是一种数据对应表,可由表项索引数据查找到需要的数据。字典操作符负责对字典数据进行处理。

h.类型、属性设置和转换操作符:对各种类型数据进行设置、转换。

i.文件操作符:对文件进行的各种处理。

(2)图形处理操作指令

a.坐标和矩阵操作符:进行坐标平移、转动、缩放等转换,利用矩阵或对矩阵进行多种转换。

b.路径构造操作符:对路径进行构造、控制、描绘等各种处理。

c.绘图操作符:填充、绘制各种图形,生成采样像素图像。

d.内点测试操作符:为填充图形而进行测试的操作。

e.图案、图文组合体操作符:生成、安装、显示图案或图文元素组合体。

f.图形状态操作符:图形状态是图形(颜色、加网、路径等)参数设置和状态的组合。这些操作符可以对图形状态进行管理。

(3)资源操作指令

a.资源操作符:字形、图案、色彩还原字典等许多图文对象作为“资源”可以利用。资源操作符负责对资源进行登记、清除、查找等多种操作。

b.虚拟存储器操作符:虚拟存储器用来存储复合对象。这些操作符负责虚拟存储器的管理。

c.字形、字库操作符:对字形、字库进行管理、处理。

(4)其他指令

a.解释器参数操作符:对页面描述语言解释器的参数进行设置。

b.设备和输出操作符:返回设备参数、对设备进行设置、输出页面。

c.错误处理操作符:错误信息显示。

d.其他操作符:返回语言等级/解释器版本号/序列号/运行时间、程序过程替代、调用交互式操作、打开或关闭命令提示行操作等。

4.页面描述相关的其他技术

对页面的成像而言,与页面描述相关的一些技术也是不可或缺的。这些技术包括字形描述和存储格式、加网技术、图像/文字数据压缩技术、颜色转换和管理技术等。这些技术将在后续章节中详细讨论。