初学者电脑字体设计(创造中文电脑字体的艰辛过程)
初学者电脑字体设计(创造中文电脑字体的艰辛过程)显示中文位图字体的Sinotype III显示器的照片。 路易斯·罗森布鲁姆,斯坦福大学图书馆特别收藏Sinotype III从未发布过。尽管如此,如何让计算机处理中文,包括位图中文字体的开发——是解决工程难题的核心 毕竟中文是地球上使用最广泛的语言之一。虽然Gridmaster可能是一个简单的程序,但它要完成的任务——创建数千个汉字的数字位图——对设计提出了更长远的挑战。事实上,为位于马萨诸塞州剑桥的图形艺术研究基金会(GARF)开发的“Sinotype iii”打印字体所花费的时间远远超过计算机本身的编程时间。没有字体,就没有办法在屏幕上显示汉字,也没有办法在电脑的点阵打印机上输出汉字。对于每个汉字,设计师必须做出256个单独的决定,一个用于位图中的每个潜在像素。(位图是一种以数字方式存储图像---无论是 JPEG、GIF、BMP 还是其他文件格式,使用共同构成元件或图像的像素网格。)
40多年前,设计师手工绘制和编辑了数千个字符,使中文打字和印刷成为可能。-- by Tom
由图形艺术研究基金会(GARF)制作的中国位图字体的早期模型。 路易斯·罗森布鲁姆,斯坦福大学图书馆收藏
布鲁斯打开他的Apple II计算机,发出一个F的高音,接着是软盘驱动器的咔嗒声。在一连串敲击键盘后。绿色网格出现了16*16的单元格。这就是“Gridmaster”,基于BASIC语言编写的一个程序,用来构建世界上最早的中文数字字体之一。当时,他正在为一台名为“Sinotype III”的实验机器开发中文字体,这台机器是首批能处理中文的个人电脑之一。
在1970年代末和1980年代初,中国还没有个人电脑。因此,为了制造一台“中国”PC,Rosenblum的团队对Apple II电脑进行了重新编程,使其能以中文操作。这是一件非常复杂的事情,他必须从头开始编写操作系统,因为Apple II的DOS 3.3根本不允许输入和输出中文文本。同样,他还必须为中文文字处理器编写程序。
虽然Gridmaster可能是一个简单的程序,但它要完成的任务——创建数千个汉字的数字位图——对设计提出了更长远的挑战。事实上,为位于马萨诸塞州剑桥的图形艺术研究基金会(GARF)开发的“Sinotype iii”打印字体所花费的时间远远超过计算机本身的编程时间。没有字体,就没有办法在屏幕上显示汉字,也没有办法在电脑的点阵打印机上输出汉字。
对于每个汉字,设计师必须做出256个单独的决定,一个用于位图中的每个潜在像素。(位图是一种以数字方式存储图像---无论是 JPEG、GIF、BMP 还是其他文件格式,使用共同构成元件或图像的像素网格。)将数千个字符相乘,这相当于在一个花了两年多时间才完成的开发过程中的数十万个决策。
编程gridmaster——事后Rosenblum向我描述它“最多就是用起来很笨重”。他的父亲Louis Rosenblum和GARF把创造数字字体的工作进行了外包。使用任何一台Apple II电脑,并在软盘上运行Gridmaster,数据输入临时人员就可以远程创建并保存新的中文字符位图。一旦这些位图被创建并存储,rosenblum就可以通过使用第二个程序(也是由Bruce设计的)将它们和它们相应的输入代码吸收到系统数据库中,从而将它们安装到Sinotype III上。
Sinotype III从未发布过。尽管如此,如何让计算机处理中文,包括位图中文字体的开发——是解决工程难题的核心 毕竟中文是地球上使用最广泛的语言之一。
显示中文位图字体的Sinotype III显示器的照片。 路易斯·罗森布鲁姆,斯坦福大学图书馆特别收藏
随着西方计算和文字处理的出现,工程师和设计师们认为低分辨率的英文数字字体可以建立在5 × 7位图网格上——每个符号只需要5个字节的存储空间。用美国信息交换标准码(ASCII)存储所有128个低分辨率字符,包括英语字母表中的每一个字母,数字0到9,以及常用的标点符号,只需要640字节的内存——这只是苹果II 64kb板载内存的一小部分。
但汉字有成千上万个,5 * 7的格子太小,难以辨认。中国需要16 * 16或更大的格子。,每个字符至少有32个字节(256位)的内存。如果设想一种字体包含7万个低分辨率汉字,那么总内存需求将超过2兆字节。即使一个字体只包含8000个最常见的中文字符,仅存储位图就需要大约256kb。这是20世纪80年代初大多数现成的个人电脑总内存容量的四倍。
与这些记忆挑战一样严重的是,在上世纪七八十年代,低分辨率中文字体制作面临的最棘手的问题是美学和设计问题。早在有人坐下来使用Gridmaster这样的程序之前,大部分工作都是在电脑之外使用笔、纸和涂改液完成的。
设计师花了数年时间来设计位图,以满足低内存要求,并保留少量的书法优雅。在创造这个字符集的人当中,无论是通过手绘特定汉字的位图草图,还是使用Gridmaster将其数字化,都有凌焕銘和艾伦·迪·乔瓦尼。
中国类型III字体的汉字位图绘制草稿。 路易斯·罗森布鲁姆,斯坦福大学图书馆特别收藏
设计师面临的核心问题是在两种截然不同的中文书写方式之间进行转换:用钢笔或毛笔书写的手绘汉字,和用排列在两个轴上的像素阵列书写的位图符号。设计师们必须决定如何重现手写中文的某些正字法特征,比如入口笔画、笔画的渐变和出口笔画。
就Sinotype III字体而言,设计和数字化低分辨率中文位图的过程被彻底记录下来。这一时期最引人入胜的档案来源之一是一个装满网格的活页夹,上面到处都是手绘的哈希标记-这些草图后来被数字化为数千个汉字的位图。这些角色中的每一个都经过精心布置,在大多数情况下,由Louis Rosenblum和GARF编辑,使用校正液擦除编辑不同意的任何“位”。在最初的一组绿色哈希标记之上,然后,第二组红色哈希标记表示“最终”草案。直到那时,数据输入的工作才开始。
bei(背,背,后)的草稿位图绘图的特写,显示了使用校正流体进行的编辑
考虑到团队需要设计的位图数量庞大——如果机器可以满足消费者需求的话,至少需要3000个位图(理想情况下更多)——人们可能会寻找简化工作的方法。例如,他们可以复制汉字的基本偏旁——当它们从一个汉字到另一个汉字的位置、大小和方向大致相同时。例如,当生成几十个包含“女性偏旁”(女)的常见中文字符时,GARF的团队可以只创建一个标准位图,然后在出现该偏旁的每个字符中复制它。
然而,档案资料显示,他们并没有做出这样的决定。相反,Louis Rosenblum坚持要求设计师调整每一个组件——通常是用一种几乎察觉不到的方式——以确保它们与它们所呈现的整体特征相协调。
例如,在juan(娟)和mian(娩)的位图中,每一个都包含了女性偏旁,偏旁的变化非常微小。在“娟”字中,女字的中间部分占据了6个像素的水平跨度,而在“勉”字中则是5个像素。但与此同时,在“勉”字中,女字的右下曲线只向外延伸了一个像素,而在“娟”字中,这一笔画根本没有延伸。
来自Sinotype III字体的juan(娟)和mian(娩)的位图字符
在整个字体中,这种级别的精度是规则而不是例外。
当我们将位图草图与最终形式并列时,我们会看到更多的修改。例如,在罗(collect net)的草案版本中,左下角的行程以完美的45°角向下延伸,然后逐渐变细,成为一个外行程的数字化版本。然而,在最终版本中,曲线被“拉平”了,从45度开始,然后逐渐变平。
两个草稿版本的字符罗的比较。
尽管设计师的工作空间看似很小,但他们必须做出惊人数量的选择。每一个这些决定都会影响他们为特定角色所做的每一个决定,因为添加一个像素通常都会改变整体的水平和垂直平衡。
网格的大小以其他意想不到的方式影响了设计师的工作。我们在实现对称这一棘手问题上看得最清楚。对称布局——在汉字中大量存在——在低分辨率框架中尤其难以表现,因为根据数学规则,创造对称需要奇数大小的空间区域。具有偶数尺寸的位图网格(如16 × 16网格)使对称是不可能的。在许多情况下,GARF只使用了整个网格的一部分:在上方只有一个15乘15的区域,从而成功地实现了对称。
山(山,安装),中(中,中),日(日,太阳)和田(田,场)中的对称性和不对称性。
当我们开始比较不同公司或创造者为不同项目创建的位图字体时,情况就变得更加复杂了。想想这个水字(氵),它以Sinotype III字体出现(下图和右图),而不是由美籍华裔心理治疗师、企业家田宏志(上图左)创造的另一种早期中文字体,田宏志在上世纪七八十年代尝试使用中文计算机。
比较了中国字体III字体(右)中出现的水根(氵)与H.C. Tien(左)创建的早期中文字体。
尽管上面的例子看起来微不足道,但每一个都代表了GARF设计团队无论是在起草阶段还是在数字化阶段都必须在数千个例子中做出的决定。
当然,低分辨率不会保持“低”太久。计算的进步带来了更密集的位图,更快的处理速度,以及不断减少的内存成本。在我们现在这个4K分辨率、视网膜显示器以及其他技术的时代,我们可能很难欣赏到早期中国位图字体的创造所体现的艺术——无论是美学还是技术上的——尽管它们都很有限。但正是这样的问题解决,最终让全球六分之一的人口能够接触到计算、新媒体和互联网。
Tom Mullaney是斯坦福大学中国史教授,古根海姆研究员,美国国会图书馆科技与社会克鲁格主席。他是六本书的作者或主编,包括《中国打字机》、《你的电脑着火了》和即将出版的《中国计算机》——第一部全面的中文计算机史。