快捷搜索:  汽车  科技

古文化领域的创新(古文字信息化处理综述)

古文化领域的创新(古文字信息化处理综述)歧义字就是有着多种考释结论,尚未有哪一种结论得到公认的文字。将歧义字放入字库,首先要确立代表字形,满足计算机处理的要求,然后满足对其字形的不同渠道查询,根据各种不同考释都可查询到该字。歧义字在选择中应当注意字形、用法的统一。2.歧义字与未识字整理在古文字信息化的研究处理中,我们首先要面对的就是古文字字库的整理与储存,迄今为止出版的古文字研究资料统计,甲骨文、金文、小篆等古文字字形大约有60万左右,这样大的字形量给字库整理收纳带来了很大的困难,由于古文字本质上属于手写文字,往往会因为书写者的个人原因造成字形差异,规范程度相对较低,如果不加整理就放进字库,会对古文字信息化处理造成很大困难。1、已识文字整理已识文字的整理就在于将已有考释的古文字的各个具有区别意义的字形整理入库,这种整理不仅要为古文字的普及而服务,也要为古文字的研究提供方便快捷的信息化处理服务。对已识文字整理分析其字形结构,找出代

用计算机储存整理、研究古文字是当今古文字界关心研究的一个问题,随着时代的飞速发展,我们对古文字的研究已经不再局限于文物、书本、手写等渠道。各种新兴媒体的发展,我们将重点放在了如何使用计算机去整理研究古文字。我们常用的输入法有中文、英文、日文等等,但是我们很少见到,有直接可以输入使用的甲骨文等文字的输入法,现在网上很流行的就是文字在线转换器,但是转换出的文字无法复制使用在别处,而且只能输入现代汉字来查找对应的古文字,却无法直接输入古文字,这对古文字研究造成了麻烦,所以如何解决这种无法便捷使用古文字输入的情况成了当务之急。

在现在出版的一些古文字刊物中,有些缺少了一些关键的古文字,一些采用图文混排,直接将古文字图片剪切粘贴,有一些则是直接采用图像版。这些方式虽然便捷了古文字的推广和学习,但是距真正意义上的信息化处理计算机输入查询还有一些距离。

现代汉语常用的汉字编码主要有拼音编码、字形编码两大类。拼音码又可以细分为全拼码、双拼码、简拼码。字形码又可以细分为部件码和笔画码。部件码需要将汉字拆分为部件或字根,再将它们通过音托、位托、形托等方式映射到键盘字符。拼音码以音为主以形为辅,字形码以形为主以音为辅。但是有很多古文字读音失传无法使用拼音编码,同时又有着大量象形字异体字,无法找到对应的规则笔画,用字形编码也产生了困难。那么做好古文字信息化处理,目前应当关注以下几个问题。

古文化领域的创新(古文字信息化处理综述)(1)

一、古文字字库

在古文字信息化的研究处理中,我们首先要面对的就是古文字字库的整理与储存,迄今为止出版的古文字研究资料统计,甲骨文、金文、小篆等古文字字形大约有60万左右,这样大的字形量给字库整理收纳带来了很大的困难,由于古文字本质上属于手写文字,往往会因为书写者的个人原因造成字形差异,规范程度相对较低,如果不加整理就放进字库,会对古文字信息化处理造成很大困难。

1、已识文字整理

已识文字的整理就在于将已有考释的古文字的各个具有区别意义的字形整理入库,这种整理不仅要为古文字的普及而服务,也要为古文字的研究提供方便快捷的信息化处理服务。对已识文字整理分析其字形结构,找出代表字形,字形结构相同的就可以不必重复录入字库。

2.歧义字与未识字整理

歧义字就是有着多种考释结论,尚未有哪一种结论得到公认的文字。将歧义字放入字库,首先要确立代表字形,满足计算机处理的要求,然后满足对其字形的不同渠道查询,根据各种不同考释都可查询到该字。歧义字在选择中应当注意字形、用法的统一。

将未识字放入字库的目的是出于研究的目的,方便古文字研究学者利用计算机信息化处理手段对其进行考释,在对未识字的整理方面我们能寻找到的依据更加的少,所以对未识字的字形观察重中之重,可以将字形结构完全相同的未识字收入字库。

二、古文字编码

进入字库的古文字还要面对如何输入、导出的问题。在出土的上古文字中,有一部分是因为无法识别字形,又不能确定读音,就无法使用现代汉语编码方式对其进行编码。

我们可以将古文字字形中的基本字形拆分出来,就像“偏旁”一样,找出这个字中的基本字形,按照基本字形的排列组合规律,来查询文字,基本字形的确定,可以扩大古文字检索的覆盖面,将基本字符拆分进行编码从而达到对古文字的查询搜索。

古文字中存在着一些未识字形,又没有什么基本字形的文字,对于这种文字,我们可以将字中的几何图形提取出来作为编码的依据,比如有矩形图样的文字可以以“kuang”来进行查询。

我们还应该建立多路径多角度的检索路径,不能将一个字束缚在一种查询方式中,古文字的结构并不单一,我们对其的解读也不应该单一化,所以我对古文字字形分析也应该有多种的组合方式,有不同的查询方式。比如某个已识字,我们可以从基本字形查询,也可以从文字的几何图形构成进行研究。

如果将原形字与隶定字分类放入字库,那么非专业人士进行查询的时候很难去分清区别,将他们放入不同字库,无疑会为检索增加困难。所以建立一个包含特定古文字种类的字库是十分必要的。

古文字如何输入导出,不仅需要构建字库还需要去开发相对应的专属输入法,对古文字进行解构分析,再与现代汉语对应上,利用现代汉语常用汉字编码去分析研究古文字,从而使古文字信息化处理研究不再成为难事。

猜您喜欢: