快捷搜索:  汽车  科技

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)Windows CP1256b. Windows CP1256阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,Windows CP1256, Unicode等;a. ISO8859-6ISO8859-6

一、阿拉伯语

阿拉伯语是联合国六种工作语言之一,主要分布于西亚,北非,使用人口约 4 亿 。

1. 分布图示如下

2. 字符集

阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,Windows CP1256, Unicode等;

a. ISO8859-6

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(1)

ISO8859-6

b. Windows CP1256

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(2)

Windows CP1256

c. Unicode

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(3)

Unicode

说明:

1. ISO8859-6 是国际标准化组织内ISO/IEC 8859的其中一个8位字符集,供现代阿拉伯语使用,它等同于阿拉伯标准ASMO-708。

2. CP1256 是由 Microsoft 制定的一个 8 位字符集,主要应用于Dos,Windows 系统,其扩展性有限。

3. Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

总结: 1 2 由于很多阿拉伯语使用的字母都未能支援,故现已被Unicode逐步取代。若要实现阿拉伯语的显示,首要根据平台需求(选择编码方式),否则推荐 Unicode 方式,便于后期扩展。

二、阿拉伯字母

阿拉伯字母为阿拉伯语的书写形式。除了阿拉伯语,还有其它语言也使用阿拉伯字母,如: 波斯语(伊朗)、乌尔都语(巴基斯坦,印度)、普什图语(阿富汗)、哈斯克语(哈萨克)、维吾尔语(维吾尔族)等。每个字母都有唯一对应编码,书写方向从右至左,无大、小写之分,但有印刷体、手写体和艺术体之别,且书写时均有独写与连写之分。

分布图示如下:

扩展补充字母 (unicode)

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(4)

Arabic Extended-A

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(5)

根据字母分类

说明: Unicode 针对不通语言或特殊需求,做的一些字符补充。

三、阿拉伯符号

阿拉伯符号即展示形态(或样式),有些字母存在多形态,需根据前后字母,择其形态。很多小语种都存在这种多形态现象,有些符号在矢量字库中甚至没有映射编码。阿拉伯符号主要分如下 3 种:

1. 独立形态 (1个符号对应1个编码)

在前面展示的字符图形中的小图片,都属这类符号。

2. 含映射编码的独立、连写,合成形态。 (1个符号对应1个编码)

在unicode中,包含了阿拉伯文特有的2个编码段。

#FB50-FDFF #阿拉伯表達形式A (Arabic Presentation Form-A)

#FE70-FEFF #阿拉伯表達形式B (Arabic Presentation Form-B)

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(6)

说明:根据当前字母(编码)的前后字母(编码),决定当前字母的显示形态(即符号),解决方法:生成点阵信息,建立映射关系。

注意:这些符号的编码不会出现在信息存储或传递中。

3. 不含映射编码的独立、连写,合成形态。 (符号没有对应编码)

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(7)

说明: 点阵方式,这类符号在某些场景中也会需要显示,不同字体,由于处理方式不同,字符数也会不同,故解决方案亦不一样。解决方法: 自定义编码,生成点阵信息,建立映射关系。

建议: 要实现这类需求,首要确定字体,再考虑进一步动作。

四、阿拉伯语与其它语言的关系

如西欧国家,德语,法语, 西班牙语等,都共用拉丁文字母,但是彼此却各不相同。阿拉伯语与波斯语,乌尔都语等, 虽说同使用阿拉伯字母,但使用方法,表达的意思各有不同,甚至都未必同源。参阅如下图述:

阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)(8)

语言来源比较

总结:一套字库可以支持多种语言,多种语言可以共用字母,但是语言未必能共用。

猜您喜欢: