阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)
阿拉伯语的常用字母(干货阿拉伯语阿拉伯字母)Windows CP1256b. Windows CP1256阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,Windows CP1256, Unicode等;a. ISO8859-6ISO8859-6
一、阿拉伯语
阿拉伯语是联合国六种工作语言之一,主要分布于西亚,北非,使用人口约 4 亿 。
1. 分布图示如下
2. 字符集
阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,Windows CP1256, Unicode等;
a. ISO8859-6
ISO8859-6
b. Windows CP1256
Windows CP1256
c. Unicode
Unicode
说明:
1. ISO8859-6 是国际标准化组织内ISO/IEC 8859的其中一个8位字符集,供现代阿拉伯语使用,它等同于阿拉伯标准ASMO-708。
2. CP1256 是由 Microsoft 制定的一个 8 位字符集,主要应用于Dos,Windows 系统,其扩展性有限。
3. Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
总结: 1 2 由于很多阿拉伯语使用的字母都未能支援,故现已被Unicode逐步取代。若要实现阿拉伯语的显示,首要根据平台需求(选择编码方式),否则推荐 Unicode 方式,便于后期扩展。
二、阿拉伯字母
阿拉伯字母为阿拉伯语的书写形式。除了阿拉伯语,还有其它语言也使用阿拉伯字母,如: 波斯语(伊朗)、乌尔都语(巴基斯坦,印度)、普什图语(阿富汗)、哈斯克语(哈萨克)、维吾尔语(维吾尔族)等。每个字母都有唯一对应编码,书写方向从右至左,无大、小写之分,但有印刷体、手写体和艺术体之别,且书写时均有独写与连写之分。
分布图示如下:
扩展补充字母 (unicode)
Arabic Extended-A
根据字母分类
说明: Unicode 针对不通语言或特殊需求,做的一些字符补充。
三、阿拉伯符号
阿拉伯符号即展示形态(或样式),有些字母存在多形态,需根据前后字母,择其形态。很多小语种都存在这种多形态现象,有些符号在矢量字库中甚至没有映射编码。阿拉伯符号主要分如下 3 种:
1. 独立形态 (1个符号对应1个编码)
在前面展示的字符图形中的小图片,都属这类符号。
2. 含映射编码的独立、连写,合成形态。 (1个符号对应1个编码)
在unicode中,包含了阿拉伯文特有的2个编码段。
#FB50-FDFF #阿拉伯表達形式A (Arabic Presentation Form-A)
#FE70-FEFF #阿拉伯表達形式B (Arabic Presentation Form-B)
说明:根据当前字母(编码)的前后字母(编码),决定当前字母的显示形态(即符号),解决方法:生成点阵信息,建立映射关系。
注意:这些符号的编码不会出现在信息存储或传递中。
3. 不含映射编码的独立、连写,合成形态。 (符号没有对应编码)
说明: 点阵方式,这类符号在某些场景中也会需要显示,不同字体,由于处理方式不同,字符数也会不同,故解决方案亦不一样。解决方法: 自定义编码,生成点阵信息,建立映射关系。
建议: 要实现这类需求,首要确定字体,再考虑进一步动作。
四、阿拉伯语与其它语言的关系
如西欧国家,德语,法语, 西班牙语等,都共用拉丁文字母,但是彼此却各不相同。阿拉伯语与波斯语,乌尔都语等, 虽说同使用阿拉伯字母,但使用方法,表达的意思各有不同,甚至都未必同源。参阅如下图述:
语言来源比较
总结:一套字库可以支持多种语言,多种语言可以共用字母,但是语言未必能共用。