文字识别技术原理,中英韩日四国文字识别效率对比
文字识别技术原理,中英韩日四国文字识别效率对比한 의 는 한의 와 다르다. 한 의 는 중국인 의 것 이 고 한 의 는 한국인 의 것 이다.2、韩文版中文的识别效率非常高,基本达到了“看到就明白,一目了然”的程度。这句话从入眼,到完全识别信息只需要5秒左右。而且中文对汉字的顺序并不敏感,你可以正着写,也可以倒着写,甚至词序颠倒对中文识别都没太大影响。下面这句话错乱的顺序对你阅读造成影响了吗?“研表究明,汉字的顺序并不定一能影阅响读,比如当你看完这话句后,才发现这里的字全是乱的。”汉字是唯一一个可以做到“一目十行”的文字,“识别速度”是汉字的独门绝技!
文字有两面,一面是记录信息,一面是识别信息。人能否快速高效的识别文字中的信息,是该文字先进与否的重要标准。目前世界有四类文字:以中文为代表的象形文字,以英文为代表的表音文字,以韩文为代表的拼音文字,以日文为代表的混合文字。这四大文字,谁的识别效率最高?
让我们来以一句话来看看四大文字的识别效率:
一、中文版
汉医与韩医是不一样的,汉医是中国人的,韩医是韩国人的。
中文的识别效率非常高,基本达到了“看到就明白,一目了然”的程度。这句话从入眼,到完全识别信息只需要5秒左右。而且中文对汉字的顺序并不敏感,你可以正着写,也可以倒着写,甚至词序颠倒对中文识别都没太大影响。下面这句话错乱的顺序对你阅读造成影响了吗?
“研表究明,汉字的顺序并不定一能影阅响读,比如当你看完这话句后,才发现这里的字全是乱的。”
汉字是唯一一个可以做到“一目十行”的文字,“识别速度”是汉字的独门绝技!
2、韩文版
한 의 는 한의 와 다르다. 한 의 는 중국인 의 것 이 고 한 의 는 한국인 의 것 이다.
韩语是拼音文字,词汇主要来源于中文。韩语的拼音化,让它的识别效率非常低。其感受类似于我们使用汉语拼音,拼读出来并不一定知道意思,需要联系上下文猜测这句话的真实意思,相当于要经过两道工序才能识别信息,效率当然不高。同音词是韩语最大的障碍,一直得不到根本性解决。在这句话里“汉医”和“韩医”的韩文都是“한 의”,完全相同,如果没有中文辅助,韩国人永远不知道我说的是“汉医”还是“韩医”!
再看一个例句:枕戈待旦,用翻译软件是창 고 를 베 고 날 이 밝 기 를 기다리다,然后再翻译成中文“枕着库房等天亮”或“我们削减了仓库,等待美好的一天“。这说明“戈”这个字在韩语里发音与“仓库”相同,电脑很难识别。不知道汉字“戈”的韩国人也不知道具体什么意思。所以韩国军队在飞机上用的是“枕戈待旦”的汉字。
综合评价,韩文的识别效率只有中文的50%左右。
3、英文版
Chinese medicine is different from Korean medicine. Chinese medicine belongs to Chinese people while Korean medicine belongs to Korean people.
制约英文识别效率的是“空间”。英文是线性文字,占用的空间比较大,而人眼和人脑对“空间”的识别是有“体积限制”的。同一时间人眼和人脑能主动看到并识别的字符数是6个,超过6个字符,人眼和人脑只会扫描,但会延时识别。比如“dog”,瞬间就能识别,而“medicine”则要延迟0.1-0.2秒才能识别,单词越长,延迟越久,“overestimate”的识别则比“dog”慢两拍!说到底,人的大脑也是一种“计算机”,同一瞬间,能够处理的“字节”数也是有限的!
汉字是一种高压缩“方块文字”,把大量信息压缩在了一个字符内,这是其它所有表音文字所达不到的“高能文字”。加上几千年间中文在词汇上的精炼,进一步浓缩了中文信息的密度。四个字的成语典故,如果翻译则需要一段话。兔死狐悲、过河拆桥、鸟尽弓藏、兔死狗烹、鹦鹉学舌、爱莫能助、一鸣惊人、引狼入室.....,简单的四个字,蕴含了多大信息量?
其次,英文中有许多frome、to、have、on、at、for、of等无实际意义的介词、助词,也拉伸了英文的线性长度,降低了英文的识别效率。第三,英文的16种时态变化,也让英文识别效率降低。
英语还有一个致命问题:近代以来,英语单词的长度越来越长,占用的空间越来越大,识别的效率越来越低。以Electric为起点,英文创造了electricity电 、Electric car电动车、Electric locomotive电力机车、Electric kettle电水壶、电动牙刷Electric toothbrush等以电驱动的词汇。英文单词本身就是线性的,新造的词汇是线性 线性,双倍的长度,0.5倍的识别效率。与中文新造词汇相比,效率之低,令人震惊!
综合评价,英文识别效率只有中文的60%。
4、日文版
漢医と韓医は違います。漢方医は中国人で、韓医は韓国人です。
日本人还是比较聪明的,重要的信息都用汉字表达,让效率瞬间提升!在日本,门牌、车牌、街牌、招牌、人名、站名等重要信息几乎都是纯汉字。日本人给出的解释是“汉字比片假名更有辨识度”。比如一辆肇事车辆逃逸,看到的人瞬间就能通过汉字识别出这是那儿的车,并迅速记下车牌,如果是片假名呢?做不到。
综合评价,日文的识别效率是中文的80%,当然是在大量使用汉字的前提下。
其它西方文字如法语、德语、俄语、西班牙语、阿拉伯语就不一一讨论了,都是表音文字,内在机制基本一样,效率不会比英语高多少。
信息密度、识别效率、识别速度,中文都站在了当今所有文字的巅峰。有人说:你说的再好也没多大意思,科学还是人家西方厉害,中国人还是要去西方留学,全世界也只有中国人和日本用汉字。
中国今天比西方落后,不是中文之过,而是过去几百年制度和思想落后造成的,但中文的先进性让中国能够更快的追上西方。
近日有西方媒体做了一个测试,让中国初三学生和荷兰初三学生做对方的试卷,结果荷兰学生直呼这也太难了,完全不会做啊!荷兰学生接受采访说:是中国学生学的多。我认为这个回答挺准确的!
中文的高效率可以让中国人在相同的时间内学到比其他任何国家更多的知识!中国人一堂课抵得上外国人两堂课,中文让中国人获得了不对称优势。所以我坚信中国将在未来50年内超越西方,在所有科学领域全面超越!
城市、经济、科技、地理、人文,欢迎关注我!