大禹治水背后的历史(穿越到大禹时代)
大禹治水背后的历史(穿越到大禹时代)遇到“镕、啰、瞭、袆、祎、曌、赟、贇、鱻、驫、犇……”等汉字,既无法输入,又不能打印。为解决字数过少的问题,在1995年和2000年又先后发布了GBK和GB18030国标码。GBK编码方案收录汉字21003个,GB18030则更多。新版国标码是在旧版基础上增加新的码位,因此向下兼容旧版国标码。文化人写稿子,特别是输入人名的时候,常会有一些特别的字,GB2312-80字库里面没有。1980年颁布了《信息交换用汉字编码字符集--基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。也就是建立字库的时候,考虑的是词频。书面语常用字:
我们现在假装穿越了,虽然物理现在做不到这件事情,但是思想还是可以任意驰骋的。
现在回到了大禹治水的年代了,而且想把大禹治水这事记录下来,我们会遇到什么样的表达的技术问题?
口语与书面语表达并不完全相同口语常用字:
这我们通常会以为有很多,但是,实际上即便现在,也就有3000左右字。这些字通常与生活的内容直接息息相关。
1980年颁布了《信息交换用汉字编码字符集--基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。
也就是建立字库的时候,考虑的是词频。
书面语常用字:
文化人写稿子,特别是输入人名的时候,常会有一些特别的字,GB2312-80字库里面没有。
遇到“镕、啰、瞭、袆、祎、曌、赟、贇、鱻、驫、犇……”等汉字,既无法输入,又不能打印。为解决字数过少的问题,在1995年和2000年又先后发布了GBK和GB18030国标码。GBK编码方案收录汉字21003个,GB18030则更多。新版国标码是在旧版基础上增加新的码位,因此向下兼容旧版国标码。
另外,会说话的人可以不认字,并不影响生活中简单的表达。这是文字产生以前,口传心授依然有实际意义的基础。最早干这活的是巫师,直到殷商。
关于唐诗的词频我们先看看《唐诗三百首》的词频统计。
来自网络的词频统计
《唐诗三百首》排名前30的词频
去掉其中的诗词名称及人名,我们发现,高大上的唐诗中,常用的排在前三十位的汉字小学就已经全认识了。
在里面,我们可以发现老子的阴阳:来(归)、去(送);上、下;有(在)、空等。传统的阴阳思想无处不在的,词频接近对应。都是前三十位的高频,这符合概率特征。
而且,这些字都与儒家、儒教或者道、禅之类的关键字有关,词频如此之高,还需留神的。这通常是很多人并没有在意的。《唐诗三百首》是清朝乾隆年间的汇总,历史文化背景并不同,而且作者蘅塘退士那是五行八卦都懂的。
上面这个词频统计是基于《唐诗三百首》的。
笔者前一阵将诗词名称作者姓名全去掉,不加筛选的凑了三万多字的唐诗宋词放在一起,进行词频分析,结果是找出这么一个问题来:
《从文化角度谈谈文人的坏毛病之一动不动就忧郁了,这毛病哪来的?》(当时还不是原创作者,该文无法链接,自行在笔者的文章中找吧。)
未经筛选的三万多字的唐诗宋词词频高频显示
这说明,《唐诗三百首》已经是古人的优选结果,至少摒弃了一些消极的文化;至于进入现代课本的,更是对于教育、教化优中选优结果了。这里面的本土传统文化的气息,是很浓厚的。
大禹时期古人当时最尴尬的字是什么内容?与大自然有关的、与生活有关的意思当时是都可以表达的,也就是现代词频较高的那些字,除了手机、电视之类的古人没有,其他的生活中使用的东西和基本的现象,古人是可以表达的。这从甲骨文中已经翻译出来的2000左右个字可以看出来。情况与大禹时期并差不了多少,仅仅是当时的表达可能主要是基于口传。特别重要的才用文字,而且年代久远,发现的证据并不多,但是当时有基于象形的文字了。
那么GB2312字库中,不是后世衍生出来的字,在甲骨文中或者大禹时期,是一样可以表达的,仅仅是表达和使用的方法可能与现代的表达方式并不同,这在前文已经探讨。周朝之后,对文字的字义进行了大规模的规范和修改,以使字义表达更准确,并且改变殷商文化,这同时产生了一些新的字。
至清朝,汉字有十多万个字。不过大多数我们并不用上。
甲骨文还有3000-4000字没有翻译出来,这就是词频较低的。这些字,往往是姓名、名称、一些哲思类的特指(可以看看笔者前文中说的道、易这些字的甲骨文是怎么来的),一些抽象的过程(这些过程可能现代不存在了)等等。
古代道教的画符是本土传统文化的延续,那么甲骨文中,一些构架复杂的组合,实际与道教的画符同理,从《六书通》《说文解字》中可以看出中文复杂的字造字的组合方法。甲骨文中抽象的图符构件成为汉字文字的基础。而这些抽象的构件,传说产生于仓颉,实际是仓颉组织进行了第一次的文字规范。
大禹时期,字有多少,并不明确。字数较少的情况下,就会出现一字多意的表达。因为随着文明的发展,要表达的事情总是不断增加。这样字也就逐渐的增加了。
大禹治水女娲补天,治天水的传说中使用的是“息壤”,现代通常认为这可能是现代所说的膨润土,遇水体积大幅膨胀。
大禹基于父亲鲧治水“堵”的经验教训,采取了泄的方式,疏通、疏导水,以入东海。
现在我们再看看《山海经》中的大禹治水。
《山海经·海内经》:洪水滔天,鲧窃帝之息壤以堙洪水,不待帝命。帝令祝融杀鲧于羽郊。鲧复生禹,帝乃命禹卒布土以定九州岛。禹娶涂山氏女,不以私害公,自辛至甲四日,复往治水。禹治洪水,通轘辕山,化为熊。谓涂山氏曰:“欲饷,闻鼓声乃来。”禹跳石,误中鼓,涂山氏往,见禹方坐熊,惭而去。至嵩高山下,化为石,方生启。禹曰:“归我子!”石破北方而启生。
《史记·夏本纪》“予娶涂山”,“禹伤先人父鲧功之不成受诛,乃劳身焦思,居外十三年,过家门不敢入”,司马贞索隐:“《系本》曰‘涂山氏女名女娲’,是禹娶涂山氏号女娲也。”亦称“ 女娇”、“ 女趫”。
这是以前流传下来的内容的整理。
可以标榜史册的第一本称得上是书的并完整得以流传的是《周易》,金文中的铭文最多也就是几百字。这之前的记载通常都是小块头的内容。而《山海经》这个字数规模超过《周易》,在当时是何等重要的文献呢?古人画这么大的气力搞出来的当时的传世巨著,难道仅仅是为了好玩,这不符合逻辑。
”禹治洪水,通轘辕山,化为熊“。大禹治水带着的这帮人后来成为以熊为图腾的这个部落。启从石头中生出来,这启发了吴承恩,孙猴子从石头中蹦出来。至于这种生孩子的方法,也启发了司马迁,这才有史记中的踏雷泽白蟒生子的故事。
虽然这个生育过程描写的很蹊跷,但是整个事件的人物、事件的来龙去脉还是基本清楚的。
至于大禹因治水十三年未归家还是八年,后世记载有不同,但是从启出生的过程看,两口子见一次面不容易。启出生在熊的北方,一座山上。
即便现在用古文来表达这个故事,需要改的地方并不多。仅仅是轩辕山在哪?嵩高山在哪?我们不太准确地清楚罢了。但这并未影响事件过程的记录。
待续。。。。。。