1985年,在湖南常德澧县城头山镇,考古发现“彭头山遗址”,距今大约9000余年,其中出土了一件非常珍贵的字符。
随后,在距今7000年以上的湖北秭归柳林溪遗址,在距今5000余年的良渚文化陶罐上,在甲骨文上,都发现了这一字符。其中,以甲骨文来看,该字符为数字“五”。
因此,数字“五”应是被中国人使用了万年的汉字,反过来说中国应有上万年的文字史。
那么,从距今万年中国汉字出现开始,一直到今天,中国汉字数量有何变化,引起变化的原因又何在?
图片
首先,商朝之前
迄今为止,商朝之前的文字发现不多,无法判断数量情况,但其中两个发现较为特殊:
其一是安徽蚌埠双墩遗址,考古发现630个字符(下图),距今大约7300年,其中部分字符被江苏镇江、南京等先民使用,已经具备文字的特点。
其二是骨刻文,形成约在4600~3300年之间,目前发现单字数量约900个,龙山文化时期流行的文字,主要出土于山东,但在山西、陕西、内蒙等地也有发现。
图片
文字数量变多,背后反映的是人类物质与精神活动增多,需要更多的字或词来表达,由此导致字词的增多。旧石器时代,人类没有什么多余产出,核心工作是寻找食物,想方设法活下去,当时不需要什么文字。但到了新石器时代,随着社会的进化,新事物新现象的不断涌现,尤其龙山时代系统礼乐制度的出现,需要表达的东西越来越多,文字数量必然随之增多,所谓黄帝时代仓颉造字其实是有其历史背景的,不能简单的将之归为虚构。
双墩刻符、骨刻文等文字数量,符合当时中国社会发展情况,也可以解释商朝文字数量众多的原因。
图片
其次,商朝甲骨文
史前文字的融合与进化,最终在商朝形成了一套成熟文字系统(这不代表成熟文字系统始于商朝,只能说如今考古发现是这样)。根据甲骨文统计,甲骨文上大约一共有4500个文字,这与商朝属于广域王权、以及高度发达青铜文明的身份,显然是相符的。
如今破译的甲骨文,大概只有1600余,还有3000余未能破译。未能破译的甲骨文中,多数属于对汉字系统影响不大的地名人名等专有名词,很多应该未能传承下来,否则这些字就容易被释读了。也就是说,被传承下来的甲骨文,大概在2000个左右,这些属于常用文字。
由于甲骨文用于与沟通鬼神,日常另有简牍文书,因此如果算上未在甲骨文上出现的文字,估计商朝被传承下来的文字数量应超过2000个,可能达到3000个左右。
图片
第三,周秦时代
西周时期,中国出现第一部“文字书”,相传西周宣王时太史作《史籀(zhòu)篇》,也是中国最早的儿童识字课本,《汉书·艺文志》称《史籀》十五篇,但史籀已经失传,究竟收录了多少个字,已经无法知道。
战国时期,中国出现第一部字辞书——《尔雅》,“尔”为近、“雅”为正,即接近雅言、雅正之言,全书收录4300多个词语,计2091个条目。清朝四库全书认为,《尔雅》是战国到西汉“递相增益而成”。总之,战国西汉时,若加上遗漏的部分,中国汉字大概有5000余。
图片
秦朝时期,秦始皇书同文,统一列国文字后,李斯作《仓颉篇》,赵高作《爰历篇》,胡毋敬作《博学篇》,但这些都没能完整流传下来。其中,根据文献记载,仓颉篇收录3300字,但汉书又记载“太史试学童,能讽九千字以上,乃得为史”,九千字者是何书(或与八体六技有关),如今已经不得而知了。
总之,在周朝秦朝时,中华文明突飞猛进,对文字有了更多的“刚性需求”,需要更多的文字表达物质与思想,于是汉字数量出现大幅度增长。比如,“花”就是从“华”分化而来,因为“华”包含的意思太多,于是古人造出了“花”。
图片
第四,两汉魏晋南北朝
两汉时期,中国出现了不少文字书,比如司马相如的《凡将篇》,杨雄的《仓颉训纂》(继写李斯的仓颉篇,增加了2040个字,总量为5300多,即西汉末年汉字大概5000左右),东汉蔡邕等,但其中最重要的是东汉许慎的《说文解字》。
许慎为何要写《说文解字》?原因在于当时文字没有条例,于是“学者往往诡正文,乡璧虚造不可知之书”,说到底就是当时学者故弄玄虚,造出了一些没有的文字,导致文字混乱。在这种情况下,许慎整理历代文字书,最终收录9353个字,其中大约1200个字重复,主要是同一个字的不同写法。下图,许慎雕像。
图片
三国时期魏国张揖,整理的《广雅》收字18150个,但张揖与许慎相隔不远,文字数量不可能如此暴涨。因此,清朝学者考证认为“盖藉张揖之书以纳诸说,而实多揖所未知”,就是“递相增益而成”,但还是冠以《广雅》之名。
两汉魏晋南北朝时,中国文字书层出不穷,大概有百余部,其中南北朝时的《玉篇》,传世下来的收录了13208个字。之所以大幅度增多,原因在于翻译佛经而新造文字,以及社会变化带来的表达需要。比如,玉篇中的“身”部文字数量28个,说文解字中仅2个;珏、鼎属于后世不常用的事物,故而每部增加的数量都非常少。
图片
第五,隋唐之后
隋唐之后,中国文字数量进一步增加,北宋《类编》收录的汉字为33190个、《集韵》收字53525个,清朝《康熙字典》共收字为46933个,新中国《汉语大字典》收字60370个,将佛经、道经和石刻资料中发现的异体字也包含在内的《中华字海》收字85568个。
相比之下,本世纪初,“全球语言监督机构”宣布:以“每98分钟出现一个新英语单词”的速度计算,英语单词量已经达到988968个。显然,今年肯定已经超过百万。从英语出现到现在,大概也就千年左右,却已经暴涨到超过百万个。
图片
这一时期,之所以汉字数量出现暴涨,除了社会发展的表达需要之外,最主要的原因应在于佛教翻译。尤其隋唐两宋,是佛教文献翻译传抄十分频繁的时期,这一段时期汉字数量恰好出现暴涨。有兴趣的朋友可以看一看佛经,上面文字会让人怀疑自己是不是文盲,但实际上上面文字多属于形声字,是对梵语的音译。
值得一问的是,翻译佛经创造的文字,基本都是形声字,犹如西方的表音文字,如果这种传承像古希腊、古埃及等一样断绝,兼且没有文字书释意,那么今人还能读懂吗?
图片
最后,关于本文话题,可以总结为以下两点:
首先,从史前到汉唐,中国汉字的发展,是与社会的发展相适应,随着社会表达需要而文字数量逐渐增加,最终走向成熟规范。
其次,中国文字书数量众多,举世独一无二,这是汉字一脉相承的重要原因,也是后人读懂古代文书的重要资料(比如某些生僻字,没有文字书记载,如何释读)。
当然,不知道是西方字母文字的特殊性,还是其他什么原因,它们与中国文字的发展规律不太相符。比如,古希腊文字、楔形文字、古埃及文字出现就是规范成熟、而且数量庞大,其中古希腊单词数量高达5万多个,又在没有一部当时文字书的情况下,却被西方无碍释读,还能将断绝文字的读音标出来,着实让人惊叹。
参考资料:《胡朴安——中国文字学史》等
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。