中文
中文,顾名思义,就是中国的语言文字,有时候特指汉族的语言文字。 “中文”和“汉语”应该是两个不同的概念。中文不仅是指口讲、耳听的语言,还包括阅读和书写的内容。“中文”与“汉语”两个概念的差异问题,一直以来,被人们忽略着。众所周知,中华民族是由56个民族组成的民族大家庭。除了一些较小的少数民族,他们始终没有自己的民族文字以外,藏、满、蒙、回等一些较大的民族,都有自己的民族语言和文字。而这些“中华民族大家庭”的语言文字,都属“中文”范畴。因此,“中文”并不恒等于“汉语”,或者说“中文”并不一定就是“汉语”。把“汉语”称做“中文”,用“中文”来代替“汉语”,严格说来,是欠准确的。 中文是相对于外国文字的一种叫法,一般特指汉字,即汉语的文字表达形式。但有时广义的概念也有所扩展,即既包括书写体系,也包括发音体系。
中文的历史
·目前发现的最早的中文是甲骨文
甲骨文主要指殷墟甲骨文,是中国商代后期(前14~前11世纪)王室用于占卜记事而刻(或写)在龟甲和兽骨上的文字。它是中国已发现的古代文字中时代最早、体系较为完整的文字。
甲骨文是中国的一种古代文字,被认为是现代汉字的早期形式,有时候也被认为是汉字的书体之一,也是现存中国最古的一种成熟文字。甲骨文又称契文、龟甲文或龟甲兽骨文。商朝人用龟甲、兽骨占卜后把占卜时间、占卜者的名字、所占卜的事情用刀刻在卜兆的旁边,有的还把过若干日后的吉凶应验也刻上去。不过具体的情形因甲骨分期而有详略的差异,大致上以武丁期的刻辞最为完整,同时也是现存数量最多的时期。学者称这种记录为卜辞,这种文字为甲骨文。殷墟甲骨文是殷王朝占卜的记录,是目前已知的中国最早的成熟的文字。被称为中国古代最早的“档案库”。目前发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力。中国商代和西周早期(约公元前16~前10世纪)以龟甲、兽骨为载体的文献。是已知汉语文献的最早形态。刻在甲、 骨上的文字早先曾称为契文、 甲骨刻辞、卜辞、龟版文、殷墟文字等,现通称甲骨文。商周帝王由于迷信,凡事都要用龟甲(以龟腹甲为常见)或兽骨 (以牛肩胛骨为常见)进行占卜,然后把占卜的有关事情(如占卜时间、占卜者、占问内容、视兆结果、验证情况等) 刻在甲骨上,并作为档案材料由王室史官保存 (见甲骨档案)。除占卜刻辞外,甲骨文献中还有少数记事刻辞。甲骨文献的内容涉及当时天文、历法、气象、地理、方国、世系、家族、人物、职官、征伐、刑狱、 农业、 畜牧、田猎、交通、宗教、祭祀、疾病、生育、灾祸等,是研究中国古代特别是商代社会历史、文化、语言文字的极其珍贵的第一手资料。 甲骨文的发现经历了一个错综复杂的过程。这有必要先从发生在一个名字叫李成的农民身上说起。这个愚昧的农民对甲骨文的发现有着一段典型的、可笑 的、荒诞而又充满文化悲怆感的传说。他是河南省洹河畔安阳县小屯村人。李成是为了赚钱第一个把“甲骨文”作为药材运到城里、传送出去的人,但也是在他手里,毁掉了难以计数的甲骨文字。功耶?罪耶?惟有历史来定论。
·中文文字(汉字)的演变
汉字起源于图画。在汉字产生的早期阶段,象形字的字形跟它所代表的语素的意义直接发生联系。虽然每个字也都有自己固定的读音,但是字形本身不是表音的符号,跟拼音文字的字母的性质不同。象形字的读音是它所代表的语素转嫁给它的。随着字形的演变,象形字变得越来越不象形。结果是字形跟它所代表的语素在意义上也失去了原有的联系。这个时候,字形本身既不表音,也不表义,变成了抽象的记号。如果汉语里所有的语素都是由这种既不表音也不表义的记号代表的,那么汉字可以说是一种纯记号文字。不过事实并非如此。汉字有独体字与合体字的区别。只有独体字才是纯粹的记号文字。合体字是由独体字组合造成的。从构造上说,合体字比独体字高一个层次。因为组成合体字的独体字本身虽然也是记号,可是当它作为合体字的组成成分时,它是以有音有义的“字”的身份参加的。合体字可以分成以下3类: ①形声字。形声字由表示意义的形旁和表示读音的声旁两部分组成。拿构造最简单的形声字来说,形旁和声旁都是由独体字充当的。作为形声字的组成部分,这些独体字都是有音有义的字。不过形旁只取其义,不取其音,例如“鸠”字的偏旁“鸟”;声旁则只取其音,不取其义,例如“鸠”字的偏旁“九”。 由于字义和字音的演变,有些形声字的形旁或声旁现在已失去了表意或表音的功能。例如“球”本来是一种玉的名称,所以以“玉”为形旁。现在“球”字不再指玉,这个形旁就没有作用了。再如“海”字本来以“每”为声旁。由于字音的变化,现在“海”和“每”的读音相去甚远,声旁“每”也就不起作用了。有的时候,形旁和声旁都丧失了原来的功能,例如“给、等、短”。这一类字已经不能再作为形声字看待了。
形声字和非形声字之间并没有明确的界限。造字之初,形声字和它的声旁的读音本来就不一定密合。发展到现代汉字,出入就更大了。有人拿7500多个现代合体汉字进行统计。就普通话读音来说,合体字跟声旁完全同音(声母、韵母、声调全同)的不到 5%。声母、韵母相同而声调不同的约占10%。只有韵母一项相同的约占20%。如果我们只把前两类看作形声字,那么形声字大概只占通行汉字的15%。如果把以上三类全看作形声字,形声字大概会占通行汉字35%的样子。要是把标准再放宽或者完全根据来历确定形声字,那么通行汉字中形声字的百分比还要高得多。 ②合体会意字。古人说“止戈为武”,“人言为信”。对于“武”、“信”两个字来说,这种解释是错误的。不过汉字体系里确实有按照这种方式造成的字,例如“不正为歪”,“不好为孬”。这一类字的特点是会合偏旁的字义来表现整个合体字的意义。这种字为数很少,只有个别的例子。 以上两类合体字里的偏旁有的有表意作用,有的有表音作用。下边一类的情形不同。 ③合体记号字。这一类合体字的偏旁既不表意,也不表音。这主要有两种情形。一是由于字音和字义的变化,原来的声旁和形旁已经不再表音、表意了。例如上文举过的“给、等、 短”一类字。 另一种情形可以举“章”字为例。 按照汉代许慎《说文解字》的分析,“章”字从“音”从“十”。 可是现在一般人说“立早章” (以区别于“弓长张”)的时候,是把它分析成“立”和“早”两部分。其实从古文字看,“章”本来是一个独体象形字,跟“音、十、立、早”都没有关系。 汉字用来记录汉语已经有3000年以上的历史,一直沿用到今天,没有中断过。在如此长的历史时期里,汉字不仅为人们的现实生活服务,而且记录下极其丰富的文化资料;甚至跨越国界,被日本、朝鲜、越南等邻国借去记录非汉语语言。 另一方面,长期以来也不断有人批评汉字的缺点,主要是说汉字难认、难写、难于机械化(印刷排版、打字等)。因此在扫盲、儿童识字教育、文化传播等方面,都不如拼音文字效率高。 跟拼音文字比较起来,汉字有它的短处,但是也有它的长处。汉字最大的长处就是能够超越空间和时间的限制。古今汉语字音的差别很大。但由于2000年来字形相当稳定,没有太大变化,字义的变化比较小,所以先秦两汉的古书今天一般人还能部分看懂。如果古书是用拼音文字写的,现代人就根本无法理解了。有些方言语音差别也很大,彼此不能交谈,可是写成汉字,就能互相了解,道理也是一样的。 50年代开始进行简化汉字的工作。1986年重新公布的《简化字总表》规定了2200多个简化汉字(包括用简化偏旁类推的字)。这项工作目前已告一段落,今后在一个时期内将保持稳定,不继续简化。因为不断简化会破坏文字的稳定性,而且简化一批字以后,原来的繁体字并不能废除。结果是汉字的总数有增无减,反而加重了学习和使用的人的负担。 关于文字拼音化问题,长期以来一直有争论。从理论上说,任何自然语言都可以用拼音文字记录。但是由于汉语方言分歧,在推广普通话的工作没有取得广泛、切实的成效以前,改用拼音文字会给方言区的人带来很大的困难。此外,由于汉字历史悠久,大量的文献都是用汉字记录的。一旦改弦易辙,势必在文献的广泛利用上造成一定困难,在社会心理和民族感情上也可能引起波动。事实上,由于长时间使用汉字这一可以表意的书写系统,汉语中可以存在大量同音字词,而且这个现象确实发生了,现在一个音节最多可以对应几十上百个汉字,如果使用拼音来记载语音,会出现不读出来就看不懂的现象,即使经过长时间的训练也无法彻底解决这个问题,因此如果真要进行汉字拉丁化的工作,决不是一朝一夕能够完成的,在汉语发展到合适的程度以前,最好搁置拉丁化的计划。