汉字

 
甲骨文是商代后期王室用于占卜记事而刻在龟甲和兽骨上的文字
甲骨文是商代后期王室用于占卜记事而刻在龟甲和兽骨上的文字
 汉字,亦称中文字、中国字,是汉字文化圈广泛使用的一种文字,汉字为上古时代的华夏族人所发明创制并作改进,目前确切历史可追溯至约公元前1300年商朝甲骨文。再到秦朝的小篆,发展至汉朝才被取名为“汉字”,至唐代楷化为今日所用的手写字体标准——楷书。  汉字是迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的文字,期间东亚诸国都有一定程度地自行创制汉字。相较而言,古埃及、古巴比伦、古印度文字都早已消亡,所以有学者认为汉字是维系中国南北长期处于统一状态的关键元素之一,亦有学者将汉字列为中国第五大发明。  中国历代皆以汉字为主要官方文字,现时中国定为国家规范用字。汉字在古代已发展至高度完备的水平,不单中国使用,在很长时期内还充当东亚地区唯一的国际交流文字,二十世纪前都是日本朝鲜半岛、越南等国家官方的书面规范文字。  现代汉字,在中文体系大致分成繁体中文与简体中文两个体系。前者主要用于香港澳门以及台湾,而后者主要用于中国大陆以及新加坡、马来西亚东南亚国家,一般来讲,繁简两个体系的使用者都能在短期内适应并能看懂另一体系的文字,并无太大的沟通障碍。日本和韩国则是另行各自制定了官方的汉字使用规范,而汉字在越南、朝鲜和蒙古国已不再具有官方规范地位。  汉字是一种音节文字,一个字代表语言里的一个音节汉语是以单音节语素为主的,所以汉字正适应于记录汉语。每一个字都有一定的音义。在字形的结构上以一半表意、一半表音的形声字为最多,占汉字的80%以上。汉字本身有一定的严谨的结构规律,自有其完整的系统性。在中国几千年社会发展的进程中汉字对团结汉族人民、发展全民族的经济文化、巩固国家的统一、对外传播文化等都起了极其重大的作用。尽管汉语方言比较分歧,可是用汉字写下的书面语言,南北各地的人都能看得懂,虽然古今语音有很大的变化,但是商周的古文和由秦汉传下来的古书现在仍然能读得懂。这不是其他民族的文字所能相比的。    汉字随着汉语的发展,在不同的历史时期都出现一些新字,文字日益增多,字书所收盈千累万,其中有很多古老的废字和异体字。实际上我们现在经常使用的汉字约在六七千之数,见于古书中流传下来的字也不过一万五千字,所以不用的字就要废除掉。中国文字改革委员会(现名国家语言文字工作委员会)对异体字和印刷用字都做了精细的整理工作,以便于文字的使用趋向现代规范化,汉字对发展中国的文化事业和进行国际文化交流都将起更大的作用。  

汉字的产生

 
秦小篆——琅琊台刻石
秦小篆——琅琊台刻石
 汉字有极悠久的历史,在战国时期曾经传说文字黄帝史官仓颉所造。一说仓颉是古帝王。这种传说只是传说而已,本不足信。因为文字绝对不是一个人所能独创,而是在社会文化发展到一定阶段,需要有文字记事的时候,人们在集体生产劳动过程中经过观察自然的事物,并根据所要表达的思想内容而创制出来的。然后又一步一步使之完善起来,成为记录语言的工具。汉字有繁富的体系,非经过很长的时间是不能创制成功的。    汉字开始产生的时间,还难以确实断定。今天所能见到的最古的文字是商代刻在甲骨上和铸在青铜器上的文字。商代的文字已经是很发达的文字了,最初产生文字的时代必然远在商代以前,那就是夏代或更早于夏代。距今当在四五千年以上,应当在新石器时代。    商王好占卜,凡是祭祀、征伐、田猎、农事等都要占卜,占卜所用的东西主要是龟腹甲,有时也用牛肩胛骨。占卜的文辞就刻在龟甲兽骨上。商代占卜的甲骨是于清光绪二十五年(1899)在河南安阳西北五里小屯村发现的。这个地方是殷商的旧墟。从1928年以后又经过几次发掘,前后所得甲骨在10万片以上,其中绝大部分是商朝后半期盘庚自奄迁于殷以后的东西,约在公元前13~前11世纪,在甲骨上所刻的文字我们称之为甲骨文。甲骨文字的发现使我们对于汉字产生的最初情况有了明确的认识。    甲骨刻辞大部分是贞问之辞,也有一部分是记事的。现在能认识的字有2000多个,还有些字我们还不认识。从已经认识的字来看,很明显汉字是从图画发展而来的。由图画而变为笔画简单的文字,再由笔画简单的文字进一步创制大量的新的文字。    甲骨文已经是很发达的文字了。但在甲骨文里图画式的文字还很多。凡是实物有形可画的大都用图形来表示。例如:以上这些字所表示的都是有形可画的实物。在文字学上称这类字为象形字。这类字虽然接近于图画,但是已经成为一种代表语词的文字,笔画采用线条式,只要能把事物形象的特征表现出来使人一看就能明白是什么字就行了,并不需要像图画那样复杂。  语言里的词并非都有具体的形象可画的。例如数词,在甲骨文里就用线条来表示数目:有些事物没有实际的外形可做为表象,而在甲骨文里也想方设法用图形来表示。    在语言里除事物的名词用图形来表示以外,属于行为动作的词在甲骨文里也利用图画来表示。例如:这些字都是用绘画的形式把两个形体组合在一起的表意文字,在文字学上称为会意字。

汉字的特点

 
颜真卿楷书
颜真卿楷书
 汉字的特点有以下几项:  1.字根组字:以本身即有意义的869个声母及265个形母的象形、指事字为最基本字根部件,称为“字源”,通常为独体字,例如“日”、“月”,可组成各种复合部件(如“明”,可再堆栈组合成汉字盟、萌、曌等字)、以及一般认知的字(“明”本身就是一个字)。《参考汉字的字形与编码第三页》   2.表意:承上,字根本身表义,多个字根合成新义,且空间的配置对字义有影响。(朱邦复先生的字易即是探讨此)   3.相容并蓄:各语言、各领域应用可以六书基本规则,可贴近自身领域、地域所需组出所需要之字。   4.书同文:汉字本身不完全表音,不同方言、语言之间,仍可书同文,以文意、字义来互相了解。   5.独有的文化如对联、书法艺术等。   6.任意排列:因为汉字属表意文字,故汉字可由上而下、由右而左、由左而右排列,不像其他表音文字只能固定一个方向读。

汉字的构造原理

  六书是汉字组字的基本原理,在周礼中就有提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了“六书”这个汉字构造原理:象形、指事、会意、形声、转注、假借。

·象形

  这种造字法是依照物体的外貌特征来描绘出来,所谓“画成其物,随体诘诎”是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成现在的造型。

·指事

  这是指表现抽象事情的方法,所谓“各指其事以为之”是也。如人在其上写作“上”,人在其下写作“下”,有人称为抽象的象形。

·会意

  这个造字法,是将两个字根组合起来,使衍生出新的含意。如“日”和“月”组起来,就是日光加月光变成“明”。“人”字和“言”字合成“信”字,意思就是人过去所言;有信,就是这个人都很遵守自己说过的话。

·形声

  此乃文字内以特定形状(字根)表特有的音。例如:胡,这个字也可为一个声符,结合不同的属性部件,表不同意义如蝴、湖、葫、瑚、醐等,而以同样的发音元素(也有的是完全同音),表达不同的事物。但形声字,也因古今语言音韵变迁,不少古代同类形声字在今天的官话已无共同音素了,如过、蜗。

·转注

  这是用于两个字互为注释,彼此同义而不同形,汉代许慎解释道:“建类一首,同意相受,考、老是也。”,这怎么说呢?此二字,古时“考”可作“长寿”讲,“老”、“考”相通,意义一致,即所谓“老者考也,考者老也”。诗经的《大雅·棫朴》亦云:“周王寿考。”。苏轼的《屈原塔诗》也有“古人谁不死,何必较考折。”一语。其中的““考”皆“老”意,特别注意的是,后代的文字学家针对许慎的前述的定义也作了大量的解释。其中包括“形转说、声转说、义转说”三类,只是这三种说法有人认为不够全面,当代古文字家林沄先生也有解释说“转注”就是一个形体(字根)记录两个读音和意义完全不同的两个词。例如“帚和婦”与甲骨文中的“母和女”等等。

·假借

  此法简言之,借用一字,去表达别的事物。一般来说,是有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。例如:“又”,本来是指右手(最早可见于甲骨文),但后来被假借当作别的意思。闻,本意是用耳朵听东西的意思。例如《大学?第七章》中有“视而不见,听而不闻,食而不知其味”,但后来被假借成嗅觉的动词(不过也有人认为这是错用)。   (其中“转注”“假借”两项的意义,至今争讼不休,尚无令人满意的说法。)  总结以上古代六书,前两项,“造字法”也;中两项,“组字法”也;后两项,“用字法”也。这六个原理,是古代文字学学者归纳出来的字学理论。其所含汉字构成法则,是长期演化而成的,不是任何一个人独创的。

读音

  汉字是多种语言的共同书写体系,每个字代表一个音节或数个音节(视语言而定)。此外念法上在日语以及各汉语中,读音有“音读”和“训读”之分。

·汉语

  古代汉语,曾存在一个汉字多个音节的情况,从唐朝开始减为一字一音节。现代标准汉语中,皆由一个声母、一个韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有一字多音的情形,称为多音字或破音字。这一情况与各种汉语方言是普遍一致。而其他少数民族借汉字表音时,也有存在一字多音节的情况。

·朝鲜语

  汉字大致为一字一种发音,存在训读,但现今已不常用。

·日语

  在汉字的发音上,有着多音节,如国(こく)、肉(にく),也有单音节如空気(空气)的気(き,Ki),此外有许多字因训读、音读,在不同状况,发不同音的情形。  除了日本以外,其他汉字使用地区仍有少数字使用多音节字,如“浬”(海里)、“嗧”(加侖)、“瓩”(千瓦)、吋(英寸)、哩(英里)等。台湾官方机构或民间均普遍使用,在大陆地区由于官方废除已不使用,但一般人也理解其意思。

注音

  最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如“埻,射臬也,读若准”。 直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。  以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以发挥注音的作用,例如“襪音韈”等。  魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以透过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。  近代以来,又发展出了仿汉字形式的注音符号及众多拉丁化拼音方式。注音符号一直都是台湾官方教学的一部分,学生在学习汉字前先要求必需掌握。而目前中国大陆最为广泛使用的是汉语拼音。  由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度,必须进行专门的汉语音韵学才能推测它们在上古汉语和中古汉语的发音。例如“庞”从“龙”而得声,但今日北京话前者读“páng”(ㄆㄤˊ),后者为“lóng”(ㄌㄨㄥˊ)。  潘悟云和法国学者沙加尔认为:汉朝之前,某些汉字可能代表着两个音节以上的发音,即这些字具有次要音节和主要音节。详见上古汉语。   

汉字形体的演变

   现在我们日常手写的规规矩矩的汉字字体称为楷书,或称为正楷。楷书是从公元3~4世纪魏晋时代开始形成的一种字体。魏晋以前,从殷商到秦汉,汉字的写法有过很大的变迁。汉字形体的变迁主要可以分为3个大的阶段:  

·商周的古文字到秦代的小篆

   商代的文字见之于卜辞和铜器铭文的已经不是图画,而是一种笔画简单的记录语言的符号了。但是很多文字在表形表意上还离图画的形式不太远。例如:这里隹、齿二字都是象形字,興象四支手共举,星象人企立远望,竝象二人竝立,逐象人逐豕,男象以耒耜在田耕作。  到了周代,铜器上的文字在写法上跟甲骨文还很接近,只是在笔画上或有改变。  到了春秋战国之间,书写工具有了竹简和丝帛,文字可以用笔来写,不用契刻和陶铸了,因而使用日广。这时,列国的文字各有地方特色,不完全一致。秦人承继了西周的文字,笔画趋于繁复, 如秦刻石(通称石鼓),即所谓大篆;而东方诸国的文字又趋于简易,改变比较多。秦灭六国以后,建立了统一的王朝,李斯倡议进行统一文字,罢其不与秦文合者,于是有小篆。小篆对大篆而言,形体比大篆简单,结构比金文整齐,写法有一定的规范,而且同从一个偏旁的字,偏旁的写法和地位也都有一定,因而文字走向系统化。例如从女旁的字在金文里大都写在右边,有时写在左边,在小篆里则一律改写在左边。从言字边的字,在金文里有的写在左边,有的写在右边,如"许"字、"谏"字,在小篆里一律也改写在左边。又如在金文里从彳又从止的字,彳写在左边,止写在右下边,在小篆里就一律合写在左边,作兠。秦朝统一文字在汉字发展的历史进程中是一大进步。小篆是由商周文字发展而成的。小篆以前是一个大的阶段。  

·秦汉的隶书

   隶书是由简略的篆书逐渐发展而成的。战国时代的兵器文字已趋简捷,相传秦代开始有了与篆书接近的隶书,隶书在民间使用。到了汉代,隶书不断发展,由接近篆书而改变篆书,成为日常应用的字体了。隶书不同于篆书的地方很多。主要表现在3方面:①笔画简化。如言字边、辵字边,阜字边之类。②结体改变。如晋字、秦字、曹字、春字的上边一部分都不同于篆书。③变篆书的圆笔为直笔或方笔。如月、木、文、六、女、大、甲、有、以等都是。    隶书的出现是汉字由繁复变简单的一大发展。隶书解散了篆体,使文字完全脱掉了图画的性质,成为便于书写的符号,文字也就走向大众化的方向,在社会生活中发挥着更大的作用。从东汉时起;纸已经大量生产,书写文字也更加方便,因此隶书的笔势带有波折,在体势上与篆书大不相同,东汉时期有不少的书法家善于楷隶。    在汉代隶书开始发展的时期,又有了草书。草书是草率的隶书,汉魏时通行的是章草。汉末又有了由楷隶简化的行书, 东晋时又有了今草。足见文字为便于实用,不断有新体出现。但草书只求整个形体与隶书相似,不容易认,行书又偏于草率,所以楷法为人所重。  

·魏晋以后的正楷

 "楷"是有规矩的意思。从汉代有楷隶以后,到魏晋时代就有了正书。正书也称为真书。这种字体比楷隶又有了不同。波势减少,笔画也趋于平易圆转。所以从唐代以后一直成为手写的字体。    总之,汉字的形体演变从商周古文字到小篆是一期,由小篆发展为隶书是一期,由隶书发展为正书又是一期。总的趋向是由繁难变为简易。文字在使用上尽量求其易写,不再斤斤于表意了。

汉字的结构

   汉字自古至今都是方块式的文字,有的是独体字,有的是合体字。独体字来源于图画式的象形字和指事字,合体字是以独体字为基础而构成的,包括会意字和形声字。在汉字总体内,独体字很少,合体字占90%以上,而合体字中又以形声字占绝对多数。    合体字是把两个已有的字组合在一起,组合的形式主要有两种:一种是左右排列的形式,另一种是上下组合的形式。形声字的结构是一半形旁,一半声旁,形旁表意,声旁表音。形旁和声旁所摆的位置则有6种不同的方式:    ①左形右声。如:组、红、语、提、伍、校、忙、江、城、附、唱、鲤、舫、狗、炬、神、迷、距。  ②左声右形。如:放、和、鸭、视、收、颈、翅、部、勃、额、剂、救、谿、钦、敲。  ③上形下声。如:简、花、室、草、定、覆、岌、麋、冕、岑、星、露。  ④上声下形。如:吾、常、裂、帛、含、盟、婆、斧、忽、摩、烹、费、翡、恭、贡、瞽、驾、忌、密、努。  ⑤外形内声。如:匡、衷、痕、病、废、闺、弼、街、圃、匐。  ⑥外声内形。如:闻、闷、辨、问、赢。这些不同的写法,最初是为了书写的方便和形式的美观,以致形旁跟声旁的位置有不同,后来同从一个形旁的字就大都有一定的格式。例如:" 亻、口、彳、氵、火、木、扌、土、犭、礻、糸、禾、米、虫、酉、足、玉、巾、衤、日"等形旁一般都在左边:"力、攴、殳、见、刂、戈、页、欠、瓦、鸟、斤"等形旁都在右边;"宀、穴、艹、、儧"等形旁都在上边;"皿、子、心、灬(火)、黾"等形旁都在下边。这些不同的形旁在字形结构中所处的位置看起来仿佛复杂,实际上具有一定的规律,对认字和书写两方面都有很大的方便。这种结构的形式从秦汉时期的篆书发展为隶书就已经固定下来了。书写的笔顺也必然要从左到右,从上到下,从外到内不能错乱。

汉字的数量

  汉字由于是开放集合,数量并没有准确数字,日常所使用的汉字约为几千字。汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。  近代编集的字典收字量更高,如清朝的《康熙字典》收字47035个;台湾的《中文大字典》收字49905个;大陆的《汉语大字典》收字54678;最新的《中华字海》收字85568个,包含了《汉语大字典》、《中文大字典》、《康熙字典》和《说文解字》的所有收字;日本的《大汉和字典》收字48902个,另有附录1062个。21世纪已出版的字数最多的是《日本今昔文字镜》,收字15万个。  本世纪所新创的,还有第一批简化字后跟第二批的“二简字”,其中也包括社会上不少人造的文字,不过二简字已被大陆官方废除,只有少数字在社会上流行,但现时并没有于计算机编码中被收录。  在汉字计算机编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(4.0)共收录可考证之正简、日、韩语汉字共76,067个,在户政系统等官方机构普遍使用。台湾及港澳地区民间通用的大五码收录繁体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB 2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。  初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。过去在汉字组成基本因子(前述字根部件)研究与教学上落后,造成学习上必须逐字学习难以举一反三,汉字数量越多学习越困难,组建新字的风气日趋保守,也没有相应的资讯处理技术,于是有许多单一的汉语意义是以词表示,例如常见的双字词,所以近代书写的发展多朝向造新词而非造新字。  

汉字与汉语的关系

   汉字是一种表意注音的音节文字,每一个汉字代表语言里的一个音节。在上古时代汉语有单音节词,也有双音节词,而以单音节词为主,一个汉字就是一个词。自汉代以后,双音节词逐渐加多,一直发展到现代,汉语就变为以双音节词和多音节词为主了。这样,语言里的词大多数需要用两个或两个以上的字来表示,字跟词的数目就不能相应。因此,一个字不一定就是一个词,它可能只是构成一个词的词素(或称语素),它只代表整个词的一个音节。    汉字虽然是音节文字,但是汉字本身不都能确切地表示语音。汉字中的象形字和表意字,如山、水、首、目、大、文、京、方、走之类,都是不表音的字。汉字的形声字,一半是形,一半是声,表声的部分跟字音相同的固然不少,可是也有很多不相同的。例如词、资、堂、杜、汤、荡、欣、汗、都、循之类,声旁跟字音只是韵母相同而声母不同;其他如涤、灑、仍、特、雕、凝之类,声旁跟字音就全不相同,很难看出应该怎样读。声旁也就失去了表音的作用。    声旁跟字音不相应,主要有两种原因。一种原因是古今音异,古代原来音是相同的,由于时代的变迁,语音有了改变,读音也就不一样了。如铺从甫声,铺、甫古音声同;结从吉声,结、吉古音韵同,今音就不一样。另一种原因是前人制字,声旁与字音本不相同,只取其相近。例如浩从告声,聚从取声,暖从爰声,蔡从祭声,似从以声,枢从区声,喘从耑声之类都是。因此汉字中形声字尽管占大多数,而字形上所标识的声旁跟语言并不都相协合,表音的作用也就不显著了。汉字本身既不能明确表音,每个字就只能按照字典所注的读音来读了。    汉语的语词极为丰富,古代字少,一字多义,或一个字代表几个词,连带着都有一字多音的现象。例如"说"有yuè、shuō、shuì三个音,表有喜悦,说话,游说三个意思。喜悦的意思是一个词,说话、游说两者又各是一个词。"卒"有zú、cù两个音,zú有兵卒的意思,又有终了,死亡的意思;cù是猝然的意思。兵卒是一个词,终了,死亡是一个词,猝然又是一个词。罷字音pí,又音bà,pí是疲敝的意思,bà是停歇的意思,疲敝是一个词,停歇又是一个词。又如行字有xíng、háng两个音,xíng是行走,háng是行列。遗字有yí、 wèi两个音,有遗留、馈赠两个意思。这些都是一字多义。要分辨意义和读音只有凭仗上下语句来断定了。这是文字与语音不相应的又一种情况。    汉字在记录语言时,每一个字都有一定的约定俗成的用法。汉字当中同音字也特别多,除古代已经通行的同音假借字一直沿用的以外,其他是不能随便写的。写错了就称为写"白字",例如 shi这样一个音,见于下列一些词里:城市、表示、战士、方式、考试、教室、形势、解释、装饰、合适、事情、世界。这里每一个词都有一定的写法,其中每个字都是组词的一部分,因为它又联系着许多相关的词,自成一组,所以不能写错。例如"市",既有"城市"一词,又有"都市"、"市场"、"市井"、"市价"一些词。因此,汉语的语音系统虽不复杂,而文字却成千累万。一个字作为一个词素构成一个词,它本身承担着一定的意义,每个词怎么写是受字义和词义所制约的,所以不能错乱。    汉字在记录语言当中也出现不少古今字和异体字,例如洒(灑)、兒(貌)、罷(疲)、辟(闢) 、莫(暮)是古今字;泄(洩)、窥(闚)、迹(跡)、懒()、辖(鎋)等是异体字。一个词也可以写成几个形体。如"箇"、"個"、"个";"泛"、"汎"、"氾"。为了使文字规范化,许多不必要的异体字现在就都不用了。  

汉字的增繁与简化

   汉字在商代除了有象形字、表意字以外,还有形声字和假借字。象形、表意主形,形声、假借主音。为配合语言,表音是汉字发展的必然趋势,所以从周代以后形声字成为造字的主体。语言随着社会政治、经济、文化、科学的发展,语词不断增多,文字也随之日益增加,形成一个繁富的文字体系。    秦代的《仓颉》、《博学》、《爰历》三篇有3300字,汉代扬雄作《训纂篇》,有5340字,到许慎作《说文解字》就有9353字了(不算"重文")。晋宋以后,文字又日渐增繁。据唐代封演《闻见记·文字篇》所记晋吕忱作《字林》,有12824字,后魏杨承庆作《字统》,有13734字,梁顾野王作《玉篇》有16917字,隋陆法言作《切韵》,有12158字,都达一万数千字。唐代孙强增字本《玉篇》有 22561字。到宋代司马光修《类篇》就多至31319字,到清代《康熙字典》就有47000多字了。    字书中文字数量的增多是由不同时期所产生的文字累积而成的。各时期都有不少新的语词出现,就要造许多形声字,字数自然增加。并且在文字使用中也出现很多不同情况的异体字和孳生的字。不同形体的字有以下几种:    ①相传下来的古文奇字。如《说文解字》所收:"儿"是古文奇字"人"字," 无"是奇字"無"字,"礼"(禮)、"眎"(视、)、""(多)、"愳"(懼)等字是古文,"雱"(旁)、"墜"(地)是籀文。  ②字的异体。如鷄雞, 谲憰、逴趠、踣、呧诋、谿溪、偪逼、脣唇等字形旁不同,枹桴、讻、胑肢、觵觥、悑怖、抽、澂澄、磨等字声旁不同,但音义是相同的。这种异体字特别多。  ③古今字。同是一个字而古今的写法不同。今字或就古字增加偏旁,或另成一字。如"从"作"從",""作"派","寽"作"捋",""作"敝",""作"淵",""作"煮",""作"煼","鼃"作"蛙","鼄"作"蛛","鬴"作"釜","羴"作"膻",""作"涎","汓"作"泅"。这些字音义都一样。  ④俗体字。民间流行的手写体字很多。如:"煞"(殺)、"柒"(漆)、"吊"(弔)、"头"(頭)、" 楞"(棱)、""(辩)、""(憂)、"泪"(淚)等都是。以上这种异体字在字书里占有很大的比重。    其次,文字在使用中还产生一些增添偏旁的字。有些是属于俗体字一类,如"棟樑"的"樑","水菓"的"菓"、"笤箒"的"箒",徒增赘疣,自当会废弃不用。但有些因为原来的字作为另外一个词来用,与原来造字的意思毫无关系,于是又就原字加偏旁代表原字的意思,这在文字学上称为后起本字。如"莫"的本义为日暮,因"莫"另作"無"的意思来用,所以又造"暮"字。"暴"的本义为晒,因"暴"作"暴虐"的意义来用,所以又造"曝"字。"须"的本义为胡须,因"须"用为"必须"字,所以又造" 鬚"字。"韋"的本义为圍,因"韋"用为"皮革"字,所以又造"圍"字。"然"原义为燃烧,因用为"如此"的意思,所以又造"燃"字。又有些字由于义有引申,原义不用,而通常作引申义讲,于是加偏旁又为原义另造一字。如"监"字原义是人俯身向水鑑中看自己,引申有监察、监督等意义,原义不用,因而又造"巶"字。"益"字原义是水从皿中溢出,引申有增加、有利等意义,原义不用,所以另造"溢"字。"原"字原义是水源,引申有原始、本来等意义,原义不用,因而又造"源"字。以上这些都是后起本字。    另外在汉字发展过程中还产生一些义近音同或音近的分别字。如"輓"为輓车,但属于一般牵引的意思就别作"挽"。"版"为版图、版筑的"版",木板、铁板都别作"板"。"称"为称举、称量轻重,可是称量轻重的器具却另造"秤"字,音 chènɡ。"受"为接受,受与别人就另作"授"。"知"为知道、明白的意思,聪明有知识就别作"智",音zhì。这些都是分别字。    从这些方面来看,汉字在历史上之所以日趋繁富,一方面由于不同时代有新的语词增加,须要创造新字与之相适应;另一方面由于产生了大量的异体字、俗体字和用增益偏旁的方法以表现新的意义的孳生字;因此由汉代以后字书的字日益加多。实际上日常使用的字不过六七千而已。    汉字作为记录语言的符号,分歧旁出的异体字就要废除掉。选择的标准就是要求简易便用,而且要符合约定俗成的规范。因此废去古字而用今字,不取繁复的异体字,而取简便易写的字。由繁复趋向简化,这是汉字形体发展的规律。从商代到近代,一直是如此。由篆书变隶书就是一次大改革。例如泰、秦、春、奉几个字的上头,篆书都不相同,可是隶书就都变得一样了。又如心字在字的左边,楷书都作忄,火字在字的下边,楷书都写作灬,都是有意的简化。至于各时代受行书、草书的影响出现的简体字更是指不胜屈。如斷作断,牀作床 ,莊作庄,潛作潜,條作条,備作备,憐作怜,召作之类,从隋唐时代以来就已在民间流行了,所以有条理的、符合汉字的形体结构方式和表音作用的简体字还是有利于识别和书写的。但不能违背约定俗成的原则。随意简化,师心自用,就失去作为交流思想工具的作用。中国文字改革委员会在整理异体字和制定简化字方面做了大量工作,对汉字的规范化起了重大作用。

汉字文化

·衍生字

  汉字书写体系也是世界上最主要的基础文字之一,在汉字的影响下,还产生过契丹文、女真文、西夏文、古壮字(方块壮字)、古白字(方块白字)、古布依字(方块布依字)、字喃等文字。但它们都因各种原因而消亡,而汉语中的女书,如今也无几人能识。日语的假名(仮名)在创制时也大量受到汉字字形的影响。  此外如蒙古文、满文、锡伯文等也是在汉字书写方式和书写工具的影响下,将从右向左书写的源自察合台文的书写方式改为从上到下书写,文字的结构也随之有所变化。

·汉字民俗

  中国许多民俗都与汉字有关,例如:  射虎:就是猜灯谜,也叫打灯虎,与汉字有着密切关系。旧时的射虎大致可以分成两类,一类是文人射虎,谜面深奥谜格复杂多样谜底多为四书五经中的原句;一类是市井灯谜,谜面谜底均很通俗。射虎是元宵节的一项重要活动。   合文:中国民间常将一些带有吉祥含义的短语合写为一个字,以祈求吉祥,常见的合文如“招財進寶”、“囍”(双喜)、“黃金萬両”等。   谐音字:华人喜欢利用汉字的同音特点用谐音字取吉祥之意,比如蝙蝠的“蝠”谐音为幸福的“福”,于是庙宇中常见石柱刻有蝙辐。而走兽的“兽”亦谐音为“寿”。   九九消寒图:中国北方地区的一项民俗在每年数九的季节写下“庭前垂柳珍重待春風”九个双钩字,这九个字每字九划,从冬至开始每天根据天气为一个笔画填充颜色,到数九结束完成全图。   花鸟字:一些民间艺人用一些花卉和禽鸟的图案拼写成汉字,近看细节是一些花鸟画,远看整体却是一幅字,这种字画结合的艺术形式被称作花鸟字,是一种多彩花鸟虫鱼组合书法。在中国,只有在春节庙会中,和一些节日集会中才可以看到。花鸟字在英美等西方国家也成为一种街头艺术。早期的鸟字画大多写的是一些吉祥话语,以祈求吉利,现在在庙会见到的鸟字画则以书写顾客的姓名为主,购买者的目的也由祈求吉祥逐渐转变为猎奇。

·汉字艺术

  汉字独特优美的结构,书写的主要工具——毛笔有多样的表现力,因而产生了中文独特的造型艺术——书法。而篆刻是和书法相关的艺术,用刀在石材上雕刻出篆字作为印章。

汉字文化圈

  汉字是承载文化的重要工具,目前留有大量用汉字书写的典籍。不同的方言、甚至语言都使用汉字作为共同书写体系。在古代日本、朝鲜和越南,汉字都曾是该国正式文书的唯一系统,因而汉字在历史上对文明的传播分享有着重要作用。  由于汉字和发声的联系不是非常密切,比较容易被其他民族所借用,如日本、朝鲜半岛和越南都曾经有过不会说汉语,单纯用汉字书写的历史阶段。汉字的这个特点对于维系一个文化圈—一个充满各种互相不能交流的方言群体的民族——发挥了主要的作用。  汉字对周边国家的文化产生过巨大的影响,形成了一个共同使用汉字的汉字文化圈,在日本、越南和朝鲜半岛,汉字被融合成它们语言的文字“漢字(かんじ)”、“漢字(한자)”、“漢字(hán tự)”。直到现在,日语中仍然把汉字认为是书写体系的一部分。在朝鲜和越南,已经完全不再使用汉字;在韩国,汉字的使用在近几十年来越来越少;但是由于朝鲜语/韩语中使用了大量的汉字词汇,并且重音现象严重,所以在需要严谨表达的场合时仍然会使用汉字。虽然在通常情况下人名、公司机构名称等均使用韩文书写,不过大多数的人名、公司机构均有其对应的汉字名称。

·日本

  汉字于公元3世纪经朝鲜半岛辗转传入日本。二战后日本开始限制汉字的数量和使用,颁布了《当用汉字表》及《人名用字表》等,其中简化了部分汉字(日本新字体),不过文学创作使用的汉字,并不在限制之列。日本除从中文中传入的汉字外,还创造和简化了一些汉字,如“辻”(十字路口)、“栃”、“峠”(山路的最高点)和“広”(广)、“転”(转)、“働”(劳动)等。详见:日文汉字。

·朝鲜半岛

  公元3世纪左右,汉字传入了朝鲜半岛,朝鲜语/韩语曾经完全使用汉字来书写。相传薛聪在当时发明了吏读,把朝鲜语用同音或同义的汉字来表示。例如:“乙”字被用来表示韩语中的后缀“-l”。由于有不少发音都没有对应的汉字,所以朝鲜半岛的人民又运用组字法,把两个或多个汉字合组成为一个新的吏读字。相传后来的契丹文就是受到吏读字的影响。此外尚有乡札、口诀等以汉字表记朝鲜语的方法。1444年,朝鲜世宗大王颁布《训民正音》,发明了谚文与汉字一起使用,但当中有不少部件仍然有昔日吏读字的痕迹。现在的大韩民国虽禁止在正式场合下使用汉字,并停止了在中小学中教授汉字(不过从2011年开始,大韩民国的李明博政府已经决定将汉字重新纳入中小学的课程里),不过汉字在民间仍在继续使用,且可以按照个人习惯书写,但是现在能写一笔漂亮汉字的韩国人越来越少。朝鲜民主主义人民共和国于1948年废除了汉字,仅保留了十几个汉字。详见:韩文汉字。

·越南

  公元1世纪汉字便传入了越南,越南语也曾完全使用汉字做为书写用文字,并在汉字的基础上创造了喃字,但是由于书写不便,汉字仍是主要的书写方式。1945年越南民主共和国成立后废除了汉字,使用了称为“国语字”的拼音文字。现在的越南文已经看不出汉字的痕迹了。