汉字的规范化


  汉字规范化,就是制定有关标准,对汉字的数量、形体、读音和排列顺序等等方面进行规范,以利于汉字的使用,具体地讲就是对汉字进行“四定”。
  1.定量
  定量是指规定现代汉语用字的数量,以便汉字学习和运用,便于汉字信息处理。
  

历代字书收字数目一览表

时间

编著者

书名

字数(个)

东汉(121 年)

许慎

说文解字

9 353(小篆)(不含重文1 163)

南朝· 梁(534 年)

顾野王

玉篇

16 917(唐宋后改为22 726)

宋(1008 年)

陈彭年等

广韵

26 194

明(1615 年)

梅膺祚

字汇

33 179

清(1716 年)

张玉书等

康熙字典

47 043

1915 年

陆费逵等

中华大字典

48 000 多

1968 年

该辞典编委会

中文大辞典

49 905

1990 年

徐中舒等

汉语大字典

54 678

1994 年

冷玉龙等

中华字海

85 568


  汉字的累积数量与实用字量相差悬殊。

  从静态上看,从甲骨文到现代汉字,总字数不断增加。历代字书所收字数是在逐步增多的。如果把大量异体字排除,实际字数不会有这么多。据郑林曦《精简汉字字数的理论和实践》统计,《康熙字典》中收异体字9329组,共两万多字,占该字典所收字数的40%(中国社会科学出版社1982年版,第3页)。
  从动态上看,实际使用的汉字在不同的时代基本上稳定在一定的数量上。从古今汉字的使用情况看,动态系统中汉字的实用字量大约在6000个。这个数字一直是比较稳定的。
  第一,通用字。通用汉字的研究从20世纪50年代就开始了。1955年,文改会编印了《通用字表(初稿)》,收字5709个;修订后于1965年公布了《印刷通用汉字字形表》,收字6196个。这是通用汉字研究的初步成果。1981年,国家标准局发布 《GB231280信息交换用汉字编码字符集》(基本集),收字6763个。1988年,国家新闻出版署、国家语委发布《现代汉语通用字表》,收字7000个,这可以看作现代汉语通用的汉字。
  第二,常用字。国家语言文字工作委员会和国家教育委员会于1988年发布了《现代汉语常用字表》,其中常用字2500个,次常用字1000个。对340万字语料的检测结果是:2500个常用字覆盖率达97.97%,1000个次常用字覆盖率达1.51%,3500个字合计覆盖率达99.48%,因此,《现代汉语常用字表》的字数是符合实际的。
  在字量上加以规定,可以限制死字、废字、罕用字的复活使用,有利于减轻汉字学习的负担,提高汉字应用的效率。

  2.定形
  定形,是指规定现代汉语用字的标准字形。
  在新中国成立后的汉字整理过程中,公布了《第一批异体字整理表》、《简化字总表》、《印刷通用汉字字形表》、《现代汉语通用字表》等,为汉字的定形工作打下了较好的基础。
  为了适应定形的要求,今后对简化汉字笔画的工作,要采取审慎的态度。为保持字形的稳定性,在一定时期内不应该对汉字进行笔画的简化。在将来需要对某些汉字的笔画进行简化时,要注意采用恰当的方式。
  汉字定形的任务:①淘汰异体字。②整理异形词。异形词又叫异体词,是读音和意义完全相同、只有所使用的汉字字形不同的词。③统一新旧字形。④规定电脑字形点阵标准。电脑字形点阵标准是指中文信息处理所用的汉字字形点阵库的国家标准。

  3.定音
  定音,是指规定现代汉语用字的标准读音。
  现代汉语用字的读音,有不确定的情况。例如,过去“庇”读bì,又读pì;“殊”读shū,又读chū。普通话审音委员会于1957年、1959年、1962年先后发表了《普通话异读词审音表初稿》, 并于1963年辑录成《普通话异读词三次审音总表初稿》。1982年重建了普通话审音委员会,对《初稿》进行修订;1985年,国家语委、国家教委、广播电视部发布了《普通话异读词审音表》。这样,现代汉语异读词的读音就有了规范化的标准。例如“庇”只读bì,“殊”只读shū,其余的读音废除。国家语委、国家教委、广播电视部在《关于<普通话异读词审音表>的通知》中指出 :“这次修订以符合普通话语音发展规律为原则,以便利广大群众学习普通话为着眼点,采取约定俗成、承认现实的态度。对《初稿》原订读音的改动,力求慎重。”
  4.定序
  定序是指确定现代汉语用字的排列顺序,做到字有定序。
  首先需要确定汉字的排序方式,然后才能确定每个字的次序。汉字的排序法主要有义序法、形序法、音序法三种。
  形序法又有笔画法、部首法、号码法等三种。号码法中还有四角号码、三角号码、高低笔号等多种。此外,还有兼用不同方法进行汉字排序的,如先部首后笔画、先笔画后部首等。
  ①义序法
  优点:可以从意义的角度成系统地查阅单字。
  缺点:意义的类聚关系没有一定的标准;同义类内部的顺序排列没有客观的依据;不适合字数较多的工具书。
  ②笔画法
  优点:只要会数笔画数,熟悉笔画笔形的先后次序,掌握了部首就可以进行汉字的检索。
  缺点:有些字或者部件的笔顺不一致,影响正确排序;笔画数和笔顺都相同的字的排序存在二义性。
  ③部首法
  优点:部首法历史悠久、使用广泛;基本适应汉字的结构特点,多数汉字与部首具有意义上的联系;基本符合人们从形查字的习惯和要求,便于查检不会读音的生字。
  缺点:部首的位置不固定,有些字难以确定部首;同笔画的部首字及同部首内的字,排列次序存在二义性。
  ④号码法
  优点:可以直接根据笔形编码查字,避免了数笔画的繁琐;汉字代码采用阿拉伯数字,汉字排列成自然数列,查找起来自然方便。

  缺点:规则比较复杂,初学者不易掌握;重码字较多,需要增加区别码。
  ⑤音序法
  优点:排检速度快,准确率高;不受简、繁字体的影响;符合国际上大都按音序检索的习惯。
  缺点:读不出或读不准音的字、词可以排序,但是难以查找;同音字的顺序存在分歧;不适合用来编排收字较多的字典、词典。