Abstract: The Chinese character is a scientific character. After extensive studying of the frequency of utilization of the Chinese characters, we understand the rule of the use and identification of the Chinese characters and the rule of the character-formation, thus know the rules of character-formation of 500 basic Chinese characters. Summing up all the rules, we can find and form the new idea and concept of learning   Chinese.

This article elaborates all the views comprehensively, such as how to ascertain 500 basic Chinese characters, how to make a digital and comparative analysis of the frequency of utilization of 500 basic Chinese characters and explain the importance of learning 500 basic Chinese characters.

This article also analyses the relationship between the Chinese characters and “words”, between learning 500 basic Chinese characters and 3000 often-used Chinese characters and 3000 basic words and make a digital analysis of all of those relationships. This article also shows the relationship between 3000 basic Chinese words and 3000 basic essential English words.

The 500 basic Chinese characters apply various teaching methods. This article makes simple introduction and analysis of every study method of the Chinese characters and draws a scientific conclusion: “let’s forget the several-thousand-year history of difficult learning, recalling, understanding and mastering of the Chinese characters.”

汉字是科学的文字。为什么说它是科学的文字呢?经过我们对汉字使用频度的大规模的调查,使我们了解了它的使用和认读规律;经过我们对汉字构字规律的研究和整理,使我们了解了它的构字规律,得出了500个基本汉字的构字规律。我们对汉字使用规律和认读规律与构字规律的了解,结合改革开放以来所涌现出来的各种汉字教学法,把这些教学法同学好500个基本汉字再结合起来,我们必然找出一条学习汉字的最佳的途径,使汉字教学与学习更加快速科学地向前发展。

《500个基本汉字是怎样产生确定的?》

“500个基本汉字反映了汉字构字基本规律。汉字的构字存在着规律。汉字多是由基本字加上偏旁、部件和笔画组成新字。如果我们把这些偏旁、部件和笔画去掉,还原基本字,加以归纳整理,便可得出基本字。这些基本字有多少呢?经过归纳整理,可以初步确定它有500个。我们认识这个汉字构字规律,这对汉语教学将起着很大的作用,我们要使集中识字系统化,使汉语汉字教学科学化、系统化,提高汉字和汉语教学的速度和质量。

汉字是象形文字,一般由偏旁构成的汉字,左边是偏旁表意,右边是形声字表示字音和意义,它是独体字,也是基本字,这些基本字可以组成不同的偏旁与多个偏旁和部件构成另外的汉字,不管字形多么复杂,总有由一个基本字和部件构成。在被构成的新字中,产生新的字义,或相近的字义。这也是为了表达更接近字义和客观事物的意境,产生的新汉字。这也说明了汉字的变化功能和作用,不同于拼音文字的地方。汉字适应性很强,它的构词能力也很强,同样一个汉字,在不同的构词中,在不同的句子中,产生不同的意义变化和功能作用。”只要我们认识汉字的构字规律,就可以找出科学地认读汉字的方法,学好500个基本汉字就为科学地认读汉字,提供了一个科学的认读汉字的方法。

学好500个基本字,是学好3000个常用的、必读的字和其它非常用的古汉字的基础。只有先学好500个基本字,再学习3000个汉字就比较容易了,学习500个基本字,可以分批学也可以集中学,利用各种汉字教学法进行学习,可以采用各种汉字学习法,不管采取何种识字教学法,目的都是为了学好3000个常用字和其它的汉字,达到认读汉字,书写汉字,阅读书报的目的。

确定500个基本汉字,不是随意确定的,它是经过了科学地归纳和整理确定的。尽管确定500个基本字可能有不够确切的地方,在某种情况下,有不太合理、不太符合构字逻辑的地方,但总的情况是符合客观构字规律的。它基本上反映了汉字构字的客观规律。有的汉字构字规律很清晰合理,个别的汉字构字规律不符合构字逻辑,必须采取特殊的归纳方法,说明其特殊性,总的来说,它反映了汉字构字规律。这是学习汉字的新概念。

《汉字频度统计——速成识读优选表》(注)中,我们按照汉字频度把汉字每500个分成一级,比如一级的500字,它已占汉字频度的近80%,这500个汉字不是基本字,它是最常用字,它也包括了一大部分基本字。这充分说明,学会了500个最常用字,近80%的常用字基本认识,用所学的常用字和基本字,按汉字构字规律,再学习其它的汉字就比较容易了。

500基本汉字同3000常用字分级对比表

级别

常用字字数

基本字字数

综合累积频度% 占500基本字频度%

占3000常用字频度%

独体字

合体字

一级

 500

212

77.42

42.4

 7.07

190

22

二级

1000

105

90.57

21

3.5

80

25

三级

1500

 73

96.00

14.6

2.4

44

29

四级

2000

 44

98.00

8.8

1.4

25

19

五级

2500

 32

99.10

6.4

 1.06

17

15

六级

3000

 18

99.6

3.6

0.6

13

 5

总计

3000

484

 

96.8

16.03

369

115

①根据《汉字频度表》统计。②③在500个基本汉字中,有独体字369个,合体字115个,共有484个,有6个字是3000常用字以外的字。

从以上用汉字频度结合认读汉字进行分析,学习和掌握基本字和常用字非常重要,这500个字已占到汉字频度的80%,那20%的非最常用字,有3000个汉字以上,这些字虽然频度不高,但也必须学会,不学会这些字,你就不能准确的看懂文章。除了这3000个常用字以外的汉字,还有很多非常用汉字,为了提高自己的认读汉字的水平,还要继续地学习,这是提高的问题了。中国人不管你的认读汉字水平多高,总有不认识的汉字。这个问题不是本文探讨的问题。汉字的使用幅度和认读度是两个问题,不能混谈。总之,认读汉字越多越好。但我们学习汉字不能平均用力,要把重点学会基本字和常用字上。初学者真正学会掌握三千个常用字不下苦功也是不行的。

《汉语水平词汇与汉字等级大纲》说:“3000常用词这个界标是多数人经过几十年教学与多种语料反复统计、实践后得出的第一个词汇量共识。”根据较大规模的一般语料的词频统计资料,3000常用词的覆盖面为86%。

三千个常用字和三千个常用词,从汉字的频度和词的覆盖率来看,基本上相吻合的,反映了汉字的使用规律,因为一个汉字有的是“字”,同时它也是“词”。作为一个汉字它有字义,作为一个词它有词义,这是它优于拼音文字的特点和特色。作为词它扩展了字义,又产生了新义,从字义上讲,它包含了很多的内涵。这充分体现了汉字的优越性和先进性。

以英语为例加以说明。最常用的单词,即使用频率高的1000个单词平均占34部著作中词汇量的80.5%。如果你掌握了2000个单词,就可以读懂书中86%的内容;掌握了3000个单词,就可以读懂90%的内容;要是你掌握了5000个单词,就可以读懂93.5%的内容。因此学习英语如果成功地记住了5000个单词,那么根据上述百分比,一页书中如有300个单词,其中你认识的单词有281个,不懂的单词有19个。而这剩下的单词中,有的可用对照或相似等方法理解它,有的是专有名词,有的是国际语,稍加思考或许大致可以推知它的含义。对实在不敢妄猜的词,就查字典。(华龙宝:《快速记忆法》第20页,华东理工大学出版社2000年出版。)

从以上对照可以得出这样的结论,汉语的用字量同英语的用词量的百分比所反映出来的规律,它们之间的用字和用词量大体基本上是相仿的,这充分地反映了语言的共同规律性。学习英语的5000个单词,学习英语字母的排列组合和它们发音规则;学习3000个汉字的笔画组合、构字规律,理解和掌握汉字的发音和四声韵调规律、同音字和同音词的规律,得要下很大的功夫。

500个基本汉字适用于各种教学法的学习。

在《语文教法词典》所罗列的9类(1、识字教学的形式;2、识字教学的方法;3、提出生字的方法;4、字义教法;5、字音教法;6、字形教法;7、识字顺口溜编写方式;8、纠正错别字的方法;9、查字典的方法。)178种识字教学法;或根据山东教育出版社1999年5月出版的由戴汝潜主编、谢锡金、郝嘉杰副主编的《汉字教与学》中,引用《现代小学识字教育现代化研究》分析,得出:1、汉字特征类识字方法(总计:6类16法);2、心理特征类识字方法(总计:2类3法);3、技术特征类识字方法(总计:2类4法)。

从上述引用的事实和数字说明学习汉字的类别和方法是多种多样的,不管学习汉字类别和方法有多少,都要面临一个学习多少汉字、怎样学习汉字的问题。它们都离不开先学习常用的汉字,也得一批一批地进行“教”与“学”的问题,从这个意义上讲,500个基本汉字都适用于这类识字方法。500个基本汉字具有实用的广泛地意义。

无论学习汉字采取何种方法,都面临一个学习汉字数量的问题,怎样进行学习的问题。

汉字是有构字规律的。它的构字规律是,绝大部分的汉字是由不同形状的形声字加上不同的偏旁所构成。也就是由基本字加上不同的偏旁所构成。只要我们了解和掌握了基本字,了解汉字的各种偏旁的意义,了解和掌握有多少个基本字,我们先学习基本字,掌握汉字的构字规律,这对于提高学习汉字的速度,减少学习汉字的难度,将起着极大的作用。

有些汉字教学法,不采用“基本字”的概念和做法,而采用“母体字”的概念和做法,这种概念和做法并不科学。“母体字”是人性化的概念,基本字是科学化概念。避开人性化的概念,采用“基本字”科学化概念是准确的概念。

选用“基本字”概念较之使用“母体字”概念更确切。因为汉字构字方法比较复杂,虽然大多数的汉字是由基本字、笔画和部件构成,但是有些汉字是由多个基本字和多个偏旁构成新的字,用一个“母体字”来说明汉字的构成不确切。

不是全部独体字都可以构成新汉字,有少数独体字没有构字的能力,不能构成新的汉字,因此,选用“基本字”较选用“母体字”更确切,否则就容易发生矛盾。

还有的工具书把“基本字”叫做“字根”和“字族”,汉字不是拼音文字,不存在词头、词根和词尾的问题,不存在“字根”的问题,不能把拼音文字的叫法,移植到汉字的叫法上来。两种文字的字形和词形绝不等同。

在由四川教育出版社1995年出版,刘国正、顾黄初和章熊主编的《中国语文教育丛书》中,其中由张田若、陈良璜、李卫民所著《中国当代汉字认读与书写》的第二章,中国汉字的特征中的第二节,汉字的字量和常用字,对近代中国所形成的汉字的使用量和常用字的定量,用大量的事实做了历史的和现实的分析,最后得出一个明确的结论:“经过60年逐渐形成了这样一个共识:中国现代汉语的常用字可以定为3000。”这是一个科学的总结和最后得出的科学结论。

面对这样一个最后结论,我们如何对这3000个常用字进行“教” 与“学”?

只要我们改变和抛弃脱离实际的、强加在汉字头上的形形色色的误解和偏见,面对现实地树立科学的汉字观和新概念,汉字的前途正如北京商务印书馆国际有限公司总编辑程孟辉先生所预想的:“这种方法(指基本字带字的方法)一旦被推广,定会给汉字语言文化的普及、发展乃至走向世界带来更加广阔的前景”,“让几千年一直困扰着人们的所谓汉字难学、难记、难懂、难掌握的历史成为过去。”(《汉字文化》2004年第一期,61页《语典编纂史上的一次革命》)。

2004年5月—7月,大连辽师大研究古汉语的李成充老师先后给我写了几封信,现摘录两段,作为这篇文章的结束语:

“所有不同学习汉字方法的实质,都是对唯一的汉字发生、发展历史规律和汉字性质认识不同的具体反映。您的从500个基本字开始的字本位的学习汉字的方法,不管人们现在是否意识到,它们都是当代中国语言文字学界对汉字发生、发展历史规律和汉字性质认识最高水平的一个组成部分。”

“从500个基本字开始的字本位的学习汉字方法,是目前最贴近汉字发生、发展历史规律和汉字性质的学习方法,因此它是所有学习汉字方法中最科学的方法。无论教与学,中国与外国,都概莫能外。它是当代中国乃至世界实现汉字教学由必然向自由飞跃非它莫属的科学之路。”

(注)《汉字频度表》同《汉字频度统计》。1974年8月,四机部、一机部、中国科学院、国家出版局和新华社联名向国家计委申请研制“汉字信息处理系统工程”(简称“748工程”。)国家出版局1975年3月28日发出了《关于汉字信息处理系统工程文字标准编码及有关协作项目科研计划任务的通知》。1977年10月,《汉字频度表》内部出版。

1984年初,原查频组的成员又用了一年多的时间,查找原始数据,用计算机重新计算,并且增加了一些新的内容。最后由贝贵琴、张学涛编成了《汉字频度统计》,1988年4月由电子工业出版社正式出版。(见北京大学苏培成教授:《20世纪的现代汉字研究》第66、68页)

1981年5月1日,由国家标准总局发布的根据《汉字频度表》研制的《信息交换用汉字编码字符集•基本集》,引起了信息和语言学界的对汉字频度工作重视。

1989年上海教育出版社出版、由陈原主编《现代汉语定量分析》60-69页收有孙建一写的《现代汉语字频测定及分析》:“提供了这次字频统计工程的基本数据,还把这次统计和“748工程”得出的《汉字频度表》进行了分析,尽管《748工程》是在“文革”后期那种特殊语境下用人工方法统计的,但是其结果和这次在普通语境下使用电子计算机统计所得的结果十分相似。作者画出了这两次统计的函数曲线图,两条曲线大致相仿。”(《20世纪的现代汉字研究》第74页)

2004年2月17日,法国朋友安雄先生,在北京前门建国饭店约请我们几位中国朋友介绍了他的博士论文集:《古今中国集中识字教学法研究》。在129页中,他用图表画出了“748工程”、已故香港安子介先生、国家科委、北京语言学院、美国Jun Da 五种汉字频度曲线对比表,证明这五种汉字频度的曲线是相似的。