当前位置:首页>服务>测试

《汉字应用水平等级标准》研制报告

时间:2007-06-21   作者:   来源:教育部语言文字应用研究所

        [摘要]汉字应用水平指的是人在以汉字为媒介的阅读、书面表达等活动中,掌握和使用汉字的正确程度和准确程度。“正确”是指是否符合国家颁布的有关汉字的现行规范和标准;“准确”是指是否与规范程度高、权威性强的工具书相一致。《汉字应用水平等级标准》从人能够掌握和使用的汉字字种数量、掌握和使用的程度、在阅读和书面表达中的典型表现、能够承担的工作类型以及与汉字应用水平测试的关系等几方面,根据实际调查和研究,对等级标准进行了界定和描述。

[关键词]汉字 应用水平 标准

Developing Chinese Characters Proficiency Rating Scale

Zhang Yiqing

Abstract: The Chinese Characters Proficiency means individual ability to read and write in routine duties and everyday life. Describe this kind of ability which is divided into some part as follows: a)quantity that individual is able to use Chinese Characters; b) level of correctness in using Chinese Characters; c)individual common performance in reading and writing; d)tasks that individual is competent.

Key word: Chinese Characters   proficiency   rating scale

一、研制背景

新中国成立以来,特别是《中华人民共和国国家通用语言文字法》颁布实施以来,我国的语言文字应用状况越来越好,人们普遍意识到语言文字规范化、标准化的重要性。但是,在使用汉字的各种场合的确还存在着写错别字、滥用或错用繁体字和异体字、自造“简化字”、错读或误读汉字等现象。这些现象不仅造成了用字混乱、沟通困难甚至引起各种纠纷,更严重的是违背了我国的《通用语言文字法》,不利于弘扬民族文化、不利于我国的对外形象,甚至直接影响到青少年正确掌握和使用祖国的语言文字。

造成上述不良现象的根本原因是,大量从事汉字应用工作的从业人员、具有中等或高等受教育程度的学生等,他们应用汉字的正确程度和准确程度明显偏低。因此,有关部门意识到,减少和避免用字的混乱,必须标本兼治,从根本抓起,建立针对文字使用者应用汉字水平的评测制度和评测体系,促进应用汉字整体水平的提高。在这种情况下,国家语委“十五”科研规划设立了重点项目——汉字应用水平测试研究。

二、研制目的和研究基础

“汉字应用水平测试研究”的目的是建立一整套科学的、标准化的汉字应用水平评测制度和评测体系,以提高有关人群应用汉字的能力和水平,加强和推进全社会应用汉字的规范化和标准化。

课题启动之后,课题组首先面临着几个问题。第一个问题是汉字应用水平测试的范围如何确定,也就是测什么,包括考查哪种能力,考查哪些内容;第二个问题是如何对人应用汉字的能力和水平划分等级,划分的依据和指标是什么;第三个问题是《等级标准》与汉字应用水平测试有什么关系,如何通过应试人在测试中的表现推断他们在实际应用汉字过程中的水平和能力。

这几个问题实际上也正是研制《等级标准》的目的,同时也是研制《等级标准》的基础。针对这些问题,课题组成员经过认真思考和反复讨论,并多次征求有关领导和专家们的意见,初步形成了以下共识:

一、《等级标准》应当着眼于描述人在阅读、书面表达等应用汉字活动中,能够掌握和使用的汉字的数量及范围,以及掌握和使用汉字的正确程度和准确程度。由于人在上述活动中,能够碰到或用到的汉字在数量和范围上都是有限的,因此,汉字应用水平测试的范围不能漫无边际,不必囊括古今中外一切汉字典籍文献中的所有汉字,而应当充分考虑在现实生活中见诸书报文献的汉字的频度,以及不同人群掌握汉字的平均水准,从而为确定汉字应用水平测试范围、研制《等级标准》提供科学的依据。

二、《等级标准》应当从程度上对人应用汉字的能力和水平划分层次,区分社会上与汉字应用密切相关的几种主要人群使用汉字的不同情况,明确这些具体情况各自的内涵。而要实现这样的划分,首先要从理论和实践两方面找到依据,其次还要明确划分的具体指标。从有关汉字应用研究的历史和现状看,不同人群在应用汉字的实践活动中,确实在能够掌握和使用汉字的数量及范围、掌握和使用的程度等方面存在着差异,这些差异需要通过进一步的实际调查和测验等予以确定,而对调查、测验的结果经过分析整理,也就形成了划分不同层次的具体指标。

三、《等级标准》既然着眼于描述人在应用汉字的实践活动中所能达到的程度,那么显然就需要有一个针对人应用汉字的能力和水平的衡量标尺和衡量方法,而具有一定规模,同时又比较客观的可操作性标尺和可操作性方法就是测试。测试是测量的一个特殊类别和形式,主要通过一定的程序引起应试者的反应,并给这种反应赋分,然后对不同的分数给以稳定的、一致性的解释和说明,而且这种建立在定量基础上的定性说明,还必须切近现实生活,与人的实践活动尽可能保持一致,而不仅仅局限于人在测试中的表现。很显然,《等级标准》所包含的内容,正是来源于现实生活、来源于人的实践活动,因此,它和汉字应用水平测试存在着必然联系,既在宏观上指导测试的研究和实践,又是量化性质的测试结果的定性反映。

      《等级标准》和测试的关系,是任何一种语言测试都会面临的共同问题。测试环境和语言应用的现实环境、应试人在测试中的表现和他们应用语言的实际状况,是语言测试学长期以来一直关注并探索的最主要问题。国内外大多数较大规模的语言测试,它们的等级标准都着眼于语言应用的现实状况,下面是一些引自不同语言测试的有关等级标准的典型描述:

       他们(指达到某一等级标准的人。下同)能够明白标签、简单的标识、街道名称、价目等等,但是还不具备足够的能力应对日常交际。

       他们能够运用有限的词语表达一般性的问候,说出某些常见物体的名称,表达简单的行为动作。

他们能够像使用他们的母语一样,用这种语言应对所有的交际情境,偶然出现的不准确、不流畅、不恰当或其他失误,完全不影响表情达意,不影响交际过程。

这些描述显然都针对特定的测试目的,针对所要测试的语言能力,对人们应用语言的现实状况进行了系统的概括性描写。以这种方式形成的等级标准,完全建立在对人应用语言的现实状况以及所运用的语言能力进行科学、客观的分析基础上。当然,这种分析往往带有很强的针对性,一般都从测试目的出发,首先确定所要测试的能力的范围,比如要对报刊类新闻采编人员进行考评,或者是从应聘这个行业的人群中进行选拔,那么,首先就要明确所考查的能力是撰写或编辑新闻报道;然后对新闻体素材所涉及到的语言现象、语言知识进行细致的分析,例如词汇、语法特点等等;接着,再对人掌握、运用这些知识的特点做进一步的分析,例如词汇量的大小、运用词语的准确程度、驾驭语句以上结构的熟练程度等;最后,根据分析结果概括、归纳出按一定原则划分层次的描述,初步形成相应的等级标准。

       这里对等级标准的形成过程只是一个简要的说明,实际的研制过程和操作过程则非常复杂。从这个过程中不难看出,研制等级标准的过程,实际上也是为研究测试本身和实施测试设立具体的目标,并对测试的研究和实施产生指导性作用,因为测试内容、测试形式等越接近现实生活的实际状况,测试的有效性也就越高。

在语言测试领域,就目前所能看到的国内外资料,绝大多数测试都针对语言的表达和理解,针对语言知识的掌握,几乎没有专门针对人掌握和使用文字情况的标准化测试,只有一部分书面语测试把文字内容当作其中的一个组成部分。形成这种局面的原因是多种多样的,首先是大多数语言测试并不专门考查人掌握和使用文字的能力;其次,由于不同文字符号的特点,对许多以拼音文字为载体的国家、地区或民族来说,研制专门的文字测试也没有必要。

       与此形成鲜明对比的是,汉字具有区别于其他文字符号的特殊性,其中最明显的特点是一个个独立的汉字符号并不完全对应于语言层面的词,例如“马”字,当它表示“一种哺乳动物”的时候,它对应于语言中的一个词;当它出现在 “马路” 中,它则对应于语言中的一个语素,代表合成词里的一个成分;而当它出现在“马达”中,它就只对应于语言中的一个音节。因此,在汉语里,汉字的文字学意义非常强,汉语研究中既有词的研究,也有字的研究;既讲词义,也讲字义;既有词典,也有字典。这种现象说明两个问题:第一,汉字和汉语的关系并不是简单的谁为表、谁为里的关系,汉字在记录汉语的同时,还具有非常明显的独立性,像“六书”中的象形、指事、会意、形声等四种造字法,就完全是文字层面上的东西,是独立于语言而存在的,例如形声字的形符或者说义符,它完全是文字的一种属性和特点,而并非语言的特点在文字上的反映;第二,汉字字种的数量大于语音单位——音节的数量,而小于语义单位——义素的数量,因此,汉字的同音、多义特点非常突出,另一方面也表现出与此相对的多音、同义特点。与汉字的这几种特性相对应,汉字的学习和使用一方面表现出在整个汉语学习和使用过程中的局部独立性,例如在汉语学习中识字教学体系的建立和使用汉字时错别字现象的产生及纠正;另一方面,汉字的学习和使用既涉及以字形为准划分的字量(字种数量)的多少,也涉及把握字音、字义及一部分特殊用法的准确程度。由此可见,汉字的学习和使用具有在局部自成一体的特点,这就使汉字应用水平测试体系的建立有了明确的目标和必要的基础。

在理论上,语言文字学特别是汉字学的研究及其成果,更重要的是国家颁布的一系列语言文字规范和标准,以及为制定这些规范和标准所进行的科学研究,为汉字应用水平测试研究奠定了坚实的基础,例如汉字整理工作中对汉字的定形、定音、定量、定序等研究和成果,就成为研制《等级标准》时所遵循的原则和所依凭的根据。

在实践上,汉字教学和一些书面语测试中的汉字测试也为构建标准化的汉字应用水平测试体系提供了必要的参考,例如汉字教学的教学大纲、教学目标、教学要求和有关汉字测试的分数解释等,都成为研制《等级标准》时可以分析借鉴的基础。

另外,测试学的理论与实践,特别是近年来测试学的新进展,也对汉字应用水平测试研究起着导向作用。尤其是测试学中关于能力单维性的假设和测试实践,在研制《等级标准》时,对确定汉字应用水平的评价指标具有非常重要的作用,而且有助于《等级标准》和测试实践的衔接。

当然,应当看到,汉字应用水平测试研究还面临着许多困难,存在着很多不利因素,比如还没有找到一种现成的、可资参照的,并且是专门用于文字测试的等级标准。另外,本节一开头提到的几个问题,也都找不到现成答案,因此,研制《等级标准》,就需要从头做起,按计划、分步骤进行扎扎实实的研究。

三、研制过程

研制《等级标准》,最重要的首先是确定它的性质。就《等级标准》的针对性而言,它的定位可以从两个方面来考虑。第一,“等级标准”是对人使用汉字的能力和水平的一种评价,因此,它来源于客观现实,并且是针对人的汉字应用水平的一种标准化定性描述,但是它所着眼的是人使用汉字的普遍情况,而并不面对一个个具体的个体,所以,它在本质上独立于、或者高于针对个体或特定人群的任何形式的测试或观察;第二,“等级标准”既然源于现实,它对于评价人应用汉字水平的实践活动当然具有非常重要的指导意义和指导作用,因此,对于微观的测试手段或观察活动而言,它也是宏观的纲领性文献。

从人使用汉字的实践活动看,大的方面可以分为三类:第一方面是阅读;第二方面是表达(书写);第三方面是一些由特殊目的而产生的其他活动,比如查阅工具书,汉字教学,编校汉字文献等。综合这几个方面,针对人使用汉字的能力和水平,衡量标准可从以下几个方面进行思考:

一、是否能在一定语境中正确辨认汉字,并准确理解其所表达的意思。二、是否能根据表达的需要,正确使用汉字。三、是否能适应查阅工具书、汉字教学、编校汉字文献等需求,准确掌握汉字的普通话读音和汉字的偏旁、部首、笔画、笔顺等字形规范方面的知识,并具备一定的纠错能力。

与此同时,还应考虑人使用汉字的能力和水平的不同程度,这又涉及到两个方面的问题:一是人能掌握并运用的汉字的数量;二是对同样一个汉字的多种意义、若干用法以至不同读音的掌握和使用程度。由此又引出了汉字的字形和读音的对应关系,汉字的字形和字义、以及字和单音节词的对应关系。

从汉字数量方面界定和描述人使用汉字的能力和水平,首先要明确一个概念,这个概念有的学者称为字种,有的学者称为字户,我们采用前一种说法。所谓字种,就是指在字形上能区别于其他汉字的字,也就是说具有几个读音或若干意义和用法的汉字都按一个字种处理,例如:“长短”的“长”和“首长”的“长”以一个字种计;表示竖着的东西横躺下来的“倒”和表示转换的“倒”也以一个字种计;在语言中用作形容词的“多”和用作副词的“多”也以一个字种计。这样,从汉字数量方面界定和描述人使用汉字的能力和水平时,所说的汉字数量指的就是字种的数量。另一方面,仅仅依凭掌握汉字字种的数量界定和描述人使用汉字的能力和水平显然是不够的,因此,从汉字的字形和读音的对应关系,汉字的字形和字义、以及字和单音节词的对应关系等角度思考人掌握和使用汉字的正确程度和准确程度,就成为界定和描述人使用汉字的能力和水平的另一个重要方面。

就汉字的字种数量看,如前所述,从古至今,以汉字为载体的文献典籍浩如烟海,一些大型工具书所收的汉字有数万之巨,但以其常用性和使用频率为指标,较常出现在文献中的汉字在数量和范围上都是有限的。因此,《现代汉语通用字表》所收的7000汉字就成为衡量人使用汉字的能力和水平的一个参照系。与此同时,语言文字学家和语言教育专家们也注意到,7000通用汉字主要是以书面文献中汉字出现的频率为标准形成的,与人实际掌握汉字的情况并不完全一致,因此在7000通用汉字的基础上,就需要进行人对这些汉字掌握情况的调查。

基于这种考虑,课题组先后两次对公务人员、教师、编辑、大专院校学生等进行了7000通用汉字掌握情况测验,并建立了相应的数据库。数据统计结果显示:在识字数量为550045004000三个标志处,人数呈现出明显的集中趋势,显示出鲜明的众数特征;而且分别集中在三个标志处的人也各自明显呈现出某些行业和某种受教育程度的特征。因此,以字种数量为指标界定和描述人使用汉字的能力和水平就确定为3500-40004000-45004500-5500三个等级。

如果把能够掌握和使用汉字的数量当作人汉字应用水平的广度标志,那么,对同一个汉字的多种意义、若干用法以及不同读音的掌握情况,则可看作是人掌握汉字的深度标志。比如有两个人同样具备了掌握和使用4000个汉字的能力,那么,要衡量他们汉字应用水平的差异,首先要确定的就是他们所掌握的4000汉字,是否是字种概念上的含义,也就是说这些汉字中多音字的若干常用音项、多义字的若干基本义项和基本用法他们是否已经掌握,这样就可以从具有广度含义的字种数量方面判断他们的汉字应用水平;其次,一部分汉字还具有某些不常用音项或特殊含义和用法,例如:“一唱一和”中的“和(hè)”,“一文不名”中的“名(占有)”。能否准确把握这部分汉字的这一类读音、含义或用法,就成为判断他们汉字应用水平的深度标准。当然,深度标准和广度标准并不是截然分开或完全对立的,如果从严格的意义上讲,只有通过深度标准判断的结果,才称得上是完全意义上的字种概念,因为对于一个在字形上能够区别于其他汉字的字,深度标准涵盖了它的绝大多数音项、义项和用法;而通过广度标准判断的结果,并不是一种完全意义上的字种概念,因为它只涵盖了汉字的常用音项、基本义项和基本用法,但是就汉字的应用层面来看,这已经足以构成判断标准之一了,而且在确立广度标准的时候,实际上其中也已经蕴涵了深度标准的因素,因为对于一个在字形上能够区别于其他汉字的字,广度标准已经考虑了它常用的和基本的若干音项、义项和用法。因此,“等级标准”除了从字种数量上界定和描述人的汉字应用水平外,还应当从掌握和使用汉字的正确程度和准确程度上界定和描述他们的汉字应用水平。

从掌握和使用汉字的正确程度和准确程度上衡量人的汉字应用水平,首先要考虑汉字本身的要素,同时也要考虑这些要素之间的关系。汉字本身的要素就是常说的形、音、义三个方面,它们之间既彼此独立、又相互联系,在汉字学习和汉字使用过程中,字形、字音和字义既有单一判断或使用的情况,也有综合运用的情况,例如:汉字“长”,从字形上讲,它有笔画、笔顺、部首、结构等要素和知识;字音上则有普通话读音、若干音项等要素和知识;字义上有表示空间或时间的距离大,表示长度,表示善于做某事,表示年龄大,表示辈分大,表示领导人,表示生长,表示增加等要素和知识;而在“长短;他长于写作;成长;他长我两岁”等具体语言环境中,判断或使用汉字“长”的形、音、义则是一种综合运用。因此,在《等级标准》中,从字形、字音和字义三方面分别描述人的汉字应用水平和从实际应用的正确程度和准确程度方面综合描述人的汉字应用水平就成为相互配合、相互补充、并行不悖的两条线。

另一方面,人在日常阅读和书面表达等活动中所需具备的汉字基础和汉字能力,汉字应用水平和一定受教育程度的对应关系,汉字应用水平和所能承担的工作任务之间的对应关系,也是研制《等级标准》时应当予以关注、思考,并在《等级标准》中进行说明的几个问题。

第一个问题涉及到现当代以各种媒介形式存在并流传的各类汉字文献的用字情况;第二和第三两个问题涉及到目前已达到一定受教育程度或日常工作与汉字应用密切相关的特定人群掌握汉字的现实状况。

针对第一个问题,课题组把《测试字表》用国家语委语料库和863超大规模平衡语料库进行了覆盖率和分布状况检测(这方面的情况将另文专述)。检测的主要目的是考察《测试字表》中400045005500三个界标各自在语料库中的覆盖和分布状况,然后根据数据统计、整理和分析结果,对达到一定等级标准的人在阅读和书面表达活动中应具有的表现进行了概括性描写。

针对后两个问题,课题组先后几次对具有不同受教育程度的人群和日常工作与汉字应用密切相关的有关行业人群,进行了汉字掌握情况调查和测验,并把调查和测验的结果建成数据库,最后经过数据统计和整理,按照《等级标准》的要求,对达到不同等级标准的人与受教育程度的对应关系、与他们所能承担的工作任务的对应关系,进行了概括性说明。

在进行上述工作过程中,课题组也一直在思考和探讨另外两个问题:一个是汉字应用水平和阅读理解能力以及书面语言表达能力的关系;另一个是《等级标准》和汉字应用水平测试的关系。

第一个问题主要涉及到对“汉字应用水平”的界定,同时对第二个问题也会产生非常重要的影响;第二个问题主要涉及到如何在一定的标准和原则指导下,研制《测试大纲》,建立汉字应用水平测试题库,拼组试卷等,从而实现汉字应用水平测试和《等级标准》的衔接。

       对“汉字应用水平”,前面已经谈到,课题组经过反复讨论,并在广泛征求了语言文字学专家学者的意见后,将其明确为人在阅读、书面表达以及其他与汉字应用有关的活动中,掌握汉字形、音、义以及使用汉字的正确程度和准确程度。但是,应当承认,衡量人的汉字应用能力和水平,很难避免与人的书面语言理解能力和表达能力纠缠在一起,因为这两种能力在客观上存在着相互重叠的领域,例如“迈”,它的字形和读音,与它表示机动车速度单位的概念意义事实上很难截然分开;再如用“一丘之貉”考查人掌握“丘” 的情况,也很可能与人掌握这个成语的情况混杂在一起。但是,尽管存在着这样那样的困难,如前所述,汉字应用水平的评价标准还是具有汉字形、音、义等方面的独立性;同时,按照汉字应用的实际情况,语言层面的词语等内容可看作是应用汉字的语境,而且,在一定语境中评价人的汉字应用水平,着眼点还应当是应用汉字的正确程度和准确程度。这样就把人的汉字应用水平与阅读理解能力和书面语言表达能力最大可能地进行了区分。因此,《等级标准》明确提出人在阅读、书面表达等活动中的汉字基础和使用汉字的正确程度及准确程度。

《等级标准》按照汉字的形、音、义分别确定评价标准,并把汉字应用水平与阅读理解能力和书面语言表达能力最大可能地进行区分,这就同测试学中IRT理论的强假设“能力单维性”取得了一致,因此便于在汉字应用水平测试中运用IRT的理念和方法,从而有助于真正实现衡量人的汉字应用水平这样一个目标。当然,最终实现这个目标,也还有待于研制《测试大纲》《测试词表》和编制试题的工作。

关于《等级标准》和汉字应用水平测试的关系,前面已经谈到,《等级标准》是宏观的指导性纲领,测试是微观的实践性操作。举例来说,测试就像用标准化的尺子测量人的身高,而相应的等级标准则是依照常模数据,综合民族、地域、年龄、性别等因素,给经过测量并确定为一定身高的人,做出生长发育情况、健康状况等方面的评估。因此,《等级标准》所阐述的有关能够掌握和使用汉字的数量、掌握和使用汉字的正确程度和准确程度、具备了一定汉字基础和汉字能力的人在阅读和书面表达方面的表现、以及他们所对应的受教育程度和所能承担的工作任务等内容,特别是与《等级标准》相辅相成的《测试字表》,对试题的编制和测试题库的建立都具有十分重要的指导作用,能够使测试有明确的方向和目标。此外,《等级标准》也对各级标准所对应的标准分数做出了明确规定,这样就可以同研制《测试大纲》以及编制试题、拼组试卷、确定评分体系等工作程序一道构成完整的汉字应用水平评测机制。

四、几个问题

在研制《等级标准》过程中,还有几个问题值得关注,并需要在将来的试测阶段以及实施汉字应用水平测试时进行检验和探讨。

第一个问题是如何从测试角度看待汉字和词的关系。第二个问题是《等级标准》是否可以有针对不同行业的若干版本。第三个问题是在《等级标准》中确定最初级起点以及划分各个等级的依据。第四个问题是是否根据社会上的某些需要,涉及繁体字内容。 

主要参考文献

1.《汉语水平词汇与汉字等级大纲》,国家对外汉语教学领导小组办公室汉语水平考试部,北京语言学院出版社,1992

2.《教育测量学》,张敏强,人民教育出版社,1998

3.《数学教学测量与评估》,田万海,上海教育出版社,1995

4.《语言文字学及其应用研究》,许嘉璐,广东教育出版社,1999

5.Measured Words》,Bernard Spolsky,上海外语教育出版社,1999

6.Language Testing in Practice》,Lyle F.BachmanAdrian S.Palmer,上海外语教育出版社,1999

7.Language Test Construction and Evaluation》,J.Charles AldersonCaroline ClaphamDianne Wall,外语教学与研究出版社,剑桥大学出版社,2000

8.Fundmental Considerations in Language Testing》,Lyle F.Bachman,上海外语教育出版社,1999

http://172.19.104.1/wcm/app/editor/editor/images/spacer.gif

“汉字应用水平测试研究”课题研究在科研经费上得到广东教育出版社的大力支持,特此鸣谢!

“汉字应用水平测试研究”课题组成员是张一清、佟乐泉、孙曼均、陈菲。

 

版权所有:国家语言文字工作委员会
地址:北京市东城区朝阳门内南小街51号   邮编:100010   邮箱:yyswangzhan@163.com