怎样测试英语运用能力

来源:互联网 作者:iamvickiele 发布日期:2012年09月26日 06:02

摘要:

现在对人类语言和语言运用,当然还远不能说已经认识清楚,但是至少肯定了以下三个基本观点。

    一、英语运用能力是什么


     要测试语言运用能力,首先得弄清楚语言运用能力是什么。 这问题过去很多人不怎么去追究。 有一种观念,以为懂得英语语音语法词汇就能运用英语,因此英语语音语法词汇就是英语运用能力。 这种观念很普遍,存在于大家的脑子里有几十年。 几十年英语考试也都是根据这个观念设计的。 60年代以前这种观念不足为奇,因为那时候大家对语言运用研究还不深,缺乏认识。 到了70年代,语言学和相关科学进步了,这样的观念就很有问题了。 现在对人类语言和语言运用,当然还远不能说已经认识清楚,但是至少肯定了以下三个基本观点:


     1. 语言运用能力不等于语言知识或语言技能,前者大于后者。


     什么是语言? 每一种语言,首先是一个形式系统,或称语码系统(code system)。 这个形式系统包括三个方面:语音、语法、词汇。 语音语法词汇是构成语言形式系统的三个次系统。 要会运用一种语言,当然必须要具有对这个语言形式系统的知识,也就是关于语音、语法、词汇的语言知识(knowledge)。


     有了语言知识,是不是就能运用语言了呢? 从前有人认为这就足够了。 四、五十年代以来,结构主义语言学派指出,学了语言知识往往不会用语言,必须获得操作语言形式系统的技能(skills)才能用语言。 技能按他们的定义是一种习惯性的自动化的条件反应能力。 语言的掌握完全可以用训练自动化技能的方法解决。但是有了语言技能,是否就能运用语言呢? 结构主义语言学派提出的语言技能,事实上不能说明语言的运用能力,它有两个严重的缺陷:(1)把听、说、读、写的技能当作主要是耳、口、眼、手的技能,忽视运用语言认知的一面和创造性的一面。 (2)把语言技能看作是一种脱离语言运用的语境和情境的独立的技能,忽视了语言运用依赖于语境情景这一事实。到了70年代,人们已经认识到语言运用除了关于语言形式系统的知识,除了对语言形式系统的操作技能外,还必须有在语境和情景制约下创造性地运用语言的能力。 换言之,原来的知识、技能的概念不能解释语言运用能力,需要提出能力的概念(competence) (注:英语里ability, capacity和competence是三个不同的概念。 但在汉语三者都只能译作能力。 希望大家注意我们把它们用于不同的含义,请注意区分。)。语言运用能力远大于,多于,也复杂于语言知识或语言技能。


     2. 语言运用能力是多成分多层次的复合体。


     70年代以来,很多人研究过语言运用能力(也称为交际能力)的构成,提出了多种不同的交际能力构成模式。 这里不必详加介绍,可以总结为两条:


     (1)语言运用能力是一种包含多种成分的能力。


       语言运用能力里面既有知识,有技能,也有能力。 是包含知识(knowledge)、技能(skills)和能力(ability & capacity)等多种不同性质的成分的能力(competence)。


       知识是存在于人脑中的对事物的理解和认识。 包括陈述性知识和程序性知识(declarative knowledge and procedural knowledge),也包括明现的和不明现的知识(explicit and implicit knowledge)。 结构语言学派之前的英语教学重点放在语法词汇知识的教授上。 结构派却认为知识没有            用。 我们认为,单是语言知识对运用语言是没有用,但是语言运用不能排除知识,语言运用能力里面含有知识的成分。


      技能,这里指一种自动化行动的能力,譬如对外界刺激的生理反应、机械反应、自动化反应或者习惯性反应。 如骑自行车、打字的技能等。 语言运用上的技能,简单的有辨音发音、辨识和书写字母、拼音拼词等; 复杂一点的包括交际中由于纯熟而达到自动化程度的(不用动脑筋的)连串的语言解码和编码,譬如打招呼、道别和一些几乎是公式化的对答等等。 一个人学外语,开始时在听说读写过程中连最小单元的解码编码都不能自动化,到后来能够自动化的单元越来越多越来越长,也可以说技能越来越纯熟了。 低层次的解码编码都成了技能,不用动脑子,脑子便能越来越多地解放出来做高层次的工作。


      能力不同于技能,是动脑的能力,包括推理、判断、创造、想象、审美、欣赏、同情或憎恶等等的能力。 可以分为认知(思想)和感受(情感)两个范畴,分别称为认知和感受能力(cognitive and affective capacity)。 人用语言,必然牵涉到认知和感受。 事实上语言运用在很大程度上依赖于人的认知和感受能力。 很难想象一个全无认知感受(也就是全无思想感情)的人能够用语言交际。 教外语,说我只教语言,不管语言里的思想感情或学生的认知感受能力,是自欺欺人。 外语考试,说我只考语言,不牵涉学生的认知感受能力,那也是自欺欺人。 除非你考的不是语言运用,而只是语言形式,譬如默写单词、句子主动语态变被动等等。


      结论:语言运用能力是多成分构成的,包含知识、技能、能力等多种不同性质的成分。


     (2)语言运用能力是在多层次上同时运作的能力。


       运用语言必须遵守共同的规则,否则无法互相理解和交际。 过去很多人以为只要懂得和遵守语言形式系统的规则(即语音语法词汇规则,或可广义地称为语法规则)便可。 其实光是靠语言形式系统的规则远远不能顺利交际。 因为语言运用是一种多层次的行为。 任何一种语言运用起来,都要在多个层次上同时运作,因此必须同时在多个层次上遵守规则。 第一层次是语言形式系统层次或广义的语法层次(遵守广义的语法规则)。 第二层次是语境层次(遵守上下文或语篇的规则,譬如上下文前后如何呼应如何连贯等等)。 第三层次是情景层次(遵守时、地、人及社会文化背景等的交际情景的规则,譬如向老师请假,向朋友道别,向警察报案分别应该说什么话如何说话等等)。 真正的语言运用,在语法、语篇和情景这三个层次上同时体现。 语言运用能力是在三个层次同时运作的能力。


      3. 语言运用能力是一个整体,各种成分不是相加,而是互相作用化合而成。


        有一句常被引用的话:整体不等于部分的和(The whole does not equal the sum of the parts.)。 这很能说明语言运用能力。 上面提了那么多的成分和层次, 但是语言运用能力却不等于这些成分、这些层次相加起来。 语言运用不能一个一个成分、一个一个层次分开去测试。 因为这些成分和层次互相作用、互相化合,成为一个不可分割的整体。 举一个浅显的比喻,语言运用能力不是积木砌的房子,一块一块积木堆起来就可以得到完整的房子。 语言运用能力也许更像一种化合的药品或食品。 譬如八珍汤,如果有人请你喝八珍汤,不把八样原料加水煮好给你喝,而是一样一样原料分开煮了给你吃,盐和油和味料也都一样一样分开给你尝,另外给你白水喝,即使原料一样不缺,分量也十足,但是味道和八珍汤会一样吗? 更根本的是,你能说你吃的、喝的是八珍汤吗? 应该说根本不是。 语言运用能力也是这样一种成分不可分割的结合物。 试想真正运用语言可以只用一个成分,只在一个层次上用吗? 不可能。 即使最简单的运用,譬如和朋友互相打个招呼,不能说我现在只用语音,不用所以也不管词汇和语法。 也不能说我现在只管单词,不管句子或者语篇有些什么规矩,也不管当前这个交际情景有什么制约。 这是不可能的。 每次运用语言必须同时要管单词,管句子,管上下文,也要管时、地、人包括社会文化等情景;同时要管语音(或书写)、语法和词汇;同时要运用知识,运用技能,也运用能力。 所有各种成分、各种层次都同时要用要管。 这就是语言运用的实际。


     二、语言运用能力如何测试


        1. 语言运用能力测试的原则


         上面讨论了语言运用能力是什么,现在讨论如何测试这个能力。 当然,如何测试某样事物,首先取决于这事物是什么。 语言运用能力以下两点基本性质决定了对它的测试的大原则。


         (1)语言运用能力(或交际能力)是抽象的内在的能力,不能直接观察。


          测试或者测量一样东西,假如是具体的看得见摸得着的东西,譬如一块木头,那好办。 或者一杯液体,是酸性还是碱性,也容易测试。 可是一种语言的运用能力,是存在于人的脑子里、看不见的抽象东西。 怎么测量或者测试呢?


          语言运用能力本身固然不可见。 但是一个人有了这种能力,就能做出种种语言运用行为(也可称交际行为)。 这些行为就是语言运用能力的表征。 语言运用能力虽不可见,它的表征交际行为却是可见的。 也只有它表征出来成为交际行为的时候才可见。 因此测试语言运用能力(交际能力)可以也只能通过对语言运用行为(交际行为)的测试来进行。 在语言测试科学里这称为直接测试,即直接地测试交际行为。 不同于测试交际行为的某个成分或层次(如语法或语音,单词或句子)以代替交际行为的间接测试。


        (2)语言运用能力是多成分多层次的不可分割的复合体。


         我们已知道语言运用能力包含很多成分(不是单一成分),有很多层次(不是单一层次)。 而且我们还知道,这些成分互相作用、互相结合构成语言运用能力整体,不应该一个一个成分分解开来去测试。 我们还知道,这些成分又都不能剥离它们的层次。 剥离了它们的层次,语言就不再是运用中的语言。 那么这种多个成分不能分开,多个层次又不能剥离的语言运用能力,该如何去测试呢? 显然,只能把多个成分多个层次综合起来测试。


         譬如测试游泳。 如果把游泳分解为一个一个分解性动作,如何划手,如何蹬腿,如何呼吸等等。 让受试人站在岸上,一个一个动作去做,一个一个动作给他打分,然后加起总分。 这总分能代表受试人游泳的水平吗? 这样的测试,能说是真正测试了游泳吗? 当然不能。测试游泳必须所有动作一起互相配合地做,而且必须在水里做,让受试人真枪实弹地在水里游泳,看他能游多远多快,这才是真正的游泳测试。 语言运用也是这么回事。 测试游泳必须所有动作综合起来做,测试语言运用也必须所有语言运用能力的成分综合起来测。 测试游泳必须在游泳的真实环境中进行,也就是在水里进行。 同样地语言运用测试也必须放在它的真实环境中去测,也就是结合语言运用的多个层次去测。


        关于层次问题,有一点要特别说明:当你测试语言的时候,如果你只在第一层次去测试,那你就只能测到第一层次的知识、技能和能力。 如果你在第二层次去测试,那你就能测到第二层次的,同时也测到第一层次的知识、技能和能力。 因为受试者在第二层次运作语言的时候,必然同时也在运作第一层次的知识、技能和能力。 而如果你在第三层次去测试,那你在测试第三层次的知识、技能和能力的同时,也能测到第一、二层次的知识、技能和能力。 举一些具体例子:如果你让学生默写单词或者造句,你只能测试到他拼写单词或者造句这种第一层次的能力。 如果你让他写My Family这样一篇短文,你能测到学生连句成篇的能力,也就是语篇层次或称第二层次的能力。 同时,你也测试到他拼写单词和造句等第一层次的能力。 如果你把你的试题再提高一个层次,让学生给外国友人写道歉信,这时你不但能测试到他适应交际情景用语言这第三层次的能力,同时也测试到他连句成篇的第二层次的能力,也测试到他拼写单词和造句等第一层次的能力。 这里有一条规律:测试题目高层次可以包括低层次,低层次却不能包括高层次。 这就是为什么语言运用能力测试要在第三层次上设计的道理。


       语言运作的三个层次,可以形象地理解为语言运作的三个维度。 如果只在第一层次设计语言测试试题,譬如孤立的单词默写或者释义,单句默写、填空、改写或者翻译,那是单维的语言操作,是在点和线的层次上进行语言测试。 测试的当然不是语言运用能力。 如果你在第二层次设计试题,譬如默写或复述成段课文,无情境的作文等。 那是双维的语言操作,是在面的层次上测试语言,也还不能算是测试语言运用能力。 如果你在第三层次上去设计试题,譬如在外籍教师送别会上致辞,给外商写投诉信等。 试题既有语境也有交际情景,那就是三维的语言动作,或立体的语言动作,这才是真正测试了语言运用能力。


       结论:基于语言运用能力以上所说的两个主要性质,测试它最好的办法也是唯一真正的办法就是直接测试真实的言语行为(交际行为)。 只有通过真实的交际行为才可以观察和测试到不可见的语言运用能力。 而因为真实的交际行为必然是多成分结合的三维度的立体的行为,所以也只有通过真实的交际行为才可以把语言运用能力的多个成分同时在多个层次上综合地测试出来。 直接性和综合性,正是语言运用能力测试的两大原则。


       2. 语言运用能力测试的具体条件


       语言运用能力测试,如何才能实现直接性和综合性,在三个层次立体地测试语言,也就是真正地测试语言运用能力呢? 具体设计起来,要符合以下6个条件:


       (1)以意义(信息)为纲,而非以形式为纲以信息为纲的试题,考听、读的时候要让受试者的确是为信息而听而读。 考说、写的时候要让受试者的确是为传达信息而说而写。


        这样,听、读的试题用的材料必须有新信息,也就是对受试者来说的未知信息。 而问的问题又必须是信息题,(考读者听者是否获得了信息),而不是语法题(考的是语法)、词汇题(考的是词汇)、甚至于抄答题(考的是直接从材料中对答案、抄答案的能力)。 后面这三种都是以形式为纲的试题。


        考说和写的时候,形式为纲的题目的特点是:先规定要用什么语言形式,受试者要根据形式考虑可以套上什么意义,用意义去迁就形式(例如给单词、时态、句型造句等)。 有时甚至根本用不着考虑意义(例如给单数名词变复数,给现在时短文改过去时等)。 以信息为中心的题目恰恰相反:题目首要提供的是交际情景和目的,根据情景决定信息和意义,由受试者根据情景和信息去选择恰当的语言形式。 应该明白,情景决定意义再决定形式符合真实的交际。 而先定形式,由形式去决定意义却正好违反了真实的交际。


       技术上,以信息为纲的试题的设计往往要制造和利用信息沟。 使受试者为获得未知信息而听而读,为传达对方未知的信息而说或写。 说或写时,还必须容许受试者有在情景制约下选择语言形式的自由。


       以信息为纲的试题,评分也应以信息为纲。 评分依据是:该表达(说和写)的信息是否有效地表达,该获得(读和听)的信息是否有效地获得。 有效性包括准确性,也包括得体性。 准确性加上得体性,才能真正有效地达到交际目的。


      (2)有语境(context)


       语境这个术语一般既指语段本身的环境(上下文),也指语言文字之外的时、地、人以及社会文化环境。 我们这里用语境和情景两个术语把两个层次区分开来。 语境在这里仅仅指语段本身的环境,即上下文。


       真实生活中语言交际都是有上下文的,有上下文的语言动作牵涉到第二层次语言动作要求的知识、技能和能力,这是无语境的语言测试测试不到的。 因此测试语言运用能力的试题都必须有语境。


       具体说,就是测试中要求听、读、说、写、译的语言材料,不可以是孤立的单词或者句子。 譬如听写或者听解单词单句,读解单词单句,单句语法或者词汇填空,翻译单句或者造句等等试题,都不符合要有语境这个条件。


       (3)有真实交际情景(situation)


       上面已经提到,情景指文字之外的语言环境,也就是交际情景,近一点的包括交际的情况、时间、地点、交际人的身份、交际需要和目的等,远一点的包括社会文化背景。 测试的试题必须有交际情景,是因为真正的语言运用,都是有交际情景的。 没有交际情景的语言动作,是把语言放在真空里运作,那不是语言运用。 常见的这种真空试题有短文复述,不交代情景的命题作文等。


       交际情景还必须真实,这就是说对受试人是真实生活中会遇到的。 譬如命题作文,可以设计为给父母写信报告学校生活。 这样虽然也有情景,但是这情景不真实,因为我们的考试对象是中国学生,让中国学生给父母写英文信,是不真实的情景。 如果改为给国外笔友或网友写信描写中国学生的生活,那情景就比较真实。


       一般说,我们设计试题,明显不符合要有真实交际情景的条件的,多是写或说的试题,因为我国教师多年习惯了随便拿一篇东西就让学生复述,随便出一道题目就让学生写作文,教师自己就没有把学生的写和说放在情景中考虑的习惯。 今后如果我们每次出题目时都问自己:让他们说这个写这个,是为了什么交际目的? 是以什么身份说和写,给什么人听和看? 设计试题的时候都这样考虑,设计出来的试题就不会是真空试题了。


       读和听的试题,是否缺乏真实的交际情景,一般不那么明显。 因为学生总是以听者、读者的身份去听去读外国人说的话或写的文。 这也就是一种真实的交际身份和情景了。 要注意的是,选用听或读的材料时,应尽量选一些在真实生活里我们的学生(包括他们将来工作以后)有可能并有需要听到读到的材料。 其实由于现代生活里超越国界的书报、电视、电影、电脑网络的日益普遍,要选择我们的学生比较容易遇到的听、读英语的真实情景和材料还是不难的。


      (4)语言真实


      真实的语言,就是对具体的交际情景、具体的交际目的而言是恰当的文体的语言,也就是在真实生活中,在这样的交际情景、这样的交际目的的情景下,会读到、听到的语言。


      我们国家里不真实语言用于英语测试还是不鲜见的。 一种相当普遍的现象是在听力测试中用显著是书面语的材料。 这是由于很多命题人员以为随便什么课文录上音便可以用于听力测试,脑子里缺乏文体必须适合交际情景的概念,也就是缺乏语言真实性的概念。 另外一种常碰到的不真实语言是我们的教师自己写或者改写过的语言。 在设计低水平英语测试当中,材料要自己写或改写有时是不可避免的。 这时候要特别小心,要保证英语正确、地道和得体。 换言之,是在真实生活中这样的交际情景中,英语为本族语者会写和说的英语。 避免在英语测试中用过时英语、中国式英语、阉割英语或者课本体英语(注:阉割英语,指把该用的语法现象或生词阉割掉的英语。 课本体,指我国中小学英语课本某些课文特有的一种不自然的英语文体,是课本之外现实生活中真实交际里所见不到的。 进一步的说明及实例,可看李筱菊:《语言测试科学与艺术》(湖南教育出版社)。)等不真实的英语去测试学生。


      (5)所做的事真实


       有了上面说的情景真实、语言真实,还需要所做的事真实。 所做的事是测试试题具体要受试者做的事。 譬如要他听一段讲话记笔记,这是真实的。 可是听讲话要求逐字听写,那就不大真实。 真实生活中除非你当速记员,需要逐字听写的机会是很少的。 严格说来以下一些常用题型本身都缺乏做事的真实性:听写、默写、填空、改错、改写、朗读、复述、看图说话、是非题、多项选择题等等。 但是如果给以这种题型合理的交际角色和需要, 也就可以使它们获得一定的真实性。 譬如英国一种英语教师资格考试里就有朗读和改错。 朗读的情景是: 假设你要在课堂里向学生朗读以下戏剧道白。 改错的情景是:以下是真实的学生习作影印件,请以教师的身份划出错误,指出错误性质,并改正。 这样设计,所做的事就真实了。 看图说话或写作,如果给以情景,也是可以成为有真实性的交际试题的。


      最后要为多项选择题型(MC题型)说几句话。 这种题型要求做的事本身肯定不真实。 但语言测试发展至今,它是几乎唯一可以保证足够题量又可以方便地用机器客观评分的题型。 因此为了保证考试的信度,仍不能不在考试里部分地使用MC题。 重要的是,在使用MC题型时,必须在试题的选材和命题上狠下功夫,保证选材真实,保证所命的题是信息题,而且努力提高其作为信息题的质量。 要知道,高、低质量的MC题是截然不同的两种试题。 高质量的MC题可以划入测试运用能力的试题的范畴; 而低质量的MC题却完全属于非运用能力的试题的范畴了(注:关于如何命好信息题和MC题,也可看上注提到的书。)。


      (6)有互动性(interactive)


       交际行为必然是互动性行为。 即使在默默地听讲话或者读文章,事实上听者和读者也不是纯粹被动的,他们也要动脑筋。 听者和说者,读者和作者在字里行间一直在进行无形的互相交流,或称相互作用(interact)。 通过这种相互作用(interaction),听者和读者才有可能一步一步地获得信息。 我们命听力和阅读试题的时候,只要注意命的是信息题,迫使受试者动脑筋去获取信息,这种试题也就具有互动性了。


       说和写的试题是否具有互动性,就更显而易见,也更需要我们注意。 譬如口试题,让受试者一个人独白,显然就不如让他与主考或者与另一受试者交谈更具有互动性。 写作试题,很多人忽略了它的互动性问题,以为写就是自己写,给一个题目便成。 然而我们在生活中,每写一样东西,写的时候心目中总是有一个意指的(intended)读者对象的。 如果是一封信,心里当然知道写给谁。 如果是一篇对社会问题的评论,写的时候就想着要向报刊投稿,报刊的读者就是对象。 写的时候知道写给谁看或预备发表在哪里很重要,这决定你应该写什么和怎么写。 任何写的过程,事实上在心理上是一个作者与读者之间的互动过程。 因此,设计写的试题时,我们都应该给一个读者对象,也就是给一个互动性的情景。


       语言测试符合以上6个条件,才能真正同时在三个层次上测试语言运用能力的多个成分。 条件能实现多少,说明直接性和综合性达到什么程度,决定了测试运用能力到底测到了多少。3.语言运用能力测试考虑效度的同时,还必须考虑信度和可行性以上说的都是英语测试如何能真正测试英语运用能力,是解决英语测试的效度问题。 但是对任何语言测试(语言运用能力测试不例外),效度固然重要,信度也同样重要,也同样必须考虑。 同时还有可行性,也不能不考虑。 事实上,语言运用能力测试,比之非运用能力的语言测试,要保证信度和适应可行性,困难要大得多,因此也需要更认真地考虑。


       譬如以上提的语言运用能力测试的6个条件,在学校范围内的评估性测试,是完全可以实现的,而且我们非常鼓励大家去努力实现。 但是超出学校范围的考试,尤其是决定考生毕业或升学的公共考试,在信度和可行性方面受到很多制约,两大原则和6个条件也许就不容易全面地实现,只能尽力而为。 也许在一套考试中各部分的实现程度不同。 有些大题直接性、综合性程度高一点,有些大题直接性综合性程度低一点。 这在语言测试发展的现阶段,是不可避免的现实。


       这样说来,我们今天讨论语言运用能力的测试,提出这些原则和条件,是不是有现实意义? 我认为,不但有现实意义,而且有很迫切的现实意义。 因为测试语言运用能力,是国际上也是我国语言测试当前和未来发展的大方向。 认识大方向,才能保证在我们的考试工作中不会迷失方向,不会走回头路。 认识大方向,才能明确我们应该朝什么方向努力。 也只有这样,我们的努力也就会成为促进(而不是“促退”)我国乃至世界外语测试(同时也是外语教学)向前发展的努力的一部分。  

 
燕定美中教育托福暑期班课
高中生正式进入“洋高考”
 
 

免费评估咨询

姓名 GPA
学校 TOEFL
SAT GRE GMAT
电话 申请类别
Email 申请专业
      红色边框为必填项目