应用语言学论文

您当前的位置:学术堂 > 语言学论文 > 应用语言学论文 >

对外汉语教学中文本多元化的开发应用

来源:未知 作者:傻傻地鱼
发布于:2014-10-17 共14995字
论文摘要

  一、对外汉语教学中文本多元化的开发

  海外华人和华人社区通过自己的母语———汉语及其书面形式中文,表现出巨大的远超出其他族裔的文化凝聚力。然而,与此形成强烈而有趣对比的是,华裔儿童普遍厌恶学习中文。《纽约时报》中文网2013年7月23日有篇署名“南桥”的文章《为什么ABC们痛恨中文》讲到ABC(American-Born Chinese,出生于美国的华裔儿童)普遍痛恨学习中文的事实时指出,“在上海、北京,我也看到了很多国际学校,没听说这些同样侨居他乡的儿童恨英语、恨德语、恨法语、恨日语的。为什么海外华裔儿童的汉语教学如此失败呢?”

  由于中华文化的巨大凝聚力,多数海外华人家庭都在家中说中文,社交圈子也以华人为多,他们的孩子一般都在不同程度上能进行汉语交际,并能经常接触到汉字文化。但即使有这样的语言背景,这些孩子学习中文时仍然感受到巨大的困难,对于把汉语完全作为外语来学习的其他族裔的学生就更不用说了。

  该文指出上述现象的原因是多方面的,包括大环境不利、华裔家长和中文学校的教育方法不当等等,但是忽视了汉字本身的确比拼音文字难学得多这一重要因素。马庆株(2013)也指出,“在欧美的几百万中国人的第二代没有拼音文字多半丢了汉语;而在中亚三国的十几万回族(东干族)有拼音文字却奇迹般地把汉语保持下来”。可见,文字形式简、繁对于语言习得的重要性。

  另一个反映文字形式对于语言学习重要性的有趣现象是,中国人、日本人学习英语感到阅读很容易而听说很难很难,但西方人学习日语、汉语则相反,感到听说很容易而阅读很难很难。这显然跟文字形式的差别有关。

  虽然在对外汉语教学的初级阶段,可使用汉语拼音缓和汉字学习的困难,但是由于汉语拼音仅仅定位为“注音工具”,没有正式文字的地位,拼音过渡的阶段通常是很短的。

  与此相比,日语虽然也用大量汉字表示实词,但在初级教学阶段大量用假名拼写这些实词,而因其假名具有正式文字形式的地位,学生就可以较长时间使用假名。这不仅直接减少了初学阶段的难度,而且也大大减少了汉字对课文内容知识性和丰富性的限制、阻碍,增加了课文的知识性、趣味性。完全用汉字的教材,因为受汉字的限制,课文内容无法跟上学生的知识水平,难免使学生感到无趣。因此,海外日裔儿童学习本族书面语的困难,虽然超过本族书面母语为拼音文字的其他族裔儿童,但比华裔儿童学习中文好多了。

  其实,拼音使用阶段的长短和使用的程度,可根据不同的教学目的而不同。作为极端的例子是,对于不以阅读汉字为目的的学习者,这个阶段可以一直维持下去。

  例如,美国摩门教的传教活动散布世界各地,他们训练汉语传教人员(基本上是义务自愿性质的,主要在海外华人社区和台湾传教)完全采用拼音,学习者通常能在一年受训时间内掌握相当流利的汉语口语。这些学习者其实已经把拼音作为唯一的书面汉语而终生使用。

  马庆株(2013)在英国讲学时曾注意到,“英国半数汉语学习者竟是汉字文盲”。

  另外,一些精通汉语的西方汉学家,即使已经能相当熟练地阅读汉字文本,但在参加以汉语为工作语言的学术会议时,也往往全部用拼音写发言稿,感到读起来更容易。根据我们的观察,美国的高年级汉语学生,尽管汉字程度已经很高,在准备对话测验、写演出剧本时也常用拼音;尽管现在拼音输入汉字非常方便,可学生觉得读拼音比读汉字快。

  以上情况中,这些学习者不同程度上也把汉语拼音作为汉语的另一种文字而终生使用。

  总之,非汉字文化圈的学习者使用书面汉语,只要不是跟中国人作书面交流,往往倾向于继续使用拼音。正如柯彼得(2003)所说,“总之,外国人学习和使用汉语时,汉语拼音除了其重要的辅助作用以外,早已具有了文字的性质和价值。但是,由于大多数的中国人不重视汉语拼音,也不习惯于学习和使用汉语拼音,甚至以为汉语拼音是‘外来产品’,因此到目前为止,外国人使用汉语拼音的场合和范围还相当受限制”。不过,很明显地,随着学习汉语的国际友人日益快速增多,他们相互间的汉语交流扩大,这种场合和范围也在逐步扩大。

  万业馨(2012)在肯定汉语拼音并强调汉语教学初级阶段“拼音先行”必要性的同时,否认了汉语拼音替代汉字的可能性。理由一是“中国至今仍然在普遍使用汉字”,二是汉语同音词太多,无法用拼音文字。中国普遍使用汉字当然是现实,但是世界范围内存在着用拼音汉语的弱势汉语交际群体也是不容忽视的事实。关于汉语同音词多,其实首先是个语言问题,某些同音问题在口语中也需要解决。其次,书面语,包括汉语拼音,其实也有种种我们未曾开发的分化同音词的方法。“中国至今仍在普遍使用汉字”所能得出的直接结论应该是“至今拼音不能普遍取代汉字”,而不是否认在某些使用汉字不便甚至极其不便的场合,拼音能局部地替代汉字。最后,国际标准化组织也已经把汉语拼音作为转写汉字的标准字母形式,随着中国跟世界交往的频繁,越来越多的汉语成分进入其他语言的文字中,这本身就是汉语拼音形式事实上逐渐文字化的一方面。

  可见,汉语的拼音形式在国际上的运用领域已经超出了仅仅作为初学阶段标音工具这一范围。因此,有必要予以进一步重视,并且应该超越仅仅把它看作注音工具的局限,从一种准文字的功能去加以研究。这样扩大研究的视野和角度,也能促进我国文字学的研究。

  其实,在标准汉字文本和拼音文本之间,还可以有不同的其他文本形式,如汉字夹用拼音的文本,汉字分词连写的文本等等多种文本,用以满足不同学习者和使用者的需要。在讨论这个问题前,我们先来看看关于文字编码形式跟学习、阅读效率之间的一般关系。

  二、表音文字中的语义、语法编码

  我们这里首先来分析一下决定一种文字是否容易阅读的基本原理。首先要承认,拼音化应该是语言的书面编码的主要形式。事实上这已经是世界文字的主流。不过,现行各种主要拼音文字中,虽然以表音为主,但其文本中其实都包含了大量语义、语法信息,而这一点往往被忽视。语义信息和语法信息,两者界限不是绝对的,如专有名词首字母大写,可以说是语义信息,但由于“专有名词”是个语法范畴,因此也可以看作一种语法信息。但句首字母的大写,表示一个作为语法单位的句子的开始,完全是种语法信息了。

  以英语为例,语义信息主要是同样的语素写法相同。英语中,同一个语素,可以有不同的变体,如capable跟capacity中的同一个词根语素cap,读音差别很大,但写法相同。法语语素的韵尾辅音,往往在条件变体中不发声,但书面上仍然要写出。这里反映了“语素拼写同一性”的原则:同一个语素的不同形式变体,尽量反映出其同一性。显然,这个原则跟“表音精确性”原则有冲突,但从认知上看,对阅读理解有帮助,对于计算机的自动处理也有帮助。即使不是文字而仅仅为注音工具的汉语拼音,处理儿化字时也同样遵循这个原则,如“盖”和“干”的儿化“盖儿”和“干儿”实际发音都是ɡɑr,但是教材一般都依据原字发音分别写成ɡɑir和ɡɑnr。

  在书面表达中,语法信息的表达首先是标点符号,这是所有现代文字都采用的语法信息编码。标点当然也反映了节律停顿这一语音信息,但远不止于此。首先,一些没有停顿的地方也有标点,如书名号、专名号、着重号等。其次,不同标点的分化并不完全按照停顿大小,而主要是根据语义、语法功能。

  标点之外的语法信息,以英语文本为例,其中的语法信息主要是句首字母和专有名词的首字母大写。此外,德文中则所有名词都大写。日文用汉字表达一般实词,用表音的片假名表达西方借词(主要是专有名词和科学术语),用平假名表达各种虚词(格助词、各种后缀、语气词等等)。此外,日语中宾格助词发如ぉ/o/,但用没有其他用处的假名を(历史上代表/wo/音,但现代日语也发成/o/了)专职表示,也有增加语法信息的作用。

  阿拉伯语文本这方面很有趣,以辅音字母为主,元音用小点、小圈加在辅音字母上下方作为辅助形式,且常常省略,如 。这其实也是反映语法信息的一个手段。因为阿拉伯语中词根由辅音串构成,元音主要表示形态和词缀,基本上是虚词性质的。例如表示“书写”这一概念的词根,其基本音素是k-t-b三个辅音,填进不同的元音或附加词缀后,构成kataba(他写了)、yaktubu(他正在写)、uktub(你写!命令式),以及名词性的katib(书写者、作家、文书)、kitab(书、经、作品)等。这样,辅音表达主要的词根词汇信息,而元音表达次要的词缀语法信息;两者分别用高低、大小不同的字母表示,能够明确反映词根的连续性、整体性和同一性,便于读者一目了然地区分词汇信息和语法信息。但是阿拉伯文采取不同高低的二维形式,又跟口语语流的一维形式不一致。阿拉伯文如果采用字母一维线性排列格式,又要保留这种区分词根和语缀、虚实分明的处理格局,笔者认为就应该如上面例子所显示的那样,把作为词根的辅音字母串用粗黑体印刷,而作为语法标志的元音字母用细、浅一些的字体印刷。这样虽然不能维持词根辅音串的整体性,但至少凸显了这些辅音之间的密切关系。

  又如菲律宾的主要语言塔加碌语,是一种动词居首的VOS语言。该语言的动词词根出现在句子中通常要插入一个表示“语态”的中缀,如同一个意思“吃”k-ain,插入中缀-um-,读作kumain表示强调施事,全句的施事在后面出现时要带个前置语缀ang作为强调标志。

  写作kinain表示强调受事,后面受事出现时同样要前加强调标志ang,语态上类似被动句。为了突出动词词根的一致性,不妨分别如上所示用粗、细字母去区分词根和中缀。

  三、边际效用递减律与文字编码

  中国的文字拼音化运动至今已经有一百多年,前期进展迅猛,后期基本停顿乃至倒退,其中原因是多方面的,但是很重要的一点,也是被忽视的一点,就是对表音文字应有的表达语义、语法信息的编码手段不够重视,导致设计的文字难以阅读。

  早期从事文字改革的拼音文字倡导者,有个简单的想法:语音是语言的载体,拼音文字只要忠实、精确地记录语音信息,读者阅读时就好像听录音器,听得懂的内容,就应该看得懂。并且,表达的语音信息越丰富、越完整,越容易理解。这也就是“表音精确性原则”。但事实上情况要复杂得多,比方说用国际音标书写英语,不见得会比现行英语文本更容易读。

  首先,因为精确是有代价的。太精确的表达不仅会使文字十分繁琐,更重要的是,还会以次要信息掩盖主要信息。因此,用精密的国际音标作文字就并不合适。事实上,多数拼音文字都是精确到音位为止。所谓“音位”,就是能区别意义的最小语音单位。音位足以区别意义,超出音位音质的细微语音差别,如果都表达出来,就会以次要语音信息掩盖了区别词义的主要语音信息。

  其实,根据经济学中“边际效用递减律”(The Law of Diminishing Marginal Utility),每种手段都有个边际效用递减的问题。任何方面的表达,开始采取的一些手段往往是十分关键而有效的,是“雪中送炭”;此后的精密化,就是“锦上添花”的问题了;而过度的精密,就是“画蛇添足”了,因烦琐成为累赘和干扰。如在具有元音和谐律的乌拉尔-阿尔泰语言中,元音负载的信息量并不大。如果都表示出来,反而会使辅音不那么凸显了。因此,那些语言的文字往往省略某些很容易恢复的元音。

  总之,理想的文字,应该是语音、语义、语法三方面都根据边际效用适度地有所表达,而不应该有任何一方面被完全忽视或过分的精密化。汉字文本的情况是语音信息编码不充分。其手段主要是通过音旁,但音旁标音不精确,且常常有误导作用(错读半边)。汉字的语义信息编码主要是义旁,传达的信息很丰富。这在很大程度上弥补了语法信息的不足。汉字文本中的语法信息,除近代引进的标点符号外,几乎没有,个别的例外是“的、地、得”的分化(比较“他高兴地跳起来”、“他高兴得跳起来”的区别)。因此,优化汉语文本的当务之急就是增加语法信息编码。

  生物学告诉我们,能够对多方面的刺激进行粗略反应的生物体比只能对少数刺激进行精确反应的生物体,具有更强的生存适应能力。也就是多元化比一元化适应能力强。例如国宝熊猫,只吃竹子,它们对不同竹子的区别肯定比其他动物敏感,但熊猫因此适应能力很低,若非人工保护,早就绝种了。这可以说是大自然对边际效用递减原理的自觉运用吧。这对我们研究文字的改进也大有启发。

  文字和阅读的关系,是个极其复杂的心理现象和认知现象,仅仅从现有语法学和文字学的角度来探讨,恐怕是不够的。我们迫切需要根据当代阅读心理学和认知科学的原理去分析文字的使用效率;特别是阅读效率,因为人们阅读文字的时间远远超过学习文字和书写/输入文字的时间。

  四、汉字文本如何增加语法信息:两个信息通道的关系

  标点符号反映了重要的语法信息。引进标点符号之后,文本改进的下一步任务就是采用“词式文本”(彭泽润,2008)。“词式”文本无疑能提高初学者的阅读理解效率(沈模卫等,2001;高珊,2006;白学军等,2009)。但“词式文本”的问题是语言学中对“词”的定义并不明确。不同的人对“词”的语感也不同,这会导致写法的不同。这个问题要分两方面来看。

  一方面,即使写法有分歧,也比完全忽视“词”的存在好。好比至今我们对标点符号的使用,个人习惯不同:有人句号用得多些,有人“一逗到底”,在段落末尾才用一个句号。但即使这样,也比完全没有标点符号的文本读起来容易得多。另一方面,即使“词”的概念是明确的,严格的词式文本也不见得是最理想的。因为这样的词式文本跟口语中的自然节奏并不一致,而这种不一致会干扰对文字的认知过程。反过来说,某些不符合分词理论但符合口语节律的连写法,反而会便于阅读。

  人类接受语言信息主要有两个通道:听觉通道(听话)和视觉通道(阅读)。其中听觉通道是基本的、初始的;而视觉通道则是派生的。视觉通道中所感知的节律结构,应该跟听觉通道中感知的节律结构尽可能保持一致,才便于文字的理解(陆丙甫,2003、2005)。

  例如英语the king of England’s daughter(英国国王的女儿),其中虽然England’s连写为一个单位,但它并不是一个词,因为其中的’s是粘着在整个the king of England这个短语上的。但这种写法符合口语节奏,有其好处。再看几个英语的例子。

  (1)a.a hard-to-pronounce Chinese sound‘一个难发的汉语音’b.a Chinese sound hard to pronounce(2)a.the above-average salary‘高于平均数的年薪’b.the salary above average(3)a.a five-year old boy‘一个五岁的男孩’b.a boy five years old每对句子中,虽然前、后置定语内容基本相同,但因节律松紧的差异而写法不同。前置定语内部不能有明显停顿,一般认为这些前置定语构成一个“节拍群(phonological chunk)”(Escribano,2004),于是就用短横“-”连写起来。这一写法显然便于阅读:读者读时可以读得紧凑些,并且也预先知道整个连写单位是个定语。事实上英语中前、后置定语的性质也很不同,如(1)中的前置定语很难扩展,而后置的却很容易扩展成hard to pronounce correctly(很难正确发出的)。(3)中前置定语中的year不能带复数形态标志-s,后置的却必须带这个复数形态。

  作为反面的例子,有汉语的数目表达。汉语数目表达是“万进位”(四进位)的,即“一万个一万成一亿”,口语节奏与此是一致的,至少不冲突。但文本中若用阿拉伯数字形式,则是“千进位”(三进位)的,即三位一撇的“一千个一千成百万”。这种冲突导致中国人很难做到对书面上大数目表达的“一目了然”和“一气读出”,并且由两个信息通道的结构不一致所导致的冲突也影响了对大数目的记忆。所以123,456,789应该写作1,2345,6789,才能提高中国人对大数目的认知效率(陆丙甫,2005)。

  如果文本尽量跟口语节律结构保持一致,结果连写出来的单位就往往比词大。俄国境内的东干语(本为一种汉语西北方言),其俄语字母文本的写法就是如此(彭泽润,2008):

  (4)a.Москвачыннидиесыниyанниюйигнабыйшытулуйчелэдисанни.若转写成标准的汉语,采用词式连写,就是:(4)b.莫斯科 城里的野牲园里有一个拿白石头垒起来的山呢。其中连写的单位显然比词大,实际上就是节奏单位。这样连写虽然跟口语节律更一致,但是混淆了词跟语缀(不是词缀)的界限。笔者认为不妨采取不同的字体区分词根和后面连读的语缀。这样,既标示了口语节律,又区分了词根和语缀:

  (4)c.莫斯科 城-里的野牲园-里有一个拿白石头垒起来的山呢。这个方法,其实是借鉴了上世纪五十年代把不成音节的“儿化”用小号汉字书写的方法。用较小字体表示轻读虚词也符合“数量象似”的原理和认知心理。

  最后,汉字文本中适当引进拼音形式也能极大提高阅读效率,例如常用虚词用拼音写,可以凸显语言成分的虚、实差别,肯定能提高阅读效率。如上面那个句子就可以写成:

  (4)d.莫斯科 城-里de野牲园-里有一个拿白石头垒起来de山ne。

  进口字母词进入汉语文本,已经是势不可挡的既成事实。其实,最需要并且也能最大程度提高汉语文本阅读效率的也许是用字母表示虚词。虚词本来无具体意义,用累赘的表义汉字不仅是杀鸡焉用牛刀,而且是画蛇添足,导致虚实难分,干扰阅读。在开放字母词这一问题上,我们不能本末倒置,歧视“国货”。

  东干语跟历次公布的“汉语拼音正词法”的最大区分,是所有后置语缀都跟其前置成分连写。事实上,各语言拼音文字连写法中分歧比较大的就是“后置语缀”(enclitics)的写法。

  后置语缀不同于后置词缀,不是后置于一个单词,而是后置于整个短语。但是节律上却跟后置词缀一样,跟前置词根构成一个紧凑的节律单位,属于同一个音步。例如,日语中的各种助词,因为都是后置性的,在词调上完全属于其前置名词。因此,有些词根的区分,完全体现在后缀的高低读法不同。如“桥”和“顶端”的发音都是hasi(下划线标示念高调的音节),但“桥”的调型是只有一个高调音节的中高型,后接主格助词ga时,一起读为hasi-ga,而“顶端”是只有第一音节是低调的平板型,后接主格助词ga时,一起读为hasi-ga。两个词的词调差别,不是显示在本身,而是显示在后面的语缀上。由此可见后置语缀跟其前置从属语之间的密切关系。这样密切的韵律关系,如果文本上分成分写的两个单位,读起来非常别扭,从而影响到阅读效率。

  增加语义、语法信息的文本,当然比纯汉字文本或纯拼音文本更复杂,但是,考虑到人们阅读文字的时间远超过学习和书写文字的时间,我们应该给予可读性以更大重视。由于有了电脑输入,文字是否容易写的重要性降低了。当代文字研究者在容易学习、书写和容易阅读之间,越来越看重后者(Neef et al.,2002)。

  五、汉语声调不同的编码形式的利弊

  对外汉语教学无法离开拼音,但是把拼音进一步在某种程度上作为文字来使用,读起来往往很不便。这是因为汉字含有丰富的语义信息(主要体现在“义旁”上),一旦汉语文本拼音化,就丧失了大量语义信息。表音字母所增加的语音信息和词式文本所增加的语法信息,还不足以弥补这些语义信息的丧失。这必然会导致有太多的歧义而难以一目了然地理解。

  许多歧义虽然可以通过上下文消除,但阅读拼音文本“消除歧义所需要的语境长度”会大大超过阅读汉字文本的长度。阅读汉字文本基本不存在歧义问题,也就是说,消除歧义的语境长度为零,即绝大多数情况是读到一个词时就“同步解决”了。但阅读汉语拼音文字的往往要读到后面好几个词,甚至整个句子后,才能消除歧义,消除歧义的语境长度大得多。这会严重影响阅读效率,成本太大了。

  歧义通常由同音词、同形词导致。同音词有两种,狭义的指同音同调,广义的包括同音不同调。拼音中文如果标调,则可以大大减少广义同音词和同形词。

  标调方式主要有两种。一种是“上加调号”,如汉拼(汉语拼音方案);另一种把声调“拼入音节”,如像国罗(国语罗马字)那样的“用字母拼写形式标调”。前者容易学习,但作为文字可读性低。后者正如维基百科上的“国语罗马字”条目指出的那样:“繁琐的规则使国语罗马字不便学习与运用,因而一直无法普及于社会大众,但其不需特殊符号或数字便可标调的特点,却使以国语罗马字做拼音的文字相对来说可读性高出许多。”这个评论相当中肯。

  考虑到许多外国学习者不仅仅是把拼音当作学习工具,而且在不同程度上当作文字使用,拼音的可读性应该受到更多重视。

  例如美国加州州立大学河边分校东亚系汉学家Perry Link(林培瑞)教授,汉语说得非常地道,阅读中文也很熟悉。国罗是他早年初学汉语时用的,此后主要接触汉字和汉拼,国罗仅仅用于准备中文会议发言等场合。但他仍感到阅读国罗比阅读汉字或汉拼更省力,阅读速度更快。

  Perry Link教授告诉笔者,他如果准备中文的会议发言稿,就会用国罗,因为可以把声调读得更准确。另外,比起汉语拼音,他觉得阅读国罗时对理解有更大的信心。

  据一些以前在教学中用过国罗后来改用汉拼的美国资深中文教师的经验体会,借助于国罗教汉语,学生对于声调的掌握非常好,效果明显超过通过汉拼学习汉语。

  同样为拼音的国语罗马字和汉语拼音,为何在声调掌握和阅读效率上有这种差别,是个非常值得从阅读心理学和认知科学角度去分析的有趣问题。按理说,上加调号更加独立和凸显,应该更容易记住才是;但实际情况相反。问题相当复杂,需要通过专门的深入研究才能解决,包括心理语言学的实验等等(笔者至今没见过这方面的比较实验)。我们这里只能作一些初步的推测。

  这里面可能牵涉到以下几个原因:

  1)国罗那样的“拼入音节”难学。但难学的东西一旦学会,就不容易忘记,而容易学会的汉拼上加调号也容易忘记。

  2)上加调号容许使用者在许多场合省去调号,导致对声调掌握的忽视。根据我们的观察,上加调号在外国学生学习生词的时候起一定的作用,但是一旦学生学会了这个词便抛弃调号,只看字母,写时也能省就省。而国罗的拼法强迫学生无法在使用过程中偷懒省略声调,就在长期的反复使用中更好地掌握了声调。

  但问题恐怕还不这么简单,可能牵涉到更深的认知心理。像林培瑞那样的汉学家,对汉字和拼音运用那么多,仍然感到国罗最容易阅读,又如何解释呢?这就牵涉第三个因素,也许是主要因素:

  3)声调融入音节的程度不同导致的不同认知效果。从语音学看,汉语的声调共时地跟整个音节密切融合,是整个音节中不可缺少的有机部分,决不是附加在声、韵和音节之上的额外成分。“拼入音节”反映了包括声调在内的音节一体性和整体性,比较符合实际语音结构和认知心理,因此处理起来有认知上的优势。换言之,国罗标调把声韵调一体化,一个音节作为一个整体处理;而上加调号把作为一体的音节割裂成声韵(音节)和声调两部分。“汉语一个音节可以有四种声调”的说法,其中的“音节”就是指去掉声调的抽象音节。这跟实际音节结构不一致,因违背认知心理而导致了阅读上不便。

  Link教授认为,阅读国罗的tinɡ(tinɡ的第一声)时不会想到tynɡ(tinɡ第二声)、tiinɡ(tinɡ第三声)和tinq(tinɡ第四声)。

  这个说法就反映了上述差别。也就是说,拼入音节起到了“一步到位”地直接区分同声韵而不同声调之音节的作用,而汉拼那样的上加调号对同声韵之音节的区分是间接的。直接的区分比间接的区分在认知上效率更高。

  因此,为探索汉语文本的改进问题,似乎有必要从教学效果角度对拼入音节和上加调号的差别做些深入的学术研究。

  此外,上加声调在技术处理上也比较麻烦。跟国际拼音文字常规不接轨,不利于拼音中文走向国际。表现之一就是带调号的汉语拼音进入外语后,就只好放弃调号,导致大量同形词。

  2012年5月15日全国启用的新版普通护照,规定字母ü大写时用YU代替,如“吕”,用LYU拼写。这是为了跟使用日益普及的电子护照保持拼写一致,因为英文字母及电脑键盘上无ü。此前,“吕”字的拼写只能用LV或LU代替。由此可见上加符号之不便。汉语拼音方案中的声调在护照上也因此只好省去,使成千上万中国人从不同姓变成同姓。中国的姓本来就少,加之比较集中于几个“张、李、黄、王”等一些大姓以及同姓名的人的数量巨大,如果再不区分“吕”跟“陆、鲁、卢”,问题就更严重了。这在英文学术论著的文献引用中已经表现出来。英语学术论著的正文中注明所引出处时,一般只用圆括号注出作者的姓和文献发表年份,如朱德熙1979年的论著,就写为(Zhu,1979),但是如果有关领域的中国研究者的文献较多,同姓者较多,如在汉语语言学的论著中,往往在姓之外还加上名的首字母缩写,如(朱德熙,1979)就写成(Zhu,D.X.1979),或(Zhu,D-X.1979)、(D.Zhu 1979)等(特别是“张、黄、李”等一些大姓,更有这样进一步区分的必要),可惜目前还未有统一形式。

  目前,通过汉语拼音进入国际的汉语成分还很少,但随着国际交流的增加,越来越多的汉语成分进入国际信息交流系统是必然趋势。省去声调的拼音必然带来很多进入国际的同音词、同形词,包括汉字不是同名同姓而到国际上就成同名同姓的情况。这对汉语走向国际显然是很不方便、很不利的。这些新情况都是当初设计主要作为学习工具的汉拼所没有想到的,我们有必要根据新的需要进行与时俱进的思考。

  六、汉语拼音文本中如何增加语法信息:节律和语法

  进一步看,即使标调,不管是国罗式的还是汉语拼音方案式的,拼音中文仍然会有大量同音、同形词。解决这个问题的方法就是“定型化”分化(尹斌庸,1980)。

  这类似英语中同音词的分化,如no、know;new、knew;I、eye;right、write。这些分化,即使用于少数同音词,但由于是常用词,也能在提高阅读效率方面发挥极大的边际效用。又如法语中发音相同的poids(重量)、pois(豌豆)、poix(松香)3个词,词末的-ds、-s、-x不发音,就起到了区分同音词的作用。

  从前不标调的北拉借鉴国罗而仅仅分化了“山西Shanxi、陕西Shaanxi”,“大da、打daa”,“买maai、卖mai”和“在zai、再zaai”这四对常用词,就有明显的效果。其中Shanxi、Shaanxi的分化,在邮电部门和其他领域,一直被继承了下来。由中国地名委员会制定《中华人民共和国地图(汉语拼音版)》也是这样,这一区分也得到了国际公认。

  如果说英语、法语中这些区分有历史的原因,这些不同的写法反映了历史语音的话,那么,德语中许多区分同音词的手段就纯粹是人为制定的(冯志伟,2003),如同音的Lid(眼皮)、Lied(歌曲)的分化(德语名词首字母都大写),同音的malen(画图)、mahlen(磨碎)的分化。德语中的同音词问题并不严重,对定型化也就没有系统深入的研究。但汉语中同音词数量大,定型化决不能零敲碎打地一个个具体解决,需要找到一个广泛适用的原则性方法。

  下面讨论根据语法性质分化同音词的方法。

  跟零敲碎打定型化不同的是,增加语法信息的分化,可以成批地应用于同范畴的语法结构。例如专有名词的大写,一下子就可解决一大批同音、同形词。除尹斌庸(1980)等研究外,这方面进行了大量研究的还有马庆株(2013),该文在汉语拼音的基础上,借鉴国罗的一些原则并加以简化,将声调拼入字母串去区分同形词。当然还有其他的分化方法。如对于同样的多音节连写单位,可以根据不同语法结构采用不同的连写法。首先是汉语中双音“韵律词”太多,大量同形词是双音节单位。不妨采用以下方法进行语法分化(Lu,1997):

  1)方位结构用“短横半连写”,例如“山-上、天-上、地-下”,其中的方位后缀倾向于轻读。

  2)动介(动词+介词)结构用“隔音号连写”,如“住’在(农村)”、“生’在 (哪一年)”。其中被吸收到(incorporated)动词上的介词轻读倾向比后置方位词更明显。

  3)动宾结构用小点“.”半连写。如“种.田、看.书”。其中宾语没有轻读倾向。

  以上双音单位,如果分写,严重违反口语节奏,阅读起来很不自然,影响阅读效率。我们听、读汉语(解码)时不会听一个音节就去索取意义,因为歧义太多。双音节是消除歧义的基本单位(陆丙甫,1985a、1985b)。以前有人主张“吃饭”和“读书”的宾语虚化时,即作“用餐、进食”和“上学、学习”解时连写成词,作“吃米饭”和“阅读书籍”解时则分写成词组。但是两个意义的“吃饭”和“读书”在语法性质上并无差别,况且许多上下文中是模糊甚至两可的,那又怎么办?连写的好处是反映了双音节音步是“解码的基本单位”这一倾向。再看三音节单位的分化。

  从节奏上看,三音节主要有两种情况:“双音节+单音节”的2 1组合和“单音节+双音节”的1 2组合。其中2 1组合比1 2组合在韵律上紧密得多,原则上2 1组合应该连写,而1 2组合通常可以分写。以下具体举例分析。

  2 1节奏的方位结构和“动-介”结构可以依照双音节同类结构的处理,如“天空-上、桌子-下”,“战斗’在 前线”。2 1节奏的三音节的“定语+名词”全部连写,如“骆驼毛、复印件、运输品”等等。事实上,其中的后置单音节往往是粘着语素,例如“复印件、运输品”中的“件、品”。即使后置单音节是成词语素,如“骆驼毛”,我们的语感中,跟后置单音节不成词的“骆驼绒”结构和节律上并无任何差别,都是典型的复合词。

  1 2节奏的三音节结构基本分写,如“看 小说、听 故事”。但是其中有少数的前置单音节是带有前缀性质的粘着语素,可以用短横连写,如“副-厂长、总-经理”。动补结构可以用隔音符号连写,如“看’清楚、想’明白”。四音节有三种节奏,2 2、1 3和3 1。两个双音节组成的四音节结构基本可以写成两个双音单位,如“桌子 底下、解决 问题”。

  但是歧义结构“进口电视”、“组装电脑”,因为不同解读的节律不同,可以分化。黄彩玉(2012)通过实验语音学的测量发现,上述歧义结构,作定中结构时,“进口”、“组装”在时长、最高基频、调域上都长于、高于、大于述宾结构的“进口”、“组装”。相反,理解为述宾结构时,“电视”、“电脑”在时长、最高基频、调域上都长于、高于、大于定中结构的“电视”、“电脑”。或者说,这类歧义结构作定名时,倾向“重-轻”节律模式;作动宾结构时,倾向“轻-重”节律模式。此外,前后两个双音节之间的停顿大小也不同:作动宾时较松散,作定名时更紧凑。两方面的差别其实是密切相关的。其他一切条件相同的情况下,总是“重-轻”节奏比“轻-重”结构更紧凑,整体性更强(柯航,2007)。前面说过前置词短语比后置词短语更松散,也是因为前后置词相对轻读所造成的。

  如果要把上述歧义结构在文本上加以区分的话,松散的动宾结构可以分写,而紧凑的定名结构可以用半连写形式“进口-电视、组装-电脑”。

  1 3节奏取决于前置单音节是否是粘着语素。如“总-指挥员、副-董事长、太-皇太后(不是“太皇-太后”)”用短横连写,而“大 会议厅、看 旧 小说、新副-经理”等等分写(后面的三音节按照三音节写法规则去写)。

  3 1节奏名词性单位用短横连写,如“研究生-院、鱼腥草-素”,当然,不用短横的全连写也可以,但是用短横便于阅读和理解。动宾结构则分写,如“看完了书、看不起他”。

  最后,像“高不高兴”、“应不应该”这样的组合,分写成“高 不 高兴”这样的形式显然不便阅读,也不能反映第一个“高”不是“高低”的“高”,而是“高兴”的省略的事实。因此,不妨写作 “高’不 高兴”、“高’不-高兴”或“高’不高兴”。事实上西方文字中的隔音号,常用的一个功能就是表示“减缩”,如英语的o’er(over)、can’t(cannot),法语的c’est等。

  五音节结构中,4 1节奏的可以短横连写,如“古生物学-家”。其余大部分可以拆开成1 4、2 3、3 2作两个单位处理。但是,少数第一字为粘着语素而结合比较紧密的1 4节奏,如“副总工程师”可以在第一个音节后加短横写成“副-总工程师”。

  以上所说那些不同的半连写符号,其实就是传统标点符号的扩大运用,是扩大深入到了词内结构,或者说“韵律词”(冯胜利,2000)和“语法词”内部的标点符号。

  从上述例子中可以看出,汉语的节奏组合具有很强的规律性。例如,歧义的“复印 文件”,作名词时只能省略成紧凑的“复印件”,作动宾结构时只能省略成松散的“印 文件”。由此可见,汉语虽然没有像西方语言那样比较明确的词划分和显性语法标记,但是汉语的节奏规律往往反映了一定的语法类型,有着相当的语法意义。

  吕叔湘(1979:65)说过,由于形态标记少,“语法范畴主要依靠大小语言单位互相结合的次序和层次来表达”。“结合的次序和层次”的形式差异,就落实在节律上。近年来随着对汉语韵律的深入研究,学者们越来越注意到,韵律(轻重和松紧)在汉语中的重要作用,在很多场合起到了相当于其他语言的语法形态的作用(冯胜利,2000)。

  上述种种不同的连写法和半连写法,不仅更明确地显示了“层次”,而且用不同半连写手段丰富了文本的语法信息。连写方式的多样化,其实是汉语这种形态特点的如实反映,我们不能低估其认知上的功能价值,应该在文本的多元化和改进方面加以充分利用。

  这些手段,便于读者更好地把握诵读节律,如区分“山-上”(第二音节倾向轻读)、“住’在(农村)”(第二音节明显轻读)和“看.书”(第二音节较重)的细微差别。

  此外,三种半连写符号的分工也很明显:隔音号用于动词性单位,短横用于名词性单位,小点用于动宾结构。

  这些手段,对于正常汉字文本当然是不必要的,因为其语义信息编码已经足够丰富,足以弥补语法信息的不足;但是对于拼音文本,却能起到用语法信息有效地弥补语义信息丧失的作用。此外,在对外汉语教学的汉字文本中,为减少学生阅读理解和诵读的困难,也可以在一定范围和阶段加以运用。

  对于外国人学习中文,除了汉字本身的难学外,在形态标记极少的情况下如何“组字成词”,再“组词成句”,也是个极大的挑战。节律编码形式化后,同为三音节词,1-2节律和2-1节律中的前置和后置的单音节字,范围就大大缩小,理解意义就容易得多。并且,这些节律标注形式不但有助于学生理解语法结构,也有助于学生掌握正确的诵读节奏。

  七、信息时代的汉语文本多元化

  教学文本多元化方面,日本的做法很值得借鉴。标准日文也是没有分词排版的。由于日文文本有汉字、片假名、平假名三种形式,有一定的分工(片假名主要拼写西方外来语,汉字主要书写实词,平假名主要用于词尾形态),文字的语法信息比汉字文本丰富,因词界不明造成的阅读困难比汉语文本小得多。一些日语、汉语同样好的双语朋友告诉笔者,他们觉得阅读日语比阅读汉语速度快些,轻松些。尽管如此,日本语文学界和教育界仍然高度重视分词排版的作用。日本幼儿园和小学低年级的课本、读物全部采用分词排版;到了三四年级,才开始逐渐增加不分词排版的教材。日本的许多对外日语初级教科书也采用分词排版以减少初学阶段的困难。并且,日语的对外教科书,初级教材中的实词采用较多的假名拼写,跟标准文本差别很大,并且采用词式书写。随着程度的提高,实词的书写中逐渐减少假名的使用。这对汉语的分级教材也有可借鉴之处。

  文本多元化,除了教学领域外,在其他领域也有需要,也是现实生活中无法避免的。

  我们前面提到,一些外国人需要把汉语的拼音文本在私下场合当作文字来使用。随着汉语在世界上的日益扩大使用,这种需要必然日益加强。例如,目前已经有多个学习汉语的老外用拼音汉语聊天的网页,其中最大的是“学习汉语聊天室”,都是汉语学习者用拼音在聊天练习。这个聊天室已经存在十多年了,参与者主要是学习中文的外国学生。部分地由于受到汉语拼音作为文字不完善性的限制,交流并不深入、复杂。对于这样的阵地,对外汉语教学界不应该消极旁观,而应该积极引导并利用。

  周恩来1958年1月10日在政协全国委员会上的报告《当前文字改革的任务》,其中第四点是帮助外国人学习汉语,指出我国地位日益提高,愿意学习汉语的人是越来越多了。紧接着就说“他们遭到的最大困难就是汉字,因此常有望洋兴叹之感。”(王均主编,1995:564)。

  鉴于此,马庆株(2013)认为,在不放弃汉字的前提下,“应该也可以包容和更多地利用拉丁字母,用汉语拼音帮助汉语汉字走出汉字孤岛,走向世界”。

  人类文字发展史显示,许多改进都源自于程度较低的使用者的创造,如日文中的表音假名最初就是妇女专用的,假名后来进入正规文本,极大地提升了日文的适应能力。欧洲拼音文字最初是通篇连写的,后来的分词、分段和标点都是首先在文化程度较低的使用者中开始的(Cavallo & Chartier,1999:64-89)。未来汉语的拼音文本,也有可能孕育于汉语水平低的外族学习者。他们使用的同时也就是在实践中实验。这种有限范围的“汉语拼音特区试验”对汉语主流社会的使用毫无消极干扰,只会提供积极参考。用外国人做这种他们也乐意、自愿的实验,何乐而不为?

  自五四运动开始提倡白话文,到白话文彻底战胜文言文而成为唯一法定书面标准语,经历了30多年时间(在港、台地区时间更长)。在这个漫长的过渡阶段,中国实际上处于两种书面语言并存的书面双语状况中,文言仍然在一些文人信件来往和某些报刊中存在。这个过渡阶段有其积极意义,它使白话能更多吸收文言中的积极因素,构成现代汉语的“庄雅文体”(冯胜利,2010)。为了慎重、逐步地优化汉语,为什么不能容许汉语的汉字文本和包括拼音文本在内的其他文本变体同时存在的“一语双文”或“一语多文”呢?现代汉语不同文本并行的冲突,不见得像某些人想象的那么严重,至少比白话、文言并行的冲突小多了;而实际价值是很明显的:至少能给数量日益增长的正在学习汉语或者已经基本学会汉语的外国人提供一种对他们更方便的阅读和交流使用的文本,增加他们的实践和使用机会,可以为汉语走向世界减少阻力。在全球化的时代,这一点的重要性更不应忽视。

  无疑地,汉语程度较低者各种场合所使用的汉语文本变体,包括国际互联网上出现的各种变体,为汉语文本的长远改进提供了必要的多元化实践经验和选择空间。

  历史上每次书写工具的改革,都带来文本形式的改变。今天电脑输入、电脑排版正在迅速地取代手写和传统排版。这一改革,跟历来的书写工具改革不同,是史无前例的根本性质的转变。只要我们解放思想,敢于并善于吸收世界文字的各种优点,完全可以让古老的汉字和日新月异发展的汉语适应当前的信息化时代(陆丙甫,2008、2013)。

  并且,电脑输入和排版也为文本形式的丰富化提供了极为便利的条件。首先,电脑要做到不同文本间互相转换的难度比不同语言的电脑翻译容易得多。又如,词式文本中的空格大小在显示时很容易控制,甚至选择不显示。学习者可以随着程度的提高,逐渐缩小空格直至完全不显示;也可以在阅读过程中,根据需要在词式文本和标准文本之间随时转换;根据汉语中节律的重要性,也可以把空格分成大、小两种,较大的空格用于长句子中需要一个停顿、但用逗号又显得小题大做而不适宜的、切分较大“意群”的场合。再如,拼音输入基本都是按词输入的,输入软件只要把用户输入汉字时的分词过程记录下来,就可以根据需要随时显示词界而获得词式文本(黄昌宁等,2009)。编码进更多语义、语法信息的文本,也必然大大便利汉语文本的计算机处理。这一点,只要设想一下如果现行汉字文本仍然没有标点,会给汉语文本的计算机处理带来多么巨大的困难,就可以知道了。例如,词的切分是汉语文本计算机处理中的第一步,这一程序在词式文本中就不再成为必要。

  总之,汉语文本多元化,不仅为对外汉语教学过程所需,也为汉语走向世界、走向未来提供了更广阔的选择空间。

  参考文献:
  1.白学军、田瑾、阎国利、王天琳 (2009)词切分对美国大学生汉语阅读影响的眼动研究,《南开语言学刊》第1期。
  2.冯胜利 (2000)《汉语韵律句法学》,上海:上海教育出版社。
  3.冯胜利 (2010)论语体的机制及其语法属性,《中国语文》第5期。
  4.冯志伟 (2003)从英德法语的正词法看汉语拼音正词法,《语文建设通讯》第73期。
  5.高珊 (2006)词切分信息对留学生汉语阅读的影响,北京语言大学硕士学位论文。

作者单位:
相关内容推荐
相关标签:
返回:应用语言学论文