不同音节条件下塞音感知的情况,普通话论文

　　一、引言

　　塞音是语言中最常见的音类之一,但不同语言的塞音系统是不同的。如汉语、英语是塞音二分的语言(石锋、冉启斌,2008;Chao & Chen,2008),而泰语、韩语是塞音三分的语言(Kess-inger & Blumstein,1997;Kim & Duanmu,2004)。塞音系统的不同会给第二语言习得者带来习得困难。比如,母语中有浊塞音的习得者在学习汉语塞音时会出现清音浊化的问题,而中国人在习得这类有浊塞音的语言时又可能将浊音清化。(温宝莹等,2009;王茂林,2009;张锦玉,2012)因此,目前不少学者都围绕着作为目的语或母语的汉语在塞音上的特征进行研究。可是,较之塞音声学研究,塞音的知觉研究无论在数量上还是在深度上都有着比较大的差距。我们知道,语音的习得首先从感知开始,Flege(1999)的研究也发现,发音与感知之间有着密切的关系。

　　所以,如果不能正确地感知目的语的语音,那么就谈不上正确地产出。因此,对于汉语塞音的研究就不能仅停留在声学层面,而是应该深入到感知的层面,从语音接收的角度做大量的心理分析,这样才能为第二语言习得提供更多的数据和理论支撑。

　　范畴性知觉(Categorical perception,CP)是指连续的语音刺激被感知为离散的、数量有限的语音范畴,人们对同一范畴内的语音难以区分,而对范畴间的语音则很容易识别。(Liberman等,1957)塞音的知觉也属于范畴性知觉,这在不同的语言中都得到了印证。

　　Lisker &Abramson(1970)发现英语等区分清/浊的语言的塞音在VOT知觉上是范畴化的,西班牙语、法语的塞音知觉也同样是范畴化的,但它们的范畴边界却存在差异。此外,不少研究还发现,不仅成人具有语音范畴化能力,且一岁左右的婴儿也已建立起语音的范畴化知觉,他们可以区分母语中不同范畴的塞音,但是对非母语中塞音的区分能力则不强。 (Lasky等,1975;Aslin等,1981)来自二语习得方面的证据也表明,成人对第二语言塞音的感知范畴能力也是可塑的。

　　(Pisoni等,1982;张林军,2009)这说明,受语言经验的影响,人的范畴化感知能力是动态的、可重组的。

　　汉语塞音的知觉也具有范畴化特点,但关于范畴化边界的VOT数值则有不同的观点,大约从25ms到45ms不等。(杨玉芳、方至,1984;王韫佳、上官雪娜,2004;席洁等,2009)此外,一些学者还研究了其他因素对塞音感知范畴化的影响,如杨玉芳、方至(1984)认为,发音位置不会影响塞音的感知边界;杨玉芳、金凌娟(1988)发现塞音发音方式的感知与音节的声调判断存在交互影响的关系。可见,语言环境对于音位的范畴化感知是存在一定影响的。

　　综览上述研究,我们发现,目前塞音感知的研究已较为深入,但是关于不同音节条件下塞音感知的情况以及塞音感知与其声学特征之间的联系还研究较少,因此,本文试图针对上述问题对汉语塞音的感知问题进行研究。

　　二、实验过程

　　(一)刺激语料

　　为观察不同发音部位和不同声调对塞音知觉的影响,本文选取以/u/为韵母、以/p/、/ph/、/t/、/th/、/k/、/kh/为声母的CV单音节并配以阴阳上去四个声调,共得到24个音节。

　　本次实验的发音合作人为一名女性,28岁,能说标准的普通话。发音人没有经过系统的发音训练,无口鼻咽喉障碍,听力及视力正常。录音在安静的教室中进行,使用软件为Audacity,采样率设为16000Hz。在合成刺激音前,我们测量了所有原始刺激音的韵母时长和声母时长。经测量,原始刺激音的韵母平均时长为513.5ms,不送气塞音的VOT平均时长为15.7ms,送气塞音的VOT平均时长为106.8ms。由此,我们制定了刺激音样本的合成标准:所有音节的韵母时长均设为450ms,声母部分的VOT时长设为90ms,并以10ms为步长逐一递减,直至0ms。由此,本研究共得到120个刺激音样本(3组塞音×4组声调×10组不同VOT时长),根据辨认实验和区分实验不同的要求,对这些刺激音样本进行组合或拆分。

　　(二)被试

　　本实验被试均为非中文专业的中国人,共16人,其中男性10人,女性6人,平均年龄29岁,所有被试均没有听力障碍或听力疾病,能够说标准的普通话。

　　(三)实验过程

　　本次实验包括辨认实验和区分实验两部分,为使实验结果更加科学、准确,辨认和区分实验使用相同的被试。实验开始前,主试如实登记被试的信息,包括姓名、年龄、性别、普通话情况、方言情况、有无听力疾病等信息,然后向被试说明实验要求。

　　辨认实验共120个刺激音,这些词以无序、随机状态排列,每个刺激音播放一次,中间有2秒的停顿供被试选择。实验要求被试听到一个刺激时就在问卷上选择其认为正确的选项,该选择为强制选择。辨认实验约5-6分钟。区分实验共96个刺激音对儿,我们采用AX式组合刺激音,即每个刺激音对儿由两个词语组成,要求被试判断二者是否完全相同。在每对儿刺激音中,两个刺激音的VOT相差20ms,相隔500ms。在播放刺激音时,我们仍采用单次、无序、随机的形式播出,要求被试在问卷上选择“A相同”或“B不同”。区分实验约5-6分钟。

　　(四)数据统计

　　实验完成后,我们将被试的纸质问卷结果输入excel表格,共得到辨认数据1920个(120个刺激×16人)和区分数据1536个(96个刺激×16人),然后分别计算塞音听辨率、区分率,找到不同塞音知觉的边界位置、边界宽度、区分峰值以及知觉范围,并按照不同发音部位(双唇塞音组、舌尖塞音组、舌根塞音组)和不同声调(阴平组、阳平组、上声组、去声组)对实验结果进行分类平均,共得到7组数据。之后,我们将用SPSS软件对数据进行方差分析。

　　(五)相关参数介绍

　　本实验涉及若干术语和参数,简要解释如下(见图1):

　　论文摘要

　　边界位置:两条辨认曲线在交点位置对应的VOT值。边界宽度:在边界位置两侧,某塞音辨认率达到25%至75%的VOT值区间范围。塞音的知觉范围:指某塞音的感知区间占发音人整体VOT区间的百分比。区分峰值:区分曲线上最显著峰值处的百分比数值,即区分率的最大值。辨认/区分曲线平滑度:指辨认/区分曲线的整体趋势是否平滑,若出现起伏,则代表该曲线存在一定程度的波动。

　　三、实验结果

　　(一)总体情况

　　Liberman等(1957)认为语音知觉范畴化的判断标准主要有三:一是在辨认实验中,两个连续刺激之间的辨认率出现突变;二是区分曲线出现明显峰值;三是辨认曲线的突变处和区分曲线的峰值能够对应,该处即为感知的范畴边界。

　　图2中各组曲线均有类似特点,具体表现为:首先,辨认曲线平滑度好,波动较小,辨认曲线中有明显的突变;其次,区分曲线两端区分率较小,中间区分率较大,有明显峰值;最后,区分峰值基本都在辨认曲线的突变处,二者有较好的对应关系。可见,中国人的塞音知觉属于典型的范畴化知觉。

　　从具体数值上来看,汉语塞音知觉的边界位置大约在35-55ms之间,边界宽度约在10-20ms左右,VOT小于35ms的塞音多半被感知为不送气塞音,而VOT大于55ms的塞音则多数被感知为送气塞音,被感知为不送气音的范围要小于送气音的范围;塞音区分峰值较高,约在50%-80%之间,范畴化程度较高 (Xuetal,2006)。但是从图中我们也可发现,发音部位和音节声调对塞音的知觉是有影响的,因此下文将从这两个角度分别讨论普通话塞音的知觉情况。

　　论文摘要

　　(二)不同发音部位塞音知觉的情况表

　　1是按发音部位和声调类型两个因素对听辨结果进行分类统计的数据表。为了更直观,我们又做出了图3。其中左侧为辨认曲线图,横轴表示VOT时长,纵轴表示辨认为不送气塞音的百分比;右侧为区分曲线图,横轴表示VOT相差20ms的刺激音对儿,纵轴表示区分率。

　　论文摘要

　　由图3可见,不同发音部位的塞音知觉均有明显的辨认边界和区分峰值,且峰界能够较好地对应,说明不同发音部位塞音的知觉均为范畴化知觉。

　　在边界位置上,双唇塞音的边界位置为34.4st,舌尖塞音的为37.2st,舌根塞音的是53.8st;方差分析显示,舌根塞音与双唇、舌尖塞音在边界位置上均差异显著(ps<0.05),而后两者之间的差异不显著(p>0.05)。可见,发音部位越靠后,知觉边界越靠后,即偏大后移。

　　在边界宽度上,不同发音部位塞音的边界宽度排序表现为双唇塞音<舌尖塞音<舌根塞音;方差分析显示,舌根塞音与双唇、舌尖塞音在边界宽度上均差异显著(ps<0.05),而后两者之间的差异不显著(p>0.05)。所以,发音部位越靠后,边界宽度越大,反之边界宽度越小。

　　在区分峰值上,从双唇塞音到舌尖塞音再到舌根塞音的区分峰值是依次减小的;方差分析的结果仍然表现为舌根塞音与双唇、舌尖塞音差异显著(ps<0.05),而后两者之间差异不显著(p>0.05)。这说明,发音部位越靠后,区分峰值越小,范畴化程度越低;反之则区分峰值越大,范畴化程度越高。

　　在不送气塞音的知觉范围上,双唇塞音为38.2%,舌尖塞音为41.4%,舌根塞音为56.5%,表现出随发音部位后移而知觉范围变大的趋势;方差分析显示,舌根塞音与双唇、舌尖塞音差异显著(ps<0.05),而后两者之间差异不显著 (p>0.05)。由此可知,发音部位越靠后,不送气塞音的知觉范围越大,也就是说塞音越容易被知觉为不送气塞音。

　　(三)不同声调音节中塞音知觉的情况

　　图4是不同声调音节中塞音的知觉曲线图,其中左侧图为辨认曲线图,右侧图为区分曲线图,横轴、纵轴所表示的意义同图3。由图4可见,不同声调音节中塞音知觉均有明显的辨认边界和区分峰值,且峰界能够较好地对应,说明不同声调音节中塞音的知觉均为范畴化知觉。

　　论文摘要

　　在边界位置上,塞音知觉的边界由小到大依次为阴平组、去声组、阳平组、上声组,方差分析显示,阴平、去声组均与上声组差异显著 (ps<0.05),其他组间差异不显著(ps>0.05)。可见,阴平、去声也即声调起点在高调域的声调容易使边界位置偏小前移,而上声、阳平也即声调起点在中低调域的声调易使边界位置偏大后移。

　　不同声调组在塞音知觉边界宽度上的排序与边界位置的排序相同,也表现为阴平组、去声组、阳平组、上声组,其中阴平组与阳平、上声组的差异显著(ps<0.05),其他组间差异不显著(ps>0.05);说明高调域起点的声调组边界宽度较窄,而中低调域起点的声调组边界宽度较宽。

　　在区分峰值上,阴平组的区分峰值是最高的,为64.6%,去声组的区分峰值是最低的,为52.1%,上声和阳平组居于其间;其中,阴平组与阳平、去声组,上声组与去声组的差异显著(ps<0.05),其他组间差异不显著(ps>0.05)。所以,阴平组的范畴化程度是最高的。

　　不同声调组在不送气塞音知觉范围的排序上由小到大依然是阴平组、去声组、阳平组、上声组;方差分析显示,阴平组与阳平、上声组,去声组与上声组差异均显著(ps<0.05),其他组间差异不显著(ps>0.05)。由此可知,高调域起点的声调使不送气塞音知觉范围变小,塞音更容易被感知为送气音;而中低调域起点的声调则使不送气塞音的知觉范围变大,塞音更容易被感知为不送气塞音。

　　四、讨论

　　从本文3.2部分的结果可知,不同发音部位塞音的知觉很有规律,表现为发音部位越靠后,感知边界越靠后,边界宽度越大,区分峰值越小,越容易被感知为不送气塞音;反之则反。对于上述规律,我们认为可以从发音生理的角度得到解释。

　　我们知道,不送气塞音的口腔气流小于送气塞音,前者峰值气流率显著小于后者。(牛海军等,2007)所以口腔送出的气流越大,越容易被感知为送气塞音。双唇和舌尖塞音的发音部位靠前,口腔后部空间较大,所盛气流也较多,因此发塞音时可以用成阻部位灵活、有效地调节气流,从而可使送气音有明显的送气过程和较大的送气程度,也就容易被感知为送气音;而舌根塞音的发音部位靠后,其后部空间有限,所盛气流也相对较少,发音部位相对前二者不够灵活,因此发送气音时,送出的气流量相对较少,更容易被感知为不送气塞音。

　　关于普通话塞音知觉与声学特征的关系,我们认为,二者存在一致性关系。根据方差分析的结果,舌根鼻音在听辨的各项指标上均与双唇塞音和舌尖塞音差异显著,而后两者之间则无显著性差异。因此我们认为,塞音知觉与发音部位的关系表现为具有“前”特征的双唇、舌尖塞音与具有“后”特征的舌根塞音的二分对立,并非双唇/舌尖/舌根三分对立。该结论与冉启斌、石锋(2007)对普通话塞音声学特征的研究结果一致,表明人耳对塞音的知觉特点与塞音本身的声学特征存在密切关系,且前者可以从听觉心理学的角度对后者进行验证。

　　石锋、冉启斌(2008)在声学实验的基础上提出了普通话的“塞音声学格局”,他们认为40-60ms的VOT区间是普通话塞音的声学断裂带,其左侧为不送气塞音区,右侧为送气塞音区。

　　根据本文的结果,普通话送气与不送气塞音的知觉过渡区大致为30-60ms,其左侧被感知为不送气塞音,右侧被感知为送气塞音。(见图5)可见,普通话塞音知觉过渡区的范围大于其声学断裂带,后者处于前者的范围之中。这说明人耳对某一语音的感知是基于其声学特征的,但听者在感知语音时又参照其母语经验对语音进行复杂的心理加工,从而表现为知觉与声学范围既交叠又不一致的关系,这也可以解释不同母语者对同一语音知觉的差异。

　　论文摘要

　　对于音节声调类型对塞音知觉的影响,我们发现,阴平和去声可归为一类,它们是起点音高较高的声调,可以使塞音知觉边界位置靠前,边界宽度变小,更易被感知为送气塞音;而阳平和上声可归为一类,它们是起点音高较低的声调,可以使塞音知觉的边界位置靠后,边界宽度变大,更易被感知为不送气塞音。从塞音与声调声学方面的相互作用来看,Zee(1980)对广东话的研究发现,送气塞音后的元音基频起点高,不送气塞音后的元音基频起点低。

　　也就是说,塞音的送气特征可以提高后接元音基频的起点,而起点基频高的元音则可以强化塞音的送气特征,反之则反。究其原因,我们认为,阴平、去声在时长上都比较短,阳平、上声的时长则较长,(Howie,1976;Rose,1981)而汉语音节的长度则有趋于相等的趋势。因此,为了平衡音节时长,声调时长就与塞音时长互相调节,表现为在时长较短的阴、去声音节中,塞音被感知到的时长会偏长,也即易被感知为送气塞音;而在时长较长的阳、上声音节中,塞音被感知到的时长会偏短,易被感知为不送气塞音。

　　但关于声调与塞音知觉的关系也存在相反的观点。杨玉芳、金凌娟(1988)的实验发现,音节的声调也影响塞音发音方式的判断,在一、四声音节里,听着倾向于将塞辅音听成不送气音,在二、三声音节里倾向于听成送气音。对于这种差异,可能是实验语料的选择不同造成的,具体原因还需进一步研究。

　　五、结语

　　本文采用知觉实验的方法对汉语普通话塞音的知觉做了研究,得到以下发现:

　　(1)汉语母语者普通话塞音的知觉是典型的范畴化知觉,发音部位和音节声调类型对塞音的知觉的影响是显著的,且前者对塞音的影响大于后者。

　　(2)从发音部位的角度看,发音部位越靠后,感知边界越靠后,边界宽度越大,区分峰值越小,越容易被感知为不送气塞音;从音节声调类型的角度看,起点音高高的声调(阴平和去声)可使塞音知觉边界位置靠前,边界宽度变小,更易被感知为送气塞音。

　　(3)塞音知觉与其声学特征存在密切联系,表现为知觉/声学特征与发音部位间的二分对立关系,以及塞音知觉过渡区与声学断裂带的叠合关系。语音是存在于具体语言环境中的,因此人类对语音的感知是多因素的,不仅受语音本身声学性质的影响,而且还要受其周边语言环境的影响。

　　就影响本文塞音知觉的因素来说,发音部位属于内部自身因素,而音节声调类型属于外部附加因素,被试对塞音的知觉就是在这两个因素的作用下形成的。此外,音节结构、后接元音类型等的不同也可能影响知觉结果,这是今后需要继续深入的方面。