语音计量的方法原则与制约因素(2)
来源:未知 作者:chunt
发布于:2016-12-23 共6433字
4.多状态特征量化编码法。张梦翰博士论文《语言分类及计量的竞争模型》[14]选取吴语古阳声韵韵尾的消失变化特征,通过音变特征规则和历史层次,为多状态的语音特征进行编码,将原始数据数值化,为每一个方言点构建一条特征序列。具体步骤如下。 (1)选取多状态特征,根据方言点的音系材料和语音特征,确定该特征的音变规律和历史发展状态。 (2)对应方言特征的时间状态,最原始状态的标记为“0”,后续的特征状态标记为“1、 2、 3……”等,完成特征数值化。
另外,还有民族语的加权比率统计方法,如黄行列举了苗瑶语中符合某类条件的语音元素,计算它们的加权出现比率,计算公式为:
加权出现比率=相对出现次数(客位方言与主位方言某音类的对当次数)/绝对出现次数(客位方言某音类在音系中的出现次数)
运用这种方法对主客位苗语的声、韵、调进行穷尽式的分析,以判断苗语方言的亲疏关系。[15]加权比率法适用于民族语。
(二)实验语音统计法。这是现代实验语音学基础上发展的统计方法:首先录制语音资料,其次采用语音分析软件对语音特征进行分析,随后用数理统计的方法统计特征并分析结果。例如在声调格局的研究中进行基频的语音分析和归一统计,在此基础上研究方言声调系统格局。辅音和元音也能够采用语音统计法,如张梦翰采用Matlab软件,利用短时语音信号处理技术分析水语的清鼻音材料,找出区分清鼻音和送气鼻音的信号特征。[16]元音也可以采用归一法进行处理。
二、语音计量的制约因素
(一)数理统计的材料。计量的方法选用的材料需要统一规范。如果要使用不同作者的二手方言材料,需要有音系录音材料,然后根据计量需要进行规范统一。在有声调录音数据的基础上,声调的统一可以进行基频归一后,根据朱晓农《声调类型大要》中的各类声调类型进行归类。[17]声母和韵母的统一比较复杂,例如介音和滑音在不同的方音描写系统中有不同的处理方法。韵母有严式记音和宽式记音的区别,音系经过了音位处理,掩盖了字的实际发音。这些问题在进行二手方言材料的处理上都有很多难以处理的问题。凌锋[18]设计的方言单元音韵母格局比较法,有实用性,但是也需要在原始录音材料基础上进行整理才有可比性。
在方言语音处理前,还必要面对一字多读的现象,包括文白读、新旧读法等。还有一些字处于变化中,呈现动态的面貌,例如在粤西某地粤语中有一类入声字韵尾有两种-t和-p,彼此之间没有意义区别等情况。计量的规范统一涉及到在具体操作时应该如何处理这些语音现象。在以往的研究中,这些语音处理的原则和方法都是依靠试验规定,没有具体理由。例如陈海伦对方言韵母相似度的比较,有以下8条规定。[19](l)如果一个字只有训读字音,则此字不统计。 (2)一个字有文白异读时取白读,如果白读为训读时仍取文读。 (3)一个字有新旧读音时取新读,有文白异读又有新旧读音时仍取新读。 (4)一个字有几个异读时取第一个异读音,如果异读中有口语音时取口语音,有几个口语音时取第一个。 (5) 《字汇》中把广州话、阳江话中出现于零声母后的介音[i] [w]处理为半元音声母[i] [w],因而零声母后韵母少了介音标记,计算韵母对应情况时仍把这些韵母当有介音处理。 (6) 《字汇》中苏州、温州有半元音声母[j],我们认为有[j]声母的字其韵母实应有一个介音,所以苏州、温州有声母[j]的字,其韵母也当有介音[i]处理。(7)福州话中某些韵母因字调不同而有变韵。计算时不把它们归回原韵,而按《字汇》实际标音处理。 (8)对一些韵母的标音进行了修改,例如[au]中的[a]实际发音应为[ɑ], [a]就改成了[ɑ].这些规定具备解释力,但是都没有根据统计的实际情况进行试验比对。如果要以理服人,则需要对比采用规则前后产生的不同效果,以选择最佳方式方法。对比统计的结果差异,确定统计原则。
在语音数理统计过程中,统计的要求需要收集尽可能多的方言点的文字材料和录音,并对材料按照一定格式编排,放在方言数据处理平台进行操作。每个计量的字要对应中古音的地位,其声韵调要按照规定的格式进行记录,例如送气音有三种不同记录方式,在记录时要统一使用一种,不能混用。
(二)数理统计的方法。数理统计都有现成统计学的公式可以套用,但是统计方法的选择需要进行试用和比照。对于同一个问题采用不同的方法,结果会有差异。例如麦耘用T检验跟用X2检验算押韵问题,结果有时就不同。还有在方言距离关系上也有欧式距离和明式距离可选用。选用哪种方法需要进行试验,比照结果,结合已有的定性研究的结果才能确定。获得统计结果后,对于这些数据还要进行一个还原的步骤,把统计结果和实际研究的问题结合起来,正如麦耘所说“数字是抽象的,它代表的物理意义是具体的。对于历史音韵学者所研究的问题来说,统计结果的物理意义就是语音史上的事实。能不能正确地把数字中蕴藏的信息还原为事实,是个不易把握的问题”,[20]对于方言语音同样如此。
计量方法应用在音类研究上有加权的问题。有的学者不主张加权,例如沈榕秋提到“我们主张不加权。方言定量研究结果应该是客观性的。如果加权,势必使结果带有主观性。方言内部各种特征的地位在定量研究中应该相等”.[21]但由于各音类特征之于亲疏关系的作用或权重大小不同,例如声母清浊的分与合,韵母塞音尾的去留这两个特征在衡量方言的类型时的作用不同,所以加权成为计量法的瓶颈。若要消除这种不真实的影响,就需要给不同的特征以不同的权重,这个权重的设置影响因素太多,各专家依靠经验值有各自不同的看法。因此,以往语音研究一般以描写分析为主,很少使用计量方法。
(三)实验统计的设备与方法。实验统计的录音环境和设备要求较高,需要安静的录制环境,背景噪音不能太高。在田野调查中录音条件较差,小孩哭闹声、家禽叫声和人们交谈的声音经常成为噪音源,影响所录制语料的质量。比较理想、安静的录音地点是在宾馆、教室或把发音人请到专门的录音室录制,由于田野调查的条件限制,也不太容易实现。
在录音设备上,实验统计法需要单指向性较好的话筒(如AKG,铁三角Audio-Technica等)和国外着名厂家生产的声卡(如M-Audio,得胜TAKSTAR),以提高录音清晰度,还需要有配置较高存储量大的计算机(如联想手提笔记本Think Pad X系列),用于安装录音软件,存储录音材料。常用录音平台和音频处理软件有4类:田野调查系统软件自带的录音软件,如上海师范大学开发的田野调查系统;实验语音处理软件的录音模块,如Praat;专业的音频处理软件录音模块,如Adobe Audition;还有专业录音机,如Tascam.除了录音设备外,还有喉头仪,鼻流计等辅助设备和其他软件用于分析语音。
录音后需要进行处理分析。实验语音处理的前提是要对音节进行声韵切分和标注,切分的方法受个人差异因素影响,而且同样的录音对象因不同的录音环境也有不同录音结果,所以在切分时需要有一定数量的语音统计样本,还要采用稳定可靠的方式方法进行切分。切分和标注一般都是人工操作,虽然采用程序切分样本能够提高切分效率,但是容易忽略在切分中的细致问题。对切分标注好的语料采用哪种统计方法,则需要根据试验比照实际情况来决定。例如在录音中对声调的基频归一就有多种方法,朱晓农总结基频归一的6种方法是: z-score归一法、频域分数法、频域比较法、对数半音差比法、对数z-score法和对数频域比例法。这些方法的作用都是消除录音中的随机差异,减少录音时的发音风格,其原理为“以本人的频域作为坐标,以显示本人的各个声调在此空问中的分布”,[22]让声调实验具有可比性。但在实际操作中,归一方法并不容易决定,需要从实际出发,经过试验才能确定。例如刘俐李在研究江淮声调时,刚开始选用了对数z-score处理方法,但是发现用对数z-score产生了两个问题:第一,各发音人的LZ值波动比较大,难以直接进行多种方言比较,需要再次处理;第二,对数z-score值法不方便声调格局的归整。[23]出于转换五度制的需要,其最终采用了石峰所提出的T值对数法。[24]
作者单位:
相关内容推荐
-
沛县方言中“来”的各种虚词用法介绍
0、引言从20世纪80年代起,汉语史研究中对助词来的来源及其演变关注颇多。例如,太田辰夫(1987)指出,助词来从唐五代就有,它是由动词来演变来的。孙锡信(1992)认为来早在先秦时已有虚化迹象,语气词来最初多用于祈使语句中,相当于现在的吧字。刘坚(1...
-
图木舒克汉语方言音系的分区问题
一、图木舒克市的地理位置、历史沿革和文化图木舒克,维吾尔语意思是鸟的嘴,位于巴楚县东北60多公里处,地形十分险要,历史上曾经是丝绸之路上的城池重地,是古代通向疏勒(喀什)、叶尔羌(莎车)、和田地区及印度、巴基斯坦、阿富汗等国的唯一必经之路。1...
-
基于认知功能语言学的语音问题研究
一、语料库理论概述语料库语言学不是语言理论,而是语言研究的一种方法,为语言研究提供语言证据。语料库的发展受到语言学理论的影响,20世纪50年代的行为主义重经验轻直觉,语料成为经验主义研究语言的唯一证据,促进了语料库的发展。20世纪50年代中期以后...
相关标签: