1 引言.
声音增强系统和声学增强系统之间的基本差别之一在于相对声源近距离的传声器的使用。在声音增强系统中,通常需要近距离提供相对环境声更高比率的直达声。在声学增强系统中,则通常相反的情况才是所需结果。特别是布置在相距声源一定距离的传声器拾取的是直达声和环境声的混合声。因为传声器与扬声器相连接,这种可使这些系统与声学反馈相抗衡的方式对用于将系统与环境相结合的方法而言变得非常重要。可对传声器和扬声器数量、可使其互连的方法、系统尺寸和成效、以及其在建筑声学上的可靠性施加一定限制。
已有众多技术论文和文章阐述了多种电声系统的成效之间的差别.这里所描述的时变系统在反馈之前提供了增益上的绝对优势,而这给在环境中布置传声器和扬声器提供了自由度而不会受到设计上的限制。在使用这种空间技术时,对于声品质和经济的系统整合两者而言还有哪些重要的因素呢?需要哪些种类的组件?如何(为什么)放置这些组件?
本文将简要介绍笔者在音乐声学和声品质方面研究的最新进展,并展示其是如何成功地用在物理和电子建声的集成上的。
2 关于人类感知的研究近况.
之前的论文中指出声学描述可分为四类---定位、空间感、可懂度和混响感。弄清楚人类神经是如何分析声音事件的对于确定声学状态应如何得到解释是非常重要的。以下所列的是声音感知的关键流程,这在之前的文献中有提到,每一个流程依次工作在更高级的神经学层面上。而低级的流程包括:
(1)在鼓膜处将入射声压分解成多个频段;(2)在独立频段对声级快速增长进行检测---这是在对前景声音单元(phonesandnotes)的开始和停止进行检测的第一步;(3)对在各频段的双耳时间差和声级差的检测;(4)对双耳时间差和声级差的平均非确定性进行确定。
将声音分离为频段是低级功能的最基本的特征;同时伴随在所有其他的神经学流程中该分离也会发生。更高级的流程完成该分离会占用一定时间。这些时间常数对获取房间声学的方式而言非常重要。更高级别的流程包括:
(1)将声音分解成独立单元:phones和notes.
(2)确定单独的声音事件的方位和音色。
(3)将声音事件群组织成前景流。对于语音,将来自特别的phones组织成短语和句子。对于乐音,则前景流由来自独立乐器和片段的乐音系所组成。
(4)当同时有几个说话人谈话时,将每一个人的声音单元组织成单独的流。同样会有几个同步的前景声音流。
(5)流形成过程中使用所有可用的线索对独立的声音事件进行组合,线索包括方位、音色和音调。因此特定的事件的方位角可以帮助将其安排进流中。
(6)“背景流”的形成包括在前景流的各元素间获取的声音。背景流包括房间噪声、混响等。虽然可有几个前景流,但只有一个背景流。
声音流的形成对声音感知来说是非常重要的部分。当一系列声音事件例如语音得以连接时;会强烈感知到位置、音色及混响。这是因为人类神经在声音流的感知中使用了不同的流程。混响和噪声被分离成背景流---除非他们需要受到注意。如果一个响亮的声音事件在聆听谈话时发生,声音事件和其混响两者都会变成另一个前景事件从而得到全面的神经分析,同时得到更高的神经优先权。在流形成过程中或之后还有几个动作发生:
(1)对多种前景流的含义分配。
(2)将双耳声级差和时间差的波动要么解释成“房间”印象,要么解释成包围感。这种解释依赖于造成前述波动的声音事件结尾和反射能量之间的时间延迟。
将声音解析为独立的单元是更高级流程中最重要的环节。当噪声或声学状况阻止了phones结束和开始的可靠检测时,语音可懂度迅速下降。语音中的phones在快速语音中每150ms即发生,而phones间隔的一般值为50ms.因此,此时时间窗中的反射能对语音可懂度及乐音清晰度是不利的。在150ms和400ms之间发生的反射能对背景流起主要作用。活动混响(RR)的感知依赖于在phones和notes之间的间隔、混响的绝对级别以及从前景声音流中的间隔中可靠分离出信息的听觉机理能力。这种分离流程需要一定时间---在声音事件结束之后必须要经历至少100ms,而这是在背景声的灵敏度最大化之前。当反射声干扰到识别声音的开始和结束的能力时,会造成分离流程的不确定度的上升---可懂度、清晰度和包围感知降低。
笔者最近的研究表明声源亲切感的感知对声品质的感知是非常重要的.亲切感是一种潜意识事件,其与声学距离的感知紧密联系。人类在聆听任何发声体的声音时可以立刻感知其或近或远,即使只用一只耳朵来听。人类生存依靠的是辨别声音事件是否是近的---因此这就是被感知为“近”的声音往往需要被更多神经所关注的原因。同样,较远的声音具有低的优先级,且经常被描述成具有“浑浊”的包围感。进一步的实验表明亲切感的感知与声源的水平定位有很大关系。只有当听众获得直达声时才能获得快速的定位---即声音无干扰地从声源直接传播过来。这种情况下,复合音的谐波的相位关系不会被反射所改变---从心理上声源被感知为近的,独立于其物理距离。因此该声源被“亲切”式地感知。当反射扰乱了这些谐波的相位,关于定位的相对不确定性增加,人类神经的声学距离感知受到影响。声源不再被感知为熟悉的或亲切的,声品质的感知度则降低。
当有机会严格按照乐音源的自然度来调整混响水平和时间时,业余和专业听众都倾向于将混响比进行正向调节.自从数字混响诞生以来在录音行业中该方法已被使用。好音质的共识为声音是纯净并具有亲切感的,混响是可闻的、有支撑性的并具有包围感的;同时不会被直达声的感知所干扰。因为人类的偏好不尽相同,所录制的音乐作品听起来也基本不同。
然而,在世界上最好的音乐厅里,这并不会发生。混响的级和时间两者都是与容积相关的物理产物,即与其建筑几何、表面处理以及满座率相关。这些参量相互关联,其一改变则可能改变声学结果。直混比在临界距离被反转---在这一点上直达声场和混响声场具有相等能级。在这些音乐厅中,临界距离接近20ft(1ft=30.48cm).这意味着多数座位具有负的直混比-6~-10dB.典型的声学测量关注于声音延迟(EDT,RT),但并不关心能量在最初100ms的比率问题。这给鉴别这些场馆的声音特性相比混响延迟而言带来更大的影响。这些空间对于大多数座位而言都具有15~25ms的初始时间间隙.这意味着在反射能量起作用时会影响到基频的谐波相位关系,之前直达声会得到清晰的定位(见图1).因此针对乐队中单独的乐器会得到精准的定位且不需要视觉线索---即使在靠近厅堂后部也是这样。图1为波士顿交响音乐厅模型的100ms激励下混响的建立和衰变。选择座位的标准是持续激励下D/R比为-10dB.
3 厅堂不能进行声音性的度量.
随着厅堂尺寸减少,主要的自由路径变短。这意味着在最初的100ms内会潜在出现更多的反射声能,初始时间间隙变短,反射能的上升沿改变。混响时间降低,但反射能级升高。这些反射会用于改变基频谐波的相位关系并落入人声共振峰的范围。这种情况下,人类神经会影响声学距离的感知,并且声源会被视为噪声(见图2).笔者发现声学协会里的许多人都认为壳体会改善这种情况。然而,当反射能级已经很高的时候,多余的反射能只会使更多的能量聚图2降低了一个或两个因素维度的波士顿交响音乐厅100ms激励下混响的建立和衰变集到最初的100ms并且增加上升沿。混响时间会保持较短,“房间”的空间印象会变成主导。如果一个具有这些声学属性的声学增强系统用在厅堂中,混响级及延迟时间都会增强。结果,所有的关于厅堂的问题还是会存在,房间的空间印象会变为主导,同时伴随多余的混响延迟时间。
选择座位的标准是使持续激励下D/R比为-10dB.
该音乐厅具有1s以内的混响时间,但声音浑浊没有亲切感。
在小的厅堂中使用电子建声建立起最佳的声品质需要充分降低反射能量的幅度,以至于建筑声学在容积上和电子建声的融合上保持大声学容积的感知度,这需要使用吸声处理来实现。可能也需要在舞台细致地布置吸声材料来改善清晰度、定位和亲切感(见图3).而厅堂的尺寸增加了相反情况的发生概率。主要的自由路径增加,在最初100ms内的反射数量减少,最初100ms内能量的上升沿上升更加平缓,初始时间间隙也会随着几何尺寸而增加。反射能幅度降低,且混响时间增加。保持住直达声的影响对较大厅堂而言是种挑战,因为其声压级随距离每翻一倍而降低6dB,因此D/R比在厅堂后部面临挑战。
在声源附近使用电子声反射器以保持声直达性,而来自内侧阵列的多余直达声能会帮助降低声源的距离感知。使用统一布置的吸声体来降低混响,使用电子建声来增加环境声场的幅度会帮助重建亲切感知。
图3为某250座厅堂的照片,舞台表面布置吸声,电子建声扬声器隐蔽阵列构建包围感的混响场,而无需构建减少清晰度和亲切感的反射。
4 系统组件.
声学增强系统只能为厅堂增加能量。他们不能解决声学问题例如噪声侵扰、机械噪声、灯光噪声等等。有很多例子,目的是要么增加环境声幅度或混响场,要么增加混响时间延迟,或两者皆有。
为了在低噪声环境和场合下功能最佳,电子组件必须具备高品质,其本噪要足够低以不能增加环境的底噪为好。因为这些系统利用了多个输出通路,这些通路连接到多个扬声器,这对系统透明度的感知而言非常重要。
4.1 扬声器.
商业化的扬声器主要分为两类---用于商业和专业场合的,以及那些用于消费领域的。专业扬声器通常更适合覆盖某些频率段并具有特别指向性---也就是术语“指向性控制”.这种扬声器一般用来关注到达听众的声音,同时避免声音输出从环境表面反射。虽然这对声音增强应用有好处,但对于电子建声而言性能不佳。构建了指向性控制的波导带来了非统一性的功率响应。因此当听众改变了位置获得的输出会随幅度而改变。相反,混响场的功率响应大多数时候非常稳定。用于消费类Hi-Fi的扬声器通常不具备指向性控制功能---然而,整个功率响应通常更趋向于轴向的功率响应。虽然这对其主要的应用有意义,而轴向和非轴向的功率响应是不同的,要考虑到许多扬声器用于电子建声中。在扬声器轴向上的听众同时会偏离相当大的设备阵列的轴向。因此,设备偏离轴向的偏差对声音增强或消费类Hi-Fi应用可能不会带来麻烦,却对电子建声影响很大。另一重要的因素是不存在万能的设备,功率统一设计常常会带来灵敏度、尺寸和功率控制的牺牲。高天花板需要更大的输出功率,这需要设计用于功率统一传输的大规格设备来提供。该需求对电子建声而言基本上是独特的。同样对于挑台天花下部而言需要增加声能密度。在这里,操作设备的同时保持低功率需求的能力对成本效益和功率效益系统而言是关键。
有例子表明放大后的扬声器对该应用有意义---但这些非常稀少,而且这些厅堂通常具有敞开的框架天花,且需要从根本上一次又一次地重构系统阵列。然而在众多应用中,扬声器会永远安装并隐藏于视线之外。在许多厅堂中,扬声器会先于永久性座椅前安装在高的天花板上,很可能会使得后期接入变得困难。因此,将功率放大器沿着必要的功率传输线加入永久性安装的扬声器,以及在扬声器处会产生热量,这都不是好主意。在笔者一直从事系统集成的二十五年多以来,见证了数量庞大的放大器类型的兴衰。放置一个失败的放大器在机架上显然要比找个梯子从天花板上拆除它容易得多。优秀的工程实践、高品质装备以及熟练的套路能确保扬声器的长寿命。
4.2 功率放大器.
笔者在可靠的开关模式功率供应器和D类功放出现之前就已经开始做系统集成项目了。几乎所有早期使用了高质量专业级功率放大器的系统仍然在使用那些设备。开关放大器的出现降低了每通道的成本,减少了所需的机架空间,且减少了整个系统的热量。对这些放大器进行功率评级通常是基于在所要评级功率点的短期操作。笔者已经注意到当长期使用在功率水平下会带来功率供应缺损,这样会大大低于要评级的峰值输出,输出会变得非线性而没有出问题的征兆。这并不是对特定的一个或多个品牌的指控,而是对该技术大致情况的观察---特别是当在一个单独箱体中的多个放大通道由一个单独的功率供给器所供给时。使用具有更高评级的功率放大器通常会克服这个问题。
4.3 扬声器密度与声音.
增强系统不同,声学增强系统必须能够产生全频带信号且具有全动态范围,这样会避免任何形式动态处理的使用。对那些具有足够上部空间的系统而言,扬声器阵列必须能够获得比某一点稍高的声级,在该点上直达声能量的释放不会掩蔽空间中的混响声能。当该测量依赖于以下因素:如音乐形式和乐手数量时,实验表明针对听众的增强系统应提供对所定义的覆盖面积的直达声信号6dB以内的能量。例如,一般的厅堂,整个乐队在指挥处可能产生120dB的声压级。在临界距离附近座位的最前面几排处,反平方的直达声会跌落至接近108dB的声压级,减去掩蔽因子---这超过所需要的102dB声压级。如果扬声器阵列产生的声学信号在20~30ft高,这需要合适的功率来满足需求.
扬声器阵列必须具有足够宽带的功率加和均匀度以将每个设备变成非可定位性的直达声源。从实验中发现这需要阵列提供宽带功率加和均匀度至少1.5dB.这比典型的声音增强应用的需求更加严格。低天花板会获得更高的阵列密度,一般会产生更高的功率需求。
4.4 传声器.
提到时变系统,不需要在传声器和扬声器之间对通道配置或者空间,因此传声器会放置在非常靠近扬声器的位置而不会产生由声学反馈造成的声染色。
然而,在人类神经感知方面的研究证明了优先于直达声而降低反射声会增强感知的声品质。笔者也开发了一款新的声学算法,可产生具有优秀声音清晰度的混响。结果是混响的更高比率使用起来不会产生亲近感的感知。因此,最好是将传声器放置在离混合声源足够近的位置。这不影响在祷告集会时使用传声器,或者将传声器放置在体育场中的观众上方。反过来说,系统对于传声器的摆放和类型提供了实质上无限的灵活性,以及应如何使用。具有紧密配合的轴向和非轴向响应的指向性传声器的使用是另一需要重点考虑的问题。这些传声器通常必须拾取宽敞空间的声源而不会造成声染色。
4.5 系统集成.
近期最显着的进步之一是新处理平台的开发和应用于声学算法和系统信息处理。另外,新的声学算法是基于笔者近期对声音品质的人类感知研究而一步步开发出来的。该新系统(E-Architecture)最多支持1024个音频通道,可被配置为点到点的形式。
这差不多是当前已安装在具有5000座容量厅堂的最大系统处理通道数的两倍。较小的E-Perform-ance系统支持最高128个输出,其可轻易用于大多数中等尺寸的厅堂和观众厅。E-venue系统则设计用于小的厅堂例如排练厅或独唱空间。
系统控制近年来也大规模开发。使用802.11协议和蓝牙无线协议的移动设备的出现连同提供安全接入私有网络的低成本应用,改变了用户对如何“控制”和如何运行的预期。新的控制系统硬件和软件为用户创造了合理的透明度,通过专门的应用可提供与有线触摸板操作类似的功能。
5 结论.
对于电子建声系统的设计而言,主要的声学特性是清晰度、可懂度和来自声源的亲切感,同时构建一个有支撑性和包围感的混响声场。这无论是对表演音乐的音乐厅,还是多功能厅而言,都是正确的。
在较小的声学空间中,总是会有足够的反射声能,且有许多例子表明,这会给欲获得的理想声学状态带来问题。为了降低反射声的影响而按需求加入吸声材料,这改变了在人声共振峰范围的谐波相位关系,会重塑清晰度、可懂度并加强亲切感。许多例子表明,这会涉及舞台上吸声材料的使用。在大空间中,电子声学系统既会增强混响也会增强可懂度。这些系统具有传统声学手段不可比拟的优点,可以改变所需的贯穿厅堂的D/R比。运动混响(RR)在接近乐队的位置得到增加,直达声得到增加以保持影响力和清晰度,而直达声比率低。对于任何安装而言,系统的终极目的在于获得足够的清晰度---必须要有足够的考虑以使得建声处理和电子建声都具有合适的声学特性,且对于每一种表演厅堂都能提供给听众良好的听觉体验。