当你听到一个突然发出的声响,往往会下意识地扭头朝声音发出的方向看去。我们可以利用声音获取信息、躲避危险。你有没有想过,我们的两只耳朵是如何在三维空间精确地定位声音来源的?如果一只耳朵失聪,只用单耳是否就只能听到声音而无法判断声音的方位?要回答这个问题,我们需要了解人是如何判断声源的方向(左右、前后、上下)以及距离的。
用双耳判断声音方向
双耳空间听觉(binaural spatial hearing)是最主要的声音定位机制。其实,人类对不同方向的声音,敏感度是不同的。具体说来,我们对身体左右两边的声源最为敏感,其次为前后,再次为上下。也就是说,我们最容易分辨声音是来自左边还是右边,最不容易分辨声音是来自上方还是下方。
人类的双耳是靠两个主要因素判定声音来源的方向的:声音传到两个耳朵的时间差(interaural time difference,简称ITD)和声级差(interaural level difference,简称ILD),后者代表声音大小的差别。最早提出这个理论的是英国物理学家瑞利(Rayleigh)。
1896年,瑞利提出了“双耳效应”理论。当声音频率低于1500赫兹时,声音会先到达靠近声源那一侧的耳朵,然后才到达另外一只耳朵。这个时间差我们称为ITD。当声音频率高于300赫兹时,听力健康的人都能够感知声源的方向。而当声音频率高于1500赫兹时,声音波长比人的头颅宽度短,使得声音在传播到较远的耳朵时被头颅阻挡,这个现象被形象地称为“头颅影子现象”(head shadow effect)。这个现象使得处在“头颅影子”里的耳朵所接收到的声音的强度要低于另一只耳朵,这就是ILD。早在20世纪60年代,科学家就发现,人类能够分辨的最短时间差仅仅为10微秒,而最小的声级差仅为1分贝,可见我们的听觉有多么灵敏。
“双耳效应”原理
左图为声音到达两个耳朵的时间差,右图为“头颅影子现象”造成的声级差。
耳廓效应:一只耳朵也能定向
假如声源是左右居中而上下不同,那么它们发出的声音到达左右耳的时间应该相同,音量也相同,我们就无法利用时间差和声级差来分辨声音的方向了。那人类是怎样定位前后、上下的声源的呢?这要归功于另一种重要的声音定位机制—耳廓效应(pinna effect)。
耳廓对声音的影响很容易检验:试着用手指将双耳耳廓往后压平,你会发现,同样的声音听起来就会有不同的效果,对于低频声音这个现象更为明显。当外界的声音传播到人耳时,耳廓会对其起反射作用,从而产生一组短暂延时的反射声。人类耳廓的形状不像碟型天线那样对称、平滑,而是不规则的长卵形,上面有很多形状各异的突起和凹陷。这样,来自不同方向的声波被耳廓反射后,所产生的反射声组在时间和强度上会存在细微的差别。譬如,由于人耳为长卵型,来自上方的声音产生的反射声组延时就会比来自水平方向的声音产生的反射声组延时要稍微长一点。我们的大脑就能利用这些差别来判断声音的方向。
耳廓效应也称为单耳效应。实际上,由于耳廓的作用,我们用一只耳朵就可以在很大程度上分辨三维空间中声音的来源。虽然人类的耳朵看起来都差不多,但仔细观察一下就会发现,我们每个人的耳廓形状千差万别,并不完全相同。一般人或许不会意识到,从我们一出生,我们的神经系统就在不断地学习如何利用自己独特的耳廓来准确判断声音的方位。经过多年的学习和训练,我们的大脑早已习惯接听由这一双形状固定的耳廓所影响的声音,可以自如地通过散射后反射声的细微差别来检测声源方向。
耳廓效应有很多有趣的应用。例如,在声学物理中可以用头相关变换函数(Head Related Transfer Function,即HRTF)来描述它。如果改变耳廓的形状,HRTF就会改变,所听到的声音也相应改变。现在高级的音频技术就可以利用HRTF,通过控制声音在延时和强度上的细微差别,用一副耳机就能“骗过”你的大脑,让你感受到震撼的环绕立体声效果。耳廓效应对我们选择耳机也有指导作用。入耳式耳塞直接将声音射入耳洞,完全不受耳廓的影响;而包耳式耳机发出的声波会首先经过耳廓,这与自然状态下声音的传播路线更为相似。所以单从耳廓效应来看,相比于入耳式耳塞,包耳式的大耳机在空间感上更为自然。选择戴上后耳机较宽松,尽量不改变耳廓形状的包耳式耳机,有利于获得更自然更真实的声场。
感知声源的距离
那么我们又是如何判断声源与我们之间的距离呢?研究表明,帮助我们感知听觉距离的因素主要有3类,即声源、传播环境以及听者。
声源因素包括声级(响度)和频谱(音色)。在生活中,大家应该都会注意到,同一个声源,离听者越近,声音也会越响。声音的响度是通过声音的声级体现的。也就是说,声源越近,声音到达耳朵处的声级就越高。这个现象在自由声场(指均匀的各向同性的媒质中,边界影响可以不计的声场)中表现明显:声压与感知距离的平方成反比,即声源与听音者的距离每增加一倍,到达耳朵的声压级就下降6分贝,响度也相应地下降6分贝。在我们生活中,这是最主要的判断声音远近的因素。但是利用响度只能判断相对距离,并不能提供绝对距离信息。
另一个声源因素是声音的频谱。不同频谱的声音,在听觉距离判断时其作用会有所不同。高声级的声音,也就是强度比较大的声音,很明显地体现了感知距离越远、声级越低的渐变规律。相比之下,低声压级声音的听觉距离与声级的关系就比较弱。耳语的此种关系就更弱了。耳语与正常的低声级语音的不同在于,在发音时,声带几乎没有振动,这导致了耳语的语音频谱图与正常语音不同。总之,拥有不同频谱的声音,声源距离判断也会有所不同。
除了声源以外,声音传播的环境也对听觉距离感知有着重要的影响。声音在传播过程中,由于空气的吸收,高频部分的损耗比较大。距离超过15米时,这样的损耗尤为明显,距离越远,高频损耗越大。所以,声音的高频损失量也是一个判断听觉距离的依据。
在非自由声场(譬如密闭的小房间)中,我们听到的声音包括的不仅仅是声源产生的直达声,还包含由地板、墙壁等反射而产生的来自不同方向的反射声(这些反射声混合在一起形成混响声)以及环境噪声等。混响声也是一个非常重要的判断距离的依据:直达声与混响声的能量比值越小,距离就越近。另外,反射声能的时间分布以及细微结构也是听觉距离的判断因素。有意思的是,研究还发现,适量的环境噪声对听觉距离的判断还会有所帮助。
最后就是听者的因素。对于不同的听者,同样的声源和距离,感知也会不同。其中的原因有很多,除了前面所提到的人各不同的“头颅影子现象”和耳廓效应,还有听者对声源所发出的声音的熟悉程度等。我们对某种声音越熟悉,就越容易判断出它的远近。
另外,对于声源较近的声音,其距离感知与方向定位之间有非常强的相关性。在近距离声音判定时,双耳时间差和声级差也起着重要作用。也就是说,方向定位和距离感知相互帮助才使得我们的听觉空间定位能力如此精确。
为什么人类需要如此复杂精确的空间听觉?除了判定发声体的运动方向和速度,在社会生活中,人们也需要空间听力来除噪。例如,在一个鸡尾酒会上,你能听到很多嘈杂的声音:背景音乐、宾客寒暄、酒杯碰撞等,但是你却能够把这些你不感兴趣的声音都过滤掉,而专注于与朋友的对话。这个有趣的现象被称为“鸡尾酒会效应”。可见,空间听力不仅仅使我们能够探测和跟踪声源,更对我们的社会生活有着重要的作用。
(本文发表于《科学世界》2013年第8期)
请 登录 发表评论