人类语言中颤音的发声机制的生理物理原理是什么?

@胡妹殿下 邀!

一、伯努利效应

“(流体的)流速大,压强小”相信大家都很熟悉,这就是伯努利效应(Bernoulli effect)。我们可以做个非常简单的实验:捏两张纸中间留有空隙,向空隙吹气,两张纸就会贴近。这就是因为两张纸之间空气流动,压强减小,纸就被外侧的压力压向内了。

如果把两张纸捏得很接近,嘴唇也离纸很近,那么吹气的时候就很容易吹出“声音”了——恭喜你,你已经成功地用两张纸模仿出了语音学的清颤音!(这个实验很容易完成,快去试一试吧)

如果在这个基础上把吹气改成浊声(比如 [u]),那么就有可能让纸发出另一种声音。想这样弄出响儿稍微有点难,但如果弄出响儿了那你一定会对这个声音很熟悉,因为非常像卡祖笛(kazoo)(实际上这和卡祖笛就是相同的原理)。这就类似语音学的浊颤音。

二、颤音的空气动力学

以双唇清颤音 [ʙ̥] 为例,上、下唇就相当于那两张纸,整个的调音过程是:

  1. (人)使双唇相互靠近。
  2. 气流流出,经过双唇时流速升高(流速 = 流量 ÷ 截面积),产生伯努利效应,使双唇间的气压降低,双唇就更加靠近,几近闭合。
  3. 双唇(几近)闭合使唇内部的气压升高。
  4. 唇内部的气压将双唇冲开,驱动双唇颤动。于是回到第 2 步,如此循环。
  5. (人)使双唇相互远离,颤音的调音结束。[1][2]

这 5 步里只有第 1 步和第 5 步是需要人主动控制的;中间 3 步则在气流驱使下自发循环,要求气流要够劲儿、调音器官要松弛。颤动的能量来自气流的动能,如果气流提供的能量不足,颤音就会退化成近音了。如果调音器官过于紧张,就无法颤动起来——试想,如果把上面的“两张纸”模型换成很硬的纸,我们还能吹得动吗?

如果是齿/龈清颤音 [r̥] 的话,其被动调音部位(齿/龈)不能颤动,因此就像是把“两张纸”模型改成一块硬纸板和一张纸:只有舌尖颤动。调音过程和前面的 5 个步骤相似,只要把双唇换成舌尖即可。

对软腭音而言,其被动调音部位(软腭)当然不能颤动,主动调音部位(舌面)也无法颤动,就像是两个纸板。所以软腭颤音不存在的:

(图片出自除「tan90°」外还有哪些表达「不存在的」的有趣方式?

人们在说“不~”的时候,如果重音不在“不”上,那么“不”有时声母就会变成颤音,发成 [ʙu](尽管只颤一下;且可能仍是清化的颤音),这就是因为松弛(非重音加上 [u] 带来的唇化作用)。(请听你们那里「不知道」用方言怎么说?里的语音)

只颤一下的颤音虽然和拍音(tap)、闪音(flap)听起来很像,但调音上是不同的。拍音是主动部位敲打一下被动部位、闪音是主动部位刮抹一下被动部位,它们都是由调音部位的肌肉控制的、是主动的,与颤音不同。

浊颤音现在无法介绍,到第四节再介绍(其实到了那儿也介绍不了)。

三、音乐的颤音

在介绍语音学的颤音之前,我很想先介绍一下音乐里 3 种颤音性的演奏技巧:颤吟(vibrato)、颤音(trill)和震音(tremolo)。颤吟(也叫抖音[3]、揉音)指在演奏时让音高有规律地上下波动,颤音指有规律地交替奏出两个音高。震音(这里仅考虑弓震音[4])则不是音高(频率)维度的演奏技巧,它是指有规律地反复奏出相同的音高。

在弦乐器上的实现方法,颤吟即是手指揉弦,颤音是有一根手指在另一个位置上反复起落,弓震音是反复地来回运弓。我们来听听看它们吧!下面是小提琴依次奏出普通、颤吟、颤音、弓震音的 C 音(颤音是从 C 到 D),图像是频谱图(spectrogram,又叫时频谱、声谱图、语图)中的四次和三次谐波,其变化反映音高的变化:

小提琴的 3 种颤音

语音学的颤音和音乐的震音相似,与发声的音高无关。震音在木管乐器上的实现是弹吐音奏法(flutter tongue),也就是俗称花舌的演奏技巧——在吹气演奏的同时,口腔发一个(语音学的)颤音,来反复地阻断这个音符。花舌奏法还分两种:小花舌,即小舌清颤音 [ʀ̥] 与乐器管内空气柱振动的“双重调音”,和大花舌,即齿/龈清颤音 [r̥] 与乐器管内空气柱振动的“双重调音”。

说句题外话:维基百科把用于人声的颤吟也列为一种发声态(当然,不具有语言学辩义作用)。这看似非常强行,但有一定道理(见第四节结尾),因为人声的颤吟涉及声带肌(vocalis muscle)的极低频振动。

四、声学的语音学的颤音

我们来看一看龈浊颤音和龈浊近音的频谱图。近音近似就是颤音去掉颤动之后的声音,因此放在后面作为参照。视频前半是频率分辨率很高的频谱图,频率范围是 0~700 Hz(浊声的基频和一小部分二次谐波);后半是频率分辨率较高的频谱图,频率范围是 0~4 kHz(浊声的前十个谐波)。注意它们都是语言学里说的“窄带语图”而非“宽带语图”。

龈浊颤音和龈浊近音的频谱图

由图或由听觉可知,这段语音的基频约为 350 Hz。准确地说,是声带振动的基频约为 350 Hz,因为在龈浊颤音的高分辨频谱图中我们还可以看到很密集的一道道细横条,即一个频率很低的振动(的泛音列)。它是舌尖的振动。如果截取龈浊颤音的一段来看看其频谱(spectrum)就更明确了:

最左边的那个宽峰就是舌尖振动的基频,约为 24 Hz(音高约在 G0);右边的 3 个尖峰的位置就是上面说的声带振动的基频,约为 350 Hz(音高约在 F4)。下图把这个 24 Hz 的舌尖振动的泛音列标出来:

可见,那 3 个尖峰果然是舌尖振动的泛音。以下是我的猜测:发龈浊颤音时,舌尖会跟着声带发出的浊声产生共振,因此舌尖振动中频率接近声带振动的泛音就会被增强。体现在上图中,就是 350 Hz 上下的 3 个舌尖振动泛音(14、15、16 次谐波)被显著增强了,显现为 3 个尖峰(实际上再往两边看也有一些小峰,那也是稍微被增强了的泛音)。甚至可以把声带振动的泛音当作舌尖振动的“共振峰”。我没有查阅更多文献,因此我能做到的对浊颤音的介绍仅仅止步于这点猜测了。

有两点值得怀疑的:一、350 Hz 处的 3 个尖峰会不会是声带振动的基频分裂的结果?(其实我看到那 3 个尖峰的第一反应确实是核磁共振谱里的自旋耦合裂分[5]!)然而图上的 3 个尖峰并不是“分裂”的结果,它就是舌尖振动的泛音。这通过推理或实验都可以验证,可惜这里空白的地方太小,我写不下。二、声带发出的浊声在频谱中哪儿去了?按理说最终的结果应该是声带振动和舌尖振动的叠加,但图中却看不出声带振动的基频宽峰了。我不知道为什么。(难道是舌尖为了颤动而吸收了浊声的能量?)

这个 24 Hz 的舌尖振动其实还是可以以音高的形式感知到的(前提是你耳机够好),因此浊颤音实际上是一个双音!瞧,用不着学习什么泛音唱法或是 unt 吹的那个口哨 + 浊声,只要学会语音学的颤音你就能用嘴发出双音了哦!——但这种颤音的频率毕竟太低了,跟声带的浊声相差太大,人们难以把它们俩识别成“和声”,只能把颤音当作一种“音色”来看待吧。

这就是不太高分辨频谱图上显示的那样:声带的振动在时间上被分成了一个个小段,从而和音乐里的震音相似了(但显然不相同)。正因为有些颤音可以被当作音色,所以有些颤动也被视作声门上发声态(supraglottal phonation),比如(杓)会厌颤音带来的 strident voice。

能力有限,如有错误敬请指正。

以上小提琴声音使用 EastWest/Quantum Leap Symphonic Orchestra 和 LA Scoring Strings 2.0 音源演奏,龈浊颤音和龈浊近音由 unt 发音。频谱图(spectrogram)使用 Adobe Audition CC 作图,频谱(spectrum)使用 Transcribe! 8 作图。

来源:知乎 www.zhihu.com

作者:UntPhesoca

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 3 个回答,查看全部。
延伸阅读:
为何各语言的辅音大多不到三十个?

这个音素应该如何表示?在各种语言当中存在吗?