语速对普通话音段产生的影响 您所在的位置:网站首页 塞音的声学特征 语速对普通话音段产生的影响

语速对普通话音段产生的影响

2024-06-09 21:30| 来源: 网络整理| 查看: 265

语速影响音段的语音实现以及相邻音段发音动作的时间关系。通过考察不同语速条件下发音器官的运动特征,不仅可以建立正常发音的语音产出模型,同时也可以研究病理语音产出的根源[1]。

语速一般用单位时间内的音节数来衡量,有2种计算方法:一种把静音停顿纳入到计算中;另外一种不包括静音停顿,又称为音速。研究结果发现,语速控制在声学上主要表现为音段/音节时长随语速的加快而缩短,音段时长缩短的幅度与音段属性有关,辅音时长缩短的程度小于元音[2],送气音的浊音起始时间的缩短幅度要大于同部位的不送气塞音[3]。语速加快使得元音发音不到位或者元音声学空间缩小[4-5],但也有研究表明,语速不影响元音的频谱特征[6]。

语速对发音器官运动特征影响的研究集中在3个方面[7]:1) 发音器官运动最大速度以及速度变化曲线;2) 运动幅度(或位移);3) 不同发音器官运动的时间关系。在慢速条件下,发音器官的速度曲线表现为非对称、多峰值的变化,而在快速条件下表现为对称的、单峰值的变化[8]。动态电子腭位(electropalatography, EPG)语音研究发现[9],语速加快使得音段的动作时长缩短,但并不一定伴随着动作幅度的减弱。语速对不同发音器官动作的时间关系的影响没有一致的结论[7],然而,生理研究发现语速对不同发音器官动作的绝对时差(absolute latency)有影响,相邻音段的发音动作重叠程度则取决于音段的属性和语音环境[9]。

汉语普通话是声调语言。语速影响音节或音段的声学和生理特征,在语速较快的条件下,普通话音节/音段的声学时长缩短,缩短程度与其在语流中的韵律位置有关[2, 10];元音和辅音声学时长缩短的程度存在差异[2]。随着语速的加快,辅音发音动作的生理时长缩短,动作幅度减弱,相邻音段发音动作的绝对时差缩短,动作重叠度增大[11]。本文使用62个电极的EPG考察语速对普通话音段产出的影响,从语音生理和声学角度分析语速对普通话音段产出的影响。

1 方法 1.1 语料设计

EPG数据来自北京大学语言学实验室建立的2位发音人(男性XS,女性JZ)的汉语普通话动态电子腭位数据库。语料分为2类:1) 跨音节C1#C2辅音丛(#为音节边界),设计了8个V1C1#C2V2双音节,C1为软腭鼻音/ŋ/,C2为齿龈塞音/t/和舌尖前擦音/s/,V1和V2为/i/或/a/;2) V1#C2V2双音节,把目标元音/i, ɿ, ʅ/分别置于双音节前字和后字韵母位置上,设计了11个双音节/ʂʅ#pV2/、/pV1#ʂʅ/、/sɿ#pV2/、/pV1#sɿ/、/pi#pa/、/pi#pi/和/pa#pi/(V1为/i/或/a/)。把辅音音段/t, s, ʂ/置于后字声母位置,设计了4个双音节/pa#ta/、/pa#ti/、/pa#sa/和/pa#ʂa/。JZ缺少部分辅音的语料,双音节语料置于负载句“我说__这个词”。发音人语速控制参考文[8],设计了慢速、正常和快速3种语速条件。每种语速条件下每个句子连续读3或4遍。使用负载句的头2个音节韵母时长的平均值作为语速参数(speech rate,SR),SR越大,说明语速越慢。

1.2 生理和声学参数

对辅音的EPG关键帧进行定义。把假腭前3行电极定义为齿龈区域,该区域的舌腭接触与/t, s/的舌尖发音动作有关。舌尖动作起点定义为该区域电极开始接触的时刻,动作目标(幅度)定义为辅音持阻段在齿龈区域的最大舌腭接触比率,首帧目标腭位的定义参照文[12],动作结束点定义为齿龈区域舌腭接触消失前最后一帧的时刻。舌尖辅音后接高元音/i, ɿ, ʅ/的时候,在元音时段齿龈区域也有接触, 此时舌尖动作结束点定义为元音声学起点前的腭位帧时刻。舌尖后擦音/ʂ/的成阻部位位于齿龈后到硬腭中的部位,此时选择整个假腭区域并定义关键帧时刻。

假腭后2行中部2列电极定义为软腭区域,这个区域与软腭鼻音/ŋ/的舌体动作有关。如果软腭区域存在舌腭接触,则可以定义舌体动作的EPG关键帧时刻。如果软腭区域没有接触,则采用声学标准,以语图中元音和鼻音的边界点作为舌体动作的起点时刻,声学结束点作为舌体动作结束时刻,此时无法获得舌体动作的运动幅度。

C1#C2辅音丛的参数有2类:1) C1舌体动作和C2舌尖动作各自的参数,包括动作幅度(displacement,DIS)和生理时长(length,LEN)。DIS为音段最大舌腭接触比率,LEN为动作起点和结束点的间距。C1和C2的2个参数分别用C1DIS和C1LEN以及C2DIS和C2LEN表示。2) C1和C2发音动作时间关系参数。时差参数包括C1和C2发音动作起点的间距△OSS和发音动作目标的间距△PKS。发音动作重叠参数为C2发音动作在C1动作时域内与C1的重叠度C1OL,即C1和C2动作重叠时段与C1动作时段的比率。

在V1#C2V2语料中,C2的参数包括动作幅度C2DIS、生理时长C2LEN、成阻段时长C2APP、接触重心(center of gravity,CoG)、趋中指数(contact centrality,CC)以及擦音的谱重心和谱偏度。C2APP为舌尖动作起点和首帧腭位目标时刻的间距。CoG和CC的计算方法分别见文[13]和[14],擦音声学参数计算方法见文[15]。元音的参数包括DIS、CoG、CC、元音声学时长vLEN和元音声学中点的共振峰F1和F2。元音的DIS定义为元音声学时段中点附近连续3帧腭位中舌腭接触最大帧的接触比率,CoG和CC也基于该帧腭位进行计算。

1.3 统计分析

本文考察SR与音段生理和声学参数是否存在线性关系,使用线性回归的分析方法,计算回归方程的回归系数和确定系数R2。如回归方程显著,则说明参数与语速之间存在线性关系;确定系数越大,则说明语速和参数的线性关系越明显。

2 结果与分析 2.1 辅音丛发音动作时间关系

使用C1#C2语料,以SR为自变量,7个参数为因变量,对2类辅音丛分别进行线性回归分析。表 1是具有显著性的回归方程的2个系数,括号外的数值表示确定系数,括号内的数值表示回归系数,“n.s.”表示回归方程不显著。

表 1 辅音丛回归方程的确定系数R2和回归系数 参数 发音人 辅音丛 /ŋ#t/ /ŋ#s/ ΔOSS XS 0.76a (0.4) 0.79a (0.6) JZ 0.43a (0.5) 0.44a (0.6) ΔPKS XS - - JZ 0.43b(0.4) 0.56a (0.7) C1OL XS 0.44a (-1.9) 0.31a (-1.4) JZ 0.50a (-2.1) 0.42a (-1.9) C1DIS XS - - JZ n.s. n.s. C1LEN XS 0.80a (0.4) 0.85a (0.7) JZ 0.20b(0.4) 0.40a (0.6) C2DIS XS 0.10c (51.4) n.s. JZ 0.25a (81.9) n.s. C2LEN XS 0.41a (0.4) 0.26a (0.3) JZ 0.21b(0.3) n.s.   显著性水平:p < 0.001a, p < 0.01b, p < 0.05c。 表选项

由表 1可知,SR与C1舌体和C2舌尖动作的ΔOSS线性相关,ΔOSS随语速的加快(SR减小)而缩短。ΔPKS数据来自JZ的前字韵母为/iŋ/条件下的样本,与SR也线性相关,ΔPKS随语速的加快而缩短。C1OL与SR线性相关,随着语速的加快,C1OL增大,说明辅音丛的协同发音程度增大。

图 1是SR与ΔOSS以及C1OL的线性关系示意图,图中的回归方程是基于2位发音人数据得出的结果。由图 1a可知,在相同条件下,/ŋ#s/的ΔOSS大于/ŋ#t/的情况。此外,前者的ΔPKS也大于后者的。由图 1b可知,在相同条件下,/ŋ#s/的C1OL小于/ŋ#t/的情况。

图 1 SR与时间关系参数的线性关系 图选项

下面分析C1/ŋ/和C2/t, s/的动作参数。C1DIS来自JZ的前字韵母为/iŋ/条件下的样本。由表 1可知,SR与C1DIS无关,但是与C1LEN线性相关。

图 2是SR与C2DIS以及C2LEN的线性关系示意图。可以看出,语速对C2DIS的影响与C2的发音方式有关,语速对塞音C2DIS影响较大,但是擦音受影响的程度较低。由图 2a可知,在快速条件下,/t/的C2DIS降低,说明出现了动作减弱的趋势;/s/的C2DIS基本不变。SR与C2LEN线性相关,然而JZ的/s/的LEN不受语速影响。由图 2b可知,在相同条件下,/s/比/t/的LEN更长;在快速条件下,/t/的LEN下降较快,/s/的变化则相对较慢。

图 2 SR与C2动作参数的线性关系 图选项

上述结果表明:1) 语速对辅音丛的生理控制机制表现为音段发音动作时间关系的变化,SR与ΔOSS以及ΔPKS呈现正相关,与C1OL负相关;这种关系受到C2发音方式的影响,擦音/s/条件下的时差参数较大,重叠度相对较小;2) SR和C2LEN呈现正相关;快速条件下C2动作幅度是否减弱取决于辅音的发音方式,擦音的动作幅度受影响较少,塞音的动作幅度易于减弱;3) C1舌体动作幅度不受语速影响,但是SR与LEN呈现正相关。

2.2 语速对辅音发音动作和声学特征的影响

使用V1#C2V2语料,以SR为自变量,C2的7个参数为因变量进行线性回归分析。表 2是具有显著性的回归方程的确定系数和回归系数,图 3和4分别为C2DIS以及C2LEN与SR的线性关系。

表 2 C2参数回归方程的确定系数R2和回归系数 参数 发音人 辅音 /t/ /s/ /ʂ/ C2DIS XS 0.72a (291.5) 0.09d(59.0) 0.31b(32.0) JZ - n.s. 0.44c (-86.9) C2CoG XS n.s. n.s. n.s. JZ - 0.78a (3.9) 0.27d(2.9) C2CC XS 0.60a (0.7) n.s. n.s. JZ - n.s. n.s. C2LEN XS 0.45a (0.4) 0.12d(0.2) 0.60a (0.4) JZ - 0.95a (0.9) 0.82a (0.8) C2APP XS n.s. 0.32b(0.3) 0.23b(0.2) JZ - n.s n.s. 谱重心 XS - n.s. 0.23b(3 206) JZ - n.s n.s. 谱偏度 XS - n.s. 0.28b(-2.3) JZ - n.s n.s.   显著性水平:p < 0.001a, p < 0.01b, p < 0.05c, p < 0.1d。 表选项 图 3 发音人XS的SR与C2DIS的线性关系(图中sh表示/ʂ/) 图选项 图 4 发音人XS的SR与C2LEN的线性关系(图中的Sh表示|ʂ|) 图选项

由表 2可知,3个辅音的动作幅度受语速影响的结果不一致。/t/的C2DIS与SR正相关;/s/的C2DIS受语速影响的程度相对较低,XS的SR与C2DIS的关系只表现为趋势效应(p=0.09),JZ的C2DIS与语速无关。SR与/ʂ/的C2DIS线性相关,但是存在个体差异:XS表现为正相关,在快速条件下/ʂ/的舌面与假腭的电极接触数目下降;JZ则表现为负相关,进一步的分析发现,在快速条件下C2DIS上升主要与假腭后4行接触电极数目增多有关,前4行接触电极数目不受语速影响。这说明元音对擦音的协同发音幅度增大。

从图 3可知,XS产出的塞音和擦音的SR与C2DIS的关系存在差异:塞音/t/的C2DIS变化幅度较大,在快速条件下,C2DIS快速降低;/s, ʂ/的C2DIS变化范围相对较小。

CoG和CC反映音段舌腭接触模式的细节特征。由表 2可知,JZ产出的2个擦音的CoG与SR存在正相关关系,SR与/ʂ/的CoG的关系呈现出趋势效应(p=0.07)。在快速条件下,CoG的降低主要与假腭后部接触电极数目增多有关。

上述结果说明:不同语速条件下舌尖擦音的主发音器官动作相对稳定;在快速条件下,由于元音协同发音的增强,舌尖后擦音/ʂ/不参与成阻的舌面上抬。

由表 2可知,XS产出的/t/的CC与SR线性相关。在快速条件下,由于塞音出现了舌尖齿龈不完全闭合的情况,因此CC明显降低。

由XS擦音的结果可知,SR与C1APP线性相关,这说明在较快语速条件下,擦音的舌尖动作能够在较短的时间内到达指定位置。进入到持阻段后,舌尖动作相对稳定,表现为舌腭接触面积基本不变;在慢速条件下,持阻段的舌尖动作存在调整过程。这说明在快、慢速条件下擦音的动作策略存在差别,这与文[8]的结果一致。舌尖塞音的C1APP不受语速影响,原因在于C1APP非常短(0.01~0.04 s之间)。SR和C2LEN线性相关。由图 4可知,在相同条件下,/t/比/s, ʂ/的LEN要低一些。

语速影响XS产出的/ʂ/的声学特征。在快速条件下,/ʂ/的谱重心下降,谱偏度增大,这与发音动作幅度减弱有关。

上述结果表明:1) 辅音动作时长与语速正相关,语速越快,辅音的动作时长就越短;2) 语速只影响擦音的C1APP,在快、慢速条件下擦音的动作过程存在差异;3) 在快速条件下,塞音/t/的舌尖动作出现弱化趋势;擦音发音动作受语速的影响小于塞音, 擦音/ʂ/动作幅度的降低伴随频谱的变化;在快速条件下,元音对擦音的协同发音幅度增大。

2.3 语速对元音发音动作和声学特征的影响

元音动作和频谱特征受多个因素的影响,除语速外,发音人、音节位置以及元音前后的辅音都会影响元音音段的产出。因此,本文对2位发音人的11个双音节分别进行回归分析,考察语速对元音的DIS、CoG、CC、vLEN以及元音的F1和F2共振峰的影响。表 3是元音参数回归方程的确定系数和回归系数。SR与vLEN高度线性相关(R2=0.82~0.99,p < 0.000 1),限于篇幅,不放入表中。

表 3 元音参数回归方程的确定系数R2和回归系数 双音节 发音人 元音参数 DIS CoG CC F1 F2 /sɿ#pa/前 XS 0.44c(51.9) 0.46c(3.5) 0.47c(1.1) 0.77a (-462) 0.35c(-408) JZ 0.79a (76.0) n.s. 0.86a (2.9) 0.74b(-520) n.s. /sɿ#pi/前 XS 0.72a (56.9) 0.71a (3.7) 0.45c(1.1) 0.67a (-531) 0.69a (-1 871) JZ n.s. n.s. n.s. 0.60c(-913) n.s. /pa#sɿ/后 XS 0.83a (169.2) 0.78a (12.4) 0.83a (3.2) 0.74a (-793) 0.88a (-3 170) JZ n.s. n.s. n.s. 0.38c(-631) 0.82a (-4 873) /pi#sɿ/后 XS 0.78a (109.1) 0.77a (7.1) 0.81a (2.3) 0.83a (-568) 0.91a (-2 458) JZ n.s. n.s. n.s. n.s. 0.91a (-3 683) /ʂʅ#pa/前 XS 0.31c(27.9) n.s. n.s. 0.58a (-311) n.s. JZ 0.44c(66.3) 0.38c(-3.7) n.s. 0.44c(-569) 0.70b(2 114) /ʂʅ#pi/前 XS n.s. n.s. n.s. n.s. n.s. JZ 0.33d(34.1) 0.50c(-3.3) n.s. 0.56c(-708) 0.72b(1 905) /pa#ʂʅ/后 XS 0.56b(75.1) 0.43c(3.2) n.s. 0.35c(-433) 0.53b(-785) JZ 0.48c(-47.5) n.s. n.s. n.s. 0.54c(-1 015) /pi#ʂʅ/后 XS n.s. 0.26d(3.2) n.s. n.s. n.s. JZ n.s. 0.28d(-4.3) 0.40c(-1.5) n.s. n.s. /pi#pa/前 XS n.s. n.s. 0.39c(0.7) 0.74a (-493) n.s. JZ n.s. n.s. 0.44c(1.3) 0.62b(-1 282) 0.34d(910) /pa#pi/后 XS 0.72a (84.9) 0.26d(2.1) 0.79a (1.0) 0.68a (-389) n.s. JZ n.s. n.s. n.s. n.s. 0.56c(1 453) /pi#pi/前 XS 0.60b(91.8) 0.54b(2.8) 0.52b(0.8) 0.64a (-796) n.s. JZ 0.41d(-56.4) 0.48d(-2.8) 0.38d(-0.7) 0.48c(-1 021) 0.88a (2 094) /pi#pi/后 XS 0.52c(85.1) n.s. 0.76a (1.3) 0.42c(-410) n.s. JZ n.s. 0.34d(-3.8) n.s. 0.48c(-794) 0.50c(1 641)   显著性水平:p < 0.001a, p < 0.01b, p < 0.05c, p < 0.1d。 表选项

由表 3可知,XS的前字元音/ʅ/的DIS和F1受语速影响,在快速条件下,DIS下降,F1上升。JZ的前字元音/ʅ/的DIS、CoG、F1和F2受语速的影响,语速越快,DIS下降,CoG上升,F1上升,F2下降。首字元音/ʅ/的动作在快速条件下趋于弱化,而声学上表现为央化的趋势。XS的后字元音/ʅ/在快速条件下发音动作减弱,DIS和CoG下降,F1和F2上升。JZ的后字元音/ʅ/随语速的变化方式与XS不同,语速加快,DIS、CC和CoG上升,F1不变,F2上升。

XS的元音/i/的生理参数受语速的影响,语速越快,DIS、CoG和CC下降,说明在快速条件下元音动作幅度和舌腭收紧程度均降低。/i/的频谱特征也发生了变化,语速越快,F1上升。JZ前字元音/i/的CC和频谱特征受到语速的影响,在快速条件下,CC下降,F1上升,F2下降。上述结果表明:快速条件下元音收紧程度的降低使得元音频谱特征发生相应变化。JZ的后字元音/i/的结果与XS的不同,DIS、CoG和CC随语速加快上升,F1上升,F2下降,这有可能与快速条件下后续音节声母/tʂ/的影响有关。

语速对XS的舌尖前元音/ɿ/的发音动作影响显著,语速加快,DIS、CoG和CC降低,F1和F2上升。表 4为3种语速条件下XS产出的元音/ɿ/的腭位,样本取自双音节/sɿ#pa/中的前字元音,图中黑点表示电子假腭的电极,灰色区域表示舌腭接触的区域。可以看出,随着语速的加快,前腭区域的收紧程度明显降低,收紧点截面积增大,舌尖动作出现了明显的弱化;F1和F2的升高表明元音有央化的趋势(F1变化范围为359~532 Hz,F2变化范围为925~1 420 Hz)。语速对JZ的前字元音/ɿ/的DIS和CC有影响,表现为语速加快,DIS下降,前腭区域的收紧程度降低;F2不受语速影响,但是F1随语速的加快而上升。JZ的后字元音/ɿ/的生理参数不受语速影响,但是F1和F2却随语速的加快而上升。上述结果表明:在快速条件下,元音/ɿ/的舌尖动作减弱,在声学上表现出元音央化的趋势。需要注意的是,舌尖动作弱化还有可能与音段间协同发音的增强有关,前字元音的腭位有可能受到跨辅音元音/a/的影响,后字元音的腭位有可能受到后续音节声母/tʂ/的影响。

表 4 3种语速条件下XS产出的元音/ʅ/的腭位 项目 快速 正常 慢速 腭位 表选项

元音分析结果表明:1) SR与vLEN具有高度线性关系;2) 在快速条件下,元音的发音动作易于弱化,元音频谱特征表现出央化的趋势;3) 在快速条件下,元音发音动作易受周边音段的协同发音影响。

3 讨论和结论

本文使用EPG分析了语速对普通话音段产生的影响。普通话语速调整与发音动作指令间距密切相关,快速条件下,相邻音段发音动作指令间距缩短。不同发音器官的动作在时域上重叠,因而协同发音程度增大。然而,发音动作的时间关系受辅音发音方式的制约。研究发现,擦音影响发音动作时间关系,使得动作间绝对时差变大,动作重叠度变小,这是因为鼻音和擦音对软腭的动作要求相互冲突,后者需要关闭鼻咽通道以保持口腔内保持较高的气压条件。

语速对辅音和元音音段的影响主要表现为生理(声学)时长的缩短和动作弱化。在快速条件下,辅音动作时长缩短,发音动作幅度一般降低,但是降低程度取决于辅音的发音方式。塞音动作易于弱化,擦音的动作受语速影响较小,后者受擦音动作控制、空气动力条件和音段感知条件的制约。擦音的成阻动作时长随语速的变化而变化,且在快、慢速条件下产出动作存在差异。元音时长随语速的加快而线性缩短,并伴随着动作幅度的减弱。在快速条件下,元音动作易于弱化,在声学上表现为元音央化的趋势;同时,元音受语音环境影响的程度变大。

分析结果表明:普通话语速控制与音段发音动作的时间关系以及音段动作的时空特征有关,音段发音属性和发音人发音策略也影响不同语速条件下音段产出的结果。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有