基音是指发浊音时声带振动所引起的周期性。基音周 (n)和声道响应v(n),根据声门脉冲激励e(n)及其倒谱特征 期,又称基音频率,是指发浊音时声带震动所引起的周期运 即可求得基音周期。由于过渡音中的周期激励信号能量降低 动时间间隔,是声带振动频率Fn的倒数【l】。基音周期是语音 和类噪激励信号干扰含噪语音中的噪声干扰,反映基音信息 的一个非常重要的特征参数之一,描述了语音激励源的一 的倒谱峰,在过渡音和含噪语音中会变得不清晰甚至完全消 个重要特征,在语音编码、语音合成、说话人识别、语音识别 失。因此,要对语音信号中的声道响应信息、类噪激励和噪声 和音乐检索等方面有着广泛的应用,是语音研究的一个重 加以适当的抑制,从而改善倒谱基音检测算法的检测结果 要阶段 。 [5]。本文采用线性预测残差技术来改善倒谱法的检测结果。 由于人声道的易变性及其声道特征的因人而异,基音 2.2线性预测残差 周期的范围很宽,且同一个人在不同情态下发音的基音周 在语音信号的线性预测编码(LPC)分析中,语音信号s 期也不同,加之基音周期受到单词发音音调的影响,因此, (n)可以表示为: 基音周期的精确检测实际上是十分困难的问题。总体来说, 占 困难主要反映在以下三个方面I5_:(1)声道共振峰有时会严 s(n):一 ai s(n--i)+Ge(n) (4) i l 重影响激励信号的谐波结构;(2)语音信号本身是准周期性 其中ai为预测系数,P为预测阶数,e(n)为激励信号,G 的,而且其波形的峰值点或过零点受共振峰的结构、噪声的 为幅度音子。如果对输入语音进行线性预测分析获得预测系 影响;(3)基音周期变化范围大,不同的人说话的基音周期 数ai,并根据预测系数构成逆滤波器A(z): 频率分布有所不同,男性主要分布在60--200Hz范围内,女 性和小孩主要分布在200--450Hz之间。针对存在的问题, A(z)=l一 ai z一,ao=l (5) i=0 基音周期的检测和提取有许多方法,本文对传统的倒谱算 再将原始语音通过逆滤波器A(z)进行逆滤波,则可获 法进行进~步的改进,采用基于线性预测残差的倒谱法求 得线性预测残差(预测余量)信号。理论上讲,线性预测残差 语音信号的基音周期。 信号中已不包含声道响应信息,但却包含完整的激励信息。 2.基于线性预测残差的倒谱基音检测方法 对线性预测残差信号进行倒谱分析,并且,残差信号具有非 2.I倒谱分析 常清晰的谐波结构,与原始语音信号的频谱相比,将可获得 根据语音信号产生模型,语音信号sfn)是有声门脉冲激 更为清晰精确的基音信息。 励e(n)经声道响应v(n)滤波而得。即: 2.3算法基本思想 s(n)=e(n) v(n) (1) 基于LPC预测残差的倒谱基音检测算法的基本思想 而一个信号的倒谱定义为信号频谱模的自然对数的逆 是:在对输入语音分帧加窗后,首先对分帧语音进行LPC分 傅里叶变换(即设相位恒定为零),则其倒谱 析,得到预测系数ai,并由此构成逆滤波器A(z);然后将原分 为: 帧语音通过逆滤波器滤波,获得预测残差信号;再对预测残 I 差信号作DFT、取对数后,将多的信号的高频分量置零;最 S(n)=IDEF{In IDFT[s(n)】} (2) 后将此信号作IDFT,得到原信号的倒谱;最终根据所得倒谱 ^ ^ ^ 设三者的倒谱分别为s(n)、e(n)及,v(n) ̄JJ有: 中的基音信息检测出基音周期。 /x A 1一 算法的基本流程如图1所示: S(n):e(n)+v(n) (3) 作者简介:郭淑妮,女,山东威海人。硕士研究生,研究方向:中文信息处理和说话人识别。 于,女,山东龙口人,教授、博士生导师,研究方向;中文信息处理和语音信息处理等。 基金项目:国家自然基金:基于语音、嗓音和呼吸信号的藏语拉萨话韵律模型研究,项目编号:60773052。 34。・—— 基金项目 原始语音信号s(n) 分帧加窗 3.实验结果 对上述方法进行举例说明。图4给出一段藏文的时域波 LPC分析 l 。。。。。。。。‘。。。。。。。。。。。。。。。。。。。。‘。。 。。。。。__J 形图、预测波形图、预测残差图,对预测波形、预测残差波形 分别进行倒谱运算得到图5,对图5中两幅图进行分析,可 I预测系数ai 逆滤波器A(z】 逆诡渡船 l ———————1—————J 以清楚地看出,传统算法所得倒谱并无法消除基音峰点周 围的声道信息,而LP.CEP算法所得残差倒谱的基音峰点更 加清晰可辨。 I线性预测残差 主 里FT、lnl。 II 对信号进行 主 I /行低通滤波 由此表明本文所述算法的检测结果比传统倒谱检测结 处理 高频分量置零l 基啬周jI目检翊I 图1基于LPC预测残差的倒谱基音检测算法框图 2.4基音周期提取的后处理 任何一种基音检测算法都可能产生基音检测错误,使求 得的基音周期轨迹有个别点偏离正常轨迹(偏离到正常值 的2倍或1/2),即出现“野点”。如图2所示: 图2有“野点”基音周期图 为消除野点需要对预测结果进行平滑处理,常用的平滑 算法有中值平滑算法和线性平滑算法。中值平滑处理的方 法是在被平滑的点的两侧各取M个点,连同自身在内的 2M+1个点进行排序,序列中间的点的值作为该点新的取 值。线形平滑处理的方法是对周围的点进行线形加权,设T 为平滑前的序列,现在准备平滑第i个点,那么 T(i)=T(i一1)/4+T(i)/2+T(i=1)/4 (6) 对图2所得基音周期进行平滑处理之后得到图3。 图3 中值平滑后的基音周期图 果有所改善。 DD1 O D' D ∞ 1∞ 19 雹Ⅱ 卸 3130 图4藏语语音的波形图、预测波形图、预测残差图 原始语音帧倒谱 预测残差倒谱 a5 : ●l _● O .a5 ^一= }^ 0 — 1r ~^}_l — —}● —~ l I;I I田 1m 1卫 1‘O 1an 1田 语音帧 图5原始语音帧倒谱图、预测残差倒谱图 周期圈 一 』¨ …A 一…7 …1广l。 ’ .J: 广、 、 …‘ J... ...。 4.结束语 随着语音技术的成熟,基音检测技术也不断发展与完 善。基于LPC线性预测残差的倒谱方法只是(下转第45页) 一35一 伽 的布局与车体的设计都需要仔细考虑,要符合自动控制原 理和机械运动的要求。电机、传感器两个功能单元在本方案 的基础上还可以针对速度和准确性进一步改进和升级,从 而进一步提高智能老鼠探索迷宫的速度。 图8改前红外线传感器单元布局 图9斜角传感器单元 Algorithm Design of Intelligent Mouse Passing through the Labyrinth He Lijun Wang Liyan (The Engineering and Technical College of Chengdu University of Technology,Leshan 614007,Sichuan) 【^】hhI醴】The paper manufactures the intelligent mouse based on 32 Cortex—M3 core LM3S615 microcontroller,the infrared sensor and step—b step electrical machinery.It also studies the automatic exploration algorithm in the complex labyrinth.Through the automatic selection of algorithm according to diferent labyrinth by the intelligent mouse.Finally,it realizes the automatic addressing and hte shortest path seeking in the labyrinth. 【 喇由】LM3¥615;Intelligent Mouse;labyrinth;algoritmh (上接第35页) 其中的一种,本文中利用预测残差信号进行基音周期估计, [2]邵艳秋,韩纪庆,刘挺等.自然风格言语的汉语句重音自动判 其优点在于残差信号的谱接**坦,同时共振峰效应在残 别研究[J].声学学报,2006,31(3):203.210. 差信号中也被去除,使共振峰不会影响到基音周期的估计。 【3】Yang Min,Yang Yingchun,Wu Zhaohui.A pitch—basede rapid 近年来,为了改善基音检测算法,也有一些基于倒谱的 speech segmentation for speaker indexing[J].Seventh IEEE International Symposium on Mulitmedia,2005:6 改进算法被提出来,例如统计检测的思想方法、非线性声道 【4】赵晓群,刘颖娜,武睿.基于形态滤波的基音检测新方法[J】. 系数模型的思想、倒谱与单边ACF相结合的方法[61、结合谐 通信学报,2004,25(5):53.58. 波积谱和基于LP残差的倒谱分析『7】等等,有待于我们进一 [5]赵力.语音信号处理【M】.北京:机械工业出版社,2003. 步学习研究。 [6】蔡莲红,黄德智,蔡锐.现代语音技术基础与应用[M】.北京: 清华大学出版社,2003. 参考文献: [7】钱博,李燕萍,唐振民等.一种基于线性预测残差倒谱的基音 [1】王炳锡,屈丹,彭煊.实用语音识别基础[m].北京:国防工业 检测算法[J].计算机工程与应用,2007,43(32):210.213. 出版社,,2005. Pitch Detection Based on Linear Predictive Residual Cepstrum Guo Shuni Yao Xu Yu Hongzhi (China Minorities Information Technology nIstitute,Northwest University for Nationaliites,LanzhoB 730030,Ganshu) 【 bI岫 】The traditional algorihtm of pitch detection f0r the noisy speech has the poor test results.This paper adopts lniear predictive residual method based on linear predictive cepstrum to solve this problem.The results show that it makes the peak point more clearly and improves theaccuracy ofpitch detection. 【 喇:dI】pitch detection;LPC—residual;cepstrum 一45—