CN1452158A - 获取语音基本周期及编码的方法 - Google Patents
获取语音基本周期及编码的方法 Download PDFInfo
- Publication number
- CN1452158A CN1452158A CN02105584A CN02105584A CN1452158A CN 1452158 A CN1452158 A CN 1452158A CN 02105584 A CN02105584 A CN 02105584A CN 02105584 A CN02105584 A CN 02105584A CN 1452158 A CN1452158 A CN 1452158A
- Authority
- CN
- China
- Prior art keywords
- basic cycle
- frame
- unit
- basic
- cycle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明是一种获取语音基本周期及编码的方法,本发明以脱机的方式对语音进行取样,并计算经取样的语音的基本周期,首先提供一低通滤波器以滤掉高频波,接着再将语音取样并将经取样的语音分割成各段长度相同的帧,再以逐步平移的方式逐一计算每个帧的单位基本周期并做基本周期的二倍、1/2倍周期修正,以获得准确的单位基本周期;之后即可由单位基本周期序列撷取基本周期;最后再以二进制方式进行基本周期的编码。
Description
技术领域
本发明涉及一种语音编码方法,特别是一种获取语音基本周期及其编码的方法。
背景技术
随着声带振动的发音,称为有声音(voiced sound)。反之则称为无声音(unvoiced sound),其每秒振动数即为基本频率(fundamentalfrequency),倒数则为基本周期(fundamental period),或称为音调(pitch),由基本周期可决定声音的高或低。音调是人类对声频的感觉,人类说话或唱歌即为一种音调的改变,亦即,语音基本周期数据即由音调改变所形成。
因此,在电子产品的语音资料合成与压缩等领域中,如何能抓住音调(基本周期)的本质,成为语音数据合成与压缩的研究重点,亦即,如何能掌握音调的改变。不过,由于语音本身为一种模拟信号,在数字产品中如何能将语音的模拟信号数字化,并用最少的内存空间来储存,更成为工程师们研究的重点。通过取样(sampling)将语音的模拟信号取样为可数据化的数据,再经过分析处理,得到语音编码的参数,即可将语音数据数字化,而基本周期正是其中一项参数。
另外,为了要让此数据化的语音数据能在信息处理设备间相互进行数据的传送,或在储存时用较少的内存空间,就必须将此语音数据进行位编码,即将每个语音参数以较少的位数来表示。不过,不论是做语音数据的编码或压缩,语音数据的基本周期都会有一个计算上的问题。即在计算时,必须避免算出两倍的基本周期,或1/2基本周期,以免影响译码或解压缩后语音数据的品质。
现有的技术,对于语音数据的基本周期的获取包括特别针对两倍或1/2基本周期做校正的动作,如果在线(on-line)进行实时编码操作,会有运算量上的限制。另外,在计算基本周期时,通常是取各段语音帧(frame)作分析,这些语音帧彼此是连续的语音段,并无重叠。
发明内容
为解决以上现有技术的问题,本发明的目的在于提供一种获取语音基本周期及编码的方法,是在脱机(off-line)的情况下,计算语音的基本周期,因此无运算量的限制,其可准确算出基本周期,有效避免两倍、或1/2基本周期的问题,而且所取的各段分析语音帧是彼此互相重叠的,可增加基本周期变化的分辨率及正确性。
依据本发明所揭露的技术,本发明提供一种获取语音基本周期及编码的方法,至少包下列步骤:首先将语音信号通过一个低通滤波器(Low PassFilter),滤掉高频信号;其次将语音分为多个帧,利用AMDF(AbsoluteMagnitude Difference Function,绝对值差方函数)对每个帧计算出一个语音的单位基本周期,每个帧的划分,是在前一个单位基本周期计算出来后,平移单位基本周期长度而得,接着利用向前(Forward)追踪方式修正两倍、或1/2平均基本周期,即可得出一个准确的单位基本周期;再将所得到的单位基本周期序列,以每个帧为单位,在一个帧长度内的所有单位基本周期取一最佳值或平均值,而得到基本周期;之后只要将此准确的基本周期进行位编码即可,编码可按六位的方式进行。
有关本发明的特征与实例附图和最佳实施例详细说明如下。
附图说明
图1为本发明获取语音基本周期及编码的方法流程图;
图2为本发明单位基本周期的获取方法示意图;
图3为本发明的向前追踪二倍、1/2倍基本周期的流程图;
图4为本发明基本周期编码示意图;
图5为本发明基本周期Ti编获取的流程图;
图6为本发明具体实施例中的波形示意图;
图7为图6的波形经一低通滤波器的前一千个取样波形;
图8为本发明具体实施例中的基本周期获取及向前追踪的结果。
具体实施方式
图1是本发明的获取语音基本周期及编码的方法流程图,本发明所提供的方法,是以脱机方式对语音进行取样,并计算经取样的语音的基本周期,至少包含下列步骤:低通滤波处理(步骤110);撷取语音帧(步骤115);
计算单位基本周期(步骤120);向前追踪二倍、1/2倍单位基本周期(步骤130);撷取基本周期(步骤140);以及,进行编码(步骤150)。以下将对个别的步骤进行详细说明:
首先,步骤110中,先将经取样的语音数据以低通滤波处理(Low PassFiltering),因为语音基本周期长度大约在20ms~2.5ms(50Hz~400Hz)之间,若以取样频率每秒8千次为例,则语音基本周期约为160~20个取样点之间。所以,在处理上可先将400Hz以上的信号滤掉,如此可提高计算准确度。
其次,先将经取样的语音分割成各段帧(步骤115),每一帧长度为M(以取样频率每秒8千次为例,约180个取样点);接着,计算每一个帧当中的基本周期步骤120,在此,称之为单位基本周期。可利用AMDF来找出每个帧中的单位基本周期(以下以Pi表示),其方程序如下: 其中,M为语音帧长度,而i则为帧数,亦即,某个计算中的帧,x’为第i个帧的语音数据。
其中,每个Pi即为使AMDF(k)为最小值的k值:
如上所述,在取样频率为每秒8千次的状况下,k值通常为20,21,…160等。
每一个帧都可以上述的计算方法计算出一个单位基本周期,然而,为了要能更准确的计算出单位基本周期,使其变化较平缓且更具连续性,并有助于向前追踪修正(步骤120),本发明在计算下一个单位基本周期时,以逐步平移的方式来撷取下一个语音帧(步骤115)。其做法为,从第一个帧计算完单位基本周期后,下一个单位基本周期的帧获取范围,是将上一个帧向右平移Pi取样点后所得,如图2所示,其帧重叠了M-Pi个取样点。通过每一次平移,即可得到单位基本周期P1,P2,…,Pn。将第一个帧(平移长度<=帧长度M)之内所有的单位基本周期进行平均即可得第一个帧的平均基本周期,设此值为P0。
每计算出一个单位基本周期后,即进行向前追踪(Forward Tracking)修正两倍、或1/2倍基本周期(步骤130),来进行确认基本周期值的工作,其具体流程请参考图3,步骤如下:计算第一个帧的平均基本周期P0(步骤310);判断是否为两倍基本周期(步骤320);调整单位基本周期(步骤330);判断是否为1/2基本周期(步骤340);调整单位基本周期(步骤350);是否为最后一个帧(步骤360);以及,下一个单位基本周期(步骤365)。
首先,先计算前几个基本周期(第一个帧;基本周期长度的总和<帧长度)的基本周期平均值,设此平均值为P0(步骤310),此P0是平均基本周期的概略值,当作向前追踪的初值,若已知语音的平均基本周期概略范围,则可将P0设成一个常数。接着,在步骤320与330当中,从第1个单元基本周期P1开始,如果这个单位基本周期约等于上一个基本周期的两倍,亦即,如果Pi>Pi-1*2-10(10是一经验值)(步骤330),则依照下列算式调整单位基本周期:Pi=k of min(AMDF(k),k=Pi/2-3~Pi/2+3)。其中,3是一经验值。
接着,在步骤340与350当中,如果这个单位基本周期约等于上一个单位基本周期的1/2,亦即,如果Pi<Pi-1/2+5(5是一经验值)(步骤340),则依照下列算式调整单位基本周期:Pi=k of min(AMDF(k),k=Pi*2-3~Pi*2+3)(步骤350)。其中,3是一经验值。
接着,判断是否为最后一个帧(步骤360),若是即可停止;如果不是,再继续进行下一个单位基本周期(步骤365)的向前追踪。
由以上的向前追踪,每个单位基本周期都以相同的方式做修正,然后回到步骤115,每个帧的撷取原则都与第2图所示相同,以上一个向前追踪修正后的单位基本周期,做为撷取下一个帧的平移长度,最后再做基本周期的撷取工作。
在图1的步骤140当中,由于已进行过基本周期的修正过程,接着,即可撷取欲编码的基本周期。请参考图4,基本周期的编码通常取一个固定长度(M)的帧(以取样频率每秒8千次为例,可取帧长度为20~25ms,亦即,160~200个取样点)为单位,即在每隔一个帧取一个基本周期值编码,因为分析的语音帧是每次位移一个单位基本周期,所以,在位移一个帧中,可有好几个单位基本周期(Pi),此时每隔一个帧取一次的基本周期(Tj)即是从这几个基本周期中撷取出来,并进行编码。其中,Tj可由下列步骤得出,请参考图5:
1、令N=0,i=1,j=1,k=0(步骤510)
2、令N=N+Pi,k=k+1(步骤520)
3、如果N>M,(步骤530)
则计算Tj(步骤540)
且令N=N-M,j=j+1,k=0(步骤550)
其中Tj算法如下:
如口果k<=2,
如果k>2,Tj=Pi,当
有最小值,其中
Pd=Pi,当
有最大值
4、令i=i+1(步骤560)
5、如果i<n(全部单位基本周期数)(步骤570)则回到2(步骤520)
6、结束
最后,进入步骤150,编码(Encoding)。如上所述,以取样频率为每秒8千次为例,基本周期值约在20~160取样点之间,因此,可将基本周期以6bits进行编码。亦即,基本周期[64]={0,20,22,24,26,28,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,92,96,100,104,108,112,116,120,124,128,132,136,140,144,148,152,156,160};其中,0为保留的值。
图6至图8是语音/e/通过本发明所揭露的方法所获得的处理结果,由此说明本发明的具体运作。图6是语音/e/的前1000个取样波形,图7是语音/e/经过低通滤波后的前1000取样波形,图8为初步算出的单位基本周期值(o),与经过向前追踪修正后的单位基本周期值(x)及最后撷取出欲编码的基本周期(□)(fundamental period)比较。
依据本发明所提供的技术,本发明的语音基本周期参数获取及编码的方法,以脱机方式计算出语音的基本周期,因而无运算量的限制,并以帧重叠方式,可准确算出基本周期,有效避免两倍、或1/2基本周期的问题,应用在语音编码或压缩上可对提高语音译码或解压缩后的品质助益甚多。
虽然本发明通过前述的较佳实施例揭露如上,然其并非用以限定本发明,本行业的普通技术人员在不脱离本发明的精神和范围内,可进行各种轻易思及的变化和润饰,因此本发明的专利保护范围应以权利要求书界定的为准。
Claims (8)
1.一种语音基本周期参数获取及编码的方法,是通过脱机方式对该语音进行取样为一取样语音,并通过将该取样语音分割为多段长度相同的帧来计算该取样语音的一个基本周期,其特征在于该方法至少包含下列步骤:
以一逐步平移的方式撷取该多段帧的每一段帧,并获取该多段帧的多个单位基本周期;
由每一段该帧内的该多个单位基本周期中个别撷取一基本周期;以及
将该基本周期编码。
2.如权利要求1所述的语音基本周期参数获取及编码的方法,其特征在于在所述获取该语音的该单位基本周期步骤之前,还包含下列步骤:
提供一低通滤波器,用以将高频的信号进行阻绝。
3.如权利要求1所述的语音基本周期参数获取及编码的方法,其特征在于所述的以逐步平移的方式撷取该下一段帧,是依据该第一段帧所计算出的该第一单位基本周期,向后平移该单位基本周期时间长而得,每一段该帧的选取方式相同。
4.如权利要求1或3所述的语音基本周期参数获取及编码的方法,其特征在于所述的获取多个单位基本周期的步骤,还包含下列步骤:
撷取该取样语音开始的一第一段帧,并计算该第一段帧的一第一单位基本周期;
向前追踪修正单位基本周期,是将该第一段帧所计算出的该第一单位基本周期向前追踪修正一第一个两倍基本周期与将该单元一第一个1/2倍基本周期,并重新计算该第一单位基本周期;以及
以该逐步平移的方式撷取接续该第一段帧的一下一段帧,计算该多段帧的一下一个单位基本周期,重复此步骤至该多段帧的最后一段帧,以个别计算出每一个该单位基本周期。
5.如权利要求4所述的语音基本周期参数获取及编码的方法,其特征在于所述的单位基本周期的计算,是利用一绝对值差方函数处理该多段帧中的每一段该帧而得出该单元基本周期。
6.如权利要求4所述的语音基本周期参数获取及编码的方法,其特征在于所述的向前追踪修正两倍或1/2倍基本周期的步骤,还包含下列步骤:
计算该第一段帧的一平均基本周期;
判断下一个单位基本周期是否为该平均基本周期的两倍,若是,则重新计算该单位基本周期;以及
判断该下一个单位基本周期是否为该平均基本周期之1/2倍,若是,则重新计算该单位基本周期。
7.如权利要求1所述的语音基本周期参数获取及编码的方法,其特征在于所述的将基本周期编码的步骤,是将该基本周期以二进制方式进行编码,如编为六位码。
8.如权利要求1所述的语音基本周期参数获取及编码的方法,其特征在于所述语音的取样频率为每秒八千次。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB02105584XA CN1179322C (zh) | 2002-04-17 | 2002-04-17 | 获取语音基本周期及编码的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB02105584XA CN1179322C (zh) | 2002-04-17 | 2002-04-17 | 获取语音基本周期及编码的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1452158A true CN1452158A (zh) | 2003-10-29 |
CN1179322C CN1179322C (zh) | 2004-12-08 |
Family
ID=29220717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB02105584XA Withdrawn - After Issue CN1179322C (zh) | 2002-04-17 | 2002-04-17 | 获取语音基本周期及编码的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1179322C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101030374B (zh) * | 2007-03-26 | 2011-02-16 | 北京中星微电子有限公司 | 基音周期提取方法及装置 |
-
2002
- 2002-04-17 CN CNB02105584XA patent/CN1179322C/zh not_active Withdrawn - After Issue
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101030374B (zh) * | 2007-03-26 | 2011-02-16 | 北京中星微电子有限公司 | 基音周期提取方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN1179322C (zh) | 2004-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106653056B (zh) | 基于lstm循环神经网络的基频提取模型及训练方法 | |
CN1125430C (zh) | 基于波形的周期性检测器 | |
EP0722165B1 (en) | Estimation of excitation parameters | |
EP0259950A1 (en) | Digital speech sinusoidal vocoder with transmission of only a subset of harmonics | |
KR101414341B1 (ko) | 부호화 장치 및 부호화 방법 | |
WO1980002211A1 (en) | Residual excited predictive speech coding system | |
JPS63500683A (ja) | 並列処理型ピッチ検出器 | |
CN1437747A (zh) | 闭环多模混合域线性预测(mdlp)语音编解码器 | |
CN1165365A (zh) | 音调提取方法和装置 | |
JPH06332496A (ja) | 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法 | |
CN1173690A (zh) | 识别浊音/清音的方法和装置及其语音编码方法 | |
EP1339042B1 (en) | Voice encoding method and apparatus | |
US6456965B1 (en) | Multi-stage pitch and mixed voicing estimation for harmonic speech coders | |
CN1717718A (zh) | 正弦波音频编码 | |
DE69601068T2 (de) | Verfahren zur sprachkodierung mittels analyse durch synthese | |
CN1975861A (zh) | 声码器基音周期参数抗信道误码方法 | |
JPH08511110A (ja) | オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法 | |
CN1112674C (zh) | 用于语音有效编码的谱参数预测分解矩阵量化 | |
WO1987001500A1 (en) | Voice synthesis utilizing multi-level filter excitation | |
CN1145144C (zh) | 对背景噪音信号进行高质量解码的语音解码器 | |
CN1179322C (zh) | 获取语音基本周期及编码的方法 | |
US6061648A (en) | Speech coding apparatus and speech decoding apparatus | |
JP2002505450A (ja) | ハイブリッド被刺激線形予測スピーチ符号化装置及び方法 | |
JP2779325B2 (ja) | ボコーダーにおける前処理の相関関係式を用いたピッチ検索時間短縮方法 | |
KR100323487B1 (ko) | 버스트여기선형예측 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
AV01 | Patent right actively abandoned |
Granted publication date: 20041208 Effective date of abandoning: 20111102 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |