JPH113098A - Method and device of encoding speech - Google Patents

Method and device of encoding speech

Info

Publication number
JPH113098A
JPH113098A JP9155552A JP15555297A JPH113098A JP H113098 A JPH113098 A JP H113098A JP 9155552 A JP9155552 A JP 9155552A JP 15555297 A JP15555297 A JP 15555297A JP H113098 A JPH113098 A JP H113098A
Authority
JP
Japan
Prior art keywords
pitch period
frame
pitch
subframe
current frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9155552A
Other languages
Japanese (ja)
Other versions
JP3435310B2 (en
Inventor
Masahiro Oshikiri
正浩 押切
Kimio Miseki
公生 三関
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP15555297A priority Critical patent/JP3435310B2/en
Priority to US09/012,792 priority patent/US6202046B1/en
Publication of JPH113098A publication Critical patent/JPH113098A/en
Priority to US09/726,562 priority patent/US6704702B2/en
Application granted granted Critical
Publication of JP3435310B2 publication Critical patent/JP3435310B2/en
Priority to US10/675,947 priority patent/US7191120B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method of encoding speech permitting to calculate a pitch cycle of a speech signal by a less calculation amount and express it by a less information amount. SOLUTION: An input speech signal from an input terminal 21 is divided into frames by a frame sub-frame composition part 22 and each frame is further divided into sub-frames, and then, pitch cycles of at least two of a present frame, a past frame to the present frame, and a future frame are determined by a pitch cycle analysis part 23. From these pitch cycles, pitch cycles of each sub-frame are determined by interpolating by a sub-frame pitch cycle extraction part 24. And, this sub-frame pitch cycle information is outputted from an output terminal 25.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声信号の圧縮符
号化を行う音声符号化方法に係り、特に音声信号の符号
化処理の中のピッチ周期を求める処理に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech encoding method for compressing and encoding a speech signal, and more particularly to a process for obtaining a pitch period in a speech signal encoding process.

【0002】[0002]

【従来の技術】音声信号を低ビットレートで高能率に圧
縮符号化する技術は、自動車電話等の移動体通信や企業
内通信において、電波の有効利用や通信コストの削減に
重要な技術である。
2. Description of the Related Art A technique for compressing and encoding an audio signal at a low bit rate with high efficiency is an important technique for effective use of radio waves and reduction of communication costs in mobile communication such as a car telephone or in a company communication. .

【0003】8kbps以下のビットレートで品質の優
れた音声合成が可能な音声符号化方式として、CELP
(Code Excited Linear Prediction)方式が知られてい
る。CELP方式は、M.R.Schrodeder氏とB.S.Atal氏に
より、“Code-Excited Linear Prediction(CELP) High-
Quality Speech at Very low Bit Rates”,Proc.ICASS
P;1985,pp.937-939(文献1)で発表されて以来、高品
質な音声が合成できる方式として注目され、品質の改善
や計算量の削減について、種々の検討がなされてきた。
[0003] CELP is a speech encoding system capable of performing speech synthesis of excellent quality at a bit rate of 8 kbps or less.
(Code Excited Linear Prediction) method is known. The CELP method is described in “Code-Excited Linear Prediction (CELP) High-Level” by MR Schrodeder and BSAtal.
Quality Speech at Very low Bit Rates ”, Proc.ICASS
P; 1985, pp. 937-939 (Reference 1), it has attracted attention as a method of synthesizing high-quality speech, and various studies have been made on improving quality and reducing the amount of calculation.

【0004】CELP方式による音声符号化を実現する
ための構成要素の一つとして、適応符号帳がある。適応
符号帳は、入力音声信号のピッチ予測分析を閉ループ動
作または合成による分析(Analysis by Synthesis)によ
って行うものである。一般に適応符号帳によるピッチ予
測分析は、20〜147サンプルの探索範囲(128候
補)でピッチ周期の探索を行って、目標信号に対する歪
が最小となるピッチ周期を求め、このピッチ周期の情報
を7ビットの符号化データとして伝送することが多い。
[0004] As one of the components for realizing speech coding by the CELP method, there is an adaptive codebook. The adaptive codebook performs pitch prediction analysis of an input speech signal by closed loop operation or analysis by synthesis (Analysis by Synthesis). In general, in pitch prediction analysis using an adaptive codebook, a search for a pitch period is performed in a search range (128 candidates) of 20 to 147 samples to find a pitch period that minimizes distortion with respect to a target signal. It is often transmitted as coded data of bits.

【0005】上述した従来のCELP方式では、サブフ
レーム単位に閉ループ動作によってピッチ周期を決定す
るため、前述のようにピッチ周期の探索範囲が128候
補と大きい場合、計算量が膨大になってしまう。さら
に、このような直接的なピッチ周期探索法では、ピッチ
周期の情報はサブフレーム当たり7ビット必要となり、
仮に4サブフレームで1フレームが構成されると、フレ
ーム当たり28ビットものビット数が必要になってしま
う。
In the conventional CELP system described above, the pitch period is determined by a closed loop operation in units of subframes. Therefore, when the search range of the pitch period is as large as 128 candidates as described above, the amount of calculation becomes enormous. Further, in such a direct pitch period search method, the pitch period information requires 7 bits per subframe,
If one frame is composed of four subframes, as many as 28 bits are required per frame.

【0006】本来、音声信号のピッチ周期の変動はゆる
やかな部分が多く、サブフレーム毎に全探索を行う必要
はない。このようなピッチ周期の性質を利用して、計算
量の削減およびビット数の削減が可能である。そのよう
な観点から、ピッチ周期の探索範囲を限定する差分ピッ
チ表現を用いる方法が報告されている。
[0006] Originally, the pitch cycle of the voice signal fluctuates largely in many parts, and it is not necessary to perform a full search for each subframe. Utilizing such a property of the pitch period, the amount of calculation and the number of bits can be reduced. From such a viewpoint, a method using a differential pitch expression that limits the search range of the pitch cycle has been reported.

【0007】その一つに、ピッチ周期の探索に際し奇数
サブフレームについては全ての候補探索を行い、偶数サ
ブフレームについては奇数サブフレームの近傍の候補の
みを探索することで、計算量とビット数を削減する方法
がJ.P.Campbell,Jr.氏らによって“An Expandable Erro
r-Protected 4800 bps CELP coder(U.S.Federal Standa
rd 4800 bps Voice Coder)”,Proc.ICASSP;1989,pp.73
5-738 (文献2)で報告されている。この方法によれ
ば、奇数サブフレームについては128候補の全探索、
偶数サブフレームについては例えば32候補に限定して
ピッチ周期の探索を行うと、ピッチ周期の情報量をフレ
ーム当たり24ビットに削減することができる。
One of them is to search all candidates for odd-numbered sub-frames and search only candidates near odd-numbered sub-frames for even-numbered sub-frames when searching for a pitch period. JPCampbell, Jr. et al. “An Expandable Erro
r-Protected 4800 bps CELP coder (USFederal Standa
rd 4800 bps Voice Coder) ”, Proc. ICASSP; 1989, pp. 73
5-738 (Reference 2). According to this method, for odd subframes, a full search of 128 candidates,
For example, when the pitch period is searched for even 32 subframes, the information amount of the pitch period can be reduced to 24 bits per frame.

【0008】しかし、この方法では奇数サブフレームで
求めたピッチ周期が実際のピッチ周期と大きく異なる値
が選択された場合、次のサブフレームにまで影響を与え
てしまい、品質劣化が知覚されるという問題が生じる。
実際、サブフレームのように短い区間でピッチ分析を行
うと、実際と異なるピッチ周期が求まりやすくなってし
まう。
However, according to this method, if a value that is different from the actual pitch period is selected for the pitch period obtained in the odd-numbered sub-frames, it affects the next sub-frame and quality degradation is perceived. Problems arise.
In fact, if pitch analysis is performed in a short section such as a subframe, a pitch cycle different from the actual one is likely to be obtained.

【0009】また、安定的にフレームのピッチ周期を求
め、各サブフレームをそれぞれフレームピッチ周期から
の変動量として表し、その近傍のみピッチ周期を探索す
る方法がM.Yong氏らによって“Efficient Encoding of
the Long-Term Predictor inVector Excitation Coders
”,Boston,MA:Kluwer,1991,pp329-338 (文献3)で
報告されている。この方法によれば、フレームのピッチ
周期の情報を7ビットで表し、サブフレームのピッチ周
期の情報を5ビットで表している。
A method of stably obtaining the pitch cycle of a frame, expressing each sub-frame as a variation from the frame pitch cycle, and searching for a pitch cycle only in the vicinity thereof is described by M. Yong et al. In "Efficient Encoding of
the Long-Term Predictor inVector Excitation Coders
According to this method, information on the pitch period of a frame is represented by 7 bits, and information on the pitch period of a subframe is represented by 5 bits. [Boston, MA: Kluwer, 1991, pp. 329-338 (Reference 3)] Expressed in bits.

【0010】この方法の利点は、全てのサブフレームの
ピッチ周期探索は32候補だけに対して行えばよく、大
幅な計算量削減が可能となる点にある。しかしながら、
この方法には、フレーム内でピッチ周期が変動するよう
な場合に大きな劣化が生じてしまうという問題点があ
る。この問題点を図1(a)を用いて説明する。
The advantage of this method is that the search for the pitch period of all the subframes needs to be performed for only 32 candidates, and the amount of calculation can be greatly reduced. However,
This method has a problem that significant deterioration occurs when the pitch period fluctuates in a frame. This problem will be described with reference to FIG.

【0011】図1(a)に示すように、実際のピッチ周
期がフレーム内で変動するような場合、フレームのピッ
チ周期はその中での平均的な周期として求められる。各
サブフレームのピッチ周期は、フレームのピッチ周期の
近傍を探索範囲とする。しかし、探索範囲が十分な大き
さでない場合、図1(a)に示すように実際のピッチ周
期を求めることはできない。また、探索範囲を大きくし
てしまうと、それだけピッチ周期の情報を表すのに必要
なビット数が必要になり、計算量やビット削減の効果が
小さくなってしまう。
As shown in FIG. 1A, when the actual pitch period fluctuates in a frame, the pitch period of the frame is obtained as an average period in the frame. The pitch period of each subframe is set to a search range near the pitch period of the frame. However, if the search range is not large enough, the actual pitch period cannot be obtained as shown in FIG. In addition, if the search range is enlarged, the number of bits required to represent the information of the pitch period becomes necessary, and the amount of calculation and the effect of bit reduction are reduced.

【0012】[0012]

【発明が解決しようとする課題】上述したように、従来
の音声符号化方法であるCELP方式では、サブフレー
ム単位の閉ループ探索によってピッチ周期を求めるた
め、ピッチ周期を求めるのに必要な計算量が膨大とな
り、しかもピッチ周期情報のビット数が増大するという
問題点がある。
As described above, in the CELP system, which is a conventional speech coding method, the pitch period is obtained by a closed-loop search in units of subframes, so that the amount of calculation required to obtain the pitch period is small. There is a problem that it becomes enormous and the number of bits of pitch period information increases.

【0013】また、文献2に記載されたような探索範囲
を限定してピッチ周期を求める方法では、ピッチ周期を
求めるための計算量およびピッチ周期情報のビット数が
減少するが、ピッチ周期を正しく求めることが難しいと
いう問題点がある。
In the method described in Reference 2 for obtaining the pitch period by limiting the search range, the amount of calculation for obtaining the pitch period and the number of bits of the pitch period information are reduced. There is a problem that it is difficult to obtain.

【0014】さらに、文献3に記載されたようにサブフ
レームのピッチ周期をフレームのピッチ周期からの変動
量としてフレームのピッチ周期近傍においてのみ探索す
る方法では、大幅な計算量の削減が可能であるが、フレ
ーム内でピッチ周期が変動するような場合はサブフレー
ムのピッチ周期を正しく求めることができないという問
題点があった。
Further, as described in Reference 3, in the method of searching the pitch period of a subframe as a variation from the pitch period of the frame only in the vicinity of the pitch period of the frame, it is possible to greatly reduce the amount of calculation. However, when the pitch period fluctuates within the frame, there is a problem that the pitch period of the sub-frame cannot be correctly obtained.

【0015】本発明は、このような従来技術の問題点を
解消するためになされたもので、音声信号のフレーム周
期を少ない計算量で正しく求めることができ、かつピッ
チ周期を少ない情報量で表現できる音声符号化方法を提
供することを目的とする。
The present invention has been made in order to solve such problems of the prior art, and it is possible to correctly obtain a frame period of an audio signal with a small amount of calculation and express a pitch period with a small amount of information. It is an object of the present invention to provide a speech encoding method capable of performing the above.

【0016】[0016]

【課題を解決するための手段】上記の課題を解決するた
め、本発明は入力音声信号を予め定められた長さのフレ
ームに分割し、入力音声信号のピッチ周期を求める処理
を含む音声符号化処理において、符号化しようとする現
フレームに対して時間的に未来のフレームのピッチ周期
を求める処理と、このピッチ周期を符号化する処理とを
含むことを特徴とする。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, the present invention divides an input speech signal into frames of a predetermined length and includes a process for obtaining a pitch period of the input speech signal. The process is characterized in that it includes a process of obtaining a pitch period of a future frame in time with respect to a current frame to be coded, and a process of coding this pitch period.

【0017】また、本発明は入力音声信号を予め定めら
れた長さのフレームに分割し、各フレームの音声信号を
さらにサブフレームに分割して、音声信号のピッチ周期
を求める処理を含む音声符号化処理において、符号化し
ようとする現フレームと現フレームに対して過去のフレ
ームおよび未来のフレームのうちの少なくとも二つのフ
レームのピッチ周期を用いて現フレーム中のサブフレー
ムのピッチ周期予測値を求め、このピッチ周期予測値を
用いて現フレーム中のサブフレームのピッチ周期を求め
ることを特徴とする。
Also, the present invention provides a speech code including a process of dividing an input speech signal into frames of a predetermined length, further dividing the speech signal of each frame into subframes, and finding a pitch period of the speech signal. In the encoding process, a pitch period prediction value of a subframe in the current frame is obtained using a pitch period of at least two frames of a past frame and a future frame for the current frame to be encoded and the current frame. The pitch period of a subframe in the current frame is obtained using the predicted pitch period value.

【0018】このように本発明では、現フレームに対し
て未来のフレームのピッチ周期を求めるため、現フレー
ムのピッチ周期や過去のフレームのピッチ周期とともに
用いて、補間により現フレーム中のサブフレームのピッ
チ周期予測値を求め、このピッチ周期予測値を用いて現
フレーム中のサブフレームのピッチ周期を求めることに
より、フレーム内でピッチ周期が変動する場合であって
も、サブフレームのピッチ周期を精度よく、かつ少ない
計算量で求め、しかも少ない情報量で表すことができ
る。
As described above, according to the present invention, the pitch period of the future frame is obtained with respect to the current frame, and is used together with the pitch period of the current frame and the pitch period of the past frame to obtain the pitch period of the subframe in the current frame. The pitch period prediction value is obtained, and the pitch period of the subframe in the current frame is obtained using the pitch period prediction value. Therefore, even if the pitch period fluctuates within the frame, the pitch period of the subframe can be accurately determined. It can be obtained with a good and small amount of calculation, and can be represented with a small amount of information.

【0019】図1(b)を用いて説明すると、同図に示
されるように図1(a)と同様に実際のピッチ周期はフ
レーム内で変化している。本発明では例えば現フレーム
のピッチ周期と過去のフレームのピッチ周期とで補間を
行い、各サブフレーム毎にサブフレームピッチ周期予測
値を求め、その近傍にサブフレームのピッチ周期の探索
範囲を決定する。このため、実際のピッチ周期は探索範
囲の中に含まれ、ピッチ周期の正確な探索を行うことが
できる。
Referring to FIG. 1B, as shown in FIG. 1, the actual pitch period changes within a frame, as in FIG. 1A. In the present invention, for example, interpolation is performed between the pitch cycle of the current frame and the pitch cycle of the past frame, a subframe pitch cycle prediction value is obtained for each subframe, and a search range of the pitch cycle of the subframe is determined in the vicinity thereof. . For this reason, the actual pitch period is included in the search range, and an accurate search for the pitch period can be performed.

【0020】また、サブフレームピッチ周期予測値は実
際のピッチ周期をかなり正確に近似するため、サブフレ
ームのピッチ周期の探索範囲を例えば8候補のように狭
めても問題は生じない。サブフレームピッチ周期の探索
範囲を8候補とすると、フレームのピッチ周期は7ビッ
ト、サブフレーム当たり3ビットで表されるため、4サ
ブフレームで1フレームとすれば、サブフレームのピッ
チ周期は、従来ではフレーム当たり28ビットで必要で
あったの対し、7ビット+3ビット*4=19ビットの
情報量で表すことができる。また、サブフレームピッチ
周期の探索範囲が8候補と小さいため、計算量の削減に
も大きく寄与する。
Further, since the predicted value of the subframe pitch period approximates the actual pitch period fairly accurately, there is no problem even if the search range of the pitch period of the subframe is narrowed to, for example, eight candidates. If the search range of the subframe pitch period is 8 candidates, the pitch period of the frame is represented by 7 bits and 3 bits per subframe. Therefore, if one frame is composed of 4 subframes, the pitch period of the subframe is In contrast to the requirement of 28 bits per frame, it can be represented by an information amount of 7 bits + 3 bits * 4 = 19 bits. Further, since the search range of the subframe pitch period is as small as eight candidates, it greatly contributes to the reduction of the calculation amount.

【0021】本発明においては、上記のようにして求め
られた現フレーム中のサブフレームのピッチ周期を符号
化してもよいし、入力される音声信号のピッチ周期成分
を強調するピッチフィルタを有する場合、上記のように
して求められた現フレーム中のサブフレームのピッチ周
期を用いてピッチフィルタの伝達関数を決定するように
してもよい。ピッチフィルタは、例えば聴感重みフィル
タやポストフィルタの一構成要素として知られる。
In the present invention, the pitch period of the sub-frame in the current frame obtained as described above may be encoded, or a case where a pitch filter for enhancing the pitch period component of the input audio signal is provided. The transfer function of the pitch filter may be determined using the pitch period of the subframe in the current frame obtained as described above. The pitch filter is known as a component of, for example, an auditory weight filter or a post filter.

【0022】さらに、本発明は過去の駆動信号系列を予
め定められた範囲に含まれる周期で繰り返して生成され
る複数の適応ベクトルを格納した適応符号帳を有し、こ
の適応符号帳から取り出される適応ベクトルを所定のフ
ィルタに通して得られる信号と目標ベクトルとの誤差が
最小となる周期の適応ベクトルを所定の探索範囲から探
索する処理を含む音声符号化処理において、入力音声信
号を予め定められた長さのフレームに分割し、各フレー
ムの音声信号をさらにサブフレームに分割した後、符号
化しようとする現フレームと現フレームに対して過去の
フレームおよび未来のフレームのうちの少なくとも二つ
のフレームのピッチ周期を用いて現フレーム中のサブフ
レームのピッチ周期予測値を求め、このピッチ周期予測
値を用いて現フレーム中のサブフレームについての前記
探索範囲を決定することを特徴とする。
Further, the present invention has an adaptive codebook storing a plurality of adaptive vectors generated by repeating past drive signal sequences at a cycle included in a predetermined range, and is extracted from the adaptive codebook. In a speech encoding process including a process of searching an adaptive vector having a cycle in which an error between a signal obtained by passing an adaptive vector through a predetermined filter and a target vector is minimized from a predetermined search range, an input audio signal is determined in advance. After the audio signal of each frame is further divided into sub-frames, the current frame to be encoded and at least two of the past and future frames with respect to the current frame are encoded. The pitch period prediction value of the subframe in the current frame is obtained using the pitch period of the current frame, and the current frame And determines the search range for the sub-frame in the arm.

【0023】本発明においては、フレームのピッチ周期
を求める際、フレーム毎にピッチ周期の分析位置を適応
的に決定してもよい。より具体的には、ピッチ周期分析
位置を音声信号、予測残差信号、または低域通過フィル
タ通過後の予測残差信号の短区間パワーの大きさで判定
する。このようにすることにより、ピッチ周期をより正
確に求めることができ、復号音声の品質向上が図られ
る。
In the present invention, when determining the pitch period of a frame, the analysis position of the pitch period may be determined adaptively for each frame. More specifically, the pitch period analysis position is determined by the magnitude of the short-term power of the speech signal, the prediction residual signal, or the prediction residual signal after passing through the low-pass filter. By doing so, the pitch period can be determined more accurately, and the quality of decoded speech can be improved.

【0024】また、ピッチ周期の連続性に応じて現フレ
ーム中のサブフレームのピッチ周期を求める方法を選択
してもよい。例えば、ピッチ周期が連続的に変化してい
ると判定された場合は、サブフレームピッチ周期予測値
を求め、この近傍を探索することによりサブフレームピ
ッチ周期を求める。逆に、ピッチ周期の変化が不連続で
あると判定された場合、サブフレームピッチ周期は全探
索によって求める。このような適応処理により、ピッチ
周期の連続性に応じて最適なサブフレームピッチ周期の
探索法が選択されるため、復号音声の品質が向上する。
Further, a method of obtaining the pitch period of the sub-frame in the current frame according to the continuity of the pitch period may be selected. For example, when it is determined that the pitch period is continuously changing, a predicted value of the sub-frame pitch period is obtained, and a sub-frame pitch period is obtained by searching the vicinity thereof. Conversely, when it is determined that the change in the pitch period is discontinuous, the subframe pitch period is obtained by a full search. By such adaptive processing, a search method for an optimal subframe pitch cycle is selected according to the continuity of the pitch cycle, so that the quality of decoded speech is improved.

【0025】また、複数のサブフレームのピッチ周期の
変動を表す相対ピッチパターンを複数個格納した相対ピ
ッチパターン符号帳をさらに有し、サブフレームのピッ
チ周期の変化を相対ピッチパターン符号帳から所定の指
標に基づいて選択した一つの相対ピッチパターンによっ
て表すようにしてもよく、これによりサブフレームピッ
チ周期を表す情報のさらなるビット数削減を図ってい
る。
Further, the apparatus further includes a relative pitch pattern codebook storing a plurality of relative pitch patterns representing variations of the pitch cycle of the plurality of subframes, and a change in the pitch cycle of the subframe is determined by a predetermined value from the relative pitch pattern codebook. It may be represented by one relative pitch pattern selected based on the index, thereby further reducing the number of bits of the information indicating the subframe pitch period.

【0026】すなわち、相対ピッチパターン符号帳は、
例えば出現頻度の高い相対ピッチパターンをベクトルと
して格納している。これと複数のサブフレームのピッチ
周期をベクトル化したものとマッチングをとり、最も適
した相対ピッチパターンで複数のサブフレームのピッチ
周期を表すようにする。例えば、サブフレームのピッチ
周期を個別に表すのにサブフレーム当たり3ビット必要
であれば、4サブフレーム当たり12ビット必要になる
が、この4次元ベクトルを相対ピッチパターン符号帳内
の7ビットの大きさを持つ一つの相対ピッチパターンで
表現すれば、フレーム当たり5ビットのビット削減につ
ながる。
That is, the relative pitch pattern codebook is:
For example, a relative pitch pattern having a high appearance frequency is stored as a vector. This is matched with a vectorized pitch period of a plurality of subframes, and the pitch period of the plurality of subframes is represented by the most suitable relative pitch pattern. For example, if three bits per subframe are required to individually represent the pitch period of a subframe, 12 bits are required per four subframes. This four-dimensional vector is represented by the size of 7 bits in the relative pitch pattern codebook. If represented by one relative pitch pattern having a length, this leads to a bit reduction of 5 bits per frame.

【0027】また、本発明においては入力音声信号を予
め定められた長さのフレームに分割し、入力音声信号の
ピッチ周期を求める処理を含む音声符号化処理を行うた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体であって、符号化しようとする現フレームに対
して時間的に未来のフレームのピッチ周期を求める処理
と、このピッチ周期を符号化する処理とを実行するため
のプログラムを記録した記録媒体が提供される。
Further, in the present invention, a computer-readable program storing a program for performing a speech encoding process including a process of dividing an input speech signal into frames of a predetermined length and calculating a pitch period of the input speech signal is provided. A possible recording medium, in which a program for executing a process of obtaining a pitch period of a future frame in time with respect to a current frame to be encoded and a process of encoding the pitch period is recorded. A recording medium is provided.

【0028】また、本発明によると入力音声信号を予め
定められた長さのフレームに分割し、各フレームの音声
信号をさらにサブフレームに分割して、音声信号のピッ
チ周期を求める処理を含む音声符号化処理を行うための
プログラムを記録したコンピュータ読み取り可能な記録
媒体であって、符号化しようとする現フレームと現フレ
ームに対して過去のフレームおよび未来のフレームのう
ちの少なくとも二つのフレームのピッチ周期を用いて現
フレーム中のサブフレームのピッチ周期予測値を求め、
このピッチ周期予測値を用いて現フレーム中のサブフレ
ームのピッチ周期を求める処理を実行するためのプログ
ラムを記録した記録媒体が提供される。
According to the present invention, an audio signal includes a process of dividing an input audio signal into frames of a predetermined length, further dividing the audio signal of each frame into subframes, and obtaining a pitch period of the audio signal. A computer-readable recording medium on which a program for performing an encoding process is recorded, wherein a current frame to be encoded and a pitch of at least two frames of a past frame and a future frame with respect to the current frame. Using the period, determine the predicted pitch period of the subframe in the current frame,
A recording medium is provided that records a program for executing a process of obtaining a pitch period of a subframe in the current frame using the pitch period predicted value.

【0029】さらに、本発明においては過去の駆動信号
系列を予め定められた範囲に含まれる周期で繰り返して
生成される複数の適応ベクトルを格納した適応符号帳を
有し、この適応符号帳から取り出される適応ベクトルを
所定のフィルタに通して得られる信号と目標ベクトルと
の誤差が最小となる周期の適応ベクトルを所定の探索範
囲から探索する処理を含む音声符号化処理を行うための
プログラムを記録したコンピュータ読み取り可能な記録
媒体であって、入力音声信号を予め定められた長さのフ
レームに分割し、各フレームの音声信号をさらにサブフ
レームに分割した後、符号化しようとする現フレームと
現フレームに対して過去のフレームおよび未来のフレー
ムのうちの少なくとも二つのフレームのピッチ周期を用
いて現フレーム中のサブフレームのピッチ周期予測値を
求め、このピッチ周期予測値を用いて現フレーム中のサ
ブフレームについての前記探索範囲を決定する処理を実
行するためのプログラムを記録した記録媒体が提供され
る。
Further, in the present invention, there is provided an adaptive codebook storing a plurality of adaptive vectors generated by repeating a past drive signal sequence at a cycle included in a predetermined range, and is extracted from the adaptive codebook. A program for performing a speech encoding process including a process of searching an adaptive vector having a cycle that minimizes an error between a signal obtained by passing an adaptive vector through a predetermined filter and a target vector from a predetermined search range is recorded. A computer-readable recording medium, which divides an input audio signal into frames of a predetermined length, further divides the audio signal of each frame into subframes, and then encodes the current frame and the current frame to be encoded. Using the pitch periods of at least two of the past and future frames in the current frame. Determine the pitch period prediction value of the sub-frame, a recording medium recording a program for executing processing for determining the search range for the sub-frame of the current frame by using the pitch period prediction value is provided.

【0030】[0030]

【発明の実施の形態】以下、本発明による音声符号化方
法の実施形態について説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an embodiment of a speech encoding method according to the present invention will be described.

【0031】(第1の実施形態)図2は、本発明の第1
の実施形態に係る音声符号化方法におけるピッチ周期分
析の基本動作を説明するためのブロック図である。同図
において、入力端子11にはディジタル化された音声信
号(以下、入力音声信号という)が順次入力される。こ
の入力音声信号は、フレーム構成部12で予め定められ
た長さのフレームと呼ばれる単位に分割される(フレー
ム化)。このフレーム構成部12でフレーム化された音
声信号はピッチ周期分析部13によりピッチ周期の分析
が行われ、ピッチ周期の情報が出力端子14から出力さ
れる。
(First Embodiment) FIG. 2 shows a first embodiment of the present invention.
It is a block diagram for demonstrating the basic operation | movement of the pitch period analysis in the speech encoding method which concerns on embodiment. In FIG. 1, digitized audio signals (hereinafter referred to as input audio signals) are sequentially input to an input terminal 11. The input audio signal is divided by the frame composing unit 12 into units called frames of a predetermined length (frame formation). The pitch period of the voice signal framed by the frame forming unit 12 is analyzed by a pitch period analyzing unit 13, and pitch period information is output from an output terminal 14.

【0032】次に、フレーム構成部12の動作を図3を
用いて説明する。便宜上、ここでは後述する第2の実施
形態におけるフレーム・サブフレーム構成部22(図
4)におけるサブフレーム構成部の動作についても説明
する。
Next, the operation of the frame forming section 12 will be described with reference to FIG. For convenience, the operation of the subframe forming unit in the frame / subframe forming unit 22 (FIG. 4) according to the second embodiment described later will also be described.

【0033】図3は、本実施形態における入力音声信号
のフレーム構造とサブフレーム構造を表す。図3では、
フレームを特定するためにf(m) という記号を付してい
る。ここで、m=0のフレームはこれから符号化しよう
とするフレーム(現フレームという)を表し、m≦−1
のフレームは既に符号化が終了している過去のフレーム
を表す。さらに、frは現フレームに対して時間的に未
来のフレーム(これを先読み部という)を表す。
FIG. 3 shows a frame structure and a sub-frame structure of an input audio signal in the present embodiment. In FIG.
The symbol f (m) is attached to specify the frame. Here, a frame with m = 0 represents a frame to be coded from now (referred to as a current frame), and m ≦ −1.
Represents a past frame for which encoding has already been completed. Furthermore, fr represents a frame temporally future with respect to the current frame (this is referred to as a prefetch unit).

【0034】入力音声信号をs(n) と表し、s(0) を現
フレームの先頭に位置する音声信号とすると、s(n) と
f(m) およびfrの間には次のような関係が成り立つ。
Assuming that the input audio signal is represented by s (n) and s (0) is the audio signal located at the head of the current frame, the following is defined between s (n) and f (m) and fr. The relationship holds.

【0035】 f(m) ={s(n) ;n=m*NF〜(m+1)*NF−1} (1) (m≦0) fr={s(n) ;n=NF〜NF+ND−1} (2) ここで、NFはフレーム長、NDは先読み部の長さを表
す。本実施形態ではNF=160、ND=120として
説明する。
F (m) = {s (n); n = m * NF〜 (m + 1) * NF−1} (1) (m ≦ 0) fr = {s (n); n = NF〜 NF + ND-1} (2) Here, NF represents the frame length, and ND represents the length of the prefetch section. In the present embodiment, a description will be given assuming that NF = 160 and ND = 120.

【0036】また、フレームf(0) のサブフレームをs
f(k) とすると、s(m) とsf(k)の間には次のような
関係が成り立つ。 sf(k) ={s(n) ;n=k*NSF〜(k+1)*NSF−1} (0≦k≦K−1) (3) ここで、NSFはサブフレーム長、Kはサブフレーム数
をそれぞれ表す。本実施形態ではNSF=40、K=4
として説明を行う。また、nはサンプルを表す変数、m
はフレームを表す変数、kはサブフレームを表す変数で
ある。
The subframe of the frame f (0) is defined as s
Assuming f (k), the following relationship holds between s (m) and sf (k). sf (k) = {s (n); n = k * NSF to (k + 1) * NSF-1} (0 ≦ k ≦ K−1) (3) where NSF is a subframe length, and K is Each represents the number of subframes. In this embodiment, NSF = 40, K = 4
The description is made as follows. N is a variable representing a sample, m
Is a variable representing a frame, and k is a variable representing a subframe.

【0037】このようにフレームとサブフレームを構成
した後に、ピッチ周期分析部13においてピッチ周期分
析を行う。ピッチ周期分析部13は、先読み部frに分
析の中心を置いてピッチ周期の分析を行う点に特徴があ
る。分析の中心の定義は後で述べる。
After the frame and the subframe are constructed in this manner, the pitch period analysis section 13 performs a pitch period analysis. The pitch period analysis unit 13 is characterized in that the analysis of the pitch period is performed with the analysis center placed at the prefetch unit fr. The definition of the center of the analysis will be described later.

【0038】ピッチ周期の分析には既存の技術を適用で
きる。例えば、「音声のディジタル信号処理」コロナ社
発行(文献4)にいくつかピッチ分析法が紹介されてい
る。本実施形態では、次のようなピッチ周期分析法を用
いている。
Existing techniques can be applied to the analysis of the pitch period. For example, several pitch analysis methods are introduced in "Sound Digital Signal Processing" published by Corona (Reference 4). In the present embodiment, the following pitch period analysis method is used.

【0039】まず、図示しないLPC分析部において、
入力音声信号s(n) を分析してLPC係数を求め、この
LPC係数を使って次式で表される伝達関数A(z) の予
測フィルタを構成する。
First, in an LPC analyzer (not shown),
The input speech signal s (n) is analyzed to obtain LPC coefficients, and the LPC coefficients are used to construct a prediction filter for a transfer function A (z) represented by the following equation.

【0040】[0040]

【数1】 (Equation 1)

【0041】ここで、α(i) はLPC係数、IPは分析
次数をそれぞれ表す。本実施形態では、IP=10とし
て説明を進める。この伝達関数A(z) の予測フィルタに
音声信号s(n) を通して、予測残差信号e(n) を次式に
従い求める。
Here, α (i) represents an LPC coefficient, and IP represents an analysis order. In the present embodiment, description will be made on the assumption that IP = 10. The prediction residual signal e (n) is obtained according to the following equation by passing the speech signal s (n) through the prediction filter of the transfer function A (z).

【0042】[0042]

【数2】 (Equation 2)

【0043】次に、予測残差信号e(n) にハミング窓を
掛けて窓掛け信号u(n) を求め、この窓掛け信号u(n)
の相関分析を行い、次式に示す相関値ρ(t) を用いてピ
ッチ周期を抽出する。
Next, a windowing signal u (n) is obtained by multiplying the prediction residual signal e (n) by a Hamming window, and this windowing signal u (n) is obtained.
And a pitch period is extracted using a correlation value ρ (t) shown in the following equation.

【0044】[0044]

【数3】 (Equation 3)

【0045】ここで、NWはピッチ周期分析長、NCは
ピッチ周期分析位置をそれぞれ表す。本実施形態では、
NW=160、NC=200として説明を行う。また、
相関値ρ(t) の分析範囲は{20≦t≦147}とす
る。
Here, NW represents a pitch period analysis length, and NC represents a pitch period analysis position. In this embodiment,
The description will be made on the assumption that NW = 160 and NC = 200. Also,
The analysis range of the correlation value ρ (t) is {20 ≦ t ≦ 147}.

【0046】そして、相関値ρ(t) が最大となるときの
tがフレームのピッチ周期Tの情報として出力端子14
から出力される。このピッチ周期Tの情報は例えば符号
化され、図示しない復号器へ伝送される。
Then, t when the correlation value ρ (t) becomes the maximum is output from the output terminal 14 as information on the pitch period T of the frame.
Output from The information of the pitch period T is encoded, for example, and transmitted to a decoder (not shown).

【0047】窓関数にハミング窓や方形窓のような対称
窓を用いた場合、ピッチ分析位置は窓関数の中心と考え
ることができる。また、窓の形が左と右で異なる非対称
窓を用いた場合、その分析位置は対称窓と同様に中心部
と考えることはできない。この場合、本実施形態では窓
関数の振幅値が最大となる位置を中心としてみなすこと
にする。
When a symmetric window such as a Hamming window or a rectangular window is used as the window function, the pitch analysis position can be considered as the center of the window function. When an asymmetric window having different left and right window shapes is used, the analysis position cannot be considered to be the center as in the case of the symmetric window. In this case, in the present embodiment, the position where the amplitude value of the window function is maximum is regarded as the center.

【0048】このように本実施形態では、現フレームに
対して未来のフレームのピッチ周期を求めるため、これ
を後述するように現フレームのピッチ周期や過去のフレ
ームのピッチ周期とともに用いて、補間により現フレー
ム中のサブフレームのピッチ周期予測値を求め、このピ
ッチ周期予測値を用いて現フレーム中のサブフレームの
ピッチ周期を求めることにより、フレーム内でピッチ周
期が変動する場合であっても、サブフレームのピッチ周
期を精度よく、かつ少ない計算量で求め、しかも少ない
情報量で表すことができる。
As described above, in the present embodiment, in order to obtain the pitch cycle of the future frame with respect to the current frame, this is used together with the pitch cycle of the current frame and the pitch cycle of the past frame as described later, and interpolation is performed. Obtain the pitch period predicted value of the subframe in the current frame, and by using this pitch period predicted value to obtain the pitch period of the subframe in the current frame, even if the pitch period fluctuates within the frame, The pitch period of the subframe can be obtained with high accuracy and with a small amount of calculation, and can be represented with a small amount of information.

【0049】(第2の実施形態)図4は、本発明の第2
の実施形態に係る音声符号化方法におけるサブフレーム
ピッチ抽出の基本動作を説明するためのブロック図であ
る。同図において、入力端子21へのディジタル化され
た入力音声信号は、フレーム・サブフレーム構成部22
でフレームに分割され、各フレームはさらにサブフレー
ムに分割される。このフレーム・サブフレーム構成部2
2でフレーム化された音声信号およびサブフレーム化さ
れた音声信号は、ピッチ周期分析部23およびサブフレ
ームピッチ周期抽出部24に入力される。ピッチ周期分
析部23では、ピッチ周期Tの分析が行われ、ピッチ周
期Tの情報がサブフレームピッチ周期抽出部24に入力
される。
(Second Embodiment) FIG. 4 shows a second embodiment of the present invention.
It is a block diagram for demonstrating the basic operation | movement of a sub-frame pitch extraction in the speech encoding method which concerns on embodiment. In FIG. 1, a digitized input audio signal to an input terminal 21 is transmitted to a frame / subframe forming unit 22.
Are divided into frames, and each frame is further divided into subframes. This frame / subframe forming unit 2
The audio signal framed in 2 and the audio signal subframed are input to a pitch period analysis unit 23 and a subframe pitch period extraction unit 24. The pitch period analysis unit 23 analyzes the pitch period T, and information on the pitch period T is input to the subframe pitch period extraction unit 24.

【0050】サブフレームピッチ周期抽出部24では、
ピッチ周期分析部23で求められたピッチ周期Tを基
に、サブフレーム毎のピッチ周期ST(k) が求められ、
このサブフレームピッチ周期ST(k) の情報が出力端子
25から出力される。
In the subframe pitch period extracting section 24,
On the basis of the pitch period T obtained by the pitch period analysis unit 23, a pitch period ST (k) for each subframe is obtained,
Information on the subframe pitch period ST (k) is output from the output terminal 25.

【0051】次に、図5を用いて本実施形態の特徴部分
であるサブフレームピッチ周期抽出部24について説明
する。図5はサブフレームピッチ周期抽出部24の構成
を示すブロック図であり、入力端子101に入力される
図4のピッチ周期分析部23からのピッチ周期Tの情報
を用いて、サブフレームピッチ周期予測値算出部102
でサブフレーム毎にサブフレームピッチ周期予測値を算
出する。サブフレームピッチ周期算出部104では、サ
ブフレームピッチ周期予測値算出部102で求めたサブ
フレームピッチ周期予測値を基に、入力端子103に入
力される図4のフレーム・サブフレーム構成部22から
の音声信号を用いてサブフレーム毎にサブフレームピッ
チ周期ST(k) を算出し、このサブフレームピッチ周期
ST(k)の情報を出力端子105へ出力する。
Next, the subframe pitch period extracting unit 24, which is a feature of this embodiment, will be described with reference to FIG. FIG. 5 is a block diagram showing the configuration of the sub-frame pitch period extracting unit 24. The sub-frame pitch period predicting unit 24 uses the information of the pitch period T from the pitch period analyzing unit 23 of FIG. Value calculation unit 102
Calculates the subframe pitch period prediction value for each subframe. The sub-frame pitch period calculation unit 104 receives the sub-frame pitch period prediction value obtained by the sub-frame pitch period prediction value calculation unit 102 and inputs the sub-frame pitch period prediction value from the frame / sub-frame configuration unit 22 shown in FIG. The sub-frame pitch period ST (k) is calculated for each sub-frame using the audio signal, and information on the sub-frame pitch period ST (k) is output to the output terminal 105.

【0052】図6を用いて、サブフレームピッチ周期の
算出方法をさらに詳細に説明する。まず、ピッチ周期分
析部23において現フレームf(0) で求めたピッチ周期
をT(0) とし、過去のフレームf(-1)で求めたピッチ周
期をT(-1)とする。サブフレームピッチ周期抽出部24
では、これらの2つのピッチ周期を用いてサブフレーム
ピッチ周期予測値STP(k) をサブフレーム毎に求め
る。本実施形態では、T(-1)とT(0) とから補間により
サブフレームピッチ周期予測値STP(k) を求める方法
について説明する。音声信号の性質から、本来のサブフ
レームピッチ周期ST(k) はサブフレームピッチ周期予
測値STP(k) の近傍にあると考えることができる。そ
の理由として、音声信号のピッチ周期は時間的な変動が
小さいということが挙げられる。
The method of calculating the subframe pitch period will be described in more detail with reference to FIG. First, the pitch period determined by the pitch period analyzer 23 in the current frame f (0) is defined as T (0), and the pitch period determined in the past frame f (-1) is defined as T (-1). Subframe pitch period extraction unit 24
Then, a sub-frame pitch period prediction value STP (k) is obtained for each sub-frame using these two pitch periods. In the present embodiment, a description will be given of a method of obtaining a sub-frame pitch cycle predicted value STP (k) by interpolation from T (-1) and T (0). From the nature of the audio signal, it can be considered that the original subframe pitch period ST (k) is near the predicted subframe pitch period value STP (k). The reason is that the pitch cycle of the audio signal has a small temporal variation.

【0053】次に、サブフレームピッチ周期予測値ST
P(k) を用いてサブフレームピッチ周期ST(k) を求め
る方法を図7を用いて説明する。上述のようにサブフレ
ームピッチ周期ST(k) はサブフレームピッチ周期予測
値STP(k) の近傍にあるという仮定が成り立つことか
ら、その近傍のみをピッチ周期抽出のための範囲として
考えることができる。図7では、第0サブフレームsf
(0) におけるサブフレームピッチ周期予測値STP(0)
と、サブフレームピッチ周期ST(0) を抽出するための
相関値計算の範囲NRを表している。
Next, the subframe pitch period prediction value ST
A method of obtaining the subframe pitch period ST (k) using P (k) will be described with reference to FIG. As described above, since it is assumed that the subframe pitch period ST (k) is near the predicted subframe pitch period value STP (k), only the vicinity can be considered as a range for pitch period extraction. . In FIG. 7, the 0th subframe sf
Subframe pitch period predicted value STP (0) in (0)
And the range NR of the correlation value calculation for extracting the subframe pitch period ST (0).

【0054】このように本実施形態では、サブフレーム
ピッチ周期予測値STP(0) を中心として±NR/2の
範囲をサブフレームピッチ周期ST(0) を求めるための
相関値計算の範囲としている。すなわち、STP(0) −
NR/2≦t≦STP(0) +NR/2−1の範囲に含ま
れる周期についてのみ、先に示した式(6)で規定され
る相関値ρ(t) を算出し、これが最大値をとるときのS
TP(0) に対する相対ピッチ周期ΔT(0) の情報を出力
端子25より出力する。従って、サブフレームsf(0)
のサブフレームピッチ周期ST(0) は、サブフレームピ
ッチ周期予測値STP(0) と相対ピッチ周期ΔT(0) と
の和STP(0) +ΔT(0) として求めることができる。
同様にして、他のサブフレームsf(k) の相対ピッチ周
期ΔT(k) を求め、この情報を出力端子25より出力す
る。本実施形態ではNR=8としている。
As described above, in this embodiment, the range of ± NR / 2 around the predicted subframe pitch period STP (0) is used as the range for calculating the correlation value for obtaining the subframe pitch period ST (0). . That is, STP (0) −
The correlation value ρ (t) defined by the above equation (6) is calculated only for the period included in the range of NR / 2 ≦ t ≦ STP (0) + NR / 2-1, and this is the maximum value. S when taking
Information on the relative pitch period ΔT (0) with respect to TP (0) is output from the output terminal 25. Therefore, subframe sf (0)
Can be obtained as the sum STP (0) + ΔT (0) of the predicted subframe pitch period STP (0) and the relative pitch period ΔT (0).
Similarly, the relative pitch period ΔT (k) of another subframe sf (k) is obtained, and this information is output from the output terminal 25. In this embodiment, NR = 8.

【0055】本実施形態によると、次のような効果が得
られる。まず、サブフレームピッチ周期を求めるための
相関値計算の範囲をNRとすることができるため、大幅
な計算量削減が実現できる。仮に、サブフレーム毎にサ
ブフレームピッチ周期を式(6)により求めると、全て
のピッチ周期候補(128候補)について計算する場
合、約40,000回の積和演算が必要になる。これに
対し、本実施形態を適用した場合、相関値計算範囲をN
R=3とすると積和演算は約4,000回で済み、約9
0%計算量を削減できる。但し、これはピッチ周期分析
長NW=160のもとで計算した結果である。
According to the present embodiment, the following effects can be obtained. First, since the range of the correlation value calculation for obtaining the sub-frame pitch period can be NR, a large reduction in calculation amount can be realized. If the sub-frame pitch period is obtained for each sub-frame by equation (6), when calculating for all pitch period candidates (128 candidates), about 40,000 multiply-accumulate operations are required. In contrast, when the present embodiment is applied, the correlation value calculation range is set to N
If R = 3, the product-sum operation is about 4,000 times, and about 9
0% calculation amount can be reduced. However, this is the result calculated under the pitch period analysis length NW = 160.

【0056】また、従来ではサブフレームピッチ周期を
表すのに必要な情報量は、サブフレーム毎に128候補
の全範囲について計算する場合、4サブフレームで1フ
レームが構成されるとすると、フレーム当たり7ビット
*4=28ビットが必要であった。これに対し、本実施
形態ではフレームピッチ周期T(0) を表すのに7ビッ
ト、相対ピッチ周期ΔT(k) を表すのにサブフレーム当
たり3ビットあればよいから、サブフレームピッチ周期
を表すのに必要な情報量はフレーム当たり7ビット+3
ビット*4=19ビットとなり、約35%のビット数削
減につながる。なお、過去のフレームのピッチ周期T(-
1)は、1フレーム前の処理におけるピッチ周期T(0) で
代用することができるため、これを新たにビットを使っ
て表す必要はない。
Conventionally, the amount of information required to represent the subframe pitch period is calculated in the entire range of 128 candidates for each subframe. If one frame is composed of four subframes, 7 bits * 4 = 28 bits were required. On the other hand, in this embodiment, 7 bits are required to represent the frame pitch period T (0), and 3 bits per subframe are required to represent the relative pitch period ΔT (k). The amount of information required is 7 bits per frame + 3
Bit * 4 = 19 bits, which leads to a bit number reduction of about 35%. Note that the pitch cycle T (-
Since 1) can be substituted by the pitch period T (0) in the processing of one frame before, it is not necessary to express this using a new bit.

【0057】次に、本実施形態におけるサブフレームピ
ッチ周期算出の処理手順を図8のフローチャートにより
説明する。まず、ステップS11で入力音声信号をフレ
ーム化、サブフレーム化を行う。次に、ステップS12
で現フレーム内に分析の中心を置いてピッチ周期T(0)
を算出する。次に、ステップS13で現フレームのピッ
チ周期T(0) と過去のフレームのピッチ周期T(-1)とを
用いて、サブフレーム毎のサブフレームピッチ周期予測
値STP(k) を求める。そして、ステップS14でカウ
ンタkを0に設定した後、ステップS15でサブフレー
ムsf(k) の相対ピッチ周期ΔT(k) を算出し、ステッ
プS16でカウンタkを1だけインクリメントする。ス
テップS17でカウンタkがK(Kはサブフレーム数)
に一致しているかどうかの判定を行う。ここでkがKに
一致していなければ、ステップS15に戻って処理を継
続し、一致したならば処理は終了する。
Next, the processing procedure for calculating the sub-frame pitch period in this embodiment will be described with reference to the flowchart of FIG. First, in step S11, the input audio signal is framed and subframed. Next, step S12
With the center of the analysis in the current frame, the pitch period T (0)
Is calculated. Next, in step S13, a predicted sub-frame pitch period value STP (k) for each sub-frame is obtained using the pitch period T (0) of the current frame and the pitch period T (-1) of the past frame. Then, after setting the counter k to 0 in step S14, the relative pitch period ΔT (k) of the subframe sf (k) is calculated in step S15, and the counter k is incremented by 1 in step S16. In step S17, the counter k is K (K is the number of subframes).
It is determined whether or not they match. If k does not match K, the process returns to step S15 to continue the process, and if they match, the process ends.

【0058】(第3の実施形態)図9を用いて本発明の
第3の実施形態を説明する。本実施形態と第2の実施形
態の違いは、サブフレームピッチ周期予測値STP(k)
を求める際に、先読み部frのピッチ周期Trを利用し
ている点にある。
(Third Embodiment) A third embodiment of the present invention will be described with reference to FIG. The difference between this embodiment and the second embodiment is that the predicted value of the subframe pitch period STP (k)
Is obtained by using the pitch cycle Tr of the pre-read unit fr.

【0059】サブフレームの中心が過去のフレームf(-
1)のピッチ周期T(-1)の分析位置と現フレームf(0) の
ピッチ周期T(0) の分析位置の間にある場合、そのサブ
フレームのサブフレームピッチ周期予測値STP(k)
は、T(-1)とT(0) を用いて求められる。同様に、サブ
フレームの中心が現フレームf(0) のピッチ周期T(0)
の分析位置と先読み部frのピッチ周期Trの分析位置
の間にある場合、そのサブフレームのサブフレームピッ
チ周期予測値STP(k) は、T(0) とTrを用いて求め
られる。本実施形態では、直線補間を用いてサブフレー
ムピッチ周期予測値STP(k) を算出している。
The center of the sub-frame is set to the past frame f (-
If it is between the analysis position of the pitch period T (-1) of 1) and the analysis position of the pitch period T (0) of the current frame f (0), the predicted subframe pitch period STP (k) of the subframe
Is calculated using T (-1) and T (0). Similarly, the center of the subframe is the pitch period T (0) of the current frame f (0).
Is located between the analysis position of the subframe and the analysis position of the pitch period Tr of the prefetch unit fr, the predicted subframe pitch period value STP (k) of the subframe is obtained using T (0) and Tr. In the present embodiment, the sub-frame pitch cycle predicted value STP (k) is calculated using linear interpolation.

【0060】このようにしてサブフレームピッチ周期予
測値STP(k) を求めた後に、第2の実施形態と同様に
して相対ピッチ周期ΔT(k) をサブフレーム毎に求め
る。
After the sub-frame pitch period predicted value STP (k) is obtained in this manner, the relative pitch period ΔT (k) is obtained for each sub-frame in the same manner as in the second embodiment.

【0061】また、本実施形態においてサブフレームピ
ッチ周期ST(k) を表すのに必要な情報は、現フレーム
のピッチ周期T(0) を1フレーム前の処理において求め
た先読み部frのピッチ周期Trで代用することができ
るため、先読み部frのピッチ周期Trとサブフレーム
毎の相対ピッチ周期ΔT(k) だけでよい。
In the present embodiment, the information necessary to represent the subframe pitch period ST (k) is the pitch period T (0) of the current frame, the pitch period of the look-ahead fr obtained in the processing one frame before. Since Tr can be used instead, only the pitch period Tr of the prefetch unit fr and the relative pitch period ΔT (k) for each subframe are required.

【0062】次に、図10に示すフローチャートを用い
て本実施形態における処理手順を説明する。図10のス
テップS21、S24、S25、S26およびS27の
処理は、図8のステップS11、S14、S15、S1
6およびS17とそれぞれ同じであるので、ここでは説
明を省略する。図10の処理手順の特徴的な部分は、ス
テップS22で先読み部frに分析の中心を置いてピッ
チ周期Trを算出する点と、ステップS23でサブフレ
ームピッチ周期予測値STP(k) を先読み部frのピッ
チ周期Trと現フレームf(0) のピッチ周期T(0) とを
用いて求めるか、もしくは現フレームf(0) のピッチ周
期T(0) と過去のフレームf(-1)のピッチ周期T(-1)と
を用いて求めるかのいずれかを使う点にある。
Next, the processing procedure in this embodiment will be described with reference to the flowchart shown in FIG. The processing in steps S21, S24, S25, S26 and S27 in FIG. 10 is performed in steps S11, S14, S15, S1 in FIG.
6 and S17, respectively, and the description is omitted here. A characteristic part of the processing procedure of FIG. 10 is that the pitch period Tr is calculated with the analysis center placed in the prefetch unit fr in step S22, and the subframe pitch period predicted value STP (k) is calculated in step S23. It is determined using the pitch period Tr of fr and the pitch period T (0) of the current frame f (0), or the pitch period T (0) of the current frame f (0) and the past frame f (-1). The point is that either one of the values obtained using the pitch period T (-1) is used.

【0063】本実施形態では、いずれのサブフレームピ
ッチ周期予測値STP(k) も過去のフレームf(-1)のピ
ッチ周期T(-1)と現フレームf(0) のピッチ周期T(0)
、またはT(0) と先読み部frのピッチ周期Trの内
挿値として表されるため、より正確な予測値を得ること
ができる。
In the present embodiment, each of the predicted sub-frame pitch periods STP (k) has a pitch period T (-1) of the past frame f (-1) and a pitch period T (0) of the current frame f (0). )
, Or as an interpolated value of T (0) and the pitch period Tr of the prefetch unit fr, so that a more accurate predicted value can be obtained.

【0064】例えば、実際のピッチ周期が図11に示す
ように変動している場合、第2の実施形態のように過去
のフレームのピッチ周期T(-1)と現フレームのピッチ周
期T(0) を基にサブフレームピッチ周期予測値STP
(k) を求める方法では、サブフレームピッチ周期予測値
STP(k) の信頼性が低下してしまうという問題が生じ
ることがある。これに対し、本実施形態では先読み部f
rのピッチ周期Trが実際のピッチ周期を正確に表すた
め、その補間値も実際のピッチ周期を正確に表すことが
できるようになる。
For example, when the actual pitch period fluctuates as shown in FIG. 11, the pitch period T (-1) of the past frame and the pitch period T (0) of the current frame as in the second embodiment. ) Based on the subframe pitch period predicted value STP
In the method of obtaining (k), there may be a problem that the reliability of the predicted subframe pitch period STP (k) is reduced. In contrast, in the present embodiment, the prefetch unit f
Since the pitch period Tr of r accurately represents the actual pitch period, the interpolated value can also accurately represent the actual pitch period.

【0065】(第4の実施形態)図12を用いて本発明
の第4の実施形態を説明する。本実施形態と第3の実施
形態の違いは、サブフレームピッチ周期予測値STP
(k) を求める際に、先読み部frのピッチ周期Trと現
フレームf(0) のピッチ周期T(0) を用いる点にある。
(Fourth Embodiment) A fourth embodiment of the present invention will be described with reference to FIG. The difference between this embodiment and the third embodiment is that the subframe pitch period prediction value STP
When (k) is obtained, the pitch period Tr of the pre-read unit fr and the pitch period T (0) of the current frame f (0) are used.

【0066】本実施形態の処理手順を図13に示すフロ
ーチャートを用いて説明する。図13におけるステップ
S31、S34〜S37の処理は、図8におけるステッ
プS11、S14〜S17の処理と同様であるので、こ
こでは説明を省略する。
The processing procedure of this embodiment will be described with reference to the flowchart shown in FIG. The processes in steps S31 and S34 to S37 in FIG. 13 are the same as the processes in steps S11 and S14 to S17 in FIG.

【0067】ステップS32において、先読み部frに
分析の中心を置いてピッチ周期Trを算出する。次に、
ステップS33で先読み部frのピッチ周期Trと現フ
レームf(0) のピッチ周期T(0) を用いてサブフレーム
ピッチ周期予測値STP(k)を算出する。
In step S32, a pitch period Tr is calculated with the analysis centered on the prefetch section fr. next,
In step S33, the sub-frame pitch cycle predicted value STP (k) is calculated using the pitch cycle Tr of the prefetch unit fr and the pitch cycle T (0) of the current frame f (0).

【0068】本実施形態では、先読み部frのピッチ周
期Trと現フレームf(0) のピッチ周期T(0) とから補
間によりサブフレームピッチ周期予測値STP(k) を求
めることができるため、第3の実施形態に比べ先読み部
frの長さを短くでき、従って遅延を小さくできるとい
うメリットがある。
In the present embodiment, the sub-frame pitch period predicted value STP (k) can be obtained by interpolation from the pitch period Tr of the prefetch section fr and the pitch period T (0) of the current frame f (0). Compared with the third embodiment, there is an advantage that the length of the prefetch unit fr can be shortened, and thus the delay can be reduced.

【0069】(第5の実施形態)図14を用いて本発明
の第5の実施形態を説明する。本実施形態と第4の実施
形態の違いは、サブフレームピッチ周期予測値STP
(k) を求める際に、先読み部frのピッチ周期Trと過
去のフレームf(-1)のピッチ周期T(-1)を用いている点
にある。
(Fifth Embodiment) A fifth embodiment of the present invention will be described with reference to FIG. The difference between this embodiment and the fourth embodiment is that the subframe pitch period prediction value STP
When (k) is obtained, the pitch period Tr of the pre-read unit fr and the pitch period T (-1) of the past frame f (-1) are used.

【0070】本実施形態によると、次のような効果があ
る。ピッチ周期の正確な分析は一般に困難であり、現在
においても確立された方式があるわけではない。本実施
形態では式(6)で表される相関分析による方法につい
て説明しているが、この場合も常に正しいピッチ周期を
求められるわけではなく、実際のピッチ周期の整数分の
1のピッチ周期が求められてしまったり、逆に整数倍の
ピッチ周期が求められてしまう場合がある。
According to the present embodiment, the following effects can be obtained. Accurate analysis of the pitch period is generally difficult and there is no established method to date. In the present embodiment, the method based on the correlation analysis represented by the equation (6) is described. However, also in this case, a correct pitch period cannot always be obtained, and a pitch period equal to an integer fraction of the actual pitch period is calculated. In some cases, the pitch period may be obtained, or conversely, an integral multiple of the pitch period may be obtained.

【0071】図14に示されるように、現フレームf
(0) のピッチ周期T(0) の分析が失敗し、実際のピッチ
周期から大きく外れてしまった場合、先読み部frのピ
ッチ周期Trと過去のフレームf(-1)のピッチ周期T(-
1)とで補間を行い、サブフレームピッチ周期予測値ST
P(k) を求めるようにすれば、現フレームf(0) のピッ
チ周期T(0) が正確に求まった場合と同様に効率的にピ
ッチ周期を表現することができる。
As shown in FIG. 14, the current frame f
If the analysis of the pitch period T (0) of (0) fails and deviates greatly from the actual pitch period, the pitch period Tr of the prefetch unit fr and the pitch period T (-) of the past frame f (-1)
Interpolation is performed using 1) and the subframe pitch period prediction value ST
If P (k) is obtained, the pitch period can be expressed efficiently as in the case where the pitch period T (0) of the current frame f (0) is accurately obtained.

【0072】本実施形態の処理手順を図15に示すフロ
ーチャートを用いて説明する。図15におけるステップ
S41、S42、S45、S47、S48、S49およ
びS50の処理は、図10におけるステップS21、S
22、S23、S24、S25、S26およびS27の
処理と同じであるので、ここでは説明を省略する。本実
施形態で特徴的な部分は、ステップS43、S44およ
びS46の処理であるので、これらの処理について説明
する。
The processing procedure of this embodiment will be described with reference to the flowchart shown in FIG. The processing of steps S41, S42, S45, S47, S48, S49 and S50 in FIG.
22, S23, S24, S25, S26, and S27 are the same as those described above, and thus description thereof is omitted here. A characteristic part of the present embodiment is the processing of steps S43, S44 and S46, and these processings will be described.

【0073】ステップS43およびS44において先読
み部で求めたピッチ周期Trと過去のフレームのピッチ
周期T(-1)との平均値をステップS43で算出し、その
平均値と現フレームのピッチ周期T(0) との大きさを次
式(7)に従い比較する(ステップS44)。
In steps S43 and S44, the average value of the pitch period Tr obtained by the prefetch unit and the pitch period T (-1) of the past frame is calculated in step S43, and the average value and the pitch period T ( 0) is compared with the following equation (7) (step S44).

【0074】[0074]

【数4】 (Equation 4)

【0075】式(7)が成立する場合、現フレームf
(0) のピッチ周期T(0) は信頼できるものとして、ステ
ップS45に示すようにサブフレームピッチ周期予測値
STP(k) を算出するために現フレームf(0) のピッチ
周期T(0) を用いる。逆に、式(7)が成立しないとき
は、ステップS46で示すように先読み部frのピッチ
周期Trと過去のフレームf(-1)のピッチ周期T(-1)の
みを用いてサブフレームピッチ周期予測値STP(k) を
算出する。
If equation (7) holds, the current frame f
Assuming that the pitch period T (0) of (0) is reliable, the pitch period T (0) of the current frame f (0) is calculated to calculate the predicted subframe pitch period STP (k) as shown in step S45. Is used. Conversely, when the equation (7) does not hold, as shown in step S46, the sub-frame pitch is calculated using only the pitch cycle Tr of the prefetch unit fr and the pitch cycle T (-1) of the past frame f (-1). Calculate the cycle prediction value STP (k).

【0076】(第6の実施形態)図16を用いて本発明
の第6の実施形態を説明する。図16において、入力端
子201、フレーム・サブフレーム構成部202および
ピッチ周期分析部203は、図1中の参照符号101〜
103を付した要素と同じであるので、ここでは説明を
省略する。
(Sixth Embodiment) A sixth embodiment of the present invention will be described with reference to FIG. 16, an input terminal 201, a frame / subframe forming unit 202, and a pitch period analyzing unit 203 are denoted by reference numerals 101 to 101 in FIG.
Since it is the same as the element with 103, the description is omitted here.

【0077】本実施形態の特徴は、本発明を適応符号帳
を用いた音声符号化方法に適用した点にある。適応符号
帳とは、過去の駆動信号系列を予め定められた範囲に含
まれる周期で繰り返して生成される複数の適応ベクトル
を格納したコードブックをいう。
The feature of this embodiment lies in that the present invention is applied to a speech coding method using an adaptive codebook. The adaptive codebook is a codebook that stores a plurality of adaptive vectors generated by repeating a past drive signal sequence at a cycle included in a predetermined range.

【0078】サブフレームピッチ周期予測値算出部20
4では、ピッチ周期分析部203で求めたピッチ周期を
基に、各サブフレーム毎にサブフレームピッチ周期予測
値STP(k) を算出する。サブフレームピッチ周期予測
値STP(k) の算出法には、図6、図9、図12および
図14で説明した方法のいずれも適用可能である。ま
た、それによる効果は前述した通りである。ただし、図
6で説明した方法ではピッチ周期分析部203でのピッ
チ周期分析の中心が現フレームf(0) 上にあり、図9、
図12、図14で説明した方法ではピッチ周期分析の中
心は先読み部fr上にあるという違いはある。本実施形
態では、図6で説明した方法に基づいた場合の例につい
て説明する。
Subframe pitch period predicted value calculating section 20
In step 4, a predicted subframe pitch period value STP (k) is calculated for each subframe based on the pitch period obtained by the pitch period analysis unit 203. Any of the methods described with reference to FIGS. 6, 9, 12, and 14 can be applied to the method of calculating the predicted subframe pitch period STP (k). Further, the effect of this is as described above. However, in the method described with reference to FIG. 6, the center of the pitch period analysis in the pitch period analysis unit 203 is on the current frame f (0), and FIG.
In the methods described with reference to FIGS. 12 and 14, there is a difference that the center of the pitch period analysis is located on the prefetch unit fr. In the present embodiment, an example based on the method described in FIG. 6 will be described.

【0079】サブフレームピッチ周期予測値算出部20
4では、ピッチ周期分析部203で求めたピッチ周期T
(0) とf(-1)フレームのピッチ周期T(-1)とから補間に
よりサブフレームピッチ周期予測値STP(k) を求め
る。
Subframe pitch period predicted value calculating section 20
4, the pitch period T obtained by the pitch period analysis unit 203
A subframe pitch period predicted value STP (k) is obtained by interpolation from (0) and the pitch period T (-1) of the f (-1) frame.

【0080】探索範囲決定部205では、サブフレーム
ピッチ周期ST(0) を求める際の探索範囲、つまり適応
符号帳206に対する適応ベクトルの探索範囲を決定す
る。具体的には、サブフレームピッチ周期予測値STP
(0) を中心として±NR/2を探索範囲とする。すなわ
ち、STP(0) −NR/2≦t≦STP(0) +NR/2
−1の範囲に含まれる周期についてのみ探索を行う。探
索は、以下のような方法で行われる。
The search range determining section 205 determines a search range for obtaining the subframe pitch period ST (0), that is, a search range of the adaptive vector for the adaptive codebook 206. Specifically, the subframe pitch period prediction value STP
The search range is ± NR / 2 around (0). That is, STP (0) −NR / 2 ≦ t ≦ STP (0) + NR / 2
The search is performed only for the periods included in the range of -1. The search is performed in the following manner.

【0081】探索範囲決定部205で決定された探索範
囲に含まれるピッチ周期tに対応する適応ベクトルq
(t,n) を適応符号帳206から取り出し、これを聴感重
み付き合成フィルタ207に通して合成信号p(t,n) を
生成する。そして、この合成信号p(t,n) と、入力音声
信号を聴感重みフィルタ208に通して得られる目標信
号r(n) との寄与度cntb(t) を減算器209を介し
て歪算出部210で次式に従い算出する。
The adaptive vector q corresponding to the pitch period t included in the search range determined by the search range determination unit 205
(t, n) is extracted from the adaptive codebook 206, and is passed through a perceptually weighted synthesis filter 207 to generate a synthesized signal p (t, n). Then, the degree of contribution cntb (t) between the synthesized signal p (t, n) and the target signal r (n) obtained by passing the input audio signal through the perceptual weight filter 208 is calculated by the subtractor 209 via the subtractor 209. At 210, it is calculated according to the following equation.

【0082】[0082]

【数5】 (Equation 5)

【0083】探索範囲に含まれるピッチ周期tの全候補
の中で、寄与度cntb(t) が最大となるときのピッチ
周期tをサブフレームピッチ周期ST(0) とし、サブフ
レームピッチ周期ST(0) からサブフレームピッチ周期
予測値STP(0) を差し引いた値を相対ピッチ周期ΔT
(0) とする。この相対ピッチ周期ΔT(0) を求める処理
を全てのサブフレームsf(k) について行い、全サブフ
レームの相対ピッチ周期ΔT(k) を求める。
Among all the pitch period t candidates included in the search range, the pitch period t when the contribution cntb (t) is the maximum is defined as the subframe pitch period ST (0), and the subframe pitch period ST ( 0) is subtracted from the predicted sub-frame pitch period STP (0) to obtain a relative pitch period ΔT
(0). The process of calculating the relative pitch period ΔT (0) is performed for all subframes sf (k), and the relative pitch period ΔT (k) of all subframes is determined.

【0084】最後に、出力端子212からピッチ周期分
析部203で求めたピッチ周期T(0) の情報を出力し、
出力端子211から歪算出部210で寄与度cntb
(t)が最大となるときの相対ピッチ周期ΔT(k) の情報
を出力する。
Finally, information on the pitch period T (0) obtained by the pitch period analysis section 203 is output from the output terminal 212,
From the output terminal 211, the degree of contribution cntb is calculated by the distortion calculator 210.
Information on the relative pitch period ΔT (k) when (t) is maximum is output.

【0085】次に、本実施形態の処理手順を図17〜1
8に示すフローチャートを用いて説明する。図17〜1
8におけるステップS101、S102、S103、S
104、S114およびS115の処理は、図8におけ
るステップS11、S12、S13、S14、S16お
よびS17の処理と同じであるので、ここでは説明を省
略する。以下、本実施形態特有の処理について説明す
る。
Next, the processing procedure of this embodiment will be described with reference to FIGS.
This will be described with reference to the flowchart shown in FIG. Figures 17-1
8, steps S101, S102, S103, S
The processing of steps 104, S114, and S115 is the same as the processing of steps S11, S12, S13, S14, S16, and S17 in FIG. Hereinafter, processing unique to the present embodiment will be described.

【0086】ステップS105では、サブフレームsf
(k) の探索範囲を決定する。探索範囲は、前述したよう
にサブフレームピッチ周期予測値STP(k) を用いて定
められる。ステップS106で、変数cntbmaxと
サブフレームピッチ周期ST(k) の初期値を与える。c
ntbmaxには初期値になり得る十分に大きな値を与
え、ST(k) には最小ピッチ周期を与える。ステップS
107では、探索範囲に含まれる周期tに対応する適応
ベクトルq(t,n) を適応符号帳から選択し、ステップS
108で適応ベクトルq(t,n) を聴感重み付き合成フィ
ルタに通して合成信号p(t,n) を生成する。ステップS
109では、予め求めておいた目標信号r(n) と合成信
号p(t,n) との寄与度cntb(t) を算出し、ステップ
S110ではピッチ周期tにおける寄与度cntb(t)
とcntbmaxの大きさを比較する。
In step S105, the subframe sf
Determine the search range of (k). The search range is determined using the predicted subframe pitch period STP (k) as described above. In step S106, a variable cntbmax and an initial value of the subframe pitch period ST (k) are given. c
A sufficiently large value that can be an initial value is given to ntbmax, and a minimum pitch period is given to ST (k). Step S
At step 107, an adaptive vector q (t, n) corresponding to the cycle t included in the search range is selected from the adaptive codebook, and step S
At 108, the adaptive vector q (t, n) is passed through a perceptually weighted synthesis filter to generate a synthesized signal p (t, n). Step S
At 109, the contribution cntb (t) between the previously obtained target signal r (n) and the composite signal p (t, n) is calculated. At step S110, the contribution cntb (t) at the pitch cycle t is calculated.
And the size of cntbmax.

【0087】ここで、cntb(t) >cntbmaxが
成り立つ場合、ステップS111においてcntbma
xにcntb(t) を与え、ST(k) にtを与えてステッ
プS112に進む。cntb(t) >cntbmaxが成
り立たない場合、ステップS112に進む。
Here, if cntb (t)> cntbmax holds, then in step S111, cntbma
x is given cntb (t) and ST (k) is given t, and the flow advances to step S112. If cntb (t)> cntbmax does not hold, the process proceeds to step S112.

【0088】ステップS112では、探索範囲に含まれ
るピッチ周期tの候補を全て探索したか否かを判定し、
そうであればステップS113に進み、そうでなければ
ステップS107に戻って、まだ探索を行っていないピ
ッチ周期tを用いて処理を継続する。ステップS113
では、サブフレームsf(k) の相対ピッチ周期ΔT(k)
をサブフレームピッチ周期ST(k) とサブフレームピッ
チ周期予測値STP(k) を用いて算出し、ステップS1
14に進む。
In step S112, it is determined whether or not all candidates for the pitch period t included in the search range have been searched.
If so, the process proceeds to step S113; otherwise, the process returns to step S107, and the process is continued using the pitch period t for which search has not been performed. Step S113
Then, the relative pitch period ΔT (k) of the subframe sf (k)
Is calculated using the sub-frame pitch period ST (k) and the sub-frame pitch period predicted value STP (k), and step S1 is performed.
Proceed to 14.

【0089】(第7の実施形態)図19〜20のフロー
チャートを用いて本発明の第7の実施形態を説明する。
本実施形態と第6の実施形態との違いは、サブフレーム
ピッチ周期予測値の算出に図9で説明した方法を適用し
ている点にある。
(Seventh Embodiment) A seventh embodiment of the present invention will be described with reference to the flowcharts of FIGS.
The present embodiment differs from the sixth embodiment in that the method described with reference to FIG. 9 is applied to the calculation of the predicted value of the subframe pitch period.

【0090】本実施形態によると、前述したようにサブ
フレームピッチ周期予測値STP(k) の実際のピッチ周
期に対する正確性が向上するため、サブフレームsf
(k)のサブフレームピッチ周期ST(k) の探索範囲を小
さくでき、結果的に相対ピッチ周期ΔT(k) を表現する
のに必要なビット数および計算量を少なくすることがで
きるという効果がある。図19〜20において、ステッ
プS201およびS204〜S215の処理は、それぞ
れ図17〜18におけるステップS101およびS10
4〜S115の処理と同様であるので、ここでは説明を
省略する。
According to the present embodiment, since the accuracy of the predicted sub-frame pitch period STP (k) with respect to the actual pitch period is improved as described above, the sub-frame sf
(k), the search range of the subframe pitch period ST (k) can be reduced, and as a result, the number of bits and the amount of calculation required to express the relative pitch period ΔT (k) can be reduced. is there. 19 to 20, the processing in steps S201 and S204 to S215 is performed in steps S101 and S10 in FIGS.
Since the processing is the same as that of steps S4 to S115, the description is omitted here.

【0091】本実施形態で特徴的な処理は、ステップS
202とS203にある。ステップS202では、ピッ
チ周期分析の中心を先読み部に置いてピッチ周期を分析
している。ステップS203では、サブフレームピッチ
周期予測値STP(k) の算出を先読み部frのピッチ周
期Trとフレームf(0) のピッチ周期T(0) を用いて決
定するか、もしくはフレームf(0) のピッチ周期T(0)
とフレームf(-1)のピッチ周期T(-1)を用いて決定する
かのいずれか一方を用いている。
The characteristic processing in this embodiment is the processing in step S
202 and S203. In step S202, the pitch period is analyzed by placing the center of the pitch period analysis in the look-ahead section. In step S203, the calculation of the sub-frame pitch cycle predicted value STP (k) is determined using the pitch cycle Tr of the prefetch unit fr and the pitch cycle T (0) of the frame f (0), or the frame f (0) Pitch period T (0)
And using the pitch period T (-1) of the frame f (-1).

【0092】(第8の実施形態)図21〜22のフロー
チャートを用いて第8の実施形態を説明する。本実施形
態と第7の実施形態との違いは、サブフレームピッチ周
期予測値算出部に図12で説明した方法を適用している
点にある。
(Eighth Embodiment) The eighth embodiment will be described with reference to the flowcharts of FIGS. The present embodiment is different from the seventh embodiment in that the method described with reference to FIG. 12 is applied to the subframe pitch cycle predicted value calculation unit.

【0093】本実施形態によると、前述したように先読
み部の大きさを小さくできるため、遅延を短くすること
ができるという効果がある。図21〜22において、ス
テップS301、S302およびS304〜S315の
処理は、図19〜20におけるステップS201、S2
02およびS204〜S215の処理と同様であるの
で、ここでは説明を省略する。
According to the present embodiment, the size of the prefetch unit can be reduced as described above, so that there is an effect that the delay can be reduced. In FIGS. 21 to 22, the processes in steps S301, S302, and S304 to S315 are performed in steps S201, S2 in FIGS.
02 and the processing in S204 to S215, and a description thereof is omitted here.

【0094】本実施形態で特徴的な処理はステップS3
03にあり、このステップS303ではサブフレームピ
ッチ周期予測値STP(k) を先読み部frのピッチ周期
Trとフレームf(0) のピッチ周期T(0) を用いて算出
している。
The characteristic processing in this embodiment is step S3
In step S303, the sub-frame pitch cycle predicted value STP (k) is calculated using the pitch cycle Tr of the prefetch unit fr and the pitch cycle T (0) of the frame f (0).

【0095】(第9の実施形態)図23〜24のフロー
チャートを用いて本発明の第9の実施形態を説明する。
本実施形態と第8の実施形態との違いは、サブフレーム
ピッチ周期予測値算出部に図14で説明した方法を適用
している点にある。
(Ninth Embodiment) A ninth embodiment of the present invention will be described with reference to the flowcharts of FIGS.
The present embodiment is different from the eighth embodiment in that the method described with reference to FIG. 14 is applied to the subframe pitch cycle predicted value calculation unit.

【0096】本実施形態の方法を用いれば、前述したよ
うにフレームf(0) でのピッチ周期T(0) の分析が失敗
し実際のピッチ周期から大きく外れてしまった場合で
も、先読み部frで求めたピッチ周期Trとフレームf
(-1)のピッチ周期T(-1)とで補間を行うことでサブフレ
ームピッチ周期予測値STP(k) を正確に求めることが
でき、フレームf(0) のピッチ周期T(0) が正確に求ま
った場合と同様に効率的にピッチ周期を表現することが
できる。
According to the method of the present embodiment, even if the analysis of the pitch period T (0) in the frame f (0) fails as described above and the pitch period T (0) greatly deviates from the actual pitch period, the prefetch unit fr Pitch period Tr and frame f obtained by
By performing interpolation with the pitch period T (-1) of (-1), the predicted value of the subframe pitch period STP (k) can be accurately obtained, and the pitch period T (0) of the frame f (0) is The pitch period can be expressed efficiently as in the case where it is accurately obtained.

【0097】図23〜24において、ステップS40
1、S402およびS407〜S418の処理は、図2
1〜22におけるステップS301、S302およびS
304〜S315の処理と同様であり、また図23〜2
4におけるステップS403〜S406の処理は、図1
5におけるステップS43〜S46の処理と同じである
ので、ここでは説明を省略する。
In FIGS. 23 and 24, step S40
1, S402 and S407 to S418 are the same as those in FIG.
Steps S301, S302 and S in 1 to 22
The processing is the same as the processing in steps S304 to S315, and
4 are performed in steps S403 to S406 in FIG.
5, the description is omitted here.

【0098】(第10の実施形態)図25を用いて本発
明の第10の実施形態を説明する。図25において入力
端子301、フレーム・サブフレーム構成部302、ピ
ッチ周期分析部303、サブフレームピッチ周期算出部
304、探索範囲決定部305、適応符号帳306、聴
感重み付き合成フィルタ307、聴感重みフィル30
8、減算器309、歪算出部310、出力端子311,
312は、図16中の参照符号201〜212を付した
要素と同一であるので、ここでは説明を省略する。本実
施形態の特徴は、ピッチ周期分析部303でのピッチ周
期の分析位置をピッチ周期分析位置決定部313によっ
て決定する点にある。
(Tenth Embodiment) A tenth embodiment of the present invention will be described with reference to FIG. 25, an input terminal 301, a frame / subframe forming unit 302, a pitch period analyzing unit 303, a subframe pitch period calculating unit 304, a search range determining unit 305, an adaptive codebook 306, a perceptual weighting synthesis filter 307, a perceptual weight filter 30
8, subtractor 309, distortion calculator 310, output terminal 311,
Reference numeral 312 is the same as the element denoted by reference numerals 201 to 212 in FIG. The feature of this embodiment is that the pitch cycle analysis position in the pitch cycle analysis unit 303 is determined by the pitch cycle analysis position determination unit 313.

【0099】本実施形態の効果を図26を用いて説明す
る。同図のように入力音声信号の特性がフレーム内で変
化している場合、ピッチ周期分析位置が固定であると正
確なピッチ周期を求められないことがある。図26の場
合、ピッチ周期分析位置が固定のときのピッチ分析対象
の信号に周期成分が含まれていないことが正確なピッチ
周期を求めることができない原因になっている。しか
し、ピッチ分析位置を可変にできれば、図26に示すよ
うにピッチ周期成分を有する波形が存在する位置にピッ
チ周期分析位置を設定することができるので、正確なピ
ッチ周期を求めることが可能になる。ただし、この場合
にはピッチ周期分析位置を表すための付加情報が必要に
なる。
The effects of the present embodiment will be described with reference to FIG. As shown in the figure, when the characteristics of the input audio signal change within a frame, if the pitch period analysis position is fixed, an accurate pitch period may not be obtained. In the case of FIG. 26, the fact that the signal of the pitch analysis target when the pitch period analysis position is fixed does not include a period component causes an inability to obtain an accurate pitch period. However, if the pitch analysis position can be made variable, the pitch period analysis position can be set at a position where a waveform having a pitch period component exists as shown in FIG. 26, so that an accurate pitch period can be obtained. . However, in this case, additional information for representing the pitch period analysis position is required.

【0100】図25において、ピッチ周期分析部313
はピッチ周期分析位置を決定する。本実施形態では、入
力音声信号の短区間パワーもしくは低域通過フィルタを
通過した後の予測残差信号のパワーなどを指標にして、
そのパワーが大きくなる部分にピッチ周期分析位置を設
定する方法を用いている。そのピッチ周期分析位置の情
報をピッチ周期分析部303に送ると同時に、出力端子
314から出力する。ピッチ周期分析部303では、ピ
ッチ周期分析位置決定部313から送られてきたピッチ
周期分析位置の情報に従ってピッチ周期の分析を行う。
In FIG. 25, pitch period analysis section 313
Determines the pitch period analysis position. In the present embodiment, using the short-term power of the input audio signal or the power of the prediction residual signal after passing through the low-pass filter as an index,
A method of setting a pitch period analysis position in a portion where the power becomes large is used. The information of the pitch cycle analysis position is sent to the pitch cycle analysis unit 303 and output from the output terminal 314 at the same time. The pitch cycle analysis unit 303 analyzes the pitch cycle according to the information on the pitch cycle analysis position transmitted from the pitch cycle analysis position determination unit 313.

【0101】(第11の実施形態)図27を用いて本発
明の第11の実施形態を説明する。図27において、入
力端子401、フレーム・サブフレーム構成部402、
ピッチ周期分析部403、サブフレームピッチ周期算出
部404、探索範囲決定部405、適応符号帳406、
聴感重み付き合成フィルタ407、聴感重みフィルタ4
08、減算器409、歪算出部410、出力端子41
1,412は、図16中の参照符号201〜212を付
した要素と同じであるので、ここでは説明を省略する。
(Eleventh Embodiment) An eleventh embodiment of the present invention will be described with reference to FIG. 27, an input terminal 401, a frame / subframe forming unit 402,
Pitch cycle analysis section 403, subframe pitch cycle calculation section 404, search range determination section 405, adaptive codebook 406,
Perceptual weighting synthesis filter 407, perceptual weight filter 4
08, a subtractor 409, a distortion calculator 410, an output terminal 41
1, 412 are the same as the elements denoted by reference numerals 201 to 212 in FIG.

【0102】本実施形態の特徴は、ピッチ周期分析部4
03で求めたピッチ周期の変化が連続的であるか否かを
連続性判定部413で判定し、その判定結果に応じて適
応符号帳406の探索範囲を決定する点にある。すなわ
ち、本実施形態ではピッチ周期の変化が連続的であると
判定された場合、前述したようにサブフレームピッチ周
期予測値を求め、その値を基に探索範囲決定部405で
適応符号帳406の探索範囲を決定する。連続的でない
と判定されたなら、全探索部414で適応符号帳406
内の全候補について探索を行うようにしている。
This embodiment is characterized in that the pitch period analysis unit 4
The point is that the continuity determination unit 413 determines whether or not the change in the pitch period obtained in step 03 is continuous, and the search range of the adaptive codebook 406 is determined according to the determination result. That is, in the present embodiment, when it is determined that the change in the pitch period is continuous, the predicted value of the subframe pitch period is determined as described above, and the search range determination unit 405 determines the predicted value of the adaptive codebook 406 based on the value. Determine the search range. If it is determined that they are not continuous, the full code search unit 414 searches the adaptive codebook 406
The search is performed for all the candidates in.

【0103】本実施形態は、次のような効果を有する。
ピッチ周期分析部403で求めたピッチ周期が連続的に
変化している場合、これまで述べてきたようにピッチ周
期を補間してその周辺のみを探索する方法では効果的に
機能する。しかしながら、音声信号は常に安定してピッ
チ周期が変化しているわけではなく、ピッチ周期が大き
く変化する場合もあり、また無声部のようにピッチ成分
が存在しない場合もある。このようなとき、ピッチ周期
は連続的に変化しているという仮定の基に強制的に補間
して探索範囲を限定すると、深刻な品質劣化を招いてし
まう。このようにピッチ周期が連続的でない場合、本実
施形態では適応符号帳406の全候補を探索するように
切り替えることで、上述の問題を回避することができ
る。
This embodiment has the following effects.
When the pitch period obtained by the pitch period analysis unit 403 is continuously changing, the method of interpolating the pitch period and searching only the periphery thereof as described above works effectively. However, the pitch period of an audio signal does not always change stably, and the pitch period may change greatly, or there may be no pitch component such as a silent part. In such a case, if the search range is limited by forcibly interpolating based on the assumption that the pitch period is continuously changing, serious quality degradation is caused. When the pitch cycle is not continuous as described above, in the present embodiment, the above-described problem can be avoided by switching to search all candidates in the adaptive codebook 406.

【0104】また、全候補探索を行うかどうかをピッチ
周期分析部403で求めたピッチ周期Tのときの周期性
の強さに応じて切り替えても、同様の効果が得られる。
すなわち、式(6)のρ(T) で表されるようなピッチ周
期性の強さを表す変数が予め定められた閾値以下である
場合には、全探索部414で全候補を探索するようにス
イッチ415を切り替えることで、ピッチ周期が存在し
ない領域での劣化を回避することができる。
The same effect can be obtained by switching whether or not to search all candidates according to the strength of the periodicity at the pitch period T obtained by the pitch period analysis unit 403.
That is, when the variable representing the strength of the pitch periodicity as represented by ρ (T) in equation (6) is equal to or smaller than a predetermined threshold, the all search unit 414 searches all candidates. By switching the switch 415 to the above, it is possible to avoid deterioration in a region where no pitch period exists.

【0105】連続性判定部413では、ピッチ周期分析
部403で求めたピッチ周期を使ってピッチ周期の連続
性を判定する。本実施形態では、フレームf(0) で求め
たピッチ周期T(0) とフレームf(-1)で求めたピッチ周
期T(-1)とを使う場合について説明するが、先読み部f
rのピッチ周期Trとフレームf(0) のピッチ周期T
(0) を用いる場合、もしくは先読み部frのピッチ周期
Trとフレームf(-1)のピッチ周期T(-1)の連続性を用
いる場合、先読み部frのピッチ周期Trとフレームf
(0) のピッチ周期T(0) とフレームf(-1)のピッチ周期
T(-1)の連続性を用いる場合にも適用できる。ピッチ周
期の連続性は、次式(9)に従って判定される。
The continuity determining unit 413 determines the continuity of the pitch period using the pitch period obtained by the pitch period analyzing unit 403. In the present embodiment, a case will be described in which the pitch period T (0) obtained in the frame f (0) and the pitch period T (-1) obtained in the frame f (-1) are used.
r pitch period Tr and frame f (0) pitch period T
When (0) is used, or when the continuity of the pitch period Tr of the prefetch unit fr and the pitch period T (-1) of the frame f (-1) is used, the pitch period Tr of the prefetch unit fr and the frame f
The present invention can also be applied to the case where the continuity of the pitch period T (0) of (0) and the pitch period T (-1) of the frame f (-1) is used. The continuity of the pitch period is determined according to the following equation (9).

【0106】[0106]

【数6】 (Equation 6)

【0107】式(9)が成立する場合、ピッチ周期は連
続的に変化していると判定され、スイッチ415は探索
範囲決定部405の出力を選択して、これまで説明した
ように限定した探索範囲についてのみ適応符号帳406
の探索を行う。式(9)が成立しない場合、ピッチ周期
は連続的に変化していないと判定され、スイッチ415
は全探索部414を選択し、適応符号帳406内の全て
の候補について探索を行う。連続性判定部414の判定
結果は、出力端子416から出力される。さらに、連続
性判定部414からの出力がピッチ周期は連続的に変化
しているものではないというものであれば、ピッチ周期
分析部403で求めたピッチ周期は出力端子412から
出力する必要はない。
When the equation (9) is satisfied, it is determined that the pitch period is continuously changing, and the switch 415 selects the output of the search range determination unit 405 and performs the limited search as described above. Adaptive codebook 406 for range only
Search for. If the equation (9) does not hold, it is determined that the pitch period is not continuously changing, and the switch 415
Selects the full search unit 414 and searches all candidates in the adaptive codebook 406. The determination result of the continuity determination unit 414 is output from the output terminal 416. Further, if the output from the continuity determining unit 414 indicates that the pitch period is not continuously changing, the pitch period obtained by the pitch period analyzing unit 403 does not need to be output from the output terminal 412. .

【0108】(第12の実施形態)図28を用いて本発
明の第12の実施形態を説明する。図28において、入
力端子501、フレーム・サブフレーム構成部502、
ピッチ周期分析部503、サブフレームピッチ周期算出
部504、適応符号帳506、聴感重み付き合成フィル
タ507、聴感重みフィルタ508、減算器509、歪
算出部510、出力端子511,512は、図16中の
参照符号201〜204、206〜212を付した要素
と同じであるので、ここでは説明を省略する。
(Twelfth Embodiment) A twelfth embodiment of the present invention will be described with reference to FIG. 28, an input terminal 501, a frame / subframe forming unit 502,
The pitch period analyzer 503, the subframe pitch period calculator 504, the adaptive codebook 506, the perceptual weighting synthesis filter 507, the perceptual weight filter 508, the subtractor 509, the distortion calculator 510, and the output terminals 511 and 512 are shown in FIG. Are the same as the elements denoted by reference numerals 201 to 204 and 206 to 212, and the description thereof is omitted here.

【0109】本実施形態の特徴は、複数のサブフレーム
のサブフレームピッチ周期の変動を表す相対ピッチ周期
のパターン(相対ピッチパターンという)の複数個の集
合で構成される相対ピッチパターン符号帳505を有
し、複数のサブフレームの相対ピッチ周期をベクトルと
みなして、このベクトルと最も類似している相対ピッチ
パターン符号帳505内の相対ピッチパターンを選択す
るようにしている点にある。
The feature of the present embodiment is that a relative pitch pattern codebook 505 composed of a plurality of sets of relative pitch period patterns (referred to as relative pitch patterns) representing variations in subframe pitch periods of a plurality of subframes is provided. The relative pitch period of the plurality of subframes is regarded as a vector, and the relative pitch pattern in the relative pitch pattern codebook 505 most similar to the vector is selected.

【0110】本実施形態によると、次のような効果があ
る。サブフレーム毎に相対ピッチ周期ΔT(k) をスカラ
ー量子化すると、例えば前述のように探索範囲NR=8
とした場合、それを表現するのに3ビット必要になる。
すなわち、相対ピッチ周期ΔT(k) の情報を表すのに、
フレーム当たり3ビット×4サブフレーム=12ビット
だけ必要になる。
According to the present embodiment, the following effects can be obtained. When the relative pitch period ΔT (k) is scalar-quantized for each subframe, for example, as described above, the search range NR = 8
, Three bits are needed to represent it.
That is, to represent the information of the relative pitch period ΔT (k),
Only 3 bits × 4 subframes = 12 bits per frame are required.

【0111】これに対し、本実施形態では出現頻度の高
い相対ピッチ周期のパターンを相対ピッチパターンとし
て持つ相対ピッチパターン符号帳505を有している。
ここで、仮に4つのサブフレーム(sf(0) 〜sf(3)
)の相対ピッチ周期ΔT(0)〜ΔT(3) で1ベクトル
(4次元)を表し、相対ピッチパターン符号帳505が
128(7ビット)種類の相対ピッチパターンで構成さ
れたとすると、本来4つのサブフレームの相対ピッチ周
期ΔT(k) を表すのに12ビット必要であったものが7
ビットで表されることになり、大幅なビット削減が達成
されるという利点がある。
On the other hand, in the present embodiment, there is provided a relative pitch pattern codebook 505 having, as a relative pitch pattern, a pattern of a relative pitch cycle having a high appearance frequency.
Here, suppose four subframes (sf (0) to sf (3))
) Represents one vector (four dimensions) with the relative pitch periods ΔT (0) to ΔT (3), and if the relative pitch pattern codebook 505 is composed of 128 (7 bits) types of relative pitch patterns, there are originally four relative pitch patterns. Twelve bits were required to represent the relative pitch period ΔT (k) of the subframe.
It has the advantage of being represented in bits and achieving significant bit reduction.

【0112】相対ピッチパターン符号帳505は、次式
に示すように予め求めておいた代表的な相対ピッチパタ
ーンpv(j) をJ種類有している。 pv(j) ={v(j,k) ;k=0〜K-1 } (10) (0≦j≦J−1) 加算器513では、次式に示されるようにサブフレーム
ピッチ周期予測値STP(k) と第j番目の相対ピッチパ
ターンpv(j) とで加算を行い、K個のサブフレームの
ピッチ周期の組Tx(j) を求める。 Tx(j) =STP(k) +v(j,k) (11) このようにして求めたピッチ周期の組Tx(j) に基づい
て、K個のサブフレームにまたがる寄与度が最大となる
ときの相対ピッチパターンを閉ループ的に探索する。こ
のとき、適応符号帳506の内部状態はサブフレーム毎
に更新される。このときのサブフレーム数はK個に限定
されることはなく、2以上、K以下のサブフレーム数に
対する相対ピッチ周期を求めることができる。また、計
算量を削減するために、まず計算量の少ない簡単な指標
(例えば寄与度の分子項)によって相対ピッチパターン
の候補を限定し、その残った候補に対して正確な寄与度
を求めて最終的に1つの相対ピッチパターンを決定して
もよい。
The relative pitch pattern codebook 505 has J types of representative relative pitch patterns pv (j) obtained in advance as shown in the following equation. pv (j) = {v (j, k); k = 0−K−1} (10) (0 ≦ j ≦ J−1) The adder 513 predicts the subframe pitch period as shown in the following equation. The value STP (k) and the j-th relative pitch pattern pv (j) are added to obtain a set Tx (j) of pitch periods of K subframes. Tx (j) = STP (k) + v (j, k) (11) Based on the pitch period set Tx (j) thus obtained, when the contribution over the K subframes is maximized In a closed loop. At this time, the internal state of adaptive codebook 506 is updated for each subframe. At this time, the number of subframes is not limited to K, and a relative pitch period with respect to the number of subframes of 2 or more and K or less can be obtained. Also, in order to reduce the amount of calculation, first, the candidates of the relative pitch pattern are limited by a simple index having a small amount of calculation (for example, a numerator term of the degree of contribution), and an accurate contribution is obtained for the remaining candidates. Finally, one relative pitch pattern may be determined.

【0113】(第13の実施形態)図29を用いて本発
明の第13の実施形態を説明する。図29において、入
力端子601、フレーム・サブフレーム構成部602、
ピッチ周期分析部603、サブフレームピッチ周期算出
部604、相対ピッチパターン符号帳605、適応符号
帳606、聴感重み付き合成フィルタ607、聴感重み
フィルタ608、減算器609、歪算出部610、出力
端子611,612、加算器613は、図20中の参照
符号501〜513を付した要素と同じであるので、こ
こでは説明を省略する。
(Thirteenth Embodiment) A thirteenth embodiment of the present invention will be described with reference to FIG. 29, an input terminal 601, a frame / subframe forming unit 602,
Pitch cycle analyzer 603, subframe pitch cycle calculator 604, relative pitch pattern codebook 605, adaptive codebook 606, perceptual weighting synthesis filter 607, perceptual weight filter 608, subtractor 609, distortion calculator 610, output terminal 611 , 612 and the adder 613 are the same as the elements denoted by reference numerals 501 to 513 in FIG.

【0114】本実施形態の特徴は、適応符号帳606と
ともに雑音符号帳614の影響を考慮に入れて相対ピッ
チパターンを決定する点にある。このような構成によ
り、さらに正確な相対ピッチパターンを決定することが
可能になる。
A feature of the present embodiment is that the relative pitch pattern is determined in consideration of the influence of the random codebook 614 together with the adaptive codebook 606. With such a configuration, a more accurate relative pitch pattern can be determined.

【0115】このとき、適応ベクトルに乗算器615で
乗じられるゲインは端子616より与えられる。このゲ
インは、次式で表される理想ゲインgopt、または、
ここでは図示していない適応ベクトルゲイン符号帳の中
で最も理想ゲインgoptに最も近い要素が用いられ
る。
At this time, the gain by which the adaptive vector is multiplied by the multiplier 615 is given from the terminal 616. This gain is an ideal gain gopt expressed by the following equation, or
Here, an element closest to the ideal gain gopt in an adaptive vector gain codebook (not shown) is used.

【0116】[0116]

【数7】 (Equation 7)

【0117】ここで、r(n) は目標ベクトル、p(t,n)
はピッチ周期tにおける適応ベクトルを聴感重み付き合
成フィルタ607に通した信号を表す。
Here, r (n) is a target vector, and p (t, n)
Represents a signal obtained by passing the adaptation vector at the pitch period t through the perceptual weighting synthesis filter 607.

【0118】同様に、雑音ベクトルに乗算器617で乗
じられるゲインは端子618より与えられる。このゲイ
ンは、次式で表される理想ゲインbopt、または、こ
こでは図示していない雑音ベクトルゲイン符号帳の中で
最も理想ゲインboptに最も近い要素が用いられる。
Similarly, the gain by which the noise vector is multiplied by the multiplier 617 is given from a terminal 618. As this gain, an ideal gain bopt expressed by the following equation or an element closest to the ideal gain bopt in a noise vector gain codebook (not shown) is used.

【0119】[0119]

【数8】 (Equation 8)

【0120】ここで、t(n)は目標ベクトル、e(i,n)
はインデックスiにおける雑音ベクトルを聴感重み付き
合成フィルタ607に通した信号を表す。
Here, t (n) is a target vector, and e (i, n)
Represents a signal obtained by passing the noise vector at the index i through the perceptual weighting synthesis filter 607.

【0121】複数サブフレームにまたがる寄与度が最大
となるときの相対ピッチパターンが決定されたときに、
出力端子611からそのときの相対ピッチパターンのイ
ンデックスが出力される。また、出力端子612から
は、ピッチ周期分析部603で求めたピッチ周期の情報
が出力される。
When the relative pitch pattern at which the contribution over a plurality of subframes is maximized is determined,
The output terminal 611 outputs the index of the relative pitch pattern at that time. The output terminal 612 outputs information on the pitch period obtained by the pitch period analysis unit 603.

【0122】このとき、適応符号帳606の内部状態は
サブフレーム毎に更新される。このときのサブフレーム
数はK個に限定されず、2以上、K以下のサブフレーム
数に対する相対ピッチ周期を求めることができる。ま
た、計算量を削減するために、まず計算量の少ない簡単
な指標(例えば寄与度の分子項)によって相対ピッチバ
ターンの候補を限定し、その残った候補に対して正確な
寄与度を求めて最終的に1つの相対ピッチパターンを決
定してもよい。
At this time, the internal state of adaptive codebook 606 is updated for each subframe. The number of subframes at this time is not limited to K, and a relative pitch period for the number of subframes of 2 or more and K or less can be obtained. Also, in order to reduce the amount of calculation, candidates of relative pitch patterns are first limited by a simple index with a small amount of calculation (for example, a numerator term of the degree of contribution), and an accurate degree of contribution is obtained for the remaining candidates. Finally, one relative pitch pattern may be determined.

【0123】(第14の実施形態)図30を用いて本発
明の第14の実施形態を説明する。本実施形態は、CE
LP方式のエンコーダ(音声符号化装置)に本発明を適
用した例である。また、本実施形態ではこれまで説明し
てきた実施形態をいくつか組み合わせた一つの代表的な
構成になっているが、これに限定されるものではなく、
様々な組み合わせをCELP方式に適用することができ
る。
(Fourteenth Embodiment) A fourteenth embodiment of the present invention will be described with reference to FIG. In the present embodiment, the CE
This is an example in which the present invention is applied to an LP encoder (speech coding apparatus). Further, in this embodiment, one representative configuration is obtained by combining some of the embodiments described above, but the present invention is not limited to this.
Various combinations can be applied to the CELP scheme.

【0124】図30においては、入力端子501からデ
ィジタル化された音声信号が入力され、フレーム・サブ
フレーム構成部502においてフレームとサブフレーム
が構成される。その後、フレーム・サブフレームに分割
された音声信号はLPC係数分析部521に与えられ、
LPC分析によってLPC係数が算出される。このLP
C係数は、聴感重みフィルタ508および聴感重み付き
合成フィルタ507の伝達関数を決定する際に利用され
る。
In FIG. 30, a digitized audio signal is input from an input terminal 501, and a frame / subframe forming unit 502 forms a frame and a subframe. After that, the audio signal divided into frames and subframes is provided to an LPC coefficient analysis unit 521,
The LPC coefficient is calculated by the LPC analysis. This LP
The C coefficient is used when determining the transfer functions of the perceptual weight filter 508 and the perceptual weighted synthesis filter 507.

【0125】LPC係数分析部521で求められたLP
C係数は、LPC係数量子化部522において量子化さ
れ、量子化によって求められるインデックスはマルチプ
レクサ523に与えられ、後述する他の情報とともに多
重化される。また、量子化後に復号されたLPC係数
は、聴感重み付き合成フィルタ507の伝達関数を決定
する際に用いられる。
LP calculated by LPC coefficient analysis section 521
The C coefficient is quantized by an LPC coefficient quantization unit 522, and an index obtained by the quantization is provided to a multiplexer 523 and multiplexed with other information described later. The LPC coefficient decoded after quantization is used when determining the transfer function of the perceptually weighted synthesis filter 507.

【0126】入力音声信号は、ピッチ周期分析位置決定
部525にも与えられる。ピッチ周期分析位置決定部5
25では、音声信号の予め定められた短区間のパワーを
規定個数求め、その中で短区間パワーが最も大きくなる
領域を表すインデックスをピッチ周期分析部503とマ
ルチプレクサ523に与える。ピッチ周期分析部503
では、ピッチ周期分析位置決定部525で決定された分
析位置を中心に音声信号、予測残差信号または低域通過
フィルタを通過後の予測残差信号等を用いてピッチ周期
の分析を行う。
The input voice signal is also supplied to a pitch period analysis position determination section 525. Pitch cycle analysis position determination unit 5
In step 25, a predetermined number of powers of a predetermined short section of the audio signal are obtained, and an index representing an area where the short section power is the largest is provided to the pitch period analysis unit 503 and the multiplexer 523. Pitch cycle analyzer 503
Then, the pitch period is analyzed using the audio signal, the prediction residual signal, the prediction residual signal after passing through the low-pass filter, and the like, centering on the analysis position determined by the pitch period analysis position determination unit 525.

【0127】ここで求めたピッチ周期と前フレーム処理
で求めたピッチ周期との連続性を連続性判定部526で
判定し、その判定結果をマルチプレクサ523に与え
る。判定の結果が連続であるとなった場合、ピッチ周期
分析部503で求めたピッチ周期をマルチプレクサ52
3に与えると共に、サブフレームピッチ周期予測値算出
部504においてサブフレーム毎のピッチ周期予測値を
求める。探索範囲決定部530では、サブフレームピッ
チ周期予測値を基にサブフレーム毎のピッチ周期探索範
囲を決定する。この場合、探索範囲決定部530で決定
された探索範囲に含まれるピッチ周期の適応ベクトルが
候補として選択される。
The continuity between the pitch period obtained here and the pitch period obtained in the previous frame processing is judged by the continuity judgment section 526, and the judgment result is given to the multiplexer 523. If the result of the determination is continuous, the pitch period obtained by the pitch period analysis unit
3, and a sub-frame pitch period predicted value calculation unit 504 obtains a pitch period predicted value for each sub-frame. Search range determining section 530 determines a pitch period search range for each subframe based on the predicted subframe pitch period value. In this case, the adaptive vector of the pitch period included in the search range determined by the search range determination unit 530 is selected as a candidate.

【0128】連続性判定部526の判定結果が連続でな
いとなった場合、全探索部527が選択されるようスイ
ッチ531を切り替え、適応符号帳528に含まれる全
て適応ベクトルが候補として選択される。この場合、ピ
ッチ周期分析部503で求めたピッチ周期はマルチプレ
クサ523に与える必要はない。
When the result of determination by the continuity determining unit 526 is not continuous, the switch 531 is switched so that the full search unit 527 is selected, and all the adaptive vectors included in the adaptive codebook 528 are selected as candidates. In this case, the pitch cycle obtained by the pitch cycle analysis unit 503 does not need to be given to the multiplexer 523.

【0129】乗算器532では、適応符号帳528から
選択される適応ベクトルと適応ベクトルゲイン符号帳5
33から選択される適応ベクトルゲインとの積がとられ
る。乗算器534では同様に、雑音符号帳529から選
択される雑音ベクトルと雑音ベクトルゲイン符号帳53
5から選択される雑音ベクトルゲインとの積がとられ
る。加算器536では、乗算器532,534から得ら
れるそれぞれの信号の和をとり、駆動ベクトルを生成す
る。
The multiplier 532 includes an adaptive vector selected from the adaptive codebook 528 and an adaptive vector gain codebook 5.
The product with the adaptive vector gain selected from 33 is taken. Similarly, the multiplier 534 generates the noise vector selected from the noise codebook 529 and the noise vector gain codebook 53.
5 and the product of the noise vector and the noise vector gain. The adder 536 calculates the sum of the signals obtained from the multipliers 532 and 534, and generates a drive vector.

【0130】このようにして生成された駆動ベクトルを
聴感重み付き合成フィルタ507に通して、合成ベクト
ルを生成する。減算器509では、音声信号を聴感重み
フィルタ508に通して得られる目標ベクトルと合成ベ
クトルとの差をとり、この差信号を基に歪算出部511
で歪を求める。この歪が最小となるときの適応ベクト
ル、適応ベクトルゲイン、雑音ベクトルおよび雑音ベク
トルゲインの組み合わせを効率的に探索する。
The drive vector thus generated is passed through a perceptually weighted synthesis filter 507 to generate a synthesized vector. A subtractor 509 obtains a difference between a target vector obtained by passing the audio signal through an audibility weighting filter 508 and a synthesized vector, and calculates a distortion calculating unit 511 based on the difference signal.
Find the distortion with. An adaptive vector, an adaptive vector gain, a noise vector, and a combination of a noise vector gain when this distortion is minimized are efficiently searched.

【0131】例えば、図31のフローチャートに示され
るように、サブフレーム毎に適応ベクトル、適応ベクト
ルゲイン、雑音ベクトル、雑音ベクトルゲインの順に直
列的に求めていく方法がある。また、図32のフローチ
ャートに示されるように、サブフレーム毎に適応ベクト
ルゲインと雑音ベクトルゲインをベクトル量子化によっ
て同時最適化を図る構成の場合には、適応ベクトル、雑
音ベクトル、ゲインベクトルの順に求める方法もある。
For example, as shown in the flowchart of FIG. 31, there is a method in which an adaptive vector, an adaptive vector gain, a noise vector, and a noise vector gain are sequentially obtained for each subframe in this order. In addition, as shown in the flowchart of FIG. 32, in a configuration in which the adaptive vector gain and the noise vector gain are simultaneously optimized by vector quantization for each subframe, the adaptive vector, the noise vector, and the gain vector are obtained in this order. There are ways.

【0132】すなわち、図31ではまずステップS60
1でカウンタkを0に設定した後、ステップS602,
S603,S604,S605で適応ベクトル、適応ベ
クトルゲイン、雑音ベクトル、雑音ベクトルゲインを順
次求め、ステップS606でカウンタkを1だけインク
リメントする。ステップS607でカウンタkがKに一
致しているかどうかの判定を行う。一致していなけれ
ば、ステップS602に戻って処理を継続し、一致した
ならば処理は終了する。
That is, in FIG. 31, first, at step S60
After setting the counter k to 0 at 1, the process proceeds to step S602.
In steps S603, S604, and S605, an adaptive vector, an adaptive vector gain, a noise vector, and a noise vector gain are sequentially obtained, and in step S606, the counter k is incremented by one. In step S607, it is determined whether the counter k matches K. If they do not match, the process returns to step S602 to continue the process. If they match, the process ends.

【0133】また、図32ではまずステップS701で
カウンタkを0に設定した後、ステップS702,S7
03,S704で適応ベクトル、雑音ベクトル、ゲイン
ベクトル(適応ベクトルゲインと雑音ベクトルゲイン)
を順次求め、ステップS705でカウンタkを1だけイ
ンクリメントする。ステップS706でカウンタkがK
に一致しているかどうかの判定を行う。一致していなけ
れば、ステップS702に戻って処理を継続し、一致し
たならば処理は終了する。
In FIG. 32, first, the counter k is set to 0 in step S701, and then in steps S702 and S7.
03, S704: adaptive vector, noise vector, gain vector (adaptive vector gain and noise vector gain)
Are sequentially obtained, and the counter k is incremented by 1 in step S705. In step S706, the counter k is K
It is determined whether or not they match. If they do not match, the process returns to step S702 to continue the process, and if they match, the process ends.

【0134】このようにして歪が最小となるときの適応
ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベ
クトルゲインを表すインデックスをマルチプレクサ52
3に与える。連続性判定部526において連続であると
判定されている場合、適応ベクトルのインデックスはサ
ブフレームピッチ周期予測値に対する相対値として表さ
れる。
In this way, the adaptive vector, adaptive vector gain, noise vector, and index representing the noise vector gain when the distortion is minimized are assigned to the multiplexer 52.
Give to 3. When the continuity is determined to be continuous by the continuity determination unit 526, the index of the adaptive vector is represented as a relative value to the subframe pitch period predicted value.

【0135】マルチプレクサ523では、連続性判定部
526の判定結果が連続である場合とそうでない場合と
で多重化する対象が異なる。すなわち、連続性判定部5
26の判定結果が連続である場合、LPC係数量子化部
522で求めたLPC係数インデックス、ピッチ周期分
析位置決定部525で求めた分析位置インデックス、連
続性判定部526で求めた判定情報、ピッチ周期分析部
503で求めたピッチ周期情報、適応ベクトルのサブフ
レームピッチ周期予測値に対する相対値、適応ベクトル
ゲインのインデックス、雑音ベクトルインデックスおよ
び雑音ベクトルゲインのインデックスを多重化して符号
化データ出力端子524から符号化データとして出力す
る。一方、連続性判定部526の判定結果が連続でない
場合、LPC係数量子化部522で求めたLPC係数イ
ンデックス、連続性判定部526で求めた判定情報、適
応ベクトルのインデックス、適応ベクトルゲインのイン
デックス、雑音ベクトルのインデックスおよび雑音ベク
トルゲインのインデックスを多重化して出力端子524
から出力する。
In the multiplexer 523, the multiplexing target differs depending on whether the determination result of the continuity determining unit 526 is continuous or not. That is, the continuity determination unit 5
26 are continuous, the LPC coefficient index obtained by the LPC coefficient quantization unit 522, the analysis position index obtained by the pitch period analysis position determination unit 525, the determination information obtained by the continuity determination unit 526, the pitch period The pitch period information obtained by the analysis unit 503, the relative value of the adaptive vector to the subframe pitch period predicted value, the index of the adaptive vector gain, the noise vector index, and the index of the noise vector gain are multiplexed and encoded from the encoded data output terminal 524. Output as coded data. On the other hand, when the determination result of the continuity determination unit 526 is not continuous, the LPC coefficient index obtained by the LPC coefficient quantization unit 522, the determination information obtained by the continuity determination unit 526, the index of the adaptive vector, the index of the adaptive vector gain, A noise vector index and a noise vector gain index are multiplexed and output terminal 524
Output from

【0136】(第15の実施形態)図33を用いて本発
明の第15の実施形態を説明する。本実施形態は本発明
をCELP方式のデコーダ(音声復号化装置)に適用し
た例を示している。本実施形態は、これまで説明した実
施形態をいくつか組み合わせて構成されたCELPエン
コーダ部に対応するデコーダ部を表しているが、これに
限定されるものではなく、様々な組み合せにより構成さ
れるCELPエンコーダ部に対応するデコーダ部に適用
することができる。
(Fifteenth Embodiment) A fifteenth embodiment of the present invention will be described with reference to FIG. This embodiment shows an example in which the present invention is applied to a CELP decoder (speech decoding device). In the present embodiment, a decoder unit corresponding to a CELP encoder unit configured by combining some of the embodiments described above is shown. However, the present invention is not limited to this. The present invention can be applied to a decoder section corresponding to an encoder section.

【0137】入力端子801から多重化された符号化デ
ータが入力され、デマルチプレクサ802において種々
のパラメータのインデックスに変換される。LPC係数
復号部811では、LPC係数インデックスを基にLP
C係数を復号し、合成フィルタ812に与える。サブフ
レームピッチ周期生成部803では、ピッチ周期に関連
する情報が与えられ、適応符号帳804で用いられるピ
ッチ周期を生成する。このピッチ周期の生成についての
詳細は、図34を用いて後述する。
The multiplexed coded data is input from an input terminal 801, and is converted by a demultiplexer 802 into indices of various parameters. In LPC coefficient decoding section 811, LP based on the LPC coefficient index
The C coefficient is decoded and supplied to the synthesis filter 812. The subframe pitch period generation unit 803 is given information related to the pitch period, and generates a pitch period used in the adaptive codebook 804. Details of the generation of the pitch period will be described later with reference to FIG.

【0138】ここで生成されたピッチ周期を指標とし
て、適応符号帳804から適応ベクトルを求める。この
適応ベクトルに、適応ベクトルゲインインデックスを指
標にして適応ベクトルゲイン符号帳805から求められ
た適応ベクトルゲインを乗算器806で乗じる。同様
に、雑音符号帳807から雑音ベクトルインデックスを
指標にして求められた雑音ベクトルに、雑音ベクトルゲ
インインデックスを指標に雑音ベクトルゲイン符号帳8
08から求められた雑音ベクトルゲインを乗算器809
で乗じる。
An adaptive vector is obtained from adaptive codebook 804 using the generated pitch period as an index. The adaptive vector is multiplied by a multiplier 806 with the adaptive vector gain obtained from the adaptive vector gain codebook 805 using the adaptive vector gain index as an index. Similarly, a noise vector obtained by using the noise vector index as an index from the noise codebook 807 is added to the noise vector gain codebook 8 using the noise vector gain index as an index.
Multiplier 809 with the noise vector gain obtained from
Multiply by

【0139】これら乗算後の2つの信号を加算器810
で加算して駆動信号を生成し、合成フィルタ812に駆
動信号を与えて合成信号を生成する。この合成信号をポ
ストフィルタ813に入力し、ホルマン卜強調、ピッチ
強調、ゲイン調整などの聴感的な改善を施した後、出力
端子815より出力する。
The two signals after the multiplication are added to an adder 810.
And a driving signal is generated, and the driving signal is given to the synthesis filter 812 to generate a synthesized signal. The synthesized signal is input to a post-filter 813, subjected to auditory improvement such as formant emphasis, pitch emphasis, and gain adjustment, and then output from an output terminal 815.

【0140】次に、図34を用いてサブフレームピッチ
周期生成部803の説明を行う。入力端子901からピ
ッチ周期の連続性の判定情報が入力され、その情報に応
じてスイッチ904とスイッチ911を切り替える。ピ
ッチ周期の連続性判定情報が「不連続」を表す揚合、入
力端子902からはサブフレーム毎のピッチ周期インデ
ックスが入力され、スイッチ904を経由してサブフレ
ームピッチ周期復号部910でサブフレームピッチ周期
が復号され、スイッチ911を経由して出力端子912
から出力される。
Next, the subframe pitch period generation section 803 will be described with reference to FIG. Information for determining the continuity of the pitch period is input from an input terminal 901, and switches 904 and 911 are switched according to the information. When the pitch cycle continuity determination information indicates “discontinuous”, a pitch cycle index for each subframe is input from the input terminal 902, and the subframe pitch is decoded by the subframe pitch cycle decoding unit 910 via the switch 904. The period is decoded, and is output to the output terminal 912 via the switch 911.
Output from

【0141】ピッチ周期の連続性判定情報が「連続」を
表す揚合、入力端子902からはピッチ周期分析位置イ
ンデックス、ピッチ周期インデックス、相対ピッチ周期
インデックスが与えられ、スイッチ904を経由してそ
れぞれピッチ周期分析位置復号部905、ピッチ周期復
号部906および相対ピッチ周期復号部907にそれぞ
れ与えられる。その結果求められる、ピッチ周期分析位
置およびピッチ周期を用いてサブフレームピッチ周期予
測値算出部908でサブフレームピッチ周期予測値を求
める。サブフレームピッチ周期算出部909では、サブ
フレームピッチ周期予測値と相対ピッチ周期とを用いて
サブフレームピッチ周期を算出し、スイッチ911を経
由して出力端子912より出力する。
When the pitch cycle continuity determination information indicates “continuous”, a pitch cycle analysis position index, a pitch cycle index, and a relative pitch cycle index are given from an input terminal 902, and the pitch is determined via a switch 904. The period analysis position decoding unit 905, the pitch period decoding unit 906, and the relative pitch period decoding unit 907 are provided. The predicted subframe pitch period is calculated by the predicted subframe pitch period calculation unit 908 using the pitch period analysis position and the pitch period obtained as a result. The subframe pitch cycle calculation unit 909 calculates a subframe pitch cycle using the predicted subframe pitch cycle value and the relative pitch cycle, and outputs the calculated subframe pitch cycle from the output terminal 912 via the switch 911.

【0142】図35に、本発明に係る音声符号化/復号
化方法を実現するコンピュータシステムの構成を示す。
このコンピュータシステムは例えばパーソナルコンピュ
ータであり、演算処理を司るCPU1001と、キーボ
ード、ポインティングデバイスおよびマイクロフォンな
どの入力部1002と、ディスプレイおよびスピーカな
どの出力部1003と、主記憶としてのROM1004
およびRAM1005と、外部記憶装置としてのハード
ディスク装置1006、フロッピディスク装置1007
および光ディスク装置1008をバス1009により接
続して構成されている。
FIG. 35 shows the configuration of a computer system for realizing the speech encoding / decoding method according to the present invention.
This computer system is, for example, a personal computer, and includes a CPU 1001 for performing arithmetic processing, an input unit 1002 such as a keyboard, a pointing device and a microphone, an output unit 1003 such as a display and a speaker, and a ROM 1004 serving as a main memory.
And a RAM 1005, a hard disk device 1006 as an external storage device, a floppy disk device 1007
And an optical disk device 1008 connected by a bus 1009.

【0143】ここで、ハードディスク装置1006、フ
ロッピディスク装置1007および光ディスク装置10
08のいずれかの記録媒体に、上述した実施形態で説明
した音声符号化処理を実行するためのプログラムおよび
符号化データが格納される。そして、このプログラムに
従って入力部1001から入力される入力音声信号に対
してCPU1001で音声符号化処理が行われ、また記
録媒体から読み出された符号化データに対してCPU1
001により音声復号化処理が行われ、出力部1003
から出力される。このようにすることにより、通常のパ
ーソナルコンピュータを用いて本発明の音声符号化/復
号化処理を実施することができる。
Here, the hard disk device 1006, floppy disk device 1007 and optical disk device 10
08, a program for executing the audio encoding process described in the above-described embodiment and encoded data are stored. In accordance with this program, an audio encoding process is performed by the CPU 1001 on the input audio signal input from the input unit 1001, and the encoded data read from the recording medium is processed by the CPU 1001.
001 performs audio decoding processing, and outputs
Output from By doing so, the voice encoding / decoding processing of the present invention can be performed using a normal personal computer.

【0144】本発明は、以下のように種々変形して実施
することができる。 (1)以上の実施形態では、サブフレームピッチ周期予
測値を求める方法として補間もしくは外挿を用いたが、
これに限定されるものではなく、例えば予測に用いるピ
ッチ周期の数を増やして予測の精度を向上させたり、高
次の関数やスプライン関数といったより高度な予測を行
うことも可能である。こうすることにより、サブフレー
ムピッチの実測値と予測値との誤差が減少し、より少な
い情報量でサブフレームピッチ周期を表すことができ
る。
The present invention can be implemented with various modifications as described below. (1) In the above embodiment, interpolation or extrapolation was used as a method for obtaining the subframe pitch period predicted value.
However, the present invention is not limited to this. For example, it is possible to improve the accuracy of prediction by increasing the number of pitch periods used for prediction, or to perform more advanced prediction such as a higher-order function or a spline function. By doing so, the error between the measured value and the predicted value of the subframe pitch is reduced, and the subframe pitch period can be represented with a smaller amount of information.

【0145】(2)ピッチ周期分析部で求めたピッチ周
期を量子化する際に、過去に求めたピッチ周期で予測し
て、その予測値との差分を量子化することにより量子化
効率を向上させることもできる。
(2) When quantizing the pitch period obtained by the pitch period analysis unit, the quantization is improved by predicting the pitch period obtained in the past and quantizing the difference from the predicted value. It can also be done.

【0146】(3)サブフレームピッチ周期予測値から
探索範囲を決定する際に、サブフレームピッチ周期予測
値の近傍にのみ設定するのではなく、サブフレームピッ
チ周期予測値の整数倍の近傍もしくは整数分の1の近傍
に設定することもできる。
(3) When determining the search range from the predicted value of the sub-frame pitch period, the search range is not set only in the vicinity of the predicted value of the sub-frame pitch period. It can also be set to be close to one-half.

【0147】(4)聴感重みフィルタの一構成要素であ
るピッチフィルタのピッチ周期の算出を目的として、こ
れまで説明してきた実施形態を適用してもよい。同様
に、ここでは明示していないポストフィルタの一構成要
素であるピッチフィルタのピッチ周期の算出を目的とし
て、これまで説明してきた実施形態を適用してもよい。
その場合、付加情報は必要がないので、容易に音声符号
化装置に適用できる。
(4) For the purpose of calculating the pitch period of the pitch filter, which is one component of the perceptual weight filter, the embodiments described above may be applied. Similarly, the embodiments described so far may be applied for the purpose of calculating the pitch period of a pitch filter, which is a component of a post filter not explicitly shown here.
In this case, since additional information is not required, the present invention can be easily applied to a speech encoding device.

【0148】(5)以上述べてきた実施形態による音声
符号化方法をフレーム単位で切り替えて使用してもよ
い。その場合、どの実施形態の方法を使用したかを表す
ための付加情報が新たに必要となる。
(5) The speech coding method according to the above-described embodiment may be switched and used for each frame. In that case, additional information is required to indicate which embodiment of the method has been used.

【0149】[0149]

【発明の効果】以上説明したように、本発明の音声符号
化方法によれば、合成音の品質を維持しつつ、サブフレ
ームピッチ周期を探索する際の計算量を削減することが
できるとともに、サブフレームピッチ周期の情報を表す
ためのビット数を効果的に削減することができる。
As described above, according to the speech encoding method of the present invention, it is possible to reduce the amount of calculation when searching for a subframe pitch period while maintaining the quality of synthesized speech. The number of bits for representing information on the subframe pitch period can be effectively reduced.

【0150】すなわち、本発明の音声符号化方法では、
現フレーム、過去のフレームおよび未来のフレームのう
ちの少なくとも二つのフレームのピッチ周期を用いて、
補間により現フレームのサブフレームのサブフレームピ
ッチ周期予測値を求め、このサブフレームピッチ周期予
測値を用いてサブフレームピッチ周期を決定することに
よって、フレーム内でピッチ周期が変動しても、複数の
ピッチ周期からサブフレームピッチ周期予測値を予測す
ることで精度の良い予測が可能となり、サブフレームピ
ッチ周期を求めるための計算量およびその情報を表現す
るビット数を削減することができる。
That is, in the speech encoding method of the present invention,
Using the pitch period of at least two of the current frame, the past frame, and the future frame,
The subframe pitch period prediction value of the subframe of the current frame is obtained by interpolation, and the subframe pitch period is determined using the subframe pitch period prediction value. Predicting the predicted value of the subframe pitch period from the pitch period enables highly accurate prediction, and reduces the amount of calculation for obtaining the subframe pitch period and the number of bits representing the information.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の基本原理を説明するための図FIG. 1 is a diagram for explaining a basic principle of the present invention.

【図2】 本発明に係る音声符号化方法におけるピッチ
周期分析の基本動作を説明するためのブロック図
FIG. 2 is a block diagram for explaining a basic operation of pitch period analysis in the speech encoding method according to the present invention.

【図3】 フレーム構造とサブフレーム構造を示す図FIG. 3 shows a frame structure and a subframe structure.

【図4】 本発明の第2の実施形態に係る音声符号化方
法を説明するためのブロック図
FIG. 4 is a block diagram illustrating a speech encoding method according to a second embodiment of the present invention.

【図5】 第2の実施形態におけるサブフレームピッチ
抽出部の構成を示すブロック図
FIG. 5 is a block diagram illustrating a configuration of a subframe pitch extraction unit according to a second embodiment.

【図6】 第2の実施形態におけるサブフレームピッチ
周期の算出方法を説明するための図
FIG. 6 is a diagram for explaining a method of calculating a subframe pitch period in the second embodiment.

【図7】 第2の実施形態におけるサブフレームピッチ
周期の算出方法を説明するための図
FIG. 7 is a diagram for explaining a method of calculating a subframe pitch period in the second embodiment.

【図8】 第2の実施形態におけるサブフレームピッチ
周期算出の処理手順を説明するためのフローチャート
FIG. 8 is a flowchart illustrating a processing procedure for calculating a subframe pitch cycle in the second embodiment.

【図9】 本発明の第3の実施形態におけるサブフレー
ムピッチ周期の算出方法を説明するための図
FIG. 9 is a diagram illustrating a method for calculating a subframe pitch period according to a third embodiment of the present invention.

【図10】 第3の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
FIG. 10 is a flowchart for explaining a processing procedure for calculating a subframe pitch cycle in the third embodiment;

【図11】 第3の実施形態の効果を説明するための図FIG. 11 is a view for explaining effects of the third embodiment;

【図12】 本発明の第4の実施形態におけるサブフレ
ームピッチ周期算出方法を説明するための図
FIG. 12 is a diagram for explaining a subframe pitch period calculation method according to a fourth embodiment of the present invention.

【図13】 第4の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
FIG. 13 is a flowchart for explaining a processing procedure for calculating a subframe pitch period in the fourth embodiment;

【図14】 本発明の第5の実施形態におけるサブフレ
ームピッチ周期算出方法を説明するための図
FIG. 14 is a diagram for explaining a subframe pitch period calculation method according to the fifth embodiment of the present invention.

【図15】 第5の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
FIG. 15 is a flowchart for describing a processing procedure for calculating a subframe pitch cycle in the fifth embodiment.

【図16】 本発明の第6の実施形態に係る音声符号化
方法を説明するためのブロック図
FIG. 16 is a block diagram illustrating a speech encoding method according to a sixth embodiment of the present invention.

【図17】 第6の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の一部を示す図
FIG. 17 is a diagram showing a part of a flowchart for describing a processing procedure for calculating a subframe pitch cycle in the sixth embodiment.

【図18】 第6の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
FIG. 18 is a diagram showing another part of the flowchart for describing the processing procedure for calculating the subframe pitch period in the sixth embodiment.

【図19】 本発明の第7の実施形態におけるサブフレ
ームピッチ周期算出の処理手順を説明するためのフロー
チャートの一部を示す図
FIG. 19 is a diagram showing a part of a flowchart for describing a processing procedure of calculating a subframe pitch period in the seventh embodiment of the present invention.

【図20】 第7の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
FIG. 20 is a diagram illustrating another part of the flowchart for describing the processing procedure of calculating the subframe pitch period in the seventh embodiment.

【図21】 本発明の第8の実施形態におけるサブフレ
ームピッチ周期算出の処理手順を説明するためのフロー
チャートの一部を示す図
FIG. 21 is a diagram showing a part of a flowchart for describing a processing procedure of calculating a subframe pitch period in the eighth embodiment of the present invention.

【図22】 第8の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
FIG. 22 is a diagram illustrating another part of the flowchart for describing the processing procedure of calculating the subframe pitch period in the eighth embodiment.

【図23】 本発明の第9の実施形態におけるサブフレ
ームピッチ周期算出の処理手順を説明するためのフロー
チャートの一部を示す図
FIG. 23 is a diagram showing a part of a flowchart for explaining a processing procedure of calculating a subframe pitch period in the ninth embodiment of the present invention;

【図24】 第9の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
FIG. 24 is a diagram showing another part of the flowchart for explaining the processing procedure of calculating the subframe pitch period in the ninth embodiment;

【図25】 本発明の第10の実施形態に係る音声符号
化方法を説明するためのブロック図
FIG. 25 is a block diagram illustrating a speech encoding method according to a tenth embodiment of the present invention.

【図26】 第10の実施形態の効果を説明するための
FIG. 26 is a view for explaining effects of the tenth embodiment;

【図27】 本発明の第11の実施形態に係る音声符号
化方法を説明するためのブロック図
FIG. 27 is a block diagram illustrating a speech encoding method according to an eleventh embodiment of the present invention.

【図28】 本発明の第12の実施形態に係る音声符号
化方法を説明するためのブロック図
FIG. 28 is a block diagram for explaining a speech encoding method according to a twelfth embodiment of the present invention.

【図29】 本発明の第13の実施形態に係る音声符号
化方法を説明するためのブロック図
FIG. 29 is a block diagram illustrating a speech encoding method according to a thirteenth embodiment of the present invention.

【図30】 本発明の音声符号化方法をCELP方式に
適用した第14の実施形態に係る音声符号化装置の構成
を示すブロック図
FIG. 30 is a block diagram illustrating a configuration of a speech encoding apparatus according to a fourteenth embodiment in which the speech encoding method of the present invention is applied to the CELP scheme.

【図31】 第14の実施形態における適応ベクトル、
適応ベクトルゲイン、雑音ベクトルおよび雑音ベクトル
ゲインを求める手順を説明するためのフローチャート
FIG. 31 shows an adaptation vector according to a fourteenth embodiment;
Flowchart for explaining a procedure for obtaining an adaptive vector gain, a noise vector, and a noise vector gain

【図32】 第14の実施形態における適応ベクトル、
雑音ベクトルおよびゲインベクトルを求める手順を説明
するためのフローチャート
FIG. 32 shows an adaptation vector according to a fourteenth embodiment;
Flow chart for explaining a procedure for obtaining a noise vector and a gain vector

【図33】 本発明の音声復号化方法をCELP方式に
適用した第15の実施形態に係る音声復号化装置の構成
を示すブロック図
FIG. 33 is a block diagram showing a configuration of a speech decoding apparatus according to a fifteenth embodiment in which the speech decoding method of the present invention is applied to the CELP scheme.

【図34】 第15の実施形態におけるサブフレームピ
ッチ周期生成部の構成を示すブロック図
FIG. 34 is a block diagram illustrating a configuration of a subframe pitch cycle generation unit according to the fifteenth embodiment.

【図35】 本発明に係る音声符号化/復号化方法を実
現するコンピュータシステムの構成を示すブロック図
FIG. 35 is a block diagram showing a configuration of a computer system for realizing a speech encoding / decoding method according to the present invention.

【符号の説明】[Explanation of symbols]

11…音声信号入力端子 12…フレーム構成部 13…ピッチ周期分析部 14…ピッチ周期情報出力端子 21…音声信号入力端子 22…フレーム・サブフレーム構成部 23…ピッチ周期分析部 24…サブフレームピッチ周期抽出部 25…サブフレームピッチ周期情報出力端子 201,301,401,501,601…音声信号入
力端子 202,302,402,502,602…フレーム・
サブフレーム構成部 203,303,403,503,603…ピッチ周期
分析部 204,304,404,504,604…サブフレー
ムピッチ周期予測値算出部 205,305,405,530…探索範囲決定部 206,306,406,506,528,606…適
応符号帳 207,307,407,507,607…聴感重み付
き合成フィルタ 208,308,408,508,608…聴感重みフ
ィルタ 209,309,409,509,609…減算器 210,310,410,510,610…歪算出部 211,311,411,511,611…歪最小時の
相対ピッチ周期情報出力端子 212,312,412,512,612…ピッチ周期
情報出力端子 313,525…ピッチ周期分析位置決定部 314…ピッチ周期分析位置情報出力端子 413,526…連続性判定部 414,527…全探索部 415,531…スイッチ 416…連続性判定結果出力端子 505,605…相対ピッチパターン符号帳 513,536,613,619…加算器 521…LPC係数分析部 522…LPC係数量子化部 523…マルチプレクサ 524…符号化データ出力端子 529,614…雑音符号帳 532,534,615,617…乗算器 533…適応ベクトル符号帳 535…適応ベクトルゲイン符号帳 801…符号化データ入力端子 802…デマルチプレクサ 803…サブフレームピッチ周期生成部 804…適応符号帳 805…適応ベクトルゲイン符号帳 806,809…乗算器 807…雑音符号帳 808…雑音ベクトルゲイン符号帳 810…加算器 811…LPC係数復号部 812…合成フィルタ 813…ポストフィルタ 814…音声信号出力端子
DESCRIPTION OF SYMBOLS 11 ... Audio signal input terminal 12 ... Frame construction part 13 ... Pitch period analysis part 14 ... Pitch period information output terminal 21 ... Speech signal input terminal 22 ... Frame / subframe construction part 23 ... Pitch period analysis part 24 ... Subframe pitch period Extraction unit 25: Subframe pitch period information output terminal 201, 301, 401, 501, 601: Audio signal input terminal 202, 302, 402, 502, 602: Frame
Subframe configuration units 203, 303, 403, 503, 603... Pitch period analysis units 204, 304, 404, 504, 604... Subframe pitch period prediction value calculation units 205, 305, 405, 530. 306, 406, 506, 528, 606... Adaptive codebooks 207, 307, 407, 507, 607... Perceptual weighting synthesis filters 208, 308, 408, 508, 608 ... perceptual weight filters 209, 309, 409, 509, 609 ... Subtractors 210, 310, 410, 510, 610 Strain calculator 211, 311, 411, 511, 611 Relative pitch period information output terminal at minimum distortion 212, 312, 412, 512, 612 Pitch period information output Terminals 313, 525: Pitch period analysis position determination unit 314: Pitch Period analysis position information output terminals 413, 526: continuity determination unit 414, 527: full search unit 415, 531 ... switch 416: continuity determination result output terminal 505, 605: relative pitch pattern codebook 513, 536, 613, 619 ... Adder 521 LPC coefficient analyzer 522 LPC coefficient quantizer 523 Multiplexer 524 Coded data output terminal 529,614 Noise codebook 532, 534, 615, 617 Multiplier 533 Adaptive vector codebook 535 ... Adaptive vector gain codebook 801 ... Encoded data input terminal 802 ... Demultiplexer 803 ... Subframe pitch period generator 804 ... Adaptive codebook 805 ... Adaptive vector gain codebook 806,809 ... Multiplier 807 ... Noise codebook 808 ... Noise vector gain codebook 810 ... addition Device 811 LPC coefficient decoding section 812 synthesis filter 813 post filter 814 audio signal output terminal

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】入力音声信号を予め定められた長さのフレ
ームに分割し、入力音声信号のピッチ周期を求める処理
を含む符号化処理を行う音声符号化方法において、 符号化しようとする現フレームに対して時間的に未来の
フレームのピッチ周期を求める処理と、このピッチ周期
を符号化する処理とを含むことを特徴とする音声符号化
方法。
An audio encoding method for dividing an input audio signal into frames of a predetermined length and performing an encoding process including a process of obtaining a pitch period of the input audio signal. A speech encoding method characterized by including a process of obtaining a pitch period of a frame in the future in terms of time and a process of encoding the pitch period.
【請求項2】入力音声信号を予め定められた長さのフレ
ームに分割し、各フレームの音声信号をさらにサブフレ
ームに分割して、音声信号のピッチ周期を求める処理を
含む符号化処理を行う音声符号化方法において、 符号化しようとする現フレームと現フレームに対して過
去のフレームおよび未来のフレームのうちの少なくとも
二つのフレームのピッチ周期を用いて現フレーム中のサ
ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
ームのピッチ周期を求めることを特徴とする音声符号化
方法。
2. An encoding process including a process of dividing an input speech signal into frames of a predetermined length, further dividing a speech signal of each frame into subframes, and finding a pitch period of the speech signal. In the speech coding method, a pitch period prediction value of a subframe in a current frame is obtained by using a pitch period of at least two frames of a past frame and a future frame for a current frame to be coded and a current frame. And calculating a pitch period of a subframe in the current frame using the pitch period prediction value.
【請求項3】前記現フレーム中のサブフレームのピッチ
周期を符号化することを特徴とする請求項2記載の音声
符号化方法。
3. The speech encoding method according to claim 2, wherein a pitch period of a subframe in the current frame is encoded.
【請求項4】入力される音声信号のピッチ周期成分を抑
圧または強調するピッチフィルタを有し、前記現フレー
ム中のサブフレームのピッチ周期を用いて該ピッチフィ
ルタの伝達関数を決定することを特徴とする請求項2記
載の音声符号化方法。
4. A pitch filter for suppressing or emphasizing a pitch period component of an input speech signal, wherein a transfer function of the pitch filter is determined using a pitch period of a subframe in the current frame. The speech encoding method according to claim 2, wherein
【請求項5】過去の駆動信号系列を予め定められた範囲
に含まれる周期で繰り返して生成される複数の適応ベク
トルを格納した適応符号帳を有し、この適応符号帳から
取り出される適応ベクトルを所定のフィルタに通して得
られる信号と目標ベクトルとの誤差が最小となる周期の
適応ベクトルを所定の探索範囲から探索する処理を含む
音声符号化方法において、 入力音声信号を予め定められた長さのフレームに分割
し、各フレームの音声信号をさらにサブフレームに分割
した後、 符号化しようとする現フレームと現フレームに対して過
去のフレームおよび未来のフレームのうちの少なくとも
二つのフレームのピッチ周期を用いて現フレーム中のサ
ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
ームについての前記探索範囲を決定することを特徴とす
る音声符号化方法。
5. An adaptive codebook storing a plurality of adaptive vectors generated by repeating past drive signal sequences at a period included in a predetermined range, and the adaptive vector extracted from the adaptive codebook is stored in an adaptive codebook. In a speech encoding method including a process of searching an adaptive vector having a cycle that minimizes an error between a signal obtained through a predetermined filter and a target vector from a predetermined search range, the input audio signal has a predetermined length. After the audio signal of each frame is further divided into subframes, the pitch period of the current frame to be encoded and at least two of the past and future frames with respect to the current frame Is used to determine the predicted pitch period of the subframe in the current frame. Using the predicted pitch period, the subframe in the current frame is calculated. Speech encoding method, characterized by determination of the search range for over arm.
【請求項6】前記フレームのピッチ周期を求める際、フ
レーム毎にピッチ周期の分析位置を適応的に決定するこ
とを特徴とする請求項2〜5のいずれか1項記載の音声
符号化方法。
6. The speech encoding method according to claim 2, wherein, when determining the pitch period of the frame, an analysis position of the pitch period is adaptively determined for each frame.
【請求項7】ピッチ周期の連続性に応じて、現フレーム
中のサブフレームのピッチ周期を求める方法を選択する
ことを特徴とする請求項2〜6のいずれか1項記載の音
声符号化方法。
7. The speech coding method according to claim 2, wherein a method for obtaining a pitch period of a subframe in the current frame is selected according to the continuity of the pitch period. .
【請求項8】複数のサブフレームのピッチ周期の変動を
表す相対ピッチパターンを複数個格納した相対ピッチパ
ターン符号帳をさらに有し、 サブフレームのピッチ周期の変化を該相対ピッチパター
ン符号帳から所定の指標に基づいて選択した一つの相対
ピッチパターンによって表すことを特徴とする請求項2
〜7のいずれか1項記載の音声符号化方法。
8. A relative pitch pattern codebook storing a plurality of relative pitch patterns representing a change in pitch period of a plurality of subframes, wherein a change in pitch period of the subframe is determined from the relative pitch pattern codebook. 3. A method according to claim 2, wherein the relative pitch pattern is represented by one relative pitch pattern selected based on the index.
The speech encoding method according to any one of claims 1 to 7.
【請求項9】入力音声信号を予め定められた長さのフレ
ームに分割し、入力音声信号のピッチ周期を求める処理
を含む符号化処理を行う音声符号化装置において、 符号化しようとする現フレームに対して時間的に未来の
フレームのピッチ周期を求める手段と、 この手段により求められたピッチ周期を符号化する手段
とを有することを特徴とする音声符号化装置。
9. A speech encoding apparatus which divides an input speech signal into frames of a predetermined length and performs an encoding process including a process of obtaining a pitch period of the input speech signal, comprising: A speech coding apparatus comprising: means for calculating a pitch cycle of a frame in the future in terms of time; and means for coding the pitch cycle obtained by the means.
【請求項10】入力音声信号を予め定められた長さのフ
レームに分割し、各フレームの音声信号をさらにサブフ
レームに分割して、音声信号のピッチ周期を求める処理
を含む符号化処理を行う音声符号化装置において、 符号化しようとする現フレームと現フレームに対して過
去のフレームおよび未来のフレームのうちの少なくとも
二つのフレームのピッチ周期を用いて現フレーム中のサ
ブフレームのピッチ周期予測値を求めるサブフレームピ
ッチ周期予測値算出手段と、 このピッチ周期予測値を用いて現フレーム中のサブフレ
ームのピッチ周期を求めるサブフレームピッチ周期算出
手段とを有することを特徴とする音声符号化装置。
10. An encoding process including a process of dividing an input audio signal into frames of a predetermined length, further dividing an audio signal of each frame into subframes, and obtaining a pitch period of the audio signal. In a speech coding apparatus, a pitch period prediction value of a subframe in a current frame is obtained by using a pitch period of at least two frames of a past frame and a future frame for a current frame to be coded and a current frame. And a subframe pitch period calculating unit that calculates a pitch period of a subframe in the current frame using the pitch period predicted value.
【請求項11】過去の駆動信号系列を予め定められた範
囲に含まれる周期で繰り返して生成される複数の適応ベ
クトルを格納した適応符号帳を有し、この適応符号帳か
ら取り出される適応ベクトルを所定のフィルタに通して
得られる信号と目標ベクトルとの誤差が最小となる周期
の適応ベクトルを所定の探索範囲から探索する処理を含
む音声符号化装置において、 入力音声信号を予め定められた長さのフレームに分割
し、各フレームの音声信号をさらにサブフレームに分割
する手段と、 符号化しようとする現フレームと現フレームに対して過
去のフレームおよび未来のフレームのうちの少なくとも
二つのフレームのピッチ周期を用いて現フレーム中のサ
ブフレームのピッチ周期予測値を求めるサブフレームピ
ッチ周期予測値算出手段と、 このピッチ周期予測値を用いて現フレーム中のサブフレ
ームについての前記探索範囲を決定する探索範囲決定手
段とを有することを特徴とする音声符号化装置。
11. An adaptive codebook storing a plurality of adaptive vectors generated by repeating past drive signal sequences at a period included in a predetermined range, and extracting adaptive vectors extracted from the adaptive codebook. An audio encoding apparatus including a process of searching an adaptive vector having a cycle in which an error between a signal obtained through a predetermined filter and a target vector is minimized from a predetermined search range, the input audio signal having a predetermined length Means for dividing the audio signal of each frame into sub-frames, and the pitch of at least two of the past frame and the future frame with respect to the current frame to be encoded and the current frame. Subframe pitch period prediction value calculating means for obtaining a pitch period prediction value of a subframe in the current frame using the period; Speech coding apparatus characterized by having a search range determining means for determining the search range for the sub-frame in the current frame using the pitch period prediction value.
【請求項12】入力音声信号を予め定められた長さのフ
レームに分割し、入力音声信号のピッチ周期を求める処
理を含む音声符号化処理を行うためのプログラムを記録
したコンピュータ読み取り可能な記録媒体であって、 符号化しようとする現フレームに対して時間的に未来の
フレームのピッチ周期を求める処理と、このピッチ周期
を符号化する処理とを実行するためのプログラムを記録
した記録媒体。
12. A computer-readable recording medium on which a program for performing an audio encoding process including a process of dividing an input audio signal into frames of a predetermined length and obtaining a pitch period of the input audio signal is recorded. A recording medium on which a program for executing a process of obtaining a pitch period of a future frame in time with respect to a current frame to be encoded and a process of encoding the pitch period is recorded.
【請求項13】入力音声信号を予め定められた長さのフ
レームに分割し、各フレームの音声信号をさらにサブフ
レームに分割して、音声信号のピッチ周期を求める処理
を含む音声符号化処理を行うためのプログラムを記録し
たコンピュータ読み取り可能な記録媒体であって、 符号化しようとする現フレームと現フレームに対して過
去のフレームおよび未来のフレームのうちの少なくとも
二つのフレームのピッチ周期を用いて現フレーム中のサ
ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
ームのピッチ周期を求める処理を実行するためのプログ
ラムを記録した記録媒体。
13. A speech encoding process including a process of dividing an input speech signal into frames of a predetermined length, further dividing the speech signal of each frame into subframes, and finding a pitch period of the speech signal. A computer-readable recording medium on which a program to be executed is recorded, wherein a pitch of at least two of a past frame and a future frame is used for a current frame to be encoded and a current frame. A recording medium storing a program for obtaining a predicted pitch period of a subframe in a current frame, and executing a process of obtaining a pitch period of a subframe in the current frame using the predicted pitch period.
【請求項14】過去の駆動信号系列を予め定められた範
囲に含まれる周期で繰り返して生成される複数の適応ベ
クトルを格納した適応符号帳を有し、この適応符号帳か
ら取り出される適応ベクトルを所定のフィルタに通して
得られる信号と目標ベクトルとの誤差が最小となる周期
の適応ベクトルを所定の探索範囲から探索する処理を含
む音声符号化処理を行うためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体であって、 入力音声信号を予め定められた長さのフレームに分割
し、各フレームの音声信号をさらにサブフレームに分割
した後、 符号化しようとする現フレームと現フレームに対して過
去のフレームおよび未来のフレームのうちの少なくとも
二つのフレームのピッチ周期を用いて現フレーム中のサ
ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
ームについての前記探索範囲を決定する処理を実行する
ためのプログラムを記録した記録媒体。
14. An adaptive codebook storing a plurality of adaptive vectors generated by repeating a past drive signal sequence at a cycle included in a predetermined range, and extracting adaptive vectors extracted from the adaptive codebook. A computer-readable recording of a program for performing a speech encoding process including a process of searching an adaptive vector having a cycle that minimizes an error between a signal obtained through a predetermined filter and a target vector from a predetermined search range. A recording medium, wherein an input audio signal is divided into frames of a predetermined length, and the audio signal of each frame is further divided into subframes. The pitch period of the subframe in the current frame is determined by using the pitch period of at least two of the current frame and the future frame. Determine the period predicted value, a recording medium recording a program for executing processing for determining the search scope for the subframes in the current frame by using the pitch period estimated value.
JP15555297A 1997-01-23 1997-06-12 Voice coding method and apparatus Expired - Fee Related JP3435310B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP15555297A JP3435310B2 (en) 1997-06-12 1997-06-12 Voice coding method and apparatus
US09/012,792 US6202046B1 (en) 1997-01-23 1998-01-23 Background noise/speech classification method
US09/726,562 US6704702B2 (en) 1997-01-23 2000-12-01 Speech encoding method, apparatus and program
US10/675,947 US7191120B2 (en) 1997-01-23 2003-10-02 Speech encoding method, apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15555297A JP3435310B2 (en) 1997-06-12 1997-06-12 Voice coding method and apparatus

Publications (2)

Publication Number Publication Date
JPH113098A true JPH113098A (en) 1999-01-06
JP3435310B2 JP3435310B2 (en) 2003-08-11

Family

ID=15608564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15555297A Expired - Fee Related JP3435310B2 (en) 1997-01-23 1997-06-12 Voice coding method and apparatus

Country Status (1)

Country Link
JP (1) JP3435310B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002059876A1 (en) * 2001-01-25 2002-08-01 Sony Corporation Data processing apparatus
WO2002059877A1 (en) * 2001-01-25 2002-08-01 Sony Corporation Data processing device
JP2007279754A (en) * 1999-08-23 2007-10-25 Matsushita Electric Ind Co Ltd Speech encoding device
WO2008155919A1 (en) * 2007-06-21 2008-12-24 Panasonic Corporation Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method
JP2009003387A (en) * 2007-06-25 2009-01-08 Nippon Telegr & Teleph Corp <Ntt> Pitch search device, packet loss compensation device, and their method, program and its recording medium
JP5314771B2 (en) * 2010-01-08 2013-10-16 日本電信電話株式会社 Encoding method, decoding method, encoding device, decoding device, program, and recording medium

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4734286B2 (en) * 1999-08-23 2011-07-27 パナソニック株式会社 Speech encoding device
JP2007279754A (en) * 1999-08-23 2007-10-25 Matsushita Electric Ind Co Ltd Speech encoding device
WO2002059877A1 (en) * 2001-01-25 2002-08-01 Sony Corporation Data processing device
US7269559B2 (en) 2001-01-25 2007-09-11 Sony Corporation Speech decoding apparatus and method using prediction and class taps
US7467083B2 (en) 2001-01-25 2008-12-16 Sony Corporation Data processing apparatus
WO2002059876A1 (en) * 2001-01-25 2002-08-01 Sony Corporation Data processing apparatus
WO2008155919A1 (en) * 2007-06-21 2008-12-24 Panasonic Corporation Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method
JP2009003387A (en) * 2007-06-25 2009-01-08 Nippon Telegr & Teleph Corp <Ntt> Pitch search device, packet loss compensation device, and their method, program and its recording medium
JP5314771B2 (en) * 2010-01-08 2013-10-16 日本電信電話株式会社 Encoding method, decoding method, encoding device, decoding device, program, and recording medium
US9812141B2 (en) 2010-01-08 2017-11-07 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US10049679B2 (en) 2010-01-08 2018-08-14 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US10049680B2 (en) 2010-01-08 2018-08-14 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US10056088B2 (en) 2010-01-08 2018-08-21 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals

Also Published As

Publication number Publication date
JP3435310B2 (en) 2003-08-11

Similar Documents

Publication Publication Date Title
US6704702B2 (en) Speech encoding method, apparatus and program
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
JPH08263099A (en) Encoder
JPH09281998A (en) Voice coding device
JP3143956B2 (en) Voice parameter coding method
JPH0990995A (en) Speech coding device
JP3628268B2 (en) Acoustic signal encoding method, decoding method and apparatus, program, and recording medium
EP1005022B1 (en) Speech encoding method and speech encoding system
JP4550176B2 (en) Speech coding method
EP1367565A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH10177398A (en) Voice coding device
JP3435310B2 (en) Voice coding method and apparatus
JP3888097B2 (en) Pitch cycle search range setting device, pitch cycle search device, decoding adaptive excitation vector generation device, speech coding device, speech decoding device, speech signal transmission device, speech signal reception device, mobile station device, and base station device
JP3299099B2 (en) Audio coding device
JP3003531B2 (en) Audio coding device
JP3249144B2 (en) Audio coding device
JP3153075B2 (en) Audio coding device
JP3319396B2 (en) Speech encoder and speech encoder / decoder
JPH06131000A (en) Fundamental period encoding device
JP3089967B2 (en) Audio coding device
JP3192051B2 (en) Audio coding device
JP2001142499A (en) Speech encoding device and speech decoding device
JP3471542B2 (en) Audio coding device
JPH08320700A (en) Sound coding device
JPH0511799A (en) Voice coding system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees