JPS62278598A - Band division type vocoder - Google Patents

Band division type vocoder

Info

Publication number
JPS62278598A
JPS62278598A JP61122688A JP12268886A JPS62278598A JP S62278598 A JPS62278598 A JP S62278598A JP 61122688 A JP61122688 A JP 61122688A JP 12268886 A JP12268886 A JP 12268886A JP S62278598 A JPS62278598 A JP S62278598A
Authority
JP
Japan
Prior art keywords
pitch
calculator
analysis
band
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61122688A
Other languages
Japanese (ja)
Other versions
JPH0636157B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61122688A priority Critical patent/JPH0636157B2/en
Publication of JPS62278598A publication Critical patent/JPS62278598A/en
Publication of JPH0636157B2 publication Critical patent/JPH0636157B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Dc Digital Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】[Detailed description of the invention]

3、発明の詳細な説明 〔産業上の利用分野〕 本発明は帯域分割型ボコーダに関し、特に決定精度の改
善を図った零点を帯域分割点とする線形予測分析形式の
帯域分割型ボコーダに関する。 〔従来の技術〕 線形予測分析(Linear Predicticn 
Coding、 (以下LPC分析と略称する)手法を
利用するLPCボコーダの基本的欠点、すなわち、特に
第1フオルマツトに関して起り易いフォルマット帯域幅
の過小評価や、第17オルマントに比して第37オルマ
ントの近似性が悪いといった欠点を改善するため、特定
の周波数領域での他の集中を排除すべく入力音声信号を
複数のサブバンドに分割してLPC分析を行なう帯域分
割型ボコーダはよく知られており、その効果および問題
点も明らかにされている。 問題点の一つとして、帯域分割点でのスペクトル不連続
性があり、その緩和策として、帯域分割点を零点に一致
させる方法が提案され、これに関しては特開昭59−5
297.帯域分割型ボコーダ等に詳述されている。 〔発明が解決しようとする問題点〕 上述した従来のこの種の帯域分割型ボコーダは、その零
点推定において多少ともビ、チスベクトル構造による影
響を受け、必らずしも正確な推定が行なわれておらず、
従って折角導入した零点を介しての帯域分割効果も十分
に発揮されていない。 また、零点推定の具体的方法も明確にされてないという
欠点がある。 本発明の目的は上述した欠点を除去し、入力音声信号か
らビ、チスベクトル構造を除去したうえ、スペクトルの
零点を正確に推定する手段を備えて指定する零点を帯域
分割点とするという手段を備えることにより、著しく帯
域分割効果を改善した帯域分割型ボコーダを提供するこ
とにある0〔問題点を解決するための手段〕 本発明の帯域分割型ボコーダは、線形予測形式による帯
域分割型ボコーダにおいて、入力音声信号に関するケプ
ストラム情報を分セ[シ抽出するケプストラム分析手段
と、ピッチ検索手段と、前記ケプストラムからビ、チス
ベクトル構造を除去した低ケフレンシー成分にもとづき
入力音声信号のスペクトル包絡を求めるピ、チスベクト
ル除去手段と、前記スペクトル包絡ならびにその逆スペ
クトルをそれぞれ線形予測分析して検出する2種の極情
報にもとづき入力音声信号の零点を推定する零点推定手
段と、前記零点で分割した帯域ごとに入力音声信号の分
析および合成を行なう分析合成手段とを備えて構成され
る。 〔冥施例〕 次に図面を参照して本発明の詳細な説明する。 第1図は本発明の一実施例を示すブロック図である。第
1図に示すブロック図は分析側1と、伝送路2を介して
送、受信する合成4A3とから構成される。分析側1は
A/Dコンバータ11.ケプストラム分析器12.す7
タ13.ピッチ抽出器14、符号化・多重化器】5.ス
ペクトル算出器16、零推定部】7.極推定部18.自
己相関算出器191分割周波数決定器20.帯域分割L
PC分析器21等を備えて構成される。また合成側3は
、復号化・多重分離器31.tカスベクトル算出器32
.予測残差電力鼻出器33.ピ、チパルス列発生器34
.切替器35.自己相関鼻出器36、LPC分析器37
.雑音発生器38.可変利得増幅器39.LPC合成フ
ィルタ40.D1人コンバータ41等を備えて構成され
る0人力音声信号はA/Dコ7バータ11に入力すると
L P F (Law Pa5s Filter )で
3.4kHzを高域S断簡波数とするフィルタリングを
受けたのち8kHzのサンプリング周波数で襟本化され
、さらに所定のビット数】2ビ、トで童子化される。 この童子化音声信号は30m5EC,240サンプルず
つが窓時間分として内部メモlj K格納され、所定の
窓関数、ハミング関数の乗算を受けて切出される窓処理
を10m5ECの周期で次々にかけられ、七の出力がケ
プストラム分析器12に供給される。この窓処理の実行
周期10m5ECが分析フレーム周期となる0 ケプストラム分析器I2は、こうして入力する分析フレ
ームごとの簀子化音声信号のケプストラムを次のように
して分析、算出する0 ケプストラムは、波形の短時間振幅スペクトルlX[n
lの対数の逆7−リエ変換として定義され、入力音声信
号のスペクトル包絡と、微細構造すなわち音源情報を近
似的に分離して抽出できる特徴を有する手法であること
はよく知られている0ここでωは角周波数を示す0 いまx(t)を入力音声信号(有声音)とし、g[t)
を音源、h(t)をμ道フィルタのインパルス応答トす
ると次の(1)式が成立する0ここにtは時間を示す0 (1)式においてX(ω)、G((ロ)およびH(ω)
はそれぞれx(t)、 gft)およびh(t)のフー
リエ変換であるOg (t)が周期性を有する場合には
IX(伺1はその周期の逆数の1@波数ごとにあられれ
る線スペクトルとなり、周波数軸上で見た場合等間隔の
鋭いピークとして表現される0このIX((−11の対
数をとると次の(2)式のようになる。 log lXfω)l=log IQ(nl+1og 
IH(’41・・・・・・(2) (2)式についてωを変数として逆フーリエ変換したも
のがケプストラムであり、  IoglX(ml  の
逆フーリエ変換によるケプストラムがlog l G(
→1とlog l Hf−1の逆フーリエに換の和とし
3. Detailed Description of the Invention [Field of Industrial Application] The present invention relates to a band division type vocoder, and particularly to a band division type vocoder of a linear predictive analysis type in which zero points are used as band division points and which improves decision accuracy. [Prior art] Linear predictive analysis
Fundamental drawbacks of LPC vocoders that utilize the Coding (hereinafter abbreviated as LPC analysis) technique, namely, the possible underestimation of the format bandwidth, especially for the first format, and the 37th allmant in comparison to the 17th allmant. In order to improve the disadvantage of poor approximation, band-splitting vocoders are well known that perform LPC analysis by dividing the input audio signal into multiple subbands in order to eliminate other concentrations in a specific frequency region. , its effects and problems have also been clarified. One of the problems is spectral discontinuity at the band division point, and as a mitigation measure, a method of matching the band division point with the zero point has been proposed, and this is described in Japanese Patent Laid-Open No. 59-5
297. This is explained in detail in the band division type vocoder and the like. [Problems to be Solved by the Invention] The above-mentioned conventional band-splitting vocoder of this type is influenced to some extent by the bi and chis vector structure in its zero point estimation, and accurate estimation is not always possible. Not there,
Therefore, the effect of band division through the painstakingly introduced zero point is not fully exhibited. Another drawback is that the specific method of zero point estimation is not clarified. SUMMARY OF THE INVENTION An object of the present invention is to eliminate the above-mentioned drawbacks, remove the bi, tis vector structure from an input audio signal, and provide a means for accurately estimating the zero point of the spectrum so that the specified zero point becomes a band division point. The object of the present invention is to provide a band-splitting vocoder in which the band-splitting effect is significantly improved. cepstrum analysis means for separating and extracting cepstrum information regarding an input speech signal, pitch search means, and pix vector removal for determining the spectral envelope of the input speech signal based on a low-que frency component obtained by removing the bi, chis vector structure from the cepstrum. means for estimating zero points of the input audio signal based on two types of polar information detected by linear predictive analysis of the spectrum envelope and its inverse spectrum, respectively; and analysis and synthesis means for analyzing and synthesizing. [Example] Next, the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing one embodiment of the present invention. The block diagram shown in FIG. 1 is composed of an analysis side 1 and a synthesis 4A3 that transmits and receives via a transmission line 2. The analysis side 1 includes an A/D converter 11. Cepstral analyzer 12. 7
Ta13. Pitch extractor 14, encoder/multiplexer]5. Spectrum calculator 16, zero estimator]7. Pole estimation unit 18. Autocorrelation calculator 191 division frequency determiner 20. Band division L
It is configured with a PC analyzer 21 and the like. Furthermore, the combining side 3 includes a decoding/demultiplexing unit 31 . t scum vector calculator 32
.. Predicted residual power output device 33. Pi, Chi pulse train generator 34
.. Switcher 35. Autocorrelation nose device 36, LPC analyzer 37
.. Noise generator 38. Variable gain amplifier 39. LPC synthesis filter 40. When the 0-person-powered audio signal, which is configured with a D-1 converter 41 and the like, is input to the A/D converter 11, it is filtered by an LPF (Law Pa5s Filter) with 3.4kHz as the high-frequency S-fraction wave number. Later, the data is converted into an original at a sampling frequency of 8 kHz, and further converted into a doji using a predetermined number of bits. This Doji-formed audio signal is stored in the internal memory ljK in 30m5EC, 240 samples each as a window time, and is successively subjected to window processing, which is multiplied by a predetermined window function and a Hamming function, and cut out at a cycle of 10m5EC. The output of is supplied to the cepstral analyzer 12. The execution period of this window processing, 10 m5EC, is the analysis frame period.The cepstrum analyzer I2 analyzes and calculates the cepstrum of the filtered audio signal for each input analysis frame as follows.The cepstrum is a short waveform Time amplitude spectrum lX[n
It is well known that this method is defined as the inverse 7-Lier transform of the logarithm of l, and has the characteristic of being able to approximately separate and extract the spectral envelope of the input audio signal and the fine structure, that is, the sound source information. where ω indicates the angular frequency 0. Let x(t) be the input audio signal (voiced sound), and g[t]
If we let h(t) be the sound source and h(t) be the impulse response of the μ-way filter, the following equation (1) holds true.0 Here, t indicates time.0 In equation (1), X(ω), G((b), and H(ω)
are the Fourier transforms of x(t), gft) and h(t), respectively. If Og(t) has periodicity, then When viewed on the frequency axis, 0 is expressed as equally spaced sharp peaks.If you take the logarithm of -11, it becomes the following equation (2).log lXfω)l=log IQ(nl+1og
IH ('41... (2) The cepstrum is obtained by inverse Fourier transform of equation (2) with ω as a variable, and the cepstrum obtained by inverse Fourier transform of IoglX(ml is log l G(
→The sum of 1 and log l Hf-1 converted to inverse Fourier

【表現される。 こうして、スペクト、Is/の対数の逆変換を介して得
られるケプストラムは時間領域データでケフレ/シーと
呼ばれる。第1図の実り例ではこれらフーリエ変換、逆
フーリエf換が離散的データ処理にもとづいて実施され
る。 きて、第(2)式において、右辺の第1項はスペクトル
の微細構造を示し、第2項はスペクトル包絡を示すもの
でおる。従って、これら2つを逆フーリエ変換したもの
には大きな差異があられれ、前者は高ケフレンシ一部の
ピークとなり、後者は低ケフレノシ一部に集中するもの
となる0このようす高ケフレンク一部のピークを分析す
ることに、よって音源gft)の基本周期が求まり、ま
た、低ケ7レンン一部のフーリエ変換からは対数スペク
トル包絡、さらにこれを指数変換すればスペクトル包絡
が得られることとなる。高ケフレ/シ一部だけをケプス
トラムから分離し低ケフレンンーをとり出す処理かりフ
タ(l1fter )によって行なわれる。 第1図の実施例で、ケプストラム分析器12は分析フレ
ームごとの量子化音声信号のケプストラムを算出し、こ
れをリフタ13とピッチ抽出器】4とに供給する。 リフタ13は、後述のピッチ抽出器14より供給される
ピッチ周期情報に基づいて設定でれるリフタによってピ
ッチ成分を除去し、スペクトル算出器16へ供給する。 スペクトル算出器16は、入力に対する離散的フーリエ
f侠、引続いて指数変換を行なって入力音声信号のスペ
クトル包絡を得てこれを零推定部17、極推定部18お
よび自己相関算出器19に供給する。スペクトル算出器
】6からこうして得られるスペクトル包絡は入力音声信
号からピッチスペクトル構造を除去したスペクトル包絡
成分である。 ピッチ抽出器14は、ケプストラム分析器12から受け
るケプストラムにもとづいてピッチ情報とV(有声)、
Uv(無声)K関する情報をそれぞれ公知の技術で検索
し、これらを符号化・多重化器15に供給する。更にピ
ッチ抽出器15はピッチ周期情報を前述のようにり7り
】3へ供給する0 さて、スペクトル算出器16から出力されるスペクトル
包絡は入力音声信号に関するピッチの影醤を排除し、包
絡であることhs前造したとおりである。従って、これ
は分析フレームごとに異る゛個数、帯域幅の極と零点と
を有する。 翻って考察するに、特に零点を帯域分割点として帯域分
割点におけるスペクトルの不連続性を緩和しようとする
帯域分割型ボコーダの問題点も、この零点推定の正確な
処理の出麹性に尽きると1える。 そこで本実施例では、この問題性の根本的打開を零推定
部】7.極推定部18および分割周波数決定器20によ
って次のようにして実施している。 なお、本実施例では分割帯域数は2チヤノネルとしてい
るが、これは現在1分割効果と処理内存の増大とのトレ
ードオフその他達用実績等にもとづき通常最も効率的と
考えられている個数を設定しているだけであり、ボコー
ダの運用目的等を勘案しこの個数は適宜変更しても勿論
差支えない。 零推定部17は逆スペクトル算出器171. LPC分
析器172.極算出器173および極倹定器174を備
えて構成され、入力するスペクトル包絡の逆スペクトル
を対象として七の極の算出。 検定を行なう。つまり、スペクトル包絡の逆スペクトル
化によって元来零点であるものを見掛は上極に変換し、
これに公知の極算出手法を適用して笑質的な零点の推定
を行なうものである。 逆スペクトル算出器171は、人力した分析フレームご
とのスペクトル包絡の逆スペクトルを算出し、これをL
PC9vr器172に供給する。 LPC分析器】72は、入力した逆スペクトルを分析フ
レームごとKLI’C分析し所定の次数。 P次のαパラメータを抽出し極算出器173に供給する
。 極算出器】73は、入力したP次のαパラメータにもと
づき次のような公知の手法によって極周波数と帯域幅と
を算出する。 すなわち、P次のαパラメータを係数とする次の(3)
式に示す高次方程式を零とする根として得られる共役複
素解として極周波数を算出する。 1 + aI Z−’+a2 Z−2+  −−−−−
−+apZ−p=0・・・・・・(3) (3)式KかいてZ=eJ”であシ、また左辺は巌形予
gjモfzノ伝達rll数H(Z−’) =] /A 
p(Z ’ )の右辺の分母を表わすものであることも
よく知られている。 (3)式からは一般に、Pの偶、全数に対応しP/2個
かそれ以下の数の共役複素根が得られ、これが極周V数
を提供するものであシ、共役複素根以外の根があるとぎ
はすべて実数根となる0また、こうして得られる極周波
数の帯域幅は次の(4)式で示嘔れる。 B i = −logγi/l・ΔT   ・・・・・
・・・・・・・ f4)(4)式でΔTは標本化周期、
γiは(3)式の根を極座標表現しZi−=rieJ”
で示したときのベクトルの大きさであり、λiは極周波
数に対応する波長である。 他検定器174は他算出器173の算出結果を受け、音
声資料等にもとづいてあらかじめ設定する検定基準にも
とづいて極を最終決定しその情報を分割筒e、数決定器
20に供給する。ただし、こうして検定された極周波数
と帯域幅を丁いずれも実際は零点を指定するものである
ことは前述したとおりである。こうして零推定が実施さ
れる0極推定部18は、LPC分析器18】、極算出器
182.極検定器183を備えて構成され、入力する分
析フレームごとのスペクトル自体に対し零推定部17と
四じ手法によって極周波数と帯域幅を推定しそのデータ
を分割周波数20に供給する0 分割周波数データ20は、こうして供給される零推定と
他推定に関する検定データを分析フレームごとに受け、
音F資料、運用実績等にもとづいてあらかじめ設定した
判定基準との比較により総合的に零点を正確に推定した
うえ2分割点とする分割周波数を決定しそのデータを自
己相関算出器】9に供給するとともに符号化・多重化器
15に供給する。 自己相関算i:lli器19は、スペクトル算出器16
から受けるスペクトル包絡を分割周波数で低域(L)お
よび高域()()に2分割し、それぞれの帯域での自己
相関係数を所定の時間遅れ範囲にわたって算出しこれを
備域分割LPC分町器21に供給するとともに遅れ時間
零における自己相関係数をそれぞれの帯域について算出
し、これを平均電力として符号化・多重化器】5に供給
する。 帯域分割L’PC2]は、入力するり、H2帝域の自己
相関係数を利用し、公知の手法によってLPC係数とし
てのにパラメータを2帯域それぞれについて抽出し、こ
れを符号化・多重化器15に供給する。 符号化・多1化器15は、上述した各分析処理を介して
供給されるピッチ、V/UV、分割IkJ波数、平均電
力、’LPC係数に関する各撞データを所定の形式で符
号化したうえこれらを適宜組合せて多重化し伝送路2を
介して合成側3に伝送する。 合成側3では、復号化・多1分離器31によって受信信
号の多重化分離復号化を行ない、LPC保数データは電
カスベクトル算出器32に、平均電力データは電カスベ
クトル算出器32と予測残差電力鼻出器33に、分割周
波数データは電カスベクトル算出器32に、ピッチデー
タはピッチバルス発生器34に、またV/UVデータは
切替器35にそれぞれ供給される。 電カスベクトル算出器32は、LPC係数として入力し
たにパラメータを利用し次の(5)式にもとづく正規化
予測残差電力Uを低、高両帯域について算出する。 ・・・・・・・・・・・・(5) (5)式においてPは分析次数にはにパラメータを示す
。 電力算出器はこの正規化予測残差電力と平均電力を利用
し低、高両帯域に関する予測残差電力Paを得る。電カ
スベクトルP(→(ス、予測残差電力と、LPC係数の
K パラメータから容易に誘導しうるαパラメータとを
オリ用し次の(6)式から求めることができる。 メータの次数である。 この2帯域電カスベクトルは次に自己相関係数36に提
供され離教的逆フーリエ変換等を受は全周波帯域に対応
する自己相関係数列としてLPG分析器37に供給され
る。 LPC分析器37は、入力した自己相関係数列を利用し
て所定の次数のLPC係数を抽出しこれを全極型ディジ
タルフィルタとして構成するLPC合成フィルタ40の
フィルタ係数として出力する〇 一万、LPC分析器37はLPC係数抽出に付随して得
られる正規化予測残差電力を予測残差電力算出器33に
供給する。 予測残差電力算出器33にはまた、分析フレームごとの
電力データが供給され、予測残差電力算出器33はこの
2人力にもとづいて予測残差電力を分析フレームごとに
可変利得増幅器39に出力しその利得を予測残差電力に
対応しつつ変化せしめる。 ピッチデータはピッチパルス列発生器34に供給され、
ピッチデータに対応する周期のピッチパルス列を発生す
る。 また、残音発生器38は、白色雑音を発生し、なお、分
割周波数は、この低、高両帯域に関する予測残差電力算
出の際の境界周波数情報として提供され両帯域の連続性
の保持に利用される。 この低、高両帯域の電カスベクトルは矢に自己相関算出
器36に供給されて逆フーリエ′KIs、を受け、全周
波数帯域に対応した自己相関係数を抽出されLPC分析
器37に提供きれる。 LPC分析器37は、全周波数帯域の自己相関係数をオ
リ用して所定の次数のにパラメータをLPC係数として
分析フレームごとに抽出し、これを全極型ディジタルフ
ィルタとして構成するLPC合成フィルタ40のフィル
タ係数として利用する0LPC分析器37はまた、(5
)式にもとづいて正規化予測残差を算出しこれを予測残
差電力算出器33に供給する。 予測残差電力算出器33にはまた、低域と高域の平均電
力も供給される。この平均電力は加算されて全周波数帯
域の平均電力にf換され、これと正規化予測残差電力と
くよって予測残差電力が分析フレームごとに算出され可
変利得増幅器39に提供でれ、その利得を分析フレーム
ごとの予測残差電力すなわち音m、振幅に対応して変化
せしめる。 さて、ピッチデータはピッチパルス列発生器34に提供
されてピッチデータに対応する縄期のピッチパルス列を
発生せしめる。このピッチパルス列は切替器35に供給
される。 また、切替器35には罐曾発生器38の出力する白色雑
音も供給される。 切替器35はさらにV/UVデータを入力し、これがV
すなわち有声を指定するときはピッチパルス列発生器3
4の出力を可変利得増幅器39に出力し、またUvすな
わち無μを指定するときは雑音発生器38の出力を可変
利得増幅器39に出力するように切替える。 可変利得増幅器39はこうしてモデル化された音源情報
を発生しこれをLPG合成合成フィル54人0 こうして駆動されたLPC合成フィルタ40は、ディジ
タル形式の入力音声信号を再生し、このあとD/Aコン
バータ41でアナログ形式のデータに変換され、さらに
LPFを通して不要の高域周波数を除去した出力音声信
号として送出する。 こうして正確な推定のもとに得られる零点を分割点とす
る帯域分割型ボコーダにより帯域分割点におけるスペク
トルの不連続性を本質的に排除した分析ならびに合成が
可能となる。 〔発明の効果〕 以上説明したよ5に本発明によれば、入力音声信号から
ピ、チスベクトル構造を除去したうえ、又スペクトルの
零点を正確に推定する手段を備えて指定する零点を帯域
分割点とすることにより、著しく帯域分割効果を改讐し
うる帯域分割型ボコーダが実現できるという効果がある
[expressed. Thus, the cepstrum obtained through the inverse transformation of the logarithm of the spectrum, Is/, is called Keffle/C in time domain data. In the example shown in FIG. 1, these Fourier transforms and inverse Fourier f transforms are performed based on discrete data processing. In Equation (2), the first term on the right side represents the fine structure of the spectrum, and the second term represents the spectral envelope. Therefore, there is a big difference between the inverse Fourier transforms of these two, with the former being a peak that is concentrated in a part of the high quefrency, and the latter being concentrated in a part of the low quefrinous area. By analyzing this, the fundamental period of the sound source (gft) can be found, and by Fourier transformation of a portion of the low frequency spectrum, a logarithmic spectral envelope can be obtained, and further, by exponential transformation of this, a spectral envelope can be obtained. The process is carried out using a lid (l1fter) to separate only a portion of the high-cephalic cepstrum from the cepstrum and take out the low-cephalic. In the embodiment of FIG. 1, the cepstrum analyzer 12 calculates the cepstrum of the quantized audio signal for each analysis frame and supplies this to a lifter 13 and a pitch extractor 4. The lifter 13 removes pitch components using a lifter that can be set based on pitch period information supplied from a pitch extractor 14, which will be described later, and supplies the removed pitch component to the spectrum calculator 16. The spectrum calculator 16 performs a discrete Fourier function on the input and then performs exponential transformation to obtain the spectrum envelope of the input audio signal, and supplies this to the zero estimator 17, the pole estimator 18, and the autocorrelation calculator 19. do. The spectral envelope thus obtained from the spectrum calculator 6 is a spectral envelope component obtained by removing the pitch spectral structure from the input audio signal. The pitch extractor 14 extracts pitch information and V (voiced) based on the cepstrum received from the cepstrum analyzer 12.
Information regarding Uv (unvoiced) K is searched using known techniques, and the information is supplied to the encoder/multiplexer 15. Furthermore, the pitch extractor 15 supplies the pitch period information to the input audio signal as described above.Now, the spectrum envelope output from the spectrum calculator 16 eliminates the pitch influence on the input audio signal, and It's as I said before. Therefore, it has a different number of bandwidth poles and zeros for each analysis frame. In retrospect, the problem with band-splitting vocoders that use zeros as band-splitting points to alleviate spectral discontinuities at band-splitting points is also the problem with accurate processing of zero-point estimation. Get 1. Therefore, in this embodiment, a fundamental solution to this problem is provided by the zero estimation section]7. This is implemented by the pole estimator 18 and the division frequency determiner 20 as follows. In this embodiment, the number of divided bands is 2 channels, but this number is usually considered to be the most efficient based on the trade-off between the effect of one division and the increase in processing capacity, as well as actual results. Of course, this number may be changed as appropriate in consideration of the purpose of use of the vocoder. The zero estimator 17 includes an inverse spectrum calculator 171. LPC analyzer 172. It is configured with a pole calculator 173 and a pole saver 174, and calculates seven poles for the inverse spectrum of the input spectrum envelope. Perform the test. In other words, by inverting the spectral envelope, what is originally a zero point is transformed into an upper pole,
A well-known pole calculation method is applied to this to perform qualitative zero estimation. The inverse spectrum calculator 171 calculates the inverse spectrum of the spectral envelope of each analysis frame manually, and converts this into L
It is supplied to the PC9vr device 172. [LPC analyzer] 72 performs KLI'C analysis of the input inverse spectrum for each analysis frame to obtain a predetermined order. The P-order α parameter is extracted and supplied to the pole calculator 173. The pole calculator 73 calculates the pole frequency and bandwidth using the following known method based on the input P-order α parameter. In other words, the following (3) with the P-th order α parameter as a coefficient
The polar frequency is calculated as a conjugate complex solution obtained as the root of the higher-order equation shown in the equation to zero. 1 + aI Z-'+a2 Z-2+ ------
-+apZ-p=0...(3) (3) Subtracting equation K, we get Z=eJ'', and the left side is the number of transmission rll for gjmofz, H(Z-')= ] /A
It is also well known that it represents the denominator of the right-hand side of p(Z'). In general, from equation (3), a conjugate complex root of P/2 or less is obtained corresponding to an even or complete number of P, and this provides the polar circumference V number, other than the conjugate complex root. All roots of 0 are real roots. Furthermore, the bandwidth of the pole frequency obtained in this way can be expressed by the following equation (4). B i = -logγi/l・ΔT ・・・・・・
...... f4) In equation (4), ΔT is the sampling period,
γi represents the root of equation (3) in polar coordinates, and Zi−=rieJ”
λi is the wavelength corresponding to the polar frequency. The other tester 174 receives the calculation result of the other calculator 173, makes a final determination of the pole based on the test standard set in advance based on audio materials, etc., and supplies the information to the dividing tube e and the number determiner 20. However, as described above, both the pole frequency and the bandwidth verified in this way actually designate the zero point. The zero pole estimator 18 that performs zero estimation in this way includes an LPC analyzer 18], a pole calculator 182. It is configured with a polar tester 183, estimates the polar frequency and bandwidth using the zero estimator 17 and the four-dimensional method for the spectrum itself of each input analysis frame, and supplies the data to the divided frequency 20.0 divided frequency data 20 receives the thus supplied test data regarding the zero estimation and other estimation for each analysis frame,
The zero point is comprehensively and accurately estimated by comparison with preset judgment criteria based on sound F data, operational results, etc., and the dividing frequency to be the two dividing points is determined, and the data is supplied to the autocorrelation calculator 9. At the same time, it is supplied to the encoder/multiplexer 15. The autocorrelation calculator i:lli unit 19 is the spectrum calculator 16
The spectral envelope received from the spectral envelope is divided into low band (L) and high band () () by the division frequency, and the autocorrelation coefficient in each band is calculated over a predetermined time delay range, and this is calculated by the pre-region division LPC. At the same time, the autocorrelation coefficient at zero delay time is calculated for each band, and this is supplied to the encoder/multiplexer 5 as the average power. [Band division L'PC2] inputs or uses the autocorrelation coefficient of the H2 region, extracts parameters as LPC coefficients for each of the two bands by a known method, and sends them to the encoder/multiplexer. 15. The encoder/multiplexer 15 encodes each data regarding the pitch, V/UV, divided IkJ wave number, average power, and 'LPC coefficient supplied through each analysis process described above in a predetermined format. These are appropriately combined and multiplexed, and transmitted to the combining side 3 via the transmission line 2. On the combining side 3, a decoding/multiplexer 31 performs multiplexing, demultiplexing and decoding of the received signal, LPC constant data is sent to an electric waste vector calculator 32, and average power data is sent to an electric waste vector calculator 32 for prediction. The divided frequency data is supplied to the residual power output device 33, the divided frequency data is supplied to the electric scum vector calculator 32, the pitch data is supplied to the pitch pulse generator 34, and the V/UV data is supplied to the switch 35. The electric waste vector calculator 32 calculates the normalized predicted residual power U for both the low and high bands based on the following equation (5) using the parameters input as the LPC coefficients. (5) In equation (5), P represents a parameter for the analysis order. The power calculator uses the normalized predicted residual power and the average power to obtain predicted residual power Pa for both the low and high bands. The electric waste vector P(→(S) can be obtained from the following equation (6) using the predicted residual power and the α parameter that can be easily derived from the K parameter of the LPC coefficient. This two-band electric cassette vector is then provided to an autocorrelation coefficient 36, subjected to an inverse Fourier transform, etc., and then supplied to an LPG analyzer 37 as an autocorrelation coefficient sequence corresponding to all frequency bands.LPC analysis The device 37 extracts LPC coefficients of a predetermined order using the input autocorrelation coefficient sequence and outputs them as filter coefficients of an LPC synthesis filter 40 configured as an all-pole digital filter. 37 supplies the normalized predicted residual power obtained along with the LPC coefficient extraction to the predicted residual power calculator 33. The predicted residual power calculator 33 is also supplied with power data for each analysis frame, The predicted residual power calculator 33 outputs the predicted residual power to the variable gain amplifier 39 for each analysis frame based on the power of these two people, and changes the gain corresponding to the predicted residual power.The pitch data is generated by pitch pulse train generation. is supplied to the vessel 34,
A pitch pulse train having a period corresponding to the pitch data is generated. Further, the after-sound generator 38 generates white noise, and the divided frequency is provided as boundary frequency information when calculating predicted residual power for both the low and high bands, and is used to maintain continuity of both bands. used. The electric flux vectors in both the low and high bands are supplied to the autocorrelation calculator 36 and subjected to inverse Fourier KIs, and autocorrelation coefficients corresponding to all frequency bands are extracted and provided to the LPC analyzer 37. . The LPC analyzer 37 uses the autocorrelation coefficients of all frequency bands to extract parameters of a predetermined order as LPC coefficients for each analysis frame, and constructs the LPC synthesis filter 40 as an all-pole digital filter. The 0LPC analyzer 37 also uses (5
) is used to calculate the normalized prediction residual and supplies it to the prediction residual power calculator 33. The predicted residual power calculator 33 is also supplied with the average power of the low frequency band and the high frequency band. This average power is added and converted to the average power of the entire frequency band f, and by combining this with the normalized predicted residual power, the predicted residual power is calculated for each analysis frame and provided to the variable gain amplifier 39, and its gain is is changed corresponding to the predicted residual power for each analysis frame, that is, the sound m, and the amplitude. Now, the pitch data is provided to the pitch pulse train generator 34, which generates a pitch pulse train corresponding to the pitch data. This pitch pulse train is supplied to the switch 35. The switch 35 is also supplied with white noise output from the frequency generator 38 . The switch 35 further inputs V/UV data, and this
In other words, when specifying voicing, the pitch pulse train generator 3
The output of the noise generator 38 is outputted to the variable gain amplifier 39, and when specifying Uv, that is, no μ, the output of the noise generator 38 is switched to be outputted to the variable gain amplifier 39. The variable gain amplifier 39 generates the modeled sound source information, which is then used to synthesize the LPG synthesis filter 54. The LPC synthesis filter 40 driven in this way reproduces the input audio signal in digital format, and then converts it to the D/A converter. At step 41, the signal is converted into analog data, and then sent out as an output audio signal with unnecessary high frequencies removed through an LPF. The band division type vocoder which uses the zero point obtained based on accurate estimation as the division point enables analysis and synthesis that essentially eliminates spectral discontinuity at the band division point. [Effects of the Invention] As explained above, according to the present invention, in addition to removing the pi, chis vector structure from the input audio signal, a means for accurately estimating the zero point of the spectrum is provided, and the specified zero point is set as the band division point. By doing so, it is possible to realize a band division type vocoder which can significantly improve the band division effect.

【図面の簡単な説明】[Brief explanation of drawings]

化1図は本発明の一実施例のグロ、り図である。 1・・・・・jf−析愉、2・・・・・・伝送路、3・
・・・合成側、】】・・・・・・A/Dコンバータ、1
2・・・・・ケフストラム分v′r器、】3・・・・・
・す7り、14・・・・・・ピッチ抽出器、】5・・・
・・・符号化・多重化器、】6・・・・・・スペクトル
!出器、】7・・・・・・零推定部、】8・・・・・・
他推定部、】9・・・・・・自己相関算出器、20・・
・・・分割周波数決定器、2】 ・・・・・帯域分割L
PG分析器、31・・・・・・復号化・多重分離器、3
2・・・・・・電カスベクトル算出器、33・・・・・
・予測残差電力算出器、34・・・・・・ピッチパルス
列発生器、35・・・・・・切替器、36・・・・・・
自己相関算出器、37・・・・・・LPC分析器、38
・・・・・・雑音発生器、39・・・・・・可変利得増
幅器、40・・・・・・LPC合成フィルタ、41・・
・・・・D/Aコノバータ、171・・・・・・逆スペ
クトル算出器、172・・・・・・LPC分析器、17
3・・・・・・極算出器、】74・・・・・・他種定器
、181・・・・・・LPC分析器、】82・・・・・
・極算出器、183・・・・・・極検定器0代理人 弁
理士  内 原   晋    −1手続補正書(自発
) 62.8.10 昭和  年  月  日 持許庁長宮 殿 2、発明の名称  帯域分割型ボコーダ3、補正をする
者 事件との関係       出 願 人東京都港区芝五
丁目33番1号 (423)   日本電気株式会社 代表者 関本忠弘 4、代理人 & 補正の対象 明細書の「発明の詳細な説明」の欄 & 補正の内容 第9頁の第13行目K「排除し、包絡である」とあるの
を「排除したスペクトル包絡である」K訂正する。
Figure 1 is a diagram of one embodiment of the present invention. 1...jf-analysis, 2...transmission line, 3.
・・・Synthesis side,】】・・・A/D converter, 1
2...Cefstrum minute v'r device, ]3...
・S7ri, 14... Pitch extractor, ]5...
...encoder/multiplexer,]6...spectrum! Output device, ]7...Zero estimation section, ]8...
Other estimators, ]9... Autocorrelation calculator, 20...
... Division frequency determiner, 2] ...Band division L
PG analyzer, 31...Decoding/demultiplexer, 3
2... Electric waste vector calculator, 33...
- Prediction residual power calculator, 34...Pitch pulse train generator, 35...Switcher, 36...
Autocorrelation calculator, 37... LPC analyzer, 38
...Noise generator, 39...Variable gain amplifier, 40...LPC synthesis filter, 41...
...D/A conoverter, 171 ... Inverse spectrum calculator, 172 ... LPC analyzer, 17
3...Pole calculator, ]74...Other species determiner, 181...LPC analyzer, ]82...
・Koku Calculator, 183...Koku Verifier 0 Agent Patent Attorney Susumu Uchihara -1 Procedural Amendment (Spontaneous) 62.8.10 Showa Year/Month Date Chief Palace of the Licensing Agency 2, Name of the invention Band-splitting vocoder 3, relationship with the amended person case Applicant: 5-33-1 Shiba, Minato-ku, Tokyo (423) NEC Corporation Representative: Tadahiro Sekimoto 4, agent & of the specification subject to amendment "Detailed Description of the Invention" Column & Contents of the Amendment In page 9, line 13, K "excluded and is an envelope" is corrected to "excluded spectral envelope."

Claims (1)

【特許請求の範囲】 線形予測分析形式による帯域分割ボコーダであって、 入力音声信号に関するケプストラム(Cepstrum
)情報を分析し抽出するケプストラム分析手段と、ピッ
チ検索手段と、前記ケプストラムからピッチスペクトル
構造を除去した低ケフレンシー成分にもとづき入力音声
信号のスペクトル包絡を求めるピッチスペクトル除去手
段と、前記スペクトル包絡ならびにその逆スペクトルを
それぞれ線形予測分析して検出する2種の極情報にもと
づき入力音声信号の零点を推定する零点推定手段と、前
記零点で分割した帯域ごとに入力音声信号の分析および
合成を行なう分析合成手段とを備えて成ることを特徴と
する帯域分割型ボコーダ。
[Claims] A band division vocoder based on a linear predictive analysis format, comprising:
) a cepstrum analysis means for analyzing and extracting information; a pitch search means; a pitch spectrum removal means for determining the spectral envelope of the input audio signal based on the low frequency component obtained by removing the pitch spectral structure from the cepstrum; Zero point estimating means for estimating the zero point of the input audio signal based on two types of polar information detected by linear predictive analysis of the inverse spectra, and analysis and synthesis for analyzing and synthesizing the input audio signal for each band divided by the zero points. A band division type vocoder comprising: means.
JP61122688A 1986-05-27 1986-05-27 Band division type vocoder Expired - Lifetime JPH0636157B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61122688A JPH0636157B2 (en) 1986-05-27 1986-05-27 Band division type vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61122688A JPH0636157B2 (en) 1986-05-27 1986-05-27 Band division type vocoder

Publications (2)

Publication Number Publication Date
JPS62278598A true JPS62278598A (en) 1987-12-03
JPH0636157B2 JPH0636157B2 (en) 1994-05-11

Family

ID=14842162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61122688A Expired - Lifetime JPH0636157B2 (en) 1986-05-27 1986-05-27 Band division type vocoder

Country Status (1)

Country Link
JP (1) JPH0636157B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02134699A (en) * 1988-11-15 1990-05-23 A T R Jido Honyaku Denwa Kenkyusho:Kk Voice analyzing device
WO1995014990A1 (en) * 1993-11-29 1995-06-01 Sony Corporation Method and device for encoding signal, method and device for decoding signal, and recording medium
US5937378A (en) * 1996-06-21 1999-08-10 Nec Corporation Wideband speech coder and decoder that band divides an input speech signal and performs analysis on the band-divided speech signal

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02134699A (en) * 1988-11-15 1990-05-23 A T R Jido Honyaku Denwa Kenkyusho:Kk Voice analyzing device
WO1995014990A1 (en) * 1993-11-29 1995-06-01 Sony Corporation Method and device for encoding signal, method and device for decoding signal, and recording medium
US5778339A (en) * 1993-11-29 1998-07-07 Sony Corporation Signal encoding method, signal encoding apparatus, signal decoding method, signal decoding apparatus, and recording medium
US5937378A (en) * 1996-06-21 1999-08-10 Nec Corporation Wideband speech coder and decoder that band divides an input speech signal and performs analysis on the band-divided speech signal

Also Published As

Publication number Publication date
JPH0636157B2 (en) 1994-05-11

Similar Documents

Publication Publication Date Title
EP1262956B1 (en) Signal encoding method and apparatus
US6741960B2 (en) Harmonic-noise speech coding algorithm and coder using cepstrum analysis method
KR100615480B1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JPH11177434A (en) Voice code decoding system
JP2779325B2 (en) Pitch search time reduction method using pre-processing correlation equation in vocoder
KR0155315B1 (en) Celp vocoder pitch searching method using lsp
JPS62278598A (en) Band division type vocoder
JPH11219198A (en) Phase detection device and method and speech encoding device and method
JP3398968B2 (en) Speech analysis and synthesis method
JPH0650440B2 (en) LSP type pattern matching vocoder
Makhoul Methods for nonlinear spectral distortion of speech signals
JPH0235994B2 (en)
JPH052158B2 (en)
JP2535809B2 (en) Linear predictive speech analysis and synthesis device
JPH0667696A (en) Speech encoding method
KR0138878B1 (en) Method for reducing the pitch detection time of vocoder
Varho et al. A linear predictive method using extrapolated samples for modelling of voiced speech
JPS58198095A (en) Line spectrum type voice analyzer/synthesizer
JPH08160993A (en) Sound analysis-synthesizer
Richards A system for helium speech enhancement using the short-time Fourier transform
JPH0582600B2 (en)
JPH0235993B2 (en)
JPH0229233B2 (en)
JPS61272800A (en) Burst voice communication equipment