JPS6370900A - デジタル音声符号化および復号方法および装置 - Google Patents
デジタル音声符号化および復号方法および装置Info
- Publication number
- JPS6370900A JPS6370900A JP62225440A JP22544087A JPS6370900A JP S6370900 A JPS6370900 A JP S6370900A JP 62225440 A JP62225440 A JP 62225440A JP 22544087 A JP22544087 A JP 22544087A JP S6370900 A JPS6370900 A JP S6370900A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- harmonic
- frames
- speech
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000001228 spectrum Methods 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 210000001260 vocal cord Anatomy 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000010183 spectrum analysis Methods 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000005284 excitation Effects 0.000 abstract description 18
- 230000003595 spectral effect Effects 0.000 description 18
- 230000001755 vocal effect Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 6
- 230000003362 replicative effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004804 winding Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 241000102542 Kara Species 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 240000006413 Prunus persica var. persica Species 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
溌」し1技m−5u一
本発明は音声処理、より詳細には、音声の発声部分に対
してシヌソイダル モデルを使用し、音声の非発声部分
に対して励振予測フィルタ モデルを使用して音声の複
製を行なうためのデジタル音声符号化及び復号装置に関
する。
してシヌソイダル モデルを使用し、音声の非発声部分
に対して励振予測フィルタ モデルを使用して音声の複
製を行なうためのデジタル音声符号化及び復号装置に関
する。
技術の背景
音声メモリ及び音声レスポンス設備を含むデジタル音声
通信システムにおいては、しばしば記録及び/或いは伝
送に必要とされるビット速度を低減するために信号圧縮
が使用される。信号圧縮を行なうための1つの周知のデ
ジタル音声符号化スキームが、皇!工i嵐及び信号処理
に関するIEEE国 会議の会mla (Procee
dings of I E E E Interna
−tional Conference on Aco
ustics、 5peech。
通信システムにおいては、しばしば記録及び/或いは伝
送に必要とされるビット速度を低減するために信号圧縮
が使用される。信号圧縮を行なうための1つの周知のデ
ジタル音声符号化スキームが、皇!工i嵐及び信号処理
に関するIEEE国 会議の会mla (Procee
dings of I E E E Interna
−tional Conference on Aco
ustics、 5peech。
and Signal Processing)、 1
984年、Vol。
984年、Vol。
2、ページ27.6.1−27.6.4 (合衆国サン
ジエゴ)に掲載の論文[シヌソイダル音声モデルを使
用しての規模のみの再生(Magnitude−o n
ly Reconstruction Usinga
5inusoidal 5peech Model)
] において開示されている。この論文はシヌソイ
ダル音声モデルの音声の発声及び非発声部分の両方への
使用を開示する。この音声波形は音声波形を正弦波の総
和としてモデル化することによってボコーダ−のシンセ
サイザ部分内で再生される。正弦波のこの総和は音声波
形の基本周波数及び高調波から成り、以下によって表わ
される。
ジエゴ)に掲載の論文[シヌソイダル音声モデルを使
用しての規模のみの再生(Magnitude−o n
ly Reconstruction Usinga
5inusoidal 5peech Model)
] において開示されている。この論文はシヌソイ
ダル音声モデルの音声の発声及び非発声部分の両方への
使用を開示する。この音声波形は音声波形を正弦波の総
和としてモデル化することによってボコーダ−のシンセ
サイザ部分内で再生される。正弦波のこの総和は音声波
形の基本周波数及び高調波から成り、以下によって表わ
される。
5(n)= Σ a;(n) sin [φ、(n
)コ (1)項a;(n)及びφ1(n)は
それぞれ任意の時間内のポイントにおける音声波形のシ
ヌソイダル成分の時間とともに変動する振幅及び位相を
表わす。この音声処理機能はアナライザ部分内で振幅と
位相を決定し、これら値を式(1)を使用して音声波形
を再生するシンセサイザ部分に送られる。
)コ (1)項a;(n)及びφ1(n)は
それぞれ任意の時間内のポイントにおける音声波形のシ
ヌソイダル成分の時間とともに変動する振幅及び位相を
表わす。この音声処理機能はアナライザ部分内で振幅と
位相を決定し、これら値を式(1)を使用して音声波形
を再生するシンセサイザ部分に送られる。
マツフォーレイ(M c A u l a y )の論
文はまた振幅及び位相はフレームと呼ばれる一定の時間
期間に対して速いフーリエ(fast Fourier
)スペクトル分析を遂行することによって決定できるこ
とを開示する。基本及び高調波周波数は速いフーリエ
スペクトル内でピークとして現われ、基本及び高調波の
周波数及び振幅を決定するためのピーク ピッキングを
遂行することによって決定される。
文はまた振幅及び位相はフレームと呼ばれる一定の時間
期間に対して速いフーリエ(fast Fourier
)スペクトル分析を遂行することによって決定できるこ
とを開示する。基本及び高調波周波数は速いフーリエ
スペクトル内でピークとして現われ、基本及び高調波の
周波数及び振幅を決定するためのピーク ピッキングを
遂行することによって決定される。
マツフォーレイ(McAulay)の方法の1つの問題
は、基本周波数、全ての高調波周波数、及び全ての振幅
がアナライザからシンセサイザに伝送され、結果として
高いピッ1〜伝送速度となることである。もう1つの問
題は、周波数及び振幅が結果としてのスペクトル ピー
クから直接に決定されることである。使用される速いフ
ーリエ交換はこれらピークを非常に正確に検出するが、
多量の計算が必要とされる。
は、基本周波数、全ての高調波周波数、及び全ての振幅
がアナライザからシンセサイザに伝送され、結果として
高いピッ1〜伝送速度となることである。もう1つの問
題は、周波数及び振幅が結果としてのスペクトル ピー
クから直接に決定されることである。使用される速いフ
ーリエ交換はこれらピークを非常に正確に検出するが、
多量の計算が必要とされる。
この方法のもう1つの問題は、シヌソイダル波形符号化
技術を使用して音声の発声部分のみでなく、音声の非発
声部分もモデル化しようとする試みである0発声領域と
非発声領域の間の変動の結果、スペクトル分析からのス
ペクトル エネルギーがこれら領域間の境界の所で離接
することとなり、スペクトル内で関連するピークを決定
することが困難となる。
技術を使用して音声の発声部分のみでなく、音声の非発
声部分もモデル化しようとする試みである0発声領域と
非発声領域の間の変動の結果、スペクトル分析からのス
ペクトル エネルギーがこれら領域間の境界の所で離接
することとなり、スペクトル内で関連するピークを決定
することが困難となる。
発明の構成
本発明は先行技術のこれら問題及び欠点を解決し、技術
的進歩をはかることを目的とする。本発明の方法論上及
び構造上の実施態様においては、個々の音声フレームに
対しフレーム エネルギー、声帯を定義する音声パラメ
ータ、基本周波数、個々の高調波周波数と基本周波数の
整数倍との差を表わすオフセットをその後の音声合成の
ために符号化及び伝送するためのアナライザが含まれる
。さらにシンセサイザが提供されるが、これは伝送され
た情報に応答して基本周波数及び高調波の位相及び振幅
を計算し、この計算された情報を使用して複製音声を生
成する。この構成はアナライザからシンセサイザに振幅
情報を伝送する必要性を排除する。
的進歩をはかることを目的とする。本発明の方法論上及
び構造上の実施態様においては、個々の音声フレームに
対しフレーム エネルギー、声帯を定義する音声パラメ
ータ、基本周波数、個々の高調波周波数と基本周波数の
整数倍との差を表わすオフセットをその後の音声合成の
ために符号化及び伝送するためのアナライザが含まれる
。さらにシンセサイザが提供されるが、これは伝送され
た情報に応答して基本周波数及び高調波の位相及び振幅
を計算し、この計算された情報を使用して複製音声を生
成する。この構成はアナライザからシンセサイザに振幅
情報を伝送する必要性を排除する。
1つの実施態様においては、アナライザは基本周波数、
つまり、ピッチ検出器によって決定されるピッチをスペ
クトル分析によって得られるピッチの高調波゛に関する
情報を使用して調節する。このピッチ調節はピッチ検出
器の動作に起因する初期ピッチ予測値の不正確さを正し
、また、これがサンプリング期間の整数倍数を使用して
計算されるという事実と関連する問題を正す。これに加
え、このピッチ調節はピッチをその幾つかの高調波を派
生するために適当に掛けられたときその値がスペクトル
分析から決定される高調波の実際の値の平均となるよう
に調節する。従って、このピッチ調節はアナライザから
シンセサイザに高調波を定義するオフセット情報を伝送
するために必要とされるビットの数を削減する。
つまり、ピッチ検出器によって決定されるピッチをスペ
クトル分析によって得られるピッチの高調波゛に関する
情報を使用して調節する。このピッチ調節はピッチ検出
器の動作に起因する初期ピッチ予測値の不正確さを正し
、また、これがサンプリング期間の整数倍数を使用して
計算されるという事実と関連する問題を正す。これに加
え、このピッチ調節はピッチをその幾つかの高調波を派
生するために適当に掛けられたときその値がスペクトル
分析から決定される高調波の実際の値の平均となるよう
に調節する。従って、このピッチ調節はアナライザから
シンセサイザに高調波を定義するオフセット情報を伝送
するために必要とされるビットの数を削減する。
ピッチがいったん調節されると、適当に掛けられた調節
されたピッチ値がスペクトル内の個々の高調波の位置を
再計算するための開始ポイントとして、また、こうして
実際に検出される高調波と調節されたピッチ値に所望の
高調波の番号を掛けることによって決定されるその高調
波の理論値との間のオフセットを決定するために使用さ
れる。
されたピッチ値がスペクトル内の個々の高調波の位置を
再計算するための開始ポイントとして、また、こうして
実際に検出される高調波と調節されたピッチ値に所望の
高調波の番号を掛けることによって決定されるその高調
波の理論値との間のオフセットを決定するために使用さ
れる。
本発明のシンセサイザは音声の発声部分に対しては上に
説明のシヌソイダル モデル化技術を使用し、音声の非
発声部分に対しては多重パルスあるいはノイズ励振のい
ずれかを使用して得られるこれら伝送された情報から音
声を再生する。
説明のシヌソイダル モデル化技術を使用し、音声の非
発声部分に対しては多重パルスあるいはノイズ励振のい
ずれかを使用して得られるこれら伝送された情報から音
声を再生する。
より詳細には、高調波の振幅はシンセサイザの所で元の
サンプル ポイント及び線形予測符号化(linear
predictive coding、 L PC)
係数から決定される総フレーム エネルギーを使用して
決定される。これら高調波振幅は個々の高調波からLP
G係数を使用してアンスケールド エネルギー寄与を得
て、次に高調波の振幅を総エネルギーを演算動作におけ
るスケーリング ファクターとして使用して派生するこ
とによって計算される。この技術では、アナライザはL
PG係数及び総エネルギーのみを伝送し、個々の高調波
の振幅を伝送することは要求されない。
サンプル ポイント及び線形予測符号化(linear
predictive coding、 L PC)
係数から決定される総フレーム エネルギーを使用して
決定される。これら高調波振幅は個々の高調波からLP
G係数を使用してアンスケールド エネルギー寄与を得
て、次に高調波の振幅を総エネルギーを演算動作におけ
るスケーリング ファクターとして使用して派生するこ
とによって計算される。この技術では、アナライザはL
PG係数及び総エネルギーのみを伝送し、個々の高調波
の振幅を伝送することは要求されない。
シンセサイザはフレームの中心に起こる基本周波数及び
高調波に対する周波数に応答して音声フレームと音声フ
レームとの間を補間することによって個々のフレームを
通じての連続周波数を生成する。同様の方法で基本周波
数及び高調波に対する振幅が生成される。
高調波に対する周波数に応答して音声フレームと音声フ
レームとの間を補間することによって個々のフレームを
通じての連続周波数を生成する。同様の方法で基本周波
数及び高調波に対する振幅が生成される。
発声フレームから非はっせいフレームあるいはこの逆方
向への遷移と関連する問題は以下のように処理される。
向への遷移と関連する問題は以下のように処理される。
非発声フレー、ムから発声フレームへの遷移のときは、
基本周波数及び個々の高調波に対する周波数はそのフレ
ームの開始からそのフレームの真ん中まで一定であると
見做される1周波数は発声フレームから非発声フレーム
に遷移するときも同様に計算される0通常の補間を使用
してフレームの残りの部分に対する周波数が計算される
。基本周波数及び高調波の振幅は発声フレームの開始の
所でゼロからスタートするものと仮定され、そのフレー
ムの最初の半分に対する補間が行なわれる。発声フレー
ムから非発声フレームに遷移するときの振幅はこれと同
様に計算される。
基本周波数及び個々の高調波に対する周波数はそのフレ
ームの開始からそのフレームの真ん中まで一定であると
見做される1周波数は発声フレームから非発声フレーム
に遷移するときも同様に計算される0通常の補間を使用
してフレームの残りの部分に対する周波数が計算される
。基本周波数及び高調波の振幅は発声フレームの開始の
所でゼロからスタートするものと仮定され、そのフレー
ムの最初の半分に対する補間が行なわれる。発声フレー
ムから非発声フレームに遷移するときの振幅はこれと同
様に計算される。
これに加え、個々の発声フレームに対する高調波の数は
フレームによって異なる。このため、ある発声フレーム
内の高調波の数は隣接する発声フレーム内の高調波の数
より多かったり少なかったりする。この問題は隣接する
フレーム内に対応する高調波を持たない高調波の周波数
はそのフレームの真ん中から隣接するフレームの境界ま
で一定であり、 また、そのフレームの高調波の振幅は
そのフレームと隣接するフレームとの間の境界の所でゼ
ロであると仮定することによって解決される。この仮定
によって、補間を通常の方法で遂行することが可能とな
る。
フレームによって異なる。このため、ある発声フレーム
内の高調波の数は隣接する発声フレーム内の高調波の数
より多かったり少なかったりする。この問題は隣接する
フレーム内に対応する高調波を持たない高調波の周波数
はそのフレームの真ん中から隣接するフレームの境界ま
で一定であり、 また、そのフレームの高調波の振幅は
そのフレームと隣接するフレームとの間の境界の所でゼ
ロであると仮定することによって解決される。この仮定
によって、補間を通常の方法で遂行することが可能とな
る。
さらに、発声フレームから非発声フレームへの遷移が発
生したときは、非発声LPGフィルタが前の発声フレー
ムからのLPG係数から初期化される。これは非発声フ
ィルタが非発声領域に対する音声をより正確に合成する
ことを可能とする。このため、発声フレームからのLP
G係数は先行フレームに対する声帯をより正確にモデル
化する。
生したときは、非発声LPGフィルタが前の発声フレー
ムからのLPG係数から初期化される。これは非発声フ
ィルタが非発声領域に対する音声をより正確に合成する
ことを可能とする。このため、発声フレームからのLP
G係数は先行フレームに対する声帯をより正確にモデル
化する。
見匪夏尖凰孤
第1図及び第2図は、それぞれ本発明の焦点である一例
としての音声アナライザ及び音声シンセサイザを示す、
第1図の音声シンセサイザ100は経路120を介して
受信されるアナログ音声信号に応答してこれら信号をチ
ャネル139を介して第2図のシンセサイザ200に伝
送するために低ビツト速度にて符号化する。チャネル1
39は通信伝送路であることも、あるいは合成された音
声を要求する各種アプリケーションのために後の時点に
おいて音声合成を提供するためのメモリでもあり得る。
としての音声アナライザ及び音声シンセサイザを示す、
第1図の音声シンセサイザ100は経路120を介して
受信されるアナログ音声信号に応答してこれら信号をチ
ャネル139を介して第2図のシンセサイザ200に伝
送するために低ビツト速度にて符号化する。チャネル1
39は通信伝送路であることも、あるいは合成された音
声を要求する各種アプリケーションのために後の時点に
おいて音声合成を提供するためのメモリでもあり得る。
このアプリケーションの一例としてデジタル コンピュ
ータのための音声出力があるゆアナライザ100はアナ
ログ/デジタル コンバータ101及びフレーム セグ
メンタ102を使用してアナログ音声情報をデジタル化
及び量子化する。LPGカルキュレータ111は量子化
及びデジタル化されたこのサンプルに応答して人の声帯
をモデル化する線形予測符号化(1inear pre
dictivecoding L P C) 係数の
生成及び残留信号の生成を行なう。このLPG係数及び
残留信号の生成は本出願と同一の譲受人に譲渡された合
衆国特許第3,740,476号に開示される方法ある
いは当分野において周知の他の方法に従って遂行できる
。アナライザ100は経路120を介して受信される音
声信号を以下の分析技術、つまり、シヌソイダル分析。
ータのための音声出力があるゆアナライザ100はアナ
ログ/デジタル コンバータ101及びフレーム セグ
メンタ102を使用してアナログ音声情報をデジタル化
及び量子化する。LPGカルキュレータ111は量子化
及びデジタル化されたこのサンプルに応答して人の声帯
をモデル化する線形予測符号化(1inear pre
dictivecoding L P C) 係数の
生成及び残留信号の生成を行なう。このLPG係数及び
残留信号の生成は本出願と同一の譲受人に譲渡された合
衆国特許第3,740,476号に開示される方法ある
いは当分野において周知の他の方法に従って遂行できる
。アナライザ100は経路120を介して受信される音
声信号を以下の分析技術、つまり、シヌソイダル分析。
多重パルス分析、あるいはノイズ励振分析の1つを使用
して符号化する。最初に、フレーム セグメント化ブロ
ック102が音声サンプルを好ましくは160個のサン
プルから成るフレームにグループ化する。LPGカルキ
ュレータ111は、個々のフレームに応答して残留信号
の計算を行ない、この信号を経路122を介してピッチ
検出器109に送る。
して符号化する。最初に、フレーム セグメント化ブロ
ック102が音声サンプルを好ましくは160個のサン
プルから成るフレームにグループ化する。LPGカルキ
ュレータ111は、個々のフレームに応答して残留信号
の計算を行ない、この信号を経路122を介してピッチ
検出器109に送る。
ピッチ検出器はこの残留信号及び音声サンプルに応答し
てそのフレームが発声フレームであるか非発声であるか
決定する。発声フレームとは通常ピッチと呼ばれる基本
周波数がそのフレーム内に検出されるフレームである。
てそのフレームが発声フレームであるか非発声であるか
決定する。発声フレームとは通常ピッチと呼ばれる基本
周波数がそのフレーム内に検出されるフレームである。
ピッチ検出器109がそのフレームが発声フレームであ
ると決定すると、ブロック103から108がそのフレ
ームのシヌソイダル符号化を遂行する。しかし、フレー
ムが非発声であると決定された場合は、ノイズ/多重パ
ルス判定ブロック112においてLPGカルキュレータ
ブロック111によって計算されたLPG係数によっ
て定義されるフィルタを励振するためにノイズ励振を使
用すべきかあるいは多重パルス励振を使用すべきかが決
定される。ノイズ励振を使用すべきである場合は、この
事実がパラメータ符号化ブロック113及び送信機11
4を介してシンセサイザ200に伝送される。一方、多
重パルス励振を使用すべきであるときは、ブロック11
0によってパルス トレインの位置及び振幅が決定され
、この情報が経路128及び129を介して後に第2図
のシンセサイザ200に伝送するためにパラメータ符号
化ブロック113に送られる。
ると決定すると、ブロック103から108がそのフレ
ームのシヌソイダル符号化を遂行する。しかし、フレー
ムが非発声であると決定された場合は、ノイズ/多重パ
ルス判定ブロック112においてLPGカルキュレータ
ブロック111によって計算されたLPG係数によっ
て定義されるフィルタを励振するためにノイズ励振を使
用すべきかあるいは多重パルス励振を使用すべきかが決
定される。ノイズ励振を使用すべきである場合は、この
事実がパラメータ符号化ブロック113及び送信機11
4を介してシンセサイザ200に伝送される。一方、多
重パルス励振を使用すべきであるときは、ブロック11
0によってパルス トレインの位置及び振幅が決定され
、この情報が経路128及び129を介して後に第2図
のシンセサイザ200に伝送するためにパラメータ符号
化ブロック113に送られる。
アナライザ100とシンセサイザ200の間の通信チャ
ネルがパケットを使用して実現される場合は、第3図に
示されるようなパケットが発声フレームに対して伝送さ
れ、第4図に示されるようなパケットがホワイト ノイ
ズ励振を使用する非発声フレームに対して伝送され、そ
して第5図に示されるようなパケットが多重パルス励振
を使用する非発声フレームに対して伝送される。
ネルがパケットを使用して実現される場合は、第3図に
示されるようなパケットが発声フレームに対して伝送さ
れ、第4図に示されるようなパケットがホワイト ノイ
ズ励振を使用する非発声フレームに対して伝送され、そ
して第5図に示されるようなパケットが多重パルス励振
を使用する非発声フレームに対して伝送される。
次に、アナライザ100の動作を詳細に考察する。ピッ
チ検出器109が経路130を通じてそのフレームが非
発声であることを通知すると、ノイズ/多重パルス判定
ブロック112はこの信号に応答してノイズ励振を使用
すべきかあるいは多重パルス励振を使用すべきかを決定
する6多重パルス励振が使用されるときは、この事実を
通知する信号が多重パルス アナライザ ブロック11
0に送信される。多重パルス アナライザ110は経路
124上のこの信号及びピッチ検出器109から経路1
25及び126を介して伝送されるセットのパルスに応
答する。多重パルスアナライザ110は選択されたパル
スの位置をこの選択されたパルスの振幅とともにパラメ
ータ符号器113に伝送する。パラメータ符号器113
は経路123を介してLPGカルキュレータ111から
受信されるLPG係数に応答して第5図に示されるパケ
ットを形成する。
チ検出器109が経路130を通じてそのフレームが非
発声であることを通知すると、ノイズ/多重パルス判定
ブロック112はこの信号に応答してノイズ励振を使用
すべきかあるいは多重パルス励振を使用すべきかを決定
する6多重パルス励振が使用されるときは、この事実を
通知する信号が多重パルス アナライザ ブロック11
0に送信される。多重パルス アナライザ110は経路
124上のこの信号及びピッチ検出器109から経路1
25及び126を介して伝送されるセットのパルスに応
答する。多重パルスアナライザ110は選択されたパル
スの位置をこの選択されたパルスの振幅とともにパラメ
ータ符号器113に伝送する。パラメータ符号器113
は経路123を介してLPGカルキュレータ111から
受信されるLPG係数に応答して第5図に示されるパケ
ットを形成する。
ノイズ/多重パルス判定ブロック112がノイズ励振を
使用すべきであることを決定すると、これはこの事実を
経路124を介して1つの信号をパラメータ符号器ブロ
ック113に送信することによって示す。符号器113
はこの信号に応答してブロック111からのLPG係数
及びブロック115によって残留信号から計算された利
得を使用して第4図に示されるパケットを生成する。
使用すべきであることを決定すると、これはこの事実を
経路124を介して1つの信号をパラメータ符号器ブロ
ック113に送信することによって示す。符号器113
はこの信号に応答してブロック111からのLPG係数
及びブロック115によって残留信号から計算された利
得を使用して第4図に示されるパケットを生成する。
次に発声フレームの間のアナライザ100の動作を詳細
に説明する。エネルギー カルキュレータ103は、フ
レーム セグメンタ102から受信されるフレームに対
するデジタル化された音声S1に応答して、好ましくは
160個のサンプルを持つフレーム内の音声の総エネル
ギーを以下の式によって計算する。
に説明する。エネルギー カルキュレータ103は、フ
レーム セグメンタ102から受信されるフレームに対
するデジタル化された音声S1に応答して、好ましくは
160個のサンプルを持つフレーム内の音声の総エネル
ギーを以下の式によって計算する。
このエネルギー値はシンセサイザ200によってLPG
係数とともに基本周波数及びその高調波の振幅を決定す
るのに使用される。
係数とともに基本周波数及びその高調波の振幅を決定す
るのに使用される。
ハミング ウィンドウ ブロック104は経路121を
介して伝送される音声信号に応答して以下の式によって
与えられるウインドニング動作を遂行する。
介して伝送される音声信号に応答して以下の式によって
与えられるウインドニング動作を遂行する。
s’=幅=s、(0,54−0,46ccs((:’c
n)/159)) (3)0 < n < 159 このウインドニング動作の目的はフレームの終端点の所
の離接性(disjointness)を速いフーリエ
変換(fast Fourier transform
、 F FT)を計算するのに備えて除去する。ウイン
ドニング動作を遂行した後、ブロック105はブロック
104からの結果としてのサンプルにOを挿入するが、
これは、好ましくは、以下の式によって定義される1
024個のデータポイントの新たなシーケンスを与える
。
n)/159)) (3)0 < n < 159 このウインドニング動作の目的はフレームの終端点の所
の離接性(disjointness)を速いフーリエ
変換(fast Fourier transform
、 F FT)を計算するのに備えて除去する。ウイン
ドニング動作を遂行した後、ブロック105はブロック
104からの結果としてのサンプルにOを挿入するが、
これは、好ましくは、以下の式によって定義される1
024個のデータポイントの新たなシーケンスを与える
。
次に、ブロック105は速いフーリエ変換を遂行するが
、これは以下の式によって定義される不連続フーリエ変
換(discrete Fouriertransfo
rm)の速い実現である。
、これは以下の式によって定義される不連続フーリエ変
換(discrete Fouriertransfo
rm)の速い実現である。
F’FT計算を遂行した後、ブロック105は、式(5
)に定義される計算を遂行して得られる個々の複素周波
数データ ポイント(complex frequen
cy data point)の規模を計算することに
よってスペクトルSを得るが、この動作は次式によって
定義される。
)に定義される計算を遂行して得られる個々の複素周波
数データ ポイント(complex frequen
cy data point)の規模を計算することに
よってスペクトルSを得るが、この動作は次式によって
定義される。
S = にE =加7扉四πWア (6)0丘に丘51
1 ピッチ アジャスタ107はピッチ検出器109によっ
て計算されたピッチ及びブロック105によって計算さ
れたスペクトルに応答してピッチ検出器109からの調
節された値よりもより正確なピッチの精製(refin
e−ment)である予調ピッチを計算する。これに加
え、ピッチの整数倍数はこの回りを高調波周波数が比較
的等しく分布する値である。この調節は 3つの理由に
よって必要とされる。
1 ピッチ アジャスタ107はピッチ検出器109によっ
て計算されたピッチ及びブロック105によって計算さ
れたスペクトルに応答してピッチ検出器109からの調
節された値よりもより正確なピッチの精製(refin
e−ment)である予調ピッチを計算する。これに加
え、ピッチの整数倍数はこの回りを高調波周波数が比較
的等しく分布する値である。この調節は 3つの理由に
よって必要とされる。
第1の理由は、ブロック105によって計算されるスペ
クトルの第1のピークは基本周波数の位置を示すべきで
あるが、実際にはこの信号は通常声帯の影響及びアナロ
グ/デジタルコンバータ101内のローパス フィルタ
の影響によってシフトされることである。
クトルの第1のピークは基本周波数の位置を示すべきで
あるが、実際にはこの信号は通常声帯の影響及びアナロ
グ/デジタルコンバータ101内のローパス フィルタ
の影響によってシフトされることである。
第2の理由は、ピッチ検出器の周波数分解能はアナログ
/デジタル コンバータのサンプリング速度によって制
限され:従って、対応するピッチ期間が2つのサンプル
ポイント間にくる場合は正確なピッチ周波数を定義す
ることができないことである。この正しいピッチを持た
ないことの影響がピッチ アジャスタ107によって調
節される。これの最も大きな影響は高調波ロケータ10
6及び高調波オフセット カルキュレータ108によっ
て遂行される計算に与える影響である。高調波ロケータ
106はピッチアジャスタ107によって決定されたピ
ッチをさまざまな高調波の位置を決定するためにスペク
トル規模ブロック105によって生成されたスペクトル
を分析するための開始ポイントを生成するために利用す
る。
/デジタル コンバータのサンプリング速度によって制
限され:従って、対応するピッチ期間が2つのサンプル
ポイント間にくる場合は正確なピッチ周波数を定義す
ることができないことである。この正しいピッチを持た
ないことの影響がピッチ アジャスタ107によって調
節される。これの最も大きな影響は高調波ロケータ10
6及び高調波オフセット カルキュレータ108によっ
て遂行される計算に与える影響である。高調波ロケータ
106はピッチアジャスタ107によって決定されたピ
ッチをさまざまな高調波の位置を決定するためにスペク
トル規模ブロック105によって生成されたスペクトル
を分析するための開始ポイントを生成するために利用す
る。
゛ 第3の理由は、高調波オフセット カルキュレー
タ108がシンセサイザ200に伝送されるオフセット
を決定するためにピッチ値から計算される理論高調波周
波数及びロケータ106によって決定される高調波周波
数を利用することである。ピッチ周波数が不正確である
と、これらオフセットの各々はシンセサイザ200に伝
送するにはあまりにも多くのビットを必要とする大きな
数となる。ゼロ高調波オフセットの回りに高調波オフセ
ットを分散させることによってシンセサイザ200にオ
フセットを伝送するのtこ必要とされるビットの数を最
小数に保つ゛ことができる。
タ108がシンセサイザ200に伝送されるオフセット
を決定するためにピッチ値から計算される理論高調波周
波数及びロケータ106によって決定される高調波周波
数を利用することである。ピッチ周波数が不正確である
と、これらオフセットの各々はシンセサイザ200に伝
送するにはあまりにも多くのビットを必要とする大きな
数となる。ゼロ高調波オフセットの回りに高調波オフセ
ットを分散させることによってシンセサイザ200にオ
フセットを伝送するのtこ必要とされるビットの数を最
小数に保つ゛ことができる。
ピッチ アジャスタ ブロック107は以下のように機
能する。FFTスペクトル規模ブロック105によって
計算されるスペクトル内の基本周波数に対応するピーク
は上に述べた理由によって不明瞭であるため、ピンチア
ジャスタ107は最初に初期ピッチ予測値を以下のよう
にセットすることによってスペクトル探索を行なう。
能する。FFTスペクトル規模ブロック105によって
計算されるスペクトル内の基本周波数に対応するピーク
は上に述べた理由によって不明瞭であるため、ピンチア
ジャスタ107は最初に初期ピッチ予測値を以下のよう
にセットすることによってスペクトル探索を行なう。
th、=2p、 (7)ここで、po
はピッチ検出器109によって決定される基本周波数で
あり、th、は理論二次高調波である。thユによって
決定されるスペクトル内のこのポイントの回りの探索は
以下によって定義される周波数の領域f内である。
はピッチ検出器109によって決定される基本周波数で
あり、th、は理論二次高調波である。thユによって
決定されるスペクトル内のこのポイントの回りの探索は
以下によって定義される周波数の領域f内である。
この領域内でピッチ アジャスタ107は理論高調波周
波数の両側のスペクトルの傾きを計算し、次1ここの領
域を傾きが増加する方向に探索領域内に第1のスペクト
ル ピークが発見されるまで探索する。次に、このピー
クが発生する周波数Pkxを使用してそのフレームに対
するピッチ予測値が調節される。この時点で、新たなピ
ッチ予測値p□は以下のようになる。
波数の両側のスペクトルの傾きを計算し、次1ここの領
域を傾きが増加する方向に探索領域内に第1のスペクト
ル ピークが発見されるまで探索する。次に、このピー
クが発生する周波数Pkxを使用してそのフレームに対
するピッチ予測値が調節される。この時点で、新たなピ
ッチ予測値p□は以下のようになる。
次に、この新たな予測値p1を使用して三次高調波の理
論周波数th、=37=+zが計算される。この探索手
順が個々の理論高調波周波数thH<3600hz
に対して反復される。
論周波数th、=37=+zが計算される。この探索手
順が個々の理論高調波周波数thH<3600hz
に対して反復される。
3600hz以上の周波数では、ロー パスフィルタリ
ングがスペクトルの詳細を不鮮明にする。この探索手順
によって探索領域内にスペクトル ピークが発見されな
い場合は、調節は行なわれず、この探索が前に調節され
たピーク値を使用して次のピークに対して継続される0
個々のピークはpk、と命名される。ここで、iはi次
高調波、つまり、高調波番号を表わす、 i次のピッチ
予測値p;に対する式は以下によって定義される。
ングがスペクトルの詳細を不鮮明にする。この探索手順
によって探索領域内にスペクトル ピークが発見されな
い場合は、調節は行なわれず、この探索が前に調節され
たピーク値を使用して次のピークに対して継続される0
個々のピークはpk、と命名される。ここで、iはi次
高調波、つまり、高調波番号を表わす、 i次のピッチ
予測値p;に対する式は以下によって定義される。
i次のピッチ予測値に対する探索領域は以下によって定
義される。
義される。
(1” 1/2)P−工fふ(i+3八)pal>Oピ
ッチアジャスタ107がピッチ予測値を決定すると、こ
れは後にシンセサイザ200に伝送されるために経路1
33を介してパラメータ符号器113に、及び高調波ロ
ケータ106に送られる。高調波ロケータは式(6)に
よって定義されるスペクトルに応答してスペクトル内の
高調波ピークを以下によって定義されるレンジのスペク
トル内を探索するための開始ポイントとして最終的に調
節されたピッチ値pFを利用して正確に決定する。
ッチアジャスタ107がピッチ予測値を決定すると、こ
れは後にシンセサイザ200に伝送されるために経路1
33を介してパラメータ符号器113に、及び高調波ロ
ケータ106に送られる。高調波ロケータは式(6)に
よって定義されるスペクトルに応答してスペクトル内の
高調波ピークを以下によって定義されるレンジのスペク
トル内を探索するための開始ポイントとして最終的に調
節されたピッチ値pFを利用して正確に決定する。
(i+1八)p<f丘(i+3八)p t 1 < x
< hここで、hは現在のフレーム内の高調波周波数
の数を表わす。こうして発見される個々のピークはpk
iと命名され、ここで、iは i次高調波、つまり高調
波番号を表わす。高調波カルキュレータ108はpk1
値に応答して理論高調波周波数tS、からの高調波オフ
セットを計算する。このオフセットは hOlと命名さ
れ以下によって定義される。
< hここで、hは現在のフレーム内の高調波周波数
の数を表わす。こうして発見される個々のピークはpk
iと命名され、ここで、iは i次高調波、つまり高調
波番号を表わす。高調波カルキュレータ108はpk1
値に応答して理論高調波周波数tS、からの高調波オフ
セットを計算する。このオフセットは hOlと命名さ
れ以下によって定義される。
ここで、fr は計算されたスペクトルSのサイズに起
因する連続のスペクトルデータポイント間の周波数を表
わす。高調波カルキュレータ108は1次にこのオフセ
ットを経路137を介して後にシンセサイザ200に伝
送するためにパラメータ符号器113に送る。
因する連続のスペクトルデータポイント間の周波数を表
わす。高調波カルキュレータ108は1次にこのオフセ
ットを経路137を介して後にシンセサイザ200に伝
送するためにパラメータ符号器113に送る。
第2図に示されるシンセサイザ200はチャネル139
を介して受信される声帯モデルパラメータ及び励振情報
あるいはシヌソイダル情報に応答して第1図のアナライ
ザ100によって符号化された元のアナログ音声に近い
複製を生成する。シンセサイザ200は以下のように機
能する。フレームが発声フレームである場合は、ブロッ
ク 212,213゜及び2U、4が、式(1)に従っ
て元の音声信号を再生するためのシヌソイダル合成を遂
行し、この再生された音声情報が次にセレクタ206を
介してデジタル/アナログ コンバータ208に転送さ
れ、これによって受信されたデジタル情報がアナログ信
号に変換される。
を介して受信される声帯モデルパラメータ及び励振情報
あるいはシヌソイダル情報に応答して第1図のアナライ
ザ100によって符号化された元のアナログ音声に近い
複製を生成する。シンセサイザ200は以下のように機
能する。フレームが発声フレームである場合は、ブロッ
ク 212,213゜及び2U、4が、式(1)に従っ
て元の音声信号を再生するためのシヌソイダル合成を遂
行し、この再生された音声情報が次にセレクタ206を
介してデジタル/アナログ コンバータ208に転送さ
れ、これによって受信されたデジタル情報がアナログ信
号に変換される。
第3図に示される発声情報パケットを受信すると、チャ
ネル検出器201はピッチ及び高調波周波数オフセット
情報をそれぞれ経路221及び222を介して高調波周
波数カルキュレータ212に、音声フレーム エネルギ
ーe0、及びLPG係数をそれぞれ経路220 及び2
16を介して高調波振幅カルキュレータ213に、 そ
して発声/非発声(voiced/unvoiced、
V/U)信号を高調波周波数カルキュレータ212及
びセレクタ206に送る。′1”に等しいV/U信号は
そのフレームが発声フレームであることを示す。高調波
周波数カルキュレータ212はV/U信号が11111
であるのに応答してそれぞれ経路221及び222を介
して受信される調節されたピッチ及び高調波周波数オフ
セット情報に従って高調波周波数を計算する。高調波周
波数カルキュレータ212は次に高調波周波数情報をブ
ロック213及び214に送る。
ネル検出器201はピッチ及び高調波周波数オフセット
情報をそれぞれ経路221及び222を介して高調波周
波数カルキュレータ212に、音声フレーム エネルギ
ーe0、及びLPG係数をそれぞれ経路220 及び2
16を介して高調波振幅カルキュレータ213に、 そ
して発声/非発声(voiced/unvoiced、
V/U)信号を高調波周波数カルキュレータ212及
びセレクタ206に送る。′1”に等しいV/U信号は
そのフレームが発声フレームであることを示す。高調波
周波数カルキュレータ212はV/U信号が11111
であるのに応答してそれぞれ経路221及び222を介
して受信される調節されたピッチ及び高調波周波数オフ
セット情報に従って高調波周波数を計算する。高調波周
波数カルキュレータ212は次に高調波周波数情報をブ
ロック213及び214に送る。
高調波振幅カルキュレータ213はカルキュレータ21
2からの高調波周波数情報、経路220を介して受信さ
れるフレーム エネルギー情報、及び経路216を介し
て受信されるLPG係数に応答して高調波周波数の振幅
を計算する。シヌソイダル発生器214は経路223を
介してカルキュレータ212から受信される周波数情報
に応答して高調波位相情報を決定し、次にこの位相情報
及び経路224を介してカルキュレータ213から受信
される振幅情報を利用して式(1)によって示される計
算を遂行する。
2からの高調波周波数情報、経路220を介して受信さ
れるフレーム エネルギー情報、及び経路216を介し
て受信されるLPG係数に応答して高調波周波数の振幅
を計算する。シヌソイダル発生器214は経路223を
介してカルキュレータ212から受信される周波数情報
に応答して高調波位相情報を決定し、次にこの位相情報
及び経路224を介してカルキュレータ213から受信
される振幅情報を利用して式(1)によって示される計
算を遂行する。
チャネル復号器201が第4図に示されるようなノイズ
励振パケットを受信すると、チャネル復号器201は経
路227を介してセレクタ205にホワイト クイズ発
生器203の出力を選択させる1つの信号を送り、経路
215を介してセレクタ206に合成フィルタ207の
出力を選択させる1つの信号を送る。これに加え、チャ
ネル復号器201は経路211を介して利得をホワイト
ノイズ発生器203に送る。合成フィルタ207は経
路216を介してチャネル復号器201から受信される
LPG係数及びセレクタ205を介して受信されるホワ
イト ノイズ発生器203の出力に応答して音声のデジ
タル サンプルを生成する。
励振パケットを受信すると、チャネル復号器201は経
路227を介してセレクタ205にホワイト クイズ発
生器203の出力を選択させる1つの信号を送り、経路
215を介してセレクタ206に合成フィルタ207の
出力を選択させる1つの信号を送る。これに加え、チャ
ネル復号器201は経路211を介して利得をホワイト
ノイズ発生器203に送る。合成フィルタ207は経
路216を介してチャネル復号器201から受信される
LPG係数及びセレクタ205を介して受信されるホワ
イト ノイズ発生器203の出力に応答して音声のデジ
タル サンプルを生成する。
チャネル復号器201がチャネル139から第5図に示
されるようなパルス励振パケットを受信した場合は、復
号器201はパルスの位置及び最大パルスの振幅に対す
るパルスの相対振幅を経路210を介してパルス発生器
204に送る。これに加え、チャネル復号器201は経
路227を介してセレクタ205をパルス発生器204
の出力を選択するように条件付けし、この出力を合成フ
ィルタ207に送る。合成フィルタ207及びデジタル
/アナログ コンバータ208は、 次に経路215を
介して復号器201にて条件付けされたセレクタ206
を通じて音声を再生する。
されるようなパルス励振パケットを受信した場合は、復
号器201はパルスの位置及び最大パルスの振幅に対す
るパルスの相対振幅を経路210を介してパルス発生器
204に送る。これに加え、チャネル復号器201は経
路227を介してセレクタ205をパルス発生器204
の出力を選択するように条件付けし、この出力を合成フ
ィルタ207に送る。合成フィルタ207及びデジタル
/アナログ コンバータ208は、 次に経路215を
介して復号器201にて条件付けされたセレクタ206
を通じて音声を再生する。
コンバータ208はコンバータの出力の所に内蔵ローパ
ス フィルタを持つ。
ス フィルタを持つ。
次にブロック212,213.及び214の発声フレー
ムのシヌソイダル合成を遂行する動作を詳細に説明する
。高調波周波数カルキュレータ212は、経路221を
介して受信される調節されたピッチP六に応答して経路
222を介して受信される高調波オフセットを利用して
高調波周波数を決定する。理論高調波周波数ts、が高
調波の次数にこの調節されたピッチを掛けたものとして
定義される。
ムのシヌソイダル合成を遂行する動作を詳細に説明する
。高調波周波数カルキュレータ212は、経路221を
介して受信される調節されたピッチP六に応答して経路
222を介して受信される高調波オフセットを利用して
高調波周波数を決定する。理論高調波周波数ts、が高
調波の次数にこの調節されたピッチを掛けたものとして
定義される。
個々の高調波周波数hf、は適当な高調波オフセットに
て補正された後に1つのスペクトル ポイント上にくる
ように調節される。以下の式は個々の高調波に対する1
次高調波周波数を定義する。
て補正された後に1つのスペクトル ポイント上にくる
ように調節される。以下の式は個々の高調波に対する1
次高調波周波数を定義する。
hf;=ts;+ho;fr、1 < i < h
(14)ここで、frはスペクトル周波数分解能を表
わす。
(14)ここで、frはスペクトル周波数分解能を表
わす。
式(14)は個々の高調波周波数に対して1つの値を生
成する。この値は合成されている音声フレームのセンタ
に対応するものと仮定される。あるフレーム内の個々の
音声サンプルに対する残りのパー サンプル周波数(p
er−sample frequency)は隣接する
発声フレームの周波数間、あるいは隣接する非発声フレ
ームに対する事前に定められた境界条件から線形補間に
よって得られる。この補間はシヌソイダル発生器214
内で遂行され、後のバラグラフで詳細に説明される。
成する。この値は合成されている音声フレームのセンタ
に対応するものと仮定される。あるフレーム内の個々の
音声サンプルに対する残りのパー サンプル周波数(p
er−sample frequency)は隣接する
発声フレームの周波数間、あるいは隣接する非発声フレ
ームに対する事前に定められた境界条件から線形補間に
よって得られる。この補間はシヌソイダル発生器214
内で遂行され、後のバラグラフで詳細に説明される。
高調波振幅カルキュレータ213はカルキユニレータ2
12によって計算される周波数、経路216を介して受
信される LPG係数、及び経路220を介して受信さ
れるフレームエネルギーに応答して基本周波数及び高調
波周波数の振幅を計算する。個々の発声フレームに対す
るLPG反射係数は、個々のフレームの間の声帯を表わ
す音響管モデルを定義する。この情報から相対高調波振
幅が計算できる。しかし、LPG係数は声帯の構造をモ
デル化するものであるため、これは個々のこれら高調波
周波数の所のエネルギーの量に関する十分な情報は含ま
ない。このエネルギーの量に関する情報は、経路220
を介して受信されるフレーム エネルギーを使用して決
定される。個々のフレームに対し、カルキュレータ21
3は高調波振幅を計算するが、これは高調波周波数の計
算と同様に、この振幅がフレームの中心に位置するもの
と仮定する。
12によって計算される周波数、経路216を介して受
信される LPG係数、及び経路220を介して受信さ
れるフレームエネルギーに応答して基本周波数及び高調
波周波数の振幅を計算する。個々の発声フレームに対す
るLPG反射係数は、個々のフレームの間の声帯を表わ
す音響管モデルを定義する。この情報から相対高調波振
幅が計算できる。しかし、LPG係数は声帯の構造をモ
デル化するものであるため、これは個々のこれら高調波
周波数の所のエネルギーの量に関する十分な情報は含ま
ない。このエネルギーの量に関する情報は、経路220
を介して受信されるフレーム エネルギーを使用して決
定される。個々のフレームに対し、カルキュレータ21
3は高調波振幅を計算するが、これは高調波周波数の計
算と同様に、この振幅がフレームの中心に位置するもの
と仮定する。
フレームを通じての残りの振幅が隣接する発声フレーム
からの振幅情報あるいは隣接する非発声フレームに対す
るあらかじめ定められた境界条件を使用して線形補間に
よって決定される。
からの振幅情報あるいは隣接する非発声フレームに対す
るあらかじめ定められた境界条件を使用して線形補間に
よって決定される。
これら振幅は声帯が1つのオール ボールフィルタ モ
デルを使用して記述できるということを認識することに
より決定できる。
デルを使用して記述できるということを認識することに
より決定できる。
G (z ) = −(15)
A(z)
ここで、
であり、また、定義上、係数80=1である。
オール ボール フィルタを記述するのに必要な係数a
、(1’ m < 10)は、経路216を介して受信
される反射係数からマーケル。
、(1’ m < 10)は、経路216を介して受信
される反射係数からマーケル。
J 、 D、 (Markel、J、D、)及びグレ
イ、Jr。
イ、Jr。
A、H,(Gray、Jr、 A、H,)による著@
[音声の線形予測(L 1near P redic
tionOf 5peech)コ、スプリンガ バーラ
ッグ(S pringer B eriag) −ニュ
ーヨーク、ニューヨーク、1976年に説明の反復セッ
トアツプ手順を使用して得ることができる。式(15)
及び(16)によって記述されるフィルタが以下の方法
に従って個々のフレームに対する高調波成分の規模を計
算するのに使用される。計算されるべき高調波振幅をh
a。
[音声の線形予測(L 1near P redic
tionOf 5peech)コ、スプリンガ バーラ
ッグ(S pringer B eriag) −ニュ
ーヨーク、ニューヨーク、1976年に説明の反復セッ
トアツプ手順を使用して得ることができる。式(15)
及び(16)によって記述されるフィルタが以下の方法
に従って個々のフレームに対する高調波成分の規模を計
算するのに使用される。計算されるべき高調波振幅をh
a。
(0<i<h)と命名するものとする。ここでhは現在
のフレーム内の高調波の最大番号を表わす。アンスケー
ルド(unsealed)高調波寄与値he;(Q<i
<h)は個々の高調波周波数hfHに対して以下によっ
て得られる。
のフレーム内の高調波の最大番号を表わす。アンスケー
ルド(unsealed)高調波寄与値he;(Q<i
<h)は個々の高調波周波数hfHに対して以下によっ
て得られる。
ここで、Srはサンプリング速度を表わす。
全ての高調波に対する総アンスケールドエネルギーは以
下によって与えられる。
下によって与えられる。
160ポイントのフレーム サイズに対してと仮定する
と、を次のアンスケールド高調波振幅ha1は以下によ
って計算できる。
と、を次のアンスケールド高調波振幅ha1は以下によ
って計算できる。
ここで、eoは式(2)によって定義されアナライザ1
00によって計算された伝送された音声フレーム エネ
ルギーである。
00によって計算された伝送された音声フレーム エネ
ルギーである。
次に、シヌソイダル発生器214がカルキュレータ21
2及び213がら受信される情報を使用して如何に式(
1)によって定義される計算を遂行するか説明する。あ
る任意のフレームに対して、カル・キュレータ212及
び213は発生器214にそのフレーム内の個々の高調
波に対する1つの周波数及び振幅を提供する。発生器2
14はこの周波数情報を位相情報に変換し、周波数及び
振幅の両方についてフレームを通じての個々のサンプル
ポイントに対する周波数及び振幅を得るために線形補間
を遂行する。
2及び213がら受信される情報を使用して如何に式(
1)によって定義される計算を遂行するか説明する。あ
る任意のフレームに対して、カル・キュレータ212及
び213は発生器214にそのフレーム内の個々の高調
波に対する1つの周波数及び振幅を提供する。発生器2
14はこの周波数情報を位相情報に変換し、周波数及び
振幅の両方についてフレームを通じての個々のサンプル
ポイントに対する周波数及び振幅を得るために線形補間
を遂行する。
この線形補間は以下の方法によって遂行される。第6図
は5個の音声フレームと0次高調波とみなすこともでき
る基本周波数に対して遂行される線形補間を図解する。
は5個の音声フレームと0次高調波とみなすこともでき
る基本周波数に対して遂行される線形補間を図解する。
他の高調波周波数も類似の表現を持つ。おおざっばに、
ある発声フレームに対して3つの境界条件が存在する。
ある発声フレームに対して3つの境界条件が存在する。
第1に、ある発声フレームは1つの先行非発声フレーム
及び1つの後続発声フレームを持つことができ、第2の
ケースでは、発声フレームは他の発声フレームによって
包囲され、そして第3のケースにおいては発声フレーム
は1つの先行発声フレーム及び1つの後続非発声フレー
ムを持つ。第6図に示さ九るように、フレームC,ポイ
ント601から603は第1の状態を代表し;周波数h
f?は601によって定義されるこのフレームの開始点
まで一定であると見做される。スーパスクリプトは、こ
のフレームがCフレームである事実を示す。Cフレーム
の後のポイント603から605によって定義されるフ
レームbは第2のケースを表わし;ポイント602から
604の間でそれぞれポイント602及び604の所に
起こる周波数hfz及びhf’7を使用して線形補間が
遂行される。第3のケースはポインh 605から60
7に延びるフレームaによって代表され、フレームaに
続くフレームはポイント607から608によって定義
される非発声フレームである。このケースでは、hf周
波数はポイント607まで一定である。
及び1つの後続発声フレームを持つことができ、第2の
ケースでは、発声フレームは他の発声フレームによって
包囲され、そして第3のケースにおいては発声フレーム
は1つの先行発声フレーム及び1つの後続非発声フレー
ムを持つ。第6図に示さ九るように、フレームC,ポイ
ント601から603は第1の状態を代表し;周波数h
f?は601によって定義されるこのフレームの開始点
まで一定であると見做される。スーパスクリプトは、こ
のフレームがCフレームである事実を示す。Cフレーム
の後のポイント603から605によって定義されるフ
レームbは第2のケースを表わし;ポイント602から
604の間でそれぞれポイント602及び604の所に
起こる周波数hfz及びhf’7を使用して線形補間が
遂行される。第3のケースはポインh 605から60
7に延びるフレームaによって代表され、フレームaに
続くフレームはポイント607から608によって定義
される非発声フレームである。このケースでは、hf周
波数はポイント607まで一定である。
第7図は振幅の補間を示す。連続の発声フレーム、例え
ば、ポイント702から704゜及びポイント704か
ら706によって定義されるフレームに対しては、これ
ら振幅の補間はこれら周波数に対して遂行される補間と
同一である。しかし、前のフレームが非発声である場合
1例えばフレーム700から701のフレーム701か
ら703に対する関係においては、フレームの開始の所
の高調波はポイント701の所に示されるように0振幅
を持つものと仮定される。同様に、発声フレームに非発
声フレームが続く場合、例えば、705から707まで
のフレームa の後に707から708の非発声フレー
ムが来るような場合は、高調波は終端ポイント、例えば
、707の所でOの振幅を持つものと仮定され、線形補
間が遂行される。
ば、ポイント702から704゜及びポイント704か
ら706によって定義されるフレームに対しては、これ
ら振幅の補間はこれら周波数に対して遂行される補間と
同一である。しかし、前のフレームが非発声である場合
1例えばフレーム700から701のフレーム701か
ら703に対する関係においては、フレームの開始の所
の高調波はポイント701の所に示されるように0振幅
を持つものと仮定される。同様に、発声フレームに非発
声フレームが続く場合、例えば、705から707まで
のフレームa の後に707から708の非発声フレー
ムが来るような場合は、高調波は終端ポイント、例えば
、707の所でOの振幅を持つものと仮定され、線形補
間が遂行される。
発生器214は上に説明の補間を以下の式を使用して遂
行する。n番目のパー サンプル位相は以下によって定
義される。
行する。n番目のパー サンプル位相は以下によって定
義される。
ここで、o、I、1はi次高調波のパー サンプル位相
であり、srは出力サンプル速度である。これら位相を
解くためにはパー サンプル周波数W1,1を知ること
のみが必要とされ、これらパー サンプル周波数は補間
によって発見される。隣接する発声フレームを持つ発声
フレーム、例えば、第6図のフレームbに対する周波数
の線形補間は以下によって定義される。
であり、srは出力サンプル速度である。これら位相を
解くためにはパー サンプル周波数W1,1を知ること
のみが必要とされ、これらパー サンプル周波数は補間
によって発見される。隣接する発声フレームを持つ発声
フレーム、例えば、第6図のフレームbに対する周波数
の線形補間は以下によって定義される。
go < n < 159. O< i< h、in
(21)及び ここで、h、11はどちらかの隣接フレーム内の高調波
の最低数を表わす。非発声フレームから発声フレームへ
の遷移、例えば、フレームCは以下の式によってパー
サンプル高調波周波数を決定することによって扱われる
。
(21)及び ここで、h、11はどちらかの隣接フレーム内の高調波
の最低数を表わす。非発声フレームから発声フレームへ
の遷移、例えば、フレームCは以下の式によってパー
サンプル高調波周波数を決定することによって扱われる
。
V/’:、 、 =h f?、 oふn < 79
(23)発声フレームから非発声フレームへの遷移
、例えば、フレームaは以下の式によってパーサンプル
高調波周波数を決定することによって扱われる。
(23)発声フレームから非発声フレームへの遷移
、例えば、フレームaは以下の式によってパーサンプル
高調波周波数を決定することによって扱われる。
W二、 + =hf7. 80 < n巡159
(24)h、l、が2つの隣接するフレームのいずれか
内の高調波の最低数を表わすものとすると、フレームb
がフレームCより多くの高調波を持つようなケースにお
いては、K styより大きな高調波に対するパー サ
ンプル高調波周波数を計算するために式(23)が使用
される。フレームbがフレームaより多くの高調波を持
つときは、式(24)を使用して)1wi、。
(24)h、l、が2つの隣接するフレームのいずれか
内の高調波の最低数を表わすものとすると、フレームb
がフレームCより多くの高調波を持つようなケースにお
いては、K styより大きな高調波に対するパー サ
ンプル高調波周波数を計算するために式(23)が使用
される。フレームbがフレームaより多くの高調波を持
つときは、式(24)を使用して)1wi、。
より大きな高調波に対するパー サンプル高調波周波数
が計算される。
が計算される。
バーサンプル高調波周波数A、、1はhadから類似の
方法で決定でき、発声フレームbに対して以下によって
定義できる。
方法で決定でき、発声フレームbに対して以下によって
定義できる。
80 < n < 159. O< i < Kwin
(25)及び 0 < n < 79. O< i < h、1.
(26)そのフレームが発声領域の開始であるとき、
例えば、開始の所のフレームCのようなときは、パー
サンプル高調波振幅は以下によって決定される。
(25)及び 0 < n < 79. O< i < h、1.
(26)そのフレームが発声領域の開始であるとき、
例えば、開始の所のフレームCのようなときは、パー
サンプル高調波振幅は以下によって決定される。
A:、、=o、 o至i至h (27)及
び 0υ 1 < n < 79. O< i < h
(28)ここで、hはフレームC内の高調波の数を表わ
す。 フレームが発声領域の終端の所である、例えば、
フレームaのようなときは、バーサンプル振幅は以下に
よって決定される。
び 0υ 1 < n < 79. O< i < h
(28)ここで、hはフレームC内の高調波の数を表わ
す。 フレームが発声領域の終端の所である、例えば、
フレームaのようなときは、バーサンプル振幅は以下に
よって決定される。
80 < n < 159. O< i < h
(29)ここで、hはフレームC内の高調波の数を
表わす、フレーム、例えば、フレームbが先行発声フレ
ーム、例えば、フレームCより多くの高調波を持つ場合
は+ h、:Mより大きな高調波に対する高調波振幅を
計算するために式(27)及び(28)が使用される。
(29)ここで、hはフレームC内の高調波の数を
表わす、フレーム、例えば、フレームbが先行発声フレ
ーム、例えば、フレームCより多くの高調波を持つ場合
は+ h、:Mより大きな高調波に対する高調波振幅を
計算するために式(27)及び(28)が使用される。
フレームbがフレームaより多くの高調波を持つ場合は
、式(29)を使用してh 、iv+より大きな高調波
に対する高調波振幅が計算される。
、式(29)を使用してh 、iv+より大きな高調波
に対する高調波振幅が計算される。
エネルギー カルキュレータ103は第8図のプロセッ
サ803によって第9図のブロック901から904を
実行することによって実現される。ブロック901は、
好ましくは、サンプルの数をフレーム轟たり160にセ
ットする。ブロック902及び903は次に個々のデジ
タル サンプルの二乗S&の総和を生成する。総和が生
成されたら、ブロック904において、この総和の平方
根がとられるが、これによって元の音声フレーム エネ
ルギーe0が得られる。次にこのフレームエネルギーが
パラメータ符号器113及びブロック1001に伝送さ
れる。
サ803によって第9図のブロック901から904を
実行することによって実現される。ブロック901は、
好ましくは、サンプルの数をフレーム轟たり160にセ
ットする。ブロック902及び903は次に個々のデジ
タル サンプルの二乗S&の総和を生成する。総和が生
成されたら、ブロック904において、この総和の平方
根がとられるが、これによって元の音声フレーム エネ
ルギーe0が得られる。次にこのフレームエネルギーが
パラメータ符号器113及びブロック1001に伝送さ
れる。
第1図のハミング ウィンドウ ブロック104はプロ
セッサ803によって第9図のブロック1001及び1
002を実行することによって実現される。゛ブロック
1001及び1002は周知のハミング ウインドウニ
ング動作を遂行する。
セッサ803によって第9図のブロック1001及び1
002を実行することによって実現される。゛ブロック
1001及び1002は周知のハミング ウインドウニ
ング動作を遂行する。
FFTスペクトル規模ブロック105 は、第9図及
び第10図のブロック1003から1023を実行する
ことによって実現される。
び第10図のブロック1003から1023を実行する
ことによって実現される。
プロz’71003から1005は式(4)によって定
義されるパディング動作を遂行する。
義されるパディング動作を遂行する。
このパディング動作は虚数及び実数部分の両方に対して
、好ましくは1024個のデータポイントを含むアレイ
内のポイントCの実数部分R6、及び虚数部分I0にゼ
ロを挿入する。
、好ましくは1024個のデータポイントを含むアレイ
内のポイントCの実数部分R6、及び虚数部分I0にゼ
ロを挿入する。
ブロック1006から1013は当分野において周知の
データ整合動作を遂行する。この動作は通常、これがデ
ータ ポイントの順番をFFT分析の結果が正しい周波
数領域の順に生成されることを保証するように再配列す
るためビット反転動作と呼ばれる。
データ整合動作を遂行する。この動作は通常、これがデ
ータ ポイントの順番をFFT分析の結果が正しい周波
数領域の順に生成されることを保証するように再配列す
るためビット反転動作と呼ばれる。
第9図及び第10図のブロック1014から1o21は
式(5)によって定義される離散フーリエ変換を計算す
るための速いフーリエ変換の実現を図解する。ブロック
1o14から1021によって速いフーリエ分析を遂行
した後、ブロック1022及び1023によって式(6
)によって定義される結果としてのスペクトル規模デー
タを提供するのに必要な二乗及び平方根動作が遂行され
る。
式(5)によって定義される離散フーリエ変換を計算す
るための速いフーリエ変換の実現を図解する。ブロック
1o14から1021によって速いフーリエ分析を遂行
した後、ブロック1022及び1023によって式(6
)によって定義される結果としてのスペクトル規模デー
タを提供するのに必要な二乗及び平方根動作が遂行され
る。
ピッチ アジャスタ107は第10図、第11図、及び
第12図のブロック1101から1132によって実現
される。第10図のブロック1101はピッチ調節動作
の遂行に必要とされるさまざまな変数を初期化する。
第12図のブロック1101から1132によって実現
される。第10図のブロック1101はピッチ調節動作
の遂行に必要とされるさまざまな変数を初期化する。
ブロック1102はピッチの調節のために遂行されるべ
き反復の回数を個々の高調波ピークを探索することによ
って決定する。例外として、理論周波数thが最大許容
周波数mxf゛を越える場合は、ブロック1102によ
って制御される″フォー ループ(for 1oop)
”が判定ブロック1104によって終端される。
き反復の回数を個々の高調波ピークを探索することによ
って決定する。例外として、理論周波数thが最大許容
周波数mxf゛を越える場合は、ブロック1102によ
って制御される″フォー ループ(for 1oop)
”が判定ブロック1104によって終端される。
理論周波数が個々の反復に対して、ブロック1103に
よってセットされる。式(10)はピッチを調節するの
に使用される手順を決定し、式(11)は個々のピーク
に対する探索領域を決定する。ブロック1108は探索
の開始において最初のデータ ポイントを決定するスペ
クトル規模データS、のインデックスmを決定するのに
使用される。ブロック1108はまたこのデータ ポイ
ントの回りの上側スロープus及び下側スロープQsと
呼ばれるスロープを計算する。この上側及び下側スロー
プは指定のデータ ポイントの回りのスロープ規模デー
タのスロープに対する5つの異なる状態の1つを決定す
るのに使用される。これら5つの状態とは、スペクトル
のローカル ピーク、正のスロープ、負のスロープ、ロ
ーカル最小、あるいは平坦部分である。これら状態が第
10図及び第11図のブロック1111,1114,1
109、及び111oにおいてテストされる。スロープ
がブロック1110及び1109によって曲線の最小あ
るいは平坦部分であると検出されると、調節済みピッチ
周波数P1を決定された最後のピッチ値に等しくセット
するブロック1107が実行され、第11図のブロック
1107が実行される。曲線の最小あるいは平坦部分が
検出されない場合は、判定ブロック1111が実行され
る。判定ブロック1111によってピークが検出された
場合は、ブロック1112によってピークの所のデータ
サンプルの周波数が決定される。
よってセットされる。式(10)はピッチを調節するの
に使用される手順を決定し、式(11)は個々のピーク
に対する探索領域を決定する。ブロック1108は探索
の開始において最初のデータ ポイントを決定するスペ
クトル規模データS、のインデックスmを決定するのに
使用される。ブロック1108はまたこのデータ ポイ
ントの回りの上側スロープus及び下側スロープQsと
呼ばれるスロープを計算する。この上側及び下側スロー
プは指定のデータ ポイントの回りのスロープ規模デー
タのスロープに対する5つの異なる状態の1つを決定す
るのに使用される。これら5つの状態とは、スペクトル
のローカル ピーク、正のスロープ、負のスロープ、ロ
ーカル最小、あるいは平坦部分である。これら状態が第
10図及び第11図のブロック1111,1114,1
109、及び111oにおいてテストされる。スロープ
がブロック1110及び1109によって曲線の最小あ
るいは平坦部分であると検出されると、調節済みピッチ
周波数P1を決定された最後のピッチ値に等しくセット
するブロック1107が実行され、第11図のブロック
1107が実行される。曲線の最小あるいは平坦部分が
検出されない場合は、判定ブロック1111が実行され
る。判定ブロック1111によってピークが検出された
場合は、ブロック1112によってピークの所のデータ
サンプルの周波数が決定される。
指定のポイントの回りのスペクトル規模データのスロー
プがピーク、正のスロープ、あるいは負のスロープであ
ると検出された場合は、ブロック1128から1132
によってピッチが調節される。この調節は式(10)に
従って遂行される。ブロック1128はピーク発見標1
tll(peak 1ocated flag)をセッ
トし、それぞれ式(10)の分子及び分母を表わす変数
nm及びdnをセットする。ブロック1129から11
32は次に式(−〇)の計算を遂行する。判定ブロック
1130はこの特定の高調波し二対してピークが検出さ
れたか否か決定する。ピークが検出されない場合は、ル
ープが単に継続され、ブロック1131によって定義さ
れる計算は遂行されない。全てのピークが処理されると
、ブロック1132が実行され、現在検出されたピーク
に対して調節されたピッチを表わす調節されたピッチが
生成される。
プがピーク、正のスロープ、あるいは負のスロープであ
ると検出された場合は、ブロック1128から1132
によってピッチが調節される。この調節は式(10)に
従って遂行される。ブロック1128はピーク発見標1
tll(peak 1ocated flag)をセッ
トし、それぞれ式(10)の分子及び分母を表わす変数
nm及びdnをセットする。ブロック1129から11
32は次に式(−〇)の計算を遂行する。判定ブロック
1130はこの特定の高調波し二対してピークが検出さ
れたか否か決定する。ピークが検出されない場合は、ル
ープが単に継続され、ブロック1131によって定義さ
れる計算は遂行されない。全てのピークが処理されると
、ブロック1132が実行され、現在検出されたピーク
に対して調節されたピッチを表わす調節されたピッチが
生成される。
スペクトル データ ポイントのスロープが正あるいは
負であると検出されたときは。
負であると検出されたときは。
第11図のブロック1113から1127が実行される
。最初、ブロック1113が初期サンプル ポイントに
対する周波数psfを計算し、これがブロック1119
及び1123゜及びブロック1122及び1124によ
って探索が式(11)によって定義されるポイントを越
えて進まないことを保証するために使用される。スロー
プが正であるか負であるかの決定が判定ブロック111
4によって行なわれる。スペクトル データ ポイント
が負のスロープ上にある場合は、ブロック1115から
1125が実行される。二わらブロックの目的はスロー
プ データ ポイントをピークが発見されるまであるい
はブロック1119及び1123によって定義される探
索領域の終端が越えられるまで探索することにある。
。最初、ブロック1113が初期サンプル ポイントに
対する周波数psfを計算し、これがブロック1119
及び1123゜及びブロック1122及び1124によ
って探索が式(11)によって定義されるポイントを越
えて進まないことを保証するために使用される。スロー
プが正であるか負であるかの決定が判定ブロック111
4によって行なわれる。スペクトル データ ポイント
が負のスロープ上にある場合は、ブロック1115から
1125が実行される。二わらブロックの目的はスロー
プ データ ポイントをピークが発見されるまであるい
はブロック1119及び1123によって定義される探
索領域の終端が越えられるまで探索することにある。
判定ブロック1125はこの探索領域内にピークが発見
されたか否かを決定するためtこ使用される。ブロック
1114によって正のスロープが検出された場合は、ブ
ロック1116から1126が実行され、負のスロープ
の場合に対してブロック1115から1125によって
遂行されたのと類似の機能が遂行される。ブロック11
13から1126の実行の後、ブロック1127から1
132が上と同様の方法で実行される。スペクトル内に
存在する全てのピークがテストされたら、最終ピッチ値
が第12図のブロック1106によって式(10)に従
って累積調節ピッチ値と等しくセットされる。
されたか否かを決定するためtこ使用される。ブロック
1114によって正のスロープが検出された場合は、ブ
ロック1116から1126が実行され、負のスロープ
の場合に対してブロック1115から1125によって
遂行されたのと類似の機能が遂行される。ブロック11
13から1126の実行の後、ブロック1127から1
132が上と同様の方法で実行される。スペクトル内に
存在する全てのピークがテストされたら、最終ピッチ値
が第12図のブロック1106によって式(10)に従
って累積調節ピッチ値と等しくセットされる。
高調波ロケータ106は第12図及び第13図のブロッ
ク1201から1222によって実現される。ブロック
1201は高調波周波数を発見するのに必要な初期状態
をセットアンプする。ブロン′)1.202はブロック
1203から1222の実行を変数harmによって指
定される全てのピークが検出されるように制御する。個
々の高調波に対して、ブロック1203は理論高調波ス
ペクトルデータポイント、上側スロープ、及び下側スロ
ープを決定するのに使用すべきインデックスを決定する
。判定ブロック1204から1206によってそれぞれ
スロープが最小、平坦領域あるいはピークであると決定
された場合は、ブロック1222が実行され、高調波オ
フセットがゼロにセットされる。スロープが正あるいは
負である場合は、ブロック12o7から1221が実行
される。ブロック1207から1220は前に説明のブ
ロック1113から1126の動作によって遂行される
のと類似の機能を遂行する。ブロック1208から12
20の実行が終了すると、高調波オフセットhoqがブ
ロック1221によってインデックス番号rにセットさ
れる。
ク1201から1222によって実現される。ブロック
1201は高調波周波数を発見するのに必要な初期状態
をセットアンプする。ブロン′)1.202はブロック
1203から1222の実行を変数harmによって指
定される全てのピークが検出されるように制御する。個
々の高調波に対して、ブロック1203は理論高調波ス
ペクトルデータポイント、上側スロープ、及び下側スロ
ープを決定するのに使用すべきインデックスを決定する
。判定ブロック1204から1206によってそれぞれ
スロープが最小、平坦領域あるいはピークであると決定
された場合は、ブロック1222が実行され、高調波オ
フセットがゼロにセットされる。スロープが正あるいは
負である場合は、ブロック12o7から1221が実行
される。ブロック1207から1220は前に説明のブ
ロック1113から1126の動作によって遂行される
のと類似の機能を遂行する。ブロック1208から12
20の実行が終了すると、高調波オフセットhoqがブ
ロック1221によってインデックス番号rにセットさ
れる。
第14図から第19図はプロセッサ803によって第2
図のシンセサイザ200を実現するために実行されるス
テップの詳細を示す。
図のシンセサイザ200を実現するために実行されるス
テップの詳細を示す。
第2図の高調波周波数カルキュレータ212は第14図
のブロック1301,1302、及び1303によって
実現される。ブロック1301はこの動作で使用される
べきパラメータを初期化する。i番目のフレームの基本
周波数h f 5が伝送されたピッチP、に等しくセッ
トされる。この初期値を使用して、ブロック1303は
最初ピッチに周波数番号を掛けることによってその高調
波の理論周波数を計算することによって個々の高調波周
波数を計算する。次に、 この周波数がスペクトルデー
タ ポイント上にくるように理論高調波のインデックス
が得ら九、このインデックスが伝送された高調波オフセ
ットho、に加えられる。スペクトル データ ポイン
ト インデックスが決定されたら、このインデックスに
周波数分解能frを掛けることによってi番目の高調波
周波数hf:が決定される。
のブロック1301,1302、及び1303によって
実現される。ブロック1301はこの動作で使用される
べきパラメータを初期化する。i番目のフレームの基本
周波数h f 5が伝送されたピッチP、に等しくセッ
トされる。この初期値を使用して、ブロック1303は
最初ピッチに周波数番号を掛けることによってその高調
波の理論周波数を計算することによって個々の高調波周
波数を計算する。次に、 この周波数がスペクトルデー
タ ポイント上にくるように理論高調波のインデックス
が得ら九、このインデックスが伝送された高調波オフセ
ットho、に加えられる。スペクトル データ ポイン
ト インデックスが決定されたら、このインデックスに
周波数分解能frを掛けることによってi番目の高調波
周波数hf:が決定される。
この手順がブロック1302によって全ての高調波が計
算されるまで反復される。
算されるまで反復される。
高調波振幅カルキュレータ213は、第8図のプロセッ
サ803によって第14図及び第15図のブロック14
01から1417を実行することによって実現される。
サ803によって第14図及び第15図のブロック14
01から1417を実行することによって実現される。
ブロック1401から1407はLPG反射係数を式(
16)によって与えられる声帯のオール ポール フィ
ルタ記述のために使用される係数に変換するためのセッ
トアツプ手順を遂行する。ブロック1408から141
2は式(17)によって定義される個々の高調波に対す
るアンスケールド高調波エネルギーを計算する。
16)によって与えられる声帯のオール ポール フィ
ルタ記述のために使用される係数に変換するためのセッ
トアツプ手順を遂行する。ブロック1408から141
2は式(17)によって定義される個々の高調波に対す
るアンスケールド高調波エネルギーを計算する。
ブロック1413から1415は式(18)によって定
義される総アンスケールド エネルギーEを計算するの
に使用される。ブロック1416から1417は式(2
0)によって定義されるi番目のフレームのスケールド
高調波振幅 haを計算するのに使用される。
義される総アンスケールド エネルギーEを計算するの
に使用される。ブロック1416から1417は式(2
0)によって定義されるi番目のフレームのスケールド
高調波振幅 haを計算するのに使用される。
第15図から第18図のブロック1501から1521
及びブロック16o1がら1614は、プロセッサ80
3によって第6図及び第7図に示されるように個々の高
調波に対して周波数及び振幅の補間を行なうために遂行
される動作を図解する。これら動作は、 フレームの第
1の部分がブロック1s01 がら1521によって処
理され、フレームの第2の部分がブロック1601がら
1614によって処理されることにより遂行される。第
6図に示されるように、フレームCの最初の半分はポイ
ント601から602まで延び、フレームCの後の半分
はポイント602 から603まで延びる。これらブ
ロックによって遂行される動作は、最初に先行フレーム
が発声フレームであるか非発゛声であるが決定すること
である。
及びブロック16o1がら1614は、プロセッサ80
3によって第6図及び第7図に示されるように個々の高
調波に対して周波数及び振幅の補間を行なうために遂行
される動作を図解する。これら動作は、 フレームの第
1の部分がブロック1s01 がら1521によって処
理され、フレームの第2の部分がブロック1601がら
1614によって処理されることにより遂行される。第
6図に示されるように、フレームCの最初の半分はポイ
ント601から602まで延び、フレームCの後の半分
はポイント602 から603まで延びる。これらブ
ロックによって遂行される動作は、最初に先行フレーム
が発声フレームであるか非発゛声であるが決定すること
である。
より具体的には、第15図のブロック15o1において
初期値がセットされる。判定ブロック1502は先行フ
レームが発声フレームであったか非発声フレー11であ
ったが判定する。
初期値がセットされる。判定ブロック1502は先行フ
レームが発声フレームであったか非発声フレー11であ
ったが判定する。
先行フレームが非発声の場合は、判定ブロック1504
から1510が実行される。第17図のブロック150
4及び1507はフレームの開始の所で個々の高調波に
対する高調波周波数及び高調波振幅に対する最初のデー
タポイントを位相に対してhfJそして振幅に対してa
2.。=0に初期化する。これは第6図及び第7図の図
解に対応する。フレームの最初のデータ ポイントに対
する初期値がセット アップされたら、先行非発声フレ
ームに対する残りの値がブロック1508 から15o
1の実行によってセットされる。高調波周波数の場合は
、周波数が第6図に示されるように中心周波数に等しく
セットされる。
から1510が実行される。第17図のブロック150
4及び1507はフレームの開始の所で個々の高調波に
対する高調波周波数及び高調波振幅に対する最初のデー
タポイントを位相に対してhfJそして振幅に対してa
2.。=0に初期化する。これは第6図及び第7図の図
解に対応する。フレームの最初のデータ ポイントに対
する初期値がセット アップされたら、先行非発声フレ
ームに対する残りの値がブロック1508 から15o
1の実行によってセットされる。高調波周波数の場合は
、周波数が第6図に示されるように中心周波数に等しく
セットされる。
高調波振幅の場合は、個々のデータ ポイントが、第7
図のフレームCに対するように、フレームの開始の所の
ゼロから開始し中点振幅に至るまでの線形近似にセット
される。
図のフレームCに対するように、フレームの開始の所の
ゼロから開始し中点振幅に至るまでの線形近似にセット
される。
ブロック1502によって先行フレームが発声フレーム
であると判定された場合は、第16図の判定ブロック1
5o3が実行される。
であると判定された場合は、第16図の判定ブロック1
5o3が実行される。
判定ブロック15o3は先行フレームが現存のフレーム
と比較して高調波を多く持つか少なく持つか決定する。
と比較して高調波を多く持つか少なく持つか決定する。
高調波の数は変数shによって示される。どちらのフレ
ームが多くの高調波を持つかによってブロック1505
が実行されるかあるいはブロック1506が実行される
かが決定される。変数り1.1がどちらかのフレームの
高調波の最小番号に等しくセットされる。ブロック15
05あるいは1506が実行された後、ブロック151
1及び1512が実行される。ブロック1511及び1
512は先行フレームの最後のポイントを計算すること
によって現在のフレームの周波数及び振幅の両方に対す
る初期ポイントを決定する。この動作が全ての高調波に
対して遂行された後、ブロック1513から1515に
よってそれぞれ式(22)及び式(26)によって定義
されるように全ての高調波に対して周波数及び振幅の両
方に対する個々のパー サンプル値が計算される。
ームが多くの高調波を持つかによってブロック1505
が実行されるかあるいはブロック1506が実行される
かが決定される。変数り1.1がどちらかのフレームの
高調波の最小番号に等しくセットされる。ブロック15
05あるいは1506が実行された後、ブロック151
1及び1512が実行される。ブロック1511及び1
512は先行フレームの最後のポイントを計算すること
によって現在のフレームの周波数及び振幅の両方に対す
る初期ポイントを決定する。この動作が全ての高調波に
対して遂行された後、ブロック1513から1515に
よってそれぞれ式(22)及び式(26)によって定義
されるように全ての高調波に対して周波数及び振幅の両
方に対する個々のパー サンプル値が計算される。
変数h w i□によって定義される全ての高調波に対
してパー サンプル周波数及び振幅が計算されたら、ブ
ロック1516から1521が現在のフレームが先行フ
レームより多くの高調波を持つ可能性がある事実を考慮
するために計算される。現在のフレームが先行フレーム
より多くの高調波を持つ場合は、判定ブロック1516
は制御をブロック1517に渡す、、現在のフレーム内
に先行フレームより多くの高調波が存在する場合は、ブ
ロック1517から’、521が実行されるが、これら
の動作は前述のブロック1504から1510と同一で
あ5゜ プレー・ムの後半についての個々の高調波に対する周波
数及び振幅に対するパー サンプル ボrントの計算が
ブニ:ッグ1601から1614によって示される7ブ
ロツク1601によって次のフレームが発h゛であるか
非発声であるか判定される。pl)フレームが非発声で
ある場合は、ブロック1630から1607が実行され
る。ブロック15o4及び1507によって遂行される
初期ポイントを決定する必要はないことに注意する。
これは最初のポイントは1周波数及び振幅の両方とも中
点とされるためである。ブロックl 603 カら16
07は、ブロック1508から1510によって遂行さ
れる機能と類似の機能を遂行する。次のフレームが発声
フレームである場合は、判定ブロック1602及びブロ
ック1604あるいは1605が実行される。これらブ
ロックの実行は前述のブロック1,503゜1505、
及び1506に対して説明の実行と類似する。ブロック
1608から1611の動作は前述のブロック゛151
3から1516の動作と類似する。ブロック1621
から1614の動作は前述のブロック13L9から15
21の動作と類似する。
してパー サンプル周波数及び振幅が計算されたら、ブ
ロック1516から1521が現在のフレームが先行フ
レームより多くの高調波を持つ可能性がある事実を考慮
するために計算される。現在のフレームが先行フレーム
より多くの高調波を持つ場合は、判定ブロック1516
は制御をブロック1517に渡す、、現在のフレーム内
に先行フレームより多くの高調波が存在する場合は、ブ
ロック1517から’、521が実行されるが、これら
の動作は前述のブロック1504から1510と同一で
あ5゜ プレー・ムの後半についての個々の高調波に対する周波
数及び振幅に対するパー サンプル ボrントの計算が
ブニ:ッグ1601から1614によって示される7ブ
ロツク1601によって次のフレームが発h゛であるか
非発声であるか判定される。pl)フレームが非発声で
ある場合は、ブロック1630から1607が実行され
る。ブロック15o4及び1507によって遂行される
初期ポイントを決定する必要はないことに注意する。
これは最初のポイントは1周波数及び振幅の両方とも中
点とされるためである。ブロックl 603 カら16
07は、ブロック1508から1510によって遂行さ
れる機能と類似の機能を遂行する。次のフレームが発声
フレームである場合は、判定ブロック1602及びブロ
ック1604あるいは1605が実行される。これらブ
ロックの実行は前述のブロック1,503゜1505、
及び1506に対して説明の実行と類似する。ブロック
1608から1611の動作は前述のブロック゛151
3から1516の動作と類似する。ブロック1621
から1614の動作は前述のブロック13L9から15
21の動作と類似する。
発生器214によって遂行される最後の動作は、個々の
高調波に対して前述のようLこし。
高調波に対して前述のようLこし。
て計算されたパー サンプル周波数及び振幅を使用して
の音声の実際のシヌソイダル再生である・ 第19図の
ブロック1701 から1707は前に計算された周波
数情報を使用して周波数から高調波の位相を計算し、次
に式(1)によって定義される計算を遂行する。
の音声の実際のシヌソイダル再生である・ 第19図の
ブロック1701 から1707は前に計算された周波
数情報を使用して周波数から高調波の位相を計算し、次
に式(1)によって定義される計算を遂行する。
ブロック1702及び1703はフレームの開始に対す
る初期音声サンプルを決定する。
る初期音声サンプルを決定する。
この初期ポイントが決定されたら、ブロック1704か
ら1707によってそのフレームに対する残りの音声サ
ンプルが計算される。
ら1707によってそのフレームに対する残りの音声サ
ンプルが計算される。
これらブロックからの出力が次にデジタル/アナログ
コンバータ208に伝送される。
コンバータ208に伝送される。
第1図はブロック図にて本発明による音声アナライザを
示す図; 第2図はブロック図にて本発明による音声シンセサイザ
を示す図; 第3図は発声領域の間に音声を複製するための情報を含
むパケットを示す図; 第4図は非発声領域の間にノイズ励振を使用して音声を
複製するための情報を含むパケットを示す図: 第5図は非発声領域の間にパルス励振を使用して音声を
複製するための情報を含むパケットを示す図; 第6図はグラフにて第2図のシンセサイザによって基本
及び高調波周波数に対して遂行される補間を示す図; 第7図はグラフにて第2図のシンセサイザによって基本
及び高調波周波数の振幅に対して遂行される補間を示す
図; 第8図は第1図及び第2図のデジタル信号プロセッサ実
現を示す図; 第9図から第13図は流れ図にて第1図のアナライザ回
路の実現を可能とするために第8図のデジタル信号プロ
セッサを制御するためのプログラムを示す図;そして 第14図から第19図は流れ図にて第2図のシンセサイ
ザの実現を可能とするために第8図のデジタル信号プロ
セッサの実行を制御するためのプログラムを示す図であ
る。 [主要部分の符号の説明] 102・・・・・・・・・・・・・・・・・・フレーム
セグメント103・・・・・・・・・・・・エネルギー
カルキュレータ104・・・・・・・・・・・・・・・
・・・ハミングウィンドウ105・・・・・・・・FF
T スペクトル規模ブロック106・・・・・・・・・
・・・・・・・・・・・・・・高調波ロケータ107・
・・・・・・・・・・・・・・・・・・・ピッチアジャ
スタ108・・・・・・・・・・・・・・・・・高調波
カルキュレータ109・・・・・・・・・・・・・・・
・・・・・・・・・・ピッチ検出器111・・・・・・
・・・・・・・・・・LPCカルキュレータ113・・
・・・・・・・・・・・・・・・・・・・パラメータ符
号器lfl翌款 FIG、6 ヒHj、 / FIG、9 FIG、 /2 F/θ、/6 Flこ17
示す図; 第2図はブロック図にて本発明による音声シンセサイザ
を示す図; 第3図は発声領域の間に音声を複製するための情報を含
むパケットを示す図; 第4図は非発声領域の間にノイズ励振を使用して音声を
複製するための情報を含むパケットを示す図: 第5図は非発声領域の間にパルス励振を使用して音声を
複製するための情報を含むパケットを示す図; 第6図はグラフにて第2図のシンセサイザによって基本
及び高調波周波数に対して遂行される補間を示す図; 第7図はグラフにて第2図のシンセサイザによって基本
及び高調波周波数の振幅に対して遂行される補間を示す
図; 第8図は第1図及び第2図のデジタル信号プロセッサ実
現を示す図; 第9図から第13図は流れ図にて第1図のアナライザ回
路の実現を可能とするために第8図のデジタル信号プロ
セッサを制御するためのプログラムを示す図;そして 第14図から第19図は流れ図にて第2図のシンセサイ
ザの実現を可能とするために第8図のデジタル信号プロ
セッサの実行を制御するためのプログラムを示す図であ
る。 [主要部分の符号の説明] 102・・・・・・・・・・・・・・・・・・フレーム
セグメント103・・・・・・・・・・・・エネルギー
カルキュレータ104・・・・・・・・・・・・・・・
・・・ハミングウィンドウ105・・・・・・・・FF
T スペクトル規模ブロック106・・・・・・・・・
・・・・・・・・・・・・・・高調波ロケータ107・
・・・・・・・・・・・・・・・・・・・ピッチアジャ
スタ108・・・・・・・・・・・・・・・・・高調波
カルキュレータ109・・・・・・・・・・・・・・・
・・・・・・・・・・ピッチ検出器111・・・・・・
・・・・・・・・・・LPCカルキュレータ113・・
・・・・・・・・・・・・・・・・・・・パラメータ符
号器lfl翌款 FIG、6 ヒHj、 / FIG、9 FIG、 /2 F/θ、/6 Flこ17
Claims (1)
- 【特許請求の範囲】 1、人の音声を符号化するための処理シ ステムにおいて、該システムが: 音声を個々が所定の数の均一な間隔の音声 の瞬時振幅のサンプルを持つ複数の音声フレームにセグ
メント化するためのセグメンタ (例えば、102); 個々のフレームに対する声帯を定義するセ ットの音声パラメータ信号を計算するためのカルキュレ
ータ(例えば、111); 該音声サンプルのフレーム当たりのフレー ムエネルギーを計算するためのエネルギー カルキュレータ(例えば、103); 個々のフレームの該音声サンプルのスペク トル分析を遂行することによって個々のフレームに対す
るスペクトルを生成するためのアナライザ(例えば、1
04、105)を含み、該システムがさらに 個々のフレームに対する基本周波数信号を 個々のフレームに対応するスペクトルから検出するため
のピッチ検出器(例えば、109、107); 個々のフレームに対する高調波周波数信号 を個々のフレームに対するスペクトルから検出するため
の高調波ロケータ(例えば、106);個々のフレーム
に対して個々の該高調波周 波数信号と該基本周波数信号の整数倍数との間の差を表
わすオフセット信号を決定するための高調波カルキュレ
ータ(例えば、108)及び; 後の音声合成のために該フレームエネル ギー、該セットの音声パラメータ、該基本周波数及び該
オフセット信号の符号化表現を伝送するための送信機(
例えば、113、114)を含むことを特徴とするシス
テム。 2、特許請求の範囲第1項に記載のシス テムにおいて、該検出器が 検出された基本周波数信号を高調波周波数 信号が調節された基本周波数信号の整数倍数の回りに均
一に分布するように、該基本及び高調波周波数信号を表
わす該スペクトル内のピークの分析によって調節するた
めのピッチアジャスタ(例えば、107)を含むことを
特徴とするシステム。 3、特許請求の範囲第2項に記載のシス テムにおいて、該高調波ロケータが 該スペクトルを該調節された基本周波数信 号の倍数を個々の該高調波周波数信号に対する開始ポイ
ントとして使用し、該高調波周波数信号を決定するため
に探索するための手段(例えば、1201−1222)
を含むことを特徴とするシステム。 4、個々が所定の数の均一な間隔の音声 の瞬時振幅サンプルを持つ複数のフレームにセグメント
化された音声を合成するための方法において、個々の該
フレームがフレーム エネルギー、セットの音声パラメータ、音 声の基本周波数信号、及び基本周波数信号から派生され
た理論高調波周波数と実際の高調波周波数との間の差を
表わすオフセット信号によって符号化され、該方法が 該複数のフレームの1つのフレームの該オ フセット信号及び基本周波数信号に応答して該複数のフ
レームの個々のフレームの個々の高調波周波数に対する
高調波位相信号を計算するステップ; 該複数のフレームの該1つのフレームの該 フレームエネルギー及び該セットの音声パ ラメータに応答して該高調波位相信号の振幅を決定する
ステップ(例えば、213);及び 該複数のフレームの該1つのフレームに対 する該高調波位相信号及び該決定された振幅に応答して
複製音声を生成するステップを含むことを特徴とする方
法。 5、特許請求の範囲第4項に記載の方法 において、該決定ステップが 該複数のフレームの該1つのフレームに対 する該セットの音声パラメータを使用して個々の該高調
波位相信号のアンスケールドエ ネルギーを計算するステップ; 該複数のフレームの該1つのフレームに対 する全ての該高調波位相信号に対する該アンスケールド
エネルギーを総和するステップ;及び 個々の該高調波位相信号の該高調波エネル ギー、該総和アンスケールドエネルギー及 び該複数のフレームの該1つのフレームに対する該フレ
ームエネルギーに応答して該高 調波位相信号の高調波振幅を計算するステップを含むこ
とを特徴とする方法。 6、特許請求の範囲第4項に記載の方法 において、個々の該高調波位相信号が複数のサンプルを
含み、該アンスケールドエネル ギーを計算するステップが: 該個々のオフセット信号を該基本周波数信 号の整数倍数に加えることによって個々の該高調波位相
信号に対する高調波周波数信号を得るステップ;及び 該複数のフレームの該1つのフレームに対 する高調波周波数信号及び個々の該高調波位相信号に対
する該複数のフレームの該1つのフレームの前後のフレ
ームに対する対応する高調波周波数信号に応答して、該
複数のフレームの該前後のフレームが発声フレームであ
るとき、補間を遂行し、該複数のフレームの該1つのフ
レームの該個々の高調波位相信号に対して該複数の高調
波サンプルを得るステップを含むことを特徴とする方法
。 7、特許請求の範囲第6項に記載の方法 において、該補間ステップが線形補間を遂行することを
特徴とする方法。 8、特許請求の範囲第7項に記載の方法 において、該個々の該高調波位相信号に対する該複数の
フレームの該1つのフレームに対する該高調波周波数信
号が該複数のフレームの該1つのフレームの中心に位置
することを特徴とする方法。 9、特許請求の範囲第5項に記載の方法 において、該高調波位相信号の個々の該振幅が複数の振
幅サンプルを持ち、該計算ステップが該複数のフレーム
の該1つのフレームに対する計算された高調波振幅及び
個々の該高調波位相信号に対する該複数のフレームの該
1つのフレームの前後のフレームに対する計算された高
調波振幅サンプルに応答して、該複数のフレームの前後
のフレームが発声フレームであるとき、補間を遂行し、
該複数のフレームの該1つのフレームに対する個々の該
高調波位相信号に対する該複数の振幅サンプルを得るス
テップを含むことを特徴とする方法。 10、特許請求の範囲第9項に記載の方法 において、該補間ステップが線形補間を遂行することを
特徴とする方法。 11、特許請求の範囲第10項に記載の方 法において、個々の該高調波位相信号に対する該複数の
フレームの該1つのフレームに対する該計算された高調
波振幅が該フレームの複数の該1つのフレームの中心に
位置することを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US906523 | 1986-09-11 | ||
US06/906,523 US4797926A (en) | 1986-09-11 | 1986-09-11 | Digital speech vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6370900A true JPS6370900A (ja) | 1988-03-31 |
JPH0833754B2 JPH0833754B2 (ja) | 1996-03-29 |
Family
ID=25422593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62225440A Expired - Lifetime JPH0833754B2 (ja) | 1986-09-11 | 1987-09-10 | デジタル音声符号化および復号方法および装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US4797926A (ja) |
EP (1) | EP0260053B1 (ja) |
JP (1) | JPH0833754B2 (ja) |
KR (1) | KR960002388B1 (ja) |
AT (1) | ATE103728T1 (ja) |
AU (1) | AU580218B2 (ja) |
CA (1) | CA1307345C (ja) |
DE (1) | DE3789476T2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09181611A (ja) * | 1995-12-23 | 1997-07-11 | Nec Corp | 信号符号化装置及び方法 |
JP2002515609A (ja) * | 1998-05-11 | 2002-05-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ピッチ検出の精密化 |
JP2009255279A (ja) * | 2008-03-28 | 2009-11-05 | Hitachi Metals Ltd | シート材穿孔装置 |
JP2011101943A (ja) * | 2009-10-13 | 2011-05-26 | Hitachi Metal Precision:Kk | シート材穿孔装置 |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5202953A (en) * | 1987-04-08 | 1993-04-13 | Nec Corporation | Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching |
US4989250A (en) * | 1988-02-19 | 1991-01-29 | Sanyo Electric Co., Ltd. | Speech synthesizing apparatus and method |
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
US5179626A (en) * | 1988-04-08 | 1993-01-12 | At&T Bell Laboratories | Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US5359696A (en) * | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
US5091946A (en) * | 1988-12-23 | 1992-02-25 | Nec Corporation | Communication system capable of improving a speech quality by effectively calculating excitation multipulses |
JP2903533B2 (ja) * | 1989-03-22 | 1999-06-07 | 日本電気株式会社 | 音声符号化方式 |
JPH0782359B2 (ja) * | 1989-04-21 | 1995-09-06 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置及び音声符号化・復号化装置 |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
NL8902463A (nl) * | 1989-10-04 | 1991-05-01 | Philips Nv | Inrichting voor geluidsynthese. |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
JP2689739B2 (ja) * | 1990-03-01 | 1997-12-10 | 日本電気株式会社 | 秘話装置 |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
US5138661A (en) * | 1990-11-13 | 1992-08-11 | General Electric Company | Linear predictive codeword excited speech synthesizer |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5226084A (en) * | 1990-12-05 | 1993-07-06 | Digital Voice Systems, Inc. | Methods for speech quantization and error correction |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
US5450522A (en) * | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
US5189701A (en) * | 1991-10-25 | 1993-02-23 | Micom Communications Corp. | Voice coder/decoder and methods of coding/decoding |
US5351338A (en) * | 1992-07-06 | 1994-09-27 | Telefonaktiebolaget L M Ericsson | Time variable spectral analysis based on interpolation for speech coding |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
US5832436A (en) * | 1992-12-11 | 1998-11-03 | Industrial Technology Research Institute | System architecture and method for linear interpolation implementation |
US5448679A (en) * | 1992-12-30 | 1995-09-05 | International Business Machines Corporation | Method and system for speech data compression and regeneration |
US5479559A (en) * | 1993-05-28 | 1995-12-26 | Motorola, Inc. | Excitation synchronous time encoding vocoder and method |
CA2140779C (en) * | 1993-05-31 | 2005-09-20 | Kyoya Tsutsui | Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal |
RU2131169C1 (ru) * | 1993-06-30 | 1999-05-27 | Сони Корпорейшн | Устройство кодирования сигнала, устройство декодирования сигнала, носитель записи и способ кодирования и декодирования |
JP2906968B2 (ja) * | 1993-12-10 | 1999-06-21 | 日本電気株式会社 | マルチパルス符号化方法とその装置並びに分析器及び合成器 |
ES2224121T3 (es) * | 1994-04-01 | 2005-03-01 | Sony Corporation | Metodo y dispositivo para codificar y descodificar informacion. |
US5715365A (en) * | 1994-04-04 | 1998-02-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3528258B2 (ja) * | 1994-08-23 | 2004-05-17 | ソニー株式会社 | 符号化音声信号の復号化方法及び装置 |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
US5754974A (en) * | 1995-02-22 | 1998-05-19 | Digital Voice Systems, Inc | Spectral magnitude representation for multi-band excitation speech coders |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
JPH08254993A (ja) * | 1995-03-16 | 1996-10-01 | Toshiba Corp | 音声合成装置 |
US5717819A (en) * | 1995-04-28 | 1998-02-10 | Motorola, Inc. | Methods and apparatus for encoding/decoding speech signals at low bit rates |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
JP2861889B2 (ja) * | 1995-10-18 | 1999-02-24 | 日本電気株式会社 | 音声パケット伝送システム |
JP4005154B2 (ja) * | 1995-10-26 | 2007-11-07 | ソニー株式会社 | 音声復号化方法及び装置 |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
JP3687181B2 (ja) * | 1996-04-15 | 2005-08-24 | ソニー株式会社 | 有声音/無声音判定方法及び装置、並びに音声符号化方法 |
US5778337A (en) * | 1996-05-06 | 1998-07-07 | Advanced Micro Devices, Inc. | Dispersed impulse generator system and method for efficiently computing an excitation signal in a speech production model |
JPH10149199A (ja) * | 1996-11-19 | 1998-06-02 | Sony Corp | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
JP2001500284A (ja) * | 1997-07-11 | 2001-01-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 改良した調波音声符号器を備えた送信機 |
CN1145925C (zh) * | 1997-07-11 | 2004-04-14 | 皇家菲利浦电子有限公司 | 具有改进语音编码器和解码器的发射机 |
US6029133A (en) * | 1997-09-15 | 2000-02-22 | Tritech Microelectronics, Ltd. | Pitch synchronized sinusoidal synthesizer |
JP3502247B2 (ja) * | 1997-10-28 | 2004-03-02 | ヤマハ株式会社 | 音声変換装置 |
US6199037B1 (en) | 1997-12-04 | 2001-03-06 | Digital Voice Systems, Inc. | Joint quantization of speech subframe voicing metrics and fundamental frequencies |
WO1999059139A2 (en) * | 1998-05-11 | 1999-11-18 | Koninklijke Philips Electronics N.V. | Speech coding based on determining a noise contribution from a phase change |
US6230130B1 (en) | 1998-05-18 | 2001-05-08 | U.S. Philips Corporation | Scalable mixing for speech streaming |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
GB2357231B (en) * | 1999-10-01 | 2004-06-09 | Ibm | Method and system for encoding and decoding speech signals |
US6725190B1 (en) * | 1999-11-02 | 2004-04-20 | International Business Machines Corporation | Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope |
US6377916B1 (en) | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
US7212639B1 (en) * | 1999-12-30 | 2007-05-01 | The Charles Stark Draper Laboratory | Electro-larynx |
JP2007510524A (ja) * | 2003-11-12 | 2007-04-26 | ファセット・テクノロジーズ・エルエルシー | 穿刺装置及びマルチランセットカートリッジ |
EP1569200A1 (en) * | 2004-02-26 | 2005-08-31 | Sony International (Europe) GmbH | Identification of the presence of speech in digital audio data |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
KR100790110B1 (ko) * | 2006-03-18 | 2008-01-02 | 삼성전자주식회사 | 모폴로지 기반의 음성 신호 코덱 방법 및 장치 |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
CN102422531B (zh) * | 2009-06-29 | 2014-09-03 | 三菱电机株式会社 | 音频信号处理装置 |
CN101847404B (zh) * | 2010-03-18 | 2012-08-22 | 北京天籁传音数字技术有限公司 | 一种实现音频变调的方法和装置 |
JP6053196B2 (ja) * | 2012-05-23 | 2016-12-27 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
KR20150032390A (ko) * | 2013-09-16 | 2015-03-26 | 삼성전자주식회사 | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
EP3121814A1 (en) * | 2015-07-24 | 2017-01-25 | Sound object techology S.A. in organization | A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use |
CN106356055B (zh) * | 2016-09-09 | 2019-12-10 | 华南理工大学 | 基于正弦模型的可变频语音合成系统及方法 |
CN113938749B (zh) * | 2021-11-30 | 2023-05-05 | 北京百度网讯科技有限公司 | 音频数据处理方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5543554A (en) * | 1978-09-25 | 1980-03-27 | Nippon Musical Instruments Mfg | Electronic musical instrument |
JPS56119194A (en) * | 1980-02-23 | 1981-09-18 | Sony Corp | Sound source device for electronic music instrument |
JPS56125795A (en) * | 1980-03-05 | 1981-10-02 | Sony Corp | Sound source for electronic music instrument |
JPS6035792A (ja) * | 1983-07-25 | 1985-02-23 | 株式会社河合楽器製作所 | 非高調波上音を発生する装置 |
JPS6121000A (ja) * | 1984-07-10 | 1986-01-29 | 日本電気株式会社 | Csm型音声合成器 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4045616A (en) * | 1975-05-23 | 1977-08-30 | Time Data Corporation | Vocoder system |
US4419544A (en) * | 1982-04-26 | 1983-12-06 | Adelman Roger A | Signal processing apparatus |
SE428167B (sv) * | 1981-04-16 | 1983-06-06 | Mangold Stephan | Programmerbar signalbehandlingsanordning, huvudsakligen avsedd for personer med nedsatt horsel |
US4631746A (en) * | 1983-02-14 | 1986-12-23 | Wang Laboratories, Inc. | Compression and expansion of digitized voice signals |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
JP2759646B2 (ja) * | 1985-03-18 | 1998-05-28 | マサチユ−セツツ インステイテユ−ト オブ テクノロジ− | 音響波形の処理 |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
-
1986
- 1986-09-11 US US06/906,523 patent/US4797926A/en not_active Expired - Lifetime
-
1987
- 1987-08-27 CA CA000545552A patent/CA1307345C/en not_active Expired - Lifetime
- 1987-09-02 EP EP87307732A patent/EP0260053B1/en not_active Expired - Lifetime
- 1987-09-02 DE DE3789476T patent/DE3789476T2/de not_active Expired - Fee Related
- 1987-09-02 AT AT87307732T patent/ATE103728T1/de not_active IP Right Cessation
- 1987-09-09 KR KR1019870009956A patent/KR960002388B1/ko not_active IP Right Cessation
- 1987-09-10 AU AU78254/87A patent/AU580218B2/en not_active Ceased
- 1987-09-10 JP JP62225440A patent/JPH0833754B2/ja not_active Expired - Lifetime
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5543554A (en) * | 1978-09-25 | 1980-03-27 | Nippon Musical Instruments Mfg | Electronic musical instrument |
JPS56119194A (en) * | 1980-02-23 | 1981-09-18 | Sony Corp | Sound source device for electronic music instrument |
JPS56125795A (en) * | 1980-03-05 | 1981-10-02 | Sony Corp | Sound source for electronic music instrument |
JPS6035792A (ja) * | 1983-07-25 | 1985-02-23 | 株式会社河合楽器製作所 | 非高調波上音を発生する装置 |
JPS6121000A (ja) * | 1984-07-10 | 1986-01-29 | 日本電気株式会社 | Csm型音声合成器 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09181611A (ja) * | 1995-12-23 | 1997-07-11 | Nec Corp | 信号符号化装置及び方法 |
JP2002515609A (ja) * | 1998-05-11 | 2002-05-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ピッチ検出の精密化 |
JP2009255279A (ja) * | 2008-03-28 | 2009-11-05 | Hitachi Metals Ltd | シート材穿孔装置 |
JP2011101943A (ja) * | 2009-10-13 | 2011-05-26 | Hitachi Metal Precision:Kk | シート材穿孔装置 |
Also Published As
Publication number | Publication date |
---|---|
AU7825487A (en) | 1988-03-24 |
EP0260053B1 (en) | 1994-03-30 |
AU580218B2 (en) | 1989-01-05 |
JPH0833754B2 (ja) | 1996-03-29 |
KR880004426A (ko) | 1988-06-07 |
CA1307345C (en) | 1992-09-08 |
EP0260053A1 (en) | 1988-03-16 |
US4797926A (en) | 1989-01-10 |
ATE103728T1 (de) | 1994-04-15 |
DE3789476D1 (de) | 1994-05-05 |
DE3789476T2 (de) | 1994-09-15 |
KR960002388B1 (ko) | 1996-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6370900A (ja) | デジタル音声符号化および復号方法および装置 | |
KR960002387B1 (ko) | 음성 처리 시스템 및 음성 처리방법 | |
US5787387A (en) | Harmonic adaptive speech coding method and system | |
US5305421A (en) | Low bit rate speech coding system and compression | |
CA1337665C (en) | Computationally efficient sine wave synthesis for acoustic waveform processing | |
US8321208B2 (en) | Speech processing and speech synthesis using a linear combination of bases at peak frequencies for spectral envelope information | |
EP0337636B1 (en) | Harmonic speech coding arrangement | |
KR100388388B1 (ko) | 재생위상정보를사용하는음성합성방법및장치 | |
US8280724B2 (en) | Speech synthesis using complex spectral modeling | |
US6963833B1 (en) | Modifications in the multi-band excitation (MBE) model for generating high quality speech at low bit rates | |
US4776015A (en) | Speech analysis-synthesis apparatus and method | |
JPH02204800A (ja) | スピーチ処理と合成方法及びその装置 | |
US5953697A (en) | Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes | |
US5983173A (en) | Envelope-invariant speech coding based on sinusoidal analysis of LPC residuals and with pitch conversion of voiced speech | |
JP3687181B2 (ja) | 有声音/無声音判定方法及び装置、並びに音声符号化方法 | |
JPH0638199B2 (ja) | 音声認識装置 | |
US20050267739A1 (en) | Neuroevolution based artificial bandwidth expansion of telephone band speech | |
US4969193A (en) | Method and apparatus for generating a signal transformation and the use thereof in signal processing | |
JPH03119398A (ja) | 音声分析合成方法 | |
Roucos et al. | A segment vocoder algorithm for real-time implementation | |
US20020052737A1 (en) | Speech coding system and method using time-separated coding algorithm | |
JP3398968B2 (ja) | 音声分析合成方法 | |
EP0713208B1 (en) | Pitch lag estimation system | |
JP2001117597A (ja) | 音声変換装置、音声変換方法及び音声変換用辞書の生成方法 | |
JPH11219199A (ja) | 位相検出装置及び方法、並びに音声符号化装置及び方法 |