JPS6370900A

JPS6370900A - デジタル音声符号化および復号方法および装置

Info

Publication number: JPS6370900A
Application number: JP62225440A
Authority: JP
Inventors: エドワード　チャールズ　ブロンソン; ウォルター　ソーンレイ　ハートウェル; ウィレム　バスチアン　クレイジン; デミトリオス　パノス　プレザス
Original assignee: American Telephone and Telegraph Co Inc
Current assignee: AT&T Corp
Priority date: 1986-09-11
Filing date: 1987-09-10
Publication date: 1988-03-31
Anticipated expiration: 2011-03-29
Also published as: JPH0833754B2; CA1307345C; AU580218B2; ATE103728T1; KR960002388B1; KR880004426A; EP0260053B1; DE3789476T2; US4797926A; AU7825487A; DE3789476D1; EP0260053A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】溌」し１技ｍ−５ｕ一本発明は音声処理、より詳細には、音声の発声部分に対
してシヌソイダル　モデルを使用し、音声の非発声部分
に対して励振予測フィルタ　モデルを使用して音声の複
製を行なうためのデジタル音声符号化及び復号装置に関
する。

技術の背景音声メモリ及び音声レスポンス設備を含むデジタル音声
通信システムにおいては、しばしば記録及び／或いは伝
送に必要とされるビット速度を低減するために信号圧縮
が使用される。信号圧縮を行なうための１つの周知のデ
ジタル音声符号化スキームが、皇！工ｉ嵐及び信号処理
に関するＩＥＥＥ国　会議の会ｍｌａ　（Ｐｒｏｃｅｅ
ｄｉｎｇｓ　ｏｆ　Ｉ　Ｅ　Ｅ　Ｅ　　Ｉｎｔｅｒｎａ
−ｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ａｃｏ
ｕｓｔｉｃｓ、　５ｐｅｅｃｈ。

ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ）、　１
９８４年、Ｖｏｌ。

２、ページ２７．６．１−２７．６．４　（合衆国サン
　ジエゴ）に掲載の論文［シヌソイダル音声モデルを使
用しての規模のみの再生（Ｍａｇｎｉｔｕｄｅ−ｏ　ｎ
ｌｙ　Ｒｅｃｏｎｓｔｒｕｃｔｉｏｎ　Ｕｓｉｎｇａ　
　５ｉｎｕｓｏｉｄａｌ　５ｐｅｅｃｈ　Ｍｏｄｅｌ）
　］　　において開示されている。この論文はシヌソイ
ダル音声モデルの音声の発声及び非発声部分の両方への
使用を開示する。この音声波形は音声波形を正弦波の総
和としてモデル化することによってボコーダ−のシンセ
サイザ部分内で再生される。正弦波のこの総和は音声波
形の基本周波数及び高調波から成り、以下によって表わ
される。

５（ｎ）＝　Σ　ａ；（ｎ）　　ｓｉｎ　　［φ、（ｎ
）コ　　　　　　（１）項ａ；（ｎ）及びφ１（ｎ）は
それぞれ任意の時間内のポイントにおける音声波形のシ
ヌソイダル成分の時間とともに変動する振幅及び位相を
表わす。この音声処理機能はアナライザ部分内で振幅と
位相を決定し、これら値を式（１）を使用して音声波形
を再生するシンセサイザ部分に送られる。

マツフォーレイ（Ｍ　ｃ　Ａ　ｕ　ｌ　ａ　ｙ　）の論
文はまた振幅及び位相はフレームと呼ばれる一定の時間
期間に対して速いフーリエ（ｆａｓｔ　Ｆｏｕｒｉｅｒ
）スペクトル分析を遂行することによって決定できるこ
とを開示する。基本及び高調波周波数は速いフーリエ　
スペクトル内でピークとして現われ、基本及び高調波の
周波数及び振幅を決定するためのピーク　ピッキングを
遂行することによって決定される。

マツフォーレイ（ＭｃＡｕｌａｙ）の方法の１つの問題
は、基本周波数、全ての高調波周波数、及び全ての振幅
がアナライザからシンセサイザに伝送され、結果として
高いピッ１〜伝送速度となることである。もう１つの問
題は、周波数及び振幅が結果としてのスペクトル　ピー
クから直接に決定されることである。使用される速いフ
ーリエ交換はこれらピークを非常に正確に検出するが、
多量の計算が必要とされる。

この方法のもう１つの問題は、シヌソイダル波形符号化
技術を使用して音声の発声部分のみでなく、音声の非発
声部分もモデル化しようとする試みである０発声領域と
非発声領域の間の変動の結果、スペクトル分析からのス
ペクトル　エネルギーがこれら領域間の境界の所で離接
することとなり、スペクトル内で関連するピークを決定
することが困難となる。

発明の構成本発明は先行技術のこれら問題及び欠点を解決し、技術
的進歩をはかることを目的とする。本発明の方法論上及
び構造上の実施態様においては、個々の音声フレームに
対しフレーム　エネルギー、声帯を定義する音声パラメ
ータ、基本周波数、個々の高調波周波数と基本周波数の
整数倍との差を表わすオフセットをその後の音声合成の
ために符号化及び伝送するためのアナライザが含まれる
。さらにシンセサイザが提供されるが、これは伝送され
た情報に応答して基本周波数及び高調波の位相及び振幅
を計算し、この計算された情報を使用して複製音声を生
成する。この構成はアナライザからシンセサイザに振幅
情報を伝送する必要性を排除する。

１つの実施態様においては、アナライザは基本周波数、
つまり、ピッチ検出器によって決定されるピッチをスペ
クトル分析によって得られるピッチの高調波゛に関する
情報を使用して調節する。このピッチ調節はピッチ検出
器の動作に起因する初期ピッチ予測値の不正確さを正し
、また、これがサンプリング期間の整数倍数を使用して
計算されるという事実と関連する問題を正す。これに加
え、このピッチ調節はピッチをその幾つかの高調波を派
生するために適当に掛けられたときその値がスペクトル
分析から決定される高調波の実際の値の平均となるよう
に調節する。従って、このピッチ調節はアナライザから
シンセサイザに高調波を定義するオフセット情報を伝送
するために必要とされるビットの数を削減する。

ピッチがいったん調節されると、適当に掛けられた調節
されたピッチ値がスペクトル内の個々の高調波の位置を
再計算するための開始ポイントとして、また、こうして
実際に検出される高調波と調節されたピッチ値に所望の
高調波の番号を掛けることによって決定されるその高調
波の理論値との間のオフセットを決定するために使用さ
れる。

本発明のシンセサイザは音声の発声部分に対しては上に
説明のシヌソイダル　モデル化技術を使用し、音声の非
発声部分に対しては多重パルスあるいはノイズ励振のい
ずれかを使用して得られるこれら伝送された情報から音
声を再生する。

より詳細には、高調波の振幅はシンセサイザの所で元の
サンプル　ポイント及び線形予測符号化（ｌｉｎｅａｒ
　ｐｒｅｄｉｃｔｉｖｅ　ｃｏｄｉｎｇ、　Ｌ　ＰＣ）
係数から決定される総フレーム　エネルギーを使用して
決定される。これら高調波振幅は個々の高調波からＬＰ
Ｇ係数を使用してアンスケールド　エネルギー寄与を得
て、次に高調波の振幅を総エネルギーを演算動作におけ
るスケーリング　ファクターとして使用して派生するこ
とによって計算される。この技術では、アナライザはＬ
ＰＧ係数及び総エネルギーのみを伝送し、個々の高調波
の振幅を伝送することは要求されない。

シンセサイザはフレームの中心に起こる基本周波数及び
高調波に対する周波数に応答して音声フレームと音声フ
レームとの間を補間することによって個々のフレームを
通じての連続周波数を生成する。同様の方法で基本周波
数及び高調波に対する振幅が生成される。

発声フレームから非はっせいフレームあるいはこの逆方
向への遷移と関連する問題は以下のように処理される。

非発声フレー、ムから発声フレームへの遷移のときは、
基本周波数及び個々の高調波に対する周波数はそのフレ
ームの開始からそのフレームの真ん中まで一定であると
見做される１周波数は発声フレームから非発声フレーム
に遷移するときも同様に計算される０通常の補間を使用
してフレームの残りの部分に対する周波数が計算される
。基本周波数及び高調波の振幅は発声フレームの開始の
所でゼロからスタートするものと仮定され、そのフレー
ムの最初の半分に対する補間が行なわれる。発声フレー
ムから非発声フレームに遷移するときの振幅はこれと同
様に計算される。

これに加え、個々の発声フレームに対する高調波の数は
フレームによって異なる。このため、ある発声フレーム
内の高調波の数は隣接する発声フレーム内の高調波の数
より多かったり少なかったりする。この問題は隣接する
フレーム内に対応する高調波を持たない高調波の周波数
はそのフレームの真ん中から隣接するフレームの境界ま
で一定であり、　また、そのフレームの高調波の振幅は
そのフレームと隣接するフレームとの間の境界の所でゼ
ロであると仮定することによって解決される。この仮定
によって、補間を通常の方法で遂行することが可能とな
る。

さらに、発声フレームから非発声フレームへの遷移が発
生したときは、非発声ＬＰＧフィルタが前の発声フレー
ムからのＬＰＧ係数から初期化される。これは非発声フ
ィルタが非発声領域に対する音声をより正確に合成する
ことを可能とする。このため、発声フレームからのＬＰ
Ｇ係数は先行フレームに対する声帯をより正確にモデル
化する。

見匪夏尖凰孤第１図及び第２図は、それぞれ本発明の焦点である一例
としての音声アナライザ及び音声シンセサイザを示す、
第１図の音声シンセサイザ１００は経路１２０を介して
受信されるアナログ音声信号に応答してこれら信号をチ
ャネル１３９を介して第２図のシンセサイザ２００に伝
送するために低ビツト速度にて符号化する。チャネル１
３９は通信伝送路であることも、あるいは合成された音
声を要求する各種アプリケーションのために後の時点に
おいて音声合成を提供するためのメモリでもあり得る。

このアプリケーションの一例としてデジタル　コンピュ
ータのための音声出力があるゆアナライザ１００はアナ
ログ／デジタル　コンバータ１０１及びフレーム　セグ
メンタ１０２を使用してアナログ音声情報をデジタル化
及び量子化する。ＬＰＧカルキュレータ１１１は量子化
及びデジタル化されたこのサンプルに応答して人の声帯
をモデル化する線形予測符号化（１ｉｎｅａｒ　ｐｒｅ
ｄｉｃｔｉｖｅｃｏｄｉｎｇ　Ｌ　Ｐ　Ｃ）　　係数の
生成及び残留信号の生成を行なう。このＬＰＧ係数及び
残留信号の生成は本出願と同一の譲受人に譲渡された合
衆国特許第３，７４０，４７６号に開示される方法ある
いは当分野において周知の他の方法に従って遂行できる
。アナライザ１００は経路１２０を介して受信される音
声信号を以下の分析技術、つまり、シヌソイダル分析。

多重パルス分析、あるいはノイズ励振分析の１つを使用
して符号化する。最初に、フレーム　セグメント化ブロ
ック１０２が音声サンプルを好ましくは１６０個のサン
プルから成るフレームにグループ化する。ＬＰＧカルキ
ュレータ１１１は、個々のフレームに応答して残留信号
の計算を行ない、この信号を経路１２２を介してピッチ
検出器１０９に送る。

ピッチ検出器はこの残留信号及び音声サンプルに応答し
てそのフレームが発声フレームであるか非発声であるか
決定する。発声フレームとは通常ピッチと呼ばれる基本
周波数がそのフレーム内に検出されるフレームである。

ピッチ検出器１０９がそのフレームが発声フレームであ
ると決定すると、ブロック１０３から１０８がそのフレ
ームのシヌソイダル符号化を遂行する。しかし、フレー
ムが非発声であると決定された場合は、ノイズ／多重パ
ルス判定ブロック１１２においてＬＰＧカルキュレータ
　ブロック１１１によって計算されたＬＰＧ係数によっ
て定義されるフィルタを励振するためにノイズ励振を使
用すべきかあるいは多重パルス励振を使用すべきかが決
定される。ノイズ励振を使用すべきである場合は、この
事実がパラメータ符号化ブロック１１３及び送信機１１
４を介してシンセサイザ２００に伝送される。一方、多
重パルス励振を使用すべきであるときは、ブロック１１
０によってパルス　トレインの位置及び振幅が決定され
、この情報が経路１２８及び１２９を介して後に第２図
のシンセサイザ２００に伝送するためにパラメータ符号
化ブロック１１３に送られる。

アナライザ１００とシンセサイザ２００の間の通信チャ
ネルがパケットを使用して実現される場合は、第３図に
示されるようなパケットが発声フレームに対して伝送さ
れ、第４図に示されるようなパケットがホワイト　ノイ
ズ励振を使用する非発声フレームに対して伝送され、そ
して第５図に示されるようなパケットが多重パルス励振
を使用する非発声フレームに対して伝送される。

次に、アナライザ１００の動作を詳細に考察する。ピッ
チ検出器１０９が経路１３０を通じてそのフレームが非
発声であることを通知すると、ノイズ／多重パルス判定
ブロック１１２はこの信号に応答してノイズ励振を使用
すべきかあるいは多重パルス励振を使用すべきかを決定
する６多重パルス励振が使用されるときは、この事実を
通知する信号が多重パルス　アナライザ　ブロック１１
０に送信される。多重パルス　アナライザ１１０は経路
１２４上のこの信号及びピッチ検出器１０９から経路１
２５及び１２６を介して伝送されるセットのパルスに応
答する。多重パルスアナライザ１１０は選択されたパル
スの位置をこの選択されたパルスの振幅とともにパラメ
ータ符号器１１３に伝送する。パラメータ符号器１１３
は経路１２３を介してＬＰＧカルキュレータ１１１から
受信されるＬＰＧ係数に応答して第５図に示されるパケ
ットを形成する。

ノイズ／多重パルス判定ブロック１１２がノイズ励振を
使用すべきであることを決定すると、これはこの事実を
経路１２４を介して１つの信号をパラメータ符号器ブロ
ック１１３に送信することによって示す。符号器１１３
はこの信号に応答してブロック１１１からのＬＰＧ係数
及びブロック１１５によって残留信号から計算された利
得を使用して第４図に示されるパケットを生成する。

次に発声フレームの間のアナライザ１００の動作を詳細
に説明する。エネルギー　カルキュレータ１０３は、フ
レーム　セグメンタ１０２から受信されるフレームに対
するデジタル化された音声Ｓ１に応答して、好ましくは
１６０個のサンプルを持つフレーム内の音声の総エネル
ギーを以下の式によって計算する。

このエネルギー値はシンセサイザ２００によってＬＰＧ
係数とともに基本周波数及びその高調波の振幅を決定す
るのに使用される。

ハミング　ウィンドウ　ブロック１０４は経路１２１を
介して伝送される音声信号に応答して以下の式によって
与えられるウインドニング動作を遂行する。

ｓ’＝幅＝ｓ、（０，５４−０，４６ｃｃｓ（（：’ｃ
ｎ）／１５９））　　（３）０　＜　ｎ　＜　１５９このウインドニング動作の目的はフレームの終端点の所
の離接性（ｄｉｓｊｏｉｎｔｎｅｓｓ）を速いフーリエ
変換（ｆａｓｔ　Ｆｏｕｒｉｅｒ　ｔｒａｎｓｆｏｒｍ
、　Ｆ　ＦＴ）を計算するのに備えて除去する。ウイン
ドニング動作を遂行した後、ブロック１０５はブロック
１０４からの結果としてのサンプルにＯを挿入するが、
　これは、好ましくは、以下の式によって定義される１
０２４個のデータポイントの新たなシーケンスを与える
。

次に、ブロック１０５は速いフーリエ変換を遂行するが
、これは以下の式によって定義される不連続フーリエ変
換（ｄｉｓｃｒｅｔｅ　Ｆｏｕｒｉｅｒｔｒａｎｓｆｏ
ｒｍ）の速い実現である。

Ｆ’ＦＴ計算を遂行した後、ブロック１０５は、式（５
）に定義される計算を遂行して得られる個々の複素周波
数データ　ポイント（ｃｏｍｐｌｅｘ　ｆｒｅｑｕｅｎ
ｃｙ　ｄａｔａ　ｐｏｉｎｔ）の規模を計算することに
よってスペクトルＳを得るが、この動作は次式によって
定義される。

Ｓ　＝　にＥ　＝加７扉四πＷア　（６）０丘に丘５１
１ピッチ　アジャスタ１０７はピッチ検出器１０９によっ
て計算されたピッチ及びブロック１０５によって計算さ
れたスペクトルに応答してピッチ検出器１０９からの調
節された値よりもより正確なピッチの精製（ｒｅｆｉｎ
ｅ−ｍｅｎｔ）である予調ピッチを計算する。これに加
え、ピッチの整数倍数はこの回りを高調波周波数が比較
的等しく分布する値である。この調節は　３つの理由に
よって必要とされる。

第１の理由は、ブロック１０５によって計算されるスペ
クトルの第１のピークは基本周波数の位置を示すべきで
あるが、実際にはこの信号は通常声帯の影響及びアナロ
グ／デジタルコンバータ１０１内のローパス　フィルタ
の影響によってシフトされることである。

第２の理由は、ピッチ検出器の周波数分解能はアナログ
／デジタル　コンバータのサンプリング速度によって制
限され：従って、対応するピッチ期間が２つのサンプル
　ポイント間にくる場合は正確なピッチ周波数を定義す
ることができないことである。この正しいピッチを持た
ないことの影響がピッチ　アジャスタ１０７によって調
節される。これの最も大きな影響は高調波ロケータ１０
６及び高調波オフセット　カルキュレータ１０８によっ
て遂行される計算に与える影響である。高調波ロケータ
１０６はピッチアジャスタ１０７によって決定されたピ
ッチをさまざまな高調波の位置を決定するためにスペク
トル規模ブロック１０５によって生成されたスペクトル
を分析するための開始ポイントを生成するために利用す
る。

゛　　第３の理由は、高調波オフセット　カルキュレー
タ１０８がシンセサイザ２００に伝送されるオフセット
を決定するためにピッチ値から計算される理論高調波周
波数及びロケータ１０６によって決定される高調波周波
数を利用することである。ピッチ周波数が不正確である
と、これらオフセットの各々はシンセサイザ２００に伝
送するにはあまりにも多くのビットを必要とする大きな
数となる。ゼロ高調波オフセットの回りに高調波オフセ
ットを分散させることによってシンセサイザ２００にオ
フセットを伝送するのｔこ必要とされるビットの数を最
小数に保つ゛ことができる。

ピッチ　アジャスタ　ブロック１０７は以下のように機
能する。ＦＦＴスペクトル規模ブロック１０５によって
計算されるスペクトル内の基本周波数に対応するピーク
は上に述べた理由によって不明瞭であるため、ピンチア
ジャスタ１０７は最初に初期ピッチ予測値を以下のよう
にセットすることによってスペクトル探索を行なう。

ｔｈ、＝２ｐ、　　　　　　　　　（７）ここで、ｐｏ
はピッチ検出器１０９によって決定される基本周波数で
あり、ｔｈ、は理論二次高調波である。ｔｈユによって
決定されるスペクトル内のこのポイントの回りの探索は
以下によって定義される周波数の領域ｆ内である。

この領域内でピッチ　アジャスタ１０７は理論高調波周
波数の両側のスペクトルの傾きを計算し、次１ここの領
域を傾きが増加する方向に探索領域内に第１のスペクト
ル　ピークが発見されるまで探索する。次に、このピー
クが発生する周波数Ｐｋｘを使用してそのフレームに対
するピッチ予測値が調節される。この時点で、新たなピ
ッチ予測値ｐ□は以下のようになる。

次に、この新たな予測値ｐ１を使用して三次高調波の理
論周波数ｔｈ、＝３７＝＋ｚが計算される。この探索手
順が個々の理論高調波周波数ｔｈＨ＜３６００ｈｚ　　
に対して反復される。

３６００ｈｚ以上の周波数では、ロー　パスフィルタリ
ングがスペクトルの詳細を不鮮明にする。この探索手順
によって探索領域内にスペクトル　ピークが発見されな
い場合は、調節は行なわれず、この探索が前に調節され
たピーク値を使用して次のピークに対して継続される０
個々のピークはｐｋ、と命名される。ここで、ｉはｉ次
高調波、つまり、高調波番号を表わす、　ｉ次のピッチ
予測値ｐ；に対する式は以下によって定義される。

ｉ次のピッチ予測値に対する探索領域は以下によって定
義される。

（１”　１／２）Ｐ−工ｆふ（ｉ＋３八）ｐａｌ＞Ｏピ
ッチアジャスタ１０７がピッチ予測値を決定すると、こ
れは後にシンセサイザ２００に伝送されるために経路１
３３を介してパラメータ符号器１１３に、及び高調波ロ
ケータ１０６に送られる。高調波ロケータは式（６）に
よって定義されるスペクトルに応答してスペクトル内の
高調波ピークを以下によって定義されるレンジのスペク
トル内を探索するための開始ポイントとして最終的に調
節されたピッチ値ｐＦを利用して正確に決定する。

（ｉ＋１八）ｐ＜ｆ丘（ｉ＋３八）ｐ　ｔ　１　＜　ｘ
　＜　ｈここで、ｈは現在のフレーム内の高調波周波数
の数を表わす。こうして発見される個々のピークはｐｋ
ｉと命名され、ここで、ｉは　ｉ次高調波、つまり高調
波番号を表わす。高調波カルキュレータ１０８はｐｋ１
値に応答して理論高調波周波数ｔＳ、からの高調波オフ
セットを計算する。このオフセットは　ｈＯｌと命名さ
れ以下によって定義される。

ここで、ｆｒ　は計算されたスペクトルＳのサイズに起
因する連続のスペクトルデータポイント間の周波数を表
わす。高調波カルキュレータ１０８は１次にこのオフセ
ットを経路１３７を介して後にシンセサイザ２００に伝
送するためにパラメータ符号器１１３に送る。

第２図に示されるシンセサイザ２００はチャネル１３９
を介して受信される声帯モデルパラメータ及び励振情報
あるいはシヌソイダル情報に応答して第１図のアナライ
ザ１００によって符号化された元のアナログ音声に近い
複製を生成する。シンセサイザ２００は以下のように機
能する。フレームが発声フレームである場合は、ブロッ
ク　２１２，２１３゜及び２Ｕ、４が、式（１）に従っ
て元の音声信号を再生するためのシヌソイダル合成を遂
行し、この再生された音声情報が次にセレクタ２０６を
介してデジタル／アナログ　コンバータ２０８に転送さ
れ、これによって受信されたデジタル情報がアナログ信
号に変換される。

第３図に示される発声情報パケットを受信すると、チャ
ネル検出器２０１はピッチ及び高調波周波数オフセット
情報をそれぞれ経路２２１及び２２２を介して高調波周
波数カルキュレータ２１２に、音声フレーム　エネルギ
ーｅ０、及びＬＰＧ係数をそれぞれ経路２２０　及び２
１６を介して高調波振幅カルキュレータ２１３に、　そ
して発声／非発声（ｖｏｉｃｅｄ／ｕｎｖｏｉｃｅｄ、
　Ｖ／Ｕ）信号を高調波周波数カルキュレータ２１２及
びセレクタ２０６に送る。′１”に等しいＶ／Ｕ信号は
そのフレームが発声フレームであることを示す。高調波
周波数カルキュレータ２１２はＶ／Ｕ信号が１１１１１
であるのに応答してそれぞれ経路２２１及び２２２を介
して受信される調節されたピッチ及び高調波周波数オフ
セット情報に従って高調波周波数を計算する。高調波周
波数カルキュレータ２１２は次に高調波周波数情報をブ
ロック２１３及び２１４に送る。

高調波振幅カルキュレータ２１３はカルキュレータ２１
２からの高調波周波数情報、経路２２０を介して受信さ
れるフレーム　エネルギー情報、及び経路２１６を介し
て受信されるＬＰＧ係数に応答して高調波周波数の振幅
を計算する。シヌソイダル発生器２１４は経路２２３を
介してカルキュレータ２１２から受信される周波数情報
に応答して高調波位相情報を決定し、次にこの位相情報
及び経路２２４を介してカルキュレータ２１３から受信
される振幅情報を利用して式（１）によって示される計
算を遂行する。

チャネル復号器２０１が第４図に示されるようなノイズ
励振パケットを受信すると、チャネル復号器２０１は経
路２２７を介してセレクタ２０５にホワイト　クイズ発
生器２０３の出力を選択させる１つの信号を送り、経路
２１５を介してセレクタ２０６に合成フィルタ２０７の
出力を選択させる１つの信号を送る。これに加え、チャ
ネル復号器２０１は経路２１１を介して利得をホワイト
　ノイズ発生器２０３に送る。合成フィルタ２０７は経
路２１６を介してチャネル復号器２０１から受信される
ＬＰＧ係数及びセレクタ２０５を介して受信されるホワ
イト　ノイズ発生器２０３の出力に応答して音声のデジ
タル　サンプルを生成する。

チャネル復号器２０１がチャネル１３９から第５図に示
されるようなパルス励振パケットを受信した場合は、復
号器２０１はパルスの位置及び最大パルスの振幅に対す
るパルスの相対振幅を経路２１０を介してパルス発生器
２０４に送る。これに加え、チャネル復号器２０１は経
路２２７を介してセレクタ２０５をパルス発生器２０４
の出力を選択するように条件付けし、この出力を合成フ
ィルタ２０７に送る。合成フィルタ２０７及びデジタル
／アナログ　コンバータ２０８は、　次に経路２１５を
介して復号器２０１にて条件付けされたセレクタ２０６
を通じて音声を再生する。

コンバータ２０８はコンバータの出力の所に内蔵ローパ
ス　フィルタを持つ。

次にブロック２１２，２１３．及び２１４の発声フレー
ムのシヌソイダル合成を遂行する動作を詳細に説明する
。高調波周波数カルキュレータ２１２は、経路２２１を
介して受信される調節されたピッチＰ六に応答して経路
２２２を介して受信される高調波オフセットを利用して
高調波周波数を決定する。理論高調波周波数ｔｓ、が高
調波の次数にこの調節されたピッチを掛けたものとして
定義される。

個々の高調波周波数ｈｆ、は適当な高調波オフセットに
て補正された後に１つのスペクトル　ポイント上にくる
ように調節される。以下の式は個々の高調波に対する１
次高調波周波数を定義する。

ｈｆ；＝ｔｓ；＋ｈｏ；ｆｒ、１　＜　ｉ　＜　ｈ　　
　（１４）ここで、ｆｒはスペクトル周波数分解能を表
わす。

式（１４）は個々の高調波周波数に対して１つの値を生
成する。この値は合成されている音声フレームのセンタ
に対応するものと仮定される。あるフレーム内の個々の
音声サンプルに対する残りのパー　サンプル周波数（ｐ
ｅｒ−ｓａｍｐｌｅ　ｆｒｅｑｕｅｎｃｙ）は隣接する
発声フレームの周波数間、あるいは隣接する非発声フレ
ームに対する事前に定められた境界条件から線形補間に
よって得られる。この補間はシヌソイダル発生器２１４
内で遂行され、後のバラグラフで詳細に説明される。

高調波振幅カルキュレータ２１３はカルキユニレータ２
１２によって計算される周波数、経路２１６を介して受
信される　ＬＰＧ係数、及び経路２２０を介して受信さ
れるフレームエネルギーに応答して基本周波数及び高調
波周波数の振幅を計算する。個々の発声フレームに対す
るＬＰＧ反射係数は、個々のフレームの間の声帯を表わ
す音響管モデルを定義する。この情報から相対高調波振
幅が計算できる。しかし、ＬＰＧ係数は声帯の構造をモ
デル化するものであるため、これは個々のこれら高調波
周波数の所のエネルギーの量に関する十分な情報は含ま
ない。このエネルギーの量に関する情報は、経路２２０
を介して受信されるフレーム　エネルギーを使用して決
定される。個々のフレームに対し、カルキュレータ２１
３は高調波振幅を計算するが、これは高調波周波数の計
算と同様に、この振幅がフレームの中心に位置するもの
と仮定する。

フレームを通じての残りの振幅が隣接する発声フレーム
からの振幅情報あるいは隣接する非発声フレームに対す
るあらかじめ定められた境界条件を使用して線形補間に
よって決定される。

これら振幅は声帯が１つのオール　ボールフィルタ　モ
デルを使用して記述できるということを認識することに
より決定できる。

Ｇ　（ｚ　）　＝　−（１５）Ａ（ｚ）ここで、であり、また、定義上、係数８０＝１である。

オール　ボール　フィルタを記述するのに必要な係数ａ
、（１’　ｍ　＜　１０）は、経路２１６を介して受信
される反射係数からマーケル。

Ｊ　、　Ｄ、　　（Ｍａｒｋｅｌ、Ｊ、Ｄ、）及びグレ
イ、Ｊｒ。

Ａ、Ｈ，（Ｇｒａｙ、Ｊｒ、　　Ａ、Ｈ，）による著＠
　［音声の線形予測（Ｌ　１ｎｅａｒ　Ｐ　ｒｅｄｉｃ
ｔｉｏｎＯｆ　５ｐｅｅｃｈ）コ、スプリンガ　バーラ
ッグ（Ｓ　ｐｒｉｎｇｅｒ　Ｂ　ｅｒｉａｇ）　−ニュ
ーヨーク、ニューヨーク、１９７６年に説明の反復セッ
トアツプ手順を使用して得ることができる。式（１５）
及び（１６）によって記述されるフィルタが以下の方法
に従って個々のフレームに対する高調波成分の規模を計
算するのに使用される。計算されるべき高調波振幅をｈ
ａ。

（０＜ｉ＜ｈ）と命名するものとする。ここでｈは現在
のフレーム内の高調波の最大番号を表わす。アンスケー
ルド（ｕｎｓｅａｌｅｄ）高調波寄与値ｈｅ；（Ｑ＜ｉ
＜ｈ）は個々の高調波周波数ｈｆＨに対して以下によっ
て得られる。

ここで、Ｓｒはサンプリング速度を表わす。

全ての高調波に対する総アンスケールドエネルギーは以
下によって与えられる。

１６０ポイントのフレーム　サイズに対してと仮定する
と、を次のアンスケールド高調波振幅ｈａ１は以下によ
って計算できる。

ここで、ｅｏは式（２）によって定義されアナライザ１
００によって計算された伝送された音声フレーム　エネ
ルギーである。

次に、シヌソイダル発生器２１４がカルキュレータ２１
２及び２１３がら受信される情報を使用して如何に式（
１）によって定義される計算を遂行するか説明する。あ
る任意のフレームに対して、カル・キュレータ２１２及
び２１３は発生器２１４にそのフレーム内の個々の高調
波に対する１つの周波数及び振幅を提供する。発生器２
１４はこの周波数情報を位相情報に変換し、周波数及び
振幅の両方についてフレームを通じての個々のサンプル
ポイントに対する周波数及び振幅を得るために線形補間
を遂行する。

この線形補間は以下の方法によって遂行される。第６図
は５個の音声フレームと０次高調波とみなすこともでき
る基本周波数に対して遂行される線形補間を図解する。

他の高調波周波数も類似の表現を持つ。おおざっばに、
ある発声フレームに対して３つの境界条件が存在する。

第１に、ある発声フレームは１つの先行非発声フレーム
及び１つの後続発声フレームを持つことができ、第２の
ケースでは、発声フレームは他の発声フレームによって
包囲され、そして第３のケースにおいては発声フレーム
は１つの先行発声フレーム及び１つの後続非発声フレー
ムを持つ。第６図に示さ九るように、フレームＣ，ポイ
ント６０１から６０３は第１の状態を代表し；周波数ｈ
ｆ？は６０１によって定義されるこのフレームの開始点
まで一定であると見做される。スーパスクリプトは、こ
のフレームがＣフレームである事実を示す。Ｃフレーム
の後のポイント６０３から６０５によって定義されるフ
レームｂは第２のケースを表わし；ポイント６０２から
６０４の間でそれぞれポイント６０２及び６０４の所に
起こる周波数ｈｆｚ及びｈｆ’７を使用して線形補間が
遂行される。第３のケースはポインｈ　６０５から６０
７に延びるフレームａによって代表され、フレームａに
続くフレームはポイント６０７から６０８によって定義
される非発声フレームである。このケースでは、ｈｆ周
波数はポイント６０７まで一定である。

第７図は振幅の補間を示す。連続の発声フレーム、例え
ば、ポイント７０２から７０４゜及びポイント７０４か
ら７０６によって定義されるフレームに対しては、これ
ら振幅の補間はこれら周波数に対して遂行される補間と
同一である。しかし、前のフレームが非発声である場合
１例えばフレーム７００から７０１のフレーム７０１か
ら７０３に対する関係においては、フレームの開始の所
の高調波はポイント７０１の所に示されるように０振幅
を持つものと仮定される。同様に、発声フレームに非発
声フレームが続く場合、例えば、７０５から７０７まで
のフレームａ　の後に７０７から７０８の非発声フレー
ムが来るような場合は、高調波は終端ポイント、例えば
、７０７の所でＯの振幅を持つものと仮定され、線形補
間が遂行される。

発生器２１４は上に説明の補間を以下の式を使用して遂
行する。ｎ番目のパー　サンプル位相は以下によって定
義される。

ここで、ｏ、Ｉ、１はｉ次高調波のパー　サンプル位相
であり、ｓｒは出力サンプル速度である。これら位相を
解くためにはパー　サンプル周波数Ｗ１，１を知ること
のみが必要とされ、これらパー　サンプル周波数は補間
によって発見される。隣接する発声フレームを持つ発声
フレーム、例えば、第６図のフレームｂに対する周波数
の線形補間は以下によって定義される。

ｇｏ　＜　ｎ　＜　１５９．　Ｏ＜　ｉ＜　ｈ、ｉｎ　
　（２１）及びここで、ｈ、１１はどちらかの隣接フレーム内の高調波
の最低数を表わす。非発声フレームから発声フレームへ
の遷移、例えば、フレームＣは以下の式によってパー　
サンプル高調波周波数を決定することによって扱われる
。

Ｖ／’：、　、　＝ｈ　ｆ？、　　ｏふｎ　＜　７９　
　　（２３）発声フレームから非発声フレームへの遷移
、例えば、フレームａは以下の式によってパーサンプル
高調波周波数を決定することによって扱われる。

Ｗ二、　＋　＝ｈｆ７．　８０　＜　ｎ巡１５９　　　
（２４）ｈ、ｌ、が２つの隣接するフレームのいずれか
内の高調波の最低数を表わすものとすると、フレームｂ
がフレームＣより多くの高調波を持つようなケースにお
いては、Ｋ　ｓｔｙより大きな高調波に対するパー　サ
ンプル高調波周波数を計算するために式（２３）が使用
される。フレームｂがフレームａより多くの高調波を持
つときは、式（２４）を使用して）１ｗｉ、。

より大きな高調波に対するパー　サンプル高調波周波数
が計算される。

バーサンプル高調波周波数Ａ、、１はｈａｄから類似の
方法で決定でき、発声フレームｂに対して以下によって
定義できる。

８０　＜　ｎ　＜　１５９．　Ｏ＜　ｉ　＜　Ｋｗｉｎ
　　（２５）及び０　＜　ｎ　＜　７９．　Ｏ＜　ｉ　＜　ｈ、１．　　
　（２６）そのフレームが発声領域の開始であるとき、
例えば、開始の所のフレームＣのようなときは、パー　
サンプル高調波振幅は以下によって決定される。

Ａ：、、＝ｏ、　　　ｏ至ｉ至ｈ　　　　　（２７）及
び０υ １　＜　ｎ　＜　７９．　　Ｏ＜　ｉ　＜　ｈ　　　　
（２８）ここで、ｈはフレームＣ内の高調波の数を表わ
す。　フレームが発声領域の終端の所である、例えば、
フレームａのようなときは、バーサンプル振幅は以下に
よって決定される。

８０　＜　ｎ　＜　１５９．　　Ｏ＜　ｉ　＜　ｈ　　
　　（２９）ここで、ｈはフレームＣ内の高調波の数を
表わす、フレーム、例えば、フレームｂが先行発声フレ
ーム、例えば、フレームＣより多くの高調波を持つ場合
は＋　ｈ、：Ｍより大きな高調波に対する高調波振幅を
計算するために式（２７）及び（２８）が使用される。

フレームｂがフレームａより多くの高調波を持つ場合は
、式（２９）を使用してｈ　、ｉｖ＋より大きな高調波
に対する高調波振幅が計算される。

エネルギー　カルキュレータ１０３は第８図のプロセッ
サ８０３によって第９図のブロック９０１から９０４を
実行することによって実現される。ブロック９０１は、
好ましくは、サンプルの数をフレーム轟たり１６０にセ
ットする。ブロック９０２及び９０３は次に個々のデジ
タル　サンプルの二乗Ｓ＆の総和を生成する。総和が生
成されたら、ブロック９０４において、この総和の平方
根がとられるが、これによって元の音声フレーム　エネ
ルギーｅ０が得られる。次にこのフレームエネルギーが
パラメータ符号器１１３及びブロック１００１に伝送さ
れる。

第１図のハミング　ウィンドウ　ブロック１０４はプロ
セッサ８０３によって第９図のブロック１００１及び１
００２を実行することによって実現される。゛ブロック
１００１及び１００２は周知のハミング　ウインドウニ
ング動作を遂行する。

ＦＦＴスペクトル規模ブロック１０５　　は、第９図及
び第１０図のブロック１００３から１０２３を実行する
ことによって実現される。

プロｚ’７１００３から１００５は式（４）によって定
義されるパディング動作を遂行する。

このパディング動作は虚数及び実数部分の両方に対して
、好ましくは１０２４個のデータポイントを含むアレイ
内のポイントＣの実数部分Ｒ６、及び虚数部分Ｉ０にゼ
ロを挿入する。

ブロック１００６から１０１３は当分野において周知の
データ整合動作を遂行する。この動作は通常、これがデ
ータ　ポイントの順番をＦＦＴ分析の結果が正しい周波
数領域の順に生成されることを保証するように再配列す
るためビット反転動作と呼ばれる。

第９図及び第１０図のブロック１０１４から１ｏ２１は
式（５）によって定義される離散フーリエ変換を計算す
るための速いフーリエ変換の実現を図解する。ブロック
１ｏ１４から１０２１によって速いフーリエ分析を遂行
した後、ブロック１０２２及び１０２３によって式（６
）によって定義される結果としてのスペクトル規模デー
タを提供するのに必要な二乗及び平方根動作が遂行され
る。

ピッチ　アジャスタ１０７は第１０図、第１１図、及び
第１２図のブロック１１０１から１１３２によって実現
される。第１０図のブロック１１０１はピッチ調節動作
の遂行に必要とされるさまざまな変数を初期化する。

ブロック１１０２はピッチの調節のために遂行されるべ
き反復の回数を個々の高調波ピークを探索することによ
って決定する。例外として、理論周波数ｔｈが最大許容
周波数ｍｘｆ゛を越える場合は、ブロック１１０２によ
って制御される″フォー　ループ（ｆｏｒ　１ｏｏｐ）
”が判定ブロック１１０４によって終端される。

理論周波数が個々の反復に対して、ブロック１１０３に
よってセットされる。式（１０）はピッチを調節するの
に使用される手順を決定し、式（１１）は個々のピーク
に対する探索領域を決定する。ブロック１１０８は探索
の開始において最初のデータ　ポイントを決定するスペ
クトル規模データＳ、のインデックスｍを決定するのに
使用される。ブロック１１０８はまたこのデータ　ポイ
ントの回りの上側スロープｕｓ及び下側スロープＱｓと
呼ばれるスロープを計算する。この上側及び下側スロー
プは指定のデータ　ポイントの回りのスロープ規模デー
タのスロープに対する５つの異なる状態の１つを決定す
るのに使用される。これら５つの状態とは、スペクトル
のローカル　ピーク、正のスロープ、負のスロープ、ロ
ーカル最小、あるいは平坦部分である。これら状態が第
１０図及び第１１図のブロック１１１１，１１１４，１
１０９、及び１１１ｏにおいてテストされる。スロープ
がブロック１１１０及び１１０９によって曲線の最小あ
るいは平坦部分であると検出されると、調節済みピッチ
周波数Ｐ１を決定された最後のピッチ値に等しくセット
するブロック１１０７が実行され、第１１図のブロック
１１０７が実行される。曲線の最小あるいは平坦部分が
検出されない場合は、判定ブロック１１１１が実行され
る。判定ブロック１１１１によってピークが検出された
場合は、ブロック１１１２によってピークの所のデータ
　サンプルの周波数が決定される。

指定のポイントの回りのスペクトル規模データのスロー
プがピーク、正のスロープ、あるいは負のスロープであ
ると検出された場合は、ブロック１１２８から１１３２
によってピッチが調節される。この調節は式（１０）に
従って遂行される。ブロック１１２８はピーク発見標１
ｔｌｌ（ｐｅａｋ　１ｏｃａｔｅｄ　ｆｌａｇ）をセッ
トし、それぞれ式（１０）の分子及び分母を表わす変数
ｎｍ及びｄｎをセットする。ブロック１１２９から１１
３２は次に式（−〇）の計算を遂行する。判定ブロック
１１３０はこの特定の高調波し二対してピークが検出さ
れたか否か決定する。ピークが検出されない場合は、ル
ープが単に継続され、ブロック１１３１によって定義さ
れる計算は遂行されない。全てのピークが処理されると
、ブロック１１３２が実行され、現在検出されたピーク
に対して調節されたピッチを表わす調節されたピッチが
生成される。

スペクトル　データ　ポイントのスロープが正あるいは
負であると検出されたときは。

第１１図のブロック１１１３から１１２７が実行される
。最初、ブロック１１１３が初期サンプル　ポイントに
対する周波数ｐｓｆを計算し、これがブロック１１１９
及び１１２３゜及びブロック１１２２及び１１２４によ
って探索が式（１１）によって定義されるポイントを越
えて進まないことを保証するために使用される。スロー
プが正であるか負であるかの決定が判定ブロック１１１
４によって行なわれる。スペクトル　データ　ポイント
が負のスロープ上にある場合は、ブロック１１１５から
１１２５が実行される。二わらブロックの目的はスロー
プ　データ　ポイントをピークが発見されるまであるい
はブロック１１１９及び１１２３によって定義される探
索領域の終端が越えられるまで探索することにある。

判定ブロック１１２５はこの探索領域内にピークが発見
されたか否かを決定するためｔこ使用される。ブロック
１１１４によって正のスロープが検出された場合は、ブ
ロック１１１６から１１２６が実行され、負のスロープ
の場合に対してブロック１１１５から１１２５によって
遂行されたのと類似の機能が遂行される。ブロック１１
１３から１１２６の実行の後、ブロック１１２７から１
１３２が上と同様の方法で実行される。スペクトル内に
存在する全てのピークがテストされたら、最終ピッチ値
が第１２図のブロック１１０６によって式（１０）に従
って累積調節ピッチ値と等しくセットされる。

高調波ロケータ１０６は第１２図及び第１３図のブロッ
ク１２０１から１２２２によって実現される。ブロック
１２０１は高調波周波数を発見するのに必要な初期状態
をセットアンプする。ブロン′）１．２０２はブロック
１２０３から１２２２の実行を変数ｈａｒｍによって指
定される全てのピークが検出されるように制御する。個
々の高調波に対して、ブロック１２０３は理論高調波ス
ペクトルデータポイント、上側スロープ、及び下側スロ
ープを決定するのに使用すべきインデックスを決定する
。判定ブロック１２０４から１２０６によってそれぞれ
スロープが最小、平坦領域あるいはピークであると決定
された場合は、ブロック１２２２が実行され、高調波オ
フセットがゼロにセットされる。スロープが正あるいは
負である場合は、ブロック１２ｏ７から１２２１が実行
される。ブロック１２０７から１２２０は前に説明のブ
ロック１１１３から１１２６の動作によって遂行される
のと類似の機能を遂行する。ブロック１２０８から１２
２０の実行が終了すると、高調波オフセットｈｏｑがブ
ロック１２２１によってインデックス番号ｒにセットさ
れる。

第１４図から第１９図はプロセッサ８０３によって第２
図のシンセサイザ２００を実現するために実行されるス
テップの詳細を示す。

第２図の高調波周波数カルキュレータ２１２は第１４図
のブロック１３０１，１３０２、及び１３０３によって
実現される。ブロック１３０１はこの動作で使用される
べきパラメータを初期化する。ｉ番目のフレームの基本
周波数ｈ　ｆ　５が伝送されたピッチＰ、に等しくセッ
トされる。この初期値を使用して、ブロック１３０３は
最初ピッチに周波数番号を掛けることによってその高調
波の理論周波数を計算することによって個々の高調波周
波数を計算する。次に、　この周波数がスペクトルデー
タ　ポイント上にくるように理論高調波のインデックス
が得ら九、このインデックスが伝送された高調波オフセ
ットｈｏ、に加えられる。スペクトル　データ　ポイン
ト　インデックスが決定されたら、このインデックスに
周波数分解能ｆｒを掛けることによってｉ番目の高調波
周波数ｈｆ：が決定される。

この手順がブロック１３０２によって全ての高調波が計
算されるまで反復される。

高調波振幅カルキュレータ２１３は、第８図のプロセッ
サ８０３によって第１４図及び第１５図のブロック１４
０１から１４１７を実行することによって実現される。

ブロック１４０１から１４０７はＬＰＧ反射係数を式（
１６）によって与えられる声帯のオール　ポール　フィ
ルタ記述のために使用される係数に変換するためのセッ
トアツプ手順を遂行する。ブロック１４０８から１４１
２は式（１７）によって定義される個々の高調波に対す
るアンスケールド高調波エネルギーを計算する。

ブロック１４１３から１４１５は式（１８）によって定
義される総アンスケールド　エネルギーＥを計算するの
に使用される。ブロック１４１６から１４１７は式（２
０）によって定義されるｉ番目のフレームのスケールド
高調波振幅　ｈａを計算するのに使用される。

第１５図から第１８図のブロック１５０１から１５２１
及びブロック１６ｏ１がら１６１４は、プロセッサ８０
３によって第６図及び第７図に示されるように個々の高
調波に対して周波数及び振幅の補間を行なうために遂行
される動作を図解する。これら動作は、　フレームの第
１の部分がブロック１ｓ０１　がら１５２１によって処
理され、フレームの第２の部分がブロック１６０１がら
１６１４によって処理されることにより遂行される。第
６図に示されるように、フレームＣの最初の半分はポイ
ント６０１から６０２まで延び、フレームＣの後の半分
はポイント６０２　　から６０３まで延びる。これらブ
ロックによって遂行される動作は、最初に先行フレーム
が発声フレームであるか非発゛声であるが決定すること
である。

より具体的には、第１５図のブロック１５ｏ１において
初期値がセットされる。判定ブロック１５０２は先行フ
レームが発声フレームであったか非発声フレー１１であ
ったが判定する。

先行フレームが非発声の場合は、判定ブロック１５０４
から１５１０が実行される。第１７図のブロック１５０
４及び１５０７はフレームの開始の所で個々の高調波に
対する高調波周波数及び高調波振幅に対する最初のデー
タポイントを位相に対してｈｆＪそして振幅に対してａ
２．。＝０に初期化する。これは第６図及び第７図の図
解に対応する。フレームの最初のデータ　ポイントに対
する初期値がセット　アップされたら、先行非発声フレ
ームに対する残りの値がブロック１５０８　から１５ｏ
１の実行によってセットされる。高調波周波数の場合は
、周波数が第６図に示されるように中心周波数に等しく
セットされる。

高調波振幅の場合は、個々のデータ　ポイントが、第７
図のフレームＣに対するように、フレームの開始の所の
ゼロから開始し中点振幅に至るまでの線形近似にセット
される。

ブロック１５０２によって先行フレームが発声フレーム
であると判定された場合は、第１６図の判定ブロック１
５ｏ３が実行される。

判定ブロック１５ｏ３は先行フレームが現存のフレーム
と比較して高調波を多く持つか少なく持つか決定する。

高調波の数は変数ｓｈによって示される。どちらのフレ
ームが多くの高調波を持つかによってブロック１５０５
が実行されるかあるいはブロック１５０６が実行される
かが決定される。変数り１．１がどちらかのフレームの
高調波の最小番号に等しくセットされる。ブロック１５
０５あるいは１５０６が実行された後、ブロック１５１
１及び１５１２が実行される。ブロック１５１１及び１
５１２は先行フレームの最後のポイントを計算すること
によって現在のフレームの周波数及び振幅の両方に対す
る初期ポイントを決定する。この動作が全ての高調波に
対して遂行された後、ブロック１５１３から１５１５に
よってそれぞれ式（２２）及び式（２６）によって定義
されるように全ての高調波に対して周波数及び振幅の両
方に対する個々のパー　サンプル値が計算される。

変数ｈ　ｗ　ｉ□によって定義される全ての高調波に対
してパー　サンプル周波数及び振幅が計算されたら、ブ
ロック１５１６から１５２１が現在のフレームが先行フ
レームより多くの高調波を持つ可能性がある事実を考慮
するために計算される。現在のフレームが先行フレーム
より多くの高調波を持つ場合は、判定ブロック１５１６
は制御をブロック１５１７に渡す、、現在のフレーム内
に先行フレームより多くの高調波が存在する場合は、ブ
ロック１５１７から’、５２１が実行されるが、これら
の動作は前述のブロック１５０４から１５１０と同一で
あ５゜プレー・ムの後半についての個々の高調波に対する周波
数及び振幅に対するパー　サンプル　ボｒントの計算が
ブニ：ッグ１６０１から１６１４によって示される７ブ
ロツク１６０１によって次のフレームが発ｈ゛であるか
非発声であるか判定される。ｐｌ）フレームが非発声で
ある場合は、ブロック１６３０から１６０７が実行され
る。ブロック１５ｏ４及び１５０７によって遂行される
初期ポイントを決定する必要はないことに注意する。　
これは最初のポイントは１周波数及び振幅の両方とも中
点とされるためである。ブロックｌ　６０３　カら１６
０７は、ブロック１５０８から１５１０によって遂行さ
れる機能と類似の機能を遂行する。次のフレームが発声
フレームである場合は、判定ブロック１６０２及びブロ
ック１６０４あるいは１６０５が実行される。これらブ
ロックの実行は前述のブロック１，５０３゜１５０５、
及び１５０６に対して説明の実行と類似する。ブロック
１６０８から１６１１の動作は前述のブロック゛１５１
３から１５１６の動作と類似する。ブロック１６２１　
から１６１４の動作は前述のブロック１３Ｌ９から１５
２１の動作と類似する。

発生器２１４によって遂行される最後の動作は、個々の
高調波に対して前述のようＬこし。

て計算されたパー　サンプル周波数及び振幅を使用して
の音声の実際のシヌソイダル再生である・　第１９図の
ブロック１７０１　から１７０７は前に計算された周波
数情報を使用して周波数から高調波の位相を計算し、次
に式（１）によって定義される計算を遂行する。

ブロック１７０２及び１７０３はフレームの開始に対す
る初期音声サンプルを決定する。

この初期ポイントが決定されたら、ブロック１７０４か
ら１７０７によってそのフレームに対する残りの音声サ
ンプルが計算される。

これらブロックからの出力が次にデジタル／アナログ　
コンバータ２０８に伝送される。

【図面の簡単な説明】

第１図はブロック図にて本発明による音声アナライザを
示す図；第２図はブロック図にて本発明による音声シンセサイザ
を示す図；第３図は発声領域の間に音声を複製するための情報を含
むパケットを示す図；第４図は非発声領域の間にノイズ励振を使用して音声を
複製するための情報を含むパケットを示す図：第５図は非発声領域の間にパルス励振を使用して音声を
複製するための情報を含むパケットを示す図；第６図はグラフにて第２図のシンセサイザによって基本
及び高調波周波数に対して遂行される補間を示す図；第７図はグラフにて第２図のシンセサイザによって基本
及び高調波周波数の振幅に対して遂行される補間を示す
図；第８図は第１図及び第２図のデジタル信号プロセッサ実
現を示す図；第９図から第１３図は流れ図にて第１図のアナライザ回
路の実現を可能とするために第８図のデジタル信号プロ
セッサを制御するためのプログラムを示す図；そして第１４図から第１９図は流れ図にて第２図のシンセサイ
ザの実現を可能とするために第８図のデジタル信号プロ
セッサの実行を制御するためのプログラムを示す図であ
る。［主要部分の符号の説明］１０２・・・・・・・・・・・・・・・・・・フレーム
セグメント１０３・・・・・・・・・・・・エネルギー
カルキュレータ１０４・・・・・・・・・・・・・・・
・・・ハミングウィンドウ１０５・・・・・・・・ＦＦ
Ｔ　スペクトル規模ブロック１０６・・・・・・・・・
・・・・・・・・・・・・・・高調波ロケータ１０７・
・・・・・・・・・・・・・・・・・・・ピッチアジャ
スタ１０８・・・・・・・・・・・・・・・・・高調波
カルキュレータ１０９・・・・・・・・・・・・・・・
・・・・・・・・・・ピッチ検出器１１１・・・・・・
・・・・・・・・・・ＬＰＣカルキュレータ１１３・・
・・・・・・・・・・・・・・・・・・・パラメータ符
号器ｌｆｌ翌款ＦＩＧ、６ヒＨｊ、　　／ＦＩＧ、９ＦＩＧ、　／２Ｆ／θ、／６Ｆｌこ１７

Claims

【特許請求の範囲】１、人の音声を符号化するための処理システムにおいて、該システムが：音声を個々が所定の数の均一な間隔の音声の瞬時振幅のサンプルを持つ複数の音声フレームにセグ
メント化するためのセグメンタ（例えば、１０２）；個々のフレームに対する声帯を定義するセットの音声パラメータ信号を計算するためのカルキュレ
ータ（例えば、１１１）；該音声サンプルのフレーム当たりのフレームエネルギーを計算するためのエネルギーカルキュレータ（例えば、１０３）；個々のフレームの該音声サンプルのスペクトル分析を遂行することによって個々のフレームに対す
るスペクトルを生成するためのアナライザ（例えば、１
０４、１０５）を含み、該システムがさらに個々のフレームに対する基本周波数信号を個々のフレームに対応するスペクトルから検出するため
のピッチ検出器（例えば、１０９、１０７）；個々のフレームに対する高調波周波数信号を個々のフレームに対するスペクトルから検出するため
の高調波ロケータ（例えば、１０６）；個々のフレーム
に対して個々の該高調波周波数信号と該基本周波数信号の整数倍数との間の差を表
わすオフセット信号を決定するための高調波カルキュレ
ータ（例えば、１０８）及び；後の音声合成のために該フレームエネルギー、該セットの音声パラメータ、該基本周波数及び該
オフセット信号の符号化表現を伝送するための送信機（
例えば、１１３、１１４）を含むことを特徴とするシス
テム。２、特許請求の範囲第１項に記載のシステムにおいて、該検出器が検出された基本周波数信号を高調波周波数信号が調節された基本周波数信号の整数倍数の回りに均
一に分布するように、該基本及び高調波周波数信号を表
わす該スペクトル内のピークの分析によって調節するた
めのピッチアジャスタ（例えば、１０７）を含むことを
特徴とするシステム。３、特許請求の範囲第２項に記載のシステムにおいて、該高調波ロケータが該スペクトルを該調節された基本周波数信号の倍数を個々の該高調波周波数信号に対する開始ポイ
ントとして使用し、該高調波周波数信号を決定するため
に探索するための手段（例えば、１２０１−１２２２）
を含むことを特徴とするシステム。４、個々が所定の数の均一な間隔の音声の瞬時振幅サンプルを持つ複数のフレームにセグメント
化された音声を合成するための方法において、個々の該
フレームがフレームエネルギー、セットの音声パラメータ、音声の基本周波数信号、及び基本周波数信号から派生され
た理論高調波周波数と実際の高調波周波数との間の差を
表わすオフセット信号によって符号化され、該方法が該複数のフレームの１つのフレームの該オフセット信号及び基本周波数信号に応答して該複数のフ
レームの個々のフレームの個々の高調波周波数に対する
高調波位相信号を計算するステップ；該複数のフレームの該１つのフレームの該フレームエネルギー及び該セットの音声パラメータに応答して該高調波位相信号の振幅を決定する
ステップ（例えば、２１３）；及び該複数のフレームの該１つのフレームに対する該高調波位相信号及び該決定された振幅に応答して
複製音声を生成するステップを含むことを特徴とする方
法。５、特許請求の範囲第４項に記載の方法において、該決定ステップが該複数のフレームの該１つのフレームに対する該セットの音声パラメータを使用して個々の該高調
波位相信号のアンスケールドエネルギーを計算するステップ；該複数のフレームの該１つのフレームに対する全ての該高調波位相信号に対する該アンスケールド
エネルギーを総和するステップ；及び個々の該高調波位相信号の該高調波エネルギー、該総和アンスケールドエネルギー及び該複数のフレームの該１つのフレームに対する該フレ
ームエネルギーに応答して該高調波位相信号の高調波振幅を計算するステップを含むこ
とを特徴とする方法。６、特許請求の範囲第４項に記載の方法において、個々の該高調波位相信号が複数のサンプルを
含み、該アンスケールドエネルギーを計算するステップが：該個々のオフセット信号を該基本周波数信号の整数倍数に加えることによって個々の該高調波位相
信号に対する高調波周波数信号を得るステップ；及び該複数のフレームの該１つのフレームに対する高調波周波数信号及び個々の該高調波位相信号に対
する該複数のフレームの該１つのフレームの前後のフレ
ームに対する対応する高調波周波数信号に応答して、該
複数のフレームの該前後のフレームが発声フレームであ
るとき、補間を遂行し、該複数のフレームの該１つのフ
レームの該個々の高調波位相信号に対して該複数の高調
波サンプルを得るステップを含むことを特徴とする方法
。７、特許請求の範囲第６項に記載の方法において、該補間ステップが線形補間を遂行することを
特徴とする方法。８、特許請求の範囲第７項に記載の方法において、該個々の該高調波位相信号に対する該複数の
フレームの該１つのフレームに対する該高調波周波数信
号が該複数のフレームの該１つのフレームの中心に位置
することを特徴とする方法。９、特許請求の範囲第５項に記載の方法において、該高調波位相信号の個々の該振幅が複数の振
幅サンプルを持ち、該計算ステップが該複数のフレーム
の該１つのフレームに対する計算された高調波振幅及び
個々の該高調波位相信号に対する該複数のフレームの該
１つのフレームの前後のフレームに対する計算された高
調波振幅サンプルに応答して、該複数のフレームの前後
のフレームが発声フレームであるとき、補間を遂行し、
該複数のフレームの該１つのフレームに対する個々の該
高調波位相信号に対する該複数の振幅サンプルを得るス
テップを含むことを特徴とする方法。１０、特許請求の範囲第９項に記載の方法において、該補間ステップが線形補間を遂行することを
特徴とする方法。１１、特許請求の範囲第１０項に記載の方法において、個々の該高調波位相信号に対する該複数の
フレームの該１つのフレームに対する該計算された高調
波振幅が該フレームの複数の該１つのフレームの中心に
位置することを特徴とする方法。