JPH04506575A - 長時間予測子を有する適応変換コード化装置 - Google Patents

長時間予測子を有する適応変換コード化装置

Info

Publication number
JPH04506575A
JPH04506575A JP2506450A JP50645090A JPH04506575A JP H04506575 A JPH04506575 A JP H04506575A JP 2506450 A JP2506450 A JP 2506450A JP 50645090 A JP50645090 A JP 50645090A JP H04506575 A JPH04506575 A JP H04506575A
Authority
JP
Japan
Prior art keywords
periodicity
value
sample
block
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2506450A
Other languages
English (en)
Inventor
ウィルソン,フィリップ ジェイ.
チャトワル,ハープリット
Original Assignee
パシフィック コミュニケイション サイエンセズ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パシフィック コミュニケイション サイエンセズ,インコーポレイテッド filed Critical パシフィック コミュニケイション サイエンセズ,インコーポレイテッド
Publication of JPH04506575A publication Critical patent/JPH04506575A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 1 る 、コード [産業上の利用分野] 本発明は、スピーチコード化の分野に関し、特定すると、得られたディジタル信 号が最小ビットレートに維持されるスピーチ信号の適応変換コード化(コーディ ング)の分野における改良に関する。 [発明の背景] 最初のディジタル通信搬送装置一つは、1962年頃米国において紹介された2 4ボイスチャンネル1.544Mb/sのT1システムであった。T1システム は、より高価なアナログシステムに優る利点のため広く配備されることになった 。T1システムにおける個々のボイスチャンネルは、ボイス信号を約300−3 400Hzの周波数範囲に帯域制限し、制限された信号を8kHzのレートでサ ンプルし、その後サンプルされた信号を8ビツト対数量子化装置でコード化する ことによって発生される。得られた信号は、64kb/sのディジタル信号であ る。T1システムは、24の個々のディジタル信号を単一のデータ列に多重化す る。 データ伝送速度は1.544Mb/sの固定されるから、T1システムは、8k Hzのサンプリング速度および8ビツト対数量子化体系を使用するとき、24ボ イスチヤンネルに制限される。チャンネルの数を増し、なお約1.544Mb/ sのシステム伝送速度を維持するためには、個々の伝送速度は、64kb/sか らあるより低い速度に減ぜられねばならない。この速度を減するのに使用される 一つの方法は、変換コード化として知られている。 スピーチ信号の変換コード化において、個々のスピーチ信号は、スピーチサンプ ルの逐次のブロックに分割される。各ブロックのサンプルは、その後ベクトルで 配列され、時間領域から周波数領域のような代わりの領域に変換される。サンプ ルのブロックを周波数領域に変換すると、種々の程度の振幅を有する1組の変換 係数が生ずる。各係数は、独立に量子化され伝送される。受信端において、サン プルは、逆(または説)量子化され、時間領域に再変換される。 変換コード化の重要性は、変換領域における信号表示で冗長情報の量を減する、 すなわちサンプル間の相関がより少ないということである。したがって、所与の 誤差値(例えば平均二乗歪)について所与のサンプルブロックを量子化するのに 、原時間領域でサンプルブロックを量子化するのに必要とするであろうビット数 よりも、少ないビット数しか必要としない、量子化のために少ないビット数しか 必要としないから、個々のチャンネルに対する伝送速度を減することができる。 変換コード化方式は、理論的には個々のT1チャンネルのビットレートを減する 必要性を満足させたが、履歴的に量子化プロセスは容認できない量のノイズや歪 を生じさせた。 一般に、量子化は、アナログ信号をディジタル形式に変化する手続きである*  IRE Transactions on Inform−ation The ory、Vol、IT−6(1960年3月)のJoel Maxの「Quan tization for minimum Dfstortion」なる論文 は、この手続きを開示している。量子化においては、信号の振幅は、有限数の出 力レベルによって表示される。各レベルは、別個のディジタル表示を有する。各 レベルはそのレベル内にある全振幅を包含するから、得られたディジタル信号は 原アナログ信号を正確に反映しない、アナログ信号とディジタル信号間の差は量 子化雑音である6例えば、信号X、ここにXは0.00と10.00間の任意の 実数である、の一様な量子化を考慮すると、5つの出力レベルが1.00.3. 00.5.00.7.00および9.00で得られる。この例における第1のレ ベルを表わすディジタル信号は、0.00と2,00間の任意の実数を意味し得 る。所与の範囲の入力信号に対して、発生される量子化雑音は出力レベルの数に 逆比例することが分かる。さらに、早期の変換コード化の量子化の研究において 、低ビツトレートにおいてはすべての変換係数が量子化されず、伝送されないこ とが見出された。 変換コード化を改善しようとする試みは、動的ビット割当てプロセスおよび動的 ステップサイズ決定プロセスを使用して量子化プロセスを研究することを包含し た。 ビット割当ては、スピーチ信号の短時間統計値、すなわちブロック毎に起こる統 計値に適合せしめられ、ステップサイズは各ブロックに対する変換のスペクトル 情報に適合せしめられた。これらの技術は、適応変換コード化法として周知とな った。適応変換コード化においては、最適のビット割当ておよびステップサイズ が、各サンプルブロックに対して、各ブロックにおける変換係数の振幅のパリア ンスで動作する適合アルゴリズムにより決定される。スペクトルエンベロープは 、各サンプルブロックにおける変換係数のパリアンスにより形成されるエンベロ ープである。各ブロックにおけるスペクトルエンベロープを知ると、ステップサ イズおよびビット割当てのより最適の選択が可能となり、歪みおよびノイズの少 ないより精確に量子化された信号が得られる。 パリアンスまたはスペクトルエンベロープ情報が、伝送前に量子化プロセスを補 助するために発生されるから、この同じ情報が、受信において逆量子化プロセス に必要となる。したがって、適応変換コード化は、量子化された変換係数の伝送 に加えて、パリアンスまたはスペクトルエンベロープ情報の伝送をも用意してい る。これは、サイド情報と称せられる。 スペクトルエンベロープは、変換領域においては、スピーチの動的特性、すなわ ちホルマントを表わす、スピーチは、周期的(有声音)、非周期的(無声音)ま たは両者の混合(例えば有声摩擦音)のいずれかである励起信号を生成すること によって発生される。励起信号の周期的成分は、ピッチとして知られる0話し中 、励起信号は、口、顎、唇、鼻腔等の位置により決定される声帯フィルタによっ て濾波される。このフィルタは、発生されつつある音の性質を決定する共鳴周波 数すなわちホルマントを有する。声帯フィルタは、励起信号に対してエンベロー プを発生する。このエンベロープはフィルタホルマントを含むから、ホルマント またはスペクトルエンベロープとして知られている。したがって、スペクトルエ ンベロープの決定がより精確になればなるほど、変換されたスピーチ信号をコー ド化するに使用されるステップサイズおよびビット割当ての決定は、ますます最 適とな特定の適応変換コード化技術の開発は、’ImprovedAdapti ve Transform Coding」と題する米国特許出願第199、3 60号に記述されている。この米国特許出願に記述される新規な方法および装置 は、単一のいわゆるLSI信号プロセッサにおいて+6kb/sのビットレート での適応変換コード化が初めて可能になったから、技術上の進歩であった。この ような結果は、時間領域サンプルの各ブロックの偶拡張を生成し、かかる拡張か ら自己相関関数を生成し、自己相関関数から直線的予測係数を誘導し、そして各 変換係数のバリアスまたはホルマント情報が各FFT係数の利得の平方に等しく なるようにかかる直線的予測係数について高速フーリエ変換を遂行することによ って達成された。また、各変換係数に割当てられるべきビット数は、変換係数の ホルマント情報の予定された基数の対数を決定し、ついで各変換係数に割り当て られることになる最小ビット数を決定し、ついで最小ピット数を対数値に加える ことによって得られることも開示された。このデバイスでの問題は、伝送速度が 16kb/s以下に減するとき、信号のすべての部分は量子化されず、伝送され ないことであった。 早期の適合変換コーダーにおいて必須のスピーチ要素を失う理由は、この種のコ ーダーが非スピーチに特有であったからである。スピーチに特有の技術において は、特定の情報がビットに割り当てられ、量子化されることを保証するために、 ビット割当て中、ピッチおよびホルマント(すなわちスペクトルエンベロープ) 情報の両者が考慮される。 IEEE Transactions on Ac oustics。 5peech、 and Signal Processing、 Vol、  ASSP−27,No、3(October、 1977)、 pp、 512 −530のJ、 Tribolat等の’Frequency Domain  Coding of 5peech」なる論文に記述される1つの従来のスピー チに特有の技術は、ピッチ周期およびピッチ利得からピッチモデルを生成するこ とによって、ピッチ情報、すなわちピッチ縞を考慮した。これらの2つのファク タを決定するために、擬似ACFを捜索して、ピッチ周期となる最大値を決定し た。ついで、ピッチ利得が、最大値が決定された点における擬似ACFの値とそ の原点における擬似ACFの値との間の比として定義された。この情報で、ピッ チ縞、すなわち周波数領域におけるピッチパターンを発生し得た。 この従来技術を使用して周波数領域におけるピッチパターンを発生されるために 、時間領域インパルス系列が画定されよう、この系列は、長さ2Nの有限の列を 生成するために、台形のウィンドで窓掛けされた。Nのポイントのみに対するス ペクトルレスポンスを生成するために、2Nポイントの複合FFTが系列から取 り出された。 結果の大きさは、単位利得に対して標準化されるとき、必要とされるレスポンス を生じた。最終のスペクトル評価値を生成するために、ピッチ縞およびスペクト ルエンベロープは乗算され、標準化された。結合されたピッチ縞およびスペクト ル情報をグラフ化する際、ピッチ縞は一連のU字状の曲線として現われ、そして 2Nポイントのウィンドに多数の反復が存在する。 この全プロセスは、各サンプルブロックに対して適応的に生成された。この従来 技術に関する問題点は、その実施の複雑性であった。スピーチに特有の適応変換 コーダー(米国特許出願第199,015号)においては、ピッチ縞がずっと簡 単な実施形態で考慮に入れられた。前述のTribolet等の技術に鑑みて、 ピッチ周期が1であり、有限の系列を生成するために使用されるウィンドが方形 である場合を考えよう、ピッチの得られたスペクトルレスポンスは、単一のU字 状である。前記特許出願においては、l以外の異なる数のピッチ周期に対しては 、スペクトルレスポンスは、ピッチ周期が1の場合のピッチスペクトルレスポン スの単なるサンプル形態であると記載ささらに、同じピッチ周期を維持しながら エネルギおよび大きさをスケール(係数倍)したときの、具なる値のピッチ利得 に対するピッチ綿量の差は、主としてU字状の幅に関係づけられると記述されて いる。上の記述に基づくと、各サンプルブロックに対してピッチスペクトルを適 応的にに決定することは必要でなく、むしろかかる情報は予め発生された情報を 使って生成されたと判断される。ピッチスペクトルレスポンスは、予め形成され メモリに記憶されたルックアップテーブルから適応的に生成された。ルックアッ プテーブルは、ピッチ情報を生成するためにルックアップテーブルがサンプルさ れる前に、各サンプルブロックごとに、ピッチ周期およびピッチ利得との関係に おいて先ず適応的にスケールされた。 一度スケールファクタが決定されると、ルックアップテーブルはスケールファク タにより乗算され、得られたスケールされたテーブルが、ピッチ縞を決定するた めにモジュロ2Nでサンプルされた。 米国特許出願第199.360号と同様に、この技術に関する問題点は、18k b/sにて良好な特性を示すが、従来のシステムにより示されたのと同じ問題、 すなわち特定のスピーチ要素が非量子化に起因して失われるという問題が、約9 .6kb/aのビットレートにて現われた。この損失は、’shハ’thJ、’ phJ、 ’sc」オヨU ’pth」(D J: ’) t 音ニ対してとく に明瞭である。 IEEE Transactions on Communications、  vol、 C0M−30、No、4 (1982年4月)、pp、600−6 14. のB、S、At1asの’Predictive Coding of  5peech at Low Bit Rates」なる論文には、スピーチ 信号のいわゆる適応予測コード化の使用で10kb/sまたはそれ以下の伝送速 度を達成し得ることが示唆されている。予測コード化においては、時間領域信号 から冗長構造が除去され、その後肢信号が量子化され、伝送される。このような 構造は、予測予備を評価し、現在信号値からその値を減することによって除去さ れる。予測子は、別個に伝送され、受信機により時間領域信号に再加算される。 予測子は、2つの成分を含み、その一方はスピーチ信号の短時間スペクトルエン ベロープに基づくものであり、他方は短時間スペクトル微細構造に基づくもので あり、そしてこれはピッチ周期とボイスの周期性の程度により主として決定され ると記述されている。 Atalの特許はまた、量子化用ノイズのスペクトルを 制御するために、予測コード化におけるノイズ成形の使用を示唆している。詳述 すると、At1asの文献は、ノイズ成形予測モデルスペクトルを生ずるための 前置フィルタ/後置フィルタの手法を利用している。 Atalの文献の手法に 関する問題点は、その実施の難しさである。 本発明まで、変換コード化と予測コード化は分離した別個の技術であったことも 注目されるであろう。 したがって、より低ビツトレートで効率的に動作し得、低ノイズレベルを有し、 妥当な価額と処理時間で実施できる適応変換コード化装置の必要性がなお存在す る。 [発明の概要] 本発明の目的および利点は、情報サンプルより成るサンプルされた時間領域スピ ーチ信号から、該スピーチ信号の量子化に先立ち、該スピーチ信号を情報サンプ ルのブロックに逐次的に分離する変換コード化装置において周期性を除去する装 置および方法で達成されるが、本発明は、サンプルブロックの各々においてピッ チを決定し、各ブロックに対して決定されたピッチに基づいてブロックの各々に 対する長時間予測パラメータを決定し、ピッチおよび長時間予測子パラメータに 基づいて、ブロックの各サンプルに対する周期性を計算し、対応サンプルから周 期性の値を減することによって修正された差サンプルブロックを生成し、そして 差ブロックの各々について適応変換コード化を遂行するための装置および方法を 含むものとして示されている。 本発明のこれらおよびその他の目的および利点は、下記の図面を参照して行った 以下の詳細な説明から明らかとなろう。 [図面の簡単な説明] 第1図は、本発明に従う適応変換コード化装置の概略図である。 第2図は伝送前に第1図に示される適応変換コード化装置で遂行される動作のフ ローチャートである。 第3図は、長時間予測子(LTP)動作を遂行するときの、第2図に示される動 作の部分的なより詳細なフローチャートである。 第4図は、長時間予測子(LTP)動作を遂行するときの、第2図に示される動 作の部分的なより詳細なフローチャートである。 第5図は、長時間予測子(LTP)動作を遂行するときの、第2図に示される動 作の部分的なより詳細なフローチャートである。 第6図は、第2〜9図に示されるLPG動作のより詳細なフローチャートである 。 第7図は、第2〜9図に示されるエンベロープ生成動作のより詳細なフローチャ ートである。 第8図は、第2〜9図に示される整数ビット割当て動作のより詳細なフローチャ ートである。 第9図は、受信に続き第1図に示される適応変換コード化装置において遂行され る動作のフローチャートである。 [実施例] 図面に関してより完全に説明されるように、本発明は、伝送速度が十分に減ぜら れた適応変換コード化のための新規な装置および方法で具体化される。一般的に 言うと、本発明は、量子化されるべき信号を減することによって伝送速度を低減 した。換言すると、本発明に従う変換コード化装置は、量子化動作前に、ボイス 信号に含まれる情報を最小に減じた0本発明に従うと、伝送速度は、妥当な価額 および処理時間で実施できる装置において初めて8kb/a程度に減することが できる。 伝送速度の主たる低減は、ノイズ信号から周期性を除去することからもたらされ る。周期性情報は、−皮除去されると、サイド情報として伝送され、受信機によ りボイス信号に再加算される。技術を適応性にするために、追って詳述されるよ うに、周期性はブロックごとに決定され除去される。この出願に使用されるよう に、周期性の決定および除去は、長時間予測子技術(LTP)と称される。 本発明に従う適応変換コード化装置が、第1図に図示されており、総括的にlO として言及されている。コード化装置10の心臓部はディジタル信号プロセッサ であり、そしてこれは、好ましい具体例においては、テキサス所在のTexa@ 、Instruments、 Incにより製造販売されるTMS320C25 ディジタル信号プロセッサである。この種のプロセッサは、16ビツトのワード 長を有するパルスコード変調信号を処理し得る。 プロセッサ12は、3本の主バス網、すなわち直列ボートパス14、アドレスバ ス16およびデータバスヱ8に接続されるものとして示されている。プログラム メモリ20が、本発明に従う適応変換コード化を遂行するために、プロセッサに より利用されるべきプログラミングを記憶するために設けられている。このプロ グラミングについては、第2〜9図を参照して詳細に説明される。 プログラムメモリ20は、プロセッサ12の規格要件を満足させるに十分の速度 を有するならば、任意の従来設計とし得る。好ましい具体例のプロセッサ(7M S320C251は内部メモリを備えることを認められたい、まだ合体されてい ないけれども、この内部メモリに適応変換コード化プログラミングを記憶するこ とが好ましい、データメモリ22が、プロセッサ12の動作中必要とされ得るデ ータ、例えば対数表を記憶するために設けられている。 対数メモリの使用は、追って一層明らかとなろう。 クロック信号が、従来形式のクロック信号発生回路(図示せず)によりクロック 人力24に供給される。好ましい、実施例において、入力24に供給されるクロ ック信号は、40MHzクロック信号である。リセット人力26も、プロセッサ 12が最初に賦活されるときのように、適時にプロセッサ12をリセットするた めに設けられている。従来形式の回路が入力26に信号を供給するために設ける ことができるが、これは、信号が選ばれたプロセッサにより要求される規格に適 合する限り任意のものでよい。 プロセッサ12は、2つの方法で通信信号を送信し、受信するように接続されて いる。第1に、プロセッサ12は、本発明に従って構成される適応変換コード化 装置と通信するとき、直列ポートバス14を介して信号を受信し、送信するよう に接続されている。バス14を圧縮ボイスデータ列と結合するために、チャンネ ルインターフェース28が設けられている。インターフェース28は、特定され た伝送速度にて動作するデータ列との関連においてデータを送信し、受信するこ とができる任意の形式のものとし得る。 既存の64kb/sチヤンネルまたはアナログデバイスと通信するとき、プロセ ッサ12は、データバス18を介して信号を受信し、送信するように接続される 。コンパレータ30が、入力32に現われる個々の64kb/sチヤンネルを、 バス18に供給のため直列形式から並列形式に変換するために提供するために設 けられたいる。認められるように、この変換は、プロセッサ12により利用され る信号形式と使用できる周知のコードおよび直列/並列デバイスを利用して遂行 できる。好ましい実施例において、プロセッサ12は、バス18上に並列16ビ ツトの信号を受信し、送信する。バス18に供給されるデータをさらに同期させ るため、プロセッサ12の入力34に割込み信号が供給される。アナログ信号を 受信するとき、アナログインターフェース36は、コンバータ3゜に提示のため この信号を予定された速度でサンプルすることによってアナログ信号を変換する 働きをする。インターフェース36は、送信するときは、コンバータ30からの サンプルされた信号を連続信号に変換する。 次に、第2〜9図を参照してプログラミングについて説明するが、これは第1図 に示される諸要素と関連して利用されるとき、新規な適応変換コード化装置を提 供する0本発明に従って通信信号を伝送するための適応変換コード化が、第2図 に示されている。コード化され送信されるべき通信信号は、大力バッファ40に 提供される。この通信信号は、サンプリングが8kHzの周波数で行われる場合 、各サンプルの16ビツトPCM表示より成るサンプル信号である6本記述の目 的のため、8kHzにてサンプルされたボイス信号が伝送のためにコード化され るべきものと仮定する。バッファ4oは、予定数のサンプルをサンプルブロック に累積する。好ましい実施例においては、各ブロックに120のサンプルが存在 する。LPTは、41にて各ブロックについて遂行される。 LPT動作につい ては、第3〜5図との関連においてより詳細に記述される。 LPTは量子化前 にボイス信号を低減するから、LPTプロセスは41にて行われる。 周期性ないしピッチに基づく情報の除去/再導入プロセスは、ディジタルフィル タ技術の使用により遂行されるが、この操作は本明細書にLPTと称される。  LPTフィルタを誘導するための基本的必須条件は、精確なピッチまたは基本周 波数評価値を計算することである。ピッチを決定すること自体は新しいことでは ない、従来、ピッチは、サンプルブロックの自己相関関数(ACF)をまず誘導 し、ついで特定の範囲にわたりAFCを最大値について捜索することによって決 定された。この最大値はピッチと称される。 (Tribolet等の文献参照 )、都合の悪いことに、ピッチ以外の他の成分も存在することが発見された。し たがって、サンプルブロックから誘導されるACFは、スプリアスビークを示す ことがあり、そしてこれは不正確なピッチ評価値をもたらすことがある0本発明 に従えば、バッファ40により供給されるサンプルブロックは、まずローパスフ ィルタ42を介して濾波される。 好ましい実施例において、ローパスフィルタ42は、1800Hzおよび240 0Hzにて3dBのカットオフ周波数を有する8タツプ有限インパル応答フイル タである。関係のある周波数範囲は約50Hzないし1650Hzである。この 範囲は、デュアルトーンマルチ周波数(DTMF)を包含を許容する0本発明の コード化装置の特性の1つは、DTMF情報を通すことができることである。 したがって、フィルタは、fi97−1633Hzの周波数範囲を含むのが好ま しい。濾波された信号は、ついで44にて3レベル中心クリツプ技術を使用して 処理される。第4図を簡単に参照して、3レベル中心クリツプ・技術について詳 細に説明する。スピーチ信号のピッチを決定することに関連して中心レベルクリ ップを使用することは新しいことではないことに留意されたい、 IEEE T ransact〜fans on Acoustics、5peech and  Signal Processing。 Vol、 ASSP−24,No、1 (1987年2月)のOubnowsk i等の’Real−Timeロ゛1g1tal Hardware Pitch  Detectorj と題する論文は、この種の技術を開示している。しかし ながら、LTP操作に関連して中心レベルクリップを使用することは新しい。 ローパスフィルタ42からのサンプルブロックは、まず46にて2つの等しいセ グメントに分割される。これらのセグメントは、本明細書においては×1および ×2で指示されている。サンプルブロックの第1の半分X1は、その中に含まれ る絶対最大値を決定するために、48で評価される。この絶対最大値は、スレッ ショルドを誘導するのに使用されるが、このスレッショルドは、好ましい実施例 においては最大値の57%である0時間領域信号を半分に分割する理由は、ブロ ック間の振幅のふらつきから保護するためである。このようなふらつきは、続い て発生される自己相関関数の完全性、したがって最終のピッチの決定に影響を及 ぼすことがあり得る。このような事象を防ぐために、時間領域信号は、半分に分 割される。 3レベル中心クリップ操作は、下式にしたがい50にて遂行される。 c (n) =+1 s (n)≧Tc (+)=−js(n)≦−Tc = 0 他の場合 ここで、Tc=振幅スレッショルド 上のことから、スレッショルド(48で決定される最大の57%)を越える値の みが保埼されることが分かろう、したがって、最大値が強調されたが、この強調 は、第3図に記載される後の処理との関連において明らかとなろう、サンプルブ ロックの第1の半分x1に関して3レベル中心クリップ操作を遂行したから、サ ンプルブロックの第2の半分X、に対する絶対最大値は、52で決定される。3 レベル中心クリップ操作は、54にてx2に関して遂行される。ステップ54に て利用されるスレッショルド値は、52で決定された絶対最大値に基づく、54 にて3レベル中心クリップ操作を遂行した後、中心でクリップされた結果は、5 6にて全処理ブロックに結合される。全サンプルブロックに関して3レベル中心 クリップ操作を遂行したから、サンプルブロックの自己相関関数が58で誘導さ れ、ACF(M)で記される最大自己相関関数値を決定するために捜索される。 最大値はピッチとして定義される。58にてピッチを効率的に決定したから、こ こでピッチ利得が60にて計算される。ピッチ利得は、下式にしたがって計算さ れる。すなわち、ここで、R(M)は、ピッチ値(M)における自己相関関数の 値である。 R(0)は、その原点における自己相関関数の値である。 60にてピッチ利得を決定したから、62にてピッチ利得がスレッショルド値よ りも大きいか否かがここで決定される。ピッチ利得は比であり、したがって、無 名数であることが認められよう。好ましい実施例において、ステップ62にて使 用されるスレッショルドは値0.25である。ピッチ利得がこのスレッショルド 値より大きいと、サンプルブロックは有声ブロックと称される。ピッチ利得がこ のスレッショルド値より小さいと、サンプルブロックは無声ブロックと称される 。サンプルブロックが有声であるか無声であるかの意味は、本発明の好ましい実 施例に関してのみ重要である。 LTP操作を各サンプルブロックについて遂行 することは、本発明の技術思想内にある。しかしながら、LTP操作は各サンプ ルブロックについて遂行されることをを要しないことが分かった。 LTP操作 が必要とされないブロックは、無声ブロックである。無声ブロックにおいては、 周期性は小さい。 したがって、その除去は不必要であり、時間の浪費である0本発明の好ましい実 施例においては、LTP操作は、有声サンプルブロックであると決定されたサン プルブロックに関してのみ完成される。 この点において、適応変換コード化装置10は、特定のサンプルブロックに関し て適応的にピッチおよびピッチ利得を決定した。 LTP操作は、ここで、第5 図に示される動作との関係においてピッチに基づく情報を除去する。 LTP操 作は、サンプルブロックにおける所与のサンプルと先行のピッチ周期からの対応 するサンプルの差を抽出することによって、ピッチに基づく情報を除去する。こ の動作は、サンプルブロック内の各サンプルに関して遂行される。実際に、ピッ チに基づく成分により惹起されるサンプルブロックの基本的周期性は、LTP操 作により減ぜられつつある。 LTP操作の結果は、下記のように、入力スピー チ波形またはサンプルブロックs (n)に関して差信号である。 e (n) =s (n) −as (n−M) (3)ここで、α=ピッチ利 得にほぼ等しい定数。 s (n) =時点nにおけるスピーチ信号e (n) −差信号 M =ピッチ 都合の悪いことに、式(3)は、ピッチ(M)のみを考慮に入れた1タツプ予測 子であるから、ピッチ(M)の正数値のみが許容される。しかしながら、大変頻 繁に、関係のある値、すなわち最大の周期性を除く値は非整数値である。好まし い実施例において、差信号e (n)は、下式に従い2タツプ予測子に従って決 定される。 e (n) =s (n)−βr −s (n−M)−βi・s(n−M−1)  (4)修正係数β1およびβ2は下式に従って計算される。 β寡およびβ、 LTPパラメータと称される。上の式から、差信号e (n) は58にて計算されたピッチに関係する時間遅れを有するサンプルの直線的組合 せにより構成されることか分かろう。 第5図を再度参照すると、式(4) 、 (5)および(6)の使用が記述され ている6種々の相関関数値が、バッファ40により生成される原サンプルブロッ クとの関連において64で決定される。計算された値は、下記の如くである。す なわち、 R(0) =原点におけるACF値、 R(1)冨1におけるACF値、 R(M−+1鴬ピッチ−1におけるACF値、R(M)・ピッチにおけるACF 値、そしてR(M+++1鴬ピツチ+1けるACFイ直 。 上述の動作に関連して、作用されつつあるサンプルブロックのいずれかの側、す なわち前側または後側のブロックに含まれるサンプルを利用することが必要とな り得ることが注目されよう、したがって、ある数の逐次のサンプルブロックを記 憶することが必要となるが、これは例えばバッファ40により遂行され得る。 上式は、現在サンプルの評価値を形成するものとしてMおよびMl1の時間遅れ で起こるサンプルに依存することも注目されよう。しかしながら、M−1および Mの時間遅れを有するサンプルを利用して、代わりの評価値を利用するのが好ま しいかもしれない、このような動作は本発明の原理を実施するために必須ではな いが、本発明の好ましい実施例において利用される。したがって、66にて、M l1におけるACF値がM−1におけるACF値より大きいか否かが決定される 。もしもM◆1におけるACF値が大きければ、LTPパラメータβ1およびβ 2が式5および6にしたがって計算される。 もしもMlIAにおけるCF値が大きくなければ、適応変換コード化装置は、7 0.71および72に書かれた動作に従ってLTPパラメータを計算する。70 にて、R(Ml1)の値は値R(M−1)に等しくなる。そのとき、β寡および β2が、71にて式5および6を使用して計算される。 β1およびβ2について計算された値は72にて交換され、β1がβ2について 71で計算された値でありかっβ2がβ1について71で計算された値であるよ うになされる。ピッチ(Mlは1減算され、サイド情報として伝送される。72 にて、結果を交換した後、β1およびβ2はLTPパラメータとして利用される 。 不安定性を防ぐため、本発明の適応変換コード化装置は、nlおよびβ2の和を 制限する。これは、第5図において、74にて、β、+β暑の絶対値が879よ り小さいか否かをまず決定することによって達成される。もしもβ工◆β2の絶 対値が879よりも小さいと、差信号e (nlが、式(4)に従い76にて生 成される。β【÷β2の絶対値が879より小さければ、LTPパラメータは、 77にてβ1◆β、lI8/9となるようにスケールされる。77にてLTPパ ラメータが879に等しくなると、差信号a (n)が、式4を使って76にて 発生される。先に言及したが、信号s (nlを再構成するためには、β1、β 2およびピッチ(M)の値をサイド情報として伝送することが必要となることが 再度注目されよう、76にて発生される差信号は、その後、78にて行われる窓 掛は動作のために提供される。 LTPにより変更された各サンプルブロックは、78にて窓掛けされる。好まし い実施例において、使用される窓掛は技術は台形の窓[h (3R−N) lで あるが、ここでNのスピーチサンプルの各ブロックは、Rのサンプルだけ重畳さ れる。 主題のブロックは、80にて離散余弦変換を利用して時間領域から周波数領域に 変換されるにの変換は変換係数のブロックをもたらすが、この変換係数は82に て量子化される。量子化は、ガウスの信号について最適化された量子化装置によ って各変換係数について遂行される。しかして、この量子化装置は周知である( MAX参照)0個々の係数について割り当てられる利得(ステップサイズ)およ びビット数の選択は、本発明の適応変換コード化機能にとって重要である。この 情報がないと、量子化は適応的とならない。 ブロック当たりの単位サンプルについて利得およびビット割当てを展開するため 、まずビット割当てに対して既知の式を考える。すなわち、 R+ =I RIIVll + 0.5 $ logs [V+”/Vb+oc %] (7)ここで、Vsrock” ” [rT 1111.11 V+”] のn乗根 (8)Rtotml・ Σ1□、s [R1] (9)ここで、 R,はi番目のOCT係数に割り当てられたビット数。 RT6t□はブロック当たりに利用され得る総ビット数。 RIIV@は各OCTに割り当てられた平均ビット数。 v 、 2はi番目のOCT係数のパリアンス。 vo。ck”はOCT係数に対するVlの幾何平均。 式(7)はビット割当て式であり、この式から、得られるR、は、総計されると き、単位ブロックに割り当てられた総ビット数に等しくなるはずである。下記の 誘導は実施のための必須要件を減じ、好ましい実施例のプロセッサを利用すると き必要とされるような、16ビツト固定点演算を使用して計算を遂行することと 関連して起こるダイナミックレンジの問題を解決する0式(7)は下記のように 再構成できよう、すなわち、 R1冨[RIIV@ −logs (V1+acm”)] ” 0.5 $ l ogs(vt”)角括弧内の項は予め計算でき、かつ係数指数(i)に依存しな いから、かかる項は一定であり、γと記すことができる。したがって、式(10 )は下記のように書き変えることができる。R1・ γ ◆0.5 * Sr  (11)Sr −Uogx (vt ”) (12)項v 、 2は、i番目の [lVT係数のパリアンス、すなわち、i番目の係数がスペクトルエンベロープ 内に有する値である。したがって、スペクトルエンベロープを知ると、上式に対 する解が得られる。すなわち、z* eJ2elil/INI (in、N−1 lテ評価されて、H(zl ・ 利得/(1+Σ1ll11.F[ak傘Z−” ]) (13)ここで、H(z)はOCTのスペクトルエンベロープであり、a kは線形予測係数である9式(13)は、1組のLPG係数のスペクトルエンベ ロープを定める。 OCT領域におけるスペクトルエンベロープは、LPG係数 を変更し、ついで(13)を評価することによって誘導できる。 第2図に示されるように、窓掛けされた係数は、84にて1組の係数を決定する ように作用せしめられる。 LTP係数を決定するための技術は、第6図に詳細に示されている。窓掛けされ たサンプルブロックは、86にてx fn)で指示されている。 x(n)の偶 拡張が88にて生成されるが、この偶拡張はy (n)で指示されている。 y (n)の他の定義は、下記のごとくである。 y(n) w x(n) nMO,N−1−x(2N−1−n) n−N、 2 N−1(14)式(14)の自己相関関数(ACF)が90にて生成される。 y (n)の八CFは疑似ACFとして利用され、そしてこれからLPGが92 にて周知の態様で誘導される。 LPG (a、)を生成したから、式(13) は、ここでスペクトルエンベロープを決定するように評価できる。第2図におい て、好ましい実施例においては、LPGがエンベロープ生成に先立ち、94にて 量子化されることが注目されよう。この点における量子化は、96にてサイド情 報としてLPGの伝送を許容する目的を果たす、第2図に示されるように、スペ クトルエンベロープは98にて決定される。これらの決定についての詳細な記述 は、第7図に示されている。100にて、式(13)の分母を表わす信号ブロッ クz (n)が形成される。ブロックz(n)は、さらに下記のように定義され る。すなわち、 z(n) =1.OnMO = annsl、P 諺 0.On=P+1.2N−1(15)ブロックz (n)は、しかる後、高 速フーリエ変換(FFT)を使用して評価される。さらに詳述すると、z(n) は、z(n)が0−N−1の値のみを有する場合、NポイントFFTを使用する ことによって、102にて評価される。このような動作は、1lIO,2,4, 6−−−−、 N−2に対して結果v 、 2を生ずる0式(14)はv 、  2のLog、を必要とするから、各パリアンスの対数が104にて決定される。 奇数の順番の値を得るため、幾何的内挿が、106にてv 、 2の対数領域に おいて遂行される。 好ましくはないが、2NポイントFFTを利用してz (n)を評価することも 可能である。かかる状況においては、内挿を遂行することは必要とされないであ ろう、 2NポイントFFTを使用することに関する問題点は、FFTがサイズ の2倍であるから、好ましい方法よりも処理時間を要することである。 パリアンス(v、”)は、80にて決定される各OCT係数に対して、108に て決定される。パリアンスv 、 2は、H(z)が下式、すなわち、 Z ! 6JZal l/2Nl 、 i*0.n−1に対して (16)で評 価される場合の式(13)の大きさであるとして定められる。 より簡単にするため、下記の式を考える。すなわち、v 、 2 、 [利得/ FFT11の大きさの二乗 (17)項v 、 2は決定するのが比較的容易で ある。これは、FFT、の分母が106にて決定されるi番目のFFT係数であ るからである。スペクトルエンベロープを決定したから、ビット割当てが110 で遂行される。 式 (7)〜(9)はビット割当てを決定するための周知の技術を記述している ことが思い起こされよう、ついで、式(11)および(12)が誘導された。簡 単化されたビット割当てを遂行するために一片の式のみが残る0式(11)を式 (9)に代入することにより、下式が得られる。すなわち、 RT。tal 寓 0.5 傘 Σ l−1,8[Sll ◆ N 傘 γ ( 18)式(18)を整理すると、下式のようになる、すなわち、γ ・ [RT 。、、、 −0,5傘 Σ l−1,N (St)]/N (19)ここで、N はブロック当たりのサンプルの数であり、RT+1tlllは単位ブロックにつ いて得られるビット数である。 110で遂行されるビット割当ては、第8図に詳細に示されている0式(12) を利用すると、各Slは112で決定される。これは比較的簡単な演算である。 各Stを決定したから、式(18)を使用してγが114で決定される。 これも比較的簡単な演算である。好ましい実施例において、ブロック当たりのサ ンプルの数は128である。したがって、Nは始めから既知である。 ブロック当たりに利用可能なビット数も始めから既知である。好ましい実施例に おいて各ブロックが台形のウィンドを使して窓掛けされつつあり、16のサンプ ル、ウィンドの各側に8ずつ、が一部重量されつつあることを考慮に入れると、 フレームサイズは120サンプルである、もしも伝送が、例えば9.6 kb/ sの固定の周波数で行われていると、120のサンプルは約15m5かかるから (サンプル120を8k)Izのサンプリング周波数で割った数)単位ブロック 当たり利用可能なビットの総数は144である、 LPT情報+ピッチ情報を伝 送するには、14ビツトが必要とされる。 LPG係数のサイド情報を伝送する に必要とされるビット数も既知である。したがって、Ryatalも下式から分 かる。すなわち、 RT、t111@144−サイド情報で使用されるビット数。 各S1、RyatalおよびNはいまやすべて分かっているから、114にてγ を決定することは、式(18)を使用して比較的簡単である。 各81およびγを知ると、各R,は、式(11)を使用して116で決定される 。やはり比較的簡単な演算である。この手続きは、もはや式(10)により要求 されるような幾何平均Vbl。ak”を計算することが必要でないから、各81 の計算をかなり簡単化する。この手続きを利用することにおける他の利点は、式 (11)に対する入力値としてslを使用すると、実時間実施のための固定点演 算において式(2)のようなアルゴリズムを実施することに関連して起こるダイ ナミックレンジの問題が低減されることである。 る。 98にて量子化利得ファクタを決定し、110にてビット割当てを決定したから 、82にて量子化を完了し得る。 DCT係数は、量子化されてしまうと、11 8にてサイド情報とともに伝送のためフォーマット化される。得られたフォーマ ット化信号は、120にてバッファ記憶され、予定された周波数にて直列に伝送 される。ここで、本発明の原理に従って適応コード化されたボイス信号が受信さ れたとき利用される適応変換コード化手続きにいて考える。かかる信号は、イン ターフェース28により直列ポートバス14に提示されることが思い起こされよ う。第9図を参照すると、単一のブロックと関連するビットの全ビットがほぼ同 時に作用せしめられることを保証するために、信号はまず121にてバッファ記 憶される。バッファ記憶された信号は、ついで122にて逆(または脱)フォー マット化される。ブロックと関連しサイド情報として伝送されたLPG係数、L TPパラメータ、ピッチ周期およびピッチ利得は、122にて集められる。これ らの係数はすでに量子化されていることが認められよう、その後、126にて、 第7図を参照して記述したのと同じ手続きを使用して、スペクトルエンベロープ が生成される。得られた情報は、その後、逆量子化動作セクション128(情報 はやはり量子化を表わしているから)およびビット割当て動作セクション130 の両者に提供される。ビット割当ての決定が、第8図に関連して記述した手続き に従って遂行される。 ビット割当て情報は、逆量子化動作セクション128に供給され、したがって適 正数のビットが適当な量子化装置に提示される1割り当てられた利得およびビッ ト数も既知であるから、適正数のビットで、各逆量子化装置は、OCT係数を逆 量子化する。逆量子化されたDCT係数は、132にて時間領域に再変換される 。 LTP操作が41にて時間領域信号について遂行されるから、ピッチに基づく成 分を時間領域信号に再加算することがここで必要となる。 LTP係数は、下式 にしたがって加えられる。すなわち、 5(n) □ e(n)+βI −(n−M)+β=・S (n−M−1) ( 22)ここで、e (n)は、132にて発生される時間領域信号である。 β、およびβ2はLTPパラメータである。 Mはピッチである。 β5、β3およびピッチはサイド情報として伝送されたことが思い起こされるで あろう、かかるパラメータは、逆フォーマット化ステップ122からステップ1 34に供給される0時間領域信号に周期性情報を再加算したから、138にて信 号に鋭意掛けすることがここで必要となる0本発明は、好ましい実施例において は、逐次のサンプルブロック間の信号の不連続性の影響を最小にする用意がなさ れている。これらの不連続性は、重み付はオーバーラツプ技術の使用により回避 できされる。この技術は、オーバーラツプまたはウィンド領域の開始時に先行の ブロックからのサンプルに強い強調を、そしてオーバーラツプセグメントまたは ウィンドの終端領の近傍に現在ブロックに強い強調を配することを目的とする。 このような重み付はオーバーラツプ技術は、下式に従い実施される。 ここで、S、は現在のサンプルブロックに等しい。 鋭意掛けされたブロックは、140にてバッファ記憶され、バス18に提供前に 逐次形式に整列される。このようにしてバス18上に供給された信号は、コンバ ータ30(第1図)により並列から直列に変換され、32に出力されるか、アナ ログインターフェース32に供給される。 以上本発明を特定の実施例について説明したが、技術に精通したものであれば、 本発明の原理から逸脱することなく修正、変更をなし得ることが認められるであ ろう。 FIG、8 FIG、9 国際調査報告

Claims (31)

    【特許請求の範囲】
  1. (1)情報サンプルより成るサンプルされた時間領域スピーチ信号から、該スピ ーチ信号の量子化に先立ち、該スピーチ信号を情報サンプルブロックに逐次的に 分割する変換コード化装置において周期性を除去するための装置において、 スプリアスピークを除去するため、前記サンプルブロックの各々を濾波するため の手段と、 ビッチを決定するに必要な前記ブロック内に含まれる特定のサンプルを増強する ためのクリップ手段と、前記クリップ手段により操作した後、前記サンプルブロ ックの各々の自己相関関数を生成するための関数手段と、 前記自己相関関数における最大値を決定するためのピッチ手段と、 前記自己相関関数に含まれる前記最大値およびその他の値に関連して長時間予測 子(LTP)パラメータを決定するためのLTP手段と、 前記最大値および前記長時間予測子パラメータに基づいて、前記ブロック内の各 サンプルに対する周期性値を計算し、対応するサンプルから前記周期性値を減算 することによって修正された差サンプルブロックを生成するための差生成手段と を備えることを特徴とするスピーチ信号から周期性を除去する装置。
  2. (2)前記フィルタ手段が、約OHz〜約1650Hzの周波数範囲を有するロ ーパスフィルタより成る請求の範囲第1項記載の周期性除去装置。
  3. (3)前記フィルタが、1800Hzおよび2400Hzにて3dBのカットオ フ周波数を有する8タップ有限インパルスレスポンスフィルタより成る請求の範 囲第1項記載の周期性除去装置。
  4. (4)前記自己相関関数に関してビッチ利得を計算するための計算手段と、該前 記ビッチ利得が基準値を越える時点を決定するためのスレッショルド手段を備え る請求の範囲第1項記載の周期性除去装置。
  5. (5)前記基準値が0.25である請求の範囲第4項記載の周期性除去装置。
  6. (6)前記クリップ手段が、前記ブロックを複数のより小さいブロックに分割す るための手段と、前記小ブロックを、該小ブロックの各々内の最大値について捜 索するための捜索手段と、前記小ブロックの各々内の、スレッショルド値を越え るサンプルを識別づけるための増強手段と、該増強手段により識別づけられる全 サンプルを単一のブロックに結合するための結合手段を備える請求の範囲第1項 記載の周期性除去装置。
  7. (7)前記分割手段が前記ブロックを2つのより小さなブロックに分割する請求 の範囲第6項記載の周期性除去装置。
  8. (8)前記増強手段が、下式、すなわち、c(n)=+1s(n)≧Tc =−1s(n)≦−Tc =0他の場合 ここで、Tc=振幅スレッショルド 従ってサンプルを識別づける請求の範囲第7項記載の周期性除去装置。
  9. (9)前記差信号が、下式、すなわち ▲数式、化学式、表等があります▼ ここで、M=ビッチ β1およびβ2=長時間予測子パラメータにしたがって生成され、前記長時間予 測子パラメータが、下式、すなわち、 ▲数式、化学式、表等があります▼ ▲数式、化学式、表等があります▼ ここで、R(0)=原点におけるACF値、R(1)=1におけるACF値、 R(M−1)=ビッチ−1におけるACF値、R(M)=ビッチ0におけるAC F値、そしてR(M+1)=ビッチ+1におけるACF値に従って決定される請 求の範囲第1項記載の周期性除去装置。
  10. (10)β1およびβ2の和を基準値に比較するためのコンパレータを備える請 求の範囲第9項記載の周期性除去装置。
  11. (11)前記基準値が8/9である請求の範囲第10項記載の周期性除去装置。
  12. (12)β1+β2=前記基準値であるようにβ1およびβ2をスケールするた めのスケール手段を備える請求の範囲第10項記載の周期性除去装置。
  13. (13)R(M+1)がR(M−1)より大きいか否かを決定するためのコンパ レータを備える請求の範囲第9項記載の周期性除去装置。
  14. (14)β1およびβ2の計算に先立ちR(M+1)に対してR(M−1)を置 換するための手段と、β1およびβ2に対して計算された値を交換するための交 換手段と、伝送前にビッチ(M)を1だけ減ずるためのデクリメント手段を備え る請求の範囲第13記載の周期性除去装置。
  15. (15)情報サンプルより成るサンプルされた時間領域スピーチ信号から、該ス ピーチ信号の量子化に先立ち、該スピーチ信号を情報サンプルブロックに逐次敵 に分割する変換コード化装置において周期性を除去するための装置において、 前記各サンプルブロック内のビッチを決定するための手段と、 各ブロックに対して決定されるビッチに基づいて前記各ブロックに対する長時間 予測パラメータを決定するためのLTP手段と、 前記ビッチおよび前記長時間予測子パラメータに基づいて、前記ブロック内の各 サンプルに対する周期性値を計算し、対応するサンプルから前記周期性値を減算 することによって修正された差サンプルブロックを生成するための差生成手段と 、 前記差サンプルブロックの各々について適応変換コード化を遂行するための適応 変換コード化手段とを備えることを特徴とするスピーチ信号から周期性を除去す るための装置。
  16. (16)情報サンプルより成るサンプルされた時間領域スピーチ信号から、該ス ピーチ信号の量子化に先立ち、該スピーチ信号を情報サンプルブロックに逐次敵 に分割する変換コード化装置において周期性を除去するための方法において、 スプリアスピークを除去するため、前記サンプルブロックの各々を濾波し、 ビッチを決定するに必要な前記ブロック内に含まれる特定のサンプルを増強し、 クリップ手段により操作した後、前記サンプルブロックの各々の自己相関関数を 生成し、 前記自己相関関数における最大値を決定することによってビッチを決定し、 前記自己相関関数に含まれる前記最大値およびその他の値に関して長時間予測子 (LTP)パラメータを決定し、 前記最大値および前記長時間予測子パラメータに基づいて、前記ブロック内の各 サンプルに対する周期性値を計算し、 対応するサンプルから前記周期性値を減算することによって修正された差サンプ ルブロックを生成する諸段階を含むことを特徴とするスピーチ信号から周期性を 除去する方法。
  17. (17)前記濾波段階が、約OHz〜約1650の周波数範囲を有するローパス フィルタを提供することより成る請求の範囲第16項記載の周期性除去方法
  18. (18)前記濾波段階が、1800Hzおよび2400Hzにて3dBのカット オフ周波数を有する8タップ有限インパルスレスポンスフィルタを提供すること より成る請求の範囲第16項記載の周期性除去方法。
  19. (19)前記自己相関関数に関してビッチ利得を計算するし、該ビッチ利得が基 準値を越える時点を決定することを含む請求の範囲第16項記載の周期性除去方 法。
  20. (20)前記基準値が0.25である請求の範囲第19項記載の周期性除去方法 。
  21. (21)前記増強段階が、前記ブロックを複数のより小さいブロックに分別し、 該小ブロックを、該小ブロックの各々内の最大値について捜索し、前記小ブロッ クの各々内の、スレッショルドを越えるサンプルを識別づけ、そして増強手段に より識別づけられた全サンプルを単一のブロックに結合することを含む請求の範 囲第16項記載の周期性除去方法。
  22. (22)前記分割段階が、前記ブロックを2つのより小さなブロックに分割する ことを含む請求の範囲第21項記載の周期性除去方法。
  23. (23)前記増強段階が、下式、すなわち、c(n)=≠1s(n)≧Tc =−1s(n)≦−Tc =0他の場合 ここで、Tc=振幅スレッショルド に従ってサンプルを識別づける請求の範囲第22項記載の周期性除去方法。
  24. (24)前記差信号生成段階が、下式、すなわち▲数式、化学式、表等がありま す▼ ここで、M=ビッチ β1およびβ2=長時間予測子パラメータに従って遂行され、前記長時間予測子 パラメータが、下式、すなわち、 ▲数式、化学式、表等があります▼ ▲数式、化学式、表等があります▼ ここで、R(0)=原点におけるACF値、R(1)=1におけるACF値、 R(M−1)=ビッチ−1におけるACF値、R(M)=ビッチにおけるACF 値、そしてR(M+1)=ビッチ+1におけるACF値に従って決定される請求 の範囲第16項記載の周期性除去装置。
  25. (25)β1およびβ2の和を基準値に比較することを含む請求の範囲第24項 記載の周期性除去装置。
  26. (26)前記基準値が8/9である請求の範囲第25項記載の周期性除去方法。
  27. (27)β1+β2=前記基準値であるようにβ1およびβ2をスケールするこ とを含む請求の範囲第25項記載の周期性除去方法。
  28. (28)R(M+1)がR(M−1)より大きいか否かを決定することを含む請 求の範囲第24項記載の周期性除去方法。
  29. (29)β1およびβ2の計算に先立ちR(M+1)に対してR(M−1)を置 換し、β1およびβ2に対して計算された値を交換し、そして伝送前にビッチ( M)を1だけ減ずることを含む請求の範囲第28記載の周期性除去方法。
  30. (30)情報サンプルより成るサンプルされた時間領域スピーチ信号から、該ス ピーチ信号の量子化に先立ち、該スピーチ信号をサンプルブロックに逐次敵に分 割する変換コード化装置において周期性を除去するための方法において、 前記各サンプルブロック内のビッチを決定し、各ブロックに対して決定されるビ ッチに基づいて前記各ブロックに対する長時間予測子パラメータを決定し、前記 ビッチおよび前記長時間予測子パラメータに基づいて、前記ブロック内の各サン プルに対する周期性値を計算し、 対応するサンブルから前記周期性値を減算することによって修正された差サンプ ルブロックを生成し、前記差サンプルブロックの各々について適応変換コード化 を遂行する 諸段階を含むことを特徴とするスピーチ信号から周期性を除去する方法。
  31. (31)スケールされたスペクトルエンベロープ情報に関して生成されたヒット 割当信号に関して量子化さた逐次の変換係数ブロック、ならびにビッチ、長時間 予測子パラメータおよび線形予測係数を含み前記量子化された変換係数のバリア ンスを表すサイド情報を含むコード化スピーチ信号をデコード装置において、 前記線形予測係数に基づいて前記情報サンプルブロックの各々のスペクトルエン ベロープを生成するためのエンベロープ生成手段と、 前記スペクトルエンベロープに関してビット割当信号を発生するためのビット割 当手段と、 前記ビット割当信号に応答して前記変換係数を逆(または脱)量子化し、かつ逆 量子化された変換係数ブロックを生成するための逆(または脱)量子化手段と、 該逆量子化変換係数を前記変換領域から前記時間領域に変換するための逆変換手 段と、 前記ビッチおよび前記長時間予測子パラメータに基づいて前記ブロック内の各サ ンプルに対する周期性を計算し、対応するサンプルに前記の周期性値を加えるこ とによって修正された差サンプルブロックを生成するための集計手段と を備えることを特徴とするコード化スピーチ信号デコード装置。
JP2506450A 1989-04-18 1990-04-09 長時間予測子を有する適応変換コード化装置 Pending JPH04506575A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US339,991 1989-04-18
US07/339,991 US5012517A (en) 1989-04-18 1989-04-18 Adaptive transform coder having long term predictor

Publications (1)

Publication Number Publication Date
JPH04506575A true JPH04506575A (ja) 1992-11-12

Family

ID=23331435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2506450A Pending JPH04506575A (ja) 1989-04-18 1990-04-09 長時間予測子を有する適応変換コード化装置

Country Status (5)

Country Link
US (1) US5012517A (ja)
EP (1) EP0473611A4 (ja)
JP (1) JPH04506575A (ja)
AU (1) AU5522890A (ja)
WO (1) WO1990013110A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049395A (ja) * 2000-08-02 2002-02-15 Sony Corp ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68916944T2 (de) * 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
JPH03123113A (ja) * 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
US5687281A (en) * 1990-10-23 1997-11-11 Koninklijke Ptt Nederland N.V. Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US5588089A (en) * 1990-10-23 1996-12-24 Koninklijke Ptt Nederland N.V. Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US5271089A (en) * 1990-11-02 1993-12-14 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
US5448683A (en) * 1991-06-24 1995-09-05 Kokusai Electric Co., Ltd. Speech encoder
US5317391A (en) * 1991-11-29 1994-05-31 Scientific-Atlanta, Inc. Method and apparatus for providing message information to subscribers in a cable television system
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
DE69426860T2 (de) * 1993-12-10 2001-07-19 Nec Corp Sprachcodierer und Verfahren zum Suchen von Codebüchern
CN1155942C (zh) * 1995-05-10 2004-06-30 皇家菲利浦电子有限公司 具有改进的音调检测的编码语音传输系统和方法
US5790759A (en) * 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
US5710863A (en) * 1995-09-19 1998-01-20 Chen; Juin-Hwey Speech signal quantization using human auditory models in predictive coding systems
WO1997031367A1 (en) * 1996-02-26 1997-08-28 At & T Corp. Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
US6073100A (en) * 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
US5970441A (en) * 1997-08-25 1999-10-19 Telefonaktiebolaget Lm Ericsson Detection of periodicity information from an audio signal
US9466307B1 (en) * 2007-05-22 2016-10-11 Digimarc Corporation Robust spectral encoding and decoding methods
US8515097B2 (en) * 2008-07-25 2013-08-20 Broadcom Corporation Single microphone wind noise suppression
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
JP6086999B2 (ja) 2014-07-28 2017-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US20230128882A1 (en) * 2020-03-30 2023-04-27 Nokia Technologies Oy Dc down-scaled weighted cost function for image/video coding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS50155105A (ja) * 1974-06-04 1975-12-15
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049395A (ja) * 2000-08-02 2002-02-15 Sony Corp ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP4645866B2 (ja) * 2000-08-02 2011-03-09 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体

Also Published As

Publication number Publication date
EP0473611A4 (en) 1992-05-20
WO1990013110A1 (en) 1990-11-01
EP0473611A1 (en) 1992-03-11
AU5522890A (en) 1990-11-16
US5012517A (en) 1991-04-30

Similar Documents

Publication Publication Date Title
JPH04506575A (ja) 長時間予測子を有する適応変換コード化装置
US5042069A (en) Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals
US4964166A (en) Adaptive transform coder having minimal bit allocation processing
US6377916B1 (en) Multiband harmonic transform coder
US6078880A (en) Speech coding system and method including voicing cut off frequency analyzer
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
US6119082A (en) Speech coding system and method including harmonic generator having an adaptive phase off-setter
US6094629A (en) Speech coding system and method including spectral quantizer
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
EP1617418A2 (en) Spectral band replication and high frequency reconstruction audio coding methods and apparatuses using adaptive noise-floor addition and noise substitution limiting
RU2366007C2 (ru) Способ и устройство для восстановления речи в системе распределенного распознавания речи
JP2002516420A (ja) 音声コーダ
US20060130637A1 (en) Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method
US4991213A (en) Speech specific adaptive transform coder
JPH0744193A (ja) 高能率符号化方法
McAulay et al. Multirate sinusoidal transform coding at rates from 2.4 kbps to 8 kbps
US5649051A (en) Constant data rate speech encoder for limited bandwidth path
US6026357A (en) First formant location determination and removal from speech correlation information for pitch detection
JP3237178B2 (ja) 符号化方法及び復号化方法
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3731575B2 (ja) 符号化装置及び復号装置
Mcaulay et al. Sinusoidal transform coding
JPH07104793A (ja) 音声信号の符号化装置及び復号化装置
EP0725384A2 (en) Adaptive transform coding