JP2000516356A - 可変ビットレート音声送信システム - Google Patents

可変ビットレート音声送信システム

Info

Publication number
JP2000516356A
JP2000516356A JP10529313A JP52931398A JP2000516356A JP 2000516356 A JP2000516356 A JP 2000516356A JP 10529313 A JP10529313 A JP 10529313A JP 52931398 A JP52931398 A JP 52931398A JP 2000516356 A JP2000516356 A JP 2000516356A
Authority
JP
Japan
Prior art keywords
frame
bit rate
analysis
signal
measure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10529313A
Other languages
English (en)
Inventor
ラケシュ、タオリ
アンドレアス、ヨハネス、ゲリッツ
Original Assignee
コーニンクレッカ、フィリップス、エレクトロニクス、エヌ、ヴィ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コーニンクレッカ、フィリップス、エレクトロニクス、エヌ、ヴィ filed Critical コーニンクレッカ、フィリップス、エレクトロニクス、エヌ、ヴィ
Publication of JP2000516356A publication Critical patent/JP2000516356A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 可変ビットレート音声エンコーダ(4)において、音声サンプルのフレームは、フレーム化手段(20)によって入力音声信号から得られる。音声サンプルのフレームから、LPCパラメータのようなLPC解析パラメータが、解析手段(22)によって決定され、コードブック・インデックスおよびコードブック利得によって表される励起信号が、探索手段(36)によって決定される。これらのLPC係数および励起パラメータは、フレームで受信機(12)に送信される。音声エンコーダのビットレートをビットレート設定Rに従って可変にするために、音声エンコーダ(4)には、LPC係数を搬送する送信フレームの一部分を決定する制御手段(30)が設けられる。このフレームの一部分は、0.5から1まで可変である。残りのフレームのLPC係数は、受信機(12)の補間回路(85)によって補間により決定される。本発明の一実施例によると、隣接した係数から補間された値と最も異なるLPC係数が、受信機(12)に送信される。

Description

【発明の詳細な説明】 可変ビットレート音声送信システム 本発明は、音声エンコーダを有する送信機を備えた送信システムに関する。音 声エンコーダは、入力音声信号から解析係数を決定するための解析手段を備えて いる。送信機は、送信媒体を介して受信機に音声信号を表すデータのフレームを 送信するように構成されている。フレームの一部分は、前記解析係数に関する情 報を、残りのフレームよりも多く運ぶ。受信機は、音声信号を表すデータのフレ ームから復元された音声信号を得るための音声デコーダを備えている。 また、本発明は、送信機、音声エンコーダおよび音声符号化方法に関する。 冒頭で述べた送信システムは、米国特許第4,379,949号から公知である。 このような送信システムは、限られた送信容量を有する送信媒体により音声信 号を送信しなければならないアプリケーションまたは限られた記憶容量を有する 記憶媒体に音声信号を記憶しなければならないアプリケーションにおいて使用さ れる。このようなアプリケーションの具体例は、インターネット上での音声信号 の送信、移動電話から基地局および基地局から移動電話への音声信号の送信、な らびにCD−ROM、固体状態記憶装置またはハード・ディスク・ドライブへの 音声信号の記憶である。 エンコーダでは、音声信号が解析手段によって解析される。この解析手段は、 フレームとしても知られている1ブロックの音声サンプルに対して複数の解析係 数を決定する。これら1群の解析係数は、音声信号の短時間スペクトルを表して いる。解析係数の他の例は、音声信号の周波数の高低を表す係数である。これら の解析係数は、送信媒体を介して受信機に送信される。受信機では、これらの解 析係数は、合成フィルタの係数として使用される。 これらの解析パラメータに加えて、音声エンコーダは、1フレームの音声サン プルにつき多くの励起シーケンス(たとえば4)も決定する。このような励起シ ーケンスによって保護された時間の区間は、サブフレームを呼ばれる。音声エン コーダは、合成フィルタが、前述した解析係数を使用して、前記励起シーケンス により励起する時に、最高の音声品質になる励起信号を発見するように構成され ている。前記励起シーケンスを表したものは、送信チャネルを介して受信機に送 信される。受信機では、励起シーケンスは、受信信号から復元され、合成フィル タの入力に与えられる。合成フィルタの出力では、合成音声信号が利用可能とな る。 ある品質を有する音声信号を表すために必要となるビットレートは、音声の内 容に依存している。解析係数が長時間にわたってほぼ一定である場合には、それ らを送信するために必要となるビットレートは、減らすことができる。この可能 性は、前述した米国特許による送信システムに使用されている。この特許は、解 析係数がフレームごとに送信されるとは限らない音声エンコーダを有する送信シ ステムを開示している。フレーム内の実際の解析係数の少なくとも1つと、隣接 するフレームからの解析係数の補間によって得られる対応する解析係数との間の 差が、あらかじめ定められた閾値を超えるときにのみ、解析係数は送信される。 この結果、音声信号を送信するために必要となるビットレートが減少する。この 公知の送信システムでは、閾値を増加または減少させることにより、ビットレー トを任意の値に設定することができ、その結果、ビットレートが減少または増加 する。しかしながら、平均ビットレートは、依然、音声の内容に強く依存してい る。 本発明の目的は、ビットレートを任意の値に設定でき、音声の内容から実質的 に独立している、冒頭で述べた送信システムを提供することにある。 この目的のため、本発明による送信システムは、前記音声エンコーダが、ビッ トレート設定に従って、前記解析係数に関する情報を前記残りのフレームよりも 多く搬送するフレームの前記一部分を制御するための制御手段を備えていること を特徴とする。 ビットレート設定を指定し、かつ、前記ビットレート設定に応じて、前記解析 係数に関する情報を搬送するフレームの実際の部分を制御することにより、音声 内容には実質的に依存しない平均ビットレートを得ることができる。さらに、ビ ットレート設定を変化させることにより、実行時において、平均ビットレートを 変化させることができる。 前記実際の部分は、異なる方法で制御可能である。第1の方法は、各フレーム ごとにNステップ増加するモジュロMカウンタを使用することである。カウンタ がオーバフローするごとに、前記解析係数は、フレームに包含される。その結果 、解析係数を搬送するフレームの前記部分はM/Nとなる。 本発明の一実施例は、前記制御手段が、実際のビットレートの測度を前記ビッ トレート設定の測度と比較するための比較手段を備え、前記制御手段が、前記実 際のビットレートの測度が前記ビットレート設定の測度よりも小さいならば、前 記解析係数に関する情報を前記残りのフレームよりも多く搬送するフレームの前 記実際の一部分を増加させ、前記実際のビットレートの測度が前記ビットレート 設定の測度よりも大きいならば、前記解析係数に関する情報を前記残りのフレー ムよりも多く搬送するフレームの前記実際の一部分を減少させるように構成され ていることを特徴とする。 この実施例によると、符号化された音声信号の平均ビットレートが、ビットレ ート設定と実質的に等しくなることが、常に保証される。 本発明の他の実施例は、前記制御手段が、周囲のフレームで送信された閾値を 超える解析パラメータから補間された値から、距離測度を有する前記解析パラメ ータを示すように構成さわ、かつ、前記実際のビットレートの測度が前記ビット レート設定の測度よりも小さいならば前記閾値を減少させ、前記実際のビットレ ートの測度が前記ビットレート設定の測度よりも大きいならば前記閾値を増加さ せるように構成されていることを特徴とする。 この実施例では、補間された値と最も異なる解析パラメータが送信される。実 際のビットレートがビットレート設定よりも大きいときは閾値を増加させ、それ 以外のときは閾値を減少させることにより、平均ビットレートが、ビットレート 設定と実質的に等しくなることが得られる。 本発明のさらに他の実施例は、前記解析係数に関する情報を前記残りのフレー ムよりも多く搬送する前記フレームの前記一部分が、0.5以上であり、かつ、 1以下であることを特徴とする。 フレームの一部分の基準として0.5と1の間が、符号化品質の実質的な損失 を生ずることなく、十分な制御レンジになることを、実験は示している。 本発明の他の実施例は、前記音声エンコーダが、粗いビットレート設定に応じ て、複数のフレーム長から1つのフレーム長を選択し、複数の、1フレームあた りの励起サブフレームから1つの数の、1フレームあたりの励起サブフレームを 選択するように構成されていることを特徴とする。 ビットレート設定に応じて、フレーム長およびサブフレームの個数を可能な複 数の値から選択することにより、実質的に増加したビットレート・レンジを有す る連続的に可変なビットレートを得ることができる。 また、本発明の他の実施例は、10msのフレーム長に対して励起サブフレー ムの前記複数の数が、少なくとも値4を含み、かつ、15msのフレーム長に対 して励起サブフレームの前記複数の数が、少なくとも値6、8および10を含む ことを特徴とする。 前述したパラメータを使用すると、13.6kbit/sから21.8kbi t/sまで変化させることができる連続的に可変なビットレートを有する音声エ ンコーダを得ることができるようになる。 次に、本発明を、以下の図面を参照しながら説明する。 図1は、本発明が使用される送信システムを示す。 図2は、本発明による音声エンコーダ4の実施例を示す。 図3は、図2によるビットレート・コントローラ30の第1実施例を示す。 図4は、図2によるビットレート・コントローラ30の第2実施例を示す。 図5は、図1の音声デコーダ18の実施例を示す。 図1による送信システムにおいて、符号化されるべき音声信号は、送信機2の 音声エンコーダ4の入力に与えられる。音声エンコーダ4の第1出力は、解析係 数を表す出力信号LPCを搬送し、マルチプレクサ6の第1入力に接続されてい る。音声エンコーダ4の第2出力は、出力信号Fを搬送し、マルチプレクサ6の 第2入力に接続されている。この信号Fは、信号LPCが送信されるべきかどう かを示すフラグを表している。音声エンコーダ4の第3出力は、信号EXを搬送 し、マルチプレクサ6の第3入力に接続されている。この信号EXは、音声デコ ーダの合成フィルタのための励起信号を表している。ビットレート制御信号Rは 、音声エンコーダ4の第2入力に与えられる。 マルチプレクサ6の出力は、送信手段8の入力に接続されている。送信手段8 の出力は、送信媒体10を介して受信機12に接続されている。 受信機12において、送信媒体10の出力は、受信手段14の入力に接続され ている。受信手段14の出力は、デマルチプレクサ16の入力に接続されている 。デマルチプレクサ16の第1出力は、信号LPCを搬送し、音声復号手段18 の第1入力に接続され、デマルチプレクサ16の第2出力は、信号EXを搬送し 、音声復号手段18の第2入力に接続されている。音声復号手段18の出力にお いて、復元された音声信号が利用可能となる。デマルチプレクサ16および音声 復号手段18の組合せは、本発明概念による音声デコーダを構成する。 本発明による送信システムの処理は、CELPタイプの音声エンコーダが使用 されるという仮定の下で説明されるが、本発明の範囲は、これに制限されるもの でないことはいうまでもない。 音声エンコーダ4は、音声信号のサンプルのフレームから符号化された音声信 号を得るように構成されている。音声エンコーダは、音声信号のサンプルのフレ ームから、たとえば音声信号の短時間スペクトルを表す解析係数を得る。一般に 、LPC係数またはその変換されたものが使用される。有効な表現は、対数領域 比(Log Area Ratio:LAR)、反射係数のアークサインまたは線スペクトル対 (Line Spectral Pair:LSP)とも呼ばれる線スペクトル周波数(Line Spect ral Frequency:LSF)である。解析係数の表現は、音声エンコーダ4の第1 出力において信号LPCとして利用可能である。 音声エンコーダ4において、励起信号は、1または2以上の定型コードブック および適応型コードブックの加重出力信号の合計に等しい。定型コードブックの 出力信号は、定型コードブック・インデックスによって指定され、定型コードブ ック用の加重ファクタは、定型コードブック利得によって指定される。適応型コ ードブックの出力信号は、適応型コードブック・インデックスによって指定され 、適応型コードブック用の加重ファクタは、適応型コードブック利得によって指 定される。 コードブック・インデックスおよび利得は、合成方法による解析によって決定 される。すなわち、コードブック・インデックスおよび利得は、オリジナルの音 声信号と、励起係数および解析係数に基づいて合成された音声信号との間の差が 最小の値を有するように決定される。信号Fは、音声信号サンプルの現在のフレ ームに対応する解析パラメータが送信されるかどうかを示す。これらの係数は、 現在のデータ・フレームまたは先行するデータ・フレームで送信することができ る。 マルチプレクサ6は、ヘッダおよび音声信号を表すデータによりデータ・フレ ームを組み立てる。ヘッダは、現在のデータ・フレームが不完全なデータ・フレ ームかどうかを示す第1指示子(フラグF)を備えている。ヘッダは、現在のデ ータ・フレームが解析パラメータを搬送するかどうかを示す第2指示子をオプシ ョンとして備えている。さらに、フレームは、複数のサブフレームのための励起 パラメータを備えている。サブフレームの数は、音声エンコーダ4の制御入力の 信号Rによって選択されたビットレートに依存する。1フレームあたりのサブフ レームの数およびフレーム長も、フレームのヘッダにおいて符号化することがで きるが、1フレームあたりのサブフレームの数およびフレーム長は、接続設定中 に同意することもできる。マルチプレクサ6の出力において、音声信号を表す完 成されたフレームが利用可能となる。 送信手段8において、マルチプレクサ6の出力上のフレームは、送信媒体10 を介して送信可能な信号に変換される。送信手段で実行される処理は、誤り訂正 符号化、インタリービングおよび変調を含む。 受信機12は、送信機2によって送信された信号を送信媒体10から受信する ように構成されている。受信手段14は、復調、インタリービング解除および誤 り訂正復号を行うように構成されている。デマルチプレクサは、受信手段14の 出力信号から信号LPC、FおよびEXを取り出す。必要ならば、デマルチプレ クサ16は、続いて受信される係数の組のうちの2つの組の間に補間を行う。係 数LPCおよびEXの完成された組は、音声復号手段18に与えられる。音声復 号手段18の出力では、復元された音声信号が利用可能となる。 図2による音声エンコーダにおいて、入力信号は、フレーム化手段20の入力 に与えられる。フレーム化手段20の出力は、出力信号Sk+1を搬送し、解析手 段の入力および遅延素子28の入力に接続されている。解析手段は、ここでは、 線形予測解析器22である。線形予測解析器22の出力は、信号αk+1を搬送し 、 量子化器24の入力に接続されている。量子化器24の第1出力は、出力信号Ck+1 を搬送し、遅延素子26の入力および音声エンコーダ6の第1出力に接続さ れている。遅延素子26の出力は、出力信号Ckを搬送し、音声エンコーダの第 2出力に接続されている。 されている。ビットレート設定を表す入力信号Rは、制御手段30の第2入力に 与えられる。制御手段30の第1出力は、出力信号Fを搬送し、音声エンコーダ 4の出力に接続されている。 制御手段30の第3出力は、出力信号α’kを搬送し、補間回路32に接続さ れている。補間回路32の出力は、出力信号α’k[m]を搬送し、知覚加重フ ィルタ34の制御入力に接続されている。 フレーム化手段20の出力は、遅延素子28の入力にも接続されている。遅延 素子28の出力は、信号Skを搬送し、知覚加重フィルタ34の第2入力に接続 されている。知覚加重フィルタ34の出力は、信号rs[m]を搬送し、励起探 索手段36の入力に接続されている。励起探索手段36の出力では、定型コード ブック・インデックス、定型コードブック利得、適応型コードブック・インデッ クスおよび適応型コードブック利得を含んだ励起信号EXの表現が利用可能であ る。 フレーム化手段は、音声エンコーダ4の入力信号から、複数の入力サンプルを 含んだフレームを得る。フレーム内のサンプル数は、ビットレート設定Rに従っ て変更可能である。線形予測解析器22は、入力サンプルのフレームから、予測 係数αk+1[p]を含む複数の解析係数を得る。これらの予測係数は、周知のレ ヴィンソン−ダービン・アルゴリズムによって見出すことができる。量子化器2 4は、係数αk+l[p]を他の表現に変換し、変換された予測係数を量子化され た係数Ck+1[p]に量子化する。量子化された係数は、遅延素子26を介して 、 係数Ck[p]として出力に渡される。遅延素子の目的は、係数Ck[p]と、音 声入力サンプルの同じフレームに対応する励起信号EXとがマルチプレクサ6に この逆変換は、受信機の音声デコーダにおいて実行されるものと同じものである 。量子化係数の逆変換は、音声エンコーダにおいて実行され、受信機のデコーダ で利用可能なものとまったく同じ係数を局所的な合成のために音声エンコーダに 提供する。 制御手段30は、フレームの部分を得るように構成されている。このフレーム の部分では、解析係数に関する情報が他のフレームよりも多く送信される。本実 施例による音声エンコーダ4においては、フレームは、解析係数に関する完全な 情報を運ぶか、または、解析係数に関する情報をまったく運ばないかのいずれか である。制御ユニット30は、マルチプレクサ6が現在のフレームに信号LPC を導入する必要があるかどうかを示す出力信号Fを提供する。一方、各フレーム によって搬送される解析パラメータの数を可変にできることはいうまでもない。 制御ユニット30は、予測係数α’kを補間回路32に与える。現在のフレー ム用の前記LPC係数が送信されるならば、α’kの値は、最も近時に決定され た(量子化された)予測係数に等しい。現在のフレーム用のLPC係数が送信さ れないならば、α’kの値は、α’k-1の値とα’k+1の値を補間することによっ て導出される。 補間回路32は、現フレームのサブフレームのそれぞれに対して、α’k-1と α’kから線形に補間された値α’k[m]を提供する。α’k[m]の値は、入 力信号Skの現在のサブフレームmから「残余信号」rs[m]を得るために知 覚加重フィルタ34に与えられる。探索手段36は、「残余信号」rs[m]の 現在のサブフレームmと最適な一致を与える励起信号となるような定型コードブ ック・インデックス、定型コードブック利得、適応型コードブック・インデック スおよび適応型コードブック利得を発見するように構成されている。各サブフレ ームmに対して、励起パラメータである定型コードブック・インデックス、定型 コードブック利得、適応型コードブック・インデックスおよび適応型コードブッ ク利得は、音声エンコーダ4の出力EXにおいて利用可能である。 図2による音声エンコーダの一例は、13.6kbit/sから24kbit /sまで変化するビットレートを有する7kHzの広帯域の音声信号を符号化す るための広帯域音声エンコーダである。この音声エンコーダは、4つのいわゆる アンカー・ビットレートに設定することができる。これらのアンカー・ビットレ ートは開始値であり、予測パラメータを搬送するフレームの部分を削減すること により、この開始値からビットレートを減少させることができる。以下の表では 、これらの4つのアンカー・ビットレートおよび対応するフレーム期間の値、フ レームのサンプル数ならびにフレームあたりのサブフレーム数が与えられている 。 LPC係数が存在するフレームの数を減少させることにより、ビットレートは 、小さなステップで制御可能である。LPC係数を搬送するフレームの部分が0 .5から1に変化し、1フレームに対してLPC係数を送信するのに必要なビッ ト 数が66であるならば、最大の獲得可能なビットレートの削減を計算することが できる。10msのフレーム・サイズでは、LPC係数のビットレートは、3. 3kbit/sから6.6kbit/sに変化することができる。15msのフ レーム・サイズでは、LPC係数のビットレートは、2.2kbit/sから4 .4kbit/sに変化することができる。以下の表では、最大ビットレートの 削減および最小ビットレートが、4つのアンカー・ビットレートに対して与えら れている。 の入力および変換器44の入力に接続されている。遅延素子40の出力は、信号 ている。変換器44の出力は、出力信号ik+1を搬送し、補間回路48の第1入 力に接続されている。変換器46の出力は、出力信号ik-1を搬送し、補間回路 し、セレクタ52の第1入力に接続されている。変換器50の出力は、出力信号 ikを搬送し、セレクタ52の第2入力に接続されている。セレクタ52の出力 接続されている。変換器53の出力は、図2の補間回路32によって使用される 信号α’kを搬送し、制御手段30の出力に接続されている。 制御手段30の第2入力は、信号Rを搬送し、計算手段54に与えられる。計 算手段54の出力は、加算器56の入力に接続されている。加算器56の出力は 、アキュムレータ58の入力に接続されている。アキュムレータ58の第1出力 は、累算された値を搬送し、加算器56の第2入力に接続されている。アキュム レータ58の第2出力は、オーバフロー信号を搬送し、制御入力に接続されてい る。制御手段30において、計算手段は、ビットレート設定信号Rから、アンカ ー・ビットレートと、LPC情報を搬送するフレームの部分とを決定する。ある ビットレートRを、2つの異なるアンカー・ビットレートから開始して達成する ことができる場合には、最適な音声品質に帰着するアンカー・ビットレートが選 択される。アンカー・ビットレートの値を信号Rの関数として表に記憶すること が便利である。アンカー・ビットレートが選択されると、LPC係数を搬送する フレームの部分を決定することができる。 最初に、1フレームあたりのビット数の最大値および最小値を表す値BMAXお よびBMINが、以下の式に従って決定される。 式(1)および(2)において、bHEADERはフレーム内のヘッダのビット数であ り、bEXCITATI0Nは励起信号を表すビット数であり、bLPCは解析係数を表すビ ット数である。信号Rが要求されたビットレートBREQを表すならば、LPCパ ラメータを搬送するフレームrの部分は、以下のように記述することができる。 本実施例では、rの最小値は0.5であることがわかる。 LPCパラメータを搬送するフレームの部分を表すFR数は、加算器56に与 えられる。加算器56は、フレーム区間ごとに、アキュムレータ58の内容にF R数を加えるように構成されている。FR数およびアキュムレータ58の最大内 容Aは、FR/A=rとなるように選択される。その結果、アキュムレータは、 フレーム区間の部分rの間にオーバフローする。図2のマルチプレクサ6を制御 するために、アキュムレータ58のオーバフロー信号を使用することにより、マ ルチプレクサ6の出力においてフレームの部分rがLPC係数を搬送することが 得られる。 係数は、対数領域比、反射係数のアークサインまたは線スペクトル対である。補 間回路48は、式(ik+1[n]+ik-1[n])/2に従って、値ik+1[n] アキュムレータ58がオーバフローすると、LPC係数が送信さわ、セレクタ 52は、変換器53に予測係数ikの組を渡すように構成される。LPC係数が 予測係数α’kの組に変換する。前述したように、音声エンコーダ4の局所補間 は、各サブフレームに対して、エンコーダ4とデコーダ6とでまったく同一の予 測係数を得るように実行される。 子60の入力および変換器64の入力に接続されている。遅延素子60の出力は 、 ている。変換器64の出力は、出力信号ik+1を搬送し、補間回路68の第1入 力に接続されている。変換器66の出力は、出力信号ik-1を搬送し、補間回路 し、距離計算機72の第1入力およびセレクタ80の第1入力に接続されている 。変換器70の出力は、出力信号ikを搬送し、距離計算機72の第2入力およ びセレクタ80の第2入力に接続されている。 制御手段30の入力信号Rは、計算手段74の入力に接続されている。計算手 段74の第1出力は、制御ユニット76に接続されている。計算手段74の第1 出力上の信号は、LPCパラメータを搬送するフレームの部分rを表す。その結 果、前記信号は、ビットレート設定を表す信号である。計算手段の第2および第 3出力は、信号Rに依存して設定されるアンカー・ビットレートを表す信号を搬 送する。制御ユニット76の出力は、閾値信号tを搬送し、比較器78の第1入 力に接続されている。距離計算機72の出力は、比較器78の第2入力に接続さ れている。比較器78の出力は、セレクタ80の制御入力、制御ユニット76の 入力および制御手段30の出力に接続されている。 を導出する。 距離計算機72は、予測パラメータikの組と、ik+1およびik-1から補間さ は、以下の式によって与えられる。 式(4)において、H(ω)は係数ikによって表されるスペクトルであり、 使用されるが、実験は、より簡単で計算可能なL1正規形が共通する結果を与え ることを示している。このL1正規形は、次の式で記述することができる。 式(5)において、Pは、解析手段22によって決定される予測係数の数であ る。距離測度dは、比較器78によって閾値tと比較される。距離測度dが閾値 tよりも大きいときは、比較器78の出力信号cは、現在のフレームのLPC係 数が送信されることを示している。距離測度dが閾値tよりも小さいときは、比 較器78の出力信号cは、現在のフレームのLPC係数が送信されないことを示 している。あらかじめ定められた時間の間にわたって(たとえば、k個のフレー ムにわたって、kは典型的には100の値を有する)、信号cがLPC係数の送 信を示した回数aの数をカウントすることにより、LPCパラメータを含んだフ レームの実際の部分の測度aが得られる。選択されたアンカー・ビットレートに 対応するパラメータを与えると、この測度aは、実際のビットレートの測度でも ある。 制御手段30は、実際のビットレートの測度を、ビットレート設定の測度と比 較し、必要ならば実際のビットレートを調整するように構成されている。計算手 段74は、信号Rから、アンカー・ビットレートおよび部分rを決定する。制御 ユニット76は、部分rと、LPCパラメータを搬送するフレームの実際の部分 との間の差を決定する。ビットレート設定と実際のビットレートとの間の差に従 ってビットレートを調整するために、閾値tが増加または減少させられる。閾値 tが増加させられると、差の測度dは、より少ない数のフレームに対して前記閾 値を超え、実際のビットレートは減少する。閾値tが減少させられると、差の測 度dはより多くの数のフレームに対して前記閾値を超え、実際のビットレートは 増加する。ビットレート設定の測度rと実際のビットレート測度bに依存した閾 値tの更新は、以下の式に従って制御ユニット76によって実行される。 式(6)において、t’は閾値の最初の値であり、c1およびc2は定数である 。 図5による復号手段18では、信号LPCを搬送する入力は、サブフレーム補 間回路87の入力に接続されている。サブフレーム補間回路87の出力は、合成 フィルタ88の入力に接続されている。 入力信号EXを搬送する音声復号手段18の入力は、デマルチプレクサ89の 入力に接続されている。デマルチプレクサ89の第1出力は、定型コードブック ・インデックスを表す信号FIを搬送し、定型コードブック90の入力に接続さ れている。定型コードブック90の出力は、乗算器92の第1入力に接続されて いる。デマルチプレクサの第2出力は、信号FCBG(定型コードブック利得: Fixed CodeBook Gain)を搬送し、乗算器92の第2入力に接続されている。 デマルチプレクサ89の第3出力は、適応型コードブック・インデックスを表 す信号AIを搬送し、適応型コードブック91の入力に接続されている。適応型 コードブック91の出力は、乗算器93の第1入力に接続されている。デマルチ プレクサ89の第2出力は、信号ACBG(適応型コードブック利得:Adaptive CodeBook Gain)を搬送し、乗算器93の第2入力に接続されている。乗算器9 2の出力は、加算器94の第1入力に接続され、乗算器93の出力は、加算器9 4の第2入力に接続されている。加算器94の出力は、適応型コードブックの入 力および合成フィルタ88の入力に接続されている。 図5による音声復号手段18では、サブフレーム補間回路87は、サブフレー ムのそれぞれについての補間された予測係数を提供し、これらの予測係数を合成 フィルタ88に渡す。 合成フィルタの励起信号は、定型コードブック90および適応型コードブック 91の出力信号の加重合計に等しい。加重は、乗算器92および93によって実 行される。コードブック・インデックスFIおよびAIは、デマルチプレクサ8 9によって信号EXから抽出される。加重ファクタFCBG(Fixed CodeBook G ain)およびACBG(Adaptive CodeBook Gain)も、デマルチプレクサ89に よって信号EXから抽出される。加算器94の出力信号は、適応型コードブック にシフトされ、適応を行う。

Claims (1)

  1. 【特許請求の範囲】 1. 音声エンコーダを有する送信機を備える送信システムであって、 前記音声エンコーダは、入力音声信号から解析係数を決定するための解析手段 を備え、 前記送信機は、送信媒体を介して受信機に前記音声信号を表すデータのフレー ムを送信するように構成され、 前記フレームの一部分は、前記解析係数に関する情報を、残りのフレームより も多く搬送し、 前記受信機は、前記音声信号を表すデータの前記フレームから復元された音声 信号を得るための音声デコーダを備えているとともに、 前記音声エンコーダが、ビットレート設定に従って、前記解析係数に関する情 報を前記残りのフレームよりも多く搬送するフレームの前記一部分を制御するた めの制御手段を備えている、 ことを特徴とする送信システム。 2. 前記制御手段が、実際のビットレートの測度を前記ビットレート設定の 測度と比較するための比較手段を備え、 前記制御手段は、前記実際のビットレートの測度が前記ビットレート設定の測 度よりも小さいならば、前記解析係数に関する情報を前記残りのフレームよりも 多く搬送するフレームの前記実際の一部分を増加させ、前記実際のビットレート の測度が前記ビットレート設定の測度よりも大きいならば、前記解析係数に関す る情報を前記残りのフレームよりも多く搬送するフレームの前記実際の一部分を 減少させるように構成されている、 ことを特徴とする請求の範囲第1項に記載の送信システム。 3. 前記制御手段が、 周囲のフレームで送信された閾値を超える解析パラメータから補間された値か ら、距離測度を有する前記解析パラメータを示すように構成され、かつ、 前記実際のビットレートの測度が前記ビットレート設定の測度よりも小さいな らば前記閾値を減少させ、前記実際のビットレートの測度が前記ビットレート設 定の測度よりも大きいならば前記閾値を増加させるように構成されている、 ことを特徴とする請求の範囲第2項に記載の送信システム。 4. 前記解析係数に関する情報を前記残りのフレームよりも多く搬送する前 記フレームの前記一部分が、0.5以上であり、かつ、1以下である、 ことを特徴とする請求の範囲第1項、第2項または第3項にいずれか1項に記 載の送信システム。 5. 前記音声エンコーダが、粗いビットレート設定に応じて、複数のフレー ム長から1つのフレーム長を選択し、複数の、1フレームあたりの励起サブフレ ームから1つの数の、1フレームあたりの励起サブフレームを選択するように構 成されている、 ことを特徴とする請求の範囲第1、第2項、第3項または第4項のいずれか1 項に記載の送信システム。 6. 前記複数のフレーム長が、少なくとも10msと15msの値を含む、 ことを特徴とする請求の範囲第5項に記載に送信システム。 7. 10msのフレーム長に対して励起サブフレームの前記複数の数が、少 なくとも値4を含み、かつ、 15msのフレーム長に対して励起サブフレームの前記複数の数が、少なくと も値6、8および10を含む、 ことを特徴とする請求の範囲第6項に記載の送信システム。 8. 音声エンコーダを有する送信機であって、 前記音声エンコーダは、入力音声信号から解析係数を決定するための解析手段 を備え、 前記音声信号を表すデータのフレームを送信するように構成され、 前記フレームの一部分は、前記解析係数に関する情報を残りのフレームよりも 多く搬送するとともに、 前記音声エンコーダが、前記解析係数に関する情報をより多く搬送するフレー ムの前記一部分をビットレート設定に従って制御するための制御手段を備えてい る、 ことを特徴とする送信機。 9. 入力音声信号から解析係数を決定するための解析手段を備え、 前記音声信号を表すデータのフレームを生成するように構成され、 前記フレームの一部分は、前記解析係数に関する情報を残りのフレームよりも 多く搬送するとともに、 前記解析係数に関する情報をより多く搬送するフレームの前記一部分をビット レート設定に従って制御するための制御手段を備えている、 ことを特徴とする音声エンコーダ。 10. 入力音声信号から解析係数を決定し、 前記音声信号を表すデータのフレームを生成し、 前記フレームの一部分は、前記解析係数に関する情報を残りのフレームよりも 多く搬送するとともに、 前記解析係数に関する情報をより多く搬送するフレームの前記一部分をビット レート設定に従って制御する、 ことを特徴とする音声符号化方法。
JP10529313A 1997-04-07 1998-03-05 可変ビットレート音声送信システム Withdrawn JP2000516356A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP97200998 1997-04-07
EP97200998.9 1997-04-07
PCT/IB1998/000293 WO1998045833A1 (en) 1997-04-07 1998-03-05 Variable bitrate speech transmission system

Publications (1)

Publication Number Publication Date
JP2000516356A true JP2000516356A (ja) 2000-12-05

Family

ID=8228171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10529313A Withdrawn JP2000516356A (ja) 1997-04-07 1998-03-05 可変ビットレート音声送信システム

Country Status (9)

Country Link
US (1) US6012026A (ja)
EP (1) EP0922278B1 (ja)
JP (1) JP2000516356A (ja)
CN (1) CN1140894C (ja)
BR (1) BR9804811A (ja)
DE (1) DE69834093T2 (ja)
ES (1) ES2259453T3 (ja)
PL (1) PL193825B1 (ja)
WO (1) WO1998045833A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016507789A (ja) * 2013-02-21 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated 平均符号化レートを制御するためのシステムおよび方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6330532B1 (en) * 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US7127390B1 (en) 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
US6862298B1 (en) 2000-07-28 2005-03-01 Crystalvoice Communications, Inc. Adaptive jitter buffer for internet telephony
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
US8346544B2 (en) * 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
EP2036204B1 (en) * 2006-06-29 2012-08-15 LG Electronics Inc. Method and apparatus for an audio signal processing
US20080103765A1 (en) * 2006-11-01 2008-05-01 Nokia Corporation Encoder Delay Adjustment
US8553757B2 (en) * 2007-02-14 2013-10-08 Microsoft Corporation Forward error correction for media transmission
TWI536824B (zh) * 2012-05-04 2016-06-01 奇揚網科股份有限公司 視訊編碼系統、方法以及電腦可讀取之媒體

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4379949A (en) * 1981-08-10 1983-04-12 Motorola, Inc. Method of and means for variable-rate coding of LPC parameters
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
DE69233502T2 (de) * 1991-06-11 2006-02-23 Qualcomm, Inc., San Diego Vocoder mit veränderlicher Bitrate
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016507789A (ja) * 2013-02-21 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated 平均符号化レートを制御するためのシステムおよび方法
JP2017161917A (ja) * 2013-02-21 2017-09-14 クゥアルコム・インコーポレイテッドQualcomm Incorporated 平均符号化レートを制御するためのシステムおよび方法

Also Published As

Publication number Publication date
DE69834093T2 (de) 2006-12-14
DE69834093D1 (de) 2006-05-18
US6012026A (en) 2000-01-04
CN1140894C (zh) 2004-03-03
WO1998045833A1 (en) 1998-10-15
BR9804811A (pt) 1999-08-17
EP0922278A1 (en) 1999-06-16
ES2259453T3 (es) 2006-10-01
CN1222993A (zh) 1999-07-14
PL330398A1 (en) 1999-05-10
PL193825B1 (pl) 2007-03-30
EP0922278B1 (en) 2006-04-05

Similar Documents

Publication Publication Date Title
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
KR101147878B1 (ko) 코딩 및 디코딩 방법 및 장치
US7280959B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US20070088543A1 (en) Multimode speech coding apparatus and decoding apparatus
US20050137864A1 (en) Audio enhancement in coded domain
JP2002541499A (ja) Celp符号変換
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
JP2000516356A (ja) 可変ビットレート音声送信システム
EP1096476B1 (en) Speech signal decoding
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
US6804639B1 (en) Celp voice encoder
JP2007504503A (ja) 低ビットレートオーディオ符号化
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
EP1073039A2 (en) Speech decoder with gain processing
JP3888097B2 (ja) ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
JP3168238B2 (ja) 再構成音声信号の周期性を増大させる方法および装置
EP1544848B1 (en) Audio enhancement in coded domain
EP0971337A1 (en) Method and device for emphasizing pitch
EP0906664B1 (en) Speech transmission system
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
KR100563016B1 (ko) 가변비트레이트음성전송시스템
JP4295372B2 (ja) 音声符号化装置
JPH06130994A (ja) 音声符号化方法
KR100587721B1 (ko) 음성전송시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050304

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070426

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070426

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070827