JP2002536694A

JP2002536694A - 音声コーダのための、１／８レート乱数発生のための方法と手段

Info

Publication number: JP2002536694A
Application number: JP2000597797A
Authority: JP
Inventors: チャン、チエンチュン; シェン、タオ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 1999-02-08
Filing date: 2000-02-04
Publication date: 2002-10-29
Also published as: US6226607B1; HK1041740B; CN1339151A; CN1144177C; US20010007974A1; DE60023851D1; ES2255991T3; ATE309599T1; KR20010093324A; WO2000046796A9; AU3589200A; HK1041740A1; EP1159739B1; EP1159739A1; DE60023851T2; WO2000046796A1

Abstract

(57)【要約】【課題】垂直なリールコンベヤーによるリールの操作装置。【解決手段】第一のランダム変数（random variable）の値を発生するように構成された乱数発生器とランダム数発生器に接続されたコーデックを具備する音声ボコーダが開示されている。乱数発生器は、ランダム乱数発生器に接続された記憶媒体、該記憶媒体は第二のランダム変数の値を含み、第二のランダム変数は第一のランダム変数の蓄積分散関数の逆変換を具備する。該コーデックは第一及び第二のランダム変数の値で入力無音フレームを符号化するために、及び第一と第二のランダム変数で無音フレームを再生するために構成される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

本発明は広く音声プロセスの分野に関連する、そして、より具体的には、音声
コーダ（speech coder）のための1/8レート乱数（random number）を発生するた
めの方法と装置に関連する。

【０００２】

【従来の技術】

デジタル技術による音声の送信は、特に長距離及びデジタル無線電話用途で広
がってきている。このことは、順次、再構築された音声の知覚される品質を維持
しながら,チャネル上で送れる情報の最小量を決定することへの関心を生み出し
てきた。仮に音声が単にサンプリングされデジタル化されることにより送信され
れば、秒あたり６４キロビット（ｋｂｐｓ）オーダー（order）のデータレート
が、従前のアナログ電話の音声品質を達成するために要求される。しかしながら
、適正な符号化、送信、そして受信器での再合成（rethynthesis）を伴う、音声
分析の使用を通して、データレートの顕著な削減が達成できる。

【０００３】人間の音声の発生モデル（model）に関連するパラーメータを抽出することに
より、音声を圧縮する技術を採用する装置は音声コーダと呼ばれる。音声コーダ
は入力の音声信号を時間のブロック、または分析フレームに分割する。音声コー
ダは典型的に符号器と復号器、またはコーデックを具備する。符号器は、一定の
関連するパラーメータを抽出するために入力の音声フレームを分析する、そして
次にパラーメータを２進表現（binary representation）、即ち、１組のビット
または１組の２進データパケット(binary deta packet)に量子化する。データパ
ケットは通信チャネルで受信器と復号器に伝送される。復号器はデータパケット
を処理し、パラーメータを作成するためにそれらの量子化を戻し（unquantitize
）、そして、次に量子化から戻された（unquantitized）パラーメータを使い音
声フレームを再合成する（rethythesize）。

【０００４】音声コーダの機能は、デジタル化された音声信号を、音声に固有の全ての自然
な冗長性（redundancies）を除去することにより、低ビットレート信号に圧縮す
ることである。デジタル圧縮は、入力音声フレームを一組のパラーメータで表現
し、そしてパラーメータを一組のビットで表現するために量子化を採用すること
で達成される。仮に、入力音声のフレームがビットNiの数を持つとき、そして音
声コーダで作成されたデータパケットがビットN_Oの数を持つとき、音声コーダに
より達成される圧縮係数は、Cr=Ni/N_Oである。課題（challenge）は、目標の圧
縮係数を達成しながら、復号された音声の高い音声品質を保つことである。音声
コーダの性能は（１）いかに良く音声モデル、または上述の分析と合成の処理の
組合せが実行されるか、そして（２）いかに良くパラーメータ量子化処理が、各
フレーム当たりのN_Oビットの目標ビットレートで実行されるかに依存する。音声
モデルの達成目標はこのように、各フレームための小さい組のパラーメータで、
音声信号のエッセンス（essence）、または目標の音声品質を獲得することであ
る。

【０００５】良く知られている音声コーダは、L.B.Rabiner,とR.W.Schaferによる、「音声
信号のデジタル処理３９６−４５３（１９７８）」（L.B.Rabiner & R.W.Schafe
r,Digital Processing of Speech Signal 396-453(1978)）に述べられているコ
ード励起線形分析(code exited linear predictive)（CELP）コーダであり、こ
れは、ここに記述して完全に組み込まれる、。CELPコーダでは、音声信号内の短
期相関関係,または冗長性(redundancies)は、短期フォルマントフィルタ（forma
nt filter）の係数を見出す、線形予測（linear prediction）(LP)分析により除
去される。入力の音声フレームに短期予測フィルタを適用することは、さらに長
期予測フィルタパラーメータとそれに続くランダム的(stochastic)コードブック
でモデル化され、そして量子化されるLP剰余（residue）信号を発生する。この
ように、CELPコード化（coding）は時間領域音声波形を符号化するタスク（task
）を、LP短期フィルタ係数を符号化することとLP剰余を符号化することの別々の
タスクに分割する。例示的な可変レートCELPコーダが、本発明の譲受人（assign
ee）に譲渡され（assigned）、そしてここに記述されて完全に組み込まれる、米
国特許番号５，４１４，７９６に述べられている。

【０００６】従前の音声コーダでは、無声音(nonspeech)または無音(silence)は、単に符号化されないことの代わりに、頻繁に（可変レート音声コーダにおけるフル
レート、ハーフレート、または４/１レートに対して）1/8レートで符号化される
。無音を1/8レートで符号化するために、現在の音声フレームのエネルギーが測
定され、量子化され、そして復号器へ伝送される。同等なエネルギーを持つ（聞
き手にとり）快適な（comfort）雑音が復号器側で再生される。雑音は通常、ホ
ワイト（white）ガウス雑音としてモデル化される。例えば、均一ランダム分散
をもつランダム変数（random variable）を持つ二つの統計的に独立した、同じ
く分散されたランダム変数を持つ中心極限定理(central limit theorem)を使用
することも含めて、ランダムランダムデジタル信号プロセッサー（DSP）内でガ
ウスランダム（random）雑音を発生する数種の方法が存在する。しかしながら、
集中的（intensive）な計算は、ランダム変数の平方根の計算、コサイン(cosine
)とサイン(sine)の変換、対数関数、等のような、非線型の、数学的演算または
変換を含めて、実行されねばならない。そのような演算は高いメモリ容量を必要
とし、そして非常に計算集中的(computation-intensive)である（computation-i
ntensive）。例えば、関数のサインとコサインを計算することは関数のテーラ級
数展開の計算を必要とする。このように、メモリの必要性と計算の要求を減少す
る符号化と復号化関する必要性（need）がある。

【０００７】

【課題を解決するための手段】

本発明は、メモリの必要性と計算の要求を減少する符号化と復号化の方法に向
けられている。従って、本発明の一つの観点において、音声コーダは有利的に、
第一のランダム変数（random variable）の値を発生するように構成された乱数
発生器；乱数発生器に結合された記憶メディア、第二のランダム変数の値を有す
る記憶メディア、第一のランダム変数の累積分散関数(cumulative distribution
function)の逆変換(inverse transformation)を具備する第二のランダム変数；
及び、乱数発生器に接続された符号器を備える。符号器は、入力無音のフレーム
を第一と第二のランダム変数の値で符号化するためと、そして無音フレームを第
一と第二のランダム変数の値で再発生(regenerate)するために構成されている。

【０００８】本発明の他の観点において、無音のフレームを符号化する方法は、第一のラン
ダム変数の値を発生する；第二のランダム変数の値を記憶する、該第二のランダ
ム変数は第一のランダム変数の累積分散関数の逆変換を具備するランダム；無音
のフレームを第一と第二のランダム変数で符号化する；及び無音のフレームを第
一と第二のランダム変数の値で再発生する、工程を含むことが好ましい。

【０００９】本発明の他の観点において、音声コーダは、第一のランダム変数の値を発生す
る手段；第二のランダム変数の値を記憶する手段、第二のランダム変数は第一の
ランダム変数の累積分散関数の逆変換を具備する；無音のフレームを第一と第二
のランダム変数で符号化する手段；及び無音のフレームを第一のと第二のランダ
ム変数で再発生する手段、を含むことが好ましい。

【００１０】

【発明の実施の形態】

図1で、第一の符号器10はデジタル化された音声サンプル（n）を受信しそして
、伝送媒体１２または通信チャネル１２で第一の復号器１４へ送信するために、
サンプル（n）を符号化する。復号器14は符号化された音声サンプルを復号し、
そして出力音声信号s_synth(n)を合成する。逆方向への送信のために、第二の復
号器1６は、通信チャネル１８で送信されるところの、デジタル化された音声サ
ンプルs_synth(n)を符号化する。第二の復号器２０は符号化されたサンプルを受
けて復号する、そして合成された出力音声信号ｓ_synth(n)を発生する。

【００１１】音声サンプル（n）は、例えば、パルス符号変調(PCM)、圧伸された（compande
d）μ-lawまたはA-法則（A-law）等の当技術で知られる各種の方法に従いデジタ
ル化されまた量子化された音声信号を表す。当技術で知られるように、音声サン
プル（n）は、各フレームが所定の数のデジタル化された音声サンプル(n)を備え
る入力データのフレームに構成される。例示的な実施例では、８ｋHｚのサンプ
リングレートが、１６０個のサンプルを備える各２０ｍｓのフレームと共に使用
される。下記の実施例では、データ伝送のレートは、フレーム対フレームベース
で１３．２ｋｂｐｓ（フルレート）から６．２ｋｂｐｓ（ハーフレート）、２．
６ｋｂｐｓ（１/４レート）、そして１ｋｂｐｓ（１/８レート）へ有効的に変え
られる。データ伝送のレートを変えることは、より低いビットレートが比較的少
ない音声情報を含むフレームに選択的に使用できるので、有効である。当業者に
理解されているように、他のサンプリングレート、フレームサイズやデータ伝送
のレートも使用できる。

【００１２】第一の符号器10と第二の復号器２０は共に第一の音声コーダまたは音声コーデ
ックを構成する。同様に、第二の符号器１６と第一の復号器１４は共に第二の音
声コーダを構成する。当業者には、音声コーダはデジタル信号プロセッサ（DSP
）、特定用途集積回路(ASIC)、離散利得ロジック（discrete gain logic）、フ
ァームウエア、またはいずれの一般のプログラム可能なソフトウエアモジュール
とマイクロプロセッサで実施できると理解されている。ソフトウエアモジュール
はRAMメモリ、フラッシュメモリ、抵抗、または当技術で知られたいずれの他の
書き込み可能な記憶メディア内に所在できる。代わりに、いずれの一般的なプロ
セッサ、コントローラ、状態マシン(state machine)はマイクロプロセッサの代
わりができる。音声符号化専用に設計された例示的なASICが、本特許の譲受人（
assignee）に譲渡され、引用されて、ここに全体的に組み込まれる(incorporate
d)米国特許番号５，７２７，１２３、及び1994年2月16日に出願され、本発明の
譲受者(assignee)に譲渡され、引用された、ここに全体的に組み込まれる「ボコ
ーダーASIC」(VOCODER ASIC)と題された、米国申請続番号０８/１９７，４１７
に記述されている。

【００１３】図２で、音声コーダに使える符号器１００は、モード決定モジュール１０２、
ピッチ推定モジュール１０４、LP分析モジュール１０６、LP分析フィルター１０
８、LP量子化モジュール１１０と剰余量子化モジュール１１２を含む。入力音声
フレーム(n)はモード決定モジュール１０２、ピッチ推定モジュール１０４、LP
分析モジュール１０６、LP分析フィルター１０８に供給される。モード決定モジ
ュール１０２は、各入力音声フレーム(n)の周期数(periodicity)に基づきモード
インデックスI_MとモードMを供する。周期数に従い音声フレームを分類する各種
の方法が、1997年3月11に出願され、本発明の譲受者(assigneeに譲渡され(assig
ned)、引用されて、ここに全体的に組み込まれる、米国出願番号０８/８１５，
３５４、「低減レート可変レートボコードを実行するための方法と装置」（METH
OD AND APPARATUS FOR PERFORMING REDUCED RATE VARIABLE RATE VOCODNG ）に
記述されている。そのような方法は通信産業協会(Telecommunication Industry
Association)の産業暫定標準(Industry Interim Standards)TIA/EIA IS-127及び
TIA/EIA IS-127にも編入されている。

【００１４】ピッチ推定モジュール104は、各入力音声フレーム（n）に基づきピッチインデ
ックスI_Pと遅れ（lag）値P_Oを作成する。LP分析モジュール106は、LPパラーメー
タａを発生するために、各入力音声フレーム（n）の線形予測分析を実行する。L
PパラーメータａはLP量子化モジュール110に供給される。LP量子化モジュール11
0はモードMをも受信する。LP量子化モジュール110はLPインデックスI_LPと量子化
されたLPパラーメータ

【００１５】

【数１】を作成する(以下、このLPパラーメータを「ａ^Λ」と記す)。LP分析フィルター１
０８は、入力音声フレーム（n）に加えて、量子化されたLPパラーメータａ^Λを
受ける。LP分析フィルタ108は、入力音声フレーム（n）と量子化された線形予測
パラーメータａ^Λに基づき、復元された音声間のエラーを表すところの、LP剰余
信号R[n]を発生する。LP剰余信号R[n]、モードM、量子化されたLPパラーメータ
ａ^Λは剰余量子化モジュール１１２に供給される。これらの値に基づき、剰余量
子化モジュール１１２は剰余インデックスI_Rと量子化された剰余信号

【００１６】

【数２】を作成する。(以下、この剰余信号を「Ｒ^Λ[n]」と記す) 図3で、音声コーダに使える復号器２００は、LPパラーメータ復号モジュール
２０２、剰余復号モジュール204、モード復号モジュール２０６、及びLP合成フ
ィルタ208を含む。モード復号モジュール２０６はモードインデックスI_Mを受け
、復号し、それよりモードMを発生する。LPパラーメータ復号モジュール202はモ
ードMとLPインデックスI_LPを受ける。LPパラーメータ復号モジュール202は、量
子化されたLPパラーメータａ^Λを作成するために、それらの受けた値を復号する
。剰余復号モジュール204は、剰余インデックスI_R、ピッチインデックスI_P、モ
ードインデックスI_Mを受ける。剰余復号モジュール２０４は、量子化された剰余
信号Ｒ^Λ[n]を発生するために、それらの受けた値を復号する。量子化された剰
余信号Ｒａ^Λ[n]と量子化されたLPパラーメータａ^Λは、それらから、復号され
た出力音声信号

【００１７】

【数３】を合成するところの、LP合成フィルタ208へ供給される。(以下、出力音声信号を
「ｓ^Λ[n]」と記す) 図２の符号器１００の及び図３の復号器２００の各種モジュールの実行と実施
は当技術で知られており、前述の米国特許番号５，４１４，７９６及び、L.B.Ra
biner,とR.W.Schaferによる、「音声信号のデジタル処理３９６−４５３（１９
７８）」（l.B.Rabiner & R.W.Schafer,Digital Processing of Speech Signal
396-453(1978)）に述べられている。

【００１８】図4のフローチャートに図示されているように、一つの実施例に合致する音声
コーダは、伝送のための音声サンプルを処理する一組の工程に従う。音声コーダ
（表示されていない）は、前述の米国特許番号5,414,796に述べられている可変
レートボコーダ（variable rate vocoder）のような、８ｋｂｐｓのコード励起
線形分析(code exited linear predictive)（CELP）コーダまたは１３ｋｂｐｓ
のCELPコーダでよい。代わりに、音声コーダは符号分割多重アクセス(code divi
sion multiple access)（CDMA）強化可変レートコーダ(enhanced variable rate
coder )（EVRC）でよい。

【００１９】工程300で、音声コーダは連続するフレームで音声信号のデジタルサンプルを
受ける。所定のフレームを受けた時に、音声コーダは工程302へ進む。工程302で
,音声コーダはフレームのエネルギーを検出する。エネルギーはフレームの言語
行為(speech activity)の物差し（measure）である。音声検出が、デジタル化さ
れた音声サンプルの振幅の二乗(squares)を総和することと、しきい値に対し結
果のエネルギーを比較することにより実行される。一つの実施例では、しきい値
は背景雑音の変化するレベルに基づき順応する。例示的な可変しきい値音声活性
度検出器(variable threshhold speech activity detector)が前述の米国特許番
号5,414,796に述べられている。いくつかの無声音の声音は極端に低エネルギー
サンプルで背景雑音としてあやまって符号化されてしまう可能性がある。この発
生を防止するために、前述の米国特許番号5,414,796に述べられているように、
低エネルギーサンプルのスペクトルチルト（spectral tilt）が、背景雑音から
無声音の音声を識別するために使うことができる。

【００２０】フレームのエネルギーを検出した後に、音声コーダは工程30４へ進む。工程30
4で、音声コーダは、検出されたフレームのエネルギーが該フレームを音声情報
を含むものと識別するのに充分か否かを決定する。仮に、検出されたフレームの
エネルギーが所定のしきい値レベルより下回れば、音声コーダは工程306へ進む
。工程306で,音声コーダはフレームを背景雑音（即ち、無音声,又は無音）とし
て符号化する。一つの実施例では、背景雑音フレームは1/8レート,又は１ｋｂｐ
ｓで符号化される。仮に、工程304で、検出されたフレームのエネルギーが所定
のしきい値のレベルを満たすか越えれば,該フレームは音声と識別され,音声コー
ダは工程308へ進む。工程308で、音声コーダはフレームが無声音の音声かどうか
を決定する、即ち、音声コーダはフレームの周期性(periodicity)を試験する。
周期性決定の各種の既知の方法は、例えば、ゼロクロス(zero crossing)の使用
と規格化自己相関関数(normalized autocorrelation functions)（NACFｓ）の使
用を含む。特に、ゼロクロスとNACFｓを周期性の検出のために使うことは、1997
年3月11に出願され、本発明の譲受人（assignee）に譲渡され(assigned)、引用
されて、ここに全ぶ編入されている、「低減レート可変レートボコードを実行す
るための方法と装置」（METHOD AND APPARATUS FOR PERFORMING REDUCED RATE V
ARIABLE RATE VOCODING ）と題された、米国出願番号０８/８１５，３５４に記
述されている。加えて、無声音の音声より、有声の音声を識別するために使われ
る上記の方法は通信産業協会(Telecommunication Industry Association)の産業
暫定標準(Industry Interim Standards)TIA/EIA IS-127及びTIA/EIA IS-127に編
入されている。仮に、工程3０８で、フレームが無声音の音声と決定されると、
音声コーダは工程３１０へ進む。工程３１０で、音声コーダはフレームを無声音
の音声として符号化する。一つの実施例では、無音声の音声フレームは1/４レー
トまたは２．６ｋｂｐｓで符号化される。仮に、工程３０８でフレームが無声音の音声でないと決定されれば、音声コーダは工程３１２へ進
む。

【００２１】工程３１２では、音声コーダは、当技術で知られる、例えば、前述の米国出願
番号０８/８１５，３５４で述べられているような周期性検出の方法を使い、フ
レームが遷移(transitional)音声かどうかを決定する。仮に、フレームが遷移音
声と決定されれば、音声コーダは工程314へ進む。工程314で,フレームは遷移音
声（即ち、無声音の音声から有声の音声への遷移）として符号化される。一つの
実施例では、遷移音声フレームはフルレート、または13.2kbpsで符号化される。

【００２２】工程312で,仮に、音声コーダがフレームは遷移音声ではないと決定すれば、音
声コーダは工程316へ進む。工程316で,音声コーダはフレームを有声の音声とし
て符号化する。一つの実施例では、有声の音声はフルレート、または13.2kbpsで
符号化される。

【００２３】工程３１２で、音声コーダはフレームが遷移音声でないことを確定し、音声コ
ーダは工程316へ進む。工程316で,音声コーダはフレームを有声の音声として符
号化する。一つの実施例では、有声の音声はフルレート、または13.2kbpsで符号
化できる。

【００２４】一つの実施例では、音声コーダは、無音のフレームを1/8レートで符号化する
ために、ルックアップテーブル（lookup table）(LUT)（図示されていない）を
使用する。例示的な、特定の実施例に従ったLUTのデータが図７に表形式で示さ
れている。LUTはRＯＭメモリで有効に実施できるが、しかし代わりに、いずれの
一般的な形の不揮発性のメモリで実施された記憶メディアでよい。ゼロの平均と
1の分散を持つガウスランダム変数（Gaussian randam variable）が、無音のフ
レームを符号化するために有効に発生される。特定の実施例では,音声符号器は
デジタル信号プロセッサの部分として実施される。ファームウエアの命令（firm
ware instruction）が音声コーダにより、ランダム変数を発生し、そしてＬＵＴ
にアクセスするために、使用される。代わりの実施では、ランダム変数を発生し
、そしてＬＵＴにアクセスするために、ＲＡＭメモリに含まれるソフトウエアモ
ジュールが使用できる。代わりに、ランダム変数は、抵抗とＦＩＦＯのようなデ
ィスクリートのハードウエアの構成要素で発生できる。

【００２５】図5に示されているように、ガウスランダム変数Xの確率密度関数(probability
density function )(ｐｄf)

【００２６】

【数４】 (以下、確率密度関数を「（ｃｄｆ）ｆ_x(χ)」と記す)は、標準偏差σと分散σ² を持つ平均ｍを中心とする鐘形の曲線である。ガウスpdf ｆ_x(χ)は次の等式を
満足する：

【００２７】

【数５】累積分散関数（ｃｄｆ）ｆ_x（χ）は、所定の時間でランダム変数Xが特定の値X
より小さいか同じ確率ランダムと定義される。ゆえに、

【００２８】

【数６】図6に示されているように、（ｃｄｆ）ｆ_x（χ）は、ランダム変数ｘが無限大に
近づくに連れて1に近づき、そして、ｘが負の無限大に近づくに連れてゼロに近
づく。F_ｘ（X）に等しい第二のランダム変数、Υ、は、Xがゼロの平均と1の分散
を持つガウスランダム変数である場合、Xの分散にかかわらず、ゼロと1の間に均
一に分散されたランダム変数である。Υの逆変換（inverse transformation）を
採用（take）することはX=F^-1(Υ)を導く。

【００２９】一般的な音声コーダでは、一組の統計的に独立の、ゼロの平均と1の分散を持
つガウス関数UとVは、一組みの統計的に独立のランダム変数WとZより次の等式で
計算される。

【００３０】

【数７】ランダム変数WとZは、統計的に独立であり、同じように分散（distribute）さ
れ、そしてゼロと1の間で均一に分散される。しかしながら、上記の計算は（テ
ーラ級数の展開を必要とするところの）サインとコサインの計算、対数、そして
平方根計算を必要とする。その様な計算は比較的大きな処理能力とメモリ要件を
必要とする。例えば、そのような音声コーダは、TIA/EAI 暫定標準IS-１２７、
強化可変レートコーデック、広帯域符号分割デジタルシステムのための音声サー
ビスオプション３（TIA/EIA Iterim Standard IS-127,”Enhanced Variable Rat
e Codec,Speech Service Option 3 for Widebannd Spread Spectrum Digital Sy
stem”）に定義されている。定義されている音声コーダは、1/8レートの符号化
と復号をするためのプラットフォームのなかで比較的大きい量の計算力を消費す
る。

【００３１】記述された実施例では、上記の計算を実行する必要性を除く為にLUTが使用さ
れる。Υ=Fｘ(χ)ゆえに、逆変換はX=F^-1(Υ)であることを示す。上述のように
、Xはいずれの分散でもよい。図７に示されているように、LUTは有効にゼロの平
均と1の分散を持つガウスランダム変数ｃｄｆに基づいている。特定の実施例で
は, Υは1とゼロの間に均一に分散されているので、Υは1とゼロの間で256レベ
ルに量子化される。Υの値を導くために、ゼロと1の間の乱数（random number）
が発生される。呼応するガウス乱数、Xが、逆変換方程式で計算され、そしてLUT
に記憶される。X値に対する量子化されたΥをマップするために、Υ値でアクセ
スされるLUTが使用される。

【００３２】一つの実施例では、ゼロと１の間で、２５６レベルにΥを量子化するのに半分
に縮小されたLUTが使用される。当業者は理解するように、LUTサイズを半分に縮
小することは(reductiopn)は可能である。それは、 F_X(χ)＝０．５の周囲で、ｃｄｆ、F_X(χ)が非対称であるからである。言い換え
ると、F_X(ｍ＋ｘ)＝０．５−F_X(ｍ−ｘ)であり、ここで、ｍはF_X(χ)の平均であ
るから、F^-1（ｙ＋０．５）＝―F^-1（―ｙ＋０．５）である。代わりの実施では
、LUTサイズは半分に縮小されないが、しかしかわりに、分解能(resolution)が
増加される（即ち、量子化誤りが減少する）。

【００３３】このように、新しくそして改善された、音声コーダのための1/8レートの乱数
を発生するの方法と装置が説明されてきた。当業者は、ここで開示された実施に
関連する各種の説明的な論理ブロックとアルゴリズムの工程は、デジタル信号処
理（DSP）、用途特定IC(ASIC)、ディスクリートゲートまたはトランジスターロ
ジック、例えば、抵抗やFIFOのようなディスクリートのハードウエアの構成要素
、一組のファ―ムウエア命令を実行するプロセッサ、または、いずれかの一般的
なプログラマブルソフトウエアモジュールとプロセッサで、実施または実行でき
ることを、理解するであろう。プロセッサは有効的にマイクロプロセッサでよい
、しかし代わりに、プロセッサはいずれの一般的なプロセッサ、コントローラ、
マイクロコントローラまたは状態マシンでよい。ソフトウエアモジュールはRAM
メモリ、フラッシュメモリ、抵抗、または、当業界で知られたいずれかの書き込
み可能な記憶メディアに所在できる。当業者は、上記の記述で全体的に参照され
たデータ、命令、コマンド、情報、信号、ビット、記号とチップは有効的に電圧
、電流、電磁波、磁界または磁性体、光フィールド（optical field）、または
それらのいずれの組合せで表わされることを、更に理解するであろう。

【００３４】本発明の好ましい実施例がこのように示されそして説明されてきた。当業者に
とり、然しながら、本発明の精神または範囲から離脱することなく、多数の変更
がここに開示された実施に対して作ることが可能であることは、明白であろう。
従って、本発明は、次の請求に従うことを除き、制限的なものではない。

【図面の簡単な説明】

【図１】音声コーダで各端を終端された通信チャネルのブロックダイアグラムである。

【図２】符号器のブロックダイアグラムである。

【図３】復号器のブロックダイアグラムである。

【図４】音声符号化の決定プロセスを図示するフローチャートである。

【図５】ランダム変数のランダム密度関数対ランダム変数のグラフである。

【図６】ランダム変数の蓄積分散関数対ランダム変数のグラフである。

【図７】ルックアップテーブルのためのガウスデータの表である。

【符号の説明】

１２…伝送媒体，１８…通信チャネル，１００…符号器，２００…復号器

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ )，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (72)発明者シェン、タオアメリカ合衆国カリフォルニア州 92131 サン・ディエゴ、カミニト・コロラド 10829 Ｆターム(参考） 5D045 CC05 DA20

Claims

【特許請求の範囲】

【請求項１】下記を具備する、音声コーダ：第一のランダム変数（random variable）の値を発生するように構成された乱
数発生器；ランダム乱数発生器に接続された記憶媒体、該記憶媒体は第二のランダム変数
の値を含み、第二のランダム変数は第一のランダム変数の蓄積分散関数の逆変換
を具備する;及びランダム数発生器に接続されたコーデック、該コーデックは第一及び第二のラ
ンダム変数の値で入力無音フレームを符号化するために、及び第一と第二のランダム変数で無音フレームを再生するために構成される。
【請求項２】符号器が入力の無音フレームを１ｋｂｐｓで符号化するため
に構成される、請求項１の音声コーダ。
【請求項３】音声コーダが強化可変レート符号器(enhanced variable rat
e order)である、請求項1の音声コーダ
【請求項４】第一と第二のランダム変数は統計的にお互いに独立であっ
て、そして、ゼロと１の間で均一に分散された値を持つ第一と第二のガウスラン
ダム変数(random variables)を具備する、請求項１の音声コーダ。
【請求項５】記憶媒体が、第一のランダム変数の値によりアドレスされる
ルックアップテーブルを具備する、請求項１の音声コーダ。
【請求項６】下記の工程を具備する、無音のフレームを符号化する方法：第一のランダム変数の値を発生する；第二のランダム変数の値を記憶する、該第二のランダム変数は第一のランダム
変数の蓄積分散関数の逆変換を具備する；そして無音のフレームを第一と第二のランダム変数の値で符号化する；そして第一と第二のランダム変数の値で無音のフレームを再生(regenerate)する。
【請求項７】符号化する工程が１ｋｂｐｓで実行される、請求項6の方法
。
【請求項８】第一のと第二のランダム変数は統計的にお互いに独立であっ
て、そして、ゼロと1の間に均一に分散される第一と第二のガウスランダム変数
を具備する、請求項6の方法。
【請求項９】記憶工程が、第一のランダム変数の値によりアドレスされる
ルックアップテーブルに、第二のランダム変数の値を記憶することを具備する、
請求項６の方法。
【請求項１０】下記を具備する、音声コーダ：第一のランダム変数の値を発生する手段；第二のランダム変数の値を記憶する手段、第二のランダム変数は第一のランダ
ム変数の蓄積分散関数の逆変換を具備する；そして無音のフレームを第一と第二のランダム変数の値で符号化する手段；そして無音のフレームを第一と第二のランダム変数の値で再生する手段。
【請求項１１】符号化するための手段が、１ｋｂｐｓで無音のフレームを
符号化するように構成された、請求項１０の音声コーダ。
【請求項１２】音声コーダが強化可変レートコーダである、請求項１０の
音声コーダ。
【請求項１３】第一の第二のランダム変数は統計的にお互いに独立であっ
て、そして、ゼロと１の間に均一に分散される第一の第二のガウスランダム変数
を具備する、請求項１０の音声コーダ。
【請求項１４】記憶媒体が第一のランダム変数の値によりアドレスされる
ルックアップテーブルを具備する、請求項１０の音声コーダ。