WO2000064055A1

WO2000064055A1 - Dispositif de codage de signaux vocaux

Info

Publication number: WO2000064055A1
Application number: PCT/JP2000/002464
Authority: WO
Inventors: Hisashi Yajima
Original assignee: Mitsubishi Denki Kabushiki Kaisha
Priority date: 1999-04-20
Filing date: 2000-04-14
Publication date: 2000-10-26
Also published as: IL140123A0; EP1091495A4; JP2000308167A; EP1091495A1; US6484139B2; US20010007973A1

Description

明細書音声符号化装置技術分野

本発明は、音声のディジ夕ル有線通信および無線通信において用いられる音声符号化装置に関し、特に DTMF (Dual Tone Multi-Frequency) 信号、 PB (Push Button) 信号などの、音声周波数帯域を用いた非音声信号を伝送する事を目的とした音声符号化装置の改良方法に関する。背景技術

企業内通信においては、通信コストの低減が最も重要な課題である。通信トラヒックの大部分を占める音声信号の高能率伝送を実現するため、近年、 8 kb i t / s C S— A C E L- P ( Conjugate-Structure Algebraic-Code-Excited Line ar Prediction ：共役構造代数的符号励振線形予測）音声符号化方式（ITU-T勧告 G.729準拠）に代表されるような、音声符号化 '復号方式に基づく高能率音声符号化装置を適用する事例が増えつつある。

伝送速度が 8 kb i t/sクラスの音声符号化アルゴリズムにおいては、少ない情報量で高品質な音声を得るため、入力信号を音声信号に特化した構成となつている。この事を上記 8 kb i t/s CS— ACELP方式を例にとって説明する。図 9に符号器の概略ブロック図を、図 1 0に同詳細ブロック図を示す。このような符号化方式は、人間の発声機構をモデル化した符号化ァルゴリズムとなっている。即ち、人間の声道情報をモデル化した合成フィル夕 6 (音声のスベクトル包絡に対応する線形フィル夕）を構成し、人間の声帯音源に相当する、符号帳に蓄えられた時系列の信号（加算器 1 5の出力）で駆動する事によって音声を再生する CE LP方式に基づいている。

なお、詳細なアルゴリズムの説明は、 ITU-T Recommendation G.729, "Codi ng of Speech at 8kbit/s usmg Conjugate-Structure Algebraic-Code-Excited Linear Prediction(CS-ACLEP)"を参照されたい。 W j符号化アルゴリズムが音声に特化された構造になると、高能率音声符号化装置を用いた伝送路において、音声周波数帯域を用いた音声信号以外の信号（例えば

、 DTMF信号、 PB信号、 No.5シグナリング、モデム信号など）の伝送特性は、伝送効率が高能率になればなるほど低下する傾向がある。

この事を示す一例として、 LSP量子化部の詳細について、図 1 1を用いて説明する。図 1 1は、図 9に示した CS— ACELP方式に基づく符号器内の LS P量子化部（309) の詳細構成である。図 1 1において 308は L SPの MA (移動平均）予測成分を計算する MA予測成分計算器、 330は乗算器、 331 , 332, 333は加算器、 338は入力 LSP係数をもとに重み付け係数を算出する量子化誤差重み付け係数計算部、 334は加算器 332で計算された量子化 LSPベクトルと、入力音声信号をもとに計算された LSPべクトルとの自乗誤差を計算し、 334で計算された重み付け係数を乗じた後、量子化 LSPべクトル候補の中から最小の自乗誤差を選択する機能を備えた最小自乗誤差計算器、 335は第 1段 LSP符号帳、 336は第 2段 LSP符号帳、 337は M A予測係数のセットが複数種類格納された M A予測係数符号帳である。

なおくこの構成を用いた L S P量子化方法については、片岡他、「CS-ACEL Pの LSPとゲインの量子化法」、 NTT R&D、 Vol.45 No.4 1996 pp.331-336に詳細に述べられているのでこの場での説明は省略する。この L S P量子化方式を用いる事により、音声信号のスぺクトル包絡情報を効率よく量子化できる事が知られている。

CS-ACE L P音声符号化方式においては、 L S P係数の量子化に 3つの処理手順を踏む事で実現している。即ち、 LSP量子化部 309は、以下に示す 3 つの処理機能ブロックを有している。

( 1) フレーム間で予測可能な成分を差し引いて効率的に量子化するための、 MA (移動平均）予測成分計算部 308

(2) ターゲットとなる LSPを、音声により学習された符号帳を用いて大雑把に量子化を行う第 1段 LSP量子化符号帳 335

(3) 第 1段で大雑把に量子化されたターゲット LSPに対して、乱数系列を用いた符号帳で微調整を行う第 2段 LSP量子化符号帳 336 1 (1) の MA (移動平均）予測を用いる事により、周波数特性の急激な変化の少ない、即ちフレーム間で相関性の強い信号を効率的に量子化する事が出来る。また（2) の学習符号帳を用いることにより、音声信号特有のスペクトル包絡の概形を、少ない情報量で効率よく表現することが出来る。また、（2) の学習符号帳に加えて、（3) の乱数符号帳を併用することにより、スペクトル包絡の微妙な変化にも柔軟に追随する事が出来る。以上の観点から、 LSP量子化部 30 9は、音声のスペクトル包絡情報の特徴を効率よく符号化するのに、良く適した方式であるといえる。

一方、非音声信号、特に DTMF信号の符号化においては、以下のような性質を考慮する必要がある。

•スぺクトル包絡に関して、音声信号と DTMF信号とでは明らかに異なっている。

-信号継続時間と、ポーズ時間との間で、スペクトル特性に急激な変化がある。利得も急激に変化する。ただし、信号継続時間内に限定すれば、スペクトル特性、利得ともに変化量が極めて小さい。

• LSPの量子化歪が、そのまま DTMF信号の周波数歪に反映されるため、 L S P量子化歪は出来るだけ小さくする必要がある。

• DTMF信号が継続する区間においては、周波数特性は極めて安定している以上の観点から、上記 LSP量子化部 309は、 DTMF信号のスペクトル包絡情報を符号化するのに効果的な方法であるとは言えない。

以上の例で示したように、 DTMF信号のような非音声信号は、いくつかの観点で音声信号とは異なる性質を有しているため、非音声信号の符号化に当たって、特に伝送速度が低く符号化のための冗長性が少ないという条件の下では、音声信号と同じ手法を用いるのは適当とは言えない。

ところで、企業内通信においては、電話通信における呼接続などのために、シグナリング伝送のための信号線を別途設ける事をせず、 DTMF信号等を用いて

、インチャネルでシグナリング伝送を行う事が多い。この場合、割当てられた伝送路が、上記の高能率音声符号化を用いた伝送路であれば、 DTMF信号の伝送 ^性は悪化するため、呼接続が正常に出来なくなるケースが、高い頻度で発生するといった弊害がある。

このような問題を解決する第 1の手段として、例えば、特開平 9一 8 1 1 9 9 号公報に示されるような、図 1 2の装置構成がとられる事がある。この構成においては、送信側に、音声信号と、 D T M F信号のような非音声信号とを識別する手段と、 D T M F信号をあらかじめ符号化したパターンを記憶しているメモリを、送信側と受信側とで有しており、本識別手段において D T M F信号の入力を識別すると、 D T M Fの番号に対応する符号化パターンを保持するメモリのィンデックスを受信側に送信し、受信側では、そのインデックスを識別して、その番号に対応する D T M F信号を生成するものである。

また、このような問題を解決する第 2の手段として、例えば、図 1 3の装置構成がとられる事がある。符号器 1 0 1において、一部の符号化処理機能ブロックに関して、音声信号の符号化に最適化されたものと、非音声信号（例えば D T M F信号）を少ない歪で圧縮符号化できるように最適化されたものとを設ける。伝送する対象となる信号が音声か、非音声かを識別する手段を設け、識別手段の判定結果に応じて、上記機能プロックのいずれかを選択した上で符号化処理を行うような構成とする。符号器出力に判定結果を畳み込む手段を設け、伝送速度を変えず、かつ音声品質を極力劣化させずに伝送できるような構成にする。また、復号器 2 0 1側も、符号器 1 0 1に対応する切替手段を備えた。

次に、この音声符号化 ·復号装置の動作について説明する。図 1 3の送信側において、音声/非音声信号識別器 1 0 2は、入力される信号が音声信号か、非音声信号であるかを常に監視し、その判定結果に基づいて符号器 1 0 1の動作モードを決定する。音声/非音声信号識別器 1 0 2で「音声」と判定されたときは、切替スィツチ 1 0 3を 1 0 3 A側に、同 1 0 4を 1 0 4 A側にそれそれ倒す。その結果、符号器 1 0 1の内部において、符号化処理処理機能ブロック 1 0 5が選択され、音声信号を高能率に符号化するのに適した動作モード（以下、 "音声モ —ド" と称する）となる。

このモードにおいて、符号器 1 0 1は音声信号を符号化アルゴリズムに基づいて符号化処理を実行し、入力音声に対応する符号を出力する。また、音声/非音信号識別器 1 0 2で「非音声」と判定されたときは、切替スィッチ 1 0 3を 1 0 3.Β側に、同 1 0 4を 1 0 4 Β側にそれそれ倒す。その結果、符号器 1 0 1の内部において、符号化処理機能ブロック 1 0 6が選択され、非音声信号、例えば D T M F信号等を、少ない歪で圧縮符号化するのに適した動作モード（以下 "非音声モード" と称する）となる。

このモードにおいて、符号器 1 0 1は非音声信号、例えば D T M F信号等を符号化アルゴリズムに基づいて符号化処理を実行し、入力された非音声信号に対応する符号を出力する。さらに多重化部 1 0 7では、音声信号、或いは非音声信号が符号化されたもの（以下、音声/非音声符号と称する）と、音声/非音声信号識別器 1 0 2の出力である入力信号の識別結果（音声信号か、非音声信号か）を多重化して、伝送路へ送出する。

一方、図 1 3の受信側においては、まず伝送路から受信した信号列から、多重分離部 2 0 2において音声/非音声符号と、音声/非音声信号識別器 1 0 2の判定結果とに分離する。このように信号列から取り出された音声/非音声信号識別器 1 0 2の判定結果が、「音声」であれば、切替スィツチ 2 0 3を 2 0 3 Α側に、同 2 0 4を 2 0 4 A側にそれそれ倒す。その結果、復号器 2 0 1の内部において、復号処理機能ブロック 2 0 5が選択され、符号器 1 0 1の音声モードに対応した復号器の動作モードとなる。このモードにおいて、復号器 2 0 1は復号アルゴリズムに基づいて復号処理を実行し、音声信号を復号する。このとき、符号化 •復号処理はいずれも音声モードで実行されているので、復号された音声信号は、符号化アルゴリズムがもつ本来の性能に見合った品質となっている。

また、多重分離部 2 0 2で信号列から取り出された音声/非音声信号識別器 1

0 2の判定結果が、「非音声」であれば、切替スィツチ 2 0 3を 2 0 3 B側に、同 2 0 4を 2 0 4 B側にそれそれ倒す。その結果、復号器 2 0 1の内部において

、復号処理機能プロック 2 0 6が選択され、符号器 1 0 1の非音声モードに対応した復号器の動作モードとなる。このモードにおいて、復号器 2 0 1は復号アルゴリズムに基づいて復号処理を実行し、非音声信号を復号する。このとき、符号ィ匕 ·復号処理はいずれも非音声モードで実行されているので、復号された非音声信号は、音声モードで実行されるよりも、一層歪の少ないものとなっている。 I以上述べたような従来の実施例に依れば、音声信号伝送時には音声の符号化により適した、通常の音声符号化 ·復号アルゴリズムを用いた方法で、また、非音声信号、特に D T M F信号等の伝送時においては、一部の処理機能ブロックを、非音声信号の符号化により適した方法に切替えて、符号化 ·復号処理を実行するので、非音声信号伝送時に、伝送速度を上げる事無く、高品質の非音声信号を伝送する事が出来る。

上記の従来例に基づく音声通信システムを構築するに当たっては、符号器 1 0 1、復号器 2 0 1両者に上記の非音声モードを搭載する事が必須である。送信側 (符号化側）の改良のみでは、非音声モードに対して復号器側が対応できていないため、正常な音声信号を復号する手段がなく、異音の発生など、通話者にとつて好ましくない現象が発生する事が考えられる。

ところで、企業内通信システム等の構築に当たっては、諸事情により音声伝送装置を送信側と受信側とで同時にリブレイス出来ない事例が発生する。例えば、従来 I T U— T勧告 G . 7 2 9に準拠した C S—A C E L P方式に基づく音声符号化 ·復号装置を搭載した音声伝送装置（例えばマルチメディア多重化装置）が構築されていたとする。ここで、 D T M Fのインチャネル伝送の実現を目的として、上記に掲げたような非音声モードに対応した音声伝送装置を、送信側のみリプレイスしたとしても、相手側の音声伝送装置は従来型復号器であるため、対向接続が出来ない。従って、相手先の音声伝送装置もリブレイスが必要となるが、音声伝送装置のユーザに更に高額な投資を要求する事となるため、リプレイスを困難なものとしていた。

本発明は、このような従来の問題を解決するためになされたものであり、 D T M F信号等の非音声信号の伝送特性の改善を図りつつ、符号化ァルゴリズムが本来持っている音声伝送品質が維持された高能率音声符号化 ·復号装置を提供するに当たり、従来型の復号器と対向接続を可能としつつ、 D T M F信号等の非音声信号を、ィンチャネルで伝送可能とする音声符号化装置を得ることを目的とする J 発明の開示

この発明に係る音声符号化装置は、音声の符号化に適した第 1の量子化処理ブロック、及び非音声の符号化に適した第 2の量子化処理ブロックを有し、入力される信号を圧縮符号化する符号器と、符号器に入力される信号が音声信号か非音声信号かを識別し、判定結果を出力する音声 Z非音声信号識別器と、第 1の量子化処理ブロック及び第 2の量子化処理ブロックの各々の出力を多重化し伝送路に出力する多重化部とを備え、符号器は、音声/非音声信号識別器の判定結果に応じて、第 1の量子化処理ブロック、または第 2の量子化処理ブロックのいずれかを選択する選択手段を有し、第 1の量子化処理プロック及び第 2の量子化処理ブ口ックは、同一の量子化テーブルを用いて信号を圧縮符号化する。

また、第 1及び第 2の量子化処理ブロックは、 L S P (線スペクトル対）係数を量子化する処理プロックである。

また、 L S P係数を量子化する際、最適な量子化値を決定するために用いられる評価基準について、第 1及び第 2の係数量子化処理ブロックは、それそれ相異なる評価基準を有する。

また；第 1の量子化処理ブロックにおいて、 L S P係数を量子化する際、最適な量子化値を決定するために用いられる評価基準を、入力された音声信号の性質に応じて適応的に変化させるのに対し、第 2の量子化処理ブロックにおいては、評価基準は入力された音声信号の性質にかかわらず定常的である。

また、音声/非音声信号識別器は、 D T M F信号のディジットを検出するディジット検出手段を有し、ディジットの値に応じて決められた L S P係数を、第 2 の量子化処理プロックに入力する。

また、第 2の量子化処理ブロックは、 L S P符号帳の探索方法に閉ループ探索法を用いる。

さらに、第 2の量子化処理ブロックにおいて、最適な量子化値を決定するために用いられるパラメ一夕として、入力された音声信号の線形予測残差信号を用い o , 図面の簡単な説明

図.1は本発明の実施例 1における音声符号化装置の構成を示すプロック図、図 2は本発明の実施例 2における音声符号化装置の構成を示すプロック図、図 3は本発明の実施例 3における音声符号化装置の構成を示すプロック図、図 4は本発明の実施例 4における音声符号化装置の構成を示すプロック図、図 5は本発明の実施例 5における音声符号化装置の構成を示すプロック図、図 6は本発明の実施例 6における音声符号化装置の構成を示すプロック図、図 Ίは本発明の実施例 7における音声符号化装置の構成を示すプロック図、図 8は本発明の実施例 8における音声符号化装置の構成を示すプロック図、図 9は従来の符号器の概略プロック図、

図 1 0は図 9の符号器の更に詳細なブロック図、

図 1 1は L S P量子化部の詳細を示す図、

図 1 2は従来の他の符号器及び復号器を示す図、

図 1 3は従来の他の符号器及び復号器を示す図である。

• 発明を実施するための最良の形態

実施例 1 .

以下、本発明の一実施例について図面を参照しながら説明する。

図 1は本発明の第 1の実施例における音声符号化装置の構成を示すプロック図である。図 1において、 1 0 1は音声信号をあるアルゴリズムに基づき高能率に圧縮符号化する符号器、 1 0 2は符号器への入力信号が音声信号か、非音声信号

(例えば、 D T M F信号、 P B信号、 No.5シグナリング等）かを識別し、判定結果を出力する音声/非音声信号識別器、 1 0 3、 1 0 4は選択手段としての切替スィッチ、 1 0 5、 1 0 6はそれそれ符号器 1 0 1のある特定のパラメ一夕の量子化を実行するパラメ一夕量子化処理ブロック、 1 0 8は上記量子化処理プロック 1 0 5， 1 0 6で参照される量子化テーブル、 1 0 7は処理プロヅク 1 0 5

， 1 0 6で量子化されたパラメ一夕と、符号器 1 0 1で符号化されたそれ以外の量子化パラメ一夕とを多重化して伝送路に出力する多重化部である。

ここで量子化処理ブロック 1 0 5は、音声信号を対象とした最適な量子化が実 ^できるよう工夫がなされている第 1の量子化処理ブロックである。一方、量子化処理ブロック 1 0 6は非音声信号（例えば D T M F信号）を対象とした最適な量子化が実現できるよう工夫がなされている第 2の量子化処理ブロックである。例えば、量子化処理プロック 1 0 5と 1 0 6とでは、量子化テーブル探索時に「最適」と判断する評価基準が異なっているとする。なお、本実施例を実現するに当たっては、上記量子化処理ブロック 1 0 5， 1 0 6が量子化処理を実行する際に参照する量子化テーブル 1 0 8は、ともに同一のものを用いなければならない。また、量子化値に割り当てられる符号語（量子化インデックスなど）も、量子化処理プロック 1 0 5と 1 0 6とで共通でなければならない。

次に、この音声符号化装置の動作について説明する。図 1において、音声/非音声信号識別器 1 0 2は、入力される信号が音声信号か、非音声信号であるかを常に監視し、その判定結果に基づいて符号器 1 0 1の動作モードを決定する。音声/非音声信号識別器 1 0 2で「音声」と判定されたときは、切替スィツチ 1 0 3を 1 0 3 A側に、同 1 0 4を 1 0 4 A側にそれそれ倒す。その結果、符号器 1 0 1の内部において、符号化処理処理機能ブロック 1 0 5が選択され、音声信号を高能率に符号化するのに適した動作モード（以下、 "音声モード" と称する）となる。このモードにおいて、符号器 1 0 1は音声信号を符号化アルゴリズムに基づいて符号化処理を実行し、入力音声に対応する符号を出力する。

また、音声/非音声信号識別器 1 0 2で「非音声」と判定されたときは、切替スィッチ 1 0 3を 1 0 3 B側に、同 1 0 4を 1 0 4 B側にそれそれ倒す。その結果、符号器 1 0 1の内部において、符号化処理機能ブロック 1 0 6が選択され、非音声信号、例えば D T M F信号等を、少ない歪で圧縮符号化するのに適した動作モード（以下 "非音声モード" と称する）となる。このモードにおいて、符号器 1 0 1は非音声信号、例えば D T M F信号等を符号化アルゴリズムに基づいて符号化処理を実行し、入力された非音声信号に対応する符号を出力する。

音声/非音声信号識別器 1 0 2の動作について、一例として、識別の対象となる非音声信号に D T M F信号を用いて説明する。 D T M F信号はデュアルトーンで構成されており、出力される信号の周波数成分は、規定により特定の値に固定されている事から、 I · F F T等を用いて周波数分析を行う。

-パンドパスフィル夕を用いて特定の周波数成分を濾波する

等の方法を用いて、周波数軸上の特徴量を抽出し、 D T M F信号の持つ特徴量と一致するか否かを判定する事により識別する事が出来る。

また、 D T M F信号のレベルについても、送出レベルが規定により特定の範囲に限定されている事、レベルの変動が少ない事などから、比較的レベル変動が大きく、ダイナミックレンジの広い音声信号とは明らかに異なった特徴を示す。従つて、入力信号のレベルを監視する事により、 D T M F信号識別のための補助情報として用いる事で、 D T M F信号の検出精度を向上させる事も出来る。音声/ 非音声信号識別器 1 0 2では、上記のパラメ一夕を、入力信号を用いて独自に算出し、それらを基に判定を下して結果を出力する機能を持つ。

多重化部 1 0 7は、上記 1 0 5、あるいは 1 0 6で得られた量子化パラメ一夕のほか、符号器 1 0 1のほかの処理ブロックで得られる、音声の符号化に必要な量子化されたほかのパラメ一夕とともに多重化し、伝送路を経由して受信側へ送出する。ここで、音声/ D T M F信号識別器 1 0 2からの出力である識別結果については、量子化テーブル 1 0 8及びその量子化値に対応する符号語が共通化されているため、すでに復号のための必須情報では無くなつている。従って受信側へ送出する必要がない。このため、多重化部 1 0 7から送出されるビットシ一ケンス（フレームフォーマット）は、従来の符号器と同一のフォーマットを用いる事が出来る。

送信側から送られてくるビットシーケンスが従来型のものと全く同一であり、また、符号語の表現するパラメ一夕の物理的特性についても、従来型の符号器と共通化が図られているため、受信側については、従来型の復号器と全く同じ構成を用いて復号する事が出来る。

以上のように、本実施例に依れば、音声信号伝送時には音声の符号化により適した、通常の音声符号化アルゴリズムを用いた方法で、また、非音声信号、特に

D T M F信号等の伝送時においては、一部の処理機能ブロックを、非音声信号の伝送により適した量子化方法に切替えて、符号化処理を実行するので、音声伝送時と非音声信号伝送時とで共通のビットシーケンスを用いながら、非音声信号をり適した形で伝送する事が出来る。

また、本実施例においては、符号化処理の一部機能に変更を加えるものであり、アルゴリズムの本質に関わるような切替を行うものではないため、例えば、音声信号入力中に、音声/非音声信号識別器 102で「非音声」と誤識別した場合でも、多少の劣化はあるものの、ある程度の音声伝送品質は維持できるので、通話中に耳触りとなるような音を復号してしまう、といった弊害は抑えられる、といった利点もある。実施例 2.

以下に、本発明に係る第 2の実施例について、図 2を参照しながら説明する。本実施例は実施例 1の量子化処理プロック 105、 106に LSP (線スぺクトル対）量子化部を適用した場合についての、一つの動作例について詳細に述べたものである。ここで、説明を判り易くするために、符号化アルゴリズムの一例として CS— ACELP方式（I TU— Τ勧告 G. 729準拠）を用いる事とする。 CS— ACELP方式に基づく符号器の詳細なブロック図は、図 9に示した通りである。図 2において、 3Α、 3 Βは LSPの量子化を実行する LSP量子化プロックである。 3 Aは音声信号の L S Pパラメ一夕の量子化に最適化された量子化器（以下、音声用 LSP量子化器と称す）であり、 35は0丁1 の 3？パラメ一夕の量子化に最適化された量子化器（同、 0了1^?用1^3卩量子化器）である。その他、図 1及び図 9，図 10と同一の番号を記した構成要素は、上記実施例 1の項で説明したものと同一の機能を持つ構成要素であるため、説明の重複を省く。

高能率に音声を符号化する符号器において、音声信号のスぺクトル包絡情報を効率よく表現する手法として、 LSP (線スペクトル対）が用いられる事が多く、 CS— ACELP方式においても音声スぺクトル包絡情報パラメ一夕の伝送方式として LSP方式が採用されている。 LSPについては、菅村、板倉、「線スぺクトル対（LSP) 音声分析合成法式による音声情報圧縮」、電子通信学会論文誌' 81/08 Vol.J64-A No.8 pp.599-606 に詳しく述べられているので、この場での説明は省略する。 I次に、この符号器の動作について説明する。図 2おいて、音声/非音声信号識別器.102は、入力される信号が音声信号か、非音声信号であるかを常に監視し、その判定結果に基づいて切替スィッチ 103, 104の状態を決定する。音声 /非音声信号識別器 102で「音声」と判定されたときは、切替スィツチ 103 を 103 A側に、同 104を 104 A側にそれそれ倒す。その結果、量子化処理ブロックに音声用 LSP量子化器 3 Aが選択され、 "音声モード" に設定される。また、音声/非音声信号識別器 102で「非音声」と判定されたときは、切替スィッチ 103を 103 B側に、同 104を 104 B側にそれそれ倒す。その結果、 LSP量子化処理ブロックとしてDTMF用LSP量子化器3Bが選択され、 "非音声モード" に設定される。

音声用 LSP量子化器 3 Aは、例えば、図 11と全く同一の構成をとるものとする。即ち、

(1) MA (移動平均）予測成分計算部 308

(2)第 1段 LSP量子化符号帳 335

(3)第 2段 LSP量子化符号帳 336

を備えた、フレーム間予測及び多段量子化の 2つの手法を用いるものとする。上記量子化器 3 Aは、周波数領域のパラメ一夕である LSPを、最小自乗誤差を評価基準として量子化を行っている。即ち、最適な量子化値として選択されるのは、この自乗誤差が最小の値をとるものである。従って量子化誤差は周波数歪として復号された音声信号に反映される可能性が高い。

人間の聴覚は、音声のスペクトル歪を長時間の平均で検知するため、上記 MA 予測器 308の状態により瞬間的に周波数歪が大きくなつたとしても、歪として検知されない場合が多い。ところが DTMFの受信規定では、スペクトルピークの微小変化に対する受信規定が厳しい事（例えば、 TTC標準 JJ— 20. 12

「PBX— TDM間ディジタルイン夕フェース（個別線信号方式） — PBX— P

BX間信号規定」の PB信号受信規定によれば、 PB送信規定で定められた信号周波数からの周波数偏差は +— 1. 8%以内と規定されている）から、元来スぺクトル歪に対しては弱いと考えられる。

さらに、交換機等で用いられる DTMF検出器の構成によっては、 DTMFの時スぺクトルを検出のためのサンプルとして捉えてしまう恐れがある。上記

SP量子化器 309 Aを用いて高能率に符号化 ·復号処理を施された DTMF信号について、上記 MA予測器 308の状態によりスぺクトル歪が瞬間的に大きくなってしまった時間帯を検出サンプルとして捉えてしまうと、 L SPの量子化誤差による影響を最大限に受けてしまい、 DTMF信号と認識されなくなる恐れがある。このように、 DTMFの伝送に当たっては音声よりも周波数歪に対して留意する必要があるといえる。

一般的に市販されている DTMF検出器について、音声と DTMFとを識別するため、第 3フォルマント等、高次の周波数ビークを検出する方式を採用しているものもあるが、主信号の周波数成分に比べ厳密な検出を目的としたものではないので、 D TMFを構成する周波数成分以外の成分については、歪についてルーズであっても DTMFの伝送特性を劣化させる要因にはならないと考えられる。即ち歪のない D TMF信号を復号するためには、スべクトルのピークとなる付近の周波数域では量子化誤差を最大限に少なくする事が重要で、それ以外の D TM F検出には関わらない周波数領域では、ある程度の量子化誤差を許容する事が出来ると考えられる。このトレードオフの関係から、 DTMF用量子化器 309 B は、例えば、他の周波数成分についての量子化誤差の増加を許容して、 DTMF を構成する周波数成分付近の量子化誤差を極力少なくするように構成する。以上のように本実施例によれば、符号化時に、 DTMF検出の決め手となるトーン周波数近傍での、量子化によるスぺクトル歪を極力抑えられるように工夫されているので、より原信号に忠実な DTMF信号を復号できるという効果がある

実施例 3.

以下に、本発明に係る第 3の実施例について、図 3を参照しながら説明する。本実施例は実施例 2の L S P量子化処理プロック 309内部の機能プロックである量子化誤差重み付け係数計算部 338を、音声/ DTMF信号識別器 102の判定結果に応じて、音声入力時と D T M F入力時とで適応的に切替えられるようにしたものである。図 3において、 338Aは、音声信号の L S P係数の量子化差を最適に評価できるよう工夫された、音声用重み付け係数算出部、 338B は、 D T M F信号の L S P係数の量子化誤差を最適に評価できるよう工夫された、 DTMF用重み付け係数算出部である。

次に、動作について説明する。本実施例において、量子化誤差計算に用いる重み付け係数は、 CS— ACELP方式に依れば、以下の式（1) で示される方法で計算されている。

ここで、；:1は1次1^3 、である。

即ち、スぺクトルのビークがくる周波数域については重み付け係数を重くし、スぺクトルの"谷" になっている周波数域については重み付け係数が軽くなつている。これは、スペクトルのビークを示す周波数域については量子化誤差の寄与分を重くして、誤差に対する感度を鋭くする効果がある。ここで、 DTMF信号を LSP符号化する際、重み付け係数が大きい次数の LSPについては、トーン周波数に対応するものであろうと考えられる。このトーン周波数成分に対応する重み付け係数をより大きくする事により、この周波数成分について、局所的にではあるが量子化誤差による周波数歪を低減する事が出来る。

この DTMFのトーン周波数に対応するであろうと考えられる L S P係数の重み付け係数をより大きくするためには、例えば、重み付け計算部 338 Aと同様な操作を行った後、その係数がある閾値を超えていたら、その重み付け係数に 1 以上の補正値を掛けるような処理を施せば良い。ここで用いる閾値、及び補正値付いては、受信側での DTMF認識率や、音声/： DTMF信号識別器 102の誤検出による音声品質の劣化なども考慮した上で、実験的に最適な値を求めていく事が望ましい。

以上のように、本発明の第 3の実施例に依れば、 LSP量子化を、 DTMF信号を構成するデュアルトーン周波数近傍について、量子化誤差の評価基準を変える事によって、符号化時にスぺクトル歪を極力抑えられるように工夫されているので、より原信号に忠実な DTMF信号を復号できるという効果がある。実施例 4.

以下に、本発明に係る第 4の実施例について、図 4を参照しながら説明する。本実施例は実施例 1の DTMF用重み付け係数計算処理部 338 Bを、重み付け係数格納メモリ 338 Cに置き換えたものである。

DTMF信号の LSP係数を詳しく調査すると、低群周波数に相当するスぺクトルビークは 1次〜 3次の LSP係数が関与しており（その中でも、特に 1次と 2次の寄与分が大きい）、同じく高群周波数については 4次〜 6次の LSP係数が関与'（同じく 5次と 6次の寄与分が大きい）しており、その他の LSP係数は DTMF信号のスべクトル包絡表現には殆ど関与していない事が判っている。メモリ 338 Cには、例えば、 1次〜 6次の LSP係数の重み付けを大きくし、 7 次〜 10次の LSP係数の重み付けを極端に小さくしたような重み付け系数列を、あらかじめ何らかの手法で定めておいた上で格納しておく。音声/ DTMF信号識別器の判定結果で「DTMF」と判定された場合は、量子化前の LSP係数から計算する事をせずに、このメモリ内の重み付け係数を用いて最小自乗誤差の探索を行う。

以上のように、本実施例に依れば、 DTMF用重み付け係数計算処理部を専用に設ける必要がなくなるため、符号化アルゴリズムを実現するプログラム容量を削減する事が出来るほか、符号化アルゴリズムを簡素化出来るため導入しやすいなどの利点がある。実施例 5. I以下に、本発明に係る第 5の実施例について、図 5を参照しながら説明する。本実施例は実施例 2の音声/ DTMF信号識別器 102に、ディジット検出機能を追加し（102A) 、またそのディジット検出結果に応じて、最適な LSP係数をあらかじめ格納してあるメモリ 111からロードする機能を追加したものである ο

次に動作について説明する。信号識別器 102 Aで検出された DTMFデイジッ卜の値はメモリ 111に送られる。メモリ 111には、各ディジットに対応して LSP係数が格納されており、信号識別器 102 Aの出力に応じて、対応する LSP係数を抽出し、 LSP量子化部へ送る。メモリに格納される LSP係数は、理想的な DTMF波形における L SP係数をあらかじめ求めておいたものである。 0丁1 ?用 3?量子化部38では、 DTMF検出時は、メモリからロードされた理想的な LSP係数をもとに、量子化コードブックを探索し、インデックスを出力する。

この実施例を用いる事で、例えば、符号器に入力された D TMF信号がヅイスト歪や、若干の周波数歪を受けたものであっても、 L SP量子化の時点で補正されるため、より望ましい特性を持った DTMF信号を送信する事が出来るなどの効果がある。実施例 6.

以下に、本発明に係る第 6の実施例について、図 6を参照しながら説明する。本実施例は実施例 2の L S P量子化部 3 Bにおいて、 D T M F検出時の L S Pコ ―ドブックの探索方法にいわゆる閉ループ探索法を用いるものである。

次に動作について説明する。信号識別器 102によるスィツチ 103， 104 の動作は実施例 2の場合と同様である。音声入力時、即ち従来の CS— ACEL P方式では、入力信号をもとにまず LSP係数の量子化を実行し、合成フィル夕の係数を決定する。その後、適応符号帳インデックス 6 A、雑音符号帳インデックス 6 B、励振信号の利得符号帳ィンデックス 6 Cの組み合わせを変えて音声信号を合成し、入力音声信号との自乗誤差が最小となるようなインデックスの組み合わせを決定する。 I一方、 D T M F検出時の L S P量子化に際しては、最初に合成フィル夕の係数を決定する事はせず、他の 3種類の量子化パラメ一夕と同様、復号器で復号されるであろう合成音声波形について評価を行う。まず、復号器に伝送される量子化パラメ一夕である適応符号帳ィンデックス 6 A、雑音符号帳ィンデックス 6 B、励振信号の利得符号帳ィンデックス 6 Cを組み合わせることにより、合成フィル夕の励振信号 6 Eの候補を複数パターン生成する。その励振信号 6 Eの各々について、 L S Pコードブックに格納された複数パターンの L S P係数を用いて、合成フィル夕 6にて合成信号を生成する。最小自乗誤差探索部 1 7では、上記のようにして得られた複数種類の合成信号と、符号器に入力された音声信号 6 Fとの自乗誤差を求める。その中で自乗誤差が最小となるような量子化パラメ一夕の組合わせを選択する。各パラメ一夕について符号化して多重化部 1 0 7にて多重化し、復号器に伝送する。

この実施例によれば、 L S P符号帳インデックス 6 Dの、 4種類の量子化パラメ一夕の組み合わせ全てについて音声を合成し、それそれの合成信号波形について、入力信号と合成信号との自乗誤差を計算し、最小となるような、量子化パラメ一夕の組合せを探索するため、波形歪の少ない D T M F信号の復号する事が出来る。実施例 Ί .

以下に、本発明に掛かる第 7の実施例について、図 7、図 8を参照しながら説明する。本実施例は、実施例 6で L S P量子化の評価に用いていた複数種類の励振信号を、入力信号の予測残差信号に置換したものである。

次に動作について説明する。まず、信号識別器 1 0 2によるスィッチ 1 0 3 , 1 0 4の動作は実施例 2の場合と同様である。符号器に入力された音声信号はブロック 2で線形予測分析されると同時に、そこで得られた線形予測係数を用いて構成された逆合成フィル夕 1 1 0に入力される。逆合成フィル夕 1 1 0から出力された線形予測残差信号 7 Aは、 D T M F用L S P量子化器に入カされ、 L S P 量子化時の評価に用いられる。逆合成フィル夕 1 1 0は、例えば次式（2 ) で示される伝達関数で構成する事が出来る。 10 —i

(2 )

ここで、ひ iは線形予測分析部 2で計算される線形予測係数である。

D T M F用 L S P量子化器 3 Bの詳細な動作について、図 8を用いて説明する。 3種類の L S P符号帳 3 3 5〜3 3 7の組み合わせ、及び M A予測によって得られた、複数の量子化 L S P係数の候補は、 D T M F用 L S P量子化器 3 Bに口一カルに構成された合成フィル夕 3 4 0に供給される。逆合成フィル夕で生成された残差信号 7 Aをこの合成フィル夕に入力し、各々の L S P係数の候補に対応した複数の合成信号を得る。この複数の合成信号と、符号器に入力された音声信号との自乗誤差を計算し、最小の値をとる L S Pパラメ一夕の組み合わせを探索し、そのインデックスを抽出し、出力する。

実施例 6では、総ての量子化パラメ一夕の組み合わせについて音声を合成し、それそれの合成信号波形について、入力信号との自乗誤差を求め評価するため、最適な量子化パラメ一夕の組み合わせが得られる可能性はあるものの、計算量が膨大となっていた。この実施例を用いる事で、その性能は若干劣るものの、量子化歪をある程度低減しつつ、演算量の低減も図られているため、廉価な D S Pでも実現できる、消費電力が低減できるなどの効果がある。産業上の利用の可能性

本発明に依れば、音声信号伝送時には音声の符号化により適した、通常の音声符号化 ·復号アルゴリズムを用いた方法で、また、非音声信号、特に D T M F信号等の伝送時においては、一部の処理機能ブロックを、非音声信号の符号化によ D|適した方法に切替えて、符号化 ·復号処理を実行するので、非音声信号伝送時に、伝送速度を変える事無く、高品質の非音声信号を伝送する事が出来る。また、本発明においては、符号化 *復号処理の一部に変更を加えるものであり、アルゴリズムの本質に関わるような切替を行うものではないため、例えば、音声信号入力中に、音声/非音声信号識別器 1 0 2で「非音声」と誤識別した場合でも、多少の劣化はあるものの、ある程度の音声伝送品質は維持できるので、通話中に耳触りとなるような音を復号してしまう、といった弊害は抑えられる、といった利点もある。

また、簡便な方法で構成された、識別性能の良くない音声/非音声信号識別器を適用しても、ある程度の音声品質の維持が可能である事から、簡単な装置構成で実現できるため、製造コストが低減できるなどの優れた効果がある。

Claims

請求の範囲

1 . 音声の符号化に適した第 1の量子化処理ブロック、及び非音声の符号化に適した第 2の量子化処理プロックを有し、入力される信号を圧縮符号化する符号器と、

上記符号器に入力される信号が音声信号か非音声信号かを識別し、判定結果を出力する音声/非音声信号識別器と、

上記第 1の量子化処理プロック及び上記第 2の量子化処理プロックの各々の出力を多重化し伝送路に出力する多重化部とを備え、—

上記符号器は、上記音声/非音声信号識別器の上記判定結果に応じて、上記第 1の量子化処理ブロック、または上記第 2の量子化処理プロックのいずれかを選択する選択手段を有し、

上記第 1の量子化処理プロック及び上記第 2の量子化処理プロックは、同一の量子化テーブルを用いて信号を圧縮符号化する

ことを特徴とする音声符号化装置。

2 . 上記第 1及び第 2の量子化処理ブロックは、 L S P (線スペクトル対）係数を量子化する処理プロックである

ことを特徴とする請求項 1記載の音声符号化装置。

3 . 上記 L S P係数を量子化する際、最適な量子化値を決定するために用いられる評価基準について、上記第 1及び第 2の係数量子化処理ブロックは、それそれ相異なる評価基準を有する

ことを特徴とする請求項 2記載の音声符号化装置。

4 . 上記第 1の量子化処理ブロックにおいて、上記 L S P係数を量子化する際、最適な量子化値を決定するために用いられる評価基準を、入力された音声信号の性質に応じて適応的に変化させるのに対し、

上記第 2の量子化処理ブロックにおいては、上記評価基準は入力された音声信号の性質にかかわらず定常的である _tことを特徴とする請求項 2記載の音声符号化装置。

5. 上記音声/非音声信号識別器は、 DTMF信号のディジットを検出するディジット検出手段を有し、

上記ディジッ卜の値に応じて決められた LSP係数を、上記第 2の量子化処理ブロックに入力する

ことを特徴とする請求項 1乃至 4のいずれか記載の音声符号化装置。

6. 上記第 2の量子化処理ブロックは、 LSP符号帳の探索方法に閉ループ探索法を用いる

ことを特徴とする請求項 1乃至 5のいずれか記載の音声符号化装置。

7. 上記第 2の量子化処理ブロックにおいて、最適な量子化値を決定するために用いられるパラメ一夕として、入力された音声信号の線形予測残差信号を用いる

ことを特徴とする請求項 6記載の音声符号化装置。