JPH05150800A

JPH05150800A - 音声符号器

Info

Publication number: JPH05150800A
Application number: JP3317160A
Authority: JP
Inventors: Yoshihiro Tomita; 吉弘富田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-11-30
Filing date: 1991-11-30
Publication date: 1993-06-18

Abstract

(57)【要約】【目的】コード励起符号化（ＣＥＬＰ）方式による音
声符号器に関し、再生音声の品質を損うことなく一層の
情報圧縮が可能となるようにすることを目的とする。【構成】基本符号帳を特性別に分割した複数の特性別
基本符号帳２０−１〜２０−ｎを備え、音声入力信号を
周期的にまたは適宜監視してそれに最も適合する１つの
特性別基本符号帳を選択する特性選択制御部２１を設
け、次の選択があるまでは当該特性別基本符号帳のみを
継続して使用するように構成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声符号器、特にベクト
ル量子化を用いて音声信号を圧縮する、いわゆるコード
励起符号化方式（CELP：Code Excited Linear Predicti
on）に基づく、高能率な音声符号器に関するものであ
る。コード励起符号化（ＣＥＬＰ）方式は、後述するよ
うに音声信号をその品質を保持しつつ情報を圧縮する方
式であって、その能率の高さから近年特に注目を集めて
いる方式である。本発明はこの方式を採用した音声符号
器について一提案を行うものである。

【０００２】

【従来の技術】図９は従来の音声符号器の構成を表す図
である。本図において、音声符号器は音声入力信号（図
の上方）を受信して、これに対応する符号化出力Ｃ′ｏ
ｕｔを生成する。その構成は、複数種類の白色雑音から
なるコードベクトル群を格納する基本符号帳（Code boo
k ）１０、適応的に変化するピッチ予測残差ベクトルを
保持する適応符号帳１１、所定の（声道を模擬する）フ
ィルタ係数を有するフィルタであって各符号帳１０，１
１からの出力を入力として合成音声信号を生成する合成
フィルタ１３、符号化すべき音声入力信号を入力として
前記フィルタ係数を算出する線形予測分析部１２および
音声入力信号と合成音声入力信号との間の誤差が最小と
なるように各符号帳１０，１１に対し帰還をかけると共
に当該最小誤差に対応する１のコードベクトルを表すコ
ードＣ′ｏｕｔをもって音声入力信号の符号化出力とす
る誤差最小化制御部１４である。なお、図中の１５は加
算部、１６は減算部である。かくして、音声入力信号は
単にコードベクトル群の中の１つを表すコードＣ′ｏｕ
ｔによって符号化され、同様の符号帳を備える受信側で
は受信したそのコードＣ′ｏｕｔをもとに原音声を忠実
に再現することができる。これがコード励起符号化方式
の原理であり、既に周知である。

【０００３】

【発明が解決しようとする課題】音声入力信号の性質は
当該話者の声道特性等に依存するものであり、千差万別
である。したがって、いずれの話者についても、原音声
を高品質で、すなわち高い忠実度をもって受信側で再生
するためには、膨大な種類の数の白色雑音からなるコー
ドベクトル群を基本符号帳１０に予め格納しておかなけ
ればならない。すなわち極めて大きなサイズを有する基
本符号帳１０が必要となる。

【０００４】そうすると、その膨大な数のコードベクト
ルを表すための前記コードＣ′ｏｕｔのビット数は大幅
に増加してしまう。この結果、情報圧縮の効果は薄れ、
受信側へ低ビットレートで伝送することが困難になると
いう問題が生ずる。したがって本発明は上記問題点に鑑
み、情報圧縮効果を損うことなく、すなわちコードＣ′
ｏｕｔのビット数を増やすことなく原音声を高い忠実度
をもって再生可能にする音声符号器を提供することを目
的とするものである。

【０００５】

【課題を解決するための手段】図１は本発明に係る音声
符号器の原理構成を表す図である。本図において、従来
例に比して大幅に変更されたのは基本符号帳の部分であ
り。図示のごとく、複数の特性別基本符号帳２０−１〜
２０−ｎによって構成される。そして、これらの基本符
号帳２０−１〜２０−ｎにそれぞれ格納される各コード
ベクトル群の特性は相互に異なっている。

【０００６】これらの特性別基本符号帳２０−１〜２０
−ｎは択一的に使用されるが、そのための選択制御を行
うのが特性選択制御部２１であり、例えば誤差最小化制
御部１４と共働して、減算部１６からの誤差出力のうち
最小誤差に対応する１つのコードベクトルを格納する１
つの特性別基本符号帳（２０−１〜２０−ｎのうちの１
つ）を、例えば選択部２２を介して選択する。

【０００７】したがって符号化出力としては、上記の１
つのコードベクトルを表すコードＣｏｕｔの他に、選択
された特性別基本符号帳を表す識別コードＣＢを含むこ
とになる。

【０００８】

【作用】図２は本発明の原理を説明するための模式図で
ある。コード励起符号化方式は、白色雑音の音源とイン
パルス性の音源とを合成することによって、音声と等価
な音声信号が再現できることを利用したものであるが、
この場合の白色雑音源となるのが基本符号帳１０であ
る。この白色雑音源は理論上は無限個の位相の異なるコ
ードベクトル群（スペクトル群）をもって表すことがで
き、図２ではこれを点線の領域の母集団ＣＢ∞として表
す。

【０００９】もし音声入力信号を完璧な忠実度をもって
表そうとするならば、基本符号帳１０はその母集団ＣＢ
∞に相当する膨大な数のコードベクトル群を予め用意し
ておく必要がある。しかしこれは現実的でないし、また
情報圧縮効果も全く失われてしまう。一方、ある話者の
白色雑音スペクトル特性に着目すると、その者の音声が
有する特性は必ずしも母集団ＣＢ∞の全てを占有するも
のではない。すなわち、その母集団ＣＢ∞の中のいずれ
かの小さい領域内に分布するのが普通である。

【００１０】そこで、まずその母集団ＣＢ∞を特性別の
部分集団、例えば８個の部分集団ＣＢ₁〜ＣＢ₈に分割
することとする。通常、ある話者の音声の特性は、白色
雑音に関し、図中のＣＢ₁〜ＣＢ₈のいずれかで大体カ
バーできるはずである。そこで、上記のＣＢ₁〜ＣＢ₈
に対応させて、図１の特性別基本符号帳２０−１〜２０
−ｎ（この場合、ｎ＝８）を設け、その中に相互に特性
の異なるコードベクトル群（白色雑音スペクトルを表す
コード）をそれぞれ格納する。

【００１１】そして、これらの特性別基本符号帳２０−
１〜２０−８のうち、受信中の音声入力信号に最も適合
する１つの特性別基本符号帳を選択するのが、図１の特
性選択制御部２１である。この選択は上記の誤差（減算
部１６の出力）が最小になるような１つのコードベクト
ルを格納している特性別基本符号帳を検出することによ
って行われるから、誤差最小化制御部１４の処理結果を
利用してその選択を実行するのが最も簡便である。

【００１２】またこの場合その選択をいかなるタイミン
グで行うかについては種々考えられるが、これについて
は後述する実施例において具体的に説明する。かくし
て、音声符号器は常に小さい部分集団（図２のＣＢ₁〜
ＣＢ₈）の中のいずれか１つの部分集団に含まれるコー
ドベクトル群を用いて動作するから、図１のコードＣｏ
ｕｔを構成するビット数は、図９のコードＣ′ｏｕｔを
構成するビット数よりも少なくて済むのみならず、図９
（従来例）の音声符号器よりも高品質な、すなわち再生
忠実度の高い音声符号化が実現可能となる。

【００１３】

【実施例】図３は本発明の第１実施例を示す図である。
この第１実施例において、特性選択制御部２１は、予め
定めた一定周期で前記の選択を行い、各該一定周期の間
は当該１の特性別基本符号帳のみを選択する。その実現
例としては、図示のようにカウンタ３１およびＡＮＤゲ
ート３２を用いる。

【００１４】特性別基本符号帳２０−１〜２０−ｎは、
一般の基本符号帳１０や適応符号帳と同様に、その中に
格納されるコードベクトルは１フレーム長で構成され
る。１フレームは通常、２０msの長さを有し、音声を８
kHz でサンプリングする場合にはその中には１６０サン
プル分のデータが含まれる。したがって、音声入力信号
もそのフレーム単位で時系列的に処理される。

【００１５】一般に音声入力信号の特性は短時間（例え
ば０．５秒）のうちに急激に変化することはない。この
事実に着目し、上記の選択を１フレーム長より長い一定
周期で行うようにする。例えば８フレーム毎にその選択
を行うようにする。図３におけるカウンタ３１は音声符
号器内の基本クロックＣＬＫをカウントし、８フレーム
分のクロックを計数するごとにＡＮＤゲート３２を開に
する。ただし、例えば７フレーム分のクロックを計数し
た時点で誤差最小化制御部１４に、全ての符号帳２０−
１〜２０−８に亘るサーチを指示する。ＡＮＤゲート３
２が開になることによって、減算部１６の出力（誤差）
が最小になるコードベクトルを格納する特性別基本符号
帳の識別信号を選択部２２に送る。なお、最小誤差を判
定する誤差最小化制御部１４は、誤差電力計算回路を含
んで構成されるが既にその構成は周知であるから説明を
省略する。

【００１６】ところで、上記の選択は上記一定周期の始
めにのみ実行され、この選択によって選ばれた１つの特
性別基本符号帳のみがその一定周期の間中使用される。
またその次の一定周期の初めに再びその選択が行われ、
最小誤差に対応する別の特性別基本符号帳、もしくは直
前に使用された特性別基本符号帳が引き続き選ばれる。

【００１７】したがって、各一定周期の初めには８つの
特性別基本符号帳２０−１〜２０−８（ｎ＝８とする）
の全てを用いて誤差を算出し、その中から最小誤差を生
じさせる１つの特性別基本符号帳をを選択する、という
動作が行われる。このため、図中の構成要素１２，１
３，１４，１５，１６および２１を総括的に制御するプ
ロセッサ（図示せず）の処理量は、各該一定周期の初め
毎に８倍に跳ね上がることになる。この様子は図４のと
おりである。

【００１８】図４はプロセッサの処理量の時間的変化を
示す図である。図に示すように、プロセッサの処理にむ
らがあるものの、低ビットレートながら再生忠実度の高
い符号化出力が得られる。しかしながら、上述したプロ
セッサ処理のむらは、本発明の好ましい適用分野におい
ては事実上問題とならない。

【００１９】図５は本発明が適用される一システム例を
示す図であり、交換局間の中継伝送システムの例であ
る。このようなシステムでは、各加入者（ＴＥＬ）間で
送受される信号は各々に設けられたＣＯＤＥＣ（ＣＯＤ
ＥＲ／ＤＥＣＯＤＥＲ）によってアナログ／ディジタル
またはディジタル／アナログ変換され、多重化部ではｎ
チャンネル分の信号が多重化され、また分離部では多重
化信号がｎチャンネルの各々に分離される。

【００２０】本発明の音声符号器は多重化部に設けら
れ、情報圧縮が行われる。そうすると、図４の実線で示
したプロセッサの処理量の跳ね上り部分を第１チャンネ
ルＣＨ１に割り当てるようにし、次に点線で示したプロ
セッサの処理量の跳ね上り部分を第２チャンネルＣＨ２
に割り当てるようにし、以下同様に第ｎチャンネルＣＨ
ｎまで割り当てれば、プロセッサは常に最大の処理量で
動作することになり、上述したプロセッサの処理量のむ
らに起因する不経済さは解消される。

【００２１】図６は本発明の第２実施例を示す図であ
る。この第２実施例において、特性選択制御部２１は、
音声入力信号の無音部分から有音部分への変化点毎に前
記の選択を行い、次の該変化点まで当該１の特性別基本
符号帳のみを選択する。その実現例としては、フレーム
バッファ４１と、無音→有音の変化点を検出するための
変化点検出部４２を用いる。つまりこれら構成要素４１
および４２が図１の特性選択制御部２１をなす。

【００２２】図７は有音および無音の時間的変化を示す
図である。図６の変化点検出部４２は、図中の無音から
有音への変化点を検出する。そのために該検出部４２内
には有音と無音の切り分けをするコンパレータを設け
る。コンパレータは予め定めたしきい値ＴＨを比較基準
レベルとする。ＢＮはバックグランドノイズである。フ
レームバッファ４１は今のフレームの音声信号電力と比
較するための直前フレームの音声入力信号を保持する役
目を果たすと共に、音声符号器全体の動作を一フレーム
分遅延させ、無音→有音の立上り時にある音声入力信号
が欠落しないようにしている。

【００２３】無音→有音の変化点を検出すると誤差最小
化制御部１４に対し、特性別基本符号帳２０−１〜２０
−ｎの全てによる前記最小誤差のサーチを指示する。そ
の結果に応じて選択部２２が駆動される。図８は本発明
の第３実施例を示す図である。この実施例においては、
複数の特性別基本符号帳（２０）が、少なくとも高域ス
ペクトル基本符号帳２０−Ｈと、低域スペクトル基本符
号帳２０−Ｌとからなる。一方、特性選択制御部２１
は、音声入力信号のレベル変動を監視して、該レベル変
動が大または小であるのに応じて、それぞれ高域スペク
トル基本符号帳２０−Ｈまたは低域スペクトル基本符号
帳２０−Ｌを随時選択する。

【００２４】特性選択制御部２１の具体例としては、短
時間レベル検出部５１、長時間レベル検出部５２、両検
出部５１，５２の各検出出力の差分をとる減算部５３お
よび減算部５３の出力が基準レベルＲＥＦ以上になった
とき、選択部２２を駆動して高域スペクトル基本符号帳
２０−Ｈを選択せしめるコンパレータ５４を用いる。こ
の第３実施例は、音声入力信号レベルの変動が激しいと
きは、比較的高域での白色雑音が大く含まれ、逆にその
レベルの変動が緩やかなときは、比較的低域での白色雑
音が大く含まれることに着目したものである。

【００２５】

【発明の効果】以上説明したように本発明によれば、白
色雑音の音源を特性別に区分することによって各基本符
号帳のサイズを縮小し、これによって符号化出力のビッ
ト数を減らし、低ビットレート化、すなわち情報圧縮を
実現することができる。この場合、各基本符号帳は音声
入力信号の特性に応じて選択されることから、原音声を
極めて忠実に再生することが可能となる。

【００２６】また、音声入力信号のならず、音声帯域で
のモデム信号等にも適用でき、データ信号の帯域圧縮に
も応用することができる。

【図面の簡単な説明】

【図１】本発明に係る音声符号器の原理構成を表す図で
ある。

【図２】本発明の原理を説明するための模式図である。

【図３】本発明の第１実施例を示す図である。

【図４】プロセッサの処理量の時間的変化を示す図であ
る。

【図５】本発明が適用される一システム例を示す図であ
る。

【図６】本発明の第２実施例を示す図である。

【図７】有音および無音の時間的変化を示す図である。

【図８】本発明の第３実施例を示す図である。

【図９】従来の音声符号器の構成を表す図である。

【符号の説明】

１０…基本符号帳１１…適応符号帳１２…線形予測分析部１３…合成フィルタ１４…誤差最小化制御部２０−１〜２０−ｎ…特性別基本符号帳２０−Ｈ…高域スペクトル基本符号帳２０−Ｌ…低域スペクトル基本符号帳２１…特性選択制御部

Claims

【特許請求の範囲】

【請求項１】複数種類の白色雑音からなるコードベク
トル群を格納する基本符号帳（１０）と、適応的に変化
するピッチ予測残差ベクトルを保持する適応符号帳（１
１）と、所定のフィルタ係数を有するフィルタであって
各前記符号帳からの出力を入力として合成音声信号を生
成する合成フィルタ（１３）と、符号化すべき音声入力
信号を入力として前記フィルタ係数を算出する線形予測
分析部（１２）と、前記音声入力信号と前記合成音声入
力信号との間の誤差が最小となるように各前記符号帳に
対し帰還をかけると共に当該最小誤差に対応する１の前
記コードベクトルを表すコードをもって前記音声入力信
号の符号化出力とする誤差最小化制御部（１４）とから
なる音声符号器において、前記基本符号帳（１０）を、前記コードベクトル群の特
性が相互に異なる複数の特性別基本符号帳（２０−１〜
２０−ｎ）から構成すると共に、前記最小誤差に対応する１の前記コードベクトルを格納
する１の前記特性別基本符号帳を選択する特性選択制御
部（２１）を備えることを特徴とする音声符号器。
【請求項２】前記特性選択制御部（２１）は、予め定
めた一定周期で前記の選択を行い、各該一定周期の間は
当該１の前記特性別基本符号帳のみを選択する請求項１
に記載の音声符号器。
【請求項３】前記特性選択制御部（２１）は、前記音
声入力信号の無音部分から有音部分への変化点毎に前記
の選択を行い、次の該変化点まで当該１の前記特性別基
本符号帳のみを選択する請求項１に記載の音声符号器。
【請求項４】複数の前記特性別基本符号帳（２０−１
〜２０−ｎ）が、少なくとも高域スペトル基本符号帳
（２０−Ｈ）と、低域スペクトル基本符号帳（２０−
Ｌ）とからなり、前記特性選択制御部（２１）は、前記音声入力信号のレ
ベル変動を監視して、該レベル変動が大または小である
のに応じて、それぞれ該高域スペクトル基本符号帳（２
０−Ｈ）または該低域スペクトル基本符号帳（２０−
Ｌ）を随時選択する請求項１に記載の音声符号器。