JPH05150800A - 音声符号器 - Google Patents

音声符号器

Info

Publication number
JPH05150800A
JPH05150800A JP3317160A JP31716091A JPH05150800A JP H05150800 A JPH05150800 A JP H05150800A JP 3317160 A JP3317160 A JP 3317160A JP 31716091 A JP31716091 A JP 31716091A JP H05150800 A JPH05150800 A JP H05150800A
Authority
JP
Japan
Prior art keywords
characteristic
speech
code
input signal
basic codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3317160A
Other languages
English (en)
Inventor
Yoshihiro Tomita
吉弘 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3317160A priority Critical patent/JPH05150800A/ja
Publication of JPH05150800A publication Critical patent/JPH05150800A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 コード励起符号化(CELP)方式による音
声符号器に関し、再生音声の品質を損うことなく一層の
情報圧縮が可能となるようにすることを目的とする。 【構成】 基本符号帳を特性別に分割した複数の特性別
基本符号帳20−1〜20−nを備え、音声入力信号を
周期的にまたは適宜監視してそれに最も適合する1つの
特性別基本符号帳を選択する特性選択制御部21を設
け、次の選択があるまでは当該特性別基本符号帳のみを
継続して使用するように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声符号器、特にベクト
ル量子化を用いて音声信号を圧縮する、いわゆるコード
励起符号化方式(CELP:Code Excited Linear Predicti
on)に基づく、高能率な音声符号器に関するものであ
る。コード励起符号化(CELP)方式は、後述するよ
うに音声信号をその品質を保持しつつ情報を圧縮する方
式であって、その能率の高さから近年特に注目を集めて
いる方式である。本発明はこの方式を採用した音声符号
器について一提案を行うものである。
【0002】
【従来の技術】図9は従来の音声符号器の構成を表す図
である。本図において、音声符号器は音声入力信号(図
の上方)を受信して、これに対応する符号化出力C′o
utを生成する。その構成は、複数種類の白色雑音から
なるコードベクトル群を格納する基本符号帳(Code boo
k )10、適応的に変化するピッチ予測残差ベクトルを
保持する適応符号帳11、所定の(声道を模擬する)フ
ィルタ係数を有するフィルタであって各符号帳10,1
1からの出力を入力として合成音声信号を生成する合成
フィルタ13、符号化すべき音声入力信号を入力として
前記フィルタ係数を算出する線形予測分析部12および
音声入力信号と合成音声入力信号との間の誤差が最小と
なるように各符号帳10,11に対し帰還をかけると共
に当該最小誤差に対応する1のコードベクトルを表すコ
ードC′outをもって音声入力信号の符号化出力とす
る誤差最小化制御部14である。なお、図中の15は加
算部、16は減算部である。かくして、音声入力信号は
単にコードベクトル群の中の1つを表すコードC′ou
tによって符号化され、同様の符号帳を備える受信側で
は受信したそのコードC′outをもとに原音声を忠実
に再現することができる。これがコード励起符号化方式
の原理であり、既に周知である。
【0003】
【発明が解決しようとする課題】音声入力信号の性質は
当該話者の声道特性等に依存するものであり、千差万別
である。したがって、いずれの話者についても、原音声
を高品質で、すなわち高い忠実度をもって受信側で再生
するためには、膨大な種類の数の白色雑音からなるコー
ドベクトル群を基本符号帳10に予め格納しておかなけ
ればならない。すなわち極めて大きなサイズを有する基
本符号帳10が必要となる。
【0004】そうすると、その膨大な数のコードベクト
ルを表すための前記コードC′outのビット数は大幅
に増加してしまう。この結果、情報圧縮の効果は薄れ、
受信側へ低ビットレートで伝送することが困難になると
いう問題が生ずる。したがって本発明は上記問題点に鑑
み、情報圧縮効果を損うことなく、すなわちコードC′
outのビット数を増やすことなく原音声を高い忠実度
をもって再生可能にする音声符号器を提供することを目
的とするものである。
【0005】
【課題を解決するための手段】図1は本発明に係る音声
符号器の原理構成を表す図である。本図において、従来
例に比して大幅に変更されたのは基本符号帳の部分であ
り。図示のごとく、複数の特性別基本符号帳20−1〜
20−nによって構成される。そして、これらの基本符
号帳20−1〜20−nにそれぞれ格納される各コード
ベクトル群の特性は相互に異なっている。
【0006】これらの特性別基本符号帳20−1〜20
−nは択一的に使用されるが、そのための選択制御を行
うのが特性選択制御部21であり、例えば誤差最小化制
御部14と共働して、減算部16からの誤差出力のうち
最小誤差に対応する1つのコードベクトルを格納する1
つの特性別基本符号帳(20−1〜20−nのうちの1
つ)を、例えば選択部22を介して選択する。
【0007】したがって符号化出力としては、上記の1
つのコードベクトルを表すコードCoutの他に、選択
された特性別基本符号帳を表す識別コードCBを含むこ
とになる。
【0008】
【作用】図2は本発明の原理を説明するための模式図で
ある。コード励起符号化方式は、白色雑音の音源とイン
パルス性の音源とを合成することによって、音声と等価
な音声信号が再現できることを利用したものであるが、
この場合の白色雑音源となるのが基本符号帳10であ
る。この白色雑音源は理論上は無限個の位相の異なるコ
ードベクトル群(スペクトル群)をもって表すことがで
き、図2ではこれを点線の領域の母集団CB∞として表
す。
【0009】もし音声入力信号を完璧な忠実度をもって
表そうとするならば、基本符号帳10はその母集団CB
∞に相当する膨大な数のコードベクトル群を予め用意し
ておく必要がある。しかしこれは現実的でないし、また
情報圧縮効果も全く失われてしまう。一方、ある話者の
白色雑音スペクトル特性に着目すると、その者の音声が
有する特性は必ずしも母集団CB∞の全てを占有するも
のではない。すなわち、その母集団CB∞の中のいずれ
かの小さい領域内に分布するのが普通である。
【0010】そこで、まずその母集団CB∞を特性別の
部分集団、例えば8個の部分集団CB1 〜CB8 に分割
することとする。通常、ある話者の音声の特性は、白色
雑音に関し、図中のCB1 〜CB8のいずれかで大体カ
バーできるはずである。そこで、上記のCB1〜CB8
に対応させて、図1の特性別基本符号帳20−1〜20
−n(この場合、n=8)を設け、その中に相互に特性
の異なるコードベクトル群(白色雑音スペクトルを表す
コード)をそれぞれ格納する。
【0011】そして、これらの特性別基本符号帳20−
1〜20−8のうち、受信中の音声入力信号に最も適合
する1つの特性別基本符号帳を選択するのが、図1の特
性選択制御部21である。この選択は上記の誤差(減算
部16の出力)が最小になるような1つのコードベクト
ルを格納している特性別基本符号帳を検出することによ
って行われるから、誤差最小化制御部14の処理結果を
利用してその選択を実行するのが最も簡便である。
【0012】またこの場合その選択をいかなるタイミン
グで行うかについては種々考えられるが、これについて
は後述する実施例において具体的に説明する。かくし
て、音声符号器は常に小さい部分集団(図2のCB1
CB8 )の中のいずれか1つの部分集団に含まれるコー
ドベクトル群を用いて動作するから、図1のコードCo
utを構成するビット数は、図9のコードC′outを
構成するビット数よりも少なくて済むのみならず、図9
(従来例)の音声符号器よりも高品質な、すなわち再生
忠実度の高い音声符号化が実現可能となる。
【0013】
【実施例】図3は本発明の第1実施例を示す図である。
この第1実施例において、特性選択制御部21は、予め
定めた一定周期で前記の選択を行い、各該一定周期の間
は当該1の特性別基本符号帳のみを選択する。その実現
例としては、図示のようにカウンタ31およびANDゲ
ート32を用いる。
【0014】特性別基本符号帳20−1〜20−nは、
一般の基本符号帳10や適応符号帳と同様に、その中に
格納されるコードベクトルは1フレーム長で構成され
る。1フレームは通常、20msの長さを有し、音声を8
kHz でサンプリングする場合にはその中には160サン
プル分のデータが含まれる。したがって、音声入力信号
もそのフレーム単位で時系列的に処理される。
【0015】一般に音声入力信号の特性は短時間(例え
ば0.5秒)のうちに急激に変化することはない。この
事実に着目し、上記の選択を1フレーム長より長い一定
周期で行うようにする。例えば8フレーム毎にその選択
を行うようにする。図3におけるカウンタ31は音声符
号器内の基本クロックCLKをカウントし、8フレーム
分のクロックを計数するごとにANDゲート32を開に
する。ただし、例えば7フレーム分のクロックを計数し
た時点で誤差最小化制御部14に、全ての符号帳20−
1〜20−8に亘るサーチを指示する。ANDゲート3
2が開になることによって、減算部16の出力(誤差)
が最小になるコードベクトルを格納する特性別基本符号
帳の識別信号を選択部22に送る。なお、最小誤差を判
定する誤差最小化制御部14は、誤差電力計算回路を含
んで構成されるが既にその構成は周知であるから説明を
省略する。
【0016】ところで、上記の選択は上記一定周期の始
めにのみ実行され、この選択によって選ばれた1つの特
性別基本符号帳のみがその一定周期の間中使用される。
またその次の一定周期の初めに再びその選択が行われ、
最小誤差に対応する別の特性別基本符号帳、もしくは直
前に使用された特性別基本符号帳が引き続き選ばれる。
【0017】したがって、各一定周期の初めには8つの
特性別基本符号帳20−1〜20−8(n=8とする)
の全てを用いて誤差を算出し、その中から最小誤差を生
じさせる1つの特性別基本符号帳をを選択する、という
動作が行われる。このため、図中の構成要素12,1
3,14,15,16および21を総括的に制御するプ
ロセッサ(図示せず)の処理量は、各該一定周期の初め
毎に8倍に跳ね上がることになる。この様子は図4のと
おりである。
【0018】図4はプロセッサの処理量の時間的変化を
示す図である。図に示すように、プロセッサの処理にむ
らがあるものの、低ビットレートながら再生忠実度の高
い符号化出力が得られる。しかしながら、上述したプロ
セッサ処理のむらは、本発明の好ましい適用分野におい
ては事実上問題とならない。
【0019】図5は本発明が適用される一システム例を
示す図であり、交換局間の中継伝送システムの例であ
る。このようなシステムでは、各加入者(TEL)間で
送受される信号は各々に設けられたCODEC(COD
ER/DECODER)によってアナログ/ディジタル
またはディジタル/アナログ変換され、多重化部ではn
チャンネル分の信号が多重化され、また分離部では多重
化信号がnチャンネルの各々に分離される。
【0020】本発明の音声符号器は多重化部に設けら
れ、情報圧縮が行われる。そうすると、図4の実線で示
したプロセッサの処理量の跳ね上り部分を第1チャンネ
ルCH1に割り当てるようにし、次に点線で示したプロ
セッサの処理量の跳ね上り部分を第2チャンネルCH2
に割り当てるようにし、以下同様に第nチャンネルCH
nまで割り当てれば、プロセッサは常に最大の処理量で
動作することになり、上述したプロセッサの処理量のむ
らに起因する不経済さは解消される。
【0021】図6は本発明の第2実施例を示す図であ
る。この第2実施例において、特性選択制御部21は、
音声入力信号の無音部分から有音部分への変化点毎に前
記の選択を行い、次の該変化点まで当該1の特性別基本
符号帳のみを選択する。その実現例としては、フレーム
バッファ41と、無音→有音の変化点を検出するための
変化点検出部42を用いる。つまりこれら構成要素41
および42が図1の特性選択制御部21をなす。
【0022】図7は有音および無音の時間的変化を示す
図である。図6の変化点検出部42は、図中の無音から
有音への変化点を検出する。そのために該検出部42内
には有音と無音の切り分けをするコンパレータを設け
る。コンパレータは予め定めたしきい値THを比較基準
レベルとする。BNはバックグランドノイズである。フ
レームバッファ41は今のフレームの音声信号電力と比
較するための直前フレームの音声入力信号を保持する役
目を果たすと共に、音声符号器全体の動作を一フレーム
分遅延させ、無音→有音の立上り時にある音声入力信号
が欠落しないようにしている。
【0023】無音→有音の変化点を検出すると誤差最小
化制御部14に対し、特性別基本符号帳20−1〜20
−nの全てによる前記最小誤差のサーチを指示する。そ
の結果に応じて選択部22が駆動される。図8は本発明
の第3実施例を示す図である。この実施例においては、
複数の特性別基本符号帳(20)が、少なくとも高域ス
ペクトル基本符号帳20−Hと、低域スペクトル基本符
号帳20−Lとからなる。一方、特性選択制御部21
は、音声入力信号のレベル変動を監視して、該レベル変
動が大または小であるのに応じて、それぞれ高域スペク
トル基本符号帳20−Hまたは低域スペクトル基本符号
帳20−Lを随時選択する。
【0024】特性選択制御部21の具体例としては、短
時間レベル検出部51、長時間レベル検出部52、両検
出部51,52の各検出出力の差分をとる減算部53お
よび減算部53の出力が基準レベルREF以上になった
とき、選択部22を駆動して高域スペクトル基本符号帳
20−Hを選択せしめるコンパレータ54を用いる。こ
の第3実施例は、音声入力信号レベルの変動が激しいと
きは、比較的高域での白色雑音が大く含まれ、逆にその
レベルの変動が緩やかなときは、比較的低域での白色雑
音が大く含まれることに着目したものである。
【0025】
【発明の効果】以上説明したように本発明によれば、白
色雑音の音源を特性別に区分することによって各基本符
号帳のサイズを縮小し、これによって符号化出力のビッ
ト数を減らし、低ビットレート化、すなわち情報圧縮を
実現することができる。この場合、各基本符号帳は音声
入力信号の特性に応じて選択されることから、原音声を
極めて忠実に再生することが可能となる。
【0026】また、音声入力信号のならず、音声帯域で
のモデム信号等にも適用でき、データ信号の帯域圧縮に
も応用することができる。
【図面の簡単な説明】
【図1】本発明に係る音声符号器の原理構成を表す図で
ある。
【図2】本発明の原理を説明するための模式図である。
【図3】本発明の第1実施例を示す図である。
【図4】プロセッサの処理量の時間的変化を示す図であ
る。
【図5】本発明が適用される一システム例を示す図であ
る。
【図6】本発明の第2実施例を示す図である。
【図7】有音および無音の時間的変化を示す図である。
【図8】本発明の第3実施例を示す図である。
【図9】従来の音声符号器の構成を表す図である。
【符号の説明】
10…基本符号帳 11…適応符号帳 12…線形予測分析部 13…合成フィルタ 14…誤差最小化制御部 20−1〜20−n…特性別基本符号帳 20−H…高域スペクトル基本符号帳 20−L…低域スペクトル基本符号帳 21…特性選択制御部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数種類の白色雑音からなるコードベク
    トル群を格納する基本符号帳(10)と、適応的に変化
    するピッチ予測残差ベクトルを保持する適応符号帳(1
    1)と、所定のフィルタ係数を有するフィルタであって
    各前記符号帳からの出力を入力として合成音声信号を生
    成する合成フィルタ(13)と、符号化すべき音声入力
    信号を入力として前記フィルタ係数を算出する線形予測
    分析部(12)と、前記音声入力信号と前記合成音声入
    力信号との間の誤差が最小となるように各前記符号帳に
    対し帰還をかけると共に当該最小誤差に対応する1の前
    記コードベクトルを表すコードをもって前記音声入力信
    号の符号化出力とする誤差最小化制御部(14)とから
    なる音声符号器において、 前記基本符号帳(10)を、前記コードベクトル群の特
    性が相互に異なる複数の特性別基本符号帳(20−1〜
    20−n)から構成すると共に、 前記最小誤差に対応する1の前記コードベクトルを格納
    する1の前記特性別基本符号帳を選択する特性選択制御
    部(21)を備えることを特徴とする音声符号器。
  2. 【請求項2】 前記特性選択制御部(21)は、予め定
    めた一定周期で前記の選択を行い、各該一定周期の間は
    当該1の前記特性別基本符号帳のみを選択する請求項1
    に記載の音声符号器。
  3. 【請求項3】 前記特性選択制御部(21)は、前記音
    声入力信号の無音部分から有音部分への変化点毎に前記
    の選択を行い、次の該変化点まで当該1の前記特性別基
    本符号帳のみを選択する請求項1に記載の音声符号器。
  4. 【請求項4】 複数の前記特性別基本符号帳(20−1
    〜20−n)が、少なくとも高域スペトル基本符号帳
    (20−H)と、低域スペクトル基本符号帳(20−
    L)とからなり、 前記特性選択制御部(21)は、前記音声入力信号のレ
    ベル変動を監視して、該レベル変動が大または小である
    のに応じて、それぞれ該高域スペクトル基本符号帳(2
    0−H)または該低域スペクトル基本符号帳(20−
    L)を随時選択する請求項1に記載の音声符号器。
JP3317160A 1991-11-30 1991-11-30 音声符号器 Withdrawn JPH05150800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3317160A JPH05150800A (ja) 1991-11-30 1991-11-30 音声符号器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3317160A JPH05150800A (ja) 1991-11-30 1991-11-30 音声符号器

Publications (1)

Publication Number Publication Date
JPH05150800A true JPH05150800A (ja) 1993-06-18

Family

ID=18085125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3317160A Withdrawn JPH05150800A (ja) 1991-11-30 1991-11-30 音声符号器

Country Status (1)

Country Link
JP (1) JPH05150800A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130796B2 (en) 2001-02-27 2006-10-31 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected
JP2008304775A (ja) * 2007-06-08 2008-12-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130796B2 (en) 2001-02-27 2006-10-31 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected
JP2008304775A (ja) * 2007-06-08 2008-12-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Similar Documents

Publication Publication Date Title
US5752223A (en) Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals
US5251261A (en) Device for the digital recording and reproduction of speech signals
JPH02502491A (ja) 符号化/復号化装置
US5826221A (en) Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values
JP2005326868A (ja) 音声復号化方法及び音声復号化装置
JPH09330097A (ja) 音声再生装置
JPH09185397A (ja) 音声情報記録装置
JPH08202397A (ja) 音声復号化装置
JP3329216B2 (ja) 音声符号化装置及び音声復号装置
JPH05150800A (ja) 音声符号器
JP3050978B2 (ja) 音声符号化方法
JP4108396B2 (ja) 多地点制御装置の音声符号化伝送システム
JP2797348B2 (ja) 音声符号化・復号化装置
JP3308783B2 (ja) 音声復号化装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JPH0426565B2 (ja)
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JPH10308708A (ja) 音声符号化装置
JPH0588697A (ja) 欠落音声補間方式
JPH11109996A (ja) 音声符号化装置、音声符号化方法及び音声符号化情報の記録された光記録媒体並びに音声復号装置
JP2008090311A (ja) 音声符号化方法
JPH0481199B2 (ja)
JP3418803B2 (ja) 音声符号復号化装置
JP3240825B2 (ja) 音声補間方法
JP3736801B2 (ja) 音声復号化方法及び音声復号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204