JP3092344B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3092344B2
JP3092344B2 JP04229079A JP22907992A JP3092344B2 JP 3092344 B2 JP3092344 B2 JP 3092344B2 JP 04229079 A JP04229079 A JP 04229079A JP 22907992 A JP22907992 A JP 22907992A JP 3092344 B2 JP3092344 B2 JP 3092344B2
Authority
JP
Japan
Prior art keywords
sound source
delay
gain
signal
delay value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04229079A
Other languages
English (en)
Other versions
JPH0675597A (ja
Inventor
慶一 舟木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP04229079A priority Critical patent/JP3092344B2/ja
Publication of JPH0675597A publication Critical patent/JPH0675597A/ja
Application granted granted Critical
Publication of JP3092344B2 publication Critical patent/JP3092344B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声符号化装置に関し、
特に音声信号を低ビットレートで高品質に符号化する音
声符号化装置に関する。
【0002】
【従来の技術】近年、無線回線を用いた自動車電話やコ
ードレス電話等のディジタル化が進展している。無線回
線では使用可能な周波数帯域幅が狭いため、音声信号を
低ビットレートで符号化する方式の開発は重要である。
【0003】従来、音声信号を4〜8Kb/S程度の低
ビットレートで符号化する方法としては、例えば、米国
で発行された1985年アイキャスプ・プロシーデング
ス(ICASP prcceedings 85)第9
37頁〜第940頁所載のシュレーダとアタルの論文
「コードエキサイテッド・リニア・プレデイクション:
ハイ・クォリティ・アト・ロウ・ビット・レーツ」
(M.Schroederand B.S.Ata
l,″Code−excited linear pr
ediction:High quality spe
ech at lowbit rates″)(文献
1)等に示されているCELP(Code Excit
ed LPC Codeing)が知られている。上記
CELPにおいて、送信側では次の手順で符号可処理が
行なわれる。まず、フレーム毎(例えば20mS)に、
音声信号から音声の周波数特性を表すスペクトルパラメ
ータを抽出す次に、フレームをさらに小区間のサブフレ
ーム(例えば5mS)に分割する。上記サブフレーム毎
に過去の音源信号から長区間相関(ピッチ相関)を表す
ピッチパラメータを抽出し、上記ピッチパラメータによ
りそのサブフレームの音声信号を長期予測する。次に、
予め用意された種類の雑音信号(コードベクトル)から
抽出した上記コードベクトルによる合成信号と、上記長
期予測により求められた残差信号との誤差電力が最小に
なるような最小コードベクトルとゲインとを決定上記最
小コードベクトルの種類を表すインデクスと上記ゲイン
ならびにスペクトルパラメータとピッチパラメータとを
伝送するというものであった。
【0004】また、上記長期予測の方法としては、例え
ば、スピーチ・コミュニケーション(Speech C
ommunicasion)1988年第7巻第305
頁〜第316頁所載のクレインの論文「アン・エフィシ
ェント・ストキャスティカリ・エキサイテッド・リニア
・プレディクティブ・コーデイング・アルゴリズム・フ
ォー・ハイ・クォリティ・ロゥ・ビットレート・トラン
スミッション・オブ・スピーチ」(W.Kleij
n,″An efficient stochasti
cally exited linear predi
cteive coding algorithm f
or high quality lowbit ra
te transmisson of speech″
(文献2)等に示されている適応コードブック探索がよ
く知られている。これは、過去の音源を考えられるピッ
チ周期の範囲、例えば2.5〜18.25mSでサンプ
ル毎に遅延させ、重み付け2乗誤差(評価尺度)を最小
にする遅延値と遅延させた上記過去の音源に対するゲイ
ンとを算出するという方法である。上記遅延が上記サブ
フレーム長より短かく、例えば2.5mSの場合は、仮
想音源として遅延させた上記過去の音源をそのまま繰返
して用いているというものであった。
【0005】しかし、実際の音声信号の振幅はピッチ毎
に変化している。したがって、遅延がサブフレーム長よ
り短かい場合、過去の音源のゲインを固定しサブフレー
ム長分繰返す従来の方法では、ピッチ周期に対応する遅
延においても上記評価尺度は小さくならず、遅延の誤推
定が発生し音質劣化の原因となっているというものであ
った。また、実際の音声信号のピッチ周期も振幅と同様
にピッチ毎に変化しているので、音声のピッチ周期が変
動しているフレームでは、同一ピッチの繰返しでは上記
評価尺度は小さくならない。女性音声のようなピッチ周
期の短かい音声では、上記遅延として倍ピッチや3倍ピ
ッチが最適遅延として探索される場合が多発し、遅延す
なわちピッチ周期が不連続に変化することにより音質劣
化の原因となっていた。
【0006】
【発明が解決しようとする課題】上述した従来の音声符
号化装置は、実際の音声信号におけるような振幅とピッ
チ周期とが変動しているフレームに対しては、過去の音
源と予測差信号の振幅およびピッチ周期が相互に異なる
ことが多いので仮想音源として同一ピッチの音源の繰返
して用いる方法では、上記評価尺度が小さくならず、ピ
ッチ周期に対応する遅延においても、特に短ピッチ周期
の女性音で顕著に、評価尺度が小さくならずに倍ピッチ
や3倍ピッチが最適遅延として推定される場合が多発
し、遅延すなわちピッチ周期が不連続に変化することに
より音質が劣化するという欠点があった。
【0007】本発明の目的は、上記欠点を解消し適応コ
ードブック探索によりなめらかなピッチ変化を実現する
ことにより低ビットレートでの音質が良好な音声符号化
装置を提供することにある。
【0008】
【課題を解決するための手段】本発明の音声符号化装置
は、音声信号を分析しスペクトルパラメータを抽出する
スペクトルパラメータ抽出手段と、前記音声信号を予め
定めたサブフレーム長に分割したサブフレーム信号を生
成するサブフレーム分割手段と、前記サブフレーム長の
音源ベクトルである音源信号を格納した音源コードブッ
ク格納手段と、前記音源コードブックから最適音源を決
定する最適音源決定手段とを備え、過去の音源を予め定
めたピッチ周期の探索範囲で前記サブフレーム毎に遅延
させ評価尺度である重み付け2乗誤差を最小にする遅延
値と遅延させた前記過去の音源に対するゲインとを算出
する適応コードブック探索を行なう音声符号化装置にお
いて、前記過去の音源の前記サブフレーム長を越える長
さの前記遅延値に対し第一の評価尺度と第一のゲインと
を算出し前記探索範囲内での最適な第一の遅延値を求め
る第一の適応コードブック探索を行なう第一の適応コー
ドブック探索手段と、前記第一の適応コードブック探索
に並行して前記過去の音源の前記サブフレーム長未満の
長さの前記遅延値に対し繰り返し毎の遅延値を変えなが
らこれら遅延値の各々に対する第二の評価尺度と第二の
ゲインとを算出し、この第二の評価尺度と第二のゲイン
との算出を前記繰り返し毎の遅延値の和が前記サブフレ
ーム長に達するまで繰り返し、このサブフレーム長の探
索範囲内での最適な第二の遅延値を求める第二の適応コ
ードブック探索を行なう第二の適応コードブック探索手
段と、前記第一および第二遅延値から前記評価尺度を
最小とする最適の前記遅延値を決定する最適遅延決定手
段とを備えて構成されている。
【0009】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0010】図1は本発明の音声符号化装置の一実施例
を示すブロック図である。
【0011】本実施例の音声符号化装置は、図1に示す
ように、入力の音声信号を一時記格納るバッフア回路1
と、バッファ回路1に格納された音声信号を複数のサブ
フレームに分割するサブフレーム分割回路2と、上記音
声信号の聴感重み付けを行なう重み付け回路3と、音声
信号のスペクトルパラメータである線形予測分析(LP
C)係数を抽出するLPC分析回路4と、LPC係数を
量子化する量子化回路5と、量子化LPC係数を復号化
する逆量子化回路15と、フレーム単位の補間をする補
間回路16と、重み付けされた合成フィルタの零入力応
答信号である影響信号を算出し重み付け信号から減算す
る影響信号減算回路6と、サブフレーム長以上の遅延に
対し過去の音源を遅延させ評価尺度とゲインとを算出し
探索範囲内における最適な遅延を求める適応コードブッ
ク探索回路7と、サブフレーム長未満の遅延に対し過去
の音源を遅延させサブフレーム長分の評価尺度と最適ゲ
インとを算出する適応コードブック探索回路8と、適応
コードブック探索回路7の探索結果と適応コードブック
探索回路8の探索結果とから求めた評価尺度が最小とな
る遅延をを最適遅延として決定し上記最適遅延に対する
音源信号を生成する最適遅延決定回路9と、音源信号を
表すサブフレーム長の音源ベクトルを格納したコードブ
ックである音源コードブックの探索を行なう音源コード
ブック10と、ゲインコードを探索するゲインコードブ
ック11と、上記適応コードブックによる音源と音源コ
ードブック10による音源とを加算し音源信号を生成す
る音源生成回路12と、符号系列を組合せて出力するマ
ルチプレクサ13と、音源生成回路12の出力を重み付
けし影響信号減算回路6に出力する重み付け合成回路1
4とを備えて構成されている。
【0012】音源コードブック10は、従来例で説明し
た文献1の雑音コードブックやベクトル量子化アルゴリ
ズムにより学習された学習コードブック等を用いて実現
できる。
【0013】次に、本実施例の動作について説明する。
【0014】まず、入力の音声信号Sはバッファ回路1
に格納される。バッファ回路1からの読出音声信号SB
は、LPC分析回路4によりLPC分析され、スペクト
ルパラメータであるLPC係数Lが算出される。算出さ
れたLPC係数Lは量子化回路5で量子化され量子化L
PC係数LQとしてマルチプレクサ13に送られるとと
もに、逆量子化回路15で再度復号化され、補間回路1
6でフレーム単位の補間後サブフレーム単位の処理に用
いられる。
【0015】また、読出音声信号SBは、サブフレーム
分割回路2により分割され、サブフレーム信号SFが生
成される。各サブフレーム信号SF毎に次の処理が行な
われる。まず、重み付け回路3により聴感重み付けがな
され重み付け信号SWとして出力される。次に、影響信
号減算回路6で影響信号Eが算出され、重み付け信号S
Wから減算され影響減算信号SEとして出力される。影
響減算信号SEは適応コードブック探索回路7で、サブ
フレーム長以上の遅延に対し過去の音源を遅延させ評価
尺度とゲインとを算出し、探索範囲内における最適な遅
延である遅延D1を求める。また、並行して、適応コー
ドブック探索回路8で、サブフレーム長未満の遅延に対
し繰返し毎の遅延値を変えながらゲインと評価尺度とを
計算してサブフレーム長分の評価尺度とゲインを算出
し、この探索範囲内における最適な遅延である遅延D2
を求める。次に、最適遅延決定回路9は、遅延D1と遅
延D2との内から上記評価尺度を最小とする最適遅延を
決定しそれに対応する音源信号である適応コード音源S
Aを生成する。ここで、遅延がサブフレーム長未満であ
る場合には、音源SAを単なる繰返しにより生成する。
【0016】次に、適応コード音源SAを音源コードブ
ック10に入力し音源コードブック探索を行ない、音源
コードブック音源SCSを出力する。ゲインコードブッ
ク11は、適応コード音源SAと音源コードブック音源
SCSとに対するゲイン項Gを算出する。次に、音源生
成回路12は、適応コード音源SAと音源コード音源S
CSとをゲイン項Gを乗算して加算することにより音源
信号を生成し、過去の音源SPとして蓄積する。次に、
マルチプレクサ13は、量子化LPC係数LQと、最適
遅延決定回路9からの適応コード音源SAと、音源コー
ドブック10からの音源コード音源SCSとの各出力符
号系列を組合せて出力する。以上の処理は各サブフレー
ム毎に実行する。
【0017】ここで、適応コードブック探索回路8にお
けるサブフレーム長未満の遅延に対する最適な遅延D2
を求める探索方法の詳細について説明する。
【0018】最初に第1回目の繰返し区間でサブフレー
ム長未満の遅延であるL(例えば20〜39)サンプル
分遅延された音源を用いてゲインと評価尺度とを計算す
る。次に、第2回目の繰返し区間で、上記第1回目の繰
返し区間の適応コードブックの影響信号Eを重み付け信
号SWから減算し適応減算信号SAEを出力する。この
適応減算信号SAEに対しゲインと評価尺度とを算出す
る。この場合、過去の音源の遅延をLサンプル分に固定
するのではなく、例えば、L±3サンプル分変化させ、
それぞれの遅延毎に評価尺度を算出する。この処理をサ
ブフレーム長の分に達するまで繰返す。ただし、最後の
繰返し区間の長さは、上記サブフレーム長を遅延時間で
除した剰余となる。各繰返しの上記評価尺度の和をその
遅延に対する評価尺度とする。以上の処理を上記Lサン
プル分の各遅延に対し行ない、最小の評価尺度を与える
最適な遅延を求める。伝送容量を増加させないために、
文献2に記載されている従来技術と同様に遅延音源をサ
ブフレーム長分繰返した仮想音源を用いてゲインを算出
し、上記遅延に対するゲインとする。上記遅延の単位は
整数あるいは小数のいずれでもよいが、小数の方が音質
がより向上する。小数の場合には、過去の音源をポリフ
エーズフィルタリングにより小数化する。この方法は、
例えば、米国で発行された1990年アイキャスプ・プ
ロシーデングス(ICASP prcceedings
90)第661頁〜第664頁所載のクルーンの論文
「ピッチプレディクターズ・ウイズ・ハイテポラル・レ
ゾルーション」(P.Kroon,″Pitch pr
edictors withhigh tempora
l resolution″)(文献3)等に記載され
ている。また、上記繰返しが多い場合には探索のための
組合せが非常に多くなるが、繰返し区間毎に1つの遅延
のみを算出することにより低減できる。
【0019】以上、本発明の実施例を説明したが、本発
明は上記実施例に限られることなく種々の変形が可能で
ある。
【0020】例えば、音声のスペクトルパラメータとし
て線形予測分析(LPC)を用いる代りに反射係数を算
出するFLAT分析を用いることも本発明の主旨を逸脱
しない限り適用できることは勿論である。
【0021】
【発明の効果】以上説明したように、本発明の音声符号
化装置は、短ピッチ周期の女性音でもなめらかな遅延の
変化によりノイズの少ない良好な音質を得ることができ
るという効果がある。
【図面の簡単な説明】
【図1】本発明の音声符号化装置の一実施例を示すブロ
ック図である。
【符号の説明】
1 バッファ回路 2 サブフレーム分割回路 3 重み付け回路 4 LPC分析回路 5 量子化回路 6 影響信号減算回路 7,8 適応コードブック探索回路 9 最適遅延決定回路 10 音源コードブック 11 ゲインコードブック 12 音源生成回路 13 マルチプレクサ 14 重み付け合成回路 15 逆量子化回路 16 補間回路
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声信号を分析しスペクトルパラメータ
    を抽出するスペクトルパラメータ抽出手段と、前記音声
    信号を予め定めたサブフレーム長に分割したサブフレー
    ム信号を生成するサブフレーム分割手段と、前記サブフ
    レーム長の音源ベクトルである音源信号を格納した音源
    コードブック格納手段と、前記音源コードブックから最
    適音源を決定する最適音源決定手段とを備え、過去の音
    源を予め定めたピッチ周期の探索範囲で前記サブフレー
    ム毎に遅延させ評価尺度である重み付け2乗誤差を最小
    にする遅延値と遅延させた前記過去の音源に対するゲイ
    ンとを算出する適応コードブック探索を行なう音声符号
    化装置において、前記過去の音源の 前記サブフレーム長を越える長さの前
    記遅延値に対し第一の評価尺度と第一のゲインとを算出
    し前記探索範囲内での最適な第一の遅延値を求める第一
    適応コードブック探索を行なう第一の適応コードブッ
    ク探索手段と、前記第一の適応コードブック探索に並行して前記過去の
    音源の 前記サブフレーム長未満の長さの前記遅延値に対
    繰り返し毎の遅延値を変えながらこれら遅延値の各々
    に対する第二の評価尺度と第二のゲインとを算出し、
    の第二の評価尺度と第二のゲインとの算出を前記繰り返
    し毎の遅延値の和が前記サブフレーム長に達するまで繰
    り返し、このサブフレーム長の探索範囲内での最適な第
    二の遅延値を求める第二の適応コードブック探索を行な
    う第二の適応コードブック探索手段と、 前記第一および第二遅延値から前記評価尺度を最小と
    する最適の前記遅延値を決定する最適遅延決定手段とを
    備えることを特徴とする音声符号化装置。
JP04229079A 1992-08-28 1992-08-28 音声符号化装置 Expired - Fee Related JP3092344B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04229079A JP3092344B2 (ja) 1992-08-28 1992-08-28 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04229079A JP3092344B2 (ja) 1992-08-28 1992-08-28 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0675597A JPH0675597A (ja) 1994-03-18
JP3092344B2 true JP3092344B2 (ja) 2000-09-25

Family

ID=16886422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04229079A Expired - Fee Related JP3092344B2 (ja) 1992-08-28 1992-08-28 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3092344B2 (ja)

Also Published As

Publication number Publication date
JPH0675597A (ja) 1994-03-18

Similar Documents

Publication Publication Date Title
US5485581A (en) Speech coding method and system
EP1353323B1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
JP3254687B2 (ja) 音声符号化方式
JP3196595B2 (ja) 音声符号化装置
JP2626223B2 (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH08272395A (ja) 音声符号化装置
US5873060A (en) Signal coder for wide-band signals
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3308764B2 (ja) 音声符号化装置
JP3353852B2 (ja) 音声の符号化方法
JP3092344B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JPH08292797A (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH113098A (ja) 音声符号化方法および装置
JP3194930B2 (ja) 音声符号化装置
JP3265645B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JPH07168596A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3311518B2 (ja) 音声の長期予測装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000627

LAPS Cancellation because of no payment of annual fees