JPH08234796A - 符号化音声の復号化器装置 - Google Patents

符号化音声の復号化器装置

Info

Publication number
JPH08234796A
JPH08234796A JP7036467A JP3646795A JPH08234796A JP H08234796 A JPH08234796 A JP H08234796A JP 7036467 A JP7036467 A JP 7036467A JP 3646795 A JP3646795 A JP 3646795A JP H08234796 A JPH08234796 A JP H08234796A
Authority
JP
Japan
Prior art keywords
data
voice
storage device
encoded
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7036467A
Other languages
English (en)
Inventor
Yoshiyuki Kaneko
好之 金子
Tetsuya Nakagawa
哲也 中川
Hidetoshi Sekine
英敏 関根
Kenji Ogiji
憲治 荻路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7036467A priority Critical patent/JPH08234796A/ja
Publication of JPH08234796A publication Critical patent/JPH08234796A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 言語学習機などパッケージ型の音声データを
扱う機器に高能率符号化音声を適用するにあたり、それ
に好適なデータの格納方法およびその記憶装置ならびに
復号化器装置を提供することにある。 【構成】 適応コードブックを用いる高能率符号化方式
を用いて音声データを符号化し、その符号化データを記
憶装置に格納する場合に、符号化時に用いた適応コード
ブックも同じ記憶装置に格納させる。 【効果】 復号化器装置は圧縮音声データと適応コード
ブックデータを記憶装置から取り出して復号化する。従
って復号化器装置は、不特定の話者による音声データで
あっても良好な音質の音声を再生することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、符号化した音声データ
の記憶装置および復号化器装置に係わり、特に複数の話
者の声に対応させる場合に好適な符号化音声の記憶装置
および復号化器装置に関する。
【0002】
【従来の技術】近年のコンピュータ技術の進展により、
装置の小型化が進み、かつまた処理能力が飛躍的に向上
した。それに伴い、我々のまわりの情報をマルチメディ
ア処理することが可能になって来ている。例えば、従来
のテキスト、グラフィクスが支配的なコンピュータデー
タに音声や映像を援用したデータが容易に作成できる環
境が整備されつつある。
【0003】上記のようなマルチメディア化に伴って、
データの規模が飛躍的に増大しつつある。これは、音声
や映像データが時系列的なデータ構造を有するための必
然的な帰結である。しかしながら、これらのアナログデ
ータについては、それらをディジタル変換した形態でそ
のまま格納するのではなく、冗長な信号を削除したりす
るなどの圧縮処理・符号化処理を施すのが通常である。
これにより必要な記憶容量は数十分の一にまで低減する
ことが可能になるので、装置規模およびコストを低減す
ることができるという効果が認められている。また、圧
縮したデータを伝送するので伝送時の周波数の有効活用
が可能になる。特に音声データについは、移動無線通信
のディジタル化に向けて、上記周波数の有効活用の観点
から、4kbps以下の伝送レートの高能率音声符号化
方式が開発されている。
【0004】
【発明が解決しようとする課題】ところで、データの符
号化・復号化に関する一般的な課題としては、原信号を
いかに歪ませないかが最も重要なものである。あらゆる
可能性のある信号に対してこの歪みを小さくするのは、
かならずしも容易ではないが、特徴のある信号について
その歪みを小さくするように最適化するのは現実的な問
題である。
【0005】例えば、特定話者の声に限って高能率符号
化を適用するときには、その特定話者の声の特徴を十分
考慮に入れた符号化が可能であればより高音質な復号化
音を実現できる。実際、上記のような高能率音声符号化
方式では、話者の特徴を考慮に入れるしくみとして、適
応コードブックが採用されている。
【0006】従来は、上記の高能率符号化方式は移動無
線などリアルタイムデータ用に開発されてきたのであっ
て、上記のような適応性が十分活かされてきたわけでは
なかった。
【0007】パッケージ型の音声データについては話者
が比較的特定できるので適応性を活用することが可能に
なる。
【0008】パッケージ型音声データを扱う機器の側か
らすると、それぞれのパッケージデータで話者が特定さ
れていても、多くの種類のパッケージデータに対応する
には、話者は不特定とみなさざる得ない。一例として
は、言語学習機が挙げられる。この場合、複数の言語に
対応するといった機器の性格上、話者は不特定になる。
【0009】本発明の目的は、高能率符号化されたパッ
ケージ型音声データを扱う機器において、話者が誰であ
ってもそのデータの原音声の音質を最大限に引き出す構
成を提供することにある。
【0010】本発明の目的は、上記のようにパッケージ
型の音声データを扱う機器向けに高能率符号化音声を適
用するにあたり、不特定多数の話者の音声であっても良
好な音質の復号化音声を得るのに好適な構成でデータを
格納する記憶装置を提供し、上記の復号化器装置が多く
のパッケージ系データに対応可能とすることにある。
【0011】
【課題を解決するための手段】上記目的を達成するた
め、本発明では、話者の音声の符号化において話者の特
徴となる部分を音声データと同時に記憶させる構成とし
た。具体的には、まず適応コードブックを用いる高能率
符号化方式を用いて音声データを符号化する。次に、そ
の符号化データを記憶装置に格納する場合に、符号化時
に用いた適応コードブックも同じ記憶装置に格納すると
いう構成をとる。さらに、データ復号化時には、復号化
器装置は上記記憶装置から適応コードブック部分を読み
出して、それをもとにデータを復号化するという構成と
した。
【0012】
【作用】上記適応コードブックを用いる高能率符号化方
式によれば、特定話者に限らずに常に良好な音質の圧縮
音声データを得ることができる。さらにその適応コード
ブックデータは圧縮音声データとともに記憶装置に格納
されており、復号化器は圧縮音声データと適応コードブ
ックデータを上記記憶装置から取り出して復号化する。
従って復号化器は、不特定の話者による音声データであ
っても前記の良好な音質の音声を再生することができ
る。
【0013】
【実施例】以下図面を用いて本発明の一実施例を説明す
る。図1に本発明による符号化音声の記憶装置を用いた
復号化器の装置ブロック図を示す。
【0014】実施例における復号化器装置1は、中央演
算ユニット(CPU)、データ表示部2、データ入力部
3、データ主記憶部4、データ外部記憶装置5からな
る。データ表示部2には対角約5インチの液晶ディスプ
レイを用いる。データ入力部3には、上記液晶ディスプ
レイに接着させた感圧式タッチパネルおよび簡単な押し
ボタン式スイッチを用いる。データ主記憶部4にはRO
MおよびRAMを、データ外部記憶装置5としては、カ
ード型メモリを用いる。
【0015】図2は、4MBのメモリからなるデータ外
部記憶装置5に格納されたデータの内容の一例である。
外部記憶装置5には、少なくとも符号化された音声デー
タ6と適応コードブックデータ7とが格納されている。
符号化された音声データ6は、後述の高能率符号化によ
り作成されたものであり、伝送レートは4kbps程度
である。ここでは、約120分の音声データ6用に3.
6MB、適応コードブックデータ7用に数10kBを充
てた。
【0016】図3は、符号化器のブロック図である。本
符号化器は、符号駆動線形予測(CELP)音声符号化
方式に基づいて構成されたいる。音声の原データとして
は所定の標本化周波数(通常8kHz)でA/D変換さ
れた音声信号101が入力される。音源の周期性を表す
成分として適応コードブック108の出力である長期予
測ベクトル110と、周期性以外の成分(ランダム性、
雑音性)として利得112、113を乗じて加算した加
重和114を駆動音源としている。
【0017】最適な駆動音源を得るためのコードブック
の検索は以下のようにしてなされる。一般に、駆動音源
を合成フィルタに入力して得られる合成音声が、原音声
(入力音声)に一致するような駆動音源が得られればよ
いが、実際にはなんらかの誤差(量子化歪)を伴う。し
たがって、この誤差を最小化するように駆動音源を決定
すればよい。その際、人間の聴覚特性との対応が良くな
るように重み付けした誤差を用いるのが一般的である。
【0018】この聴覚重み付け誤差を評価するために、
駆動音源114は重み付け合成フィルタ105に入力さ
れ、重み付け合成音声116を得る。入力音声101も
聴覚重み付けフィルタ104を通して重み付け入力音声
115を得、重み付け合成音声116との差を取って重
み付け誤差波形117を得る。なお、聴覚重み付けフィ
ルタ104と重み付け合成フィルタ105のフィルタ係
数は、あらかじめ入力音声101をLPC(線形予測)
分析部102に入力して得られたLPCパラメータ10
3によって決められる。
【0019】重み付け誤差波形117は、2乗誤差計算
部118において誤差評価区間にわたって2乗和を計算
され、重み付け2乗誤差119が得られる。前述のよう
に駆動音源は長期予測ベクトルと統計コードベクトルと
の加重和であるから、駆動音源の決定は、各コードブッ
クからどのコードベクトルを選択するかを決めるコード
ベクトル指標の決定に帰着する。すなわち、長期予測ラ
グ106とコードベクトル指標107を順次変えて重み
付け2乗誤差119を算出し、誤差最小化部120にお
いて重み付け誤差が最小となるものを選択すればよい。
このような駆動音源決定法を「合成による分析法」と呼
んでいる。
【0020】このようにして最適な駆動音源が決定した
ら、長期予測ラグ106、コードブック指標107、利
得112、113、およびLPCパラメータ103をパ
ラメータとして多重化部121において多重化したデー
タ122を外部記憶装置5に格納する。また、この時の
駆動音源114を用いて適応コードブック108の状態
が更新される。同一話者の音声を用いて、上記複数回の
処理を繰り返すことにより、コードブックのトレーニン
グが完了する。もし外部記憶装置に格納する音声が複数
人の音声であるならば、それら複数人の音声を使用した
トレーニングが必要であることはいうまでもない。もち
ろん、上記のトレーニングが完了した後の適応コードブ
ックを使用して音声データを符号化してもよい。
【0021】ここで適応コードブックの最終の状態のデ
ータについても外部記憶装置5に記憶させる。これによ
り、以下に述べるような復号化器で、良好な音質の復号
化音声を得ることが可能になる。なぜなら、話者固有の
特徴を考慮にいれた最適な駆動音源が常に使用されるか
らである。
【0022】復号化器における処理は、図4に示された
通りである。まず外部記憶装置から読み出された符号化
データ222が、多重分離部221で各種パラメータに
分離される。長期予測ラグ206に基づき適応コードブ
ック208を検索し、長期予測ベクトル210を出力す
る。また、コードブック指標207に基づき統計コード
ブック209を検索し、音源ベクトル211を出力す
る。長期予測ベクトル210と音源ベクトル211にそ
れぞれの利得212と213を乗じ、加算した信号を駆
動音源214として合成フィルタ230に入力する。合
成フィルタのフィルタ係数は、LPCパラメータ203
によって決まる。ポストフィルタは必須ではないが、合
成音声の主観的品質を改善するために多用され、その出
力が出力音声232となる。ここでは、適応コードブッ
クのデータは、データ外部記憶装置5に格納されている
ものを復号化器装置の主記憶4に呼び出されて使用され
る。
【0023】なお、本発明においては、適応コードブッ
クを用いる符号化復号化方式が前提となっているが、上
記のような構成に限らないことはいうまでもない。例え
ば図5のような符号化器と図6のような復号化器の構成
であってもよい。
【0024】この構成は、上記の例とは以下の点が異な
る。図5に見られるように、音源として適応コードブッ
クと雑音情報コードブックの他にパルス情報コードブッ
クが加えられている。音響分類部からの入力情報すなわ
ち入力音声の音響的特徴に基づいて、雑音源とパルス音
源から適当なコードブックが検索処理の対象として選択
可能としている。本発明では、話者の声の特徴がその符
号化データとともに記憶装置に記録されていることが本
質であって、符号化・復号化の詳細なアルゴリズムの差
異に影響されるものではない。
【0025】次に、本発明による符号化音声の記憶装置
およびこれを用いた復号化器装置を言語学習機に応用し
た例を示す。図7の10〜15は6か国の言語の符号化
音声データとそれぞれの話者A〜Fの適応コードブック
データを格納した外部記憶装置である。復号化器装置
は、上記外部記憶装置10〜15いずれにも対応可能で
あり、それぞれのコードブックデータを呼び出して復号
化をするのでそれらの話者の特徴に適応した音声復号が
できる。
【0026】上記では、複数の話者が含まれる音声デー
タの作成には、それぞれの話者のデータを用いて単一の
コードブックをトレーニングする例について述べた。図
8に、複数の話者のそれぞれに適応コードブックデータ
を備える例を示す。外部記憶装置16の内部には3種類
の適応コードブックG、H、Iが備わり、それぞれが異
なる話者データGd、Hd、Idに対応している。適応
コードブックG、H、Iは、それぞれ話者Gd、Hd、
Idの音声によりトレーニングが済ませてある。
【0027】復号化器装置側でデータを読み込み復号化
を行うときに、それぞれの組合わせを使用するようにす
れば、最適な復号化音声を得ることができる。
【0028】なお本発明は上記実施例によって限定され
るものではない。第一に、復号化器装置の構成は上記に
限ったものではない。例えば、入力装置としては、タッ
チパネルと押しボタン式スイッチの組み合わせに限らな
い。さらには、外部記憶装置としては、カード型メモリ
に限らずCD−ROMのような光学読み出し式メモリデ
ィスクであってもよい。第二に、用途についても言語学
習機に限らず例えば異種言語間の通訳器でもよく、音楽
再生装置でもよい。
【0029】
【発明の効果】以上本発明によれば次のような効果があ
る。高能率符号化方式によって作成した音声データの復
号化時に、その音声データに付随して記憶された話者の
声の特徴に関するコードブックデータも記憶装置から取
り出されて援用されるので特定話者に限らずに常に良好
な音質の音声データを得ることができる。その結果、同
一の復号化器装置を用いて、圧縮符号化音声データの活
用を図ることができる。
【図面の簡単な説明】
【図1】本発明による符号化音声の記憶装置を用いた復
号化器装置のブロック図。
【図2】本発明による符号化音声の外部記憶装置の構成
を説明するための図。
【図3】符号化器の動作ブロック図。
【図4】復号化器の動作ブロック図。
【図5】別の符号化器の動作ブロック図。
【図6】別の復号化器の動作ブロック図。
【図7】本発明による言語学習機を説明するための図。
【図8】別の構成による外部記憶装置を説明するための
図。
【符号の説明】
1…復号化器装置、2…データ表示部、3…データ入力
部、4…データ主記憶部、5…データ外部記憶装置、6
…符号化音声データ、7…適応コードブックデータ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 荻路 憲治 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マルチメディアシステム 事業部内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】情報と符号化音声データと話者の音声の特
    徴コードとが記憶された符号化器音声データの記憶装置
    と、上記記憶装置に記憶されている上記特徴コードに基
    づいて上記符号化音声データを復号化する復号化器装置
    を有することを特徴とする符号化音声の復号化器装置。
  2. 【請求項2】請求項1に記載の符号化音声の記憶装置お
    よびこれを用いた復号化器装置において、前記特徴コー
    ドは前記符号化音声データに含まれる複数の話者の夫々
    の特徴に対応しており、前記記憶装置に複数個記憶され
    ていることを特徴とする符号化音声の復号化器装置。
  3. 【請求項3】請求項1ないし2に記載の符号化音声の復
    号化器装置であって、前記特徴コードが、入力音声信号
    を予め定めた時間長のフレームに分割し、前記音声信号
    のスペクトル包絡を示すスペクトルパラメータを求めて
    出力し、前記フレームを予め定められた時間長のサブフ
    レームに分割し、過去の音源から前記音声信号との誤差
    が最小になるよう長期予測パラメータを求めて出力し、
    前記サブフレームごとに駆動音源として予め用意された
    コードブックの中から最適なコードベクトルを選択する
    CELP音声符号化方法における適応コードブックに記
    載されることを特徴とする符号化音声の復号化器装置。
JP7036467A 1995-02-24 1995-02-24 符号化音声の復号化器装置 Pending JPH08234796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7036467A JPH08234796A (ja) 1995-02-24 1995-02-24 符号化音声の復号化器装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7036467A JPH08234796A (ja) 1995-02-24 1995-02-24 符号化音声の復号化器装置

Publications (1)

Publication Number Publication Date
JPH08234796A true JPH08234796A (ja) 1996-09-13

Family

ID=12470624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7036467A Pending JPH08234796A (ja) 1995-02-24 1995-02-24 符号化音声の復号化器装置

Country Status (1)

Country Link
JP (1) JPH08234796A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7285476B2 (en) 1996-08-27 2007-10-23 Seiko Epson Corporation Exfoliating method, transferring method of thin film device, and thin film device, thin film integrated circuit device, and liquid crystal display device produced by the same
USRE40601E1 (en) 1996-11-12 2008-12-09 Seiko Epson Corporation Manufacturing method of active matrix substrate, active matrix substrate and liquid crystal display device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7285476B2 (en) 1996-08-27 2007-10-23 Seiko Epson Corporation Exfoliating method, transferring method of thin film device, and thin film device, thin film integrated circuit device, and liquid crystal display device produced by the same
US7468308B2 (en) 1996-08-27 2008-12-23 Seiko Epson Corporation Exfoliating method, transferring method of thin film device, and thin film device, thin film integrated circuit device, and liquid crystal display device produced by the same
USRE40601E1 (en) 1996-11-12 2008-12-09 Seiko Epson Corporation Manufacturing method of active matrix substrate, active matrix substrate and liquid crystal display device

Similar Documents

Publication Publication Date Title
EP0542628B1 (en) Speech synthesis system
EP1353323B1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JP3357795B2 (ja) 音声符号化方法および装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
US5909662A (en) Speech processing coder, decoder and command recognizer
CA2440820A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP2586043B2 (ja) マルチパルス符号化装置
US6539349B1 (en) Constraining pulse positions in CELP vocoding
US4985923A (en) High efficiency voice coding system
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2001053869A (ja) 音声蓄積装置及び音声符号化装置
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
US8607127B2 (en) Transmission error dissimulation in a digital signal with complexity distribution
JPH05265496A (ja) 複数のコードブックを有する音声符号化方法
JPH08234796A (ja) 符号化音声の復号化器装置
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2796408B2 (ja) 音声情報圧縮装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
US6385574B1 (en) Reusing invalid pulse positions in CELP vocoding
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JPH05232996A (ja) 音声符号化装置
KR100304137B1 (ko) 음성압축/신장방법및시스템
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法