JPH07234698A - 音声信号符号化復号化方法 - Google Patents

音声信号符号化復号化方法

Info

Publication number
JPH07234698A
JPH07234698A JP6027767A JP2776794A JPH07234698A JP H07234698 A JPH07234698 A JP H07234698A JP 6027767 A JP6027767 A JP 6027767A JP 2776794 A JP2776794 A JP 2776794A JP H07234698 A JPH07234698 A JP H07234698A
Authority
JP
Japan
Prior art keywords
contents
codebook
decoding
audio signal
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6027767A
Other languages
English (en)
Inventor
Takehiro Moriya
健弘 守谷
Naoki Iwagami
直樹 岩上
Satoshi Miki
聡 三樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6027767A priority Critical patent/JPH07234698A/ja
Publication of JPH07234698A publication Critical patent/JPH07234698A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 音声信号符号化復号化における符号化に先だ
って符号化の対象とされる入力信号系列を使用して符号
化の準備をする音声信号符号化復号化方法を提供する。 【構成】 入力される楽音を含む音声信号を符号化復号
化する方法において、入力音声信号系列を分析して音声
信号符号化復号化の基本構成を指定する基本パラメータ
を抽出および/またはベクトル量子化に使用される符号
帳の学習を行なうことにより基本パラメータおよび/ま
たは符号帳の内容を最適化し、最適化された基本パラメ
ータおよび/または最適化された符号帳の内容を伝送
し、伝送された基本パラメータおよび/または符号帳の
内容を使用して復号化する音声信号符号化復号化方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声信号符号化復号
化方法に関し、特に、楽音を含む音声信号をでき得る限
り少ない情報量によりディジタル符号化する高能率の音
声信号符号化復号化方法に関する。
【0002】
【従来の技術】従来例を図4を参照して説明する。図4
に示される音声信号符号化復号化装置は実時間の符号化
処理を必要とする通信に利用することを目的として構成
されている。この場合、符号器2は固定の符号帳1の内
容を使用して符号化を実行するが、入力信号を標本化す
る速度以上の速度により符号化処理をすることを前提と
するものである。そして、入力信号の系列の長さは基本
的には無限長であると考える必要がある。符号化処理さ
れた情報は伝送路を介して伝送され、符号器3において
固定の符号帳4の内容を使用して復号化されて出力され
る。
【0003】一方、音声信号符号化復号化を放送用或は
蓄積用に適用する場合は、実時間の符号化処理をする必
要がないところから、復号器3さえ実時間処理すること
ができるものであればよい。ところが、復号器3は通常
は通信用の復号器が転用されるので、これに対応して符
号器2の方も実時間処理することができるものが使用さ
れることとなる。
【0004】
【発明が解決しようとする課題】この発明は、上述の様
な音声信号符号化復号化装置を使用しても、音源の長さ
が有限であって実時間の符号化の必要のない、特に信号
の放送、配送或は蓄積用の場合は、入力音声信号を少な
い情報量により符号化しても信号の品質を劣化させるこ
とのない音声信号符号化復号化方法を提供するものであ
る。
【0005】
【課題を解決するための手段】入力される楽音を含む音
声信号を符号化復号化する方法において、入力音声信号
系列を分析して音声信号符号化復号化の基本構成を指定
する基本パラメータを抽出および/またはベクトル量子
化に使用される符号帳の学習を行なうことにより基本パ
ラメータおよび/または符号帳の内容を最適化し、最適
化された基本パラメータおよび/または最適化された符
号帳の内容を伝送し、伝送された基本パラメータおよび
/または符号帳の内容を使用して復号化する音声信号符
号化復号化方法を構成した。
【0006】そして、入力される楽音を含む音声信号を
符号化復号化する方法において、符号器は入力音声信号
を音声信号符号化復号化の基本構成を指定する基本パラ
メータ候補の複数個によりそれぞれ符号化しておき、各
基本パラメータ候補による符号化結果の評価を行い、採
用されるべき基本パラメータを選択し、選択された基本
パラメータを復号化の実行されるところに伝送し、伝送
された基本パラメータを使用して伝送された符号化入力
音声信号系列を復号化する音声信号符号化復号化方法を
構成した。
【0007】また、入力される楽音を含む音声信号を符
号化復号化する方法において、符号器は入力音声信号系
列を分析して音声信号符号化復号化の基本構成を指定す
る基本パラメータを抽出すると共にベクトル量子化に使
用される符号帳の内容を学習し、学習内容を使用して符
号帳の内容を更新すると共に符号帳の更新された内容お
よび抽出された基本パラメータを非常に低い頻度或は最
初の一回だけ補助情報として復号化の実行されるところ
に伝送し、入力音声信号系列を抽出されたパラメータと
符号帳の更新された内容とを使用してフレーム単位毎に
符号化して伝送し、復号器は伝送された符号帳の内容を
使用して復号器の符号帳の内容を更新すると共にこの更
新された復号器の符号帳の内容および伝送された基本パ
ラメータを使用して伝送された符号化入力音声信号系列
を復号化する音声信号符号化復号化方法を構成した。
【0008】更に、入力される楽音を含む音声信号を符
号化復号化する方法において、符号器は入力音声信号を
音声信号符号化復号化の基本構成を指定する基本パラメ
ータ候補の複数個によりそれぞれ符号化しておき、各基
本パラメータ候補による符号化結果の評価を行い、採用
されるべき基本パラメータを選択し、入力音声信号系列
を分析してベクトル量子化に使用される符号帳の内容を
学習し、学習内容を使用して符号帳の内容を更新すると
共に符号帳の更新された内容および選択された基本パラ
メータを非常に低い頻度或は最初の一回だけ補助情報と
して復号化の実行されるところに伝送し、入力音声信号
系列を選択された基本パラメータと符号帳の更新された
内容とを使用してフレーム単位毎に符号化して伝送し、
復号器は伝送された符号帳の内容を使用して復号器の符
号帳の内容を更新すると共にこの更新された復号器の符
号帳の内容および伝送された基本パラメータを使用して
伝送された符号化入力音声信号系列を復号化する音声信
号符号化復号化方法をも構成した。
【0009】
【実施例】この発明を要約するに、符号器が実行する処
理は3段階に分けられている。この3段階の処理におい
て、基本パラメータおよび符号帳の内容を最適化し、こ
れら最適化された内容を先ず伝送し、伝送された最適化
された内容を使用して通常の符号化および復号化を実行
する。従来の音声信号符号化復号化は固定のパラメータ
および固定の符号帳の内容を使用して符号化を実行する
のであるが、この発明は従来の音声信号符号化復号化に
おける符号化に先だって符号化の対象とされる入力信号
系列を使用して符号化の準備をするところをその特徴と
する。
【0010】この発明の実施例を図1を参照して説明す
る。符号器2において実行される処理は3段階に分かれ
ている。なお、第3段階の処理である符号化処理は従来
実行されている通常の音声信号符号化処理であり、使用
される復号器も従来使用される復号器と同様のものが使
用される。符号器2の実行する第1段階の処理は、入力
音声信号系列を分析してこれから基本パラメータを抽出
すること、および符号帳1の学習を行なうことである。
高能率の音声信号符号化においては、符号帳1の中から
最も望ましい符号ベクトルを選択してそのインデックス
を伝送するベクトル量子化方法がよく使用される。この
符号帳1の内容は、通常、或る学習系列を使用して学習
により求めておく。学習の方法としては、平均量子化歪
を最小化する様に再生ベクトルの更新と境界の更新とを
交互に繰り返すLloyd の方法が良く知られている。この
発明は、学習の方法自体は通常の学習方法と同様の学習
方法を使用するが、学習系列は符号化の対象である入力
信号系列をそのまま学習信号系列として使用する。ベク
トル量子化を行なう対象としては、例えば、入力信号系
列のスペクトル形状のパラメータベクトル、予測残差系
列、正規化された波形情報が考えられる。音量の平均或
は変動範囲もベクトル量子化を行なう対象とすることが
できる。
【0011】符号器2の実行する第2段階は、学習内容
を使用して符号帳1を更新し、第1段階において求めら
れた基本パラメータおよび符号帳1の更新された内容を
復号化の実行されるところに伝送する。この基本パラメ
ータ情報および符号帳1の更新された内容は通常の伝送
符号系列の伝送に先だって伝送しておく必要がある。符
号化の第3段階は、通常の音声信号符号化を実行する。
図1の実施例においては、入力信号系列全体を合計2回
取り込んで分析することになる。即ち、基本パラメータ
抽出および符号帳1の更新の際に1回、入力音声信号の
符号化の際に1回の合計2回の入力信号取り込みを行な
う。この入力信号の取り込みはバッファ装置に記憶して
おいた同一入力信号を繰り返して取り込む。符号帳の学
習は必ずしも入力信号系列全体を使用する必要はない。
【0012】復号器3においては第2段階の処理により
伝送された基本パラメータおよび符号帳1の内容を使用
して符号帳4の内容を更新すると共に第3の段階の処理
によりフレーム毎に伝送された符号を復号する。上述し
た処理を時間軸により順を追って表現すると図2に示さ
れる様になる。 入力信号系列の取り込みを行なう。
【0013】 ここで、基本パラメータの抽出、符号
帳の学習を行なう。 基本パラメータおよび符号帳の伝送を行なう。 符号化を実行し、その結果の符号化データを伝送す
る。 復号化を実行し、その結果の復号化データを出力す
る。 図3を参照してこの発明の他の実施例を説明する。この
実施例は、符号化の基本構成を指定する基本パラメータ
をも音声信号符号化に先だって決めるものである。符号
化の対象とする基本パラメータとしては、例えば情報の
配分方法或は予測次数、ベクトルの次元数、フレームの
長さが考えられる。
【0014】これらの基本パラメータの内の何れかを選
択するために、符号器2の処理の第1段階において、複
数の基本パラメータ候補1ないしnによりそれぞれ符号
化しておく。第2段階においては、各候補による符号化
結果の評価を行い、採用されるべき基本パラメータを選
択する。具体的には、例えば量子化の平均歪が最も小さ
くなる基本パラメータの値を選択する。この段階におい
て選択された基本パラメータを伝送する。
【0015】そして、第3段階において、この選択され
た基本パラメータを使用して符号化を行なう。入力信号
の取り込みの回数は、先の実施例においては基本パラメ
ータ抽出および符号帳1の更新の際および入力音声信号
の符号化の際の2回であったが、基本パラメータの選択
を行なう場合は、基本パラメータ候補により符号化する
際に入力信号の取り込みをする分だけ更に多数回の信号
取り込みをする必要がある。
【0016】復号器においては第2段階の処理により伝
送された基本パラメータを使用して第3の段階の処理に
よりフレーム毎に伝送された符号を復号する。
【0017】
【発明の効果】この発明は、通常の音声信号符号化に先
だって入力音声信号の分析を行ない、この入力音声信号
に最適な基本パラメータおよび/または符号帳を準備す
るところから、量子化歪を軽減すると共に、合成音声品
質を改善することができる。特に楽音信号に対しては、
入力によって音量の基本パラメータおよびスペクトル形
状の符号帳内容が大きく異なるので、この様な場合にこ
の発明の効果は大きい。通常の伝送符号系列の他に基本
パラメータおよび/または符号帳の内容を伝送する必要
があるが、その量は伝送符号系列と比較して無視して差
し支えない程少なくすることができる。
【図面の簡単な説明】
【図1】この発明の実施例を説明する図。
【図2】図1の実施例の処理を時間軸により表現した
図。
【図3】この発明の他の実施例を説明する図。
【図4】符号化復号化を説明する図。
【符号の説明】
1 符号帳 2 符号器 3 復号器 4 符号帳
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04B 14/04 Z 9372−5K

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力される楽音を含む音声信号を符号化
    復号化する方法において、 入力音声信号系列を分析して音声信号符号化復号化の基
    本構成を指定する基本パラメータを抽出および/または
    ベクトル量子化に使用される符号帳の学習を行なうこと
    により基本パラメータおよび/または符号帳の内容を最
    適化し、最適化された基本パラメータおよび/または最
    適化された符号帳の内容を伝送し、伝送された基本パラ
    メータおよび/または符号帳の内容を使用して復号化す
    ることを特徴とする音声信号符号化復号化方法。
  2. 【請求項2】 入力される楽音を含む音声信号を符号化
    復号化する方法において、 符号器は入力音声信号を音声信号符号化復号化の基本構
    成を指定する基本パラメータ候補の複数個によりそれぞ
    れ符号化しておき、各基本パラメータ候補による符号化
    結果の評価を行い、採用されるべき基本パラメータを選
    択し、選択された基本パラメータを復号化の実行される
    ところに伝送し、伝送された基本パラメータを使用して
    伝送された符号化入力音声信号系列を復号化する、こと
    を特徴とする音声信号符号化復号化方法。
  3. 【請求項3】 入力される楽音を含む音声信号を符号化
    復号化する方法において、 符号器は入力音声信号系列を分析して音声信号符号化復
    号化の基本構成を指定する基本パラメータを抽出すると
    共にベクトル量子化に使用される符号帳の内容を学習
    し、学習内容を使用して符号帳の内容を更新すると共に
    符号帳の更新された内容および抽出された基本パラメー
    タを非常に低い頻度或は最初の一回だけ補助情報として
    復号化の実行されるところに伝送し、入力音声信号系列
    を抽出されたパラメータと符号帳の更新された内容とを
    使用してフレーム単位毎に符号化して伝送し、復号器は
    伝送された符号帳の内容を使用して復号器の符号帳の内
    容を更新すると共にこの更新された復号器の符号帳の内
    容および伝送された基本パラメータを使用して伝送され
    た符号化入力音声信号系列を復号化する、ことを特徴と
    する音声信号符号化復号化方法。
  4. 【請求項4】 入力される楽音を含む音声信号を符号化
    復号化する方法において、 符号器は入力音声信号を音声信号符号化復号化の基本構
    成を指定する基本パラメータ候補の複数個によりそれぞ
    れ符号化しておき、各基本パラメータ候補による符号化
    結果の評価を行い、採用されるべき基本パラメータを選
    択し、入力音声信号系列を分析してベクトル量子化に使
    用される符号帳の内容を学習し、学習内容を使用して符
    号帳の内容を更新すると共に符号帳の更新された内容お
    よび選択された基本パラメータを非常に低い頻度或は最
    初の一回だけ補助情報として復号化の実行されるところ
    に伝送し、入力音声信号系列を選択された基本パラメー
    タと符号帳の更新された内容とを使用してフレーム単位
    毎に符号化して伝送し、復号器は伝送された符号帳の内
    容を使用して復号器の符号帳の内容を更新すると共にこ
    の更新された復号器の符号帳の内容および伝送された基
    本パラメータを使用して伝送された符号化入力音声信号
    系列を復号化する、ことを特徴とする音声信号符号化復
    号化方法。
JP6027767A 1994-02-25 1994-02-25 音声信号符号化復号化方法 Pending JPH07234698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6027767A JPH07234698A (ja) 1994-02-25 1994-02-25 音声信号符号化復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6027767A JPH07234698A (ja) 1994-02-25 1994-02-25 音声信号符号化復号化方法

Publications (1)

Publication Number Publication Date
JPH07234698A true JPH07234698A (ja) 1995-09-05

Family

ID=12230146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6027767A Pending JPH07234698A (ja) 1994-02-25 1994-02-25 音声信号符号化復号化方法

Country Status (1)

Country Link
JP (1) JPH07234698A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438801B1 (ko) * 1996-10-30 2004-07-16 삼성전자주식회사 랜덤에러에견고한부호화및복호화장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438801B1 (ko) * 1996-10-30 2004-07-16 삼성전자주식회사 랜덤에러에견고한부호화및복호화장치

Similar Documents

Publication Publication Date Title
EP0542628B1 (en) Speech synthesis system
US20070106513A1 (en) Method for facilitating text to speech synthesis using a differential vocoder
US6119086A (en) Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens
CN101926181B (zh) 用于处理音频信号的方法和装置
CN101484937B (zh) 使用缓冲器调节对已预测编码的数据进行解码
CN102124655A (zh) 用以对符号编码的方法、用以对符号解码的方法、用以将符号从发射机发送至接收机的方法、编码器、解码器、及用以将符号从发射机发送至接收机的系统
JP2000187496A (ja) デジタル無線チャネル上の自動音声/話者認識
US7747435B2 (en) Information retrieving method and apparatus
US6768978B2 (en) Speech coding/decoding method and apparatus
CN111246469A (zh) 人工智能保密通信系统及通信方法
CN106256001A (zh) 信号分类方法和装置以及使用其的音频编码方法和装置
JP2001265397A (ja) 入力信号をボコーディングする方法と装置
JPH07234698A (ja) 音声信号符号化復号化方法
CN100538820C (zh) 一种对音频数据进行处理的方法及装置
US6385574B1 (en) Reusing invalid pulse positions in CELP vocoding
US6098045A (en) Sound compression/decompression method and system
US7092878B1 (en) Speech synthesis using multi-mode coding with a speech segment dictionary
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3236758B2 (ja) 可変長データのcrc演算装置
JPH03241399A (ja) 音声送受信装置
WO2021166129A1 (ja) 音声認識装置、制御方法、及びプログラム
JP3515216B2 (ja) 音声符号化装置
JPH08179800A (ja) 音声符号化装置
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
JP3350340B2 (ja) 音声符号化方法および音声復号化方法