JP3715417B2 - 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3715417B2
JP3715417B2 JP29303797A JP29303797A JP3715417B2 JP 3715417 B2 JP3715417 B2 JP 3715417B2 JP 29303797 A JP29303797 A JP 29303797A JP 29303797 A JP29303797 A JP 29303797A JP 3715417 B2 JP3715417 B2 JP 3715417B2
Authority
JP
Japan
Prior art keywords
information
decoding
signal
extracting
discrete cosine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP29303797A
Other languages
English (en)
Other versions
JPH11134000A (ja
Inventor
淳 山根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP29303797A priority Critical patent/JP3715417B2/ja
Publication of JPH11134000A publication Critical patent/JPH11134000A/ja
Application granted granted Critical
Publication of JP3715417B2 publication Critical patent/JP3715417B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は,留守番電話,音声応答システム,ボイスメール等に適用される音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関し,より詳細には,アナログ音声波形を入力してディジタル音声信号に変換した後,該ディジタル音声信号を所定の符号化方式で符号化することにより,演算量の低減を図った音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
近年,自動車電話等の移動体通信におけるチャンネル容量の拡大や,マルチメディア通信における膨大な情報の蓄積・伝送の必要性から,実用的な低ビットレート音声符号化に対する要求が高まっている。
【0003】
また,ファクシミリ・モデムや,データ・モデムの付加機能として,留守番電話のための音声符号化/復号化機能を備えたものが求められており,この符号化/復号化ための低ビットレートの音声圧縮符号化手法の開発が望まれている。
【0004】
現在,10kbps以下の低ビットレート音声圧縮符号化方式の主流は,CELP(Code Excited Linear Prediction coding system)方式である。このCELP方式は,線形予測に基づく音声のAR(Auto−Regressive:自己回帰)モデルに基づいたモデルベースの圧縮符号化方式である。
【0005】
具体的には,符号化側において,音声をフレームまたはサブフレームと呼ばれる単位に分割し,それぞれの単位についてスペクトル包絡を表すLPC(Linear Prediction Coding:線形予測)係数,そのピッチ情報を表すピッチラグ情報,音源情報である雑音(源)情報,および,ピッチラグ情報と音源情報に対する利得情報のそれぞれに対応するパラメータを抽出し,それぞれ符号化(量子化)を行い,格納または伝送するものである。
【0006】
また,復号側では,符号化された各情報を復元し,雑音源情報にピッチ情報を加えることによって励振源信号を生成し,この励振源信号をLPC係数で構成される線形予測合成フィルタに通し,合成音声を得るものである。
【0007】
【発明が解決しようとする課題】
しかしながら,上記従来のCELP方式では,10kbpsの低ビットレートにおいて,良好な音声を得ることができるという利点を有する反面,それぞれのパラメータの符号化過程における演算量の多さがリアルタイム処理を実現する上で障害となるという問題点があった。
【0008】
特に,ピッチラグ情報の符号化や雑音源情報の符号化については,励振源符号帳に蓄えられた各励振源符号ベクトルを,線形予測合成フィルタに通すことによって合成音声を生成し,原音声と比較し,最も原音声に近いものを選択することによって行われているが,フィルタ演算には多くに演算を必要とするため,前記励振源符号帳に蓄えられた全ての励振源符号ベクトルをフィルタに通して比較を行うことを多大な計算を必要とし,汎用のプロセッサでリアルタイムに処理を実現することは大変困難であった。
【0009】
そのため,これまでに,さまざまな演算量削減のための改良が行われている。例えば,全ての励振源符号ベクトルに対してフィルタ演算を行い原音声との比較を行うのではなく,近似的に原音声との比較を行うことのできる比較的演算量の少ないパラメータによって励振源符号ベクトルを少数に絞り込むという予備選択手法はその一つである。
【0010】
また,前記励振源符号帳は,与えられたビット数によって表される数の励振源符号ベクトルを蓄えているのが一般的であるが,その構成を工夫することにより,演算量を削減する方法も提案されている。励振源符号ベクトルをビット数分だけ有し,それらの和と差でビット数によって表される数の励振源符号ベクトルを表すことにより,フィルタ計算の数を激減させるVSELP(Vector Sum Excited Linear Prediction Coding)方式はその一例である。
【0011】
本発明は上記に鑑みてなされたものであって,CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないことを目的とする。
【0012】
【課題を解決するための手段】
上記の目的を達成するために,請求項1に係る音声圧縮符号化装置は,アナログ音声波形をディジタル音声信号にディジタル化するA/D変換手段と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化手段と,前記符号化されたディジタル音声信号を蓄積する蓄積手段と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化手段と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換手段と,を有する音声圧縮符号化装置において,前記音声符号化手段が,さらに前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割手段と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化手段と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成手段と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出手段と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出手段と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出手段と,を備え,前記音声復号化手段が,さらに前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号手段と,前記符号化された雑音源情報を復号する雑音源情報復号手段と,前記符号化されたピッチ情報を復号するピッチ情報復号手段と,前記符号化された利得情報を復号する利得情報復号手段と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成手段と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成手段と,を備え,さらに,前記雑音源情報抽出手段が,前記サブフレーム構成手段によって構成された前記サブフレームの強度を測定する強度測定手段と,前記強度測定手段によって測定された前記強度が予め定められた強度より小さい場合に,離散コサイン変換係数の本数を減少させるように設定する本数設定手段と,前記サブフレーム構成手段によって構成された前記サブフレームと,前記スペクトル包絡符号化手段によって抽出された前記スペクトラム包絡情報と,前記ピッチ情報抽出手段によって抽出された前記ピッチ情報と,および前記利得情報抽出手段によって抽出された前記利得情報に基づいて,二次誤差信号を抽出する二次誤差信号抽出手段と,前記二次誤差信号抽出手段によって抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換手段と,前記離散コサイン変換手段によって変換された前記離散コサイン変換係数列から前記本数設定手段によって設定された本数に基づいて,離散コサイン変換係数の選択を行う係数選択手段と,前記係数選択手段によって選択された前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換手段と,を備えたものである。
【0015】
また,請求項2に係る音声圧縮符号化装置は,アナログ音声波形をディジタル音声信号にディジタル化するA/D変換手段と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化手段と,前記符号化されたディジタル音声信号を蓄積する蓄積手段と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化手段と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換手段と,を有する音声圧縮符号化装置において,前記音声符号化手段が,前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割手段と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化手段と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成手段と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出手段と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出手段と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出手段と,を備え,前記音声復号化手段が,前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号手段と,前記符号化された雑音源情報を復号する雑音源情報復号手段と,前記符号化されたピッチ情報を復号するピッチ情報復号手段と,前記符号化された利得情報を復号する利得情報復号手段と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成手段と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成手段と,を備え,前記雑音源情報抽出手段が,二次誤差信号を抽出する二次誤差信号抽出手段と,前記抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換手段と,前記離散コサイン変換手段で得られた離散コサイン変換係数列を所定のビット長に変換する係数列変換手段と,を備え,さらに,前記係数列変換手段が,前記離散コサイン変換係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,絶対値が最大の離散コサイン変換係数から所定数の離散コサイン変換係数を選択する係数選択手段と,前記係数選択手段で選択した前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換手段と,備えたものである。
【0019】
また,請求項3に係る音声圧縮符号化方法は,アナログ音声波形をディジタル音声信号にディジタル化するA/D変換工程と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化工程と,前記符号化されたディジタル音声信号を蓄積する蓄積工程と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化工程と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換工程と,を有する音声圧縮符号化方法において,前記音声符号化工程が,さらに前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割工程と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化工程と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成工程と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出工程と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出工程と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出工程と,を含み,前記音声復号化工程が,さらに前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号工程と,前記符号化された雑音源情報を復号する雑音源情報復号工程と,前記符号化されたピッチ情報を復号するピッチ情報復号工程と,前記符号化された利得情報を復号する利得情報復号工程と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成工程と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成工程と,を含み,さらに,前記雑音源情報抽出工程が,前記サブフレーム構成工程によって構成された前記サブフレームの強度を測定する強度測定工程と,前記強度測定工程によって測定された前記強度が予め定められた強度より小さい場合に,離散コサイン変換係数の本数を減少させるように設定する本数設定工程と,前記サブフレーム構成工程によって構成された前記サブフレームと,前記スペクトル包絡符号化工程によって抽出された前記スペクトラム包絡情報と,前記ピッチ情報抽出工程によって抽出された前記ピッチ情報と,および前記利得情報抽出工程によって抽出された前記利得情報に基づいて,二次誤差信号を抽出する二次誤差信号抽出工程と,前記二次誤差信号抽出工程によって抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換工程と,前記離散コサイン変換工程によって変換された前記離散コサイン変換係数列から前記本数設定工程によって設定された本数に基づいて,離散コサイン変換係数の選択を行う係数選択工程と,前記係数選択工程によって選択された前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換工程と,を含むものである。
【0022】
また,請求項4に係る音声圧縮符号化方法は,アナログ音声波形をディジタル音声信号にディジタル化するA/D変換工程と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化工程と,前記符号化されたディジタル音声信号を蓄積する蓄積工程と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化工程と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換工程と,を有する音声圧縮符号化方法において,前記音声符号化工程が,前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割工程と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化工程と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成工程と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出工程と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出工程と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出工程と,を含み,前記音声復号化工程が,前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号工程と,前記符号化された雑音源情報を復号する雑音源情報復号工程と,前記符号化されたピッチ情報を復号するピッチ情報復号工程と,前記符号化された利得情報を復号する利得情報復号工程と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成工程と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成工程と,を含み,前記雑音源情報抽出工程が,二次誤差信号を抽出する二次誤差信号抽出工程と,前記抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換工程と,前記離散コサイン変換工程で得られた離散コサイン変換係数列を所定のビット長に変換する係数列変換工程と,を含み,さらに,前記係数列変換工程が,前記離散コサイン変換係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,絶対値が最大の離散コサイン変換係数から所定数の離散コサイン変換係数を選択する係数選択工程と,前記係数選択工程で選択した前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換工程と,を含むものである。
【0026】
また,請求項5に係るコンピュータ読み取り可能な記録媒体は,請求項3または請求項4に記載の音声圧縮符号化方法の各工程をコンピュータに実行させるためのプログラムを記録したものである。
【0027】
【発明の実施の形態】
以下,本発明の音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体について,〔実施の形態1〕〜〔実施の形態6〕の順で,図面を参照して詳細に説明する。
【0028】
〔実施の形態1〕
図1は,実施の形態1の音声圧縮符号化装置100の概略構成図を示す。音声圧縮符号化装置100は,アナログ音声波形をディジタル音声信号にディジタル化するA/D変換手段としてのA/D変換部101と,A/D変換部101からディジタル音声信号を入力して,ディジタル音声信号を所定の符号化方式で符号化する音声符号化手段としての音声符号化部102と,音声符号化部102で符号化されたディジタル音声信号(符号化されたスペクトル包絡情報,ピッチ情報,利得情報および雑音源情報)を蓄積する蓄積手段としての蓄積部103と,蓄積されたディジタル音声信号を取り出して復号化する音声復号化手段としての音声復号化部104と,復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換手段としてのD/A変換部105と,から構成される。なお,A/D変換部101としては,例えば,A/D変換装置,PC用サウンドボード等が挙げられる。また,D/A変換部105としては,例えば,D/A変換装置,PC用サウンドボード等が挙げられる。
【0029】
図2は,音声符号化部102のブロック構成図を示す。音声符号化部102は,入力したディジタル音声信号を予め定められたサンプル数(例えば,240サンプル)のフレームと呼ばれる単位に分割し,フレーム信号を出力するフレーム構成部201と,フレーム構成部201で分割したフレーム(フレーム信号)から,フレーム単位でスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡抽出部202と,フレーム構成部201で分割したフレームを更に予め定められたサンプル数(例えば,60サンプル)のサブフレーム単位に分割し,サブフレーム信号を出力するサブフレーム構成部203と,スペクトル包絡抽出部202で抽出したスペクトル包絡情報を用いて,サブフレーム構成部203で分割したサブフレームからピッチ情報を抽出して符号化するピッチ情報抽出部204と,ピッチ情報から利得情報を抽出して符号化する利得抽出部205と,スペクトル包絡情報,サブフレーム,ピッチ情報および利得情報から音源情報である雑音源情報を抽出して符号化する雑音源抽出部206と,から構成される。
【0030】
また,図3は,雑音源抽出部206のブロック構成図を示す。雑音抽出部206は,スペクトル包絡抽出部202で抽出されたスペクトル包絡情報,サブフレーム構成部203から出力されたサブフレーム信号,ピッチ情報抽出部204で抽出されたピッチ情報および利得抽出部205で抽出された利得情報を用いて,二次誤差信号を抽出する二次誤差信号構成部301と,二次誤差信号を離散コサイン変換(Discrete Cosine Transform:以下,DCTと記述する)して,DCT係数列を得るDCT変換部302と,DCT変換部302によるDCT変換で得られたDCT係数列を所定のビット長に変換する係数変換部303と,から構成される。さらに,係数変換部303は,DCT係数列からDCT係数を選択する係数選択部304と,係数選択部304で選択したDCT係数を入力し,所定長のビット列に変換して出力する変換部305とを有する。
【0031】
更に,図4は,音声復号化部104のブロック構成図を示す。音声復号化部104は,蓄積部103から取り出したディジタル音声信号(符号化されたスペクトル包絡情報,ピッチ情報,利得情報および雑音源情報)を入力し,符号化されたスペクトル包絡情報を復元するスペクトル包絡復号部401と,符号化されたピッチ情報を復元するピッチ情報復号部402と,符号化された雑音源情報から雑音源情報を復元する雑音源復号部403と,符号化された利得情報を復元する利得復号部404と,復元されたスペクトル包絡情報と復元されたピッチ情報,利得情報および雑音源情報から生成された励振源信号とから合成音声を生成する音声合成部405と,から構成される。
【0032】
以上の構成において,図5の実施の形態1の音声圧縮符号化装置100の概略フローチャートおよび図6の音声符号化部の動作手順を示すフローチャートを参照してその動作を説明する。図1において,アナログ音声入力装置(図示せず)から入力されたアナログ音声信号(アナログ音声波形)はA/D変換部101によってディジタル音声信号に変換される(S501)。ここで,アナログ音声入力装置としては,例えば,マイクロフォンや,CDプレーヤ,カセットデッキ等が挙げられる。
【0033】
続いて,ディジタル音声信号を入力した音声符号化部102は,ディジタル音声信号を所定の符号化方式で符号化する(S502)。ここで,図6の音声符号化部102の概略フローチャートを参照して,音声符号化部102による音声符号化処理について詳細に説明する。
【0034】
先ず,ディジタル音声信号は,フレーム構成部201のフレーム構成処理によって,予め定められたサンプル数(例えば,240サンプル)のフレームと呼ばれる単位に分割される(S601)。なお,このフレームはフレーム信号としてスペクトル包絡抽出部202およびサブフレーム構成部203に出力される。
【0035】
次に,スペクトル包絡抽出部202のスペクトル包絡抽出処理によって,該フレーム信号からスペクトル包絡情報を抽出して符号化(量子化)し,ピッチ情報抽出部204および雑音源抽出部206へ出力する(S602)。スペクトル包絡情報としては,例えば,線形予測分析に基づく線形予測係数,PARCOR係数,LSP係数等が挙げられる。またスペクトル包絡情報の符号化(量子化)には,ベクトル量子化や,スカラー量子化,分割ベクトル量子化,多段ベクトル量子化,あるいはそれらの複数の量子化の組み合わせが挙げられる。
【0036】
一方,サブフレーム構成部203は,フレーム構成部201からフレーム信号を入力すると,サブフレーム構成処理を実行して,該フレーム信号を予め定められたサンプル数(例えば,60サンプル)に分割し,サブフレーム信号として出力する(S603)。
【0037】
各サブフレーム信号は,ピッチ情報抽出部204のピッチ情報抽出処理によって,スペクトル包絡抽出部202によって抽出されたスペクトル包絡情報を用いて,ピッチ情報が抽出され,符号化される(S604)。ピッチ情報の抽出には,CELP方式における適応符号帳探索,またはフーリエ変換やウェーブレット変換等のスペクトル情報から求める方法等が考えられる。適応符号帳探索の場合,聴覚重みづけフィルタを用いる場合もある。聴覚重みづけフィルタは前記線形予測係数から構成することができる。
【0038】
ピッチ情報抽出部204で抽出されたピッチ情報は,利得抽出部205に入力され,利得抽出処理によって利得情報(利得成分)が抽出されて符号化される(S605)。
【0039】
雑音源抽出部206では,二次誤差信号構成部301,DCT変換部302,および係数変換部303によって雑音源抽出処理が実行される(S606)。具体的には,先ず,図3に示すように,二次誤差信号構成部301がサブフレーム信号,スペクトル包絡情報,ピッチ情報および利得情報を用いて,雑音源抽出処理を実行し,二次誤差信号を構成する。この際,前サブフレームまでの残差信号と,ピッチ情報抽出部204において抽出したピッチ情報と,利得抽出部205において抽出した利得情報と,によってピッチ成分残差信号を構成し,さらに,構成したピッチ成分残差信号とスペクトル包絡情報とからピッチ成分信号を構成した後,サブフレーム信号からピッチ成分信号を差し引くことによって二次誤差信号を得ることができる。なお,ピッチ成分残差信号とスペクトル包絡情報とからピッチ成分信号を得るには,スペクトル包絡情報によって得られる合成フィルタに残差信号を通す等の方法を用いることができる。このようにして構成された二次誤差信号は,DCT変換部302に出力される。
【0040】
次に,DCT変換部302は,二次誤差信号を入力してDCT変換し,DCT変換によって得られた複数のDCT係数(すなわち,DCT係数列)を係数変換部303へ出力する。
【0041】
係数変換部303において,係数選択部304は,複数のDCT係数を入力しすると,DCT係数列からDCT係数の選択を行い,選択結果を出力する。変換部305は,係数選択部304の選択結果に基づいてDCT係数列を所定のビット長に変換して出力する。すなわち,DCT係数列を符号化し,雑音源情報として出力する。
【0042】
このようにして音声符号化部102は,ディジタル音声信号からスペクトル包絡情報,ピッチ情報,利得情報および雑音源情報を抽出して符号化し,これらを量子化信号(符号化したディジタル音声信号)として出力する。
【0043】
図5に戻って,音声符号化部102から出力された量子化信号(符号化したディジタル音声信号)は,蓄積部103によって蓄積される(S503)。
【0044】
次に,蓄積部103に蓄積された量子化信号(符号化されたディジタル音声信号)は,必要に応じて,音声復号化部104によって読み出されて復号化(復元)される(S604)。音声復号化部104においては,図4に示すように,スペクトル包絡復号部401でスペクトル包絡情報が復元され,ピッチ情報復号部402でピッチ情報が復元され,雑音源復号部403で雑音源情報が復元され,さらに,利得復号部404で利得情報が復元される。ここで,復元されたピッチ情報,雑音源情報および利得情報は,残差信号(励振源信号)を構成する。音声合成部405は,復元されたスペクトル包絡情報と残差信号とからディジタル音声信号である復号音声(合成音声)を生成して,D/A変換部105に出力する。
【0045】
続いて,音声合成部405(すなわち,音声復号化部104)から出力されたディジタル音声信号は,図1に示すように,D/A変換部105でアナログ音声信号(アナログ音声波形)に変換される(S505)。
【0046】
前述したように本実施の形態1は,CELP音声符号化に属する音声圧縮符号化方法を用いた音声圧縮符号化装置である。
【0047】
従来のCELP方式では,二次誤差信号の符号帳を持ち,符号帳に属する各符号ベクトルとスペクトル包絡情報とから二次誤差信号を合成し,入力信号から得られた二次誤差信号と比較し,そのひずみが最小となる符号を選択することによって符号化を行っている。因みに,この探索においては聴覚重みづけフィルタを用いることができる。ところが,CELP方式は,高音質で低ビットレートの音声圧縮符号化技術であるものの,符号帳探索のための演算量の多さが問題となっている。
【0048】
これに対して,実施の形態1の音声圧縮符号化装置によれば,この二次誤差信号の符号化において,符号帳やフィルタ計算によらず,二次誤差信号を離散コサイン変換(DCT)し,その結果であるDCT係数を所定のビット長に変換することにより符号化を行うものである。前述したようにDCT係数は,係数変換部303に送られて,係数選択部304で選択され,変換部305において所定のビット長に変換される。
【0049】
すなわち,符号帳を持たず,かつ,フィルタ計算を用いた符号帳探索を行わないため,従来のCELP方式と比較して,低演算量で高音質かつ低ビットレートの音声圧縮符号化装置(音声圧縮符号化方法)が可能になる。これによって,リアルタイム処理を実現することが可能である。
【0050】
換言すれば,実施の形態1の音声圧縮符号化装置(音声圧縮符号化方法)は,CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないようにすることができる。
【0051】
〔実施の形態2〕
図7は,実施の形態2の音声圧縮符号化装置の雑音源抽出部206のブロック構成図を示す。なお,その他の構成は実施の形態1と共通につき,ここでは異なる部分のみを図示し,説明する。
【0052】
実施の形態2の音声圧縮符号化装置は,実施の形態1の音声圧縮符号化装置において,さらに,雑音源抽出部206が,サブフレーム信号の強度を測定する強度測定部306と,強度測定部306で測定した強度に基づいてビット長を算出するビット長算出部307と,を備え,変換部305が,ビット長算出部307で算出したビット長に基づいて,DCT係数列の変換に使用するビット長を変更するものである。
【0053】
以上の構成において,その動作を説明する。雑音源抽出部206に入力されたサブフレーム信号は,強度測定部306に送られ,強度測定部306でサブフレーム信号の強度Pが測定され,測定された強度Pはビット長算出部307に送られる(請求項9の強度測定工程に相当する)。
【0054】
ビット長算出部307には,あらかじめ強度Pと符号化ビットLとの関係が関数L(P)として設定されており,ビット長算出部307は,強度測定部306から強度Pを入力すると,関数L(P)を用いて符号化ビットLの値(ビット長)を算出し,符号化ビットLを変換部305へ出力する(請求項9のビット長算出工程に相当する)。
【0055】
係数変換部303では,係数選択部304がDCT変換部302から送られてきたDCT係数列からDCT係数の選択を行い変換部305へ出力する。変換部305は,係数選択部304から入力したDCT係数を,ビット長算出部307から入力した符号化ビットLの長さに符号化する(請求項9の変換工程に相当する)。
【0056】
前述したように実施の形態2の音声圧縮符号化装置(音声圧縮符号化方法)によれば,全てのフレームの信号を同一のビットレートで符号化するのではなく,信号の性質(強度)によってビットレートを変化させるため,より効率的な符号化が可能である。例えば,入力サブフレーム信号の強度が小さい場合は,ほぼ無音区間あるいは雑音のみの区間であると考えることができるため,このような信号の場合に,付与する符号ビット数を削減することにより,有音区間の音質は維持したままで平均的なビットレートを削減することが可能となる。併せて,有音区間の場合に,付与する符号ビット数を増加させることで,全体的なビットレートを増加させることなく,有音区間の音質を向上させることができる。
【0057】
〔実施の形態3〕
図8は,実施の形態3の音声圧縮符号化装置の雑音源抽出部206のブロック構成図を示す。なお,その他の構成は実施の形態1と共通につき,ここでは異なる部分のみを図示し,説明する。
【0058】
実施の形態3の音声圧縮符号化装置は,実施の形態1の音声圧縮符号化装置において,さらに,雑音源抽出部206が,サブフレーム信号の強度を測定する強度測定部306と,強度測定部306で測定した強度に基づいて,係数選択部304で選択する離散コサイン変換係数の本数を設定する本数設定部308と,を備え,係数選択部304が,本数設定部308で設定された本数に基づいて,選択する離散コサイン変換係数の数を変更するものである。
【0059】
以上の構成において,その動作を説明する。雑音源抽出部206に入力されたサブフレーム信号は,強度測定部306に送られ,強度測定部306でサブフレーム信号の強度Pが測定され,測定された強度Pは本数設定部308に送られる(請求項10の強度測定工程に相当する)。
【0060】
本数設定部308には,あらかじめ強度Pと選択本数Nとの関係が関数N(P)として設定されており,本数設定部308は,強度測定部306から強度Pを入力すると,関数N(P)を用いて選択本数Nの値を算出し,選択本数Nを係数選択部304へ出力する(請求項10の本数設定工程に相当する)。
【0061】
係数選択部304では,DCT変換部302から送られてきたDCT係数列を,本数設定部308から入力した選択本数Nに相当する本数のDCT係数を選択し,変換部305へ送る(請求項10の係数選択工程に相当する)。
【0062】
変換部305では,送られてきたN本(本数)のDCT係数を所定のビット長に符号化する。
【0063】
前述したように実施の形態3の音声圧縮符号化装置(音声圧縮符号化方法)によれば,サブフレームの強度に応じて選択するDCT係数の数を変更するため,例えば,入力サブフレーム信号の強度が小さくなれば選択されるDCT係数の本数が減少するように変化させ,選択されるDCT係数の本数が減少すれば,出力されるビット長が減少するように設定することにより,有音区間の精度を高く維持したままで平均的なビットレートの削減を行うことが可能である。
【0064】
〔実施の形態4〕
図9は,実施の形態4の音声圧縮符号化装置の雑音源抽出部206のブロック構成図を示す。なお,その他の構成は実施の形態1と共通につき,ここでは異なる部分のみを図示し,説明する。
【0065】
実施の形態4の音声圧縮符号化装置は,実施の形態1で示した係数選択部304が,DCT係数列の帯域を所定数に分割し,分割されたDCT係数列の帯域単位のそれぞれにおいて,所定のDCT係数を選択するものであり,図9に示すように,係数選択部304が,DCT係数列の帯域を所定数に分割する係数分割部500と,係数の帯域に応じて配置されており,かつ,それぞれ送られてきた係数から所定数を選択するm個の分割係数選択部501〜50mと,を有している。
【0066】
以上の構成において,その動作を説明する。係数選択部304では,DCT変換部302から送られてきたDCT係数列を,係数分割部500で帯域分割して所定数(ここでは,m個の帯域)に分割し,それぞれ係数の帯域に相当する次段の分割係数選択部501〜50mに送る。各分割係数選択部501〜50mは,それぞれ送られてきた係数から所定するを選択し,変換部305へ送出する(請求項11の係数選択工程に相当する)。
【0067】
なお,係数分割部500におけるDCT係数列の帯域の分割方法としては,例えば,図10(a)のようにDCT係数列を表した場合に,図10(b)のように隣接する係数をまとめる分割方法や,図10(c)のようにACELPで用いられるAlgebraic符号のような所定の間隔をおいた係数同士をまとめる分割方法等が考えられる。
【0068】
前述したように実施の形態4の音声圧縮符号化装置(音声圧縮符号化方法)によれば,DCT係数列の帯域を所定数に分割し,分割されたDCT係数列の帯域単位のそれぞれにおいて,所定のDCT係数を選択するため,さらに全体の圧縮率を高めることができる。すなわち,DCT係数列を全体から所定数選択し,選択されたDCT係数の係数位置(周波数)を符号化するためには,例えば,サブフレーム長が64サンプルの場合,一本あたり6ビット必要になるが,DCT係数の帯域を所定数に分割することにより,一本選択するのに必要なビット数を削減することができる。具体的には,例えば,帯域を四等分することにより,一本あたり4ビットで良くなる。したがって,同一本数の係数を選択するのに必要なビット長の削減が可能となり,全体の圧縮率を高めることができる。
【0069】
〔実施の形態5〕
図11は,実施の形態5の音声圧縮符号化装置の雑音源抽出部206のブロック構成図を示す。なお,その他の構成は実施の形態1と共通につき,ここでは異なる部分のみを図示し,説明する。
【0070】
実施の形態5の音声圧縮符号化装置は,実施の形態1の音声圧縮符号化装置において,さらに,雑音源抽出部206が,サブフレーム信号の強度を測定する強度測定部306と,強度測定部306で測定した強度に基づいてビット長を算出するビット長算出部307と,を備え,係数選択部304が,DCT係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,所定の離散コサイン変換係数を選択し,変換部305が,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,ビット長算出部307で算出したビット長に基づいて,DCT係数を変換する際のビット長を変更するものである。
【0071】
以上の構成において,その動作を説明する。雑音源抽出部206に入力されたサブフレーム信号は,強度測定部306に送られ,強度測定部306でサブフレーム信号の強度Pが測定され,測定された強度Pはビット長算出部307に送られる(請求項12の強度測定工程に相当する)。
【0072】
ビット長算出部307には,あらかじめ強度Pと符号化ビットLとの関係が関数L(P)として設定されており,ビット長算出部307は,強度測定部306から強度Pを入力すると,関数L(P)を用いて符号化ビットLの値(ビット長)を算出し,符号化ビットLを変換部305へ出力する(請求項12のビット長算出工程に相当する)。
【0073】
係数変換部303では,係数選択部304がDCT変換部302から送られてきたDCT係数列を,係数分割部500で帯域分割して所定数(ここでは,m個の帯域)に分割し,それぞれ係数の帯域に相当する次段の分割係数選択部501〜50mに送る。各分割係数選択部501〜50mは,それぞれ送られてきた係数から所定するを選択し,変換部305へ送出する(請求項12の係数変換工程に相当する)。
【0074】
続いて,変換部305が,係数選択部304から入力したDCT係数を,ビット長算出部307から入力した符号化ビットLの長さに符号化する(請求項12の変換工程に相当する)。
【0075】
前述したように実施の形態5の音声圧縮符号化装置(音声圧縮符号化方法)によれば,全てのフレームの信号を同一のビットレートで符号化するのではなく,信号の性質(強度)によってビットレートを変化させるため,より効率的な符号化が可能である。例えば,入力サブフレーム信号の強度が小さい場合は,ほぼ無音区間あるいは雑音のみの区間であると考えることができるため,このような信号の場合に,付与する符号ビット数を削減することにより,有音区間の音質は維持したままで平均的なビットレートを削減することが可能となる。併せて,有音区間の場合に,付与する符号ビット数を増加させることで,全体的なビットレートを増加させることなく,有音区間の音質を向上させることができる。
【0076】
また,DCT係数列の帯域を所定数に分割し,分割されたDCT係数列の帯域単位のそれぞれにおいて,所定のDCT係数を選択するため,同一本数の係数を選択するのに必要なビット長の削減が可能となり,さらに全体の圧縮率を高めることができる。
【0077】
〔実施の形態6〕
図12は,実施の形態6の音声圧縮符号化装置の雑音源抽出部206のブロック構成図を示す。なお,その他の構成は実施の形態1と共通につき,ここでは異なる部分のみを図示し,説明する。
【0078】
実施の形態6の音声圧縮符号化装置は,実施の形態1の音声圧縮符号化装置において,さらに,雑音源抽出部206が,サブフレーム信号の強度を測定する強度測定部306と,強度測定部306で測定した強度に基づいて,係数選択部304で選択する離散コサイン変換係数の本数を設定する本数設定部308と,を備え,係数選択部304が,DCT係数列の帯域を所定数に分割し,分割されたDCT係数例の帯域単位のそれぞれに対し,本数設定部308で設定された本数に基づいて,選択するDCT係数の本数を変更するものである。
【0079】
以上の構成において,その動作を説明する。雑音源抽出部206に入力されたサブフレーム信号は,強度測定部306に送られ,強度測定部306でサブフレーム信号の強度Pが測定され,測定された強度Pは本数設定部308に送られる(請求項13の強度測定工程に相当する)。
【0080】
本数設定部308には,あらかじめ強度Pと選択本数Nとの関係が関数N(P)として設定されており,本数設定部308は,強度測定部306から強度Pを入力すると,関数N(P)を用いて選択本数Nの値を算出し,選択本数Nを係数選択部304へ出力する(請求項13の本数設定工程に相当する)。
【0081】
係数変換部303では,係数選択部304が,DCT変換部302から送られてきたDCT係数列を,本数設定部308から入力した選択本数Nに相当する本数のDCT係数を選択し,変換部305へ送る(請求項13の係数選択工程に相当する)。
【0082】
変換部305では,送られてきたN本(本数)のDCT係数を所定のビット長に符号化する。
【0083】
前述したように実施の形態6の音声圧縮符号化装置(音声圧縮符号化方法)によれば,サブフレームの強度に応じて選択するDCT係数の数を変更するため,例えば,入力サブフレーム信号の強度が小さくなれば選択されるDCT係数の本数が減少するように変化させ,選択されるDCT係数の本数が減少すれば,出力されるビット長が減少するように設定することにより,有音区間の精度を高く維持したままで平均的なビットレートの削減を行うことが可能である。
【0084】
また,DCT係数列の帯域を所定数に分割し,分割されたDCT係数列の帯域単位のそれぞれにおいて,所定のDCT係数を選択するため,同一本数の係数を選択するのに必要なビット長の削減が可能となり,さらに全体の圧縮率を高めることができる。
【0085】
なお,前述した実施の形態1〜実施の形態6の音声圧縮符号化装置の他の実施の形態として,係数選択部304でDCT係数列から所定数のDCT係数を選択する際に,DCT係数の係数値の絶対値が最大のものから所定数を選択するようにしても良い。これによって,二次誤差信号の特徴を最もよく再現できるため,さらに精度の高い符号化を行うことができる。
【0086】
また,前述した各実施の形態では,入力したアナログ音声波形をディジタル音声信号にディジタル化し,符号化(圧縮)して蓄積し,蓄積されているディジタル音声信号(符号化されたディジタル音声信号)を取り出して復号化し,さらにアナログ音声信号に変換して出力する例を記述しているが,本発明の本質とするところは,音声圧縮符号化方法における符号化および復号化の方法にあり,本発明の方法で,符号化した信号をネットワークや通信装置等の伝送手段を介して,伝送した後,本発明の方法で復号化する場合にも,当然のことながら本発明の範疇に属することは明らかである。
【0087】
さらに,前述した各実施の形態で説明した音声圧縮符号化方法は,予め用意されたプログラムをパーソナルコンピュータや,ワークステーション等のコンピュータで実行することによって実現することもできる。このプログラムは,ハードディスク,プロッピーディスク,CD−ROM,MO,DVD等のコンピュータで読み取り可能な記録媒体に記録され,コンピュータによって記録媒体から読み出されることによって実行される。また,このプログラムは,上記記録媒体またはネットワークを介して配布することも可能である。
【0088】
【発明の効果】
以上説明したように,本発明の音声圧縮符号化装置(請求項1)によれば,音声符号化手段が,ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割手段と,分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化手段と,分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成手段と,サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出手段と,ピッチ情報から利得情報を抽出して符号化する利得情報抽出手段と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出手段と,を備え,音声復号化手段が,符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号手段と,符号化された雑音源情報を復号する雑音源情報復号手段と,符号化されたピッチ情報を復号するピッチ情報復号手段と,符号化された利得情報を復号する利得情報復号手段と,復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成手段と,励振源信号と復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成手段と,を備え,さらに,雑音源情報抽出手段が,サブフレーム構成手段によって構成されたサブフレームの強度を測定する強度測定手段と,強度測定手段によって測定された強度が予め定められた強度より小さい場合に,離散コサイン変換係数の本数を減少させるように設定する本数設定手段と,サブフレーム構成手段によって構成されたサブフレームと,スペクトル包絡符号化手段によって抽出されたスペクトラム包絡情報と,ピッチ情報抽出手段によって抽出されたピッチ情報と,および利得情報抽出手段によって抽出された利得情報に基づいて,二次誤差信号を抽出する二次誤差信号抽出手段と,二次誤差信号抽出手段によって抽出された二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換手段と,離散コサイン変換手段によって変換された離散コサイン変換係数列から本数設定手段によって設定された本数に基づいて,離散コサイン変換係数の選択を行う係数選択手段と,係数選択手段によって選択された離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換手段と,を備えたため,サブフレームの強度に応じて選択する離散コサイン変換係数の数を変更することができ,例えば,入力サブフレーム信号の強度が小さくなれば選択される離散コサイン変換係数の本数が減少するように変化させ,選択される離散コサイン変換係数の本数が減少すれば,出力されるビット長が減少するように設定することにより,有音区間の精度を高く維持したままで平均的なビットレートの削減を行うことが可能である。また,CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないようにすることができる。
【0091】
また,本発明の音声圧縮符号化装置(請求項2)は,音声符号化手段が,ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割手段と,分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化手段と,分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成手段と,サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出手段と,ピッチ情報から利得情報を抽出して符号化する利得情報抽出手段と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出手段と,を備え,音声復号化手段が,符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号手段と,符号化された雑音源情報を復号する雑音源情報復号手段と,符号化されたピッチ情報を復号するピッチ情報復号手段と,符号化された利得情報を復号する利得情報復号手段と,復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成手段と,励振源信号と復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成手段と,を備え,雑音源情報抽出手段が,二次誤差信号を抽出する二次誤差信号抽出手段と,抽出された二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換手段と,離散コサイン変換手段で得られた離散コサイン変換係数列を所定のビット長に変換する係数列変換手段と,を備え,さらに,係数列変換手段が,離散コサイン変換係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,絶対値が最大の離散コサイン変換係数から所定数の離散コサイン変換係数を選択する係数選択手段と,係数選択手段で選択した離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換手段と,備えたため,同一本数の係数を選択するのに必要なビット長の削減が可能となり,さらに全体の圧縮率を高めることができる。また,CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないようにすることができる。
【0097】
また,本発明の音声圧縮符号化方法(請求項3)は,音声符号化工程が,さらにディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割工程と,分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化工程と,分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成工程と,サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出工程と,ピッチ情報から利得情報を抽出して符号化する利得情報抽出工程と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出工程と,を含み,音声復号化工程が,さらに符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号工程と,符号化された雑音源情報を復号する雑音源情報復号工程と,符号化されたピッチ情報を復号するピッチ情報復号工程と,符号化された利得情報を復号する利得情報復号工程と,復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成工程と,励振源信号と復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成工程と,を含み,さらに,雑音源情報抽出工程が,サブフレーム構成工程によって構成されたサブフレームの強度を測定する強度測定工程と,強度測定工程によって測定された強が予め定められた強度より小さい場合に,離散コサイン変換係数の本数を減少させるように設定する本数設定工程と,サブフレーム構成工程によって構成されたサブフレームと,スペクトル包絡符号化工程によって抽出されたスペクトラム包絡情報と,ピッチ情報抽出工程によって抽出されたピッチ情報と,および利得情報抽出工程によって抽出された利得情報に基づいて,二次誤差信号を抽出する二次誤差信号抽出工程と,二次誤差信号抽出工程によって抽出された二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換工程と,離散コサイン変換工程によって変換された離散コサイン変換係数列から本数設定工程によって設定された本数に基づいて,離散コサイン変換係数の選択を行う係数選択工程と,係数選択工程によって選択された離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換工程と,を含むため,サブフレームの強度に応じて選択する離散コサイン変換係数の数を変更することができ,例えば,入力サブフレーム信号の強度が小さくなれば選択される離散コサイン変換係数の本数が減少するように変化させ,選択される離散コサイン変換係数の本数が減少すれば,出力されるビット長が減少するように設定することにより,有音区間の精度を高く維持したままで平均的なビットレートの削減を行うことが可能である。また、CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないようにすることができる。
【0098】
また,本発明の音声圧縮符号化方法(請求項4)は,音声符号化工程が,ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割工程と,分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化工程と,分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成工程と,サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出工程と,ピッチ情報から利得情報を抽出して符号化する利得情報抽出工程と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出工程と,を含み,音声復号化工程が,符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号工程と,符号化された雑音源情報を復号する雑音源情報復号工程と,符号化されたピッチ情報を復号するピッチ情報復号工程と,符号化された利得情報を復号する利得情報復号工程と,復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成工程と,励振源信号と復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成工程と,を含み,雑音源情報抽出工程が,二次誤差信号を抽出する二次誤差信号抽出工程と,抽出された二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換工程と,離散コサイン変換工程で得られた離散コサイン変換係数列を所定のビット長に変換する係数列変換工程と,を含み,さらに,係数列変換工程が,離散コサイン変換係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,絶対値が最大の離散コサイン変換係数から所定数の離散コサイン変換係数を選択する係数選択工程と,係数選択工程で選択した離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換工程と,を含むため,同一本数の係数を選択するのに必要なビット長の削減が可能となり,さらに全体の圧縮率を高めることができる。また、CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないようにすることができる。
【0102】
また,本発明のコンピュータ読み取り可能な記録媒体(請求項5)は,請求項3または請求項4に記載の音声圧縮符号化方法の各工程をコンピュータに実行させるためのプログラムを記録したため,このプログラムをコンピュータに実行させることにより,CELP方式の符号化の過程において,雑音励振源符号ベクトル探索によって行っていた二次誤差信号の符号化(量子化)を,二次誤差信号そのものを符号化(量子化)することにより,雑音励振源の探索における演算量を削減し,また雑音励振源符号ベクトルを蓄えるためのメモリを必要としないようにすることができる。サブフレームの強度に応じて選択する離散コサイン変換係数の数を変更することができ,例えば,入力サブフレーム信号の強度が小さくなれば選択される離散コサイン変換係数の本数が減少するように変化させ,選択される離散コサイン変換係数の本数が減少すれば,出力されるビット長が減少するように設定することにより,有音区間の精度を高く維持したままで平均的なビットレートの削減を行うことが可能である。また、同一本数の係数を選択するのに必要なビット長の削減が可能となり,さらに全体の圧縮率を高めることができる。
【図面の簡単な説明】
【図1】実施の形態1の音声圧縮符号化装置の概略構成図である。
【図2】実施の形態1の音声符号化部のブロック構成図である。
【図3】実施の形態1の雑音源抽出部の概略ブロック図である。
【図4】実施の形態1の音声復号化部の一部構成を示すブロック図である。
【図5】実施の形態1の音声圧縮符号化装置(音声圧縮符号化方法)の概略フローチャートである。
【図6】実施の形態1の音声符号化部の動作手順を示すフローチャートである。
【図7】実施の形態2の音声圧縮符号化装置の雑音源抽出部の構成を示すブロック図である。
【図8】実施の形態3の音声圧縮符号化装置の雑音源抽出部の構成を示すブロック図である。
【図9】実施の形態4の音声圧縮符号化装置の雑音源抽出部の構成を示すブロック図である。
【図10】実施の形態4の係数分割部におけるDCT係数列の帯域の分割方法の一例を示す説明図である。
【図11】実施の形態5の音声圧縮符号化装置の雑音源抽出部の構成を示すブロック図である。
【図12】実施の形態6の音声圧縮符号化装置の雑音源抽出部の構成を示すブロック図である。
【符号の説明】
100 音声圧縮符号化装置
101 A/D変換部
102 音声符号化部
103 蓄積部
104 音声復号化部
105 D/A変換部
201 フレーム構成部
202 スペクトル包絡抽出部
203 サブフレーム構成部
204 ピッチ情報抽出部
205 利得抽出部
206 雑音源抽出部
301 二次誤差信号構成部
302 DCT変換部
303 係数変換部
304 係数選択部
305 変換部
306 強度測定部
307 ビット長算出部
308 本数設定部
401 スペクトル包絡復号部
402 ピッチ情報復号部
403 雑音源復号部
404 利得復号部
405 音声合成部
500 係数分割部
501〜50m 分割係数選択部

Claims (5)

  1. アナログ音声波形をディジタル音声信号にディジタル化するA/D変換手段と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化手段と,前記符号化されたディジタル音声信号を蓄積する蓄積手段と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化手段と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換手段と,を有する音声圧縮符号化装置において,
    前記音声符号化手段が,さらに前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割手段と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化手段と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成手段と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出手段と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出手段と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出手段と,を備え,
    前記音声復号化手段が,さらに前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号手段と,前記符号化された雑音源情報を復号する雑音源情報復号手段と,前記符号化されたピッチ情報を復号するピッチ情報復号手段と,前記符号化された利得情報を復号する利得情報復号手段と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成手段と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成手段と,を備え,
    さらに,前記雑音源情報抽出手段が,前記サブフレーム構成手段によって構成された前記サブフレームの強度を測定する強度測定手段と,前記強度測定手段によって測定された前記強度が予め定められた強度より小さい場合に,離散コサイン変換係数の本数を減少させるように設定する本数設定手段と,前記サブフレーム構成手段によって構成された前記サブフレームと,前記スペクトル包絡符号化手段によって抽出された前記スペクトラム包絡情報と,前記ピッチ情報抽出手段によって抽出された前記ピッチ情報と,および前記利得情報抽出手段によって抽出された前記利得情報に基づいて,二次誤差信号を抽出する二次誤差信号抽出手段と,前記二次誤差信号抽出手段によって抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換手段と,前記離散コサイン変換手段によって変換された前記離散コサイン変換係数列から前記本数設定手段によって設定された本数に基づいて,離散コサイン変換係数の選択を行う係数選択手段と,前記係数選択手段によって選択された前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換手段と,
    を備えることを特徴とする音声圧縮符号化装置。
  2. アナログ音声波形をディジタル音声信号にディジタル化するA/D変換手段と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化手段と,前記符号化されたディジタル音声信号を蓄積する蓄積手段と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化手段と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換手段と,を有する音声圧縮符号化装置において,
    前記音声符号化手段が,前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割手段と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化手段と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成手段と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出手段と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出手段と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出手段と,を備え,
    前記音声復号化手段が,前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号手段と,前記符号化された雑音源情報を復号する雑音源情報復号手段と,前記符号化されたピッチ情報を復号するピッチ情報復号手段と,前記符号化された利得情報を復号する利得情報復号手段と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成手段と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成手段と,を備え,
    前記雑音源情報抽出手段が,二次誤差信号を抽出する二次誤差信号抽出手段と,前記抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換手段と,前記離散コサイン変換手段で得られた離散コサイン変換係数列を所定のビット長に変換する係数列変換手段と,を備え,
    さらに,前記係数列変換手段が,前記離散コサイン変換係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,絶対値が最大の離散コサイン変換係数から所定数の離散コサイン変換係数を選択する係数選択手段と,前記係数選択手段で選択した離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換手段と,を備えることを特徴とする音声圧縮符号化装置。
  3. アナログ音声波形をディジタル音声信号にディジタル化するA/D変換工程と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化工程と,前記符号化されたディジタル音声信号を蓄積する蓄積工程と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化工程と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換工程と,を有する音声圧縮符号化方法において,
    前記音声符号化工程が,さらに前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割工程と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化工程と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成工程と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出工程と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出工程と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出工程と,を含み,
    前記音声復号化工程が,さらに前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号工程と,前記符号化された雑音源情報を復号する雑音源情報復号工程と,前記符号化されたピッチ情報を復号するピッチ情報復号工程と,前記符号化された利得情報を復号する利得情報復号工程と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成工程と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成工程と,を含み,
    さらに,前記雑音源情報抽出工程が,前記サブフレーム構成工程によって構成された前記サブフレームの強度を測定する強度測定工程と,前記強度測定工程によって測定された前記強度が予め定められた強度より小さい場合に,離散コサイン変換係数の本数を減少させるように設定する本数設定工程と,前記サブフレーム構成工程によって構成された前記サブフレームと,前記スペクトル包絡符号化工程によって抽出された前記スペクトラム包絡情報と,前記ピッチ情報抽出工程によって抽出された前記ピッチ情報と,および前記利得情報抽出工程によって抽出された前記利得情報に基づいて,二次誤差信号を抽出する二次誤差信号抽出工程と,前記二次誤差信号抽出工程によって抽出された前記二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換工程と,前記離散コサイン変換工程によって変換された前記離散コサイン変換係数列から前記本数設定工程によって設定された本数に基づいて,離散コサイン変換係数の選択を行う係数選択工程と,前記係数選択工程によって選択された前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換工程と,
    を含むことを特徴とする音声圧縮符号化方法。
  4. アナログ音声波形をディジタル音声信号にディジタル化するA/D変換工程と,前記ディジタル音声信号を所定の符号化方式で符号化する音声符号化工程と,前記符号化されたディジタル音声信号を蓄積する蓄積工程と,前記蓄積されたディジタル音声信号を取り出して復号化する音声復号化工程と,前記復号化されたディジタル音声信号をアナログ音声信号に変換するD/A変換工程と,を有する音声圧縮符号化方法において,
    前記音声符号化工程が,前記ディジタル音声信号をフレームと呼ばれる処理単位に分割するフレーム分割工程と,前記分割したフレームについてスペクトル包絡を表すスペクトル包絡情報を抽出して符号化するスペクトル包絡符号化工程と,前記分割したフレームからサブフレームと呼ばれる処理単位を構成するサブフレーム構成工程と,前記サブフレームのピッチ情報を抽出して符号化するピッチ情報抽出工程と,前記ピッチ情報から利得情報を抽出して符号化する利得情報抽出工程と,音源情報である雑音源情報を抽出して符号化する雑音源情報抽出工程と,を含み,
    前記音声復号化工程が,前記符号化されたスペクトル包絡情報を復号するスペクトル包絡情報復号工程と,前記符号化された雑音源情報を復号する雑音源情報復号工程と,前記符号化されたピッチ情報を復号するピッチ情報復号工程と,前記符号化された利得情報を復号する利得情報復号工程と,前記復号された雑音源情報,ピッチ情報および利得情報から励振源信号を生成する励振源信号生成工程と,前記励振源信号と前記復号されたスペクトル包絡情報とから合成信号を生成する合成信号生成工程と,を含み,
    前記雑音源情報抽出工程が,二次誤差信号を抽出する二次誤差信号抽出工程と,前記抽出された二次誤差信号を離散コサイン変換係数列に変換する離散コサイン変換工程と,前記離散コサイン変換工程で得られた前記離散コサイン変換係数列を所定のビット長に変換する係数列変換工程と,を含み,
    さらに,前記係数列変換工程が,前記離散コサイン変換係数列の帯域を所定数に分割し,分割された離散コサイン変換係数列の帯域単位のそれぞれにおいて,絶対値が最大の離散コサイン変換係数から所定数の離散コサイン変換係数を選択する係数選択工程と,前記係数選択工程で選択した前記離散コサイン変換係数を入力し,所定長のビット列に変換して出力する変換工程と,を含むことを特徴とする音声圧縮符号化方法。
  5. 請求項3または請求項4に記載の音声圧縮符号化方法の各工程をコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP29303797A 1997-10-24 1997-10-24 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3715417B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29303797A JP3715417B2 (ja) 1997-10-24 1997-10-24 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29303797A JP3715417B2 (ja) 1997-10-24 1997-10-24 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH11134000A JPH11134000A (ja) 1999-05-21
JP3715417B2 true JP3715417B2 (ja) 2005-11-09

Family

ID=17789681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29303797A Expired - Fee Related JP3715417B2 (ja) 1997-10-24 1997-10-24 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3715417B2 (ja)

Also Published As

Publication number Publication date
JPH11134000A (ja) 1999-05-21

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US11721349B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
US6917914B2 (en) Voice over bandwidth constrained lines with mixed excitation linear prediction transcoding
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP5313967B2 (ja) ビット率拡張音声符号化及び復号化装置とその方法
JP2001507822A (ja) スピーチ信号のエンコード方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2796408B2 (ja) 音声情報圧縮装置
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3153075B2 (ja) 音声符号化装置
JPH08129400A (ja) 音声符号化方式
JPH05232996A (ja) 音声符号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JPH10124093A (ja) 音声圧縮符号化方法および装置
JPH11352999A (ja) 音声圧縮符号化装置
JPH11305798A (ja) 音声圧縮符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH11133999A (ja) 音声符号化・復号化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050825

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080902

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100902

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110902

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120902

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130902

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees