JP2007171519A - 音声符号化・復号装置 - Google Patents

音声符号化・復号装置 Download PDF

Info

Publication number
JP2007171519A
JP2007171519A JP2005368585A JP2005368585A JP2007171519A JP 2007171519 A JP2007171519 A JP 2007171519A JP 2005368585 A JP2005368585 A JP 2005368585A JP 2005368585 A JP2005368585 A JP 2005368585A JP 2007171519 A JP2007171519 A JP 2007171519A
Authority
JP
Japan
Prior art keywords
unit
algebraic codebook
signal
codebook
algebraic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005368585A
Other languages
English (en)
Other versions
JP4727413B2 (ja
Inventor
Hisashi Yajima
久 矢島
Satoshi Furuta
訓 古田
Tadashi Yamaura
正 山浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005368585A priority Critical patent/JP4727413B2/ja
Publication of JP2007171519A publication Critical patent/JP2007171519A/ja
Application granted granted Critical
Publication of JP4727413B2 publication Critical patent/JP4727413B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】符号化効率を改善し低ビットレートでも音声劣化を少なくする。
【解決手段】過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳111と、周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のサブバンドを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳112と、指示された選択情報に基づき上記代数符号帳におけるサブバンドを選択するセレクタ部114と、上記適応符号帳から出力された適応符号帳成分と上記代数符号帳における選択されたサブバンドから出力された代数符号帳成分信号により駆動音源信号を生成する加算器118とを備える。
【選択図】図1

Description

この発明は代数的符号励振線形予測を用いた音声符号化・復号装置に関するものである。
符号励振線形予測(CELP)を用いる高能率音声符号化方式において、単位パルスで構成される代数符号帳を用いて、励振信号の雑音成分を表現する方式(代数的符号励振線形予測:Algebraic Code-Excited Linear Prediction:ACELP)が、例えば、非特許文献1、非特許文献2及び非特許文献3に示す各種標準方式に採用されている。
従来のACELP符号化方式の音声符号化装置における符号化処理について説明する。
入力された音声信号をある一定のフレーム長(通常5msec〜50msec程度)に区切り、各フレーム毎に音声のスペクトル分析(LPC分析)を行い、そのスペクトル分析結果を用いて合成フィルタを形成する。同時に、スペクトル分析結果を所定の方式によって量子化を行い、得られた量子化インデックスをスペクトル情報として出力する。
また、音声符号化装置は、複数の既知の波形から成る駆動音源信号を生成する機構を有する。駆動音源信号は、フレーム長分、又はサブフレームと呼ばれる1フレームを時間軸上で複数に分割した区間長分生成する。複数の駆動音源信号全てを合成フィルタ部に通し、合成音声信号を生成する。生成した複数の合成音声信号について、入力された音声信号と比較し、歪みが最小となる合成音声信号を生成した駆動音源信号を探索する。探索の結果、その駆動音源信号に付された駆動音源インデックスを出力する。スペクトル情報及び駆動音源インデックスは符号化データとして多重化されて伝送路へ出力される。
通常、ACELP符号化方式において、駆動音源信号を生成する機構は、過去に生成された駆動音源信号を蓄積している適応符号帳、単位パルスで構成され駆動音源信号の雑音成分を生成するための代数符号帳、適応符号帳及び代数符号帳の複数の利得値の候補を格納している利得符号帳を備え、これらの各符号帳の要素の一部又は全部を適宜組み合わせることにより駆動音源信号を生成する。また、これらの各符号帳の要素には、それぞれに駆動音源インデックスが付されている。
生成されたこれらの駆動音源信号全てを合成フィルタ部に通して合成音声信号を生成し、入力された音声信号と比較し、歪みが最小となる合成音声信号を生成した駆動音源信号を探索する。探索されたこの駆動音源信号を生成した適応符号帳、代数符号帳、利得符号帳の駆動音源インデックスは多重化されて伝送路へ出力される。ここで、探索された適応符号帳の駆動音源インデックスは、通常、音声信号のピッチ周期を表現しているピッチ情報で、代数符号帳の駆動音源インデックスは、各単位パルスをそれぞれの位置情報と極性(正負)で表現しているパルス情報で、利得符号帳の駆動音源インデックスは利得値を表現している利得情報である。
従来のACELP符号化方式の音声復号装置における復号処理について説明する。
音声復号装置でも音声符号化装置と同様の適応符号帳、代数符号帳、利得符号帳を備えている。音声符号化装置より伝送された符号化データを、スペクトル情報と、駆動音源インデックスとしてのピッチ情報、パルス情報、利得情報に分離する。分離したスペクトル情報を用いて合成フィルタ部の係数に復号して合成フィルタ部を形成する。
分離したピッチ情報を用いて適応符号帳を参照して、駆動音源信号の適応符号帳成分信号を生成し、分離したパルス情報を用いて代数符号帳を参照して、駆動音源信号の代数符号帳成分信号(パルス系列)を生成し、分離した利得情報を用いて利得符号帳を参照して、駆動音源信号の適応符号帳成分信号及び代数符号帳成分信号の利得値を生成する。生成した駆動音源信号の適応符号帳成分信号、代数符号帳成分信号、利得値を用いて駆動音源信号を生成し、合成フィルタ部に通して合成(復号)音声信号を得る。
このACELP符号化方式の枠組みを用いて、符号化音声品質をできるだけ維持しつつ、低ビットレート化(電話帯域で8kbit/s以下、主に4kbit/s程度、7kHz帯域でおよそ16kbit/s以下、主に8kbit/s程度)を図るにあたっては、主にビット感度の観点から、例えば、特許文献1、特許文献2及び特許文献3に示すように、代数符号帳に割り当てられているビット数を削減するのが効果的であることが知られている。
これらの例は主に電話帯域(300Hz〜3400Hz帯域)の音声信号の符号化を目的になされたものであり、7kHz帯域(50〜7000Hz帯域)音声を対象とした低ビットレート化手法としては、非特許文献2に開示されている。
特許第3582693号公報 特開平11−237899号公報 特開2004−157381号公報 ITU-T Recommendation G.729,"Coding of Speech at 8kbit/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP)"(TTC標準JT−G729、「8kbit/s CS−ACELPを用いた音声符号化方式」(社)情報通信技術委員会、1999年制定) ITU-T Recommendation G.722.2,"Wideband coding of speech at around 16kbit/s using Adaptive Multi-Rate Wideband(AMR-WB)"(TTC標準JT−G722.2、「適応マルチレート広帯域(AMR−WB)方式を用いた16kbit/s程度の広帯域音声符号化」(社)情報通信技術委員会、2004年制定) 3rd Generation Partnership Project(3GPP), Technical Specification(TS) 26.090,"AMR speech codec;Transcoding functions",Version 4.0.0(2001−03) 3rd Generation Partnership Project(3GPP),Technical Report(TR)26.976,"Performance characterization of the Adaptive Multi-Rate Wideband (AMR-WB) speech codec",Version 5.1.0(2003−09)
従来の音声符号化・復号装置は、以上のように構成されているので、ACELP符号化方式の低ビットレート化を図ることは可能であるが、選択できる単位パルスの本数を減らすか、又はパルスを立てる位置の自由度を少なくする等してビット数の削減を図るため、音声品質の若干の劣化は避けられないという課題があった。その様子は、非特許文献4のFig.8.1他に詳しく示されている。
この発明は、上記のような課題を解決するためになされたもので、上記例とは異なるアプローチで代数符号帳の単位パルスを定義することにより、符号化効率を改善し低ビットレートでも音声劣化の少ない音声符号化・復号装置を得ることを目的とする。
この発明に係る音声符号化・復号装置は、過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のサブバンドを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、指示された選択情報に基づき上記代数符号帳におけるサブバンドを選択するセレクタ部と、上記適応符号帳から出力された適応符号帳成分と上記代数符号帳における選択されたサブバンドから出力された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えたものである。
この発明により、符号化効率を改善することができると共に、低ビットレートでも音声劣化を少なくすることができるという効果が得られる。
実施の形態1.
以下、この発明の実施の一形態について図面を参照しながら説明する。
図1はこの発明の実施の形態1による音声符号化装置の構成を示すブロック図である。この音声符号化装置は、駆動音源生成部11、スペクトル分析・量子化部12、合成フィルタ部13、加算器14、聴覚重み付けフィルタ部15、最小誤差探索部16及び多重化部17を備えている。
また、駆動音源生成部11は、適応符号帳111、代数符号帳112、利得符号帳113、セレクタ部114、帯域合成フィルタバンク部115、利得乗算器116、利得乗算器117及び加算器118を備え、代数符号帳112は、サブバンド1代数符号帳112a、サブバンド2代数符号帳112b、サブバンド3代数符号帳112c、サブバンド4代数符号帳112dを備えている。
次に音声符号化装置の符号化処理について説明する。
なお、ここでは実数を用いて説明を判りやすくするために、サンプリング周波数12.8kHz、フレーム長20msec、サブフレーム長5msec(=1サブフレームのサンプル数64サンプル)の音声符号化方式を仮定する。
スペクトル分析・量子化部12は、入力された音声信号をフレーム長20msecに区切り、各フレーム毎に音声信号のスペクトル分析(LPC分析)を行い、このスペクトル分析結果を用いて合成フィルタ部13を形成する。また、スペクトル分析・量子化部12は、スペクトル分析結果に対して所定の方式によって量子化を行い、得られた量子化インデックスをスペクトル情報として多重化部17に出力する。
ここで、スペクトル分析・量子化部12による合成フィルタ13の形成は以下の手順で行われる。入力された音声信号について自己相関関数を計算し、その自己相関関数を用いて16次の線形予測係数(LPC)を求め、求めた16次LPCを16次の線スペクトル対(LSP)に変換する。変換した16次LSPについてベクトル量子化を行う。具体的には、変換した16次LSPと別途蓄積されたLSP量子化テーブルとを逐次比較し、自乗誤差が最小となるLSP量子化テーブル及びそれに付与されたインデックスを抽出する。ここで抽出した量子化テーブルを量子化LSPとし、この量子化LSPを16次LPC(量子化LPC)に変換する。
駆動音源生成部11は既知の波形から成る複数の駆動音源信号を生成し、合成フィルタ部13は生成された駆動音源信号から、量子化LPCを用いてフィルタ演算を行い合成音声信号を生成する。加算器14は入力された音声信号と合成音声信号の差分を算出する。聴覚重み付けフィルタ部15は加算器14により算出された差分を聴覚重み付けする。具体的には、聴覚重み付けフィルタ部15は、ホルマント(声道共鳴)のノイズマスキングの性質を利用し、差分をホルマント周波数に近い帯域には少なく重み付けし、遠い帯域には多く重み付けする。
最小誤差探索部16は入力された音声信号と合成音声信号の差分が最小となる合成音声信号を生成した駆動音源信号を探索する。すなわち、最小誤差探索部16は、複数の合成音声信号の候補について、逐一、入力された音声信号との差分を計算し、その差分信号についてエネルギー(歪)を計算し、複数の合成音声信号の候補の中から、この歪みの値が最小となる合成音声信号を生成した駆動音源信号を探索する。
また、最小誤差探索部16は、歪が最小となる合成音声信号を生成した駆動音源信号を構成する適応符号帳111のピッチ情報、代数符号帳112のパルス情報、利得符号帳113の利得情報及びセレクタ部114の選択情報に関する駆動音源インデックスを抽出して多重化部17に出力する。ここで、探索された適応符号帳111の駆動音源インデックスは、通常、音声信号のピッチ周期を表現しているピッチ情報で、代数符号帳112の駆動音源インデックスは、各単位パルスをそれぞれの位置情報と極性(正負)で表現しているパルス情報で、利得符号帳113の駆動音源インデックスは利得値を表現している利得情報で、セレクタ部114の駆動音源インデックスは、代数符号帳112の各サブバンドを表現している選択情報である。
多重化部17は量子化インデックスであるスペクトル情報と、駆動音源インデックスであるピッチ情報、パルス情報、利得情報、選択情報とを多重化して符号化データとして伝送路へ出力する。
駆動音源生成部11において、適応符号帳111は過去に生成された駆動音源信号を蓄積している。代数符号帳112は、周波数軸上で分割されたサブバンド1代数符号帳112a、サブバンド2代数符号帳112b、サブバンド3代数符号帳112c及びサブバンド4代数符号帳112dを備え、各サブバンド1〜4代数符号帳112a〜112dは駆動音源信号の雑音成分を生成するための複数の単位パルスで構成されている。利得符号帳120は複数の利得値の候補を蓄積している。駆動音源信号はこれらの各符号帳の要素を適宜組み合せることによって生成される。
適応符号帳111は最小誤差探索部16により指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分信号を出力する。また、利得符号帳113は最小誤差探索部16により指示された利得情報に基づき利得乗算器116,117の利得値を出力する。セレクタ部114は、最小誤差探索部16により指示された選択情報に基づき、代数符号帳112におけるサブバンド1代数符号帳112a、サブバンド2代数符号帳112b、サブバンド3代数符号帳112c及びサブバンド4代数符号帳112dの何れか1つを選択し、選択したサブバンド代数符号帳の中の最小誤差探索部16により指示されたパルス情報に基づき、駆動音源信号の代数符号帳成分信号(パルス系列)を出力する。帯域合成フィルタバンク部115は、選択されたサブバンドの代数符号帳成分信号と選択されなかったサブバンドの代数符号帳成分信号とを帯域合成して出力する。ここで、選択されなかったサブバンドの代数符号帳成分信号は零信号として帯域合成される。
利得乗算器116は適応符号帳111からの適応符号帳成分信号に利得符号帳113からの利得値を乗算し、利得乗算器117は帯域合成フィルタバンク部115からの代数符号帳成分信号に利得符号帳113からの利得値を乗算する。加算器118は利得値がそれぞれ乗算された適応符号帳成分信号と代数符号帳成分信号を加算して、既知の波形から成る駆動音源信号として合成フィルタ部13に出力する。ここで、生成された駆動音源信号は、過去に生成された駆動音源信号として適応符号帳111に蓄積される。
図2は代数符号帳112の構成と最小誤差探索部16による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。代数符号帳112は周波数軸上で等間隔に複数のサブバンドに分割した構成(図2では4分割)となっている。サブバンド1代数符号帳112aは0Hz〜1.6kHz帯域成分を表現し、サブバンド2代数符号帳112bは1.6kHz〜3.2kHz帯域成分を表現し、サブバンド3代数符号帳112cは3.2kHz〜4.8kHz帯域成分を表現し、サブバンド4代数符号帳112dは4.8kHz〜6.4kHz帯域成分を表現している。
ここでは、各サブバンドが表現する帯域は1.6kHz幅に限定されるため、1サブフレーム当たりの各サブバンドのサンプル数は64サンプルの1/4である16サンプルで表現することができる。図2では、最小誤差探索部16によりセレクタ部114を介して選択されたサブバンド3の選択情報と、最小誤差探索部16により選択されたサブバンド3のパルス情報であるパルスとその極性を示している。図2では、サブバンド3の複数のパルスを選択しているが、選択するパルスの数は1つでも良い。
最小誤差探索部16は、歪みの値が最小となる合成音声信号を生成した駆動音源信号を探索し、この駆動音源信号を構成する適応符号帳111のピッチ情報、代数符号帳112のパルス情報、利得符号帳113の利得情報及びセレクタ部114の選択情報に関する駆動音源インデックスを抽出して多重化部17に出力する。
図3はこの発明の実施の形態1による音声復号装置の構成を示すブロック図である。この音声復号装置は、多重分離部51、スペクトル情報復号部52、適応符号帳53、代数符号帳54、セレクタ部55、帯域合成フィルタバンク部56、利得符号帳57、利得乗算器58、利得乗算器59、加算器60、合成フィルタ部61及びポストフィルタ部62を備えている。
次に音声復号装置の復号処理について説明する。
多重分離部51は、音声符号化装置から送信された符号化データから、量子化インデックスであるスペクトル情報、並びに駆動音源インデックスであるピッチ情報、パルス情報、利得情報及び選択情報をそれぞれ分離して出力する。スペクトル情報復号部52は、多重分離部51により分離されたスペクトル情報を用いて、合成フィルタ部61の係数に復号して合成フィルタ部61を形成する。この合成フィルタ部61の形成は、音声符号化装置の合成フィルタ部13の形成と同様に行われる。
適応符号帳53は、音声符号化装置の適応符号帳111と同様に、過去に生成された駆動音源信号を蓄積し、多重分離部51により分離されたピッチ情報に基づき駆動音源信号の適応符号帳成分信号を出力する。
代数符号帳54は、音声符号化装置の代数符号帳112と同様に、周波数軸上で等間隔に分割されたサブバンド1代数符号帳54a、サブバンド2代数符号帳54b、サブバンド3代数符号帳54c及びサブバンド4代数符号帳54dを備え、各サブバンド1〜4代数符号帳54a〜54dは駆動音源信号の雑音成分を生成するための複数の単位パルスで構成されている。
セレクタ部55は、多重分離部51により分離された選択情報に基づき、代数符号帳54におけるサブバンド1代数符号帳54a、サブバンド2代数符号帳54b、サブバンド3代数符号帳54c及びサブバンド4代数符号帳54dの何れか1つのサブバンド代数符号帳を選択し、選択したサブバンド代数符号帳の中の多重分離部51により分離されたパルス情報に基づき、駆動音源信号の代数符号帳成分信号(パルス系列)を出力する。帯域合成フィルタバンク部56は、セレクタ部55から出力された駆動音源の代数符号帳成分信号と、セレクタ部55から出力されなかった代数符号帳成分信号とを帯域合成して出力する。ここで、出力されなかった代数符号帳成分信号は零信号として帯域合成される。
利得符号帳57は、音声符号化装置の利得符号帳113と同様に、利得乗算器58,59の複数の利得値の候補を蓄積しており、多重分離部51により分離された利得情報に基づき、利得乗算器58,59の利得値、すなわち、駆動音源信号の適応符号帳成分信号及び代数符号帳成分信号の利得値を出力する。
利得乗算器58は、適応符号帳53からの駆動音源信号の適応符号帳成分信号に、利得符号帳57からの利得値を乗算し、利得乗算器59は、帯域合成フィルタバンク部56からの駆動音源信号の代数符号帳成分信号に、利得符号帳57からの利得値を乗算する。加算器60は利得値が乗算された駆動音源信号の適応符号帳成分信号と利得値が乗算された駆動音源信号の代数符号帳成分信号を加算して駆動音源信号を生成して出力する。ここで、生成された駆動音源信号は、過去に生成された駆動音源信号として適応符号帳53に蓄積される。合成フィルタ部61は加算器60からの駆動音源信号より復号音声信号を生成し、ポストフィルタ部4は復号音声信号のノイズを低減して出力する。
以上のように、この実施の形態1によれば、周波数軸上で等間隔に帯域分割されたサブバンド代数符号帳112,54を用いることにより、1サブフレーム当たりのパルス位置候補が減少する(この実施の形態1では1/4に減少する)ため、駆動音源信号の代数符号帳成分が表現できる帯域は絞られるものの、1パルス当たりの必要ビット数を減らせることができ、符号化効率を改善することができると共に、代数符号帳成分信号を特定の帯域に絞り込み、特に重要なスペクトル成分を重点的に表現することにより、音声品質を改善することができ、低ビットレートでも音声劣化を少なくすることができるという効果が得られる。
実施の形態2.
この発明の実施の形態2による音声符号化装置の構成を示すブロック図は上記実施の形態1の図1と同じであり、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
上記実施の形態1では、音声符号化装置において、セレクタ部114が代数符号帳112の中から1つのサブバンド代数符号帳を選択し、音声復号装置において、セレクタ部55が送信された選択情報により代数符号帳54の中から1つのサブバンド代数符号帳を選択している。この実施の形態2では、音声符号化装置において、セレクタ部114が代数符号帳112の中から複数のサブバンド代数符号帳を選択し、音声復号装置において、セレクタ部55が送信された選択情報により代数符号帳54の中から複数のサブバンド代数符号帳を選択するものである。
図4は代数符号帳112,54の構成と最小誤差探索部16による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。図4では、最小誤差探索部16によりセレクタ部114を介して選択されたサブバンド1及びサブバンド3と、最小誤差探索部16により選択されたサブバンド1及びサブバンド3のパルス情報であるパルスとその極性を示している。このとき、選択情報にどのサブバンドを選択したかの情報と選択サブバンド数の情報を盛り込む。このように、セレクタ部114,55が複数のサブバンドを選択することにより、入力された音声信号が特定の帯域に集中せず、スペクトル包絡が広がった音声信号にも対応することができる。
この実施の形態2では、セレクタ部114が複数のサブバンドを選択しているが、入力された音声信号に応じて、上記実施の形態1と同様に、セレクタ部114が1つのサブバンド代数符号帳を選択したり、複数のサブバンド代数符号帳を選択するように、適応的に切り替える構成としても良い。この場合、例えば最小誤差探索部16が入力された音声信号の性質を表現している特徴パラメータを抽出し、抽出した特徴パラメータに応じて1つのサブバンド代数符号帳を選択するか、複数のサブバンド代数符号帳を選択するかの指示を与える。このような構成により、入力された音声信号のスペクトル包絡の形状が不安定で、かつ時系列で変化する音声信号にも対応することができる。
以上のように、この実施の形態2によれば、上記実施の形態1と同様の効果が得られると共に、セレクタ部114及びセレクタ部55が複数のサブバンドを選択することにより、スペクトル包絡が広がった音声信号にも対応することができ、セレクタ部114及びセレクタ部55が1つのサブバンド代数符号帳を選択したり、複数のサブバンド代数符号帳を選択するように、適応的に切り替えることにより、スペクトル包絡の形状が不安定で、かつ時系列で変化する音声信号にも対応することができるという効果が得られる。
実施の形態3.
この発明の実施の形態3による音声符号化装置の構成を示すブロック図は上記実施の形態1の図1と同じであり、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
図5は代数符号帳112,54の構成と最小誤差探索部16による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。上記実施の形態1の図2に示す代数符号帳112及び代数符号帳54の各サブバンドは等間隔であるが、分割するサブバンドは等間隔である必要はなく、図5に示すように、例えば対数スケールで非等間隔に分割しても良い。図5に示す例では、サブバンド1代数符号帳は0Hz〜0.8kHz帯域成分を表現し、サブバンド2代数符号帳は0.8kHz〜1.6kHz帯域成分を表現し、サブバンド3代数符号帳は1.6kHz〜3.2kHz帯域成分を表現し、サブバンド4代数符号帳は3.2kHz〜6.4kHz帯域成分を表現している。
各サブバンドで表現する帯域幅が異なるため、各サブバンドのサンプル数もそれぞれ異なる。サブバンド1,2は8サンプル(位置情報3ビット)、サブバンド3は16サンプル(位置情報4ビット)、サブバンド4は32サンプル(位置情報5ビット)となる。代数符号帳を20ビットで表現する場合、符号(正負)情報1ビットを加えるとサブバンド1,2は4ビットで表現でき、20/4=5パルス、サブバンド3は5ビットで表現でき、20/5=4パルス、サブバンド4は6ビットで表現でき、20/6=3パルスまで表現することができる。立てられるパルスの数が多いほど、その帯域の信号をきめ細かく表現することができ、図5の場合には低域の信号をきめ細かく表現することができ、低域の帯域のスペクトル成分が強い音声信号を表現する場合に有効である。
この場合、例えば最小誤差探索部16が入力された音声信号の性質を表現している特徴パラメータを抽出して、抽出した特徴パラメータに応じてどの帯域のスペクトル成分が強いかを判断し、その判断結果に基づき、セレクタ部114にどのサブバンドを選択するかを指示し、代数符号帳112にどれだけのパルス数を選択するかを指示する。
以上のように、この実施の形態3によれば、上記実施の形態1と同様の効果が得られると共に、代数符号帳112及び代数符号帳54のサブバンドを対数スケール等の非等間隔に分割することにより、特定の帯域のスペクトル成分が強い音声信号にも対応することができるという効果が得られる。
実施の形態4.
図6はこの発明の実施の形態4による音声符号化装置の駆動音源生成部11の構成を示すブロック図である。図6に示す駆動音源生成部11は上記実施の形態1の図1に示す駆動音源生成部11に雑音性判定部119を追加したものであり、その他の構成は上記実施の形態1の図1に示す駆動音源生成部11と同じである。また、音声符号化装置の駆動音源生成部11以外の構成については上記実施の形態1の図1と同じで、さらに、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
図6において、雑音性判定部119は、入力され音声信号の状態に応じて最小誤差探索部16の指示により利得符号帳113から利得乗算器116に出力される利得値と所定のしきい値に基づき、入力され音声信号の雑音性判定を行い、セレクタ部114にサブバンド代数符号帳112のサブバンド選択数を指示する。この雑音性判定の方法は上記非特許文献2や非特許文献3に示されている。雑音性判定部119は、利得乗算器116に出力される利得値が所定のしきい値より大きく非雑音性(有声)区間と判定した場合は、セレクタ部114に選択できるサブバンド代数符号帳の数を例えば1と指示する。また、雑音性判定部119は、利得乗算器116に出力される利得が所定のしきい値より小さく雑音性(無声、無音)区間と判定した場合は、セレクタ部114に選択できるサブバンド代数符号帳の数を例えば4と指示する。
このように、非雑音性(有声)区間と雑音性(無声、無音)区間でサブバンド代数符号帳の選択数を変えているのは、一般的に非雑音性(有声)区間はスペクトルパワーが特定の領域に偏っており、雑音性(無声、無音)区間はスペクトルパワーが広がっているためである。このような構成とすることで、多様なスペクトル包絡成分を持つ音声信号にも対応することができる。
図7及び図8は代数符号帳112,54の構成と最小誤差探索部16による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。図7ではセレクタ部114が雑音性判定部119からの指示に基づき例えばサブバンド1を選択し、図8ではセレクタ部114が雑音性判定部119からの指示に基づきサブバンド1〜4を選択していることを示している。
なお、この実施の形態4では、上記実施の形態2とは異なり、選択サブバンドの数は適応符号帳111からの適応符号帳出力信号に乗算する利得符号帳113の利得値で決まるため、選択情報に選択サブバンド数情報を盛り込む必要はない。
以上のように、この実施の形態4によれば、上記実施の形態1と同様の効果が得られると共に、雑音性判定部119が利得乗算器116に出力される利得値に基づき雑音性判定を行ってサブバンドの選択数を指示することにより、多様なスペクトル包絡成分を持つ音声信号にも対応することができるという効果が得られる。
実施の形態5.
図9はこの発明の実施の形態5による音声符号化装置の駆動音源生成部11の構成を示すブロック図である。図9に示す駆動音源生成部11は上記実施の形態4の図6に示す駆動音源生成部11に代数符号帳120を追加したものであり、その他の構成は上記実施の形態4の図6に示す駆動音源生成部11と同じである。また、音声符号化装置の駆動音源生成部11以外の構成については上記実施の形態1の図1と同じで、さらに、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
図9において、代数符号帳120は、代数符号帳112のようにサブバンドに分割されておらず、全帯域の代数符号帳である。雑音性判定部119は、入力され音声信号の状態に応じて最小誤差探索部16の指示により利得符号帳113から利得乗算器116に出力される利得値と所定のしきい値に基づき雑音性判定を行い、セレクタ部114にサブバンド代数符号帳112を選択するか、又は代数符号帳120を選択するかを指示する。すなわち、雑音性判定部119は、利得乗算器116に出力される利得値が所定のしきい値より大きく非雑音性(有声)区間と判定した場合は、セレクタ部114にサブバンド代数符号帳112を選択するよう指示する。また、雑音性判定部119は、利得乗算器116に出力される利得値が所定のしきい値より小さく雑音性(無声、無音)区間と判定した場合は、セレクタ部114に代数符号帳120を選択するよう指示する。このような構成とすることで、多様なスペクトル包絡成分を持つ音声信号にも対応することができる。
なお、この実施の形態5では、代数符号帳112又は代数符号帳120の選択結果は、利得符号帳113から利得乗算器116に出力される利得値で決定されるため、選択情報に代数符号帳112又は代数符号帳120の選択結果を盛り込む必要はない。
以上のように、この実施の形態5によれば、上記実施の形態1と同様の効果が得られると共に、雑音性判定部119が、利得乗算器116に出力される利得値に基づき雑音性判定を行って、代数符号帳112又は代数符号帳120の選択を指示することにより、多様なスペクトル包絡成分を持つ音声信号にも対応することができるという効果が得られる。
実施の形態6.
図10はこの発明の実施の形態6による音声符号化装置の駆動音源生成部11の構成を示すブロック図である。図10に示す駆動音源生成部11は上記実施の形態1の図1に示す駆動音源生成部11に雑音生成部121を追加したものであり、その他の構成は上記実施の形態1の図1に示す駆動音源生成部11と同じである。また、音声符号化装置の駆動音源生成部11以外の構成については上記実施の形態1の図1と同じである。さらに、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
図10において、雑音生成部121は、セレクタ部114が最小誤差探索部16の指示に基づき代数符号帳112のサブバンドを選択した際に、選択されなかったサブバンドについてセレクタ部114からの通知を受けて、例えば白色雑音等の雑音信号を生成して帯域合成フィルタバンク部115に出力する。帯域合成フィルタバンク部115は、セレクタ部114により選択されたサブバンドの代数符号帳成分信号と、雑音生成部121により生成された雑音信号を合成して利得乗算器117に出力する。
図11は代数符号帳112,54の構成と最小誤差探索部16による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報と雑音生成部121により生成された選択されなかったサブバンドにおける雑音信号を示す図である。図11では、セレクタ部114がサブバンド1,4を選択し、雑音生成部121が、セレクタ部114により選択されなかったサブバンド2,3について、例えば白色雑音等を雑音信号として生成していることを示している。
以上のように、この実施の形態6によれば、上記実施の形態1と同様の効果が得られると共に、選択されなかったサブバンドについて、例えば白色雑音等の雑音信号を生成し挿入することで、選択されなかった帯域のスペクトル成分が減衰し、痩せてしまいうのを防ぐことができるという効果が得られる。
実施の形態7.
図12はこの発明の実施の形態7による音声符号化装置の駆動音源生成部11の構成を示すブロック図である。図12における駆動音源生成部11は上記実施の形態6の図10に示す駆動音源生成部11に雑音性判定部119を追加したもので、その他の構成は上記実施の形態6の図10に示す駆動音源生成部11と同じである。また、音声符号化装置の駆動音源生成部11以外の構成については上記実施の形態1の図1と同じで、さらに、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
図12において、雑音性判定部119は、入力された音声信号の状態に応じて最小誤差探索部16の指示により利得符号帳113から利得乗算器116に出力される利得値と所定のしきい値に基づき入力された音声信号の雑音性判定を行い、利得乗算器116に出力される利得値が所定のしきい値より大きい場合には非雑音性(有声)区間と判定し、利得乗算器116に出力される利得値が所定のしきい値より小さく、雑音性(無声、無音)区間と判定する。
雑音生成部121は、雑音性判定部119が雑音性(無声、無音)区間と判定した場合には、セレクタ部114が最小誤差探索部16の指示に基づき代数符号帳112のサブバンドを選択した際に、選択されなかったサブバンドについてセレクタ部114からの通知を受けて、例えば白色雑音等の雑音信号を生成し帯域合成フィルタバンク部115に出力する。また、雑音生成部121は、雑音性判定部119が非雑音性(有声)区間と判定した場合には、選択されなかったサブバンドについて、例えば白色雑音等の雑音信号の生成を停止する。
帯域合成フィルタバンク部115は、雑音性(無声、無音)区間の場合には、セレクタ部114により選択されたサブバンドの代数符号帳成分信号と、雑音生成部121により生成された雑音信号を合成して利得乗算器117に出力し、非雑音性(有声)区間の場合には、セレクタ部114により選択されたサブバンドと、選択されなかったサブバンドについては零信号を合成して利得乗算器117に出力する。
以上のように、この実施の形態7によれば、上記実施の形態1と同様の効果が得られると共に、雑音性(無声、無音)区間については、選択されなかったサブバンドについて、例えば白色雑音等の雑音信号を生成して挿入することで、選択されなかった帯域のスペクトル成分が減衰し、痩せてしまいうのを防ぐことができ、非雑音性(有声)区間の場合には、選択されなかったサブバンドについて、零信号を合成することにより、雑音挿入によるS/N比の劣化を防ぐことができるという効果が得られる。
実施の形態8.
図13はこの発明の実施の形態8による音声符号化装置の構成を示すブロック図である。この音声符号化装置は上記実施の形態1の図1に示す駆動音源生成部11を駆動音源生成部31に置き換えたもので、その他の構成は図1と同じである。図13に示す駆動音源生成部31は、図1に示す駆動音源生成部11の代数符号帳112を代数符号帳131に置き換え、セレクタ部114をセレクタ部132,133に置き換え、信号加算器134,135を追加したもので、その他の構成は図1に示す駆動音源生成部11と同じである。
次に音声符号化装置の符号化処理について説明する。
なお、ここでは実数を用いて説明を判りやすくするため、サンプリング周波数12.8kHz、フレーム長20msec、サブフレーム長5msec(=1サブフレームのサンプル数64サンプル)の音声符号化方式を仮定する。図13において、スペクトル分析・量子化部12、合成フィルタ部13、加算器14、聴覚重み付けフィルタ部15、最小誤差探索部16及び多重化部17の処理は上記実施の形態1と同様である。
駆動音源生成部31において、代数符号帳131は、時間軸及び周波数軸上で等間隔に分割されたセグメント1代数符号帳131a、セグメント2代数符号帳131b、セグメント3代数符号帳131c及びセグメント4代数符号帳131dを備え、各セグメント1〜4代数符号帳131a〜131dは駆動音源信号の雑音成分を生成するための複数の単位パルスで構成されている。駆動音源信号は適応符号帳111、代数符号長131、利得符号帳113の要素を適宜組み合せることによって生成される。
セレクタ部132は、最小誤差探索部16の指示に基づき、代数符号帳131におけるセグメント1代数符号帳131a、セグメント2代数符号帳131bの何れかを選択し、選択したサブバンド代数符号帳の中の最小誤差探索部16により指示されたパルス情報に基づき、駆動音源信号の代数符号帳成分信号(パルス系列)を出力する。セレクタ部133は、最小誤差探索部16の指示に基づき、代数符号帳131におけるセグメント3代数符号帳131c、セグメント4代数符号帳131dの何れかを選択し、選択したサブバンド代数符号帳の中の最小誤差探索部16により指示されたパルス情報に基づき、駆動音源信号の代数符号帳成分信号(パルス系列)を出力する。
信号加算器134、135はセレクタ部132,133により選択されなかったセグメントについてそれぞれ零信号を加算する。帯域合成フィルタバンク部115は信号加算器134、135からの信号を帯域合成する。適応符号帳111、利得符号帳113、利得乗算器116,117及び加算器118の処理は上記実施の形態1と同様である。
最小誤差探索部16は、歪みの値が最小となる合成音声信号を生成した駆動音源信号を探索し、この駆動音源信号を構成する適応符号帳111のピッチ情報、代数符号帳131のパルス情報、利得符号帳113の利得情報及びセレクタ部132,133の選択情報に関する駆動音源インデックスを抽出して多重化部17に出力する。
図14は代数符号帳131の構成と最小誤差探索部16による探索の際に選択されたセグメントとそのセグメントにおけるパルス情報を示す図である。代数符号帳131は時間軸及び周波数軸上で等間隔に複数のセグメントに分割した構成(図14では4分割)となっている。セグメント1代数符号帳は0Hz〜3.2kHz帯域/サブフレーム前半成分を表現し、セグメント2代数符号帳は0Hz〜3.2kHz帯域/サブフレーム後半成分を表現し、サブバンド3代数符号帳は3.2kHz〜6.4kHz帯域/サブフレーム前半成分を表現し、サブバンド4代数符号帳は3.2kHz〜6.4kHz帯域/サブフレーム後半成分を表現している。
ここでは、各セグメントが表現する帯域は周波数3.2kHz幅/時間幅10msecに限定されるため、1サブフレーム当たりの各セグメントのサンプル数は、64サンプルの1/4である16サンプルで表現することができる。図14では、最小誤差探索部16によりセレクタ部133を介してセグメント3が選択され、最小誤差探索部16により選択されたセグメント3のパルス情報であるパルスとその極性を示している。このように時間軸上にもセグメントを設けることで、サブフレーム途中の音声の立ち上がりや終了時の符号化に良い改善効果を示すことが期待される。
図14では、セグメント1〜4の中から、セレクタ部132,133により、上記実施の形態1と同様に1つのセグメント3を選択しているが、上記実施の形態2と同様に複数のセグメントを選択しても良い。また、図14では、セグメント3の複数のパルスを選択しているが、選択するパルスの数は1つでも良い。
駆動音源生成部31は、適応符号帳111、利得符号帳113及び代数符号帳131の各要素の組合せの一部、又は全てについて駆動音源信号を生成して、合成フィルタ部13に出力する。
図15はこの発明の実施の形態8による音声符号化方式の音声復号装置の構成を示すブロック図である。この音声復号装置は、上記実施の形態1の図3に示す代数符号帳54を代数符号帳71に置き換え、セレクタ部55をセレクタ部72,73に置き換え、信号加算器74,75を追加したものであり、その他の構成は図3と同じである。
次に音声復号装置の復号処理について説明する。
代数符号帳71は、音声符号化装置の代数符号帳131と同様に、時間時及び周波数軸上で等間隔に分割されたセグメント1代数符号帳71a、セグメント2代数符号帳71b、セグメント3代数符号帳71c及びセグメント4代数符号帳71dを備え、各セグメント1〜4代数符号帳71a〜71dは駆動音源信号の雑音成分を生成するための複数の単位パルスで構成されている。
セレクタ部72は、多重分離部51により分離された選択情報に基づき、代数符号帳71におけるセグメント1代数符号帳71a、セグメント2代数符号帳71bの何れかのセグメント代数符号帳を選択し、選択したセグメント代数符号帳の中の多重分離部51により分離されたパルス情報に基づき、駆動音源信号の代数符号帳成分信号(パルス系列)を出力する。また、セレクタ部73は、多重分離部51により分離された選択情報に基づき、代数符号帳71におけるセグメント3代数符号帳71c、セグメント4代数符号帳71dの何れかのセグメント代数符号帳を選択し、選択したセグメント代数符号帳の中の多重分離部51により分離されたパルス情報に基づき、駆動音源信号の代数符号帳成分信号(パルス系列)を出力する。
信号加算器74,75は、セレクタ部72,73により選択されないセグメントについてそれぞれ零信号を加算する。帯域合成フィルタバンク部56は、信号加算器74,75からの駆動音源の代数符号帳成分信号を帯域合成して出力する。
図15において、その他の多重分離部51、スペクトル情報復号部52、適応符号帳53、利得符号帳57、利得乗算器58,59、加算器60、合成フィルタ部61及びポストフィルタ部62の処理は上記実施の形態1と同じである。
以上のように、この実施の形態8によれば、上記実施の形態1と同様の効果が得られると共に、代数符号帳131,71に周波数軸上の他に時間軸上にもセグメントを設ける構成とすることで、サブフレーム途中の音声の立ち上がりや終了時の符号化に良い改善を施すことができるという効果が得られる。
実施の形態9.
図16はこの発明の実施の形態9による音声符号化装置の構成を示すブロック図である。この音声符号化装置は、上記実施の形態8の図13に示す駆動音源生成部31に雑音生成部136,137を追加したものであり、その他の構成は図13と同じである。また、この発明の実施の形態9による音声復号装置の構成を示すブロック図は上記実施の形態8の図15と同じである。
図16において、雑音生成部136は代数符号帳131のセグメント1,2に対応する例えば白色雑音等の雑音信号を生成し、雑音生成部137は代数符号帳131のセグメント3,4に対応する例えば白色雑音等の雑音信号を生成する。信号加算器134,135は、最小誤差探索部16の指示に基づき、セレクタ部132,133により選択されなかったセグメントについて、雑音生成部136,137により生成された雑音信号を加算する。帯域合成フィルタバンク部56は、信号加算器74,75からの雑音信号が加算された駆動音源の代数符号帳成分信号を帯域合成して出力する。その他の処理は上記実施の形態8と同様である。
図17は代数符号帳131の構成と最小誤差探索部16による探索の際に選択されたセグメントとそのセグメントにおけるパルス情報と信号加算器134,135により加算された選択されなかったセグメントにおける雑音信号を示す図である。図17の例では、サブフレームの中間付近で音声信号が入力された場合を想定し、セグメント4が選択されたとし、セグメント4と同じ時間帯の選択されなかったセグメント2の代わりに、信号加算器134が雑音生成部136により生成されたセグメント2に対応する白色雑音等の雑音信号を追加している。これにより、選択されなかった帯域のスペクトル成分の減衰を防ぐことができる。
以上のように、この実施の形態9によれば、上記実施の形態8と同様の効果が得られると共に、選択されなかった帯域のスペクトル成分の減衰を防ぐことができるという効果が得られる。
実施の形態10.
図18はこの発明の実施の形態10による音声符号化装置の駆動音源生成部31の構成を示すブロック図である。この音声符号化装置は、上記実施の形態9の図16に示す音声符号化装置の駆動音源生成部31より、信号加算器134、雑音生成部136を削除したものである。また、この発明の実施の形態10による音声復号装置の構成を示すブロック図は上記実施の形態8の図15と同じである。
図19は代数符号帳131,71の構成と最小誤差探索部16による探索の際に選択されたセグメントとそのセグメントにおけるパルス情報と信号加算器135により加算された選択されなかったセグメントにおける雑音信号を示す図である。図19において、セグメント1,2は上記実施の形態1の図2に示すサブバンド1,2と同じであり、セグメント3,4は上記実施の形態9の図17に示すセグメント3,4と同じである。このように、代数符号帳31の各セグメントは、上記実施の形態9のように、同じ帯域幅で同じ時間幅である必要はなく、図19に示すように、異なる帯域幅で異なる時間幅で非等間隔に分割されたセグメントが混在した代数符号帳131,71を使用しても良い。
図19の例では、セグメント1が選択されたとし、選択されなかったセグメント4の代わりに、信号加算器135が雑音生成部137により生成されたセグメント4に対応する白色雑音等の雑音信号を追加している。
図20はこの発明の実施の形態10による音声符号化装置の他の駆動音源生成部31の構成を示すブロック図である。図20に示す駆動音源生成部31は図18に示す駆動音源生成部31のセレクタ部132、信号加算器135、雑音生成部137、帯域合成フィルタバンク部115を、帯域合成フィルタバンク部138、セレクタ部139、信号加算器140、雑音生成部141に置き換えたもので、その他の構成は図18と同じである。
図20において、帯域合成フィルタバンク部138は、セレクタ部133により選択されたセグメントと選択されなかったセグメント(零信号)を帯域合成し、セレクタ部139は、最小誤差探索部16の指示に基づき、代数符号帳131のセグメント1,2又は帯域合成フィルタバンク部138の出力を選択する。雑音生成部141は、代数符号帳131のセグメント1〜4に対応する例えば白色雑音等の雑音信号を生成し、信号加算器140は、最小誤差探索部16の指示に基づき、セレクタ部133,139により選択されなかったセグメントに対応する雑音生成部141により生成されて雑音信号を加算する。
図21は代数符号帳131,71の別の構成を示す図であり、図20に示す駆動音源生成部31は図21に示す代数符号帳131を使用して駆動音源信号を生成する。このように、代数符号帳131として、各セグメントは同じ帯域幅で同じ時間幅である必要はなく、図21に示すように、異なる帯域幅で異なる時間幅で非等間隔に分割されたセグメントが混在した代数符号帳131を使用しても良い。
以上のように、この実施の形態10によれば、上記実施の形態9と同様の効果が得られる。
実施の形態11.
図22はこの発明の実施の形態11による音声符号化装置の構成を示すブロック図である。この音声符号化装置は、上記実施の形態1の図1に示す音声符号化装置の駆動音源生成部11に雑音性判定部119を追加し、図1に示す最小誤差探索部16を最小誤差探索部16bとしたもので、その他の構成は図1に示すものと同じである。また、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じである。
図22において、雑音性判定部119は、入力された音声信号の状態に応じて最小誤差探索部16の指示により利得符号帳113から利得乗算器116に出力される利得値と所定のしきい値に基づき入力された音声信号の雑音性判定を行い、利得乗算器116に出力される利得値が所定のしきい値より大きい場合には非雑音性(有声)区間と判定し、利得乗算器116に出力される利得が所定のしきい値より小さい場合には雑音性(無声、無音)区間と判定する。
最小誤差探索部16bは、代数符号帳112における各サブバンド1代数符号帳112a、サブバンド2代数符号帳112b、サブバンド3代数符号帳112c、サブバンド4代数符号帳112dに対する固有の重み付け係数を保持し、雑音性判定部119の判定結果に応じて、これらの重み付け係数を適応的に変更して、計算した歪値に変更した重み係数を乗じて探索処理を行う。
すなわち、雑音性判定部119が雑音性(無声、無音)区間と判定した場合には、最小誤差探索部16bは、例えば高域のサブバンド4代数符号帳112dに与えられる重み付け係数の値を、他のサブバンドに与えられる重み付け係数よりも小さくして、計算した歪値に変更した重み係数を乗じることにより、高域のサブバンド4代数符号帳112dの候補を選択され易いように制御して探索処理を行う。
一方、雑音性判定部119が非雑音性(有声)区間と判定した場合には、最小誤差探索部16bは、保持している各サブバンドの重み付け係数を変更せずに、計算した歪値に保持している重み係数をそのまま乗じることにより探索処理を行う。
この実施の形態11では、上記実施の形態1の図1に示す音声符号化装置の駆動音源生成部11に雑音性判定部119を追加し、図1に示す最小誤差探索部16を最小誤差探索部16bとしているが、上記実施の形態8の図13に示す音声符号化装置の駆動音源生成部31に雑音性判定部119を追加し、図13に示す最小誤差探索部16を最小誤差探索部16bとして、雑音性判定部119が雑音性(無声、無音)区間と判定した場合に、高域側のセグメントが選択されやすくなるよう、高域側のセグメントの誤差評価を甘くしても良い。
以上のように、この実施の形態11によれば、上記実施の形態1と同様の効果が得られると共に、通常選択されにくい高域側のサブバンドも選択されやすくなるよう、高域側のサブバンドの誤差評価を甘くすることでスペクトルを高域に拡散し、雑音性(無声、無音)区間での音声品質を改善することができ、多様なスペクトル包絡成分を持つ音声信号にも対応することができるという効果が得られる。
実施の形態12.
この発明の実施の形態12による音声符号化装置の構成を示すブロック図は上記実施の形態1の図1と同じであり、音声復号装置の構成を示すブロック図は上記実施の形態1の図3と同じであるが、この実施の形態12では、上記実施の形態2と同様に、セレクタ部114が複数のサブバンドを選択する。
図23は代数符号帳112,54の構成と最小誤差探索部16による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。上記実施の形態2の例では、図4に示すように、セレクタ部114はサブバンド1及びサブバンド3のそれぞれ2個のパルスを選択しているが、この実施の形態12では、セレクタ部114が複数のサブバンド代数符号帳の選択が許容されている場合に、複数のサブバンド代数符号帳毎に割り当てるビット数を変えても良い。
例えば、図23に示すように、サブバンド2代数符号帳112bはパルス数1本、サブバンド3代数符号帳112cはパルス数3本を割り当てることで、合成音声信号と入力音声信号との歪み量が最小になるのであれば、これを許容する。ビット割り当ての情報は、選択情報に盛り込み音声復号装置へ伝送することで、音声復号装置でも同様の代数符号帳成分信号を再生することができる。
この実施の形態12では、上記実施の形態1の代数符号帳112の各サブバンドに割り当てるビット数を変えているが、上記実施の形態8の代数符号帳131の各セグメントに割り当てるビット数を変えても良い。
以上のように、この実施の形態12によれば、上記実施の形態2と同様の効果が得られると共に、異なる周波数成分の駆動音源信号を適応的に配分することができ、音声品質の改善を行うことができるという効果が得られる。
実施の形態13.
図24はこの発明の実施の形態13による音声符号化装置の構成を示すブロック図である。図24に示す音声符号化装置は、上記実施の形態1の図1に示す駆動音源生成部11の代数符号帳112のサブバンド符号帳1代数符号帳112a、サブバンド符号帳2代数符号帳112b、サブバンド符号帳3代数符号帳112c及びサブバンド符号帳4代数符号帳112dを、サブバンド符号帳1代数符号帳112e及びサブバンド符号帳2代数符号帳112fに置き換え、セレクタ部114を削除し、パルス数配分制御部123を追加したものであり、その他の構成は図1と同じである。
上記実施の形態1では代数符号帳112を4つのサブバンドで構成しているが、この実施の形態13では、低域側のサブバンド符号帳1代数符号帳112eと高域側のサブバンド符号帳2代数符号帳112fの2つで構成し、最小誤差探索部16による探索時には、常にこの2つのサブバンドを選択するものとする。そのため、図1のセレクタ部114は不要であり、選択情報の送信も不要である。
パルス数配分制御部123は、代数符号帳112のサブバンド符号帳1代数符号帳112e及びサブバンド符号帳2代数符号帳112fで使用するパルス数を、常に低域側で多くするよう制御し、帯域合成フィルタバンク部115からは低域側にパワーの大きい代数符号帳成分信号が出力される。すなわち、上記実施の形態1では、最小誤差探索部16による探索の際に、各サブバンドの最適なパルス数と最適なパルス位置とその極性を探索しているが、この実施の形態13では、音声信号パワーが低域側に偏っている特徴を生かして、パルス数配分制御部123により常に低域サブバンドのビット割り当てを多くするよう制御し、最小誤差探索部16による探索では最適なパルス位置と極性のみを探索する。このような構成をとることにより、最小誤差探索部16による探索の際の演算量を少なくすることができる。
図25は代数符号帳112の構成と最小誤差探索部16による探索の際に選択されたパルス情報を示す図である。図25の例では、代数符号帳112は周波数軸上で等間隔に複数の2つのサブバンドに分割した構成となっており、サブバンド1代数符号帳112eは0Hz〜3.2kHz帯域成分を表現し、サブバンド2代数符号帳112fは3.2kHz〜6.4kHz帯域成分を表現し、パルス数配分制御部123は低域側のサブバンド1代数符号帳112eに3本のパルスを割り当て、高域側のサブバンド2代数符号帳112fに1本のパルスを割り当てている。
図26はこの発明の実施の形態13による音声復号装置の構成を示すブロック図である。図26に示す音声復号装置は、上記実施の形態1の図3に示す代数符号帳54のサブバンド符号帳1代数符号帳54a、サブバンド符号帳2代数符号帳54b、サブバンド符号帳3代数符号帳54c及びサブバンド符号帳4代数符号帳54dを、サブバンド符号帳1代数符号帳54e及びサブバンド符号帳2代数符号帳54fに置き換え、セレクタ部55を削除し、パルス数配分制御部63を追加したものであり、その他の構成は図3と同じである。
代数符号帳54は、音声符号化装置の代数符号帳112と同様の構成で、低域側のサブバンド符号帳3代数符号帳54c及び高域側のサブバンド符号帳4代数符号帳54dを備えている。
パルス数配分制御部63は、音声符号化装置のパルス数配分制御部123と同様に、代数符号帳54のサブバンド符号帳1代数符号帳54e及びサブバンド符号帳2代数符号帳54fで使用するパルス数を、常に低域側で多くするよう制御する。すなわち、パルス数配分制御部63は多重分離部51により分離されたパルス情報を低域側のサブバンド符号帳3代数符号帳54cに多く割り当て、帯域合成フィルタバンク部56からは低域側にパワーの大きい代数符号帳成分信号が出力される。
以上のように、この実施の形態13によれば、上記実施の形態12と同様の効果が得られると共に、パルス数配分制御部123,63が各サブバンドで使用するパルス数を制御することにより、最小誤差探索部16による探索の際の演算量を少なくすることができるという効果が得られる。
実施の形態14.
図27はこの発明の実施の形態14による音声符号化装置の構成を示すブロック図である。図27に示す音声符号化装置は、上記実施の形態1の図1に示す駆動音源生成部11のセレクタ部114を削除し、パルス数配分制御部123とパルス数配分計算部18を追加したものであり、その他の構成は図1と同じである。
パルス数配分計算部18は、スペクトル分析・量子化部12により得られた入力された音声信号のスペクトル分析結果に基づき、代数符号帳112の各サブバンドで使用するパルス数の配分を、スペクトルパワーの大きいサブバンドのビット割り当てが多くなるように計算する。
パルス数配分制御部123は、パルス数配分計算部18により計算された各サブバンドのパルス数の配分に基づき、代数符号帳112のサブバンド符号帳1代数符号帳112a、サブバンド符号帳2代数符号帳112b、サブバンド符号帳3代数符号帳112c、サブバンド符号帳4代数符号帳112dで使用するパルス数を制御し、帯域合成フィルタバンク部115からは入力された音声信号のスペクトルに対応した代数符号帳成分信号が出力される。
このように、代数符号帳112のどのサブバンドを使用するかは、入力された音声信号のスペクトルにより決定されるので、上記実施の形態1の図1に示すセレクタ部114は不要であり、選択情報の送信も不要である。
図28はこの発明の実施の形態14による音声復号装置の構成を示すブロック図である。図28に示す音声復号装置は、上記実施の形態1の図3に示す音声復号装置からセレクタ部55を削除し、パルス数配分計算部64とパルス数配分制御部63を追加したものであり、その他の構成は図3と同じである。
パルス数配分計算部18は、スペクトル情報復号部52により得られた音声信号のスペクトルに基づき、代数符号帳54の各サブバンドで使用するパルス数の配分を、スペクトルパワーの大きいサブバンドのビット割り当てが多くなるように計算する。
パルス数配分制御部63は、パルス数配分計算部64により計算された各サブバンドのパルス数の配分に基づき、代数符号帳54のサブバンド符号帳1代数符号帳54a、サブバンド符号帳2代数符号帳54b、サブバンド符号帳3代数符号帳54c、サブバンド符号帳4代数符号帳54dで使用するパルス数を制御し、帯域合成フィルタバンク部56からは送信された音声信号のスペクトルに対応した代数符号帳成分信号が出力される。
この実施の形態14では、入力された音声信号のスペクトルにより代数符号帳112のどのサブバンドを使用するかを決定しているが、入力された音声信号のスペクトルにより上記実施の形態8の図13に示す代数符号帳131のどのセグメントを使用するかを決定するように構成しても良い。
以上のように、この実施の形態14によれば、上記実施の形態13と同様の効果が得られる。
実施の形態15.
図29はこの発明の実施の形態15による音声符号化装置の構成を示すブロック図である。図29に示す音声符号化装置は、上記実施の形態1の図1に示す音声符号化装置の代数符号帳112のサブバンド4代数符号帳112dを、サブバンド4雑音符号帳112gに置き換えたもので、その他の構成は図1と同じである。なお、音声復号装置でも、図3の代数符号帳54のサブバンド4代数符号帳54dの代りにサブバンド4雑音符号帳を備えているものとする。
サブバンド4雑音符号帳112gは白色雑音等をベースとした雑音符号帳である。音声信号の母音部の駆動音源信号については、低域側はスパース性があるため、パルスをベースとした代数符号帳でモデル化するのが良いとされているが、高域になればなるほどスパース性が薄れる傾向にあり、代数符号帳よりも白色雑音等をベースとした雑音符号帳を使用する方が復号音声品質の改善を行うことができる。
この実施の形態15では、代数符号帳112にサブバンド雑音符号帳を備えているが、上記実施の形態8の図13に示す代数符号帳131にセグメント雑音符号帳を備えるように構成しても良い。
以上のように、この実施の形態15によれば、上記実施の形態1と同様の効果が得られると共に、各サブバンドに最適な形態の符号帳を割り当てることにより、復号音声品質の改善を行うことができるという効果が得られる。
実施の形態16.
この発明の実施の形態16による音声符号化装置の構成を示すブロック図は上記実施の形態13の図24と同じである。また、この発明の実施の形態16による音声復号装置の構成を示すブロック図は上記実施の形態13の図26と同じである。上記実施の形態13では、最適な代数符号帳112の探索処理の際に各サブバンドのビット割り当てを制御することにより、探索の際の演算量を少なくしているが、この実施の形態16では、さらに探索の際の演算量を少なくするものである。
図30は音声符号化装置の第1段階の代数符号帳112の探索処理を説明する図で、図31は音声符号化装置の第2段階の代数符号帳112の探索処理を説明する図である。
第1段階では、図30に示すように、最小誤差探索部16の指示に基づき、低域側のサブバンド1代数符号帳112eの探索処理を実行する。このとき、帯域合成フィルタバンク部115はサブバンド1代数符号帳112eからの代数符号帳成分信号と、高域側のサブバンド2代数符号帳112fからの代数符号帳成分信号の零信号とを帯域合成する。最小誤差探索部16は、探索の結果、サブバンド1代数符号帳112eの最適なパルス情報1を多重化部17に出力する。
第2段階では、図31に示すように、最小誤差探索部16の指示に基づき、高域側のサブバンド2代数符号帳112fの探索処理を実行する。このとき、帯域合成フィルタバンク部115はサブバンド2代数符号帳112fからの代数符号帳成分信号と、第1段階で探索されたサブバンド1代数符号帳112eからの代数符号帳成分信号とを帯域合成する。最小誤差探索部16は、探索の結果、サブバンド2代数符号帳112fの最適なパルス情報2を多重化部17に出力する。
例えば、サブバンド1代数符号帳112eの候補数がm、サブバンド2代数符号帳112fの候補数がnとすると、上記実施の形態13で総当たりで探索を行った場合は、(m×n)の候補について探索を行わねばならないが、この実施の形態16では、(m+n)の候補について探索すれば良く、探索の際の演算量を少なくすることができる。
この実施の形態16では、代数符号帳112について、所定のサブバンドについて探索処理を行い、その探索結果を用いて他のサブバンドについて探索処理を行っているが、上記実施の形態8の図13に示す代数符号帳131について、所定のセグメントについて探索処理を行い、その探索結果を用いて他のセグメントについて探索処理を行うよう構成しても良い。
以上のように、この実施の形態16によれば、上記実施の形態13と同様の効果が得られると共に、代数符号帳112の探索の際に、所定のサブバンドについて探索処理を行い、その探索結果を用いて他のサブバンドについて探索処理を行うことにより、さらに、探索の際の演算量を少なくすることができるという効果が得られる。
実施の形態17.
図32はこの発明の実施の形態17による音声符号化装置の第1段階の代数符号帳112の探索処理を説明する図で、図33は音声符号化装置の第2段階の代数符号帳112の探索処理を説明する図である。また、この発明の実施の形態17による音声復号装置の構成を示すブロック図は上記実施の形態13の図26と同じである。図32及び図33に示す音声符号化装置は、上記実施の形態13の図24に示す音声符号化装置に、スペクトルピーク計算部19とスイッチ124を追加したものであり、その他の構成は図24と同じである。上記実施の形態16では、低域側のサブバンドから探索を開始しているが、この実施の形態17では、入力された音声信号のスペクトル包絡情報に基づき探索開始のサブバンドを決定する。
図32において、スペクトルピーク計算部19は、スペクトル分析・量子化部12によるスペクトル分析結果に基づき、入力された音声信号のスペクトルについて、そのエネルギーが最大となる周波数がどのサブバンドに属するかを判定し、スイッチ124をエネルギーが最大となる周波数が属するサブバンド側に切り換える。図32の例では、エネルギーが最大となる周波数がサブバンド1に属している場合であり、スイッチ124がサブバンド1代数符号帳112e側に切り換えられている。
探索処理の第1段階では、図32に示すように、最小誤差探索部16の指示に基づき、低域側のサブバンド1代数符号帳112eの探索処理を実行する。このとき、帯域合成フィルタバンク部115はサブバンド1代数符号帳112eからの代数符号帳成分信号と、高域側のサブバンド2代数符号帳112fからの代数符号帳成分信号の零信号とを帯域合成する。最小誤差探索部16は、探索の結果、サブバンド1代数符号帳112eの最適なパルス情報1を多重化部17に出力する。
探索処理の第2段階では、図33に示すように、スイッチ124がサブバンド2代数符号帳112f側に切り換えられ、最小誤差探索部16の指示に基づき、高域側のサブバンド2代数符号帳112fの探索処理を実行する。このとき、帯域合成フィルタバンク部115はサブバンド2代数符号帳112fからの代数符号帳成分信号と、第1段階で探索されたサブバンド1代数符号帳112eからの代数符号帳成分信号とを帯域合成する。最小誤差探索部16は、探索の結果、サブバンド2代数符号帳112fの最適なパルス情報2を多重化部17に出力する。
この実施の形態17では、代数符号帳112について、入力された音声信号のスペクトル包絡情報に基づき探索開始のサブバンドを決定しているが、上記実施の形態8の図13に示す代数符号帳131について、入力された音声信号のスペクトル包絡情報に基づき探索開始のセグメントを決定するように構成しても良い。
以上のように、この実施の形態17によれば、上記実施の形態16と同様の効果が得られる
実施の形態18.
図34はこの発明の実施の形態18による音声符号化装置の第1段階の代数符号帳112の探索処理を説明する図で、図35は音声符号化装置の第2段階の代数符号帳112の探索処理を説明する図である。また、この発明の実施の形態18による音声復号装置の構成を示すブロック図は上記実施の形態13の図26と同じである。図34及び図35に示す音声符号化装置は、上記実施の形態13の図24に示す音声符号化装置に、探索パルス情報格納部125を追加したもので、その他の構成は図24と同じである。
探索処理の第1段階では、図34に示すように、最小誤差探索部16の指示に基づき、低域側のサブバンド1代数符号帳112eの探索処理を実行する。このとき、帯域合成フィルタバンク部115はサブバンド1代数符号帳112eからの代数符号帳成分信号と、高域側のサブバンド2代数符号帳112fからの代数符号帳成分信号の零信号とを帯域合成する。最小誤差探索部16は、探索の結果、サブバンド1代数符号帳112eの最適なパルス情報1を多重化部17に出力すると共に、最適なパルス情報1を含めた歪の小さい順に上位複数分のパルス情報を探索パルス情報格納部125に格納する。
探索処理の第2段階では、図35に示すように、最小誤差探索部16の指示に基づき、高域側のサブバンド2代数符号帳112fの探索処理を実行する。このとき、帯域合成フィルタバンク部115はサブバンド2代数符号帳112fからの代数符号帳成分信号と、第1段階で探索された探索パルス情報格納部125に格納されているパルス情報とを帯域合成する。この帯域合成は探索パルス情報格納部125に格納されている複数のパルス情報について行われる。最小誤差探索部16は、探索の結果、サブバンド2代数符号帳112fの最適なパルス情報2を多重化部17に出力する。
上記実施の形態16では、低域側のサブバンド1代数符号帳112eの1つの探索結果に基づき、高域側のサブバンド2代数符号帳112fの探索を実行しているが、この実施の形態18では、低域側のサブバンド1代数符号帳112eの探索結果について、歪が小さい順に上位複数分残して、高域側のサブバンド2代数符号帳112fの探索を実行することにより、上記実施の形態16より若干演算量が増えるものの、上記実施の形態16で探索から除外してしまっていた有力候補が残る可能性が高くなるため、音声品質の改善が期待できる。
この実施の形態18では、代数符号帳112について、所定のサブバンドの探索を開始し、歪が小さい複数の探索結果を用いて他のサブバンドの探索を行っているが、上記実施の形態8の図13に示す代数符号帳131について、所定のセグメントの探索を開始し、歪が小さい複数の探索結果を用いて他のセグメントの探索を行うよう構成しても良い。
以上のように、この実施の形態18によれば、上記実施の形態13と同様の効果が得られると共に、探索処理の第1段階の探索結果を歪が小さい順に上位複数分使用して、第2段階の探索処理を実行することにより、復号音声品質の改善を行うことができるという効果が得られる。
この発明の実施の形態1による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態1による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。 この発明の実施の形態1による音声復号装置の構成を示すブロック図である。 この発明の実施の形態2による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。 この発明の実施の形態3による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。 この発明の実施の形態4による音声符号化装置の駆動音源生成部の構成を示すブロック図である。 この発明の実施の形態4による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。 この発明の実施の形態4による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。 この発明の実施の形態5による音声符号化装置の駆動音源生成部の構成を示すブロック図である。 この発明の実施の形態6による音声符号化装置の駆動音源生成部の構成を示すブロック図である。 この発明の実施の形態6による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報と雑音生成部により生成された選択されなかったサブバンドにおける雑音信号を示す図である。 この発明の実施の形態7による音声符号化装置の駆動音源生成部の構成を示すブロック図である。 この発明の実施の形態8による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態8による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたセグメントとそのセグメントにおけるパルス情報を示す図である。 この発明の実施の形態8による音声復号装置の構成を示すブロック図である。 この発明の実施の形態9による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態9による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたセグメントとそのセグメントにおけるパルス情報と信号加算器により加算された選択されなかったセグメントにおける雑音信号を示す図である。 この発明の実施の形態10による音声符号化装置の駆動音源生成部の構成を示すブロック図である。 この発明の実施の形態10による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたセグメントとそのセグメントにおけるパルス情報と信号加算器により加算された選択されなかったセグメントにおける雑音信号を示す図である。 この発明の実施の形態10による音声符号化装置の他の駆動音源生成部の構成を示すブロック図である。 この発明の実施の形態10による音声符号化装置の代数符号帳の別の構成を示す図である。 この発明の実施の形態11による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態12による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたサブバンドとそのサブバンドにおけるパルス情報を示す図である。 この発明の実施の形態13による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態13による音声符号化装置の代数符号帳の構成と最小誤差探索部による探索の際に選択されたパルス情報を示す図である。 この発明の実施の形態13による音声復号装置の構成を示すブロック図である。 この発明の実施の形態14による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態14による音声復号装置の構成を示すブロック図である。 この発明の実施の形態15による音声符号化装置の構成を示すブロック図である。 この発明の実施の形態16による音声符号化装置の第1段階の代数符号帳の探索処理を説明する図である。 この発明の実施の形態16による音声符号化装置の第2段階の代数符号帳の探索処理を説明する図である。 この発明の実施の形態17による音声符号化装置の第1段階の代数符号帳の探索処理を説明する図である。 この発明の実施の形態17による音声符号化装置の第2段階の代数符号帳の探索処理を説明する図である。 この発明の実施の形態18による音声符号化装置の第1段階の代数符号帳の探索処理を説明する図である。 この発明の実施の形態18による音声符号化装置の第2段階の代数符号帳の探索処理を説明する図である。
符号の説明
11 駆動音源生成部、12 スペクトル分析・量子化部、13 合成フィルタ部、14 加算器、15 聴覚重み付けフィルタ部、16 最小誤差探索部、17 多重化部、18 パルス数配分計算部、19 スペクトルピーク計算部、31 駆動音源生成部、51 多重分離部、52 スペクトル情報復号部、53 適応符号帳、54 代数符号帳、54a サブバンド1代数符号帳、54b サブバンド2代数符号帳、54c サブバンド3代数符号帳、54d サブバンド4代数符号帳、55 セレクタ部、56 帯域合成フィルタバンク部、57 利得符号帳、58 利得乗算器、59 利得乗算器、60 加算器、61 合成フィルタ部、62 ポストフィルタ部、63 パルス数配分制御部、64 パルス数配分計算部、71 代数符号帳、71a セグメント1代数符号帳、71b セグメント2代数符号帳、71c セグメント3代数符号帳、71d セグメント4代数符号帳、72 セレクタ部、73 セレクタ部、74 信号加算器、75 信号加算器、111 適応符号帳、112 代数符号帳、112a サブバンド1代数符号帳、112b サブバンド2代数符号帳、112c サブバンド3代数符号帳、112d サブバンド4代数符号帳、112e サブバンド1代数符号帳、112f サブバンド2代数符号帳、112g サブバンド4雑音符号帳、113 利得符号帳、114 セレクタ部、115 帯域合成フィルタバンク部、116 利得乗算器、117 利得乗算器、118 加算器、119 雑音性判定部、120 代数符号帳、121 雑音生成部、122a サブバンド1誤差重み付け部、122b サブバンド2誤差重み付け部、122c サブバンド3誤差重み付け部、122d サブバンド4誤差重み付け部、123 パルス数配分制御部、124 スイッチ、125 探索パルス情報格納部、131 代数符号帳、131a セグメント1代数符号帳、131b セグメント2代数符号帳、131c セグメント3代数符号帳、131d セグメント4代数符号帳、132 セレクタ部、133 セレクタ部、134 信号加算器、135 信号加算器、136 雑音生成部、137 雑音生成部、138 帯域合成フィルタバンク部、139 セレクタ部、140 信号加算器、141 雑音生成部。

Claims (31)

  1. 過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、
    周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のサブバンドを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、
    指示された選択情報に基づき上記代数符号帳におけるサブバンドを選択するセレクタ部と、
    上記適応符号帳から出力された適応符号帳成分と上記代数符号帳における選択されたサブバンドから出力された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えた音声符号化・復号装置。
  2. 上記加算器により生成された駆動音源信号から、量子化線形予測係数を用いてフィルタ演算を行い合成音声信号を生成する合成フィルタ部と、
    上記ピッチ情報、上記パルス情報及び上記選択情報を順次出力し、入力された音声信号と上記合成フィルタ部により生成された合成音声信号との差分が最小となる駆動音源信号を探索する最小誤差探索部とを備えた請求項1記載の音声符号化・復号装置。
  3. 入力された音声信号の状態を判定する雑音性判定部を備え、
    上記最小誤差探索部は、上記代数符号帳の各サブバンドに対する重み付け係数を保持し、上記雑音性判定部により判定された入力された音声信号の状態に応じて、保持している重み付け係数を変更して駆動音源信号を探索することを特徴とする請求項2記載の音声符号化・復号装置。
  4. 上記セレクタ部は指示された選択情報に基づき上記代数符号帳における複数のサブバンドを選択し、
    選択された複数のサブバンドから出力された代数符号帳成分信号を合成する帯域合成フィルタバンク部を備えたことを特徴とする請求項1記載の音声符号化・復号装置。
  5. 代数符号帳は指示されたパルス情報に基づき各サブバンドから出力する単位パルス数を変えることを特徴とする請求項4記載の音声符号化・復号装置。
  6. 上記代数符号帳は周波数軸上で非等間隔に分割された複数のサブバンドを有することを特徴とする請求項1記載の音声符号化・復号装置。
  7. 入力された音声信号の状態を判定し、判定した音声信号の状態に応じて上記セレクタ部にサブバンドの選択数を指示する雑音性判定部を備えたことを特徴とする請求項1記載の音声符号化・復号装置。
  8. 複数の単位パルスで構成され、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する全帯域の代数符号帳と、
    入力された音声信号の状態を判定し、判定した音声信号の状態に応じて、上記セレクタ部に上記複数のサブバンドを有する代数符号帳又は上記全帯域の代数符号帳を選択するよう指示する雑音性判定部とを備えたことを特徴とする請求項1記載の音声符号化・復号装置。
  9. 選択されないサブバンドについて上記セレクタ部からの通知を受けて雑音信号を生成する雑音生成部と、
    上記セレクタ部により選択されたサブバンドの代数符号帳成分信号と上記雑音生成部により生成された雑音信号を合成する帯域合成フィルタバンク部とを備えたことを特徴とする請求項1記載の音声符号化・復号装置。
  10. 入力された音声信号の状態を判定し、判定した音声信号の状態に応じて上記雑音生成部に雑音信号の生成を指示する雑音性判定部を備えたことを特徴とする請求項9記載の音声符号化・復号装置。
  11. 代数符号帳は所定のサブバンドについて雑音系列を蓄積した雑音符号帳を有することを特徴とする請求項1記載の音声符号化・復号装置。
  12. 過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、
    周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のサブバンドを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、
    該代数符号帳における複数のサブバンドから出力するパルス数を低域側で多くなるよう制御するパルス数配分制御部と、
    上記代数符号帳における複数のサブバンドから出力された代数符号帳成分信号を合成する帯域合成フィルタバンク部と、
    上記適応符号帳から出力された適応符号帳成分と上記帯域合成フィルタバンク部により合成された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えた音声符号化・復号装置。
  13. 上記加算器により生成された駆動音源信号から、量子化線形予測係数を用いてフィルタ演算を行い合成音声信号を生成する合成フィルタ部と、
    上記ピッチ情報及び上記パルス情報を順次出力し、入力された音声信号と上記合成フィルタ部により生成された合成音声信号との差分が最小となる駆動音源信号を探索する最小誤差探索部とを備えた請求項12記載の音声符号化・復号装置。
  14. 上記最小誤差探索部は、上記代数符号帳における所定のサブバンドについて探索を開始し、その探索結果を用いて他のサブバンドについて探索を行うことを特徴とする請求項13記載の音声符号化・復号装置。
  15. 入力された音声信号のスペクトルに基づき、そのエネルギーが最大となる周波数が属する上記代数符号帳におけるサブバンドを判定するスペクトルピーク計算部を備え、
    上記最小誤差探索部は、上記スペクトルピーク計算部により判定された上記代数符号帳におけるサブバンドについて探索を開始することを特徴とする請求項14記載の音声符号化・復号装置。
  16. 上記代数符号帳における所定のサブバンドについての複数の探索結果を格納する探索パルス情報格納部を備え、
    上記最小誤差探索部は、上記探索パルス情報格納部に格納されている複数の探索結果を用いて他のサブバンドについて探索を行うことを特徴とする請求項14記載の音声符号化・復号装置。
  17. 過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、
    周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のサブバンドを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、
    入力された音声信号のスペクトルパワーに基づき代数符号帳における複数のサブバンドから出力するパルス数を計算するパルス数配分計算部と、
    該パルス数配分計算部により計算されたパルス数に基づき、上記代数符号帳における複数のサブバンドから出力するパルス数を制御するパルス数配分制御部と、
    上記代数符号帳における複数のサブバンドから出力された代数符号帳成分信号を合成する帯域合成フィルタバンク部と、
    上記適応符号帳から出力された適応符号帳成分と上記帯域合成フィルタバンク部により合成された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えた音声符号化・復号装置。
  18. 過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、
    時間軸及び周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のセグメントを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、
    指示された選択情報に基づき上記代数符号帳におけるセグメントを選択するセレクタ部と、
    上記適応符号帳から出力された適応符号帳成分と上記代数符号帳における選択されたサセグメントから出力された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えた音声符号化・復号装置。
  19. 上記加算器により生成された駆動音源信号から、量子化線形予測係数を用いてフィルタ演算を行い合成音声信号を生成する合成フィルタ部と、
    上記ピッチ情報及び上記パルス情報を順次出力し、入力された音声信号と上記合成フィルタ部により生成された合成音声信号との差分が最小となる駆動音源信号を探索する最小誤差探索部とを備えた請求項18記載の音声符号化・復号装置。
  20. 入力された音声信号の状態を判定する雑音性判定部を備え、
    上記最小誤差探索部は、上記代数符号帳の各セグメントに対する重み付け係数を保持し、上記雑音性判定部により判定された入力された音声信号の状態に応じて、保持している重み付け係数を変更して駆動音源信号を探索することを特徴とする請求項19記載の音声符号化・復号装置。
  21. 上記セレクタ部は指示された選択情報に基づき上記代数符号帳における複数のセグメントを選択し、
    選択された複数のセグメントから出力された代数符号帳成分信号を合成する帯域合成フィルタバンク部を備えたことを特徴とする請求項18記載の音声符号化・復号装置。
  22. 代数符号帳は指示されたパルス情報に基づき各セグメントから出力する単位パルス数を変えることを特徴とする請求項21記載の音声符号化・復号装置。
  23. 雑音信号を生成する雑音生成部と、
    選択されないセグメントについて上記セレクタ部からの通知を受けて、選択されたセグメントの代数符号帳成分信号と上記雑音生成部により生成された雑音信号を加算する信号加算器とを備えたことを特徴とする請求項18記載の音声符号化・復号装置。
  24. 上記代数符号帳は時間軸上又は周波数軸上で非等間隔に分割された複数のセグメントを有することを特徴とする請求項18記載の音声符号化・復号装置。
  25. 代数符号帳は所定のセグメントについて雑音系列を蓄積した雑音符号帳を有することを特徴とする請求項18記載の音声符号化・復号装置。
  26. 過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、
    時間軸上及び周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のセグメントを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、
    該代数符号帳における複数のセグメントから出力するパルス数を低域側で多くなるよう制御するパルス数配分制御部と、
    上記代数符号帳における複数のセグメントから出力された代数符号帳成分信号を合成する帯域合成フィルタバンク部と、
    上記適応符号帳から出力された適応符号帳成分と上記帯域合成フィルタバンク部により合成された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えた音声符号化・復号装置。
  27. 上記加算器により生成された駆動音源信号から、量子化線形予測係数を用いてフィルタ演算を行い合成音声信号を生成する合成フィルタ部と、
    上記ピッチ情報及び上記パルス情報を順次出力し、入力された音声信号と上記合成フィルタ部により生成された合成音声信号との差分が最小となる駆動音源信号を探索する最小誤差探索部とを備えた請求項26記載の音声符号化・復号装置。
  28. 上記最小誤差探索部は、上記代数符号帳における所定のセグメントについて探索を開始し、その探索結果を用いて他のセグメントについて探索を行うことを特徴とする請求項27記載の音声符号化・復号装置。
  29. 入力された音声信号のスペクトルに基づき、そのエネルギーが最大となる周波数が属する上記代数符号帳におけるセグメントを判定するスペクトルピーク計算部を備え、
    上記最小誤差探索部は、上記スペクトルピーク計算部により判定された上記代数符号帳におけるセグメントについて探索を開始することを特徴とする請求項28記載の音声符号化・復号装置。
  30. 上記代数符号帳における所定のセグメントについての複数の探索結果を格納する探索パルス情報格納部を備え、
    上記最小誤差探索部は、上記探索パルス情報格納部に格納されている複数の探索結果を用いて他のセグメントについて探索を行うことを特徴とする請求項28記載の音声符号化・復号装置。
  31. 過去に生成された駆動音源信号を蓄積し、指示されたピッチ情報に基づき駆動音源信号の適応符号帳成分を出力する適応符号帳と、
    時間軸上及び周波数軸上で分割されそれぞれ複数の単位パルスで構成された複数のセグメントを有し、指示されたパルス情報に基づき単位パルスを駆動音源信号の代数符号帳成分信号として出力する代数符号帳と、
    入力された音声信号のスペクトルパワーに基づき代数符号帳における複数のセグメントから出力するパルス数を計算するパルス数配分計算部と、
    該パルス数配分計算部により計算されたパルス数に基づき、上記代数符号帳における複数のセグメントから出力するパルス数を制御するパルス数配分制御部と、
    上記代数符号帳における複数のセグメントから出力された代数符号帳成分信号を合成する帯域合成フィルタバンク部と、
    上記適応符号帳から出力された適応符号帳成分と上記帯域合成フィルタバンク部により合成された代数符号帳成分信号により駆動音源信号を生成する加算器とを備えた音声符号化・復号装置。
JP2005368585A 2005-12-21 2005-12-21 音声符号化・復号装置 Active JP4727413B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005368585A JP4727413B2 (ja) 2005-12-21 2005-12-21 音声符号化・復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005368585A JP4727413B2 (ja) 2005-12-21 2005-12-21 音声符号化・復号装置

Publications (2)

Publication Number Publication Date
JP2007171519A true JP2007171519A (ja) 2007-07-05
JP4727413B2 JP4727413B2 (ja) 2011-07-20

Family

ID=38298170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005368585A Active JP4727413B2 (ja) 2005-12-21 2005-12-21 音声符号化・復号装置

Country Status (1)

Country Link
JP (1) JP4727413B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4764956B1 (ja) * 2011-02-08 2011-09-07 パナソニック株式会社 音声符号化装置及び音声符号化方法
WO2013057895A1 (ja) * 2011-10-19 2013-04-25 パナソニック株式会社 符号化装置及び符号化方法
WO2013061531A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP2014109669A (ja) * 2012-11-30 2014-06-12 Kddi Corp 音声合成装置、音声合成方法および音声合成プログラム
JPWO2013129439A1 (ja) * 2012-02-28 2015-07-30 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113799A (ja) * 1991-08-30 1993-05-07 Oki Electric Ind Co Ltd コード励振線形予測符号化方式
JPH10340098A (ja) * 1997-04-09 1998-12-22 Nec Corp 信号符号化装置
JP2002523806A (ja) * 1998-08-24 2002-07-30 コネクサント システムズ, インコーポレイテッド 雑音補償のための音声分類を採用した音声コーデック
JP2003029798A (ja) * 2001-07-13 2003-01-31 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113799A (ja) * 1991-08-30 1993-05-07 Oki Electric Ind Co Ltd コード励振線形予測符号化方式
JPH10340098A (ja) * 1997-04-09 1998-12-22 Nec Corp 信号符号化装置
JP2002523806A (ja) * 1998-08-24 2002-07-30 コネクサント システムズ, インコーポレイテッド 雑音補償のための音声分類を採用した音声コーデック
JP2003029798A (ja) * 2001-07-13 2003-01-31 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4764956B1 (ja) * 2011-02-08 2011-09-07 パナソニック株式会社 音声符号化装置及び音声符号化方法
WO2013057895A1 (ja) * 2011-10-19 2013-04-25 パナソニック株式会社 符号化装置及び符号化方法
WO2013061531A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JPWO2013061531A1 (ja) * 2011-10-28 2015-04-02 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US9786292B2 (en) 2011-10-28 2017-10-10 Panasonic Intellectual Property Corporation Of America Audio encoding apparatus, audio decoding apparatus, audio encoding method, and audio decoding method
JPWO2013129439A1 (ja) * 2012-02-28 2015-07-30 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
JP2014109669A (ja) * 2012-11-30 2014-06-12 Kddi Corp 音声合成装置、音声合成方法および音声合成プログラム

Also Published As

Publication number Publication date
JP4727413B2 (ja) 2011-07-20

Similar Documents

Publication Publication Date Title
JP3134817B2 (ja) 音声符号化復号装置
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
RU2586841C2 (ru) Многорежимный аудио кодировщик и celp кодирование, адаптированное к нему
RU2420817C2 (ru) Системы, способы и устройство для ограничения коэффициента усиления
TW497335B (en) Method and apparatus for variable rate coding of speech
EP0926660B1 (en) Speech encoding/decoding method
US20070088543A1 (en) Multimode speech coding apparatus and decoding apparatus
JP2006189836A (ja) 広域音声符号化システム及び広域音声復号化システム、高域音声符号化及び高域音声復号化装置、並びにその方法
WO2001015144A1 (fr) Vocodeur et procede correspondant
NO339287B1 (no) Subbånds talekodek med flertrinns kodebok og redundant koding
JP4727413B2 (ja) 音声符号化・復号装置
JP4789430B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
KR102138320B1 (ko) 통신 시스템에서 신호 코덱 장치 및 방법
JP3558031B2 (ja) 音声復号化装置
JPH04344699A (ja) 音声符号化・復号化方法
JP3353852B2 (ja) 音声の符号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3579276B2 (ja) 音声符号化/復号化方法
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP5084360B2 (ja) 音声符号化装置及び音声復号装置
JP6001451B2 (ja) 符号化装置及び符号化方法
JP4619549B2 (ja) マルチモード音声復号化装置及びマルチモード音声復号化方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080626

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110405

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110413

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250