JP2001242898A - 音声符号化装置及び音声復号化装置 - Google Patents

音声符号化装置及び音声復号化装置

Info

Publication number
JP2001242898A
JP2001242898A JP2000049867A JP2000049867A JP2001242898A JP 2001242898 A JP2001242898 A JP 2001242898A JP 2000049867 A JP2000049867 A JP 2000049867A JP 2000049867 A JP2000049867 A JP 2000049867A JP 2001242898 A JP2001242898 A JP 2001242898A
Authority
JP
Japan
Prior art keywords
sound source
combination
excitation
information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000049867A
Other languages
English (en)
Other versions
JP3907906B2 (ja
Inventor
Tadashi Yamaura
正 山浦
Hirohisa Tazaki
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000049867A priority Critical patent/JP3907906B2/ja
Publication of JP2001242898A publication Critical patent/JP2001242898A/ja
Application granted granted Critical
Publication of JP3907906B2 publication Critical patent/JP3907906B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 各音源番号毎の位置候補をフレーム内に均等
に分布させている。したがって、その位置候補を低ビッ
トレート化するためにはパルス数を減らすか、または、
各音源番号毎の位置候補数を均等間隔で間引くしかない
ため、局所的にパルスが集中するような駆動音源信号を
生成することができず、符号化特性の劣化を起こす課題
があった。 【解決手段】 複数の音源位置の全組合せのうち、使用
頻度が基準頻度より高い音源位置の組合せを示す情報が
記述された音源位置組合せテーブル41,51から音源
位置の組合せを選択し、その音源位置の組合せを用いて
入力音声の音源情報を符号化又は復号化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ディジタル音声
信号を少ない情報量に圧縮する音声符号化装置、その音
声符号化装置等により生成された音声符号を復号化して
ディジタル音声信号を再生する音声復号化装置に関する
ものである。
【0002】
【従来の技術】従来の多くの音声符号化装置及び音声復
号化装置では、音声符号化装置が入力音声をスペクトル
包絡情報と音源情報に分けて、所定長区間のフレーム単
位で各々を符号化して音声符号を生成し、音声復号化装
置がこの音声符号を復号化して、合成フィルタによって
スペクトル包絡情報と音源情報を合わせることで復号音
声を生成するようにしている。最も代表的な音声符号化
装置及び音声復号化装置としては、符号駆動線形予測符
号化(Code−Excited LinearPre
diction:CELP)方式を用いたものがある。
【0003】図17は従来のCELP方式を用いる音声
符号化装置を示す構成図であり、図において、1は入力
音声を分析して、その入力音声のスペクトル包絡情報で
ある線形予測係数を抽出する線形予測分析手段、2は線
形予測分析手段1により抽出された線形予測係数を符号
化する線形予測係数符号化手段、3は線形予測係数符号
化手段2により量子化された線形予測係数を用いて仮の
合成音を生成し、仮の合成音と入力音声の距離が最小に
なる適応音源符号を選択して多重化手段6に出力すると
ともに、その適応音源符号に対応する適応音源信号(過
去の所定長の音源信号が周期的に繰り返された時系列ベ
クトル)をゲイン符号化手段5に出力する適応音源符号
化手段、4は線形予測係数符号化手段2により量子化さ
れた線形予測係数を用いて仮の合成音を生成し、仮の合
成音と符号化対象信号(入力音声から適応音源信号によ
る合成音を差し引いた信号)の距離が最小になる駆動音
源符号を選択して多重化手段6に出力するとともに、そ
の駆動音源符号に対応する時系列ベクトルである駆動音
源信号をゲイン符号化手段5に出力する駆動音源符号化
手段である。
【0004】5は適応音源符号化手段3から出力された
適応音源信号と駆動音源符号化手段4から出力された駆
動音源信号にゲインベクトルの各要素を乗算し、各乗算
結果を相互に加算して音源信号を生成する一方、線形予
測係数符号化手段2により量子化された線形予測係数を
用いて、その音源信号から仮の合成音を生成し、仮の合
成音と入力音声の距離が最小になるゲイン符号を選択し
て多重化手段6に出力するゲイン符号化手段、6は線形
予測係数符号化手段2により符号化された線形予測係数
の符号と、適応音源符号化手段3から出力された適応音
源符号と、駆動音源符号化手段4から出力された駆動音
源符号と、ゲイン符号化手段5から出力されたゲイン符
号とを多重化して、音声符号を出力する多重化手段であ
る。
【0005】図18は従来のCELP方式を用いる音声
復号化装置を示す構成図であり、図において、11は音
声符号化装置から出力された音声符号を分離して、線形
予測係数の符号を線形予測係数復号化手段12に出力
し、適応音源符号を適応音源復号化手段13に出力し、
駆動音源符号を駆動音源復号化手段14に出力し、ゲイ
ン符号をゲイン復号化手段15に出力する分離手段、1
2は分離手段11から出力された線形予測係数を復号化
し、その復号結果を合成フィルタ19のフィルタ係数に
変換して、そのフィルタ係数を合成フィルタ19に出力
する線形予測係数復号化手段である。
【0006】13は分離手段11から出力された適応音
源符号に対応する適応音源信号(過去の音源信号が周期
的に繰り返された時系列ベクトル)を出力する適応音源
復号化手段、14は分離手段11から出力された駆動音
源符号に対応する時系列ベクトルである駆動音源信号を
出力する駆動音源復号化手段、15は分離手段11から
出力されたゲイン符号に対応するゲインベクトルを出力
するゲイン復号化手段である。
【0007】16はゲイン復号化手段15から出力され
たゲインベクトルの要素を適応音源復号化手段13から
出力された適応音源信号に乗算する乗算器、17はゲイ
ン復号化手段15から出力されたゲインベクトルの要素
を駆動音源復号化手段14から出力された駆動音源信号
に乗算する乗算器、18は乗算器16の乗算結果と乗算
器17の乗算結果を加算して音源信号を生成する加算
器、19は加算器18により生成された音源信号に対す
る合成フィルタリング処理を実行して出力音声を生成す
る合成フィルタである。
【0008】次に動作について説明する。従来の音声符
号化装置及び音声復号化装置では、5〜50ms程度を
1フレームとして、フレーム単位で処理を行う。
【0009】まず、音声符号化装置の線形予測分析手段
1は、音声を入力すると、その入力音声を分析して、音
声のスペクトル包絡情報である線形予測係数を抽出す
る。線形予測係数符号化手段2は、線形予測分析手段1
が線形予測係数を抽出すると、その線形予測係数を符号
化し、その符号を多重化手段6に出力する。また、その
符号に対応する量子化された線形予測係数を適応音源符
号化手段3,駆動音源符号化手段4及びゲイン符号化手
段5に出力する。
【0010】適応音源符号化手段3は、過去の所定長の
音源信号を記憶する適応音源符号帳を内蔵し、内部で発
生させる各適応音源符号(適応音源符号は数ビットの2
進数値で示される)に応じて、過去の音源信号が周期的
に繰り返された時系列ベクトルを生成する。次に、各時
系列ベクトルに適切なゲインを乗じた後、線形予測係数
符号化手段2により量子化された線形予測係数を用いる
合成フィルタに各時系列ベクトルを通すことにより、仮
の合成音を生成する。
【0011】そして、適応音源符号化手段3は、仮の合
成音と入力音声との距離を調査し、この距離を最小とす
る適応音源符号を選択して多重化手段6に出力するとと
もに、その選択した適応音源符号に対応する時系列ベク
トルを適応音源信号として、ゲイン符号化手段5に出力
する。また、入力音声から適応音源信号による合成音を
差し引いた信号を符号化対象信号として、駆動音源符号
化手段4に出力する。
【0012】駆動音源符号化手段4は、非雑音的又は雑
音的な複数の時系列ベクトルである駆動符号ベクトルを
格納する駆動音源符号帳を内蔵し、内部で発生させる各
駆動音源符号(駆動音源符号は数ビットの2進数値で示
される)に応じて、その駆動音源符号帳から時系列ベク
トルの読み出しを順次実行する。次に、各時系列ベクト
ルに適切なゲインを乗じた後、線形予測係数符号化手段
2により量子化された線形予測係数を用いる合成フィル
タに各時系列ベクトルを通すことにより、仮の合成音を
生成する。
【0013】そして、駆動音源符号化手段4は、仮の合
成音と、適応音源符号化手段3から出力された符号化対
象信号との距離を調査し、この距離を最小とする駆動音
源符号を選択して多重化手段6に出力するとともに、そ
の選択した駆動音源符号に対応する時系列ベクトルを駆
動音源信号として、ゲイン符号化手段5に出力する。
【0014】ゲイン符号化手段5は、ゲインベクトルを
格納するゲイン符号帳を内蔵し、内部で発生させる各ゲ
イン符号(ゲイン符号は数ビットの2進数値で示され
る)に応じて、そのゲイン符号帳からゲインベクトルの
読み出しを順次実行する。そして、各ゲインベクトルの
要素を、適応音源符号化手段3から出力された適応音源
信号と、駆動音源符号化手段4から出力された駆動音源
信号にそれぞれ乗算し、各乗算結果を相互に加算して音
源信号を生成する。次に、その音源信号を線形予測係数
符号化手段2により量子化された線形予測係数を用いる
合成フィルタに通すことにより、仮の合成音を生成す
る。
【0015】そして、ゲイン符号化手段5は、仮の合成
音と入力音声との距離を調査し、この距離を最小とする
ゲイン符号を選択して多重化手段6に出力する。また、
そのゲイン符号に対応する音源信号を適応音源符号化手
段3に出力する。これにより、適応音源符号化手段3
は、ゲイン符号化手段5により選択されたゲイン符号に
対応する音源信号を用いて、内蔵する適応音源符号帳の
更新を行う。
【0016】多重化手段6は、線形予測係数符号化手段
2により符号化された線形予測係数と、適応音源符号化
手段3から出力された適応音源符号と、駆動音源符号化
手段4から出力された駆動音源符号と、ゲイン符号化手
段5から出力されたゲイン符号とを多重化し、その多重
化結果である音声符号を音声復号化装置に出力する。
【0017】音声復号化装置の分離手段11は、音声符
号化装置が音声符号を出力すると、その音声符号を分離
して、線形予測係数の符号を線形予測係数復号化手段1
2に出力し、適応音源符号を適応音源復号化手段13に
出力し、駆動音源符号を駆動音源復号化手段14に出力
し、ゲイン符号をゲイン復号化手段15に出力する。線
形予測係数復号化手段12は、分離手段11から線形予
測係数の符号を受けると、その符号を復号化し、その復
号結果を合成フィルタ19のフィルタ係数に変換して、
そのフィルタ係数を合成フィルタ19に出力する。
【0018】適応音源復号化手段13は、過去の所定長
の音源信号を記憶する適応音源符号帳を内蔵し、分離手
段11から出力された適応音源符号に対応する適応音源
信号(過去の音源信号が周期的に繰り返された時系列ベ
クトル)を出力する。また、駆動音源復号化手段14
は、非雑音的又は雑音的な複数の時系列ベクトルである
駆動符号信号を格納する駆動音源符号帳を内蔵し、分離
手段11から出力された駆動音源符号に対応する駆動音
源信号を出力する。ゲイン復号化手段15は、ゲインベ
クトルを格納するゲイン符号帳を内蔵し、分離手段11
から出力されたゲイン符号に対応するゲインベクトルを
出力する。
【0019】そして、適応音源復号化手段13から出力
された適応音源信号と駆動音源復号化手段14から出力
された駆動音源信号は、乗算器16,17により当該ゲ
インベクトルの要素が乗算され、加算器18により乗算
器16,17の乗算結果が相互に加算される。
【0020】合成フィルタ19は、加算器18の加算結
果である音源信号に対する合成フィルタリング処理を実
行して出力音声を生成する。なお、フィルタ係数として
は、線形予測係数復号化手段12により復号化された線
形予測係数を用いる。最後に、適応音源復号化手段13
は、上記音源信号を用いて、内蔵する適応音源符号帳の
更新を行う。
【0021】次に、上述した音声符号化装置及び音声復
号化装置の改良が図られた従来の技術について説明す
る。片岡章俊、林伸二、守谷健弘、栗原祥子、間野一則
「CS−ACELPの基本アルゴリズム」NTT R&
D,Vol.45,pp.325−330,1996年
4月(文献1)には、演算量とメモリ量の削減を主な目
的として、駆動音源の符号化にパルス音源を導入したC
ELP系の音声符号化装置及び音声復号化装置が開示さ
れている。この従来の構成では、駆動音源を数本のパル
スの各位置情報と極性情報のみで表現している。このよ
うな音源は代数的音源と呼ばれ、構造が簡単な割に符号
化特性がよく、最近の多くの標準方式に採用されてい
る。
【0022】図19は文献1で用いられているパルス音
源の位置候補を示す音源位置テーブルであり、図17の
音声符号化装置では駆動音源符号化手段4、図18の音
声復号化装置では駆動音源復号化手段14に搭載され
る。文献1では、音源符号化フレーム長が40サンプル
であり、駆動音源は4つのパルスで構成されている。音
源番号1から音源番号3のパルス音源の位置候補は、図
19に示すように各々8つの位置に制約されており、パ
ルス位置は各々3bitで符号化できる。音源番号4の
パルスは16の位置に制約されており、パルス位置は4
bitで符号化できる。パルス音源の位置候補に制約を
与えることにより、符号化特性の劣化を抑えつつ、符号
化ビット数の削減、組合せ数の削減による演算量の削減
を実現している。
【0023】この代数的音源の品質を維持して低ビット
レート化を図る構成が、大室、間野「高速パルス探索型
4kbit/s音声符号化」日本音響学会、1999年
春季研究発表会講演論文集I、211〜212頁(文献
2)に開示されている。
【0024】図20は文献2で用いられているものと同
様なパルス音源の位置候補と極性を示す音源位置・極性
テーブルである。これは効率的に符号化ビット数を削減
するために、隣接する音源位置における極性が反対とな
るように、音源の位置候補毎に採り得る極性に制約を与
えるものである。
【0025】また、別の代数的音源の品質を改善する構
成が、Tadashi Amada,Kimio Mi
seki and Masami Akamine
“CELP speech coding based
on an adaptive pulse pos
ition codebook” 1999 IEEE
International Conference
on Acoustics,Speech,and S
ignal Processing,vol.I,p
p.13−16(Mar 1999)(文献3)及び土
屋、天田、三関「適応パルス位置ACELP音声符号化
の改善」日本音響学会、1999年春季研究発表会講演
論文集I、213〜214頁(文献4)に開示されてい
る。
【0026】文献3では、適応音源信号の振幅包絡の大
きさが大きいところにパルス音源の位置候補が集まるよ
うにフレーム毎に適応的にパルス音源の位置候補を設定
するようにしている。これにより符号化特性が改善する
ことが示されている。
【0027】文献4は文献3の改良に相当する。駆動音
源信号(文献4中ではACELP音源)の生成部にピッ
チフィルタを内包させたときには、最初の1ピッチ周期
の区間の音源位置が選択されやすい傾向があり、そのと
きにピッチ逆フィルタ処理を行った適応音源信号の振幅
包絡の大きさに基づいて、フレーム毎に適応的にパルス
音源の位置候補を設定するようにしている。
【0028】
【発明が解決しようとする課題】従来の音声符号化装置
及び音声復号化装置(文献1)は以上のように構成され
ているので、各音源番号毎の位置候補をフレーム内に均
等に分布させている。したがって、その位置候補を低ビ
ットレート化するためにはパルス数を減らすか、また
は、各音源番号毎の位置候補数を均等間隔で間引くしか
ないため、局所的にパルスが集中するような駆動音源信
号を生成することができず、符号化特性の劣化を起こす
課題があった。
【0029】文献2では、この特性劣化を抑制する音源
の位置候補と極性に関して効率的な制約のつけ方を開示
しているが、この制約は隣接する音源位置における極性
を反対にするといったヒューリスティックなルールに基
づくものであり、また、これ以外の音源位置と極性の関
係は一切採り得ないとしているので、自然発声した音声
が常にこのルールに当てはまる訳がなく、このルールに
当てはまらない場合には大きな品質劣化を招く課題があ
った。
【0030】文献3及び文献4では、この特性劣化を抑
制する適応的な間引き方法を開示しているが、入力音声
の周期性が乱れたり変化する時には、適応的な間引きを
行うことでむしろ大きな特性劣化を起こす課題があっ
た。また、この適応的な間引き処理は、通信路での符号
伝送誤りによって適応音源信号が正しく生成されない場
合、駆動音源信号にまで影響が及ぶという課題があっ
た。
【0031】また、文献4では、駆動音源信号の生成部
にピッチフィルタを内包させる場合、最初の1ピッチ周
期の区間に音源位置候補を集中させることで平均的な特
性改善を達成しているが、聴感的に最も重要な音声の立
上り区間などでは、むしろフレーム後半が重要な場合が
あり、フレーム後半が良好に再現できずに特性劣化を引
き起こして、聞いた印象ではむしろ品質劣化を起こす課
題があった。
【0032】この発明は上記のような課題を解決するた
めになされたもので、特性の劣化を招くことなく、低ビ
ットレート化を図ることができる音声符号化装置及び音
声復号化装置を得ることを目的とする。
【0033】
【課題を解決するための手段】この発明に係る音声符号
化装置は、音源符号化手段が複数の音源位置の全組合せ
のうち、音源位置の組合せに関する評価値が基準値より
高い音源位置の組合せを示す情報が記述されたインデッ
クステーブルから任意の音源位置の組合せを選択し、そ
の音源位置の組合せを用いて入力音声の音源情報を符号
化するようにしたものである。
【0034】この発明に係る音声符号化装置は、インデ
ックステーブルに記述されている音源位置の組合せを示
す情報が、個別に符号化された音源位置の組合せ情報で
あるようにしたものである。
【0035】この発明に係る音声符号化装置は、音源符
号化手段が少なくとも評価値が基準値より高い音源位置
の組合せを含む音源位置の組合せを認識することが可能
な場合、インデックステーブルに記述されている音源位
置の組合せを示す情報が、音源位置の各組合せがインデ
ックステーブルの要素であるか否かを示すフラグ情報で
あるようにしたものである。
【0036】この発明に係る音声符号化装置は、音源符
号化手段がフレーム長と音源数とインデックス数から少
なくとも評価値が基準値より高い音源位置の組合せを含
む音源位置の組合せを認識するようにしたものである。
【0037】この発明に係る音声符号化装置は、音源符
号化手段が音源位置及び極性から構成された複数の対デ
ータの全組合せのうち、対データの組合せに関する評価
値が基準値より高い対データの組合せを示す情報が記述
されたインデックステーブルから任意の対データの組合
せを選択し、その対データの組合せを用いて入力音声の
音源情報を符号化するようにしたものである。
【0038】この発明に係る音声符号化装置は、インデ
ックステーブルに記述されている対データの組合せを示
す情報が、個別に符号化された対データの組合せ情報で
あるようにしたものである。
【0039】この発明に係る音声符号化装置は、音源符
号化手段が少なくとも評価値が基準値より高い対データ
の組合せを含む対データの組合せを認識することが可能
な場合、インデックステーブルに記述されている対デー
タの組合せを示す情報が、対データの各組合せがインデ
ックステーブルの要素であるか否かを示すフラグ情報で
あるようにしたものである。
【0040】この発明に係る音声符号化装置は、音源符
号化手段がフレーム長と音源数とインデックス数から少
なくとも評価値が基準値より高い対データの組合せを含
む対データの組合せを認識するようにしたものである。
【0041】この発明に係る音声符号化装置は、音源符
号化手段が記述内容が相互に異なるインデックステーブ
ルを複数個有し、任意のインデックステーブルを選択し
て使用するようにしたものである。
【0042】この発明に係る音声符号化装置は、音源符
号化手段が入力音声を分析して所定のパラメータを抽出
し、そのパラメータに対応するインデックステーブルを
選択するようにしたものである。
【0043】この発明に係る音声符号化装置は、音源符
号化手段がスペクトル包絡情報および音源情報の少なく
ともどちらか一方から所定のパラメータを抽出し、その
パラメータに対応するインデックステーブルを選択する
ようにしたものである。
【0044】この発明に係る音声復号化装置は、音源復
号化手段が複数の音源位置の全組合せのうち、音源位置
の組合せに関する評価値が基準値より高い音源位置の組
合せを示す情報が記述されたインデックステーブルから
音源情報に含まれている組合せを示す符号に基づいて音
源位置の組合せを選択し、その音源位置の組合せを用い
て入力音声の音源情報を復号化するようにしたものであ
る。
【0045】この発明に係る音声復号化装置は、インデ
ックステーブルに記述されている音源位置の組合せを示
す情報が、個別に符号化された音源位置の組合せ情報で
あるようにしたものである。
【0046】この発明に係る音声復号化装置は、音源復
号化手段が少なくとも評価値が基準値より高い音源位置
の組合せを含む音源位置の組合せを認識することが可能
な場合、インデックステーブルに記述されている音源位
置の組合せを示す情報が、音源位置の各組合せがインデ
ックステーブルの要素であるか否かを示すフラグ情報で
あるようにしたものである。
【0047】この発明に係る音声復号化装置は、音源復
号化手段がフレーム長と音源数とインデックス数から少
なくとも評価値が基準値より高い音源位置の組合せを含
む音源位置の組合せを認識するようにしたものである。
【0048】この発明に係る音声復号化装置は、音源復
号化手段が音源位置及び極性から構成された複数の対デ
ータの全組合せのうち、対データの組合せに関する評価
値が基準値より高い対データの組合せを示す情報が記述
されたインデックステーブルから音源情報に含まれてい
る組合せを示す符号に基づいて対データの組合せを選択
し、その対データの組合せを用いて入力音声の音源情報
を復号化するようにしたものである。
【0049】この発明に係る音声復号化装置は、インデ
ックステーブルに記述されている対データの組合せを示
す情報が、個別に符号化された対データの組合せ情報で
あるようにしたものである。
【0050】この発明に係る音声復号化装置は、音源復
号化手段が少なくとも評価値が基準値より高い対データ
の組合せを含む対データの組合せを認識することが可能
な場合、インデックステーブルに記述されている対デー
タの組合せを示す情報が、対データの各組合せがインデ
ックステーブルの要素であるか否かを示すフラグ情報で
あるようにしたものである。
【0051】この発明に係る音声復号化装置は、音源復
号化手段がフレーム長と音源数とインデックス数から少
なくとも評価値が基準値より高い対データの組合せを含
む対データの組合せを認識するようにしたものである。
【0052】この発明に係る音声復号化装置は、音源復
号化手段が記述内容が相互に異なるインデックステーブ
ルを複数個有し、音源情報に含まれている選択情報を示
す符号に対応するインデックステーブルを選択して使用
するようにしたものである。
【0053】この発明に係る音声復号化装置は、音源復
号化手段が記述内容が相互に異なるインデックステーブ
ルを複数個有し、スペクトル包絡情報および音源情報の
少なくともどちらか一方から所定のパラメータを抽出
し、そのパラメータに対応するインデックステーブルを
選択して使用するようにしたものである。
【0054】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による音
声符号化装置を示す構成図であり、図において、21は
入力音声を分析して、その入力音声のスペクトル包絡情
報である線形予測係数を抽出する線形予測分析手段、2
2は線形予測分析手段21により抽出された線形予測係
数を符号化する線形予測係数符号化手段である。なお、
線形予測分析手段21及び線形予測係数符号化手段22
から包絡情報符号化手段が構成されている。
【0055】23は線形予測係数符号化手段22により
量子化された線形予測係数を用いて仮の合成音を生成
し、仮の合成音と入力音声の距離が最小になる適応音源
符号(音源情報)を選択して多重化手段26に出力する
とともに、その適応音源符号に対応する適応音源信号
(過去の所定長の音源信号が周期的に繰り返された時系
列ベクトル)をゲイン符号化手段25に出力する適応音
源符号化手段、24は線形予測係数符号化手段22によ
り量子化された線形予測係数を用いて仮の合成音を生成
し、仮の合成音と符号化対象信号(入力音声から適応音
源信号による合成音を差し引いた信号)の距離が最小に
なる駆動音源符号(音源情報)を選択して多重化手段2
6に出力するとともに、その駆動音源符号に対応する時
系列ベクトルである駆動音源信号をゲイン符号化手段2
5に出力する駆動音源符号化手段である。
【0056】25は適応音源符号化手段23から出力さ
れた適応音源信号と駆動音源符号化手段24から出力さ
れた駆動音源信号にゲインベクトルの各要素を乗算し、
各乗算結果を相互に加算して音源信号を生成する一方、
線形予測係数符号化手段22により量子化された線形予
測係数を用いて、その音源信号から仮の合成音を生成
し、仮の合成音と入力音声の距離が最小になるゲイン符
号(音源情報)を選択して多重化手段26に出力するゲ
イン符号化手段である。なお、適応音源符号化手段2
3,駆動音源符号化手段24及びゲイン符号化手段25
から音源符号化手段が構成されている。
【0057】26は線形予測係数符号化手段22により
符号化された線形予測係数の符号と、適応音源符号化手
段23から出力された適応音源符号と、駆動音源符号化
手段24から出力された駆動音源符号と、ゲイン符号化
手段25から出力されたゲイン符号とを多重化して、音
声符号を出力する多重化手段である。
【0058】図2はこの発明の実施の形態1による音声
復号化装置を示す構成図であり、図において、31は音
声符号化装置から出力された音声符号を分離して、線形
予測係数の符号を線形予測係数復号化手段32に出力
し、適応音源符号を適応音源復号化手段33に出力し、
駆動音源符号を駆動音源復号化手段34に出力し、ゲイ
ン符号をゲイン復号化手段35に出力する分離手段、3
2は分離手段31から出力された線形予測係数を復号化
し、その復号結果を合成フィルタ39のフィルタ係数に
変換して、そのフィルタ係数を合成フィルタ39に出力
する線形予測係数復号化手段(包絡情報復号化手段)で
ある。
【0059】33は分離手段31から出力された適応音
源符号に対応する適応音源信号(過去の音源信号が周期
的に繰り返された時系列ベクトル)を出力する適応音源
復号化手段、34は分離手段31から出力された駆動音
源符号に対応する時系列ベクトルである駆動音源信号を
出力する駆動音源復号化手段、35は分離手段31から
出力されたゲイン符号に対応するゲインベクトルを出力
するゲイン復号化手段である。
【0060】36はゲイン復号化手段35から出力され
たゲインベクトルの要素を適応音源復号化手段33から
出力された適応音源信号に乗算する乗算器、37はゲイ
ン復号化手段35から出力されたゲインベクトルの要素
を駆動音源復号化手段34から出力された駆動音源信号
に乗算する乗算器、38は乗算器36の乗算結果と乗算
器37の乗算結果を加算して、音源信号を生成する加算
器、39は加算器38により生成された音源信号に対す
る合成フィルタリング処理を実行して出力音声を生成す
る合成フィルタである。なお、適応音源復号化手段3
3,駆動音源復号化手段34,ゲイン復号化手段35,
乗算器36,37,加算器38及び合成フィルタ39か
ら音源復号化手段が構成されている。
【0061】図3は音声符号化装置における駆動音源符
号化手段24の内部を示す構成図であり、図において、
41は複数の音源位置の全組合せのうち、使用頻度(音
源位置の組合せに関する評価値)が基準頻度(基準値)
より高い音源位置の組合せを示す情報が記述された音源
位置組合せテーブル(インデックステーブル)、42は
音源位置組合せテーブル41から任意の音源位置の組合
せを選択し、その音源位置の組合せと適正な極性を用い
て入力音声の駆動音源情報を符号化する代数的音源符号
化手段である。
【0062】図4は音声復号化装置における駆動音源復
号化手段34の内部を示す構成図であり、図において、
51は複数の音源位置の全組合せのうち、使用頻度(音
源位置の組合せに関する評価値)が基準頻度(基準値)
より高い音源位置の組合せを示す情報が記述された音源
位置組合せテーブル(インデックステーブル)、52は
音源位置組合せテーブル51から駆動音源符号に含まれ
ている音源位置符号(組合せを示す符号)に基づいて音
源位置の組合せを選択し、その音源位置の組合せと極性
(極性を特定する情報は駆動音源符号に含まれている)
を用いて入力音声の音源情報を復号化する代数的音源復
号化手段である。
【0063】次に動作について説明する。音声符号化装
置及び音声復号化装置では、5〜50ms程度を1フレ
ームとして、フレーム単位で処理を行う。
【0064】まず、音声符号化装置の線形予測分析手段
21は、音声を入力すると、その入力音声を分析して、
音声のスペクトル包絡情報である線形予測係数を抽出す
る。線形予測係数符号化手段22は、線形予測分析手段
21が線形予測係数を抽出すると、その線形予測係数を
符号化し、その符号を多重化手段26に出力する。ま
た、その符号に対応する量子化された線形予測係数を適
応音源符号化手段23,駆動音源符号化手段24及びゲ
イン符号化手段25に出力する。
【0065】適応音源符号化手段23は、過去の所定長
の音源信号を記憶する適応音源符号帳を内蔵し、内部で
発生させる各適応音源符号(適応音源符号は数ビットの
2進数値で示される)に応じて、過去の音源信号が周期
的に繰り返された時系列ベクトルを生成する。次に、各
時系列ベクトルに適切なゲインを乗じた後、線形予測係
数符号化手段22により量子化された線形予測係数を用
いる合成フィルタに各時系列ベクトルを通すことによ
り、仮の合成音を生成する。
【0066】そして、適応音源符号化手段23は、仮の
合成音と入力音声との距離を調査し、この距離を最小と
する適応音源符号を選択して多重化手段26に出力する
とともに、その選択した適応音源符号に対応する時系列
ベクトルを適応音源信号として、ゲイン符号化手段25
に出力する。また、入力音声から適応音源信号による合
成音を差し引いた信号を符号化対象信号として、駆動音
源符号化手段24に出力する。
【0067】駆動音源符号化手段24は、適応音源符号
化手段23から符号化対象信号を入力すると、音源位置
組合せテーブル41から任意の音源位置の組合せ(パル
ス音源の位置候補の組合せ)を選択し、そのパルス音源
の位置候補の組合せと適正な極性を用いて入力音声の駆
動音源情報を符号化する。具体的には以下に示す通りで
ある。
【0068】まず、駆動音源符号化手段24の音源位置
組合せテーブル41には、例えば、図19に示すパルス
音源の位置候補の全組合せの中から使用頻度が高い組合
せ(基準頻度より高い組合せ)のみを所望数抽出するな
どして、複数のパルス音源の位置候補の組合せが記述さ
れている(図5を参照)。代数的音源において、符号化
に用いられるパルス音源の位置候補の組合せは全組合せ
が均等に出現するわけではなく、その発生の頻度には偏
りがあり、発生頻度が低い組合せを一切使用しないとし
ても合成音の品質に与える影響は小さい。この特性を利
用してパルス音源の位置候補の組合せに制約を与えるこ
とにより、符号化特性の劣化を抑えつつ、代数的音源に
要する符号化ビット数を削減する。
【0069】音源位置組合せテーブル41の情報を記憶
する方法として、例えば、図6に示すように、各インデ
ックスに対する各音源番号の音源位置を2進数で表現す
るなど、直接的に、パルス音源の位置候補を表す情報を
符号化して記憶する方法がある。この様に構成すると、
例えば、図19に示すパルス音源の位置候補の全組合せ
から、位置候補の組合せを抽出して音源位置組合せテー
ブル41を作成した場合、各パルス音源の位置候補の組
合せは13bitで表現できるので、これをインデック
スの個数(ここでは、インデックスの個数をN個とす
る)分、記憶するためには、(13×N)bitの記憶
領域が必要となる。例えば、N=512の場合は665
6bit、N=1024の場合は13312bitとな
るなど、使用する音源位置組合せテーブル41の大きさ
によって必要な記憶容量が異なる。
【0070】音源位置組合せテーブル41の情報を記憶
する別の方法として、例えば、図7に示すように、少な
くとも音源位置組合せテーブル41の全ての要素を含む
ように構成された第2の音源位置組合せテーブルにおけ
る各位置候補の組合せに対して、音源位置組合せテーブ
ル41の要素であるか否かを示すフラグ情報を1bit
で表現するなど、直接的には、パルス音源の位置候補を
表す情報を記憶するのではなく、パルス音源の位置候補
の組合せの使用の可否を記憶する方法がある。この様に
構成すると、例えば、図19に示すパルス音源の位置候
補の全組合せから、位置候補の組合せを抽出して音源位
置組合せテーブル41を作成した場合、全組合せ数(8
192個)に対して使用する/使用しないを1bitで
表すので、8192bitの記憶領域が必要となる。こ
の場合、音源位置組合せテーブル41のインデックス数
Nに依らず必要な記憶領域は一定である。
【0071】なお、図19に示すような代数的音源構造
に基づくパルス音源の位置候補の全組合せは、フレーム
長とパルス数とインデックス数から演算により求めるこ
とができるので、実際にはテーブルとして持つ必要はな
く、記憶領域は不要である。
【0072】上述したように、音源位置組合せテーブル
41の情報を記憶する方法は複数あり、インデックス数
Nと必要な記憶容量との関係が異なるので、インデック
ス数Nに応じて、より記憶容量が小さい方法を選択すれ
ば、メモリやハードディスクなどの記憶装置の規模を小
さくできるなど、効率的な装置化が可能となる。
【0073】駆動音源符号化手段24の代数的音源符号
化手段42は、音源位置組合せテーブル41に格納され
ているパルス音源の位置候補の組合せを順次読み出し
て、各位置候補に任意の極性でパルスを立てたときの仮
の合成音を生成する。そして、適応音源符号化手段23
から出力された符号化対象信号と仮の合成音との距離
(信号の誤差)を計算して、その距離を最小にするパル
ス音源の位置候補の組合せと極性を探索する。代数的音
源符号化手段42は、その探索が完了すると、その探索
結果であるパルス音源の位置候補の組合せを表す音源位
置符号と極性とを、駆動音源符号として多重化手段26
に出力するとともに、この駆動音源符号に対応する時系
列ベクトルを、駆動音源信号としてゲイン符号化手段2
5に出力する。
【0074】この代数的音源符号化手段42における探
索動作は、文献1に示されている駆動音源符号化手段と
同様に行う。また、文献1に示されているように駆動音
源の生成部の最終段にピッチフィルタを導入する。即
ち、各パルス音源の位置候補にパルスを配置した信号に
ピッチフィルタを施して駆動音源信号とし、これに対す
る仮の合成音を生成する。そして、各位置候補毎の仮の
合成音同士の相関と、各位置候補毎の仮の合成音と符号
化対象信号の相関を計算し、これらの相関を用いて各位
置候補毎の極性の決定と位置探索を高速に行う。
【0075】その結果として、パルス音源の位置候補の
組合せと各音源の極性が得られる。パルス音源の位置候
補の組合せは、例えば、音源位置組合せテーブル41に
おける組合せに対するインデックスを2進数で表現する
など、対応した符号に変換され、最終的な音源位置符号
として出力される。代数的音源は、その構造から探索動
作に要する演算量が少ないことが知られているが、その
代数的音源の構造を保ちつつ探索すべき音源位置の組合
せ数を減らすことにより、更なる演算量削減効果を得る
ことができる。
【0076】上記のようにして、駆動音源符号化手段2
4が駆動音源信号を出力すると、ゲイン符号化手段25
は、内部で発生させる各ゲイン符号(ゲイン符号は数ビ
ットの2進数値で示される)に応じて、ゲイン符号帳か
らゲインベクトルの読み出しを順次実行する。そして、
各ゲインベクトルの要素を、適応音源符号化手段23か
ら出力された適応音源信号と、駆動音源符号化手段24
から出力された駆動音源信号にそれぞれ乗算し、各乗算
結果を相互に加算して音源信号を生成する。次に、その
音源信号を線形予測係数符号化手段22により量子化さ
れた線形予測係数を用いる合成フィルタに通すことによ
り、仮の合成音を生成する。
【0077】そして、ゲイン符号化手段25は、仮の合
成音と入力音声との距離を調査し、この距離を最小とす
るゲイン符号を選択して多重化手段26に出力する。ま
た、そのゲイン符号に対応する音源信号を適応音源符号
化手段23に出力する。これにより、適応音源符号化手
段23は、ゲイン符号化手段25により選択されたゲイ
ン符号に対応する音源信号を用いて、内蔵する適応音源
符号帳の更新を行う。
【0078】多重化手段26は、線形予測係数符号化手
段22により符号化された線形予測係数の符号と、適応
音源符号化手段23から出力された適応音源符号と、駆
動音源符号化手段24から出力された駆動音源符号(音
源位置符号と極性を含む)と、ゲイン符号化手段25か
ら出力されたゲイン符号とを多重化し、その多重化結果
である音声符号を音声復号化装置に出力する。
【0079】次に、音声復号化装置の分離手段31は、
音声符号化装置が音声符号を出力すると、その音声符号
を分離して、線形予測係数の符号を線形予測係数復号化
手段32に出力し、適応音源符号を適応音源復号化手段
33に出力し、駆動音源符号を駆動音源復号化手段34
に出力し、ゲイン符号をゲイン復号化手段35に出力す
る。線形予測係数復号化手段32は、分離手段31から
線形予測係数の符号を受けると、その符号を復号化し、
その復号結果を合成フィルタ39のフィルタ係数に変換
して、そのフィルタ係数を合成フィルタ39に出力す
る。
【0080】適応音源復号化手段33は、過去の所定長
の音源信号を記憶する適応音源符号帳を内蔵し、分離手
段31から出力された適応音源符号に対応する適応音源
信号(過去の音源信号が周期的に繰り返された時系列ベ
クトル)を出力する。
【0081】駆動音源復号化手段34は、分離手段31
から音源位置符号と極性を含む駆動音源符号を受ける
と、代数的音源復号化手段52が音源位置組合せテーブ
ル51(音源位置組合せテーブル41と同一内容がテー
ブル化されている)から、音源位置符号に対応するパル
ス音源の位置候補の組合せを読み出し、各位置候補に前
記極性を付与したパルスを配置した信号にピッチフィル
タを施して駆動音源信号を生成し、その駆動音源信号を
出力する。
【0082】ゲイン復号化手段35は、ゲインベクトル
を格納するゲイン符号帳を内蔵し、分離手段31から出
力されたゲイン符号に対応するゲインベクトルを出力す
る。そして、適応音源復号化手段33から出力された適
応音源信号と駆動音源復号化手段34から出力された駆
動音源信号は、乗算器36,37により当該ゲインベク
トルの要素が乗算され、加算器38により乗算器36,
37の乗算結果が相互に加算される。
【0083】合成フィルタ39は、加算器38の加算結
果である音源信号に対する合成フィルタリング処理を実
行して出力音声を生成する。なお、フィルタ係数として
は、線形予測係数復号化手段32により復号化された線
形予測係数を用いる。最後に、適応音源復号化手段33
は、上記音源信号を用いて、内蔵する適応音源符号帳の
更新を行う。
【0084】以上で明らかなように、この実施の形態1
によれば、複数の音源位置の全組合せのうち、使用頻度
が基準頻度より高い音源位置の組合せを示す情報が記述
された音源位置組合せテーブル41,51から音源位置
の組合せを選択し、その音源位置の組合せを用いて入力
音声の音源情報を符号化又は復号化するように構成した
ので、特性の劣化を招くことなく、低ビットレート化を
図ることができる音声符号化装置及び音声復号化装置が
得られる効果を奏する。
【0085】また、音源位置組合せテーブル41,51
に記述する音源位置の組合せは、その使用頻度により選
択して抽出するなどの統計的な手法によるなど、実際に
入力音声の音源情報を符号化又は復号化するのに則した
方法で構成できるので、ヒューリスティックなルールを
用いた場合のような不自然な制約がなく、低ビットレー
トであっても品質のよい音声符号化装置及び音声復号化
装置が得られる効果を奏する。
【0086】また、固定的な音源位置の組合せを用いて
いるので、通信路での符号伝送誤りに対する強い耐性を
維持しながら、特性を改善することができる効果を奏す
る。
【0087】さらに、複数の音源位置の組合せを音源位
置組合せテーブル41,51に記述する際、各音源位置
を個別に符号化して記述するようにしたので、あるい
は、音源位置組合せテーブル41,51の各要素を第2
の音源位置組合せテーブルの要素とし、第2の音源位置
組合せテーブルの各要素に対する使用の可否を示すフラ
グ情報を記述するようにしたので、インデックス数Nに
応じて必要な記憶容量を小さくすることができ、装置化
規模が小さい効率的な音声符号化装置及び音声復号化装
置が得られる効果を奏する。
【0088】さらに、第2の音源位置組合せテーブルの
音源位置の組合せはフレーム長と音源数とインデックス
数とから生成するようにしたので、これに要する記憶容
量を不要にすることができ、装置化規模が小さい効率的
な音声符号化装置及び音声復号化装置が得られる効果を
奏する。
【0089】なお、この実施の形態1では、駆動音源信
号の生成部にピッチフィルタを導入しているが、これを
駆動音源復号化手段34においてのみ導入したり、駆動
音源符号化手段24と駆動音源復号化手段34の両方で
導入しない構成も可能である。
【0090】また、この実施の形態1では、音源位置の
組合せに関する評価値として使用頻度を用いるものにつ
いて示したが、これに限るものではなく、例えば、符号
化歪み等を小さくする期待値などを音源位置の組合せに
関する評価値として用いるようにしてもよい。この期待
値は、例えば、音源位置の全組合せを用いて学習用音声
データを符号化したときに、各音源位置の組合せ毎に、
それが用いられたときの駆動音源信号成分により減少し
た符号化歪みの総和などとすることができる。
【0091】実施の形態2.図8はこの発明の実施の形
態2による音声符号化装置における駆動音源符号化手段
24の内部を示す構成図であり、図において、43は音
源位置及び極性から構成された複数の対データの全組合
せのうち、使用頻度(対データの組合せに関する評価
値)が基準頻度(基準値)より高い対データの組合せを
示す情報が記述された音源位置・極性組合せテーブル
(インデックステーブル)、44は音源位置・極性組合
せテーブル43から任意の対データの組合せを選択し、
その対データの組合せを用いて入力音声の駆動音源情報
を符号化する代数的音源符号化手段である。
【0092】図9はこの発明の実施の形態2による音声
復号化装置における駆動音源復号化手段34の内部を示
す構成図であり、図において、53は複数の対データの
全組合せのうち、使用頻度(対データの組合せに関する
評価値)が基準頻度(基準値)より高い対データの組合
せを示す情報が記述された音源位置・極性組合せテーブ
ル(インデックステーブル)、54は音源位置・極性組
合せテーブル53から駆動音源符号に含まれている音源
位置・極性符号(組合せを示す符号)に基づいて対デー
タの組合せを選択し、その対データの組合せを用いて入
力音声の音源情報を復号化する代数的音源復号化手段で
ある。
【0093】次に動作について説明する。ただし、駆動
音源符号化手段24及び駆動音源復号化手段34以外は
上記実施の形態1と同様であるため、駆動音源符号化手
段24及び駆動音源復号化手段34の動作のみを説明す
る。
【0094】まず、駆動音源符号化手段24の音源位置
・極性組合せテーブル43には、例えば、図19に示す
パルス音源の位置候補及び各音源の極性の全組合せの中
から使用頻度が高い組合せ(基準頻度より高い組合せ)
のみを所望数抽出するなどして、複数の対データの組合
せが記述されている(図10を参照)。代数的音源にお
いて、符号化に用いられるパルス音源の対データの組合
せは全組合せが均等に出現するわけではなく、その発生
の頻度には偏りがあり、発生頻度が低い組合せを一切使
用しないとしても合成音の品質に与える影響は小さい。
この特性を利用してパルス音源の対データの組合せに制
約を与えることにより、符号化特性の劣化を抑えつつ、
代数的音源に要する符号化ビット数を削減する。
【0095】音源位置・極性組合せテーブル43の情報
を記憶する方法として、例えば、図11に示すように、
各インデックスに対する各音源番号の対データを2進数
で表現するなど、直接的に、パルス音源の対データを表
す情報を符号化して記憶する方法がある。この様に構成
すると、例えば、図19に示すパルス音源の位置候補及
び各音源の極性の全組合せから対データの組合せを抽出
して音源位置・極性組合せテーブル43を作成した場
合、各パルス音源の対データの組合せは17bitで表
現できるので、これをインデックスの個数(ここでは、
インデックスの個数をN個とする)分、記憶するために
は、(17×N)bitの記憶領域が必要となる。例え
ば、N=4096の場合は69632bit、N=81
92の場合は139264bitとなるなど、使用する
音源位置・極性組合せテーブル43の大きさによって必
要な記憶容量が異なる。
【0096】音源位置・極性組合せテーブル43の情報
を記憶する別の方法として、例えば、図12に示すよう
に、少なくとも音源位置・極性組合せテーブル43の全
ての要素を含むように構成された第2の音源位置・極性
組合せテーブルにおける各対データの組合せに対して、
音源位置・極性組合せテーブル43の要素であるか否か
を示すフラグ情報を1bitで表現するなど、直接的に
は、パルス音源の対データを表す情報を記憶するのでは
なく、パルス音源の対データの組合せの使用の可否を記
憶する方法がある。この様に構成すると、例えば、図1
9に示すパルス音源の位置候補及び各音源の極性の全組
合せから、対データの組合せを抽出して音源位置・極性
組合せテーブル43を作成した場合、全組合せ数(13
1072個)に対して使用する/使用しないを1bit
で表すので、131072bitの記憶領域が必要とな
る。この場合、音源位置・極性組合せテーブル43のイ
ンデックス数Nに依らず必要な記憶領域は一定である。
【0097】なお、図19に示すような代数的音源構造
に基づくパルス音源の位置候補及び各音源の極性の全組
合せは、フレーム長とパルス数とインデックス数から演
算により求めることができるので、実際にはテーブルと
して持つ必要はなく、記憶領域は不要である。
【0098】上述したように、音源位置・極性組合せテ
ーブル43の情報を記憶する方法は複数あり、インデッ
クス数Nと必要な記憶容量との関係が異なるので、イン
デックス数Nに応じて、より記憶容量が小さい方法を選
択すれば、メモリやハードディスクなどの記憶装置の規
模を小さくできるなど、効率的な装置化が可能となる。
【0099】駆動音源符号化手段24の代数的音源符号
化手段44は、音源位置・極性組合せテーブル43に格
納されているパルス音源の対データの組合せを順次読み
出して、その対データの各位置候補に対データの各極性
でパルスを立てたときの仮の合成音を生成する。そし
て、適応音源符号化手段23から出力された符号化対象
信号と仮の合成音との距離を計算して、その距離を最小
にするパルス音源の対データの組合せを探索する。代数
的音源符号化手段44は、その探索が完了すると、その
探索結果であるパルス音源の対データの組合せを表す音
源位置・極性符号を、駆動音源符号として多重化手段2
6に出力するとともに、この駆動音源符号に対応する時
系列ベクトルを、駆動音源信号としてゲイン符号化手段
25に出力する。
【0100】この代数的音源符号化手段44における探
索動作は、文献1に示されている駆動音源符号化手段と
同様に行う。また、文献1に示されているように駆動音
源の生成部の最終段にピッチフィルタを導入する。即
ち、各パルス音源の位置候補にパルスを配置した信号に
ピッチフィルタを施して駆動音源信号とし、これに対す
る仮の合成音を生成する。そして、各位置候補毎の仮の
合成音同士の相関と、各位置候補毎の仮の合成音と符号
化対象信号の相関を計算し、これらの相関を用いて対デ
ータの探索を高速に行う。
【0101】その結果として、パルス音源の対データの
組合せが得られる。パルス音源の対データの組合せは、
例えば、音源位置組合せ・極性テーブル43における組
合せに対するインデックスを2進数で表現するなど、対
応した符号に変換され、最終的な音源位置・極性符号と
して出力される。代数的音源は、その構造から探索動作
に要する演算量が少ないことが知られているが、その代
数的音源の構造を保ちつつ探索すべき対データの組合せ
数を減らすことにより、更なる演算量削減効果を得るこ
とができる。
【0102】次に、駆動音源復号化手段34の代数的音
源復号化手段54は、分離手段31から音源位置・極性
符号を受けると、音源位置・極性組合せテーブル53
(音源位置・極性組合せテーブル43と同一内容がテー
ブル化されている)から、音源位置・極性符号に対応す
るパルス音源の対データの組合せを読み出し、その対デ
ータの各位置候補に前記極性を付与したパルスを配置し
た信号にピッチフィルタを施して駆動音源信号を生成
し、その駆動音源信号を出力する。
【0103】以上で明らかなように、この実施の形態2
によれば、複数の対データの全組合せのうち、使用頻度
が基準頻度より高い対データの組合せを示す情報が記述
された音源位置・極性組合せテーブル43,53から対
データの組合せを選択し、その対データの組合せを用い
て入力音声の音源情報を符号化又は復号化するように構
成したので、特性の劣化を招くことなく、低ビットレー
ト化を図ることができる音声符号化装置及び音声復号化
装置が得られる効果を奏する。
【0104】また、音源位置・極性組合せテーブル4
3,53に記述する対データの組合せは、その使用頻度
により選択して抽出するなどの統計的な手法によるな
ど、実際に入力音声の音源情報を符号化又は復号化する
のに則した方法で構成できるので、ヒューリスティック
なルールを用いた場合のような不自然な制約がなく、低
ビットレートであっても品質のよい音声符号化装置及び
音声復号化装置が得られる効果を奏する。
【0105】また、固定的な対データの組合せを用いて
いるので、通信路での符号伝送誤りに対する強い耐性を
維持しながら、特性を改善することができる効果を奏す
る。
【0106】さらに、複数の対データの組合せを音源位
置・極性組合せテーブル43,53に記述する際、各対
データを個別に符号化して記述するようにしたので、あ
るいは、音源位置・極性組合せテーブル43,53の各
要素を第2の音源位置・極性組合せテーブルの要素と
し、第2の音源位置・極性組合せテーブルの各要素に対
する使用の可否を示すフラグ情報を記述するようにした
ので、インデックス数Nに応じて必要な記憶容量を小さ
くすることができ、装置化規模が小さい効率的な音声符
号化装置及び音声復号化装置が得られる効果を奏する。
【0107】さらに、第2の音源位置・極性組合せテー
ブルの対データの組合せはフレーム長と音源数とインデ
ックス数とから生成するようにしたので、これに要する
記憶容量を不要にすることができ、装置化規模が小さい
効率的な音声符号化装置及び音声復号化装置が得られる
効果を奏する。
【0108】なお、この実施の形態2では、駆動音源信
号の生成部にピッチフィルタを導入しているが、これを
駆動音源復号化手段34においてのみ導入したり、駆動
音源符号化手段24と駆動音源復号化手段34の両方で
導入しない構成も可能である。
【0109】また、この実施の形態2では、対データの
組合せに関する評価値として使用頻度を用いるものにつ
いて示したが、これに限るものではなく、例えば、符号
化歪み等を小さくする期待値などを対データの組合せに
関する評価値として用いるようにしてもよい。
【0110】実施の形態3.図13はこの発明の実施の
形態3による音声符号化装置における駆動音源符号化手
段24の内部を示す構成図であり、図において、61は
複数の音源位置の全組合せのうち、有音の立ち上がり区
間で使用頻度が基準頻度より高い音源位置の組合せを示
す情報が記述された音源位置組合せテーブル(インデッ
クステーブル)、62は複数の音源位置の全組合せのう
ち、有音の立ち上がり以外の区間で使用頻度が基準頻度
より高い音源位置の組合せを示す情報が記述された音源
位置組合せテーブル(インデックステーブル)、63は
入力音声を分析して所定のパラメータを抽出し、そのパ
ラメータに対応する音源位置組合せテーブル61(また
は62)を選択する選択手段、64は選択手段63によ
り選択された音源位置組合せテーブル61(または6
2)から任意の音源位置の組合せを選択し、その音源位
置の組合せと適正な極性を用いて入力音声の音源情報を
符号化する代数的音源符号化手段である。
【0111】図14はこの発明の実施の形態3による音
声復号化装置における駆動音源復号化手段34の内部を
示す構成図であり、図において、71は複数の音源位置
の全組合せのうち、有音の立ち上がり区間で使用頻度が
基準頻度より高い音源位置の組合せを示す情報が記述さ
れた音源位置組合せテーブル(インデックステーブ
ル)、72は複数の音源位置の全組合せのうち、有音の
立ち上がり以外の区間で使用頻度が基準頻度より高い音
源位置の組合せを示す情報が記述された音源位置組合せ
テーブル(インデックステーブル)、73は駆動音源符
号に含まれている選択情報を示す符号に対応する音源位
置組合せテーブル71(または72)を選択する選択手
段、74は選択手段73により選択された音源位置組合
せテーブル71(または72)から駆動音源符号に含ま
れている音源位置符号に基づいて音源位置の組合せを選
択し、その音源位置の組合せと極性(極性を特定する情
報は駆動音源符号に含まれている)を用いて入力音声の
音源情報を復号化する代数的音源復号化手段である。
【0112】次に動作について説明する。ただし、駆動
音源符号化手段24及び駆動音源復号化手段34以外は
上記実施の形態1と同様であるため、駆動音源符号化手
段24及び駆動音源復号化手段34の動作のみを説明す
る。
【0113】まず、駆動音源符号化手段24の音源位置
組合せテーブル61には、例えば、図19に示すパルス
音源の位置候補の全組合せの中から有声の立上り区間で
使用頻度が高い組合せ(基準頻度より高い組合せ)のみ
を所望数抽出するなどして、複数のパルス音源の位置候
補の組合せが記述されている。また、音源位置組合せテ
ーブル62には、例えば、図19に示すパルス音源の位
置候補の全組合せの中から有声の立上り以外の区間で使
用頻度が高い組合せ(基準頻度より高い組合せ)のみを
所望数抽出するなどして、複数のパルス音源の位置候補
の組合せが記述されている。
【0114】代数的音源において、符号化に用いられる
パルス音源の位置候補の組合せは全組合せが均等に出現
するわけではなく、その発生の頻度には偏りがあり、発
生頻度が低い組合せを一切使用しないとしても合成音の
品質に与える影響は小さい。例えば、有声の立上り区間
などフレーム後半のパワーがフレーム前半に比較して大
きい場合には、パルス音源の位置候補もフレーム後半に
集中する傾向がある。また、有声の立上り以外の区間で
は、ピッチフィルタを用いることもあり、パルス音源の
位置候補はフレーム前半に集中する傾向や、フレームに
均等に出現する傾向がある。この特性を利用して、入力
音声の特徴に応じてパルス音源の位置候補の組合せに制
約を与えることにより、符号化特性の劣化を抑えつつ、
代数的音源に要する符号化ビット数を削減する。
【0115】選択手段63は、入力音声を分析し、例え
ば、有声の立上り区間であれば、音源位置組合せテーブ
ル61を選択し、有声の立上り以外の区間であれば、音
源位置組合せテーブル62を選択するなど、入力音声の
分析結果に基づいて使用する音源位置組合せテーブルを
選択して切り換える。
【0116】代数的音源符号化手段64は、選択手段6
3により選択された音源位置組合せテーブル61(また
は62)に格納されているパルス音源の位置候補の組合
せを順次読み出して、各位置候補に任意の極性でパルス
を立ててピッチフィルタを施したときの仮の合成音を生
成する。そして、適応音源符号化手段23から出力され
た符号化対象信号と仮の合成音との距離を計算して、そ
の距離を最小にするパルス音源の位置候補の組合せと極
性を探索する。
【0117】代数的音源符号化手段64は、その探索が
完了すると、その探索結果であるパルス音源の位置候補
の組合せを表す音源位置符号と極性とを、駆動音源符号
として多重化手段26に出力するとともに、この駆動音
源符号に対応する時系列ベクトルを、駆動音源信号とし
てゲイン符号化手段25に出力する。なお、選択手段6
3から出力された選択情報も、駆動音源符号に含められ
て多重化手段26に出力される。
【0118】次に、駆動音源復号化手段34の選択手段
73は、駆動音源符号に含まれている選択情報を示す符
号に対応する音源位置組合せテーブル、即ち、音源位置
組合せテーブル71又は音源位置組合せテーブル72を
選択する。ただし、音源位置組合せテーブル71は音源
位置組合せテーブル61と同一内容がテーブル化され、
音源位置組合せテーブル72は音源位置組合せテーブル
62と同一内容がテーブル化されている。
【0119】代数的音源復号化手段74は、選択手段7
3により選択された音源位置組合せテーブル71(また
は72)から、音源位置符号に対応するパルス音源の位
置候補の組合せを読み出し、各位置候補に前記極性を付
与したパルスを配置した信号にピッチフィルタを施して
駆動音源信号を生成し、その駆動音源信号を出力する。
【0120】以上で明らかなように、この実施の形態3
によれば、記述内容が相互に異なる音源位置組合せテー
ブル61,62(または71,72)を有し、任意の音
源位置組合せテーブルを選択して使用するように構成し
たので、上記実施の形態1と同様の効果を奏することが
できるとともに、特性の劣化を効果的に抑制することが
できる効果を奏する。
【0121】なお、この実施の形態3では、駆動音源信
号の生成部にピッチフィルタを導入しているが、これを
駆動音源復号化手段34においてのみ導入したり、駆動
音源符号化手段24と駆動音源復号化手段34の両方で
導入しない構成も可能である。
【0122】また、この実施の形態3では、有声の立上
りか否かにより音源位置組合せテーブルを切り換えてい
るが、母音部か否か、雑音区間か音声区間か、あるい
は、ピッチ長の大小に応じて切り換えるなど、他の基準
を用いる構成も可能である。さらに、これらの基準を複
数組み合せて用いる構成も可能である。
【0123】また、この実施の形態3では、有声の立上
りか否かを判定しているので、主に入力音声のパワー情
報をパラメータとして用いて音源位置組合せテーブルを
切り換えることになるが、入力音声を分析して得られる
ピッチ情報やスペクトル情報など、他のパラメータを用
いる構成も可能である。さらに、これらのパラメータを
複数組み合せて用いる構成も可能である。
【0124】この実施の形態3では、2つの音源位置組
合せテーブルを切り換えているが、3つ以上の音源位置
組合せテーブルを切り換える構成も可能である。また、
この実施の形態3では、複数の音源位置組合せテーブル
を切り換えているが、複数の音源位置・極性組合せテー
ブルを切り換える構成も可能である。
【0125】実施の形態4.図15はこの発明の実施の
形態4による音声符号化装置における駆動音源符号化手
段24の内部を示す構成図であり、図において、81は
複数の音源位置の全組合せのうち、ピッチ周期がフレー
ム長より短い場合に使用頻度が基準頻度より高い音源位
置の組合せを示す情報が記述された音源位置組合せテー
ブル(インデックステーブル)、82は複数の音源位置
の全組合せのうち、ピッチ周期がフレーム長より長い場
合に使用頻度が基準頻度より高い音源位置の組合せを示
す情報が記述された音源位置組合せテーブル(インデッ
クステーブル)、83は適応音源符号からピッチ周期を
求め、そのピッチ周期に対応する音源位置組合せテーブ
ル81(または82)を選択する選択手段、84は選択
手段83により選択された音源位置組合せテーブル81
(または82)から任意の音源位置の組合せを選択し、
その音源位置の組合せと適正な極性を用いて入力音声の
音源情報を符号化する代数的音源符号化手段である。
【0126】図16はこの発明の実施の形態4による音
声復号化装置における駆動音源復号化手段34の内部を
示す構成図であり、図において、91は複数の音源位置
の全組合せのうち、ピッチ周期がフレーム長より短い場
合に使用頻度が基準頻度より高い音源位置の組合せを示
す情報が記述された音源位置組合せテーブル(インデッ
クステーブル)、92は複数の音源位置の全組合せのう
ち、ピッチ周期がフレーム長より長い場合に使用頻度が
基準頻度より高い音源位置の組合せを示す情報が記述さ
れた音源位置組合せテーブル(インデックステーブ
ル)、93は適応音源符号からピッチ周期を求め、その
ピッチ周期に対応する音源位置組合せテーブル91(ま
たは92)を選択する選択手段、94は選択手段93に
より選択された音源位置組合せテーブル91(または9
2)から駆動音源符号に含まれている音源位置符号に基
づいて音源位置の組合せを選択し、その音源位置の組合
せと極性(極性を特定する情報は駆動音源符号に含まれ
ている)を用いて入力音声の音源情報を復号化する代数
的音源復号化手段である。
【0127】次に動作について説明する。ただし、駆動
音源符号化手段24及び駆動音源復号化手段34以外は
上記実施の形態1と同様であるため、駆動音源符号化手
段24及び駆動音源復号化手段34の動作のみを説明す
る。
【0128】まず、駆動音源符号化手段24の音源位置
組合せテーブル81には、例えば、図19に示すパルス
音源の位置候補の全組合せの中からピッチ周期がフレー
ム長より短い場合に使用頻度が高い組合せ(基準頻度よ
り高い組合せ)のみを所望数抽出するなどして、複数の
パルス音源の位置候補の組合せが記述されている。ま
た、音源位置組合せテーブル82には、例えば、図19
に示すパルス音源の位置候補の全組合せの中からピッチ
周期がフレーム長より長い場合に使用頻度が高い組合せ
(基準頻度より高い組合せ)のみを所望数抽出するなど
して、複数のパルス音源の位置候補の組合せが記述され
ている。
【0129】代数的音源において、符号化に用いられる
パルス音源の位置候補の組合せは全組合せが均等に出現
するわけではなく、その発生の頻度には偏りがあり、発
生頻度が低い組合せを一切使用しないとしても合成音の
品質に与える影響は小さい。例えば、ピッチ周期がフレ
ーム長より短い場合は、ピッチフィルタを用いることも
あり、パルス音源の位置候補はフレーム前半に集中する
傾向があり、ピッチ周期がフレーム長より長い場合には
パルス音源の位置候補はフレームに均等に出現する傾向
がある。この特性を利用して、入力音声の特徴に応じて
パルス音源の位置候補の組合せに制約を与えることによ
り、符号化特性の劣化を抑えつつ、代数的音源に要する
符号化ビット数を削減する。
【0130】選択手段83は、適応音源符号よりピッチ
周期を求め、例えば、ピッチ周期がフレーム長より短い
場合には、音源位置組合せテーブル81を選択し、ピッ
チ周期がフレーム長より長い場合には、音源位置組合せ
テーブル82を選択するなど、ピッチ周期に基づいて使
用する音源位置組合せテーブルを選択して切り換える。
【0131】代数的音源符号化手段84は、選択手段8
3により選択された音源位置組合せテーブル81(また
は82)に格納されているパルス音源の位置候補の組合
せを順次読み出して、各位置候補に任意の極性でパルス
を立ててピッチフィルタを施したときの仮の合成音を生
成する。そして、適応音源符号化手段23から出力され
た符号化対象信号と仮の合成音との距離を計算して、そ
の距離を最小にするパルス音源の位置候補の組合せと極
性を探索する。代数的音源符号化手段84は、その探索
が完了すると、その探索結果であるパルス音源の位置候
補の組合せを表す音源位置符号と極性とを、駆動音源符
号として多重化手段26に出力するとともに、この駆動
音源符号に対応する時系列ベクトルを、駆動音源信号と
してゲイン符号化手段25に出力する。
【0132】次に、駆動音源復号化手段34の選択手段
93は、駆動音源符号化手段24の選択手段83と同様
にして、音源位置組合せテーブル91又は音源位置組合
せテーブル92を選択する。ただし、音源位置組合せテ
ーブル91は音源位置組合せテーブル81と同一内容が
テーブル化され、音源位置組合せテーブル92は音源位
置組合せテーブル82と同一内容がテーブル化されてい
る。
【0133】代数的音源復号化手段94は、選択手段9
3により選択された音源位置組合せテーブル91(また
は92)から、音源位置符号に対応するパルス音源の位
置候補の組合せを読み出し、各位置候補に前記極性を付
与したパルスを配置した信号にピッチフィルタを施して
駆動音源信号を生成し、その駆動音源信号を出力する。
【0134】以上で明らかなように、この実施の形態4
によれば、記述内容が相互に異なる音源位置組合せテー
ブル81,82(または91,92)を有し、任意の音
源位置組合せテーブルを選択して使用するように構成し
たので、上記実施の形態1と同様の効果を奏することが
できるとともに、特性の劣化を効果的に抑制することが
できる効果を奏する。また、この実施の形態4では、適
応音源符号より求めることができるピッチ周期に基づい
て音源位置組合せテーブルを選択するようにしているの
で、使用対象の音源位置組合せテーブルを特定する選択
情報の符号化が不要になる効果も奏する。
【0135】なお、この実施の形態4では、駆動音源信
号の生成部にピッチフィルタを導入しているが、これを
駆動音源復号化手段34においてのみ導入したり、駆動
音源符号化手段24と駆動音源復号化手段34の両方で
導入しない構成も可能である。
【0136】また、この実施の形態4では、適応音源符
号から求まるピッチ周期に応じて音源位置組合せテーブ
ルを切り換えているが、線形予測係数の符号から求まる
スペクトル様態に応じて切り換えるなど、他のパラメー
タを用いる構成も可能である。さらに、これらのパラメ
ータを複数組み合せて用いる構成も可能である。
【0137】また、この実施の形態4では、現フレーム
で求められた符号を用いて音源位置組合せテーブルを切
り換えるためのパラメータを求めているが、過去のフレ
ームにおける符号を用いて音源位置組合せテーブルを切
り換えるためのパラメータを求める構成も可能である。
【0138】この実施の形態4では、符号に基づいて音
源位置組合せテーブルを切り換えるためのパラメータを
求めているが、過去に生成された音源信号や出力音声な
ど、音声符号化装置及び音声復号化装置に共通に生成可
能な信号を分析してパラメータを求める構成も可能であ
る。
【0139】また、この実施の形態4では、2つの音源
位置組合せテーブルを切り換えているが、3つ以上の音
源位置組合せテーブルを切り換える構成も可能である。
さらに、この実施の形態4では、複数の音源位置組合せ
テーブルを切り換えているが、複数の音源位置・極性組
合せテーブルを切り換える構成も可能である。
【0140】
【発明の効果】以上のように、この発明によれば、音源
符号化手段が複数の音源位置の全組合せのうち、音源位
置の組合せに関する評価値が基準値より高い音源位置の
組合せを示す情報が記述されたインデックステーブルか
ら任意の音源位置の組合せを選択し、その音源位置の組
合せを用いて入力音声の音源情報を符号化するように構
成したので、特性の劣化を招くことなく、低ビットレー
ト化を図ることができる効果がある。
【0141】この発明によれば、インデックステーブル
に記述されている音源位置の組合せを示す情報が、個別
に符号化された音源位置の組合せ情報であるように構成
したので、記憶容量が小さい効率的な音声符号化装置が
得られる効果がある。
【0142】この発明によれば、音源符号化手段が少な
くとも評価値が基準値より高い音源位置の組合せを含む
音源位置の組合せを認識することが可能な場合、インデ
ックステーブルに記述されている音源位置の組合せを示
す情報が、音源位置の各組合せがインデックステーブル
の要素であるか否かを示すフラグ情報であるように構成
したので、記憶容量が小さい効率的な音声符号化装置が
得られる効果がある。
【0143】この発明によれば、音源符号化手段がフレ
ーム長と音源数とインデックス数から少なくとも評価値
が基準値より高い音源位置の組合せを含む音源位置の組
合せを認識するように構成したので、記憶容量が小さい
効率的な音声符号化装置が得られる効果がある。
【0144】この発明によれば、音源符号化手段が音源
位置及び極性から構成された複数の対データの全組合せ
のうち、対データの組合せに関する評価値が基準値より
高い対データの組合せを示す情報が記述されたインデッ
クステーブルから任意の対データの組合せを選択し、そ
の対データの組合せを用いて入力音声の音源情報を符号
化するように構成したので、特性の劣化を招くことな
く、低ビットレート化を図ることができる効果がある。
【0145】この発明によれば、インデックステーブル
に記述されている対データの組合せを示す情報が、個別
に符号化された対データの組合せ情報であるように構成
したので、記憶容量が小さい効率的な音声符号化装置が
得られる効果がある。
【0146】この発明によれば、音源符号化手段が少な
くとも評価値が基準値より高い対データの組合せを含む
対データの組合せを認識することが可能な場合、インデ
ックステーブルに記述されている対データの組合せを示
す情報が、対データの各組合せがインデックステーブル
の要素であるか否かを示すフラグ情報であるように構成
したので、記憶容量が小さい効率的な音声符号化装置が
得られる効果がある。
【0147】この発明によれば、音源符号化手段がフレ
ーム長と音源数とインデックス数から少なくとも評価値
が基準値より高い対データの組合せを含む対データの組
合せを認識するように構成したので、記憶容量が小さい
効率的な音声符号化装置が得られる効果がある。
【0148】この発明によれば、音源符号化手段が記述
内容が相互に異なるインデックステーブルを複数個有
し、任意のインデックステーブルを選択して使用するよ
うに構成したので、低ビットレート化を図ることができ
る効果がある。また、特性の劣化を効果的に抑制するこ
とができる効果がある。
【0149】この発明によれば、音源符号化手段が入力
音声を分析して所定のパラメータを抽出し、そのパラメ
ータに対応するインデックステーブルを選択するように
構成したので、複雑な処理を実施することなく、インデ
ックステーブルを選択することができる効果がある。
【0150】この発明によれば、音源符号化手段がスペ
クトル包絡情報および音源情報の少なくともどちらか一
方から所定のパラメータを抽出し、そのパラメータに対
応するインデックステーブルを選択するように構成した
ので、使用対象のインデックステーブルを特定する選択
情報の符号化が不要になる効果がある。
【0151】この発明によれば、音源復号化手段が複数
の音源位置の全組合せのうち、音源位置の組合せに関す
る評価値が基準値より高い音源位置の組合せを示す情報
が記述されたインデックステーブルから音源情報に含ま
れている組合せを示す符号に基づいて音源位置の組合せ
を選択し、その音源位置の組合せを用いて入力音声の音
源情報を復号化するように構成したので、特性の劣化を
招くことなく、低ビットレート化を図ることができる効
果がある。
【0152】この発明によれば、インデックステーブル
に記述されている音源位置の組合せを示す情報が、個別
に符号化された音源位置の組合せ情報であるように構成
したので、記憶容量が小さい効率的な音声復号化装置が
得られる効果がある。
【0153】この発明によれば、音源復号化手段が少な
くとも評価値が基準値より高い音源位置の組合せを含む
音源位置の組合せを認識することが可能な場合、インデ
ックステーブルに記述されている音源位置の組合せを示
す情報が、音源位置の各組合せがインデックステーブル
の要素であるか否かを示すフラグ情報であるように構成
したので、記憶容量が小さい効率的な音声復号化装置が
得られる効果がある。
【0154】この発明によれば、音源復号化手段がフレ
ーム長と音源数とインデックス数から少なくとも評価値
が基準値より高い音源位置の組合せを含む音源位置の組
合せを認識するように構成したので、記憶容量が小さい
効率的な音声復号化装置が得られる効果がある。
【0155】この発明によれば、音源復号化手段が音源
位置及び極性から構成された複数の対データの全組合せ
のうち、対データの組合せに関する評価値が基準値より
高い対データの組合せを示す情報が記述されたインデッ
クステーブルから音源情報に含まれている組合せを示す
符号に基づいて対データの組合せを選択し、その対デー
タの組合せを用いて入力音声の音源情報を復号化するよ
うに構成したので、特性の劣化を招くことなく、低ビッ
トレート化を図ることができる効果がある。
【0156】この発明によれば、インデックステーブル
に記述されている対データの組合せを示す情報が、個別
に符号化された対データの組合せ情報であるように構成
したので、記憶容量が小さい効率的な音声復号化装置が
得られる効果がある。
【0157】この発明によれば、音源復号化手段が少な
くとも評価値が基準値より高い対データの組合せを含む
対データの組合せを認識することが可能な場合、インデ
ックステーブルに記述されている対データの組合せを示
す情報が、対データの各組合せがインデックステーブル
の要素であるか否かを示すフラグ情報であるように構成
したので、記憶容量が小さい効率的な音声復号化装置が
得られる効果がある。
【0158】この発明によれば、音源復号化手段がフレ
ーム長と音源数とインデックス数から少なくとも評価値
が基準値より高い対データの組合せを含む対データの組
合せを認識するように構成したので、記憶容量が小さい
効率的な音声復号化装置が得られる効果がある。
【0159】この発明によれば、音源復号化手段が記述
内容が相互に異なるインデックステーブルを複数個有
し、音源情報に含まれている選択情報を示す符号に対応
するインデックステーブルを選択して使用するように構
成したので、低ビットレート化を図ることができる効果
がある。また、特性の劣化を効果的に抑制することがで
きる効果がある。
【0160】この発明によれば、音源復号化手段が記述
内容が相互に異なるインデックステーブルを複数個有
し、スペクトル包絡情報および音源情報の少なくともど
ちらか一方から所定のパラメータを抽出し、そのパラメ
ータに対応するインデックステーブルを選択して使用す
るように構成したので、低ビットレート化を図ることが
できる効果がある。また、特性の劣化を効果的に抑制す
ることができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音声符号化装
置を示す構成図である。
【図2】 この発明の実施の形態1による音声復号化装
置を示す構成図である。
【図3】 この発明の実施の形態1による音声符号化装
置における駆動音源符号化手段の内部を示す構成図であ
る。
【図4】 この発明の実施の形態1による音声復号化装
置における駆動音源復号化手段の内部を示す構成図であ
る。
【図5】 音源位置組合せテーブルを示す説明図であ
る。
【図6】 音源位置組合せテーブルの情報記憶方法を示
す説明図である。
【図7】 音源位置組合せテーブルの情報記憶方法を示
す説明図である。
【図8】 この発明の実施の形態2による音声符号化装
置における駆動音源符号化手段の内部を示す構成図であ
る。
【図9】 この発明の実施の形態2による音声復号化装
置における駆動音源復号化手段の内部を示す構成図であ
る。
【図10】 音源位置・極性組合せテーブルを示す説明
図である。
【図11】 音源位置・極性組合せテーブルの情報記憶
方法を示す説明図である。
【図12】 音源位置・極性組合せテーブルの情報記憶
方法を示す説明図である。
【図13】 この発明の実施の形態3による音声符号化
装置における駆動音源符号化手段の内部を示す構成図で
ある。
【図14】 この発明の実施の形態3による音声復号化
装置における駆動音源復号化手段の内部を示す構成図で
ある。
【図15】 この発明の実施の形態4による音声符号化
装置における駆動音源符号化手段の内部を示す構成図で
ある。
【図16】 この発明の実施の形態4による音声復号化
装置における駆動音源復号化手段の内部を示す構成図で
ある。
【図17】 従来のCELP方式を用いる音声符号化装
置を示す構成図である。
【図18】 従来のCELP方式を用いる音声復号化装
置を示す構成図である。
【図19】 音源位置テーブルを示す説明図である。
【図20】 音源位置・極性テーブルを示す説明図であ
る。
【符号の説明】
21 線形予測分析手段(包絡情報符号化手段)、22
線形予測係数符号化手段(包絡情報符号化手段)、2
3 適応音源符号化手段(音源符号化手段)、24 駆
動音源符号化手段(音源符号化手段)、25 ゲイン符
号化手段(音源符号化手段)、26 多重化手段、31
分離手段、32 線形予測係数復号化手段(包絡情報
復号化手段)、33 適応音源復号化手段(音源復号化
手段)、34 駆動音源復号化手段(音源復号化手
段)、35 ゲイン復号化手段(音源復号化手段)、3
6,37 乗算器(音源復号化手段)、38 加算器
(音源復号化手段)、39 合成フィルタ、41,5
1,71,72,81,82,91,92 音源位置組
合せテーブル(インデックステーブル)、42,44,
64,84 代数的音源符号化手段、43,53 音源
位置・極性組合せテーブル(インデックステーブル)、
52,54,74,94 代数的音源復号化手段、6
1,62 音源位置組合せテーブル(インデックステー
ブル)、63,73,83,93 選択手段。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 CB01 DA11 5K041 AA07 CC01 DD01 EE22 FF01 HH37 9A001 BB02 BB03 BB04 DD08 EE04 EE05 HH16 HH17 HH18 KK37 LL08

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 入力音声のスペクトル包絡情報を抽出
    し、そのスペクトル包絡情報を符号化する包絡情報符号
    化手段と、その入力音声の音源情報を符号化する音源符
    号化手段と、上記包絡情報符号化手段により符号化され
    たスペクトル包絡情報と上記音源符号化手段により符号
    化された音源情報を多重化して音声符号を出力する多重
    化手段とを備えた音声符号化装置において、上記音源符
    号化手段は複数の音源位置の全組合せのうち、音源位置
    の組合せに関する評価値が基準値より高い音源位置の組
    合せを示す情報が記述されたインデックステーブルから
    任意の音源位置の組合せを選択し、その音源位置の組合
    せを用いて入力音声の音源情報を符号化することを特徴
    とする音声符号化装置。
  2. 【請求項2】 インデックステーブルに記述されている
    音源位置の組合せを示す情報は、個別に符号化された音
    源位置の組合せ情報であることを特徴とする請求項1記
    載の音声符号化装置。
  3. 【請求項3】 音源符号化手段が少なくとも評価値が基
    準値より高い音源位置の組合せを含む音源位置の組合せ
    を認識することが可能な場合、インデックステーブルに
    記述されている音源位置の組合せを示す情報は、音源位
    置の各組合せがインデックステーブルの要素であるか否
    かを示すフラグ情報であることを特徴とする請求項1記
    載の音声符号化装置。
  4. 【請求項4】 音源符号化手段は、フレーム長と音源数
    とインデックス数から少なくとも評価値が基準値より高
    い音源位置の組合せを含む音源位置の組合せを認識する
    ことを特徴とする請求項3記載の音声符号化装置。
  5. 【請求項5】 入力音声のスペクトル包絡情報を抽出
    し、そのスペクトル包絡情報を符号化する包絡情報符号
    化手段と、その入力音声の音源情報を符号化する音源符
    号化手段と、上記包絡情報符号化手段により符号化され
    たスペクトル包絡情報と上記音源符号化手段により符号
    化された音源情報を多重化する多重化手段とを備えた音
    声符号化装置において、上記音源符号化手段は音源位置
    及び極性から構成された複数の対データの全組合せのう
    ち、対データの組合せに関する評価値が基準値より高い
    対データの組合せを示す情報が記述されたインデックス
    テーブルから任意の対データの組合せを選択し、その対
    データの組合せを用いて入力音声の音源情報を符号化す
    ることを特徴とする音声符号化装置。
  6. 【請求項6】 インデックステーブルに記述されている
    対データの組合せを示す情報は、個別に符号化された対
    データの組合せ情報であることを特徴とする請求項5記
    載の音声符号化装置。
  7. 【請求項7】 音源符号化手段が少なくとも評価値が基
    準値より高い対データの組合せを含む対データの組合せ
    を認識することが可能な場合、インデックステーブルに
    記述されている対データの組合せを示す情報は、対デー
    タの各組合せがインデックステーブルの要素であるか否
    かを示すフラグ情報であることを特徴とする請求項5記
    載の音声符号化装置。
  8. 【請求項8】 音源符号化手段は、フレーム長と音源数
    とインデックス数から少なくとも評価値が基準値より高
    い対データの組合せを含む対データの組合せを認識する
    ことを特徴とする請求項7記載の音声符号化装置。
  9. 【請求項9】 音源符号化手段は、記述内容が相互に異
    なるインデックステーブルを複数個有し、任意のインデ
    ックステーブルを選択して使用することを特徴とする請
    求項1から請求項8のうちのいずれか1項記載の音声符
    号化装置。
  10. 【請求項10】 音源符号化手段は、入力音声を分析し
    て所定のパラメータを抽出し、そのパラメータに対応す
    るインデックステーブルを選択することを特徴とする請
    求項9記載の音声符号化装置。
  11. 【請求項11】 音源符号化手段は、スペクトル包絡情
    報および音源情報の少なくともどちらか一方から所定の
    パラメータを抽出し、そのパラメータに対応するインデ
    ックステーブルを選択することを特徴とする請求項9記
    載の音声符号化装置。
  12. 【請求項12】 音声符号から入力音声のスペクトル包
    絡情報と音源情報を分離する分離手段と、上記分離手段
    により分離されたスペクトル包絡情報を復号化する包絡
    情報復号化手段と、上記包絡情報復号化手段により復号
    化されたスペクトル包絡情報を参照して、上記分離手段
    により分離された音源情報を復号化する音源復号化手段
    とを備えた音声復号化装置において、上記音源復号化手
    段は複数の音源位置の全組合せのうち、音源位置の組合
    せに関する評価値が基準値より高い音源位置の組合せを
    示す情報が記述されたインデックステーブルから上記音
    源情報に含まれている組合せを示す符号に基づいて音源
    位置の組合せを選択し、その音源位置の組合せを用いて
    入力音声の音源情報を復号化することを特徴とする音声
    復号化装置。
  13. 【請求項13】 インデックステーブルに記述されてい
    る音源位置の組合せを示す情報は、個別に符号化された
    音源位置の組合せ情報であることを特徴とする請求項1
    2記載の音声復号化装置。
  14. 【請求項14】 音源復号化手段が少なくとも評価値が
    基準値より高い音源位置の組合せを含む音源位置の組合
    せを認識することが可能な場合、インデックステーブル
    に記述されている音源位置の組合せを示す情報は、音源
    位置の各組合せがインデックステーブルの要素であるか
    否かを示すフラグ情報であることを特徴とする請求項1
    2記載の音声復号化装置。
  15. 【請求項15】 音源復号化手段は、フレーム長と音源
    数とインデックス数から少なくとも評価値が基準値より
    高い音源位置の組合せを含む音源位置の組合せを認識す
    ることを特徴とする請求項14記載の音声復号化装置。
  16. 【請求項16】 音声符号から入力音声のスペクトル包
    絡情報と音源情報を分離する分離手段と、上記分離手段
    により分離されたスペクトル包絡情報を復号化する包絡
    情報復号化手段と、上記包絡情報復号化手段により復号
    化されたスペクトル包絡情報を参照して、上記分離手段
    により分離された音源情報を復号化する音源復号化手段
    とを備えた音声復号化装置において、上記音源復号化手
    段は音源位置及び極性から構成された複数の対データの
    全組合せのうち、対データの組合せに関する評価値が基
    準値より高い対データの組合せを示す情報が記述された
    インデックステーブルから上記音源情報に含まれている
    組合せを示す符号に基づいて対データの組合せを選択
    し、その対データの組合せを用いて入力音声の音源情報
    を復号化することを特徴とする音声復号化装置。
  17. 【請求項17】 インデックステーブルに記述されてい
    る対データの組合せを示す情報は、個別に符号化された
    対データの組合せ情報であることを特徴とする請求項1
    6記載の音声復号化装置。
  18. 【請求項18】 音源復号化手段が少なくとも評価値が
    基準値より高い対データの組合せを含む対データの組合
    せを認識することが可能な場合、インデックステーブル
    に記述されている対データの組合せを示す情報は、対デ
    ータの各組合せがインデックステーブルの要素であるか
    否かを示すフラグ情報であることを特徴とする請求項1
    6記載の音声復号化装置。
  19. 【請求項19】 音源復号化手段は、フレーム長と音源
    数とインデックス数から少なくとも評価値が基準値より
    高い対データの組合せを含む対データの組合せを認識す
    ることを特徴とする請求項18記載の音声復号化装置。
  20. 【請求項20】 音源復号化手段は、記述内容が相互に
    異なるインデックステーブルを複数個有し、音源情報に
    含まれている選択情報を示す符号に対応するインデック
    ステーブルを選択して使用することを特徴とする請求項
    12から請求項19のうちのいずれか1項記載の音声復
    号化装置。
  21. 【請求項21】 音源復号化手段は、記述内容が相互に
    異なるインデックステーブルを複数個有し、スペクトル
    包絡情報および音源情報の少なくともどちらか一方から
    所定のパラメータを抽出し、そのパラメータに対応する
    インデックステーブルを選択して使用することを特徴と
    する請求項12から請求項19のうちのいずれか1項記
    載の音声復号化装置。
JP2000049867A 2000-02-25 2000-02-25 音声符号化装置及び音声復号化装置 Expired - Fee Related JP3907906B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000049867A JP3907906B2 (ja) 2000-02-25 2000-02-25 音声符号化装置及び音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000049867A JP3907906B2 (ja) 2000-02-25 2000-02-25 音声符号化装置及び音声復号化装置

Publications (2)

Publication Number Publication Date
JP2001242898A true JP2001242898A (ja) 2001-09-07
JP3907906B2 JP3907906B2 (ja) 2007-04-18

Family

ID=18571735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000049867A Expired - Fee Related JP3907906B2 (ja) 2000-02-25 2000-02-25 音声符号化装置及び音声復号化装置

Country Status (1)

Country Link
JP (1) JP3907906B2 (ja)

Also Published As

Publication number Publication date
JP3907906B2 (ja) 2007-04-18

Similar Documents

Publication Publication Date Title
JP4916521B2 (ja) 音声復号化方法及び音声符号化方法及び音声復号化装置及び音声符号化装置
JP3094908B2 (ja) 音声符号化装置
KR100350340B1 (ko) 음성 부호화 장치, 음성 복호 장치 및 음성 부호화 복호 장치 및 음성 부호화 방법, 음성 복호 방법 및 음성 부호화 복호 방법
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
JPH06222797A (ja) 音声符号化方式
JPH1130997A (ja) 音声符号化復号装置
KR20030062354A (ko) 음향 파라미터 부호화, 복호화 방법, 장치 및 프로그램, 음성 부호화, 복호화 방법, 장치 및 프로그램
US6768978B2 (en) Speech coding/decoding method and apparatus
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JPH09319398A (ja) 信号符号化装置
US6496796B1 (en) Voice coding apparatus and voice decoding apparatus
JP3353852B2 (ja) 音声の符号化方法
JP3907906B2 (ja) 音声符号化装置及び音声復号化装置
JP3299099B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
US20040049381A1 (en) Speech coding method and speech coder
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP2008090311A (ja) 音声符号化方法
JP3144194B2 (ja) 音声符号化装置
JPH0844398A (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3736801B2 (ja) 音声復号化方法及び音声復号化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110126

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees