JPH07225599A - 音声の符号化方法 - Google Patents

音声の符号化方法

Info

Publication number
JPH07225599A
JPH07225599A JP6018406A JP1840694A JPH07225599A JP H07225599 A JPH07225599 A JP H07225599A JP 6018406 A JP6018406 A JP 6018406A JP 1840694 A JP1840694 A JP 1840694A JP H07225599 A JPH07225599 A JP H07225599A
Authority
JP
Japan
Prior art keywords
voice
encoding method
speech
vector
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6018406A
Other languages
English (en)
Other versions
JP3353852B2 (ja
Inventor
Naka Oomuro
仲 大室
Kazunori Mano
一則 間野
Takehiro Moriya
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP01840694A priority Critical patent/JP3353852B2/ja
Publication of JPH07225599A publication Critical patent/JPH07225599A/ja
Application granted granted Critical
Publication of JP3353852B2 publication Critical patent/JP3353852B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 予測符号化方法により音声の信号系列を少な
い情報量によりディジタル符号化する高能率音声符号化
方法を提供する。 【構成】 適応符号帳からフレーム単位毎に或はサブフ
レーム単位毎に取り出した過去の駆動音源ベクトルをピ
ッチ周期に対応する周期により繰り返して作成した時系
列ベクトル、雑音符号帳から取り出した時系列ベクト
ル、或はこれらの双方の時系列ベクトルによりフィルタ
を駆動して楽音を含む音声を再生することによる入力音
声を符号化する音声の符号化方法において、入力音声を
符号化するに先だって、そのフレーム区間或はサブフレ
ーム区間の特徴を抽出し、抽出された特徴に対応した符
号化方法およびビットレートを選択して符号化する音声
の符号化方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声の符号化方法に
関し、特に、楽音を含む音声のスペクトル包絡特性を表
すフィルタを音源ベクトルにより駆動して音声を合成す
る予測符号化方法により、音声の信号系列を少ない情報
量によりディジタル符号化する高能率音声符号化方法に
関する。
【0002】
【従来の技術】ディジタル移動体通信において、電波を
効率的に利用したり、音声或は音楽を蓄積したりするサ
ービスをする際に記憶媒体を効率的に利用するために高
能率音声符号化方法が使用されている。現在、音声を高
能率に符号化する方法として、原音声をフレームと呼ば
れる5〜50ms程度の一定間隔の区間に分割し、その
1フレームの音声を周波数スペクトルの包絡特性を表す
線形フィルタの特性と、そのフィルタを駆動する駆動音
源信号の2つの情報に分離し、それぞれの情報を符号化
する手法が提案されている。この手法において、駆動音
源信号を符号化する方法として、音声のピッチ周期(基
本周波数)に対応すると考えられる周期成分と、それ以
外の成分に分離して符号化する方法が知られている。こ
の駆動音源情報の符号化方法の例として、符号駆動線形
予測符号化方法(Code-Excited Linear Prediction:CEL
P )がある。この符号駆動線形予測符号化方法(CELP
)の詳細は、文献M.R.Schroeder and B.S.Atal, “Co
de-Excited Linear Prediction(CELP):High Quality Sp
eech at Very Low Bit Rates",IEEE Proc.ICASSP-85,p
p.937-940,1985 に記載されている。
【0003】図1を参照して上述の符号化方法を説明す
る。入力端子1に入力された原音声について、線形予測
分析部2において、原音声の周波数スペクトル包絡特性
を表す線形予測パラメータが計算される。得られた線形
予測パラメータは線形予測パラメータ符号化部3におい
て符号化され、線形予測パラメータ復号化部4に送られ
る。線形予測パラメータ復号化部4においては、受信し
た符号からフィルタ係数を再生し、これを合成フィルタ
5に送り込む。なお、線形予測分析の詳細および線形予
測パラメータの符号化については、例えば古井貞煕著
“ディジタル音声処理”(東海大学出版会)に記載され
ている。ここで、線形予測分析分、線形予測パラメータ
符号化部、線形予測パラメータ復号化部および合成フィ
ルタは非線形なものに置き換えることができる。
【0004】適応符号帳7からは、バッファに記憶され
た直前の過去の駆動音源ベクトルである既に量子化され
た直前の1〜数フレーム分の駆動音源ベクトルを或る周
期に相当する長さで切り出し、その切り出したベクトル
をフレームの長さになるまで繰り返すことにより音声の
周期成分に対応する時系列ベクトルの候補が出力され
る。
【0005】雑音符号帳8からは、音声の非周期成分に
対応する1フレーム分の長さの時系列符号ベクトルの候
補が出力される。これらの候補として、入力音声とは独
立に符号化のためのビット数に応じて予め指定された数
の候補ベクトルが記憶されている。適応符号帳7から出
力された時系列ベクトルの候補は乗算部9において重み
符号帳11に記憶される重み作成部において作成された
重みが乗算される。一方、雑音符号帳8から出力された
時系列ベクトルの候補は、乗算部10において重み符号
帳11に記憶される重み作成部において作成された重み
が乗算される。乗算部9における乗算結果および乗算部
10における乗算結果は加算部12において加算されて
駆動音源ベクトルの候補となる。
【0006】合成フィルタ5は、線形予測パラメータ復
号化部4の出力をフィルタ係数とする線形フィルタであ
り、加算部12の出力である駆動音源ベクトル候補を入
力として再生音声の候補を出力する。合成フィルタ5の
次数、即ち線形予測分析の次数は、一般に10〜16次
程度とされる場合が多い。なお、上述した通り、合成フ
ィルタ5は非線形フィルタとすることができる。
【0007】歪み計算部6においては、合成フィルタ5
の出力である再生音声の候補と入力音声との間の歪みを
計算する。この歪みの計算は、例えば聴覚重み付けの様
な合成フィルタの係数或は量子化していない線形予測係
数を考慮して行なうことが多い。符号帳検索制御部13
においては、合成フィルタ5から供給される再生音声候
補と入力端子1に入力された入力音声との間の歪みが最
小となる様な周期符号、雑音符号および重み符号を選択
し、そのフレームにおける駆動音源ベクトルを決定す
る。
【0008】符号帳検索制御部13において決定された
周期符号、雑音符号、重み符号および線形予測パラメー
タ符号化部3の出力である線形予測パラメータ符号は、
符号送出部14に送られ、これらの利用の形態に応じて
記憶されるか、或は受信側へ送信される。以上の方法は
代表的な符号駆動線形予測符号化方法であるが、より少
ない演算量およびメモリ量を使用してより高品質な符号
化を行なう方法として、ピッチ同期励振源符号駆動線形
予測符号化(PSI-CELP:Pitch Synchronous Innovation-
CELP) 方法が提案されている。この符号化方法について
の詳細は、例えば「文献:間野,守谷,三樹,大室,
“自動車電話用ハーフレート音声コーデックの検討”,
信学技報,SP-92-133(1933) 」、「大矢,須田,三木,
“Pitch SynchronousInnovation CELP(PSI-CELP)-PDC
ハーフレート音声CODEC-",信学技報,RCS93-78(1993)」
に記載されている。
【0009】図2を参照してピッチ同期励振源符号駆動
線形予測符号化方法を説明する。入力端子1に入力され
た原音声について、線形予測分析部2において、原音声
の周波数スペクトル包絡特性を表す線形予測パラメータ
が計算される。得られた線形予測パラメータは、線形予
測パラメータ符号化部3において符号化されて線形予測
パラメータ復号化部4に送られる。線形予測パラメータ
復号化部4は、受信した符号からフィルタ係数を再生
し、これを合成フィルタ5に送り込む。このとき、線形
予測パラメータの符号化は、過去のフレームにおける予
測パラメータの再生値或は伝送符号との間の相関を使用
して符号化すると能率がよい。例えば過去の複数のフレ
ームにおける予測パラメータの再生値(或はベクトル)
の線形結合との間の差分(値或はベクトル)を伝送する
自己回帰型の予測符号化、過去の複数フレームにおける
予測パラメータの伝送符号(値或はベクトル)の線形結
合との間の差分(値或はベクトル)を伝送する移動平均
型の予測符号化と使用すると好適である。
【0010】適応符号帳71からは、バッファに記憶さ
れた直前の過去の駆動音源ベクトルである既に量子化さ
れた直前の1〜数フレーム分の駆動音源ベクトルを或る
周期に相当する長さで切り出し、その切り出したベクト
ルをフレームの長さになるまで繰り返すことにより、音
声の周期成分に対応する時系列ベクトルの候補が出力さ
れる。固定符号帳72からは、音声の非周期成分に対応
する1フレーム分の長さの時系列符号ベクトルの候補が
出力される。適応符号帳71と固定符号帳72とは、現
在のフレームにおいて入力音声と合成音声の歪みが最小
になる様に、適応的に切り換えて使用される。
【0011】以上の方法においては、雑音符号帳は複数
用意される。各雑音符号帳81および82からは、音声
の非周期成分に対応する1フレーム分の長さの時系列符
号ベクトルの候補が出力され、これらの候補はピッチ周
期化部21および22において適応符号帳71のピッチ
に対応する周期により周期化される。このとき、適応符
号帳71の代わりに固定符号帳72が選択された場合は
周期化処理を行なわない。また、雑音符号帳81および
82から出力される候補のすべてを周期化するのではな
く、その一部の候補のみを周期化する様にしてもよい。
周期化処理を施された各ベクトル候補は加算部23にお
いて加算され、雑音符号ベクトル候補となる。
【0012】適応符号帳71或は固定符号帳72から出
力された時系列ベクトルの候補は、乗算部9において重
み符号帳11に記憶される重み作成部において作成され
た重みが乗算される。一方、周期化処理を施された雑音
ベクトル候補は、加算部23において加算された後に乗
算部10において重み符号帳11に記憶される重み作成
部において作成された重みが乗算される。これら乗算部
9における乗算結果および乗算部10における乗算結果
は、加算部12において加算されて駆動音源ベクトルの
候補となる。このとき、重みの符号化には、ベクトル量
子化の手法を使用すると能率がよい。
【0013】合成フィルタ5は、線形予測パラメータ復
号化部4の出力をフィルタ係数とする線形フィルタであ
り、加算部12の出力である駆動音源ベクトル候補を入
力として再生音声の候補を出力する。合成フィルタ5の
次数、即ち線形予測分析の次数は一般に10〜16次と
されることが多い。なお、上述した通り、合成フィルタ
は非線形なフィルタとすることができる。
【0014】歪み計算部6においては、合成フィルタ5
の出力である再生音声の候補と入力端子1に入力される
入力音声との間の歪みを計算する。この歪みの計算は、
聴覚重み付けの様な合成フィルタの係数または量子化し
ていない線形予測係数を考慮に入れて行なうことが多
い。符号帳検索制御部13においては、各再生音声候補
と入力音声との間の歪みが最小となる様な周期符号或は
固定符号、各雑音符号帳の雑音符号および重み符号を選
択し、そのフレームにおける駆動音源ベクトルを決定す
る。
【0015】符号帳検索制御部13において決定された
周期符号或は固定符号、雑音符号、重み符号、および線
形予測パラメータ符号化部4の出力である線形予測パラ
メータ符号は、符号送出部14に送られ、利用の形態に
応じて記憶されるか、或は受信側へ送信される。
【0016】
【発明が解決しようとする課題】音声は時々刻々に特徴
が変化する非定常的な信号であり、時々刻々の特徴によ
り符号化に必要とされる情報量は異なる。必要とされる
情報量が時々刻々に異なる場合、上述の通りの従来の予
測符号化方法の様に、或る一つのモデルおよび一定のビ
ットレートにより符号化することは、信号系列をより少
ない情報量によりディジタル符号化する上において能率
上好ましくない。また、トータルの情報量が制限されて
いる場合は、品質が劣化するに到る。
【0017】この発明は、時々刻々に変化する音声の特
徴に対応して符号化方法およびビットレートの双方を切
り換えることにより、高い品質を保持したまま少ない情
報量により音声をディジタル符号化する音声の符号化方
法を提供するものである。
【0018】
【課題を解決するための手段】適応符号帳からフレーム
単位毎に或はサブフレーム単位毎に取り出した過去の駆
動音源ベクトルをピッチ周期に対応する周期により繰り
返して作成した時系列ベクトル、雑音符号帳から取り出
した時系列ベクトル、或はこれらの双方の時系列ベクト
ルによりフィルタを駆動して楽音を含む音声を再生する
ことによる入力音声を符号化する音声の符号化方法にお
いて、入力音声を符号化するに先だって、そのフレーム
区間或はサブフレーム区間の特徴を抽出し、抽出された
特徴に対応した符号化方法およびビットレートを選択し
て符号化する音声の符号化方法を構成した。
【0019】そして、上述の音声の符号化方法におい
て、入力音声の特徴抽出に際して有声音であると判断さ
れた音声区間について、適応符号帳から取り出した過去
の駆動音源ベクトルをピッチ周期に対応する周期により
繰り返して作成した時系列ベクトルと、雑音符号帳から
取り出した時系列ベクトルを適応符号帳のピッチ周期に
対応する周期により周期化した時系列ベクトルとにより
フィルタを駆動して音声を再生する符号化方法を使用す
る音声の符号化方法を構成した。また、当該音声区間が
定常的であると判断されたフレーム或はサブフレームに
ついて、適応符号帳のピッチ周期を過去のピッチ周期の
1倍或は定数倍或は定数分の1倍に微小変化分を加減算
して表現する音声の符号化方法を構成した。
【0020】更に、当該音声区間が定常的であると判断
されたフレーム或はサブフレームについて、適応符号帳
のピッチ周期を過去のピッチ周期の1倍或は定数倍或は
定数分の1倍に微小変化分を加減算して表現する音声の
符号化方法を構成した。過去のピッチ周期の1倍或は定
数倍或は定数分の1倍に加減算する微小変化分の量子化
幅を、変化分が小さいときは狭く、変化分が大きいとき
は広くとって表現する音声の符号化方法を構成した。
【0021】そして、過去のピッチ周期の1倍以外の定
数倍或は定数分の1倍に加減算する微小変化分の量子化
幅を、1倍のときの量子化幅より広くとって表現する音
声の符号化方法を構成した。また、当該音声区間が定常
的であると判断されたフレーム或はサブフレームについ
て、スペクトルパラメータ或は利得符号ベクトル或は雑
音符号ベクトル或はこれらのすべてに割り当てられるビ
ット数を、有声音であって定常的ではないと判断される
フレーム或はサブフレームにおいて割り当てられるビッ
ト数よりも少なく割り当てる音声の符号化方法を構成し
た。
【0022】更に、隣接するフレーム或はサブフレーム
間の、符号化に先だって抽出したか或は量子化された、
ピッチおよびパワおよびスペクトルの変化分が予め設定
された閾値よりも小であることを以て当該音声区間は定
常的であると判断する音声の符号化方法をも構成した。
【0023】
【実施例】この発明の実施例を図を参照して説明する。
図3は入力された音声の特徴を分析して、いくつかのパ
ターン(モード)に分類し、これらのパターンに対応し
て符号化方法を切り換える方法を説明する図である。図
3は4モードの例を示す。入力端子1に入力された原音
声は、先ず音声特徴分析部20に送られ、ここにおいて
音声の特徴を示す種々のパラメータが計算される。この
パラメータの代表的な例としては、音声パワ、変形相関
関数の最大値、変形相関関数が最大となる遅れ時間(オ
ープンループピッチ)、スペクトル変化量がある。これ
ら計算されたパラメータはモード決定部40に送られ
る。モード決定部40においては、これらのオープンル
ープにより求めた特徴パラメータと、バッファ部50に
記憶される過去のフレームにおける量子化パラメータ例
えば前フレームの適応符号帳のピッチ周期、合成音声の
パワ、前フレームが属したモードを使用し、現在のフレ
ームの音声が予め決められたモードの内の何れのモード
に属するかを決定し、決定結果に基づいて切り替えスイ
ッチ41および42を切り替えて符号化部31ないし3
4の何れかを選択する。
【0024】図4は4モードの場合の音声区間のモード
分類の仕方を説明するフローチャートを示す。先ず、入
力されたパラメータから、フレーム毎に音声区間である
か或は非音声区間であるかを判定する。これには通常音
声パワに着目して判定する。或る閾値を決め、パワがこ
れより大きいときは音声区間であり、これ以下のときは
非音声区間であると判定する。この方法により判定され
る音声/非音声の区別は音声学的な意味において厳密で
ある必要はない。非音声用のモードにより符号化したと
き、品質の劣化が生じない範囲の分類精度であればよ
い。パワの閾値は通常は入力音声の振幅が16ビットに
より量子化されているものとして、1サンプルあたりの
平均パワが数百から1万程度の値のものを使用する。
【0025】次に、音声区間であると判定されたフレー
ムについて、有声音であるか、或は無声音であるかを判
定する。通常この判定は、音声パワと変形相関関数の最
大値を使用して行い、音声パワが或る値、例えば1サン
プルあたりの平均パワが数万〜十万以下であり且つ変形
相関関数の最大値が或る閾値、例えば0.1〜0.3以
下の場合は無声音であると判定する。それ以外の場合
は、有声音であると判定する。この場合も判定は音声学
的に厳密なものである必要はなく、品質の劣化につなが
らなければよい。
【0026】更に、有声と判定された音声区間につい
て、過渡部であるか、或は定常部であるかを判定する。
この判定は、隣接するフレーム間の特徴量の変化分を調
べ、変化が少なければ定常部であり、大きければ過渡部
(非定常)であると判断する。例えば、オープンループ
ピッチの変化量を調べる。過去のフレームにおける適応
符号帳のピッチ周期と、現在のフレームのオープンルー
プピッチの変化分を調べて、変化量が或る閾値を超えて
いるか否かを判断する。通常、CELP系の符号化方法
においては、適応符号帳のピッチ周期は倍ピッチ或は半
ピッチの様な整数倍或は整数分の1の値をとることも多
く、整数倍或は整数分の1倍した値からの変化量が少な
ければ定常と判断してもよい。閾値の例としては、1割
〜2割程度の変化以内とするとよい。PSI−CELP
タイプの符号化方法の様に、適応符号帳と固定符号帳を
切り換えて使用する場合であって、前フレームにおいて
固定符号帳が選択された場合は、ピッチの変化量は大き
いと判断してもよい。ピッチの変化量の他、パワの変化
量或は前フレームの合成音声のパワと現在の入力音声パ
ワの比が閾値例えば1.2倍〜2.0倍以下であるこ
と、前フレームと現在のフレームとの間のスペクトル変
化量が閾値例えば3dB〜10dB以下であることを調
べ、定常であると判断するとよい。
【0027】以上において、音声区間を4つのモードに
分類する例を示したが、モード数は2或は8その他、任
意の数とすることができる。そして、非音声と無声音と
は同一分類として取扱い、過渡部と定常部の分類を更に
細かく、例えばピッチは定常であるが、パワは過渡的で
あるという様な分類とすることができる。また、有声音
について定常部と過渡部とを同一分類として取扱うこと
もできる。 この様に音声区間を分類した後、符号化部
を切り換えて符号化する。
【0028】次に、それぞれの音声区間に適用する符号
化モデルの例を示す。 非音声或は無声音の符号化方法を図5を参照して説
明する。図4におけるモード1およびモード2に対応す
るこれら非音声或は無声音の区間においては、音声のピ
ッチに相当する周期成分がないので、適応符号帳は使用
せず、雑音符号帳8と重み符号の記憶される重み符号帳
11のみにより駆動音源を生成する。そして、これらの
音声区間においては、波形の歪みに対して聴覚的な歪み
の感度が著しく低いので、有声音区間と比較して少ない
ビット数を雑音符号帳8および重み符号帳11、線形予
測パラメータに割り当てることができる。
【0029】 モード3に対応する有声音の過渡部に
ついては、音声を符号化するのに最も多くのビット数を
必要とする。そこで、この音声区間においては、例えば
上述した図2に示されるPSI−CELP符号化方法の
様な高能率の符号化方法を使用すると好適である。 一方、モード4に対応する有声音の定常部について
は、聴覚的に重要ではあるが、音声信号の時間変化が少
ないので、CELP系符号化方法の様な予測符号化方法
の場合は、情報量は比較的に少なくても良好な品質を維
持することができる。この区間の符号化方法を図6に示
す。先ず、ピッチ周波数の変化はゆるやかであるから適
応符号帳70の周期符号は過渡部よりも少ないビット数
を割り当てて、差分符号化とすることができる。差分周
期符号は、差分周期符号復号部80において絶対ピッチ
周期に変換され、適応符号帳70に送られる。適応符号
帳70においてはこのピッチ周期に基づいて適応符号ベ
クトルの候補を作成する。図7は差分周期符号復号部8
0の内部構成を示す。図7において、差分周期符号は差
分周期符号変換部83において、前フレーム適応符号ピ
ッチ周期に乗ずる倍率と微小変動分に変換される。倍率
は1倍のみでも差し支えないが、上述した通り、CEL
P系符号化方法の適応符号ピッチは、容易に整数倍とな
ることがあるので、割り当てビットに余裕がある場合は
1以外の整数倍或は整数分の1倍を用意した方が品質の
劣化は少ない。どの様な倍率と微小変動分の組を用意す
べきかは、割り当てビット数によるが、例えば5ビット
で32コードが使える場合は、倍率1倍のときに微小変
化分22コード、倍率2倍と1/2倍のときはそれぞれ
5コードづつを用意することができる。このとき、微小
変化分は、前フレームのピッチ周期に倍率を乗じた値か
らの変化分を等間隔に量子化してもよいが、まれに生じ
る大きな変化にもビット数を増やすことなく効率的に対
応するには、前フレームのピッチ周期に倍率を乗じた値
に近い周期は量子化幅を細かく、前フレームのピッチ周
期に倍率を乗じた値からの変化が大きい部分について
は、量子化幅を広くとるとよい。同様に、整数倍に割り
当てられた微小変動用のコードが少ない場合は、これら
の量子化幅も広くとると効率的である。
【0030】 図8を参照して有声音定常部の符号化
方法の他の例を説明する。有声音定常部においては、ピ
ッチだけではなく、音声全体の変化も少ないので、適応
符号周期の差分符号化の他に、雑音符号帳81、重み符
号帳11、線形予測パラメータに対するビット割り当て
も削減することができる。特に、PSI−CELP型の
符号化方法の場合は、複数チャンネルある雑音符号帳の
内の一方である雑音符号帳81のみを使用することによ
りビット数を削減することができる。実験の結果、適応
符号ピッチの差分符号化と、線形予測パラメータに割り
当てるビット数の削減をしても、聴覚的には殆ど品質の
劣化は観察されず、重み符号帳のビット数を削減しても
劣化は僅かであった。
【0031】以上の方法において、PSI−CELPを
基本としたときの、各モードにおける各符号帳に割り当
てるビット数の一例を表1に示した。なお、サブフレー
ム長は10ミリ秒、分数表記の欄は、分母数のサブフレ
ームを一括して分子数ビットで符号化することを表す。
モード1のパワの符号化に関しては、4サブフレームと
もモード1であった場合のみ、4サブフレームあたり3
ビットにより符号化するものとする。それ以外は7/4
ビットとする。
【0032】
【表1】 以上の方法は、CELP、PSI−CELP系の符号化
方法以外の予測符号化方法全般に適用することができ
る。
【0033】
【発明の効果】以上の通りであって、この発明は、入力
された音声の特徴を分析していくつかのパターン(モー
ド)に分類し、それぞれのモードに適した符号化モデル
と聴覚的な品質を維持する必要最小限の情報量により符
号化することにより、高い品質を保持したまま、平均の
ビットレート或は蓄積のための全メモリ量を従来の符号
化方法と比較して低減することができる。
【0034】計算機によるシミュレーションおよび一般
人による主観評価実験の結果、平均ビットレート2.1
42kbit/sで、ビットレート3.45kbit/s のPD
Cハーフレート標準PSI−CELP方式と比較して等
価Q値が僅かに約1dB低下し、平均ビットレート2.
218kbit/s においては、PDC標準とほぼ同等の品
質が得られ、この発明の有効性が確認された。
【図面の簡単な説明】
【図1】CELP符号化方法を説明する図。
【図2】PSI−CELP符号化方法を説明する図。
【図3】この発明のモード切り換え符号化方法を説明す
る図。
【図4】音声区間のモード分類の仕方を説明するフロー
チャート。
【図5】非音声、無声音の符号化方法を説明する図。
【図6】有声音定常部の符号化方法を説明する図。
【図7】差分周期符号復号部を説明する図。
【図8】有声音定常部の符号化方法の他の例を説明する
図。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】適応符号帳からフレーム単位毎に或はサブ
    フレーム単位毎に取り出した過去の駆動音源ベクトルを
    ピッチ周期に対応する周期により繰り返して作成した時
    系列ベクトル、雑音符号帳から取り出した時系列ベクト
    ル、或はこれらの双方の時系列ベクトルによりフィルタ
    を駆動して楽音を含む音声を再生することによる入力音
    声を符号化する音声の符号化方法において、 入力音声を符号化するに先だって、そのフレーム区間或
    はサブフレーム区間の特徴を抽出し、 抽出された特徴に対応した符号化方法およびビットレー
    トを選択して符号化する、 ことを特徴とする音声の符号化方法。
  2. 【請求項2】 請求項1に記載される音声の符号化方法
    において、 入力音声の特徴抽出に際して有声音であると判断された
    音声区間について、適応符号帳から取り出した過去の駆
    動音源ベクトルをピッチ周期に対応する周期により繰り
    返して作成した時系列ベクトルと、雑音符号帳から取り
    出した時系列ベクトルを適応符号帳のピッチ周期に対応
    する周期により周期化した時系列ベクトルとによりフィ
    ルタを駆動して音声を再生する符号化方法を使用する、 ことを特徴とする音声の符号化方法。
  3. 【請求項3】 請求項1に記載される音声の符号化方法
    において、 当該音声区間が定常的であると判断されたフレーム或は
    サブフレームについて、適応符号帳のピッチ周期を過去
    のピッチ周期の1倍或は定数倍或は定数分の1倍に微小
    変化分を加減算して表現する、 ことを特徴とする音声の符号化方法。
  4. 【請求項4】 請求項2に記載される音声の符号化方法
    において、 当該音声区間が定常的であると判断されたフレーム或は
    サブフレームについて、 適応符号帳のピッチ周期を過去のピッチ周期の1倍或は
    定数倍或は定数分の1倍に微小変化分を加減算して表現
    する、 ことを特徴とする音声の符号化方法。
  5. 【請求項5】 請求項4に記載される音声の符号化方法
    において、 過去のピッチ周期の1倍或は定数倍或は定数分の1倍に
    加減算する微小変化分の量子化幅を、変化分が小さいと
    きは狭く、変化分が大きいときは広くとって表現する、 ことを特徴とする音声の符号化方法。
  6. 【請求項6】 請求項4或は請求項5の何れかに記載さ
    れる音声の符号化方法において、 過去のピッチ周期の1倍以外の定数倍或は定数分の1倍
    に加減算する微小変化分の量子化幅を、1倍のときの量
    子化幅より広くとって表現する、 ことを特徴とする音声の符号化方法。
  7. 【請求項7】 請求項6に記載される音声の符号化方法
    において、 当該音声区間が定常的であると判断されたフレーム或は
    サブフレームについて、スペクトルパラメータ或は利得
    符号ベクトル或は雑音符号ベクトル或はこれらのすべて
    に割り当てられるビット数を、有声音であって定常的で
    はないと判断されるフレーム或はサブフレームにおいて
    割り当てられるビット数よりも少なく割り当てる、 ことを特徴とする音声の符号化方法。
  8. 【請求項8】 請求項7に記載される音声の符号化方法
    において、 隣接するフレーム或はサブフレーム間の、符号化に先だ
    って抽出したか或は量子化された、ピッチおよびパワお
    よびスペクトルの変化分が予め設定された閾値よりも小
    であることを以て当該音声区間は定常的であると判断す
    る、 ことを特徴とする音声の符号化方法。
JP01840694A 1994-02-15 1994-02-15 音声の符号化方法 Expired - Lifetime JP3353852B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01840694A JP3353852B2 (ja) 1994-02-15 1994-02-15 音声の符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01840694A JP3353852B2 (ja) 1994-02-15 1994-02-15 音声の符号化方法

Publications (2)

Publication Number Publication Date
JPH07225599A true JPH07225599A (ja) 1995-08-22
JP3353852B2 JP3353852B2 (ja) 2002-12-03

Family

ID=11970796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01840694A Expired - Lifetime JP3353852B2 (ja) 1994-02-15 1994-02-15 音声の符号化方法

Country Status (1)

Country Link
JP (1) JP3353852B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08202398A (ja) * 1995-01-30 1996-08-09 Nec Corp 音声符号化装置
JP2002533772A (ja) * 1998-12-21 2002-10-08 クゥアルコム・インコーポレイテッド 可変レートスピーチコーディング
WO2003015080A1 (en) * 2001-08-02 2003-02-20 Matsushita Electric Industrial Co., Ltd. Pitch cycle search range setting device and pitch cycle search device
JP2005338872A (ja) * 1999-09-22 2005-12-08 Conexant Systems Inc マルチモードの音声符号器
JP4842472B2 (ja) * 1999-07-19 2011-12-21 クゥアルコム・インコーポレイテッド フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
JP2012532344A (ja) * 2009-06-29 2012-12-13 サムスン エレクトロニクス カンパニー リミテッド 加重線形予測変換を利用したオーディオ信号符号化及び復号化装置並びにその方法
JP2013156649A (ja) * 2010-01-08 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
JPWO2012111512A1 (ja) * 2011-02-16 2014-07-07 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08202398A (ja) * 1995-01-30 1996-08-09 Nec Corp 音声符号化装置
JP2011123506A (ja) * 1998-12-21 2011-06-23 Qualcomm Inc 可変レートスピーチ符号化
JP2002533772A (ja) * 1998-12-21 2002-10-08 クゥアルコム・インコーポレイテッド 可変レートスピーチコーディング
JP2013178545A (ja) * 1998-12-21 2013-09-09 Qualcomm Inc 可変レートスピーチ符号化
JP4927257B2 (ja) * 1998-12-21 2012-05-09 クゥアルコム・インコーポレイテッド 可変レートスピーチ符号化
JP4842472B2 (ja) * 1999-07-19 2011-12-21 クゥアルコム・インコーポレイテッド フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
JP2005338872A (ja) * 1999-09-22 2005-12-08 Conexant Systems Inc マルチモードの音声符号器
US7177802B2 (en) 2001-08-02 2007-02-13 Matsushita Electric Industrial Co., Ltd. Pitch cycle search range setting apparatus and pitch cycle search apparatus
US7542898B2 (en) 2001-08-02 2009-06-02 Panasonic Corporation Pitch cycle search range setting apparatus and pitch cycle search apparatus
CN100354927C (zh) * 2001-08-02 2007-12-12 松下电器产业株式会社 解码自适应声源向量产生装置及其语音解码装置
CN100354926C (zh) * 2001-08-02 2007-12-12 松下电器产业株式会社 音调周期搜索装置
WO2003015080A1 (en) * 2001-08-02 2003-02-20 Matsushita Electric Industrial Co., Ltd. Pitch cycle search range setting device and pitch cycle search device
JP2012532344A (ja) * 2009-06-29 2012-12-13 サムスン エレクトロニクス カンパニー リミテッド 加重線形予測変換を利用したオーディオ信号符号化及び復号化装置並びにその方法
JP2013156649A (ja) * 2010-01-08 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
JPWO2012111512A1 (ja) * 2011-02-16 2014-07-07 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
JP5613781B2 (ja) * 2011-02-16 2014-10-29 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
US9230554B2 (en) 2011-02-16 2016-01-05 Nippon Telegraph And Telephone Corporation Encoding method for acquiring codes corresponding to prediction residuals, decoding method for decoding codes corresponding to noise or pulse sequence, encoder, decoder, program, and recording medium

Also Published As

Publication number Publication date
JP3353852B2 (ja) 2002-12-03

Similar Documents

Publication Publication Date Title
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
KR100566713B1 (ko) 음향 파라미터 부호화, 복호화 방법, 장치 및 프로그램, 음성 부호화, 복호화 방법, 장치 및 프로그램
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
US9972325B2 (en) System and method for mixed codebook excitation for speech coding
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JPH08272395A (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3353852B2 (ja) 音声の符号化方法
JPH05265496A (ja) 複数のコードブックを有する音声符号化方法
JP3490324B2 (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3153075B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH05232996A (ja) 音声符号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3024467B2 (ja) 音声符号化装置
JPH02160300A (ja) 音声符号化方式
JPH08160996A (ja) 音声符号化装置
JP3270146B2 (ja) 音声符号化装置
Sahab et al. SPEECH CODING ALGORITHMS: LPC10, ADPCM, CELP AND VSELP
JPH0284700A (ja) 音声符号化復号化装置
JPH01258000A (ja) 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070927

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110927

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120927

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130927

Year of fee payment: 11

EXPY Cancellation because of completion of term