JP3183743B2 - 音声処理システムにおける線型予測分析方法 - Google Patents
音声処理システムにおける線型予測分析方法Info
- Publication number
- JP3183743B2 JP3183743B2 JP05552993A JP5552993A JP3183743B2 JP 3183743 B2 JP3183743 B2 JP 3183743B2 JP 05552993 A JP05552993 A JP 05552993A JP 5552993 A JP5552993 A JP 5552993A JP 3183743 B2 JP3183743 B2 JP 3183743B2
- Authority
- JP
- Japan
- Prior art keywords
- decoder
- linear
- processing system
- autocorrelation
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【産業上の利用分野】本発明は、音声処理システムにお
ける線型予測符号化技術に関し、特に線型予測器による
線型予測分析方法に関する。
ける線型予測符号化技術に関し、特に線型予測器による
線型予測分析方法に関する。
【0002】
【従来の技術】音声信号の伝送や蓄積を行う場合、音声
信号の波形を直接符号化したのではデータ量が多くな
り、伝送時間やメモリコストが問題となることから、従
来、データを圧縮して符号化する方法がとられている。
このデータ圧縮符号化の1手法として、音声信号を標本
化したサンプル間に相関があることを利用して、サンプ
ルごとに直前までに入力されたサンプルから線型予測分
析を行って、予測値と次のサンプル値との差分を符号化
するものがある。
信号の波形を直接符号化したのではデータ量が多くな
り、伝送時間やメモリコストが問題となることから、従
来、データを圧縮して符号化する方法がとられている。
このデータ圧縮符号化の1手法として、音声信号を標本
化したサンプル間に相関があることを利用して、サンプ
ルごとに直前までに入力されたサンプルから線型予測分
析を行って、予測値と次のサンプル値との差分を符号化
するものがある。
【0003】図3はこのような線型予測分析による符号
器と復号器を備えた従来の音声処理システムの構成図で
ある。図3において、(a)は符号器、(b)は復号器
であり、1は減算器、2は量子化器、3は逆量子化器、
4は加算器、5は線型予測器、6は逆量子化器、7は加
算器、8は線型予測器を示している。
器と復号器を備えた従来の音声処理システムの構成図で
ある。図3において、(a)は符号器、(b)は復号器
であり、1は減算器、2は量子化器、3は逆量子化器、
4は加算器、5は線型予測器、6は逆量子化器、7は加
算器、8は線型予測器を示している。
【0004】符号器(a)において、入力信号x(t)
は、標本化された音声信号のサンプル値であり、時系列
にしたがって入力される。減算器1は、この入力信号x
(t)と予測信号との差分を出力し、量子化器2はこの
差分を量子化および符号化して符号語c(t)を生成す
る。この符号語c(t)は復号器(b)へ伝送されると
ともに、逆量子化器3に入力されて元の差分値が復元さ
れ、さらに加算器4で予測信号と加算され再生信号x′
(t)が生成される。このx′(t)は同時に線型予測
器5に入力され、予測信号が生成される。
は、標本化された音声信号のサンプル値であり、時系列
にしたがって入力される。減算器1は、この入力信号x
(t)と予測信号との差分を出力し、量子化器2はこの
差分を量子化および符号化して符号語c(t)を生成す
る。この符号語c(t)は復号器(b)へ伝送されると
ともに、逆量子化器3に入力されて元の差分値が復元さ
れ、さらに加算器4で予測信号と加算され再生信号x′
(t)が生成される。このx′(t)は同時に線型予測
器5に入力され、予測信号が生成される。
【0005】復号器(b)では、c(t)が入力される
と逆量子化器6で逆量子化し、加算器7で線型予測器8
からの予測信号と加算して再生信号x′(t)を生成す
る。このx′(t)は線型予測器8に入力されて次の予
測信号を生成するために用いられる。
と逆量子化器6で逆量子化し、加算器7で線型予測器8
からの予測信号と加算して再生信号x′(t)を生成す
る。このx′(t)は線型予測器8に入力されて次の予
測信号を生成するために用いられる。
【0006】音声の線型予測器を設計する際に、これま
でに再生した信号の自己相関r(0)からr(N)を用
いて設計する方法が知られており、例えばCCITTで
16kb/s LD−CELPにも採用されている。と
ころが、一般に復号器側では符号器側の内部態様を知ら
ないため、雑音による初期状態のずれが生じることから
出力である再生信号が異なり、自己相関も符号器と復号
器では一致しない。そこで線型予測器を作った後、バン
ドウィズ・エクスパンジョンと呼ばれる方法を用いるこ
とで、時間の経過とともに符号器と復号器の内部状態を
徐々に近づかせることができることが知られている。但
し演算精度が十分高くないと或る程度までしか近づかせ
ることができず、自己相関にも或る程度の食い違いe
(n)が残る。
でに再生した信号の自己相関r(0)からr(N)を用
いて設計する方法が知られており、例えばCCITTで
16kb/s LD−CELPにも採用されている。と
ころが、一般に復号器側では符号器側の内部態様を知ら
ないため、雑音による初期状態のずれが生じることから
出力である再生信号が異なり、自己相関も符号器と復号
器では一致しない。そこで線型予測器を作った後、バン
ドウィズ・エクスパンジョンと呼ばれる方法を用いるこ
とで、時間の経過とともに符号器と復号器の内部状態を
徐々に近づかせることができることが知られている。但
し演算精度が十分高くないと或る程度までしか近づかせ
ることができず、自己相関にも或る程度の食い違いe
(n)が残る。
【0007】そこで従来は符号器側で無音区間等のレベ
ルが十分低いところを検出し、この時、無音であるとい
う情報を送り、符号器・復号器で内部状態を無音に相当
する状態に初期設定していた。
ルが十分低いところを検出し、この時、無音であるとい
う情報を送り、符号器・復号器で内部状態を無音に相当
する状態に初期設定していた。
【0008】しかしながら、公衆電話や音楽が背景にあ
る場合等は無音区間が無いこともあり、必ずしも初期化
できるとは限らず、また、無音であると復号器に通知す
るための情報の伝送が必要となる。
る場合等は無音区間が無いこともあり、必ずしも初期化
できるとは限らず、また、無音であると復号器に通知す
るための情報の伝送が必要となる。
【0009】
【発明が解決しようとする課題】本発明は、自己相関を
用いて線型予測分析を行う線型予測器を有する符号器、
復号器を備えた音声処理システムにおいて、符号器と復
号器における線型予測器の状態の食い違いの影響を抑制
する線型予測分析方法を提供することを目的としてい
る。
用いて線型予測分析を行う線型予測器を有する符号器、
復号器を備えた音声処理システムにおいて、符号器と復
号器における線型予測器の状態の食い違いの影響を抑制
する線型予測分析方法を提供することを目的としてい
る。
【0010】
【課題を解決するための手段】今、相関の次数nと0〜
N、符号器側の自己相関をr(0)〜r(N)、復号器
側のそれらをr(0)+e(0)〜r(N)+e(N)
とすると、16ビット程度の固定小数点演算で符号器・
復号器を実現した場合、本発明者らの実験結果ではe
(n)はほぼ一定レベルであることが判った。さらに線
型予測分析ではr(0)で正規化した自己相関t(n)
=r(n)/r(0)が使われるが、r(0)が小さい
とき(入力信号レベルが小さいとき)は、r(n)≦r
(0)であることから、r(n)も小さく、復号器側の
自己相関は r(n)+e(n)≒e(n) となり、正規化した自己相関では、 t(n)=(r(n)+e(n))/(r(0)+e
(0))≒e(n)/e(0) となって全くの乱数となり、その結果得られる予測器が
発振するフィルタであると、入力が小さいときでも復号
器側では再生信号が異常に大きくなるのが問題であるこ
とが判った。
N、符号器側の自己相関をr(0)〜r(N)、復号器
側のそれらをr(0)+e(0)〜r(N)+e(N)
とすると、16ビット程度の固定小数点演算で符号器・
復号器を実現した場合、本発明者らの実験結果ではe
(n)はほぼ一定レベルであることが判った。さらに線
型予測分析ではr(0)で正規化した自己相関t(n)
=r(n)/r(0)が使われるが、r(0)が小さい
とき(入力信号レベルが小さいとき)は、r(n)≦r
(0)であることから、r(n)も小さく、復号器側の
自己相関は r(n)+e(n)≒e(n) となり、正規化した自己相関では、 t(n)=(r(n)+e(n))/(r(0)+e
(0))≒e(n)/e(0) となって全くの乱数となり、その結果得られる予測器が
発振するフィルタであると、入力が小さいときでも復号
器側では再生信号が異常に大きくなるのが問題であるこ
とが判った。
【0011】そこで、e(n)より十分大きなある定数
aを零次の自己相関r(0)に加えた値を用いて分析す
ると、r(n)が十分大きいときは、 t(n)=[r(n)+e(n)]/[r(0)+e
(0)+a]≒r(n)/[r(0)+a] となり、またr(n)がe(n)程度以下のときは、r
(n),e(n)≪aであるから、 t(n)=[r(n)+e(n)]/[r(0)+e
(0)+a]≒0 となり、いずれの場合もe(n)の影響を殆ど受けず、
従って、内部状態の食い違いの影響が殆ど生じないこと
が判る。
aを零次の自己相関r(0)に加えた値を用いて分析す
ると、r(n)が十分大きいときは、 t(n)=[r(n)+e(n)]/[r(0)+e
(0)+a]≒r(n)/[r(0)+a] となり、またr(n)がe(n)程度以下のときは、r
(n),e(n)≪aであるから、 t(n)=[r(n)+e(n)]/[r(0)+e
(0)+a]≒0 となり、いずれの場合もe(n)の影響を殆ど受けず、
従って、内部状態の食い違いの影響が殆ど生じないこと
が判る。
【0012】本発明は、この原理に基づいて線型予測器
を構成する。図1は、本発明を適応差分量子化方式(A
DPCM)による音声処理システムに適用した場合の構
成を示したものである。
を構成する。図1は、本発明を適応差分量子化方式(A
DPCM)による音声処理システムに適用した場合の構
成を示したものである。
【0013】図1において、(a)は符号器、(b)は
復号器の構成を示し、1は減算器(−)、2は量子化器
(Q)、3および6は逆量子化器(IQ)、4および7
は加算器(+)、5および8′は線型予測器(P)、9
および10は適応制御器(A)である。
復号器の構成を示し、1は減算器(−)、2は量子化器
(Q)、3および6は逆量子化器(IQ)、4および7
は加算器(+)、5および8′は線型予測器(P)、9
および10は適応制御器(A)である。
【0014】全体の基本的動作は、図3で説明した従来
例のシステムの場合と同じであり、図3と異なるのは、
図1の線型予測器8′が図3の線型予測器8を改良した
ものとなっていることと、図1では線型予測器5および
8′に対して、係数を最適化制御するための適応制御器
9および10がそれぞれ付加されていることである。
例のシステムの場合と同じであり、図3と異なるのは、
図1の線型予測器8′が図3の線型予測器8を改良した
ものとなっていることと、図1では線型予測器5および
8′に対して、係数を最適化制御するための適応制御器
9および10がそれぞれ付加されていることである。
【0015】符号器(a)において、入力信号x(t)
は標本化された音声信号のサンプル値であり、時系列に
したがって入力される。減算器1は、この入力信号x
(t)と予測信号との差分を出力し、量子化器2はこの
差分を量子化および符号化して符号語c(t)を生成す
る。この符号語c(t)は復号器(b)へ伝送されると
ともに、逆量子化器3に入力されて元の差分値が復元さ
れ、さらに加算器4で予測信号と加算され再生信号x′
(t)が生成される。このx′(t)は同時に線型予測
器5に入力され、予測信号が生成される。
は標本化された音声信号のサンプル値であり、時系列に
したがって入力される。減算器1は、この入力信号x
(t)と予測信号との差分を出力し、量子化器2はこの
差分を量子化および符号化して符号語c(t)を生成す
る。この符号語c(t)は復号器(b)へ伝送されると
ともに、逆量子化器3に入力されて元の差分値が復元さ
れ、さらに加算器4で予測信号と加算され再生信号x′
(t)が生成される。このx′(t)は同時に線型予測
器5に入力され、予測信号が生成される。
【0016】復号器(b)では、c(t)が入力される
と逆量子化器6で逆量子化し、加算器7で線型予測器
8’からの予測信号と加算して再生信号x′(t)を生
成する。このx′(t)は線型予測器8′に入力されて
次の予測信号を生成するために用いられる。
と逆量子化器6で逆量子化し、加算器7で線型予測器
8’からの予測信号と加算して再生信号x′(t)を生
成する。このx′(t)は線型予測器8′に入力されて
次の予測信号を生成するために用いられる。
【0017】線型予測器5,8′は、直前までに生成さ
れた再生信号x′(t−1),X′(t−2),……か
ら、線型予測係数a1 ,a2 ……,aN を、自己相関r
(0),…,r(N)から求める機能をもつ。
れた再生信号x′(t−1),X′(t−2),……か
ら、線型予測係数a1 ,a2 ……,aN を、自己相関r
(0),…,r(N)から求める機能をもつ。
【0018】自己相関は、mを0〜Nの次数とし、Lを
要素数として、
要素数として、
【0019】
【数1】
【0020】を演算して求める。本発明では、復号器の
線型予測器8′において、零次の自己相関r(0)を演
算した際定数aを加算し、r(0)+aの形にして使用
する。またさらに定数bを用いて、r(0)(1+b)
+aの形にすることもできる。後者の形は、演算精度が
低い場合に、e(n)が零であっても演算誤差のために
線型予測分析がうまく行かなくなることがあるのを防ぐ
効果をもつ。
線型予測器8′において、零次の自己相関r(0)を演
算した際定数aを加算し、r(0)+aの形にして使用
する。またさらに定数bを用いて、r(0)(1+b)
+aの形にすることもできる。後者の形は、演算精度が
低い場合に、e(n)が零であっても演算誤差のために
線型予測分析がうまく行かなくなることがあるのを防ぐ
効果をもつ。
【0021】
【作用】本発明により、線型予測器の演算精度が小さい
場合でも符号器と復号器の状態の間の食い違いの影響を
小さく押さえることが可能となる。
場合でも符号器と復号器の状態の間の食い違いの影響を
小さく押さえることが可能となる。
【0022】
【実施例】図2は、本発明実施例による線型予測器の制
御フローである。まず直前までの再生信号をL個とり、
たとえばL=100として、自己相関r(0),…,r
(N)をそれぞれ求める。次に必要な場合r(0)につ
いてのみ定数(1+b)を乗算したのち、r(0)ある
いはr(0)×(1+b)にr(0)よりも十分大きな
定数aを加え、 r(0)=r(0)+a あるいは r(0)=r
(0)×(1+b)+a を得る。これらのr(0),…,r(N)を用いて既知
のDL法等を適用し、線型予測係数a(1),a
(2),…,a(N)を求める。
御フローである。まず直前までの再生信号をL個とり、
たとえばL=100として、自己相関r(0),…,r
(N)をそれぞれ求める。次に必要な場合r(0)につ
いてのみ定数(1+b)を乗算したのち、r(0)ある
いはr(0)×(1+b)にr(0)よりも十分大きな
定数aを加え、 r(0)=r(0)+a あるいは r(0)=r
(0)×(1+b)+a を得る。これらのr(0),…,r(N)を用いて既知
のDL法等を適用し、線型予測係数a(1),a
(2),…,a(N)を求める。
【0023】さらに符号器の線型予測器5の状態に線型
予測器8′の状態を収束させるためバンドウィズ、エキ
スパンジョン操作を施し、 a(n)=a(n)×αn (n=0,1,…,N) の変換を行って、結果のa(n)を予測係数として出力
し、予測信号を生成させる。
予測器8′の状態を収束させるためバンドウィズ、エキ
スパンジョン操作を施し、 a(n)=a(n)×αn (n=0,1,…,N) の変換を行って、結果のa(n)を予測係数として出力
し、予測信号を生成させる。
【0024】本発明は、図1および図2で説明した例に
限られるものではなく、正規化された自己相関を用いて
線型予測分析を行う任意の線型予測器に適用することが
できる。
限られるものではなく、正規化された自己相関を用いて
線型予測分析を行う任意の線型予測器に適用することが
できる。
【0025】
【発明の効果】本発明により、線型予測器の演算部に比
較的少ないビット数の固定長演算器が用いられていて
も、雑音や演算誤差にあまり影響されることなく符号器
と復号器の状態の食い違いを抑制することができ、低コ
ストで再生音の品質を改善することができる。
較的少ないビット数の固定長演算器が用いられていて
も、雑音や演算誤差にあまり影響されることなく符号器
と復号器の状態の食い違いを抑制することができ、低コ
ストで再生音の品質を改善することができる。
【図1】本発明の原理的構成図である。
【図2】本発明実施例による線型予測器の制御フロー図
である。
である。
【図3】従来の音声処理システムの構成図である。
1 減算器(−) 2 量子化器(Q) 3,6 逆量子化器(IQ) 4,7 加算器(+) 5,8′ 線型予測器(P) 9,10 適応制御器(A)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 坪井 満 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 西山 直美 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 信本 俊明 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 昭60−43700(JP,A) 特開 昭60−57400(JP,A) 特開 昭61−42698(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/02 G10L 11/00
Claims (2)
- 【請求項1】 それぞれが直前までに再生した信号の自
己相関をとり線型予測分析を行う線型予測器を有する符
号器および復号器を備えた音声処理システムにおいて、 復号器の線型予測器は、零次の自己相関r(0)に定数
aを加えた関数r(0)+aを用いて線型予測分析を行
うようにしたことを特徴とする音声処理システムにおけ
る線型予測分析方法。 - 【請求項2】 それぞれが直前までに再生した信号の自
己相関をとり、線型予測分析を行う線型予測器を有する
符号器および復号器を備えた音声処理システムにおい
て、 復号器の線型予測器は、零次の自己相関r(0)に定数
(1+b)を乗じさらに定数aを加えた関数r(0)×
(1+b)+aを用いて線型予測分析を行うようにした
ことを特徴とする音声処理システムにおける線型予測分
析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05552993A JP3183743B2 (ja) | 1993-03-16 | 1993-03-16 | 音声処理システムにおける線型予測分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05552993A JP3183743B2 (ja) | 1993-03-16 | 1993-03-16 | 音声処理システムにおける線型予測分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06266400A JPH06266400A (ja) | 1994-09-22 |
JP3183743B2 true JP3183743B2 (ja) | 2001-07-09 |
Family
ID=13001265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05552993A Expired - Fee Related JP3183743B2 (ja) | 1993-03-16 | 1993-03-16 | 音声処理システムにおける線型予測分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3183743B2 (ja) |
-
1993
- 1993-03-16 JP JP05552993A patent/JP3183743B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH06266400A (ja) | 1994-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Valin et al. | Definition of the opus audio codec | |
JP4504414B2 (ja) | 冗長性低減方法 | |
US9524721B2 (en) | Apparatus and method for concealing frame erasure and voice decoding apparatus and method using the same | |
KR100241498B1 (ko) | 디지털신호 부호화장치 | |
EP0747882B1 (en) | Pitch delay modification during frame erasures | |
KR950014622B1 (ko) | 입력 신호처리 방법 | |
KR100882771B1 (ko) | 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치 | |
JPH0519331B2 (ja) | ||
JP2001102930A (ja) | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 | |
EP0747884B1 (en) | Codebook gain attenuation during frame erasures | |
JPH0590974A (ja) | 前反響処理方法およびその装置 | |
JPH10233696A (ja) | 音声符号化方法 | |
US6157907A (en) | Interpolation in a speech decoder of a transmission system on the basis of transformed received prediction parameters | |
JP3183743B2 (ja) | 音声処理システムにおける線型予測分析方法 | |
JP3095340B2 (ja) | 音声復号化装置 | |
KR100238324B1 (ko) | 오디오 신호의 에러 은닉 방법과 그 장치 | |
JP3498749B2 (ja) | 音声符号化の無音化処理方式 | |
JP3290444B2 (ja) | バックワード型コード励振線形予測復号化器 | |
JP4125520B2 (ja) | 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置 | |
JPH1049200A (ja) | 音声情報圧縮蓄積方法及び装置 | |
JP3068688B2 (ja) | コード励振線形予測符号化方法 | |
JP3229784B2 (ja) | 音声符号化復号化装置及び音声復号化装置 | |
JP3418803B2 (ja) | 音声符号復号化装置 | |
JP2637965B2 (ja) | 音声符号化復号化方法とその装置 | |
JPS635926B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010410 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080427 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090427 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |