JP3250398B2 - 線形予測係数分析装置 - Google Patents
線形予測係数分析装置Info
- Publication number
- JP3250398B2 JP3250398B2 JP32249594A JP32249594A JP3250398B2 JP 3250398 B2 JP3250398 B2 JP 3250398B2 JP 32249594 A JP32249594 A JP 32249594A JP 32249594 A JP32249594 A JP 32249594A JP 3250398 B2 JP3250398 B2 JP 3250398B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- linear prediction
- coefficient
- autocorrelation function
- windowing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
ル信号の線形予測分析を行う線形予測係数分析装置に関
するものである。
では加入者の増加に対処するために低ビットレートの音
声の圧縮符号化法が求められており、各研究機関におい
て研究開発が進んでいる。日本国内においてはモトロー
ラ社の開発したビットレート11.2kbpsのVSE
LPという符号化法がディジタル携帯電話用の標準符号
化方式として採用された(同方式を搭載したディジタル
携帯電話は1994年秋に国内において発売された)。
また更に、NTT移動通信網株式会社の開発したビット
レート5.6kbpsのPSI−CELPという符号化
方式が次期携帯電話の標準化方式として採用され、現在
製品開発の段階にある。これらの方式はいずれもCEL
P(Code Exited Linear Pred
iction: M.R.Schroeder ”High Quality Speech
at Low Bit Rates” Proc.ICASSP'85 pp.937-940に記
載されている)という方式を改良したものである。これ
は音声を音源情報と声道情報とに分離し、音源情報につ
いては符号帳に格納された複数の音源サンプルのインデ
クスによって符号化し声道情報についてはLPC(線形
予測係数)を符号化するということと、音源情報符号化
の際には声道情報を加味して入力音声と比較を行なうと
いう方法(A−b−S:Analysis by Sy
nthesis)を採用していることに特徴がある。
ムについて説明する。図3はCELP方式の符号化装置
の機能ブロック図である。まず、LPC分析部22におい
て、入力された音声データ21に対して自己相関分析とL
PC分析を行なうことによってLPC係数を得、また得
られたLPC係数の符号化を行ないLPC符号を得、ま
た得られたLPC符号を復号化して復号化LPC係数を
得る。次に、加算部25において、適応符号帳23と確率的
符号帳24に格納された音源サンプルを取り出し、それぞ
れに対する最適ゲインを求め、その最適ゲインによって
パワー調節したそれぞれの音源を加算して合成音源を得
る。更に、LPC合成部26において、加算部25で得られ
た合成音源に対して、LPC分析部22で得られた復号化
LPC係数によってフィルタリングを行ない合成音を得
る。更に、比較部27は、適応符号帳23と確率的符号帳24
の全ての音源サンプルに対して加算部25、LPC合成部
26を機能させることによって得られる多くの合成音と入
力音声との距離計算を行ない、その結果得られる距離の
中で最も小さいときの音源サンプルのインデクスを求め
る。パラメータ符号化部28では、最適ゲインの符号化を
行なうことによってゲイン符号を得、LPC符号、音源
サンプルのインデクス等をまとめて伝送路29へ送る。ま
た、ゲイン符号とインデクスから合成音源を作成し、そ
れを適応符号帳23に格納すると同時に古い音源サンプル
を破棄する。また、LPC合成部26においては、線形予
測係数や高域強調フィルタや長期予測係数(入力音声の
長期予測分析を行なうことによって得られる)を用いた
聴感重み付けを行なう。また、適応符号帳と確率的符号
帳による音源探索は、分析区間を更に細かく分けた区間
(サブフレームと呼ばれる)で行われる。
をはじめとして、線形予測分析を用いる符号化法は多
い。これらに共通する線形予測分析の機能ブロック図を
図4に示す。まず、ある時間長の入力音声信号31に対し
て、窓掛け32で窓係数を乗ずる。窓係数として用いられ
るものとしては、ハミング窓、ハニング窓、ブラックマ
ン−ハリス窓等がある。この処理を以下の(数1)に示
す。
求める。この処理を以下の(数2)に示す。
る線形予測分析34によって線形予測係数を求める。分析
方法については各音声情報処理関連書(J.D.マーケ
ル著「音声の線形予測」(コロナ社)等)に記載されて
いる。
る窓係数はいずれも両端にいくほど値が小さくなる。分
析区間に窓掛けをしたのでは、分析区間の中央の情報が
分析区間の代表値となり、両端の情報がなくなってしま
う。そこで、通常のCELP方式においては、図5に示
すように先読み区間をもうけ、未来と過去にまたがった
大きな窓を掛けることが多い。この処理によって現分析
区間全体の情報を反映させることができる。しかし、先
読み区間はそのままコーデックの処理遅延時間になって
しまう。したがって、携帯電話等の通信に用いるコーデ
ックでは先読み区間としては数msec程の僅かな時間
しかもうけていない。そのため、分析区間の両端付近の
音声の情報が反映されにくくなっていた。そのため、有
声子音等のようなスペクトル変動が大きな音が入力され
ると、音質が局所的に劣化するという問題を有してい
た。
に、本発明は、部分区間抽出手段、窓掛け手段、自己相
関分析手段、加算手段、線形予測分析手段を備え、分析
区間毎に処理を行う線形予測係数分析装置であって、部
分区間抽出手段は、一分析区間の入力信号における様々
な場所から複数の部分区間信号を抽出し、窓掛け手段
は、抽出された複数の部分区間信号の各々に分析窓係数
を乗じ、自己相関分析手段は、窓掛け係数で得られる信
号の各々から自己相関関数を得、加算手段は、得られた
自己相関関数に重み付け加算して合成自己相関関数を
得、線形予測分析手段は、合成自己相関関数に対して線
形予測分析を行い線形予測係数を得ることを特徴として
いる。
されにくい部分区間に対して小さい分析窓によって窓掛
けを行い、その信号から自己相関関数を求め、これを加
えた合成自己相関関数に対して線形予測分析を行うこと
によって、情報の反映されにくい部分の情報を線形予測
係数に反映させることができ、スペクトル変動の激しい
音の音質を向上させることができる。
実施例の線形予測分析装置の機能ブロック図を図1に示
す。各ブロックの機能について説明する。
て、様々な場所から様々な長さの連続した信号(部分区
間と呼ぶ)を抽出する(部分区間抽出12)。ここで、部
分区間は互いに重なってもよい。次に、それぞれの信号
に対して窓係数を乗ずる(窓掛け13)。窓係数として用
いられるものとしては、ハミング窓、ハニング窓、ブラ
ックマン−ハリス窓等がある。次に、自己相関分析14を
行い、自己相関関数を求める。この窓掛け13と自己相関
分析14の処理は前記従来例と同様に(数1)、(数2)
で示されるが、従来例では分析区間全体についてこの処
理を行なっているのに対し、本実施例では抽出した各部
分区間について行なっている点が異なる。
区間内の複数の部分区間について行い、それぞれの自己
相関関数に重みを付けて加算することによって合成自己
相関関数を得る(係数加算15)。この処理の様子を図2
に示す。また、加算の方法を以下の(数3)に示す。
による線形予測分析を行うことによって線形予測係数を
求める(線形予測分析16)。分析方法については各音声
情報処理関連書(J.D.マーケル著「音声の線形予
測」(コロナ社)等)に記載されている。
ついて説明を補足する。自己相関関数の加算に用いる重
みは、目的によって異なる。分析区間の後ろを強調する
場合は、分析区間の後半の部分に小さい窓を掛けて自己
相関関数を求め、大きな重みを付けて加算する。また、
分析区間全体を代表する線形予測係数を求める場合は、
各窓の重みにより分析区間内のデータに一様に重みが掛
かるようにする。具体的には、窓係数の和が1に近くな
るようにするといった方法が挙げられる。この場合は、
以下の(数4)に示す誤差Eを最小にする重みWjを求
める。
して得られる、以下の(数5)に示す連立方程式の解を
求める。
用方式に基づく符号化・復号化実験を行った。実験条件
を述べる。音声のサンプリングレートが8kHz、分析
区間長は256サンプルで、窓掛けは、1〜32と22
5〜256に長さ32のハミング窓、1〜64と193
〜256に長さ64のハミング窓、1〜128と129
〜256に長さ128のハミング窓、1〜256に長さ
256のハミング窓の計7窓を用い、窓係数の合計が1
に近くなるように重みを計算した。従来法で符号化した
場合には局所的異音が発生していた音声サンプルに対し
て符号化・復号化を行い、得られた合成音声に対して試
聴実験を行ったところ、局所的異音が減少し音質が大き
く改善されたことが確認できた。
りながら、その特徴によって、分析区間内の情報が反映
されにくい部分に小さい分析窓によって窓掛けを行い、
その信号から自己相関関数を求め、これを加えた合成自
己相関関数に対して線形予測分析を行うことによって、
情報の反映されにくい部分の情報を線形予測係数に反映
させることができ、スペクトル変動の激しい音の音質を
向上させることができる。また、重みを変えることによ
り、分析区間の局所的な部分の情報をより反映させた線
形予測係数を得ることも可能であり、本発明の効果は大
きい。
機能ブロック図
Claims (1)
- 【請求項1】 部分区間抽出手段、窓掛け手段、自己相
関分析手段、加算手段、線形予測分析手段を備え、分析
区間毎に処理を行う線形予測係数分析装置であって、部
分区間抽出手段は、一分析区間の入力信号における様々
な場所から複数の部分区間信号を抽出し、窓掛け手段
は、抽出された複数の部分区間信号の各々に分析窓係数
を乗じ、自己相関分析手段は、窓掛け係数で得られる信
号の各々から自己相関関数を得、加算手段は、得られた
自己相関関数に重み付け加算して合成自己相関関数を
得、線形予測分析手段は、合成自己相関関数に対して線
形予測分析を行い線形予測係数を得る線形予測係数分析
装置。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32249594A JP3250398B2 (ja) | 1994-12-26 | 1994-12-26 | 線形予測係数分析装置 |
US08/559,667 US5774846A (en) | 1994-12-19 | 1995-11-20 | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
EP95118647A EP0718820B1 (en) | 1994-12-19 | 1995-11-27 | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
EP03024766A EP1391878A3 (en) | 1994-12-19 | 1995-11-27 | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
DE69532879T DE69532879T2 (de) | 1994-12-19 | 1995-11-27 | Vorrichtung zur Sprachkodierung, zur linear-prädiktiven Analyse und zur Geräuschverminderung |
EP03024767A EP1391879A3 (en) | 1994-12-19 | 1995-11-27 | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US09/059,568 US6067518A (en) | 1994-12-19 | 1998-04-14 | Linear prediction speech coding apparatus |
US09/475,248 US6167373A (en) | 1994-12-19 | 1999-12-30 | Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal |
US09/475,249 US6205421B1 (en) | 1994-12-19 | 1999-12-30 | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32249594A JP3250398B2 (ja) | 1994-12-26 | 1994-12-26 | 線形予測係数分析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08179799A JPH08179799A (ja) | 1996-07-12 |
JP3250398B2 true JP3250398B2 (ja) | 2002-01-28 |
Family
ID=18144288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32249594A Expired - Lifetime JP3250398B2 (ja) | 1994-12-19 | 1994-12-26 | 線形予測係数分析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3250398B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4658853B2 (ja) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774846A (en) | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
-
1994
- 1994-12-26 JP JP32249594A patent/JP3250398B2/ja not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774846A (en) | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US6067518A (en) | 1994-12-19 | 2000-05-23 | Matsushita Electric Industrial Co., Ltd. | Linear prediction speech coding apparatus |
US6167373A (en) | 1994-12-19 | 2000-12-26 | Matsushita Electric Industrial Co., Ltd. | Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal |
Non-Patent Citations (3)
Title |
---|
Proceedings of 1996 IEEE 46th Vehcular Technology Cnference,N.Tanaka et al,"A Multi−Mode Variable Rate Speech Coder for CDMA Cellular Systems",p.198−202,April 28−May 1,1996,Atlanta,Gerogia,USA |
電子情報通子学会研究報告[音声],Vol.93,No.463,SP93−139,大室仲 外「PSI−CELP音声符号化のビットレート化に関する検討」,p.9−16(1994年2月17日発行) |
電子情報通子学会研究報告[音声],Vol.95,No.355,SP95−80,森井利幸 外「音声の短時間的特徴に対応したマルチオードCELP符号化」,p.55−62(1995年11月16日発行) |
Also Published As
Publication number | Publication date |
---|---|
JPH08179799A (ja) | 1996-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4866438B2 (ja) | 音声符号化方法及び装置 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
JP4870313B2 (ja) | 可変レート音声符号器におけるフレーム消去補償方法 | |
KR100804461B1 (ko) | 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치 | |
KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
Besacier et al. | GSM speech coding and speaker recognition | |
JP5232151B2 (ja) | パケットベースのエコー除去および抑制 | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
KR20010099764A (ko) | 광대역 신호들 코딩에서 적응성 대역폭 피치 검색 방법 및디바이스 | |
KR20080093074A (ko) | 오디오신호들의 분류 | |
EP1535277B1 (en) | Bandwidth-adaptive quantization | |
US6728669B1 (en) | Relative pulse position in celp vocoding | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
KR100216018B1 (ko) | 배경음을 엔코딩 및 디코딩하는 방법 및 장치 | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
US6539349B1 (en) | Constraining pulse positions in CELP vocoding | |
Guillemin et al. | Impact of the GSM AMR speech codec on formant information important to forensic speaker identification | |
JP3353852B2 (ja) | 音声の符号化方法 | |
JP3250398B2 (ja) | 線形予測係数分析装置 | |
JP3050978B2 (ja) | 音声符号化方法 | |
EP1298647B1 (en) | A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder | |
US6385574B1 (en) | Reusing invalid pulse positions in CELP vocoding | |
JP3183072B2 (ja) | 音声符号化装置 | |
KR100984094B1 (ko) | 가우시안 혼합 모델을 이용한 3세대 파트너십 프로젝트2의 선택 모드 보코더를 위한 실시간 유무성음 분류 방법 | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071116 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081116 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091116 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091116 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131116 Year of fee payment: 12 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |