JP3250398B2 - 線形予測係数分析装置 - Google Patents

線形予測係数分析装置

Info

Publication number
JP3250398B2
JP3250398B2 JP32249594A JP32249594A JP3250398B2 JP 3250398 B2 JP3250398 B2 JP 3250398B2 JP 32249594 A JP32249594 A JP 32249594A JP 32249594 A JP32249594 A JP 32249594A JP 3250398 B2 JP3250398 B2 JP 3250398B2
Authority
JP
Japan
Prior art keywords
analysis
linear prediction
coefficient
autocorrelation function
windowing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP32249594A
Other languages
English (en)
Other versions
JPH08179799A (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP32249594A priority Critical patent/JP3250398B2/ja
Priority to US08/559,667 priority patent/US5774846A/en
Priority to DE69532879T priority patent/DE69532879T2/de
Priority to EP95118647A priority patent/EP0718820B1/en
Priority to EP03024766A priority patent/EP1391878A3/en
Priority to EP03024767A priority patent/EP1391879A3/en
Publication of JPH08179799A publication Critical patent/JPH08179799A/ja
Priority to US09/059,568 priority patent/US6067518A/en
Priority to US09/475,248 priority patent/US6167373A/en
Priority to US09/475,249 priority patent/US6205421B1/en
Application granted granted Critical
Publication of JP3250398B2 publication Critical patent/JP3250398B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ある時間長のディジタ
ル信号の線形予測分析を行う線形予測係数分析装置に関
するものである。
【0002】
【従来の技術】携帯電話等のディジタル移動通信の分野
では加入者の増加に対処するために低ビットレートの音
声の圧縮符号化法が求められており、各研究機関におい
て研究開発が進んでいる。日本国内においてはモトロー
ラ社の開発したビットレート11.2kbpsのVSE
LPという符号化法がディジタル携帯電話用の標準符号
化方式として採用された(同方式を搭載したディジタル
携帯電話は1994年秋に国内において発売された)。
また更に、NTT移動通信網株式会社の開発したビット
レート5.6kbpsのPSI−CELPという符号化
方式が次期携帯電話の標準化方式として採用され、現在
製品開発の段階にある。これらの方式はいずれもCEL
P(Code Exited Linear Pred
iction: M.R.Schroeder ”High Quality Speech
at Low Bit Rates” Proc.ICASSP'85 pp.937-940に記
載されている)という方式を改良したものである。これ
は音声を音源情報と声道情報とに分離し、音源情報につ
いては符号帳に格納された複数の音源サンプルのインデ
クスによって符号化し声道情報についてはLPC(線形
予測係数)を符号化するということと、音源情報符号化
の際には声道情報を加味して入力音声と比較を行なうと
いう方法(A−b−S:Analysis by Sy
nthesis)を採用していることに特徴がある。
【0003】ここで、CELP方式の基本的アルゴリズ
ムについて説明する。図3はCELP方式の符号化装置
の機能ブロック図である。まず、LPC分析部22におい
て、入力された音声データ21に対して自己相関分析とL
PC分析を行なうことによってLPC係数を得、また得
られたLPC係数の符号化を行ないLPC符号を得、ま
た得られたLPC符号を復号化して復号化LPC係数を
得る。次に、加算部25において、適応符号帳23と確率的
符号帳24に格納された音源サンプルを取り出し、それぞ
れに対する最適ゲインを求め、その最適ゲインによって
パワー調節したそれぞれの音源を加算して合成音源を得
る。更に、LPC合成部26において、加算部25で得られ
た合成音源に対して、LPC分析部22で得られた復号化
LPC係数によってフィルタリングを行ない合成音を得
る。更に、比較部27は、適応符号帳23と確率的符号帳24
の全ての音源サンプルに対して加算部25、LPC合成部
26を機能させることによって得られる多くの合成音と入
力音声との距離計算を行ない、その結果得られる距離の
中で最も小さいときの音源サンプルのインデクスを求め
る。パラメータ符号化部28では、最適ゲインの符号化を
行なうことによってゲイン符号を得、LPC符号、音源
サンプルのインデクス等をまとめて伝送路29へ送る。ま
た、ゲイン符号とインデクスから合成音源を作成し、そ
れを適応符号帳23に格納すると同時に古い音源サンプル
を破棄する。また、LPC合成部26においては、線形予
測係数や高域強調フィルタや長期予測係数(入力音声の
長期予測分析を行なうことによって得られる)を用いた
聴感重み付けを行なう。また、適応符号帳と確率的符号
帳による音源探索は、分析区間を更に細かく分けた区間
(サブフレームと呼ばれる)で行われる。
【0004】上記アルゴリズムにおけるLPC分析部22
をはじめとして、線形予測分析を用いる符号化法は多
い。これらに共通する線形予測分析の機能ブロック図を
図4に示す。まず、ある時間長の入力音声信号31に対し
て、窓掛け32で窓係数を乗ずる。窓係数として用いられ
るものとしては、ハミング窓、ハニング窓、ブラックマ
ン−ハリス窓等がある。この処理を以下の(数1)に示
す。
【0005】
【数1】
【0006】次に、相関分析33を行い、自己相関関数を
求める。この処理を以下の(数2)に示す。
【0007】
【数2】
【0008】次に自己相関関数に対して自己相関法によ
る線形予測分析34によって線形予測係数を求める。分析
方法については各音声情報処理関連書(J.D.マーケ
ル著「音声の線形予測」(コロナ社)等)に記載されて
いる。
【0009】
【発明が解決しようとする課題】ここで、窓掛けで用い
る窓係数はいずれも両端にいくほど値が小さくなる。分
析区間に窓掛けをしたのでは、分析区間の中央の情報が
分析区間の代表値となり、両端の情報がなくなってしま
う。そこで、通常のCELP方式においては、図5に示
すように先読み区間をもうけ、未来と過去にまたがった
大きな窓を掛けることが多い。この処理によって現分析
区間全体の情報を反映させることができる。しかし、先
読み区間はそのままコーデックの処理遅延時間になって
しまう。したがって、携帯電話等の通信に用いるコーデ
ックでは先読み区間としては数msec程の僅かな時間
しかもうけていない。そのため、分析区間の両端付近の
音声の情報が反映されにくくなっていた。そのため、有
声子音等のようなスペクトル変動が大きな音が入力され
ると、音質が局所的に劣化するという問題を有してい
た。
【0010】
【課題を解決するための手段】この問題を解決するため
に、本発明は、部分区間抽出手段、窓掛け手段、自己相
関分析手段、加算手段、線形予測分析手段を備え、分析
区間毎に処理を行う線形予測係数分析装置であって、部
分区間抽出手段は、一分析区間の入力信号における様々
な場所から複数の部分区間信号を抽出し、窓掛け手段
は、抽出された複数の部分区間信号の各々に分析窓係数
を乗じ、自己相関分析手段は、窓掛け係数で得られる信
号の各々から自己相関関数を得、加算手段は、得られた
自己相関関数に重み付け加算して合成自己相関関数を
得、線形予測分析手段は、合成自己相関関数に対して線
形予測分析を行い線形予測係数を得ることを特徴として
いる。
【0011】
【作用】以上の構成によって、分析区間内の情報が反映
されにくい部分区間に対して小さい分析窓によって窓掛
けを行い、その信号から自己相関関数を求め、これを加
えた合成自己相関関数に対して線形予測分析を行うこと
によって、情報の反映されにくい部分の情報を線形予測
係数に反映させることができ、スペクトル変動の激しい
音の音質を向上させることができる。
【0012】
【実施例】以下、本発明の実施例について説明する。本
実施例の線形予測分析装置の機能ブロック図を図1に示
す。各ブロックの機能について説明する。
【0013】まず、分析区間の入力音声信号11に対し
て、様々な場所から様々な長さの連続した信号(部分区
間と呼ぶ)を抽出する(部分区間抽出12)。ここで、部
分区間は互いに重なってもよい。次に、それぞれの信号
に対して窓係数を乗ずる(窓掛け13)。窓係数として用
いられるものとしては、ハミング窓、ハニング窓、ブラ
ックマン−ハリス窓等がある。次に、自己相関分析14を
行い、自己相関関数を求める。この窓掛け13と自己相関
分析14の処理は前記従来例と同様に(数1)、(数2)
で示されるが、従来例では分析区間全体についてこの処
理を行なっているのに対し、本実施例では抽出した各部
分区間について行なっている点が異なる。
【0014】そして、上記窓掛けと自己相関分析を分析
区間内の複数の部分区間について行い、それぞれの自己
相関関数に重みを付けて加算することによって合成自己
相関関数を得る(係数加算15)。この処理の様子を図2
に示す。また、加算の方法を以下の(数3)に示す。
【0015】
【数3】
【0016】次に合成自己相関関数に対して自己相関法
による線形予測分析を行うことによって線形予測係数を
求める(線形予測分析16)。分析方法については各音声
情報処理関連書(J.D.マーケル著「音声の線形予
測」(コロナ社)等)に記載されている。
【0017】ここで、上記自己相関関数の加算の方法に
ついて説明を補足する。自己相関関数の加算に用いる重
みは、目的によって異なる。分析区間の後ろを強調する
場合は、分析区間の後半の部分に小さい窓を掛けて自己
相関関数を求め、大きな重みを付けて加算する。また、
分析区間全体を代表する線形予測係数を求める場合は、
各窓の重みにより分析区間内のデータに一様に重みが掛
かるようにする。具体的には、窓係数の和が1に近くな
るようにするといった方法が挙げられる。この場合は、
以下の(数4)に示す誤差Eを最小にする重みWjを求
める。
【0018】
【数4】
【0019】そのために、上記誤差Eを各重みで偏微分
して得られる、以下の(数5)に示す連立方程式の解を
求める。
【0020】
【数5】
【0021】上記に述べた方法を用いて、CELPの応
用方式に基づく符号化・復号化実験を行った。実験条件
を述べる。音声のサンプリングレートが8kHz、分析
区間長は256サンプルで、窓掛けは、1〜32と22
5〜256に長さ32のハミング窓、1〜64と193
〜256に長さ64のハミング窓、1〜128と129
〜256に長さ128のハミング窓、1〜256に長さ
256のハミング窓の計7窓を用い、窓係数の合計が1
に近くなるように重みを計算した。従来法で符号化した
場合には局所的異音が発生していた音声サンプルに対し
て符号化・復号化を行い、得られた合成音声に対して試
聴実験を行ったところ、局所的異音が減少し音質が大き
く改善されたことが確認できた。
【0022】
【発明の効果】以上のように、本発明は簡単な処理であ
りながら、その特徴によって、分析区間内の情報が反映
されにくい部分に小さい分析窓によって窓掛けを行い、
その信号から自己相関関数を求め、これを加えた合成自
己相関関数に対して線形予測分析を行うことによって、
情報の反映されにくい部分の情報を線形予測係数に反映
させることができ、スペクトル変動の激しい音の音質を
向上させることができる。また、重みを変えることによ
り、分析区間の局所的な部分の情報をより反映させた線
形予測係数を得ることも可能であり、本発明の効果は大
きい。
【図面の簡単な説明】
【図1】実施例の線形予測分析装置の機能ブロック図
【図2】本発明の自己相関関数の加算の様子を示した図
【図3】CELP方式の基本機能のブロック図
【図4】CELP方式の機能ブロックのLPC分析部の
機能ブロック図
【図5】従来例における窓掛けの方法を示した図
【符号の説明】
21 入力音声 22 LPC分析部 23 適応符号帳 24 確率的符号帳 25 加算部 26 LPC合成部 27 比較部 28 パラメータ符号化部 29 伝送路 31 入力音声 32 窓掛け 33 自己相関分析 34 線形予測分析
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭56−129972(JP,A) 欧州特許出願公開718820(EP,A 1) 米国特許5774846(US,A) 米国特許6067518(US,A) 米国特許6167373(US,A) 電子情報通子学会研究報告[音声], Vol.93,No.463,SP93−139, 大室仲 外「PSI−CELP音声符号 化のビットレート化に関する検討」, p.9−16(1994年2月17日発行) 電子情報通子学会研究報告[音声], Vol.95,No.355,SP95−80, 森井利幸 外「音声の短時間的特徴に対 応したマルチオードCELP符号化」, p.55−62(1995年11月16日発行) Proceedings of 1996 IEEE 46th Vehcular Technology Cnfere nce,N.Tanaka et a l,”A Multi−Mode Va riable Rate Speech Coder for CDMA Ce llular Systems”,p. 198−202,April 28−May 1,1996,Atlanta,Gerog ia,USA (58)調査した分野(Int.Cl.7,DB名) G10L 19/02 G10L 11/00

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 部分区間抽出手段、窓掛け手段、自己相
    関分析手段、加算手段、線形予測分析手段を備え、分析
    区間毎に処理を行う線形予測係数分析装置であって、部
    分区間抽出手段は、一分析区間の入力信号における様々
    な場所から複数の部分区間信号を抽出し、窓掛け手段
    は、抽出された複数の部分区間信号の各々に分析窓係数
    を乗じ、自己相関分析手段は、窓掛け係数で得られる信
    号の各々から自己相関関数を得、加算手段は、得られた
    自己相関関数に重み付け加算して合成自己相関関数を
    得、線形予測分析手段は、合成自己相関関数に対して線
    形予測分析を行い線形予測係数を得る線形予測係数分析
    装置。
JP32249594A 1994-12-19 1994-12-26 線形予測係数分析装置 Expired - Lifetime JP3250398B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP32249594A JP3250398B2 (ja) 1994-12-26 1994-12-26 線形予測係数分析装置
US08/559,667 US5774846A (en) 1994-12-19 1995-11-20 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP95118647A EP0718820B1 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP03024766A EP1391878A3 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
DE69532879T DE69532879T2 (de) 1994-12-19 1995-11-27 Vorrichtung zur Sprachkodierung, zur linear-prädiktiven Analyse und zur Geräuschverminderung
EP03024767A EP1391879A3 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US09/059,568 US6067518A (en) 1994-12-19 1998-04-14 Linear prediction speech coding apparatus
US09/475,248 US6167373A (en) 1994-12-19 1999-12-30 Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal
US09/475,249 US6205421B1 (en) 1994-12-19 1999-12-30 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32249594A JP3250398B2 (ja) 1994-12-26 1994-12-26 線形予測係数分析装置

Publications (2)

Publication Number Publication Date
JPH08179799A JPH08179799A (ja) 1996-07-12
JP3250398B2 true JP3250398B2 (ja) 2002-01-28

Family

ID=18144288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32249594A Expired - Lifetime JP3250398B2 (ja) 1994-12-19 1994-12-26 線形予測係数分析装置

Country Status (1)

Country Link
JP (1) JP3250398B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4658853B2 (ja) * 2006-04-13 2011-03-23 日本電信電話株式会社 適応ブロック長符号化装置、その方法、プログラム及び記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774846A (en) 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US6067518A (en) 1994-12-19 2000-05-23 Matsushita Electric Industrial Co., Ltd. Linear prediction speech coding apparatus
US6167373A (en) 1994-12-19 2000-12-26 Matsushita Electric Industrial Co., Ltd. Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Proceedings of 1996 IEEE 46th Vehcular Technology Cnference,N.Tanaka et al,"A Multi−Mode Variable Rate Speech Coder for CDMA Cellular Systems",p.198−202,April 28−May 1,1996,Atlanta,Gerogia,USA
電子情報通子学会研究報告[音声],Vol.93,No.463,SP93−139,大室仲 外「PSI−CELP音声符号化のビットレート化に関する検討」,p.9−16(1994年2月17日発行)
電子情報通子学会研究報告[音声],Vol.95,No.355,SP95−80,森井利幸 外「音声の短時間的特徴に対応したマルチオードCELP符号化」,p.55−62(1995年11月16日発行)

Also Published As

Publication number Publication date
JPH08179799A (ja) 1996-07-12

Similar Documents

Publication Publication Date Title
JP4866438B2 (ja) 音声符号化方法及び装置
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP4870313B2 (ja) 可変レート音声符号器におけるフレーム消去補償方法
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
Besacier et al. GSM speech coding and speaker recognition
JP5232151B2 (ja) パケットベースのエコー除去および抑制
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
KR20010099764A (ko) 광대역 신호들 코딩에서 적응성 대역폭 피치 검색 방법 및디바이스
KR20080093074A (ko) 오디오신호들의 분류
EP1535277B1 (en) Bandwidth-adaptive quantization
US6728669B1 (en) Relative pulse position in celp vocoding
JP3357795B2 (ja) 音声符号化方法および装置
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
US6539349B1 (en) Constraining pulse positions in CELP vocoding
Guillemin et al. Impact of the GSM AMR speech codec on formant information important to forensic speaker identification
JP3353852B2 (ja) 音声の符号化方法
JP3250398B2 (ja) 線形予測係数分析装置
JP3050978B2 (ja) 音声符号化方法
EP1298647B1 (en) A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder
US6385574B1 (en) Reusing invalid pulse positions in CELP vocoding
JP3183072B2 (ja) 音声符号化装置
KR100984094B1 (ko) 가우시안 혼합 모델을 이용한 3세대 파트너십 프로젝트2의 선택 모드 보코더를 위한 실시간 유무성음 분류 방법
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071116

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 12

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term