JP4574320B2 - 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 - Google Patents
音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4574320B2 JP4574320B2 JP2004306158A JP2004306158A JP4574320B2 JP 4574320 B2 JP4574320 B2 JP 4574320B2 JP 2004306158 A JP2004306158 A JP 2004306158A JP 2004306158 A JP2004306158 A JP 2004306158A JP 4574320 B2 JP4574320 B2 JP 4574320B2
- Authority
- JP
- Japan
- Prior art keywords
- basic
- encoding
- code
- signal
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
一方、近年開発された音声符号化方式では、線形予測分析に基く符号化方式が主流であり、この線形予測分析によって得られる包絡情報を元に雑音を変形して符号化する手法が用いられている(非特許文献3、非特許文献4)。しかし、線形予測分析方式では符号化処理時間単位毎に演算量の多い自己相関関数を求める必要がある。また、符号選択時にはこの包絡情報を符号化処理時間単位毎に反映して符号を選択する必要があり、符号化に要する演算量は上述した波形符号化方式の数10倍となる。
μ則・A則PCMやADPCMによる符号化方式は振幅の非線形圧縮を用いるため、再生音声に重畳する符号化雑音は音声全体のパワと相関が強く、入力音声レベルに依存せずにSN比を一定にできるという利点がある(非特許文献6)。しかし、この符号化雑音は白色雑音となる。将来G.711やG.726への入力音声が、IRS特性等に代表される高域成分が強調された従来の電話機から出力される信号の周波数特性に変更されることが想定されているため、このように高域成分が強調されている信号によれば白色雑音が顕著に知覚されることはない。ここでのIRS特性(非特許文献7)とは図7に示すような緩やかな高域通過フィルタ型の周波数特性を指す。
ITU-T (Telecommunication Standardization Sector, International Telecommunication Union), Geneva, Switzerland. ITU-T G.711-Pulse code modulation (PCM) of voice frequencies, Nov.1988. ITU-T (Telecommunication Standardization Sector, International Telecommunication Union), Geneva, Switzerland. ITU-T G.726-40,32,24,16 kbit/s adaptive differential pulse code modulation (ADPCM), Dec. 1990. B.S. Atal and M. R. Schroeder. Predictive coding of speech signals and subjective error criteria. Vol.27, No.3, pp.247-254. J. Makhoul. Adaptive noise spectral shaping and entropy coding in predictive coding of speech. Vol.27, No.1, pp.63-73. H.Schulzrinne and S. Casner. RFC 3551: RTP profile for audio and video conferences with minimum control, July 2003. N.S. Jayant and P.Noll. Digital Coding of Waveforms, Principles and Applications to Speech and Video. Prentice Hall, Englewood Cliffs, NJ,1984. ITU-T (Telecommunication Standardization Sector, International Telecommunication Union), Geneva, Switzerland. ITU-T P.830 Annex D-modified IRS send and receive characteristics, Feb. 1996.
例えば平坦な周波数特性を持つマイクを使用して音声を収音すると、音声信号は低域(〜1kHz程度)にパワが集中しているため、高域において入力音声に対して符号化雑音が相対的に大きくなり高域側のSN比が悪化する不都合が生じる。
この品質劣化符号化器では固定の高域重み付けフィルタを用い、予め演算して用意した高域重み付き形状符号帳と高域重み付き形状のパワ符号帳などを用いて高品質に再生でき、かつ低演算量で符号化を実現する。
波形符号化方式により音声信号を符号化し、基本符号を送出する基本符号化処理と、この基本符号化処理により符号化された基本符号から基本符号化処理の過程で発生する符号化雑音を基本雑音信号として抽出する基本雑音抽出処理と、基本雑音抽出処理で抽出した基本雑音信号に固定の高域重み付けを付与する重み付き処理と、重み付き処理された基本雑音信号を符号化し、拡張符号を生成する品質拡張符号化処理とを含む。
更に、本発明で提案する品質拡張符号化処理の手順は、先ず重み付き処理された基本雑音信号を用いて雑音形状符号Isを選択し、選択された雑音形状符号Isを手掛かりに理想ゲインを求め、次にこの理想ゲインから利得符号Igを選択する順序に従って符号化処理を実行する手順を提案する。この手順に従うことにより、利得符号を選択する際の演算量を大きく低減することができる効果が得られる。
更に、本発明では品質拡張符号化処理で実行される利得符号Igの具体的な決定方法としては雑音形状符号Isで与えられる重み付き形状符号帳及び重み付き形状のパワ逆数表のIs番目の要素を用いて理想ゲインを求め、この理想ゲインと利得符号帳に用意した全ての要素との距離値が最小となる条件を与える要素の格納インデックスに従って決定する。ここで重み付けとは低減に集中するパワが原因で高域に集中する雑音を補償するために、高域に重み付けすることを示す。
更に本発明の品質拡張符号化処理によれば波形符号化のエンコーダミスマッチによって生じた量子化雑音を低演算量で且つ、高能率に低減することができる。
更に、本発明の広帯域音声符号化方法によれば広帯域の音声信号の特に低域側を低演算量で高品位に伝達し、または記録し、再生することができる。
コンピュータを本発明による音声符号化装置として機能させる場合、コンピュータには音声を波形符号化方式で符号化する基本符号化器と、この基本符号化器で発生する符号化雑音を基本雑音信号として抽出する基本雑音抽出器と、抽出した基本雑音信号に高域重み付けを付与する高域重み付け処理部と、高域重み付け処理された基本雑音信号を雑音形状符号と利得符号に符号化する品質拡張符号化器とが構築され音声符号化処理が実行される。
本実施例では8kHzでサンプリングされた3.4kHz帯域(電話帯域)の音声デジタル信号を入力とする。また、この多段符号化器は実時間処理およびメモリ量の削減を目的とするため、8サンプル(1ms)から160サンプル(20ms)程度の短時間処理フレーム毎に処理を行う。もちろん、オフラインで実施するのであれば、メモリの許す限り信号を保存して一括処理をしても同じ結果が得られる。
品質拡張符号化器30は、この基本雑音信号eを量子化する機能を持つ。まず、高域重み付け部31で高域の重み付けが行われ、高域重み付き基本雑音信号We(Wは重み)を得る。ここでは演算量をできる限り低減するために、以下のFIRフィルタwを用いる。
こうして選択された高域重み付き形状符号帳34および高域重み付き形状のパワ逆数表35のIs番目の要素を用いて、下記の式で表わされる理想ゲインg〜を求める。
最後に、以上で得られた形状符号Isと利得符号Igは拡張符号多重部38で多重化されて拡張符号Ieとなり、伝送されるか又は記録媒体に記録される。
以上に述べた拡張品質の符号選択は、理論的には、形状符号のi番目のベクトル要素ciに高域重み行列Wを乗じ、更に利得符号帳のj番目の要素gjを乗じたものと、高域重み付き雑音ベクトルWeの差分が小さくなるようにiおよびjを選択してそれぞれIsとIgとすることを意味する。これは以下の距離dの計算式を最小化するiとjを探索すると数学的に記述することができる。
ここで、前述の通り重み付け部31で付与する重みWは固定であるため、要素Wciは予め演算しておき、これを高域重み付き形状符号帳34とすることができる。ここで、gjとciの取りうる組合せは膨大になるため、最適なiとjを一度に求めることは演算量の観点から好ましくない。
そこで、本発明ではまず形状符号の選択を行い、その次に利得符号の選択を行うのである。なお、(3)式の分母にある高域重み付き形状符号帳34のベクトル要素のパワ‖Wci‖2もWciと同様各ベクトル要素に固定であるため、高域重み付き形状符号パワの逆数表35として1/‖Wci‖2を予め演算しておき、d^の計算に用いることによって演算量の低減も行う。
1.ベクトルWciとベクトルWeの内積を演算する。
2.ステップ1の結果に1/‖Wci‖2を乗ずる。
図3に本発明を実施した場合の復号側のブロック図を示す。基本符号Ibは基本復号器110で復号され、基本復号信号sb^が生成される。拡張符号Ieは拡張符号分解部131で雑音形状符号Isと雑音利得符号Igとに分割される。雑音形状符号Isは形状符号帳132から該当するベクトル要素cIsを選択し、同じく雑音利得符号Igを用いて選択された利得gIgを乗じて、e^を生成する。
s^=sb^+gIgcIs (7)
この実施例では、8サンプル毎に以下のようにビット数を配分した。これは合計16kbit/sとなる。
以上説明した本発明による音声符号化装置或は広帯域音声符号化装置はコンピュータに音声符号化プログラム或は広帯域音声符号化プログラムをインストールし、これらのプログラムをコンピュータに実行させて実現することができる。
プログラムはコンピュータに備えた中央演算処理装置が解読可能なプログラム言語によって記述され、コンピュータが読み取り可能な例えば磁気ディスク或はCD−ROM、半導体メモリのような記録媒体に記録され、これらの記録媒体或は通信回線を通じてコンピュータにインストールされる。
20 基本復号化器
25 基本雑音抽出器
30 品質拡張符号化器
31 高域重み付け部
32 距離計算部
33 利得符号帳
34 高域重み付き形状符号帳
35 高域重み付きパワの逆数表
36 形状符号選択部
37 利得符号選択部
38 拡張符号多重部
Claims (9)
- 高域成分が強調されている入力信号を想定して設計された符号化方式により音声信号を符号化し、基本符号を送出する基本符号化処理と、
この基本符号化処理により符号化された基本符号から、この基本符号化処理の過程で発生する符号化雑音を基本雑音信号として抽出する基本雑音信号抽出処理と、
基本雑音信号抽出処理で抽出した基本雑音信号に固定の高域重み付けを付与する重み付き処理と、
高域重み付き処理された基本雑音信号を符号化し、拡張符号を生成する品質拡張符号化処理と、
を含むことを特徴とする音声符号化方法。 - 請求項1記載の音声符号化方法において、
各処理は複数サンプルにより構成されるフレーム毎に行われ、
上記品質拡張符号化処理は、固定の高域重みが付与された複数サンプルにより構成されるベクトルを格納した重み付き形状符号帳及び前記ベクトルのパワの逆数を格納したパワ逆数表を用いて、前記基本雑音信号のベクトルと前記重み付き形状符号帳に格納されたベクトルとの距離を最小化する雑音形状符号Isを選択し、選択された重み付き形状符号帳及び重み付き形状のパワ逆数表のIs番目の要素を用いて理想ゲインを求め、この理想ゲインと利得符号帳に用意した全ての要素とから利得符号Igを選択する手順に従って符号化処理を実行することを特徴とする音声符号化方法。 - 広帯域音声信号を帯域分割フィルタで高域周波数帯域信号と低域周波数帯域信号とに分割し、高域周波数帯域信号は高域符号化器により符号化し、低域周波数帯域信号は上記請求項1又は2記載の音声符号化方法の何れかで符号化することを特徴とする広帯域音声符号化方法。
- 入力信号を高域成分が強調されている入力信号を想定して設計された波形符号化方式により符号化し基本符号を送出する基本符号化器と、
この基本符号化器が送出する基本符号を復号する基本復号化器と、
上記入力信号と上記基本復号化器で復号した復号信号との差を求め、上記基本符号化器で発生する基本雑音信号を抽出する基本雑音信号抽出器と、
この基本雑音信号抽出器で抽出した基本雑音信号に固定の高域重み付けを付与する重み付け部と、
この重み付け部で高域重み付け処理された基本雑音信号を符号化し、拡張符号を生成する品質拡張符号化器と、
を備えることを特徴とする音声符号化装置。 - 請求項4記載の音声符号化装置において、
各処理は複数サンプルにより構成されるフレーム毎に行われ、
上記品質拡張符号化器は、固定の高域重みが付与された複数サンプルにより構成されるベクトルを格納した重み付き形状符号帳及び前記ベクトルのパワの逆数を格納したパワ逆数表を用いて、前記基本雑音信号のベクトルと前記重み付き形状符号帳に格納されたベクトルとの距離を最小化する雑音形状符号I s を選択し、選択された重み付き形状符号帳及び重み付き形状のパワ逆数表のI s 番目の要素を用いて理想ゲインを求め、この理想ゲインと利得符号帳に用意した全ての要素とから利得符号I g を選択する手順に従って符号化処理を実行することを特徴とする音声符号化装置。 - 広帯域音声信号を帯域分割フィルタで高域周波数帯域信号と低域周波数帯域信号とに分割し、高域周波数帯域信号は高域符号化器により符号化し、低域周波数帯域信号は上記請求項4又は5記載の音声符号化装置の何れかで符号化する構成としたことを特徴とする広帯域音声符号化装置。
- コンピュータが解読可能なプログラム言語によって記述され、コンピュータを請求項4又は5記載の音声符号化装置として機能させる音声符号化プログラム。
- コンピュータが解読可能なプログラム言語によって記述され、コンピュータを請求項6記載の広帯域音声符号化装置として機能させる広帯域音声符号化プログラム。
- コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に少なくとも請求項7記載の音声符号化プログラムか請求項8記載の広帯域音声符号化プログラムの何れかを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004306158A JP4574320B2 (ja) | 2004-10-20 | 2004-10-20 | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004306158A JP4574320B2 (ja) | 2004-10-20 | 2004-10-20 | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006119301A JP2006119301A (ja) | 2006-05-11 |
JP4574320B2 true JP4574320B2 (ja) | 2010-11-04 |
Family
ID=36537260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004306158A Active JP4574320B2 (ja) | 2004-10-20 | 2004-10-20 | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4574320B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4891747B2 (ja) * | 2006-12-08 | 2012-03-07 | 日本電信電話株式会社 | 信号符号化装置、信号符号化方法、プログラム及び記録媒体 |
JP4638895B2 (ja) * | 2007-05-21 | 2011-02-23 | 日本電信電話株式会社 | 復号方法、復号器、復号装置、プログラムおよび記録媒体 |
US20110022924A1 (en) * | 2007-06-14 | 2011-01-27 | Vladimir Malenovsky | Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711 |
KR100913818B1 (ko) | 2007-11-06 | 2009-08-26 | 서울통신기술 주식회사 | Ip 전화 시스템에 구비된 녹취장치 및 그 녹취방법 |
WO2009093466A1 (ja) | 2008-01-25 | 2009-07-30 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
-
2004
- 2004-10-20 JP JP2004306158A patent/JP4574320B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006119301A (ja) | 2006-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
KR101000345B1 (ko) | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 | |
US8447621B2 (en) | Methods for improving high frequency reconstruction | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
KR100788706B1 (ko) | 광대역 음성 신호의 부호화/복호화 방법 | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
JP4390208B2 (ja) | 音声を可変レートで符号化および復号する方法 | |
JP2011150357A (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
KR20070085532A (ko) | 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 | |
US20080071550A1 (en) | Method and apparatus to encode and decode audio signal by using bandwidth extension technique | |
JP2002372996A (ja) | 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体 | |
US7684978B2 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
JP2006171751A (ja) | 音声符号化装置及び方法 | |
JP4574320B2 (ja) | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3472279B2 (ja) | 音声符号化パラメータ符号化方法及び装置 | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080731 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090310 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090709 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100818 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4574320 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |