JP6691440B2 - 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 - Google Patents
音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP6691440B2 JP6691440B2 JP2016122446A JP2016122446A JP6691440B2 JP 6691440 B2 JP6691440 B2 JP 6691440B2 JP 2016122446 A JP2016122446 A JP 2016122446A JP 2016122446 A JP2016122446 A JP 2016122446A JP 6691440 B2 JP6691440 B2 JP 6691440B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- speech
- frequency
- code
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
〔参考文献1〕古井貞煕著、「ディジタル音声処理」、東海大学出版会、pp. 60-98
以下、音声復号装置が備える高域音声復号部25の詳細な構成を説明する。高域音声復号部25は、図9に示すように、デマルチプレクサ(符号分離部とも呼ぶ)40、帯域分割フィルタ(帯域分割部とも呼ぶ)41、パワー計算部42、線形予測部43、逆フィルタ44、複製部45、係数復号部46、相対ゲイン復号部47、合成フィルタ48、パワー計算部49、ゲイン計算部50、乗算部(HL帯域乗算部とも呼ぶ)51、相対ゲイン予測部52、係数予測部53、乱数部54、合成フィルタ55、パワー計算部56、ゲイン計算部57、乗算部(HH帯域乗算部とも呼ぶ)58、および帯域合成フィルタ(帯域合成部とも呼ぶ)59を備える。
図11に、高域音声復号部25の変形例を示す。変形例1の高域音声復号部25Aは、逆フィルタ44と複製部45との間に、周波数軸反転部60を備える点が、実施形態の高域音声復号部25との相違点である。
図12に、高域音声復号部25の変形例を示す。変形例2の高域音声復号部25Bは、逆フィルタ44と複製部45の間に、周波数軸反転部60の代わりに周波数軸動的反転部61を備える点が、変形例1の高域音声復号部25Aとの相違点である。
〔参考文献2〕H.Ohmuro, T.Moriya, K.Mano, and S.Miki, “Coding of LSP Parameters Using Interframe Moving Average Prediction and Multi-Stage Vector Quantization”, IEICE TRANS. FUNDAMENTALS, Vol.E76-A, No.7, pp.1181-1183, 1993
図14に、高域音声符号化部14の変形例を示す。変形例3の高域音声符号化部14Aは、周波数軸反転部38Hが帯域分割フィルタ31Hの前段に配置され、周波数軸反転部38Lが帯域分割フィルタ31LのLH帯域音声出力の先に配置されている点が実施形態の高域音声符号化部14との相違点である。
図15に、高域音声復号部25の変形例を示す。変形例4の高域音声復号部25Cは、周波数軸反転部62が帯域分割フィルタ41のLH帯域音声出力の先に配置され、周波数軸反転部63が乗算部58と帯域合成フィルタ59との間に配置されている点が変形例2の高域音声復号部25Bとの相違点である。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
12 帯域分割フィルタ
13 低域音声符号化部
14 高域音声符号化部
15 遅延部
16 低域音声復号部
17 符号送出部
21 符号受信部
22 低域音声復号部
23 高域符号抽出部
24 遅延部
25 高域音声復号部
26 帯域合成フィルタ
Claims (13)
- 入力音声を低域音声と高域音声とに帯域分割する帯域分割部と、
復号低域音声に基づいて上記高域音声を符号化して高域符号を生成する高域音声符号化部と、
上記低域音声を符号化して上記高域符号を埋め込んだ低域符号を生成する低域音声符号化部と、
上記低域符号を復号して上記復号低域音声を生成する低域音声復号部と、
上記低域符号を音声符号として出力する符号送出部と、
を含み、
上記高域音声符号化部は、
上記復号低域音声をLH帯域音声とLL帯域音声とに帯域分割する低域帯域分割部と、
上記高域音声をHL帯域音声とHH帯域音声とに帯域分割する高域帯域分割部と、
上記LH帯域音声のパワーと上記HL帯域音声のパワーとの比に基づく相対ゲインを求める相対ゲイン計算部と、
上記LH帯域音声の線形予測係数を用いて上記HL帯域音声の線形予測係数を符号化して係数符号を求める係数符号化部と、
上記LH帯域音声の線形予測係数と上記係数符号を用いて上記相対ゲインを符号化してゲイン符号を求めるゲイン符号化部と、
上記ゲイン符号と上記係数符号とを多重化して上記高域符号を出力する多重化部と、
を含むものである、
音声符号化装置。 - 請求項1に記載の音声符号化装置が出力する音声符号を受信する符号受信部と、
上記音声符号を復号して復号低域音声を生成する低域音声復号部と、
上記音声符号に埋め込まれた高域符号を抽出する高域符号抽出部と、
上記復号低域音声に基づいて上記高域符号を復号して復号高域音声を生成する高域音声復号部と、
上記復号低域音声と上記復号高域音声とを合成して復号音声を出力する帯域合成部と、
を含み、
上記高域音声復号部は、
上記復号低域音声をLH帯域音声とLL帯域音声とに帯域分割する帯域分割部と、
上記音声符号をゲイン符号と係数符号とに分離する符号分離部と、
上記LH帯域音声の線形予測係数を用いて上記係数符号を復号してHL帯域復号線形予測係数を求める係数復号部と、
上記LH帯域音声の線形予測係数と上記係数符号とを用いて上記ゲイン符号を復号して復号相対ゲインを求める相対ゲイン復号部と、
上記LH帯域音声の線形予測係数と上記係数符号とを用いてHH帯域線形予測係数を予測して求める係数予測部と、
上記ゲイン符号と上記係数符号とを用いて予測相対ゲインを予測して求める相対ゲイン予測部と、
上記LH帯域音声の線形予測係数をフィルタ係数として上記LH帯域音声から求めたLH帯域線形予測残差を複製してHL帯域駆動音源を求める複製部と、
上記HH帯域線形予測係数をフィルタ係数としてガウス乱数から求めたHH帯域音声のパワーと上記LH帯域音声のパワーとの比に基づいて上記予測相対ゲインから算出したゲインを上記HH帯域音声に乗算して復号HH帯域音声を生成するHH帯域乗算部と、
上記HL帯域復号線形予測係数をフィルタ係数として上記HL帯域駆動音源から求めたHL帯域合成音声のパワーと上記LH帯域音声のパワーとの比に基づいて上記復号相対ゲインから算出したゲインを上記HL帯域合成音声に乗算して復号HL帯域音声を生成するHL帯域乗算部と、
上記復号HH帯域音声と上記復号HL帯域音声とを合成して上記復号高域音声を出力する帯域合成部と、
を含むものである、
音声復号装置。 - 請求項2に記載の音声復号装置であって、
上記高域音声復号部は、上記LH帯域線形予測残差の周波数軸を反転した反転信号を生成する周波数軸反転部をさらに含み、
上記複製部は、上記反転信号を複製して上記HL帯域駆動音源を求めるものである、
音声復号装置。 - 請求項2に記載の音声復号装置であって、
上記高域音声復号部は、上記LH帯域音声の線形予測係数と上記HL帯域復号線形予測係数とに基づいてフレーム毎に上記LH帯域線形予測残差の周波数軸を反転するか否かを選択しながら上記LH帯域線形予測残差から動的反転信号を生成する周波数軸動的反転部をさらに含み、
上記複製部は、上記動的反転信号を複製して上記HL帯域駆動音源を求めるものである、
音声復号装置。 - 請求項4に記載の音声復号装置であって、
上記周波数軸動的反転部は、上記LH帯域音声の線形予測係数と上記HL帯域復号線形予測係数との距離dと、上記LH帯域音声の線形予測係数と上記HL帯域復号線形予測係数とのいずれか一方の周波数軸を反転したときの距離drとを求め、上記距離drが上記距離dよりも小さい場合には上記LH帯域線形予測残差の周波数軸を反転し、その他の場合には上記LH帯域線形予測残差の周波数軸を反転せずに、上記LH帯域線形予測残差から動的反転信号を生成するものである、
音声復号装置。 - 入力音声を低域音声と高域音声とに帯域分割する帯域分割部と、
復号低域音声に基づいて上記高域音声を符号化して高域符号を生成する高域音声符号化部と、
上記低域音声を符号化して上記高域符号を埋め込んだ低域符号を生成する低域音声符号化部と、
上記低域符号を復号して上記復号低域音声を生成する低域音声復号部と、
上記低域符号を音声符号として出力する符号送出部と、
を含み、
上記高域音声符号化部は、
上記復号低域音声を帯域分割したLH帯域音声とLL帯域音声のうちLH帯域音声と、上記高域音声を帯域分割したHL帯域音声とHH帯域音声のうちHL帯域音声と、のみを用いて、上記LL帯域音声と上記HH帯域音声を用いず、上記高域符号を生成する、
音声符号化装置。 - 帯域分割部が、入力音声を低域音声と高域音声とに帯域分割し、
高域音声符号化部が、復号低域音声に基づいて上記高域音声を符号化して高域符号を生成し、
低域音声符号化部が、上記低域音声を符号化して上記高域符号を埋め込んだ低域符号を生成し、
低域音声復号部が、上記低域符号を復号して上記復号低域音声を生成し、
符号送出部が、上記低域符号を音声符号として出力し、
上記高域音声符号化部は、
低域帯域分割部が、上記復号低域音声をLH帯域音声とLL帯域音声とに帯域分割し、
高域帯域分割部が、上記高域音声をHL帯域音声とHH帯域音声とに帯域分割し、
相対ゲイン計算部が、上記LH帯域音声のパワーと上記HL帯域音声のパワーとの比に基づく相対ゲインを求め、
係数符号化部が、上記LH帯域音声の線形予測係数を用いて上記HL帯域音声の線形予測係数を符号化して係数符号を求め、
ゲイン符号化部が、上記LH帯域音声の線形予測係数と上記係数符号を用いて上記相対ゲインを符号化してゲイン符号を求め、
多重化部が、上記ゲイン符号と上記係数符号とを多重化して上記高域符号を出力する、
音声符号化方法。 - 符号受信部が、請求項7に記載の音声符号化方法が出力する音声符号を受信し、
低域音声復号部が、上記音声符号を復号して復号低域音声を生成し、
高域符号抽出部が、上記音声符号に埋め込まれた高域符号を抽出し、
高域音声復号部が、上記復号低域音声に基づいて上記高域符号を復号して復号高域音声を生成し、
帯域合成部が、上記復号低域音声と上記復号高域音声とを合成して復号音声を出力し、
上記高域音声復号部は、
帯域分割部が、上記復号低域音声をLH帯域音声とLL帯域音声とに帯域分割し、
符号分離部が、上記音声符号をゲイン符号と係数符号とに分離し、
係数復号部が、上記LH帯域音声の線形予測係数を用いて上記係数符号を復号してHL帯域復号線形予測係数を求め、
相対ゲイン復号部が、上記LH帯域音声の線形予測係数と上記係数符号とを用いて上記ゲイン符号を復号して復号相対ゲインを求め、
係数予測部が、上記LH帯域音声の線形予測係数と上記係数符号とを用いてHH帯域線形予測係数を予測して求め、
相対ゲイン予測部が、上記ゲイン符号と上記係数符号とを用いて予測相対ゲインを予測して求め、
複製部が、上記LH帯域音声の線形予測係数をフィルタ係数として上記LH帯域音声から求めたLH帯域線形予測残差を複製してHL帯域駆動音源を求め、
HH帯域乗算部が、上記HH帯域線形予測係数をフィルタ係数としてガウス乱数から求めたHH帯域音声のパワーと上記LH帯域音声のパワーとの比に基づいて上記予測相対ゲインから算出したゲインを上記HH帯域音声に乗算して復号HH帯域音声を生成し、
HL帯域乗算部が、上記HL帯域復号線形予測係数をフィルタ係数として上記HL帯域駆動音源から求めたHL帯域合成音声のパワーと上記LH帯域音声のパワーとの比に基づいて上記復号相対ゲインから算出したゲインを上記HL帯域合成音声に乗算して復号HL帯域音声を生成し、
帯域合成部が、上記復号HH帯域音声と上記復号HL帯域音声とを合成して上記復号高域音声を出力する、
音声復号方法。 - 帯域分割部が、入力音声を低域音声と高域音声とに帯域分割し、
高域音声符号化部が、復号低域音声に基づいて上記高域音声を符号化して高域符号を生成し、
低域音声符号化部が、上記低域音声を符号化して上記高域符号を埋め込んだ低域符号を生成し、
低域音声復号部が、上記低域符号を復号して上記復号低域音声を生成し、
符号送出部が、上記低域符号を音声符号として出力し、
上記高域音声符号化部は、
上記復号低域音声を帯域分割したLH帯域音声とLL帯域音声のうちLH帯域音声と、上記高域音声を帯域分割したHL帯域音声とHH帯域音声のうちHL帯域音声と、のみを用いて、上記LL帯域音声と上記HH帯域音声を用いず、上記高域符号を生成する、
音声符号化方法。 - 請求項1または6に記載の音声符号化装置としてコンピュータを機能させるためのプログラム。
- 請求項2から5のいずれかに記載の音声復号装置としてコンピュータを機能させるためのプログラム。
- 請求項1または6に記載の音声符号化装置としてコンピュータを機能させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
- 請求項2から5のいずれかに記載の音声復号装置としてコンピュータを機能させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016122446A JP6691440B2 (ja) | 2016-06-21 | 2016-06-21 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016122446A JP6691440B2 (ja) | 2016-06-21 | 2016-06-21 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017227701A JP2017227701A (ja) | 2017-12-28 |
JP6691440B2 true JP6691440B2 (ja) | 2020-04-28 |
Family
ID=60891462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016122446A Active JP6691440B2 (ja) | 2016-06-21 | 2016-06-21 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6691440B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP3926726B2 (ja) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
JP2007072264A (ja) * | 2005-09-08 | 2007-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声量子化方法、音声量子化装置、プログラム |
PL3128513T3 (pl) * | 2014-03-31 | 2019-11-29 | Fraunhofer Ges Forschung | Koder, dekoder, sposób kodowania, sposób dekodowania i program |
-
2016
- 2016-06-21 JP JP2016122446A patent/JP6691440B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017227701A (ja) | 2017-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5143193B2 (ja) | スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法 | |
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
JP5619176B2 (ja) | 改良された励起信号帯域幅拡張 | |
ES2955855T3 (es) | Generación de señal de banda alta | |
ES2865099T3 (es) | Procedimiento y aparato de ocultación de errores de trama y procedimiento y aparato de decodificación que usa los mismos | |
JP6553025B2 (ja) | 冗長フレーム情報を通信するシステムおよび方法 | |
JP5226777B2 (ja) | 音声信号中に埋め込まれた隠れデータの回復 | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
JP4958780B2 (ja) | 符号化装置、復号化装置及びこれらの方法 | |
US7805314B2 (en) | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data | |
ES2717131T3 (es) | Métodos, codificador y decodificador para codificación y decodificación predictiva lineal de señales de sonido tras transición entre tramas que tienen diferentes tasas de muestreo | |
WO2001059757A2 (en) | Method and apparatus for compression of speech encoded parameters | |
TWI775838B (zh) | 用於在多源環境中之非諧波語音偵測及頻寬擴展之裝置、方法、電腦可讀媒體及設備 | |
WO2003091989A1 (en) | Coding device, decoding device, coding method, and decoding method | |
KR100912587B1 (ko) | 오디오 신호 보간 방법 및 오디오 신호 보간 장치 | |
JP2009533716A (ja) | オーディオ符号化並びに復号化における励起の処理 | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
EP2009623A1 (en) | Speech coding | |
US20220284908A1 (en) | Encoder, decoder, encoding method and decoding method for frequency domain long-term prediction of tonal signals for audio coding | |
JP6691440B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体 | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JPH11504733A (ja) | 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器 | |
JP4574320B2 (ja) | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190625 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190801 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6691440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |