JP4810335B2 - 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 - Google Patents
広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 Download PDFInfo
- Publication number
- JP4810335B2 JP4810335B2 JP2006187123A JP2006187123A JP4810335B2 JP 4810335 B2 JP4810335 B2 JP 4810335B2 JP 2006187123 A JP2006187123 A JP 2006187123A JP 2006187123 A JP2006187123 A JP 2006187123A JP 4810335 B2 JP4810335 B2 JP 4810335B2
- Authority
- JP
- Japan
- Prior art keywords
- code amount
- encoding
- frame
- band
- activity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 29
- 230000000694 effects Effects 0.000 claims description 58
- 230000005540 biological transmission Effects 0.000 claims description 39
- 238000013139 quantization Methods 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000008447 perception Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 54
- 230000012447 hatching Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
信号のアクティビティを検出し、それに基づいて符号化ビットレートをフレーム単位で切り替えることができる音声圧縮符号化方式として、例えば、AMR(Adaptive Multi−Rate)方式がある(非特許文献1および非特許文献2参照。)。
AMR方式では、送信電力節約のため、符号化するフレーム単位で音声信号か否かのアクティビティを検出し(VAD制御)、その判定結果に基づいて音声信号であれば通常の音声符号化フレームとして送出し、非音声信号であればコンフォートノイズフレームとしてフレームの基本的な情報のみの間欠送信(DTX制御)を行っている。しかしながら、DTX制御する単位がフレームであるため、オーディオ信号のような広帯域信号へ適用した場合、全帯域を通じて信号のアクティビティがあるか否かを判定してDTX制御することになる。
MPEG2オーディオ規格として、時間周波数変換符号化を用いるAAC(Advanced Audio Coding)方式がある。
フレーム単位で符号化ビットレートを制御する可変レート符号化方式がある(特許文献1参照。)。この符号化方式の主眼は、SNR(音質)が一定となるように可変レート制御を行うことである。また、音声等の信号系列を複数の帯域に分割し、帯域毎の信号電力を基に帯域毎に符号量を制御している。ただし、有音無音の判定は全帯域に渡って行い、フレーム全体の総和の符号量を制御しており、帯域毎に制御しているわけではない。これは、背景技術1に記載のAMR方式と同様である。
「3GPP TS 26.093; 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Mandatory Speech Codec speech processing functions AMR Speech Codec; Source Controlled Rate operation(Release 4)」V4.0.0、2000年12月 「3GPP TS 26.094; 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Mandatory Speech Codec speech processing functions; AMR speech codec; Voice Activity Detector (VAD)(Release 4)」V4.0.0、2001年3月
全バンドについて以上の処理を行うと、次に、レート制御部11は、上記した各バンドの分割帯域DTX制御情報符号化の適用度合いに応じて、レート制御の補正を行う。
以上の処理をバンド毎に行い、全てのバンドについて処理を完了するまで行う(ステップS7)。
本発明の実施例によれば、分割帯域DTX制御が適用された帯域の信号のパワーなどに応じた割当て符号量をレート制御することができ、符号量を削減することができる。
2 心理聴覚モデル部
3 量子化部
4 ノイズレス符号化部
5 フォーマッタ
6 分割帯域DTX制御部
7、8、9 AAD(Audio Activity Detection)制御部
10 DTX符号化部
11 レート制御部
12 ビットリザーバ
51 ストリーム解析分解部
52 ノイズレス復号部
53 逆量子化部
54 フィルタバンク
55 分割帯域DTX復号補間処理部
56 周波数領域補間部
57 フレーム補間部
100 符号化処理部
200 復号処理部
Claims (4)
- 広帯域オーディオ信号を所定のサンプル数から成るフレーム構成とし、複数の周波数帯域信号に分割する周波数帯域分割手段と、
前記周波数帯域毎に信号のノイズ性に基づくアクティビティを検出するアクティビティ検出手段と、
前記周波数帯域毎に量子化処理および符号化処理を行う第1符号化手段と、
前記周波数帯域毎に間欠送信制御対象であることを示す間欠送信制御情報と間欠送信制御対象となる信号の符号化を行う第2符号化手段と、
予め定められたターゲットレートに基づく1フレームあたりの規定割り当て符号量と符号化に必要な符号量との差分を吸収する余剰符合容量の管理を行うビットリザーブ手段と、
前記周波数帯域毎に、過去のフレームで所定回数以上前記アクティビティの非検出が連続しなかった場合は、前記第1符号化手段を選択実行し、過去のフレームで所定回数以上前記アクティビティの非検出が連続し、かつ過去のフレームで所定回数以上アクティビティの非検出が連続した時点から、過去のフレームで所定回数以上アクティビティの非検出が連続しなかった時点まで実行される間欠送信制御を行なっていない場合は、前記第2符号化手段を選択実行し、当該選択実行を前記フレームの前記複数の周波数帯域について行う符号化制御手段と、
前記フレーム毎に、フレーム全体の第1パワーと前記第2符号化手段が適用された帯域の第2パワーを算出し、前記第1パワーに対する前記第2パワーの比率に応じて、当該フレームあたりの前記第1符号化手段への第1の割り当て符号量を、前記規定割り当て符号量と前記余剰符号容量と前記広帯域オーディオ信号の特性とから導かれる当該フレームあたりの第2の割り当て符号量から削減補正し、加えて、前記ビットリザーブ手段の前記余剰符号量の管理を更新する符号量として前記補正前の第2の割り当て符号量を適用するレート制御手段と、
を具備することを特徴とする広帯域オーディオ信号符号化装置。 - 広帯域オーディオ信号を所定のサンプル数から成るフレーム構成とし、複数の周波数帯域信号に分割する周波数帯域分割手段と、
前記周波数帯域毎に信号のノイズ性に基づくアクティビティを検出するアクティビティ検出手段と、
前記周波数帯域毎に量子化処理および符号化処理を行う第1符号化手段と、
前記周波数帯域毎に間欠送信制御対象であることを示す間欠送信制御情報と間欠送信制御対象となる信号の符号化を行う第2符号化手段と、
予め定められたターゲットレートに基づく1フレームあたりの規定割り当て符号量と符号化に必要な符号量との差分を吸収する余剰符合容量の管理を行うビットリザーブ手段と、
前記周波数帯域毎に、過去のフレームで所定回数以上前記アクティビティの非検出が連続しなかった場合は、前記第1符号化手段を選択実行し、過去のフレームで所定回数以上前記アクティビティの非検出が連続し、かつ過去のフレームで所定回数以上アクティビティの非検出が連続した時点から、過去のフレームで所定回数以上アクティビティの非検出が連続しなかった時点まで実行される間欠送信制御を行なっていない場合は、前記第2符号化手段を選択実行し、当該選択実行を前記フレームの前記複数の周波数帯域について行う符号化制御手段と、
前記フレーム毎に、フレーム全体の第1の知覚エントロピー値と前記第2符号化手段が適用された帯域の第2の知覚エントロピー値を算出し、前記第1の知覚エントロピー値に対する前記第2の知覚エントロピー値の比率に応じて、当該フレームあたりの前記第1符号化手段への第1の割り当て符号量を、前記規定割り当て符号量と前記余剰符号容量と前記広帯域オーディオ信号の特性とから導かれる当該フレームあたりの第2の割り当て符号量から削減補正し、加えて、前記ビットリザーブ手段の前記余剰符号量の管理を更新する符号量として前記補正前の第2の割り当て符号量を適用するレート制御手段と、
を具備することを特徴とする広帯域オーディオ信号符号化装置。 - 広帯域オーディオ信号を所定のサンプル数から成るフレーム構成とし、複数の周波数帯域信号に分割する周波数帯域分割手段と、
前記周波数帯域毎に信号のノイズ性に基づくアクティビティを検出するアクティビティ検出手段と、
前記周波数帯域毎に量子化処理および符号化処理を行う第1符号化手段と、
前記周波数帯域毎に間欠送信制御対象であることを示す間欠送信制御情報と間欠送信制御対象となる信号の符号化を行う第2符号化手段と、
予め定められたターゲットレートに基づく1フレームあたりの規定割り当て符号量と符号化に必要な符号量との差分を吸収する余剰符合容量の管理を行うビットリザーブ手段と、
前記周波数帯域毎に、過去のフレームで所定回数以上前記アクティビティの非検出が連続しなかった場合は、前記第1符号化手段を選択実行し、過去のフレームで所定回数以上前記アクティビティの非検出が連続し、かつ過去のフレームで所定回数以上アクティビティの非検出が連続した時点から、過去のフレームで所定回数以上アクティビティの非検出が連続しなかった時点まで実行される間欠送信制御を行なっていない場合は、前記第2符号化手段を選択実行し、当該選択実行を前記フレームの前記複数の周波数帯域について行う符号化制御手段と、
前記フレーム毎に、当該フレームあたりの前記第1符号化手段への第1の割り当て符号量を、前記規定割り当て符号量と前記余剰符号容量と前記広帯域オーディオ信号の特性とから導かれる当該フレームあたりの第2の割り当て符号量を目標符号量として第1の符号化手段で符号化した場合の発生符合量から前記間欠送信対象となる帯域信号に対する符号量を削減補正して再度第1符号化手段にて符号化し、加えて、前記ビットリザーブ手段の前記余剰符号量の管理を更新する符号量として前記補正前の第2の割り当て符号量を適用するレート制御手段と、
を具備することを特徴とする広帯域オーディオ信号符号化装置。 - 周波数帯域毎の間欠送信制御対象であることを示す間欠送信制御情報を含む広帯域オーディオ信号符号化データを受信する受信手段と、
前記広帯域オーディオ信号符号化データを復号する復号手段と、
前記周波数帯域毎の間欠送信制御情報をチェックして間欠送信制御が適用された帯域であるかを判定し、間欠送信制御が適用された帯域でない場合は、前記復号手段を選択実行し、間欠送信制御が適用された帯域の場合は、更に現フレームでの間欠送信制御情報を受信しているかをチェックし、間欠送信制御情報を受信していれば間欠送信信号符号化情報から当該周波数帯域のスペクトラムを補間復元し、間欠送信制御情報を受信していなければ、当該周波数帯域における直前のフレームと同じパワーのままベースとするランダム信号のみを更新することに基づいてフレーム間補間を行う復号制御手段と、
を具備することを特徴とする広帯域オーディオ信号復号装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006187123A JP4810335B2 (ja) | 2006-07-06 | 2006-07-06 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US11/825,636 US8041563B2 (en) | 2006-07-06 | 2007-07-05 | Apparatus for coding a wideband audio signal and a method for coding a wideband audio signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006187123A JP4810335B2 (ja) | 2006-07-06 | 2006-07-06 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008015281A JP2008015281A (ja) | 2008-01-24 |
JP4810335B2 true JP4810335B2 (ja) | 2011-11-09 |
Family
ID=38920083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006187123A Expired - Fee Related JP4810335B2 (ja) | 2006-07-06 | 2006-07-06 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8041563B2 (ja) |
JP (1) | JP4810335B2 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US8090588B2 (en) * | 2007-08-31 | 2012-01-03 | Nokia Corporation | System and method for providing AMR-WB DTX synchronization |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
EP2291844A2 (en) * | 2008-06-09 | 2011-03-09 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating a summary of an audio/visual data stream |
KR20100067447A (ko) * | 2008-12-11 | 2010-06-21 | 한국전자통신연구원 | 광대역 음성 코덱을 적용한 유무선 통합 통신 장치 |
JP5446258B2 (ja) * | 2008-12-26 | 2014-03-19 | 富士通株式会社 | オーディオ符号化装置 |
EP2363852B1 (en) * | 2010-03-04 | 2012-05-16 | Deutsche Telekom AG | Computer-based method and system of assessing intelligibility of speech represented by a speech signal |
WO2012037515A1 (en) * | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
AR085362A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral |
BR112013020699B1 (pt) | 2011-02-14 | 2021-08-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Aparelho e método para codificar e decodificar um sinal de áudio utilizando uma parte antecipada alinhada |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
EP2550653B1 (en) | 2011-02-14 | 2014-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Information signal representation using lapped transform |
AU2012217184B2 (en) | 2011-02-14 | 2015-07-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Encoding and decoding of pulse positions of tracks of an audio signal |
KR101613673B1 (ko) | 2011-02-14 | 2016-04-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 불활성 위상 동안에 잡음 합성을 사용하는 오디오 코덱 |
EP2676262B1 (en) | 2011-02-14 | 2018-04-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
SG192748A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
WO2012122303A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9015042B2 (en) | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
JP5853758B2 (ja) * | 2012-02-21 | 2016-02-09 | 富士通株式会社 | 通信装置及び帯域制御方法 |
CN104934034B (zh) | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5150387A (en) * | 1989-12-21 | 1992-09-22 | Kabushiki Kaisha Toshiba | Variable rate encoding and communicating apparatus |
JP3004664B2 (ja) | 1989-12-21 | 2000-01-31 | 株式会社東芝 | 可変レート符号化方法 |
US20040024596A1 (en) * | 2002-07-31 | 2004-02-05 | Carney Laurel H. | Noise reduction system |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
JP2005165183A (ja) * | 2003-12-05 | 2005-06-23 | Matsushita Electric Ind Co Ltd | 無線通信装置 |
-
2006
- 2006-07-06 JP JP2006187123A patent/JP4810335B2/ja not_active Expired - Fee Related
-
2007
- 2007-07-05 US US11/825,636 patent/US8041563B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20080010064A1 (en) | 2008-01-10 |
US8041563B2 (en) | 2011-10-18 |
JP2008015281A (ja) | 2008-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4810335B2 (ja) | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 | |
JP6937877B2 (ja) | 信号符号化及び復号化方法及び装置 | |
JP6849619B2 (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
CN105247614B (zh) | 音频编码器和解码器 | |
JP2004522198A (ja) | 音声符号化方法 | |
US10607624B2 (en) | Signal codec device and method in communication system | |
CN114550732B (zh) | 一种高频音频信号的编解码方法和相关装置 | |
WO2014161994A2 (en) | Advanced quantizer | |
KR101100280B1 (ko) | 오디오 양자화 | |
KR102380642B1 (ko) | 스테레오 신호 인코딩 방법 및 인코딩 장치 | |
CN101853664B (zh) | 一种信号去噪的方法和装置及音频解码系统 | |
US20190348055A1 (en) | Audio paramenter quantization | |
KR101166650B1 (ko) | 배경 잡음 정보를 디코딩하기 위한 방법 및 수단 | |
JP2010532489A (ja) | デジタルオーディオ信号の符号化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090630 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110822 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140826 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |