JP6573887B2 - オーディオ信号の符号化方法、復号方法及びその装置 - Google Patents
オーディオ信号の符号化方法、復号方法及びその装置 Download PDFInfo
- Publication number
- JP6573887B2 JP6573887B2 JP2016540509A JP2016540509A JP6573887B2 JP 6573887 B2 JP6573887 B2 JP 6573887B2 JP 2016540509 A JP2016540509 A JP 2016540509A JP 2016540509 A JP2016540509 A JP 2016540509A JP 6573887 B2 JP6573887 B2 JP 6573887B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- audio signal
- audio
- encoding
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Description
図1ないし図3に図示されたオーディオコーデックシステム30に含まれるオーディオ符号化装置10は、正確なピッチ検出のために、プリエンファシス部12においてプリエンファシス処理された入力オーディオ信号に対して、ピッチを検出する。オーディオ符号化装置10は、検出されたピッチに基づいて、決定されたフィルタ係数を利用して、コムフィルタリングを行う。そして、オーディオ符号化装置10は、プリエンファシス部12においてプリエンファシス処理された入力オーディオ信号を、周波数・ドメイン符号化してビットストリームを出力する。
図1ないし図3に図示されたオーディオコーデックシステム30において、オーディオ符号化装置10は、ピッチに係わる情報を獲得した後、ロウオーバーラップウィンドウ(low overlap window)または50%オーバーラップウィンドウを利用して、ウィンドウイングを行い、周波数・ドメイン符号化を行うことができる。ウィンドウイングとは、周波数・ドメイン符号化を行うために、オーディオ信号を小さいセットに分けることを意味する。
図11Aは、オーディオ符号化装置500に入力されるオーディオ信号を図示している。図11Bは、プリフィルタ510によって行われるピッチの検出を図示している。図11Cは、符号化部550によって遂行されるオーディオ信号、及びピッチに係わる情報の符号化を図示している。
Claims (10)
- オーディオ信号からピッチを検出する段階と、
前記検出されたピッチを考慮してフィルタ係数を決定する段階と、
前記決定されたフィルタ係数に基づいて、前記オーディオ信号に対して第2フィルタリングを行う段階と、
前記第2フィルタリングされたオーディオ信号を符号化する段階と、を含み、
前記第2フィルタリングされたオーディオ信号を符号化する段階は、
所定のオーバーラップ区間を有するように設計されるウィンドウを利用し、前記第2フィルタリングされたオーディオ信号に対してウィンドウイングを行う段階と、
前記ウィンドウのオーバーラップ区間を基に符号化遅延を決定する段階と、
前記決定された符号化遅延により、前記ピッチに係わる情報を遅延させて出力する段階と、
前記第2フィルタリングされたオーディオ信号、及び前記ピッチに係わる情報を含むビットストリームを生成して出力する段階と
を含む、ことを特徴とするオーディオ符号化方法。 - 前記オーディオ信号を第1フィルタリングする段階をさらに含み、
前記ピッチを検出する段階は、前記第1フィルタリングされたオーディオ信号からピッチを検出する段階を含むことを特徴とする請求項1に記載のオーディオ符号化方法。 - 前記第1フィルタリングする段階は、
前記オーディオ信号に含まれる所定帯域内の周波数成分の大きさを他の周波数成分の大きさより増大させるか、あるいは前記所定帯域内の周波数成分を除いた他の周波数成分をフィルタリングするプリエンファシスを行う段階を含むことを特徴とする請求項2に記載のオーディオ符号化方法。 - 前記ピッチを検出する段階は、
前記第2フィルタリング遂行いかんを示すフラグ、ピッチ周期、ピッチゲイン及びピッチタップのうち少なくとも一つを含む前記ピッチに係わる情報を、前記オーディオ信号から獲得する段階を含むことを特徴とする請求項1に記載のオーディオ符号化方法。 - 前記第2フィルタリングする段階は、
前記オーディオ信号に対してコムフィルタリングを行う段階を含むことを特徴とする請求項1に記載のオーディオ符号化方法。 - 前記ピッチを検出する段階は、
前記オーディオ信号から前記ピッチに係わる情報を獲得する段階を含み、
前記ピッチに係わる情報は、前記第2フィルタリング遂行いかんを示すフラグ、ピッチ周期、ピッチゲイン及びピッチタップのうち少なくとも一つを含むことを特徴とする請求項1に記載のオーディオ符号化方法。 - 前記ビットストリームを生成して出力する段階は、
前記ピッチに係わる情報を前記ビットストリームの補助領域内に含む前記ビットストリームを生成して出力する段階を含むことを特徴とする請求項1に記載のオーディオ符号化方法。 - 前記ピッチを検出する段階は、
フレーム単位に分割された前記オーディオ信号の各フレームから、前記ピッチに係わる情報を獲得する段階を含み、
前記決定された符号化遅延により、前記ピッチに係わる情報を遅延させて出力する段階は、
前記ピッチに係わる情報を1フレーム遅延させて出力する段階と、
前記第2フィルタリングされたオーディオ信号、及び前記遅延されたピッチに係わる情報を含むビットストリームを生成して出力する段階と、を含む、
ことを特徴とする請求項1に記載のオーディオ符号化方法。 - オーディオ信号からピッチを検出するピッチ検出部と、
前記検出されたピッチを考慮してフィルタ係数を決定し、前記決定されたフィルタ係数に基づいて、前記オーディオ信号に対して第2フィルタリングを行う第2フィルタと、
前記第2フィルタリングされたオーディオ信号を符号化する符号化部と、を含み、
前記符号化部は、
所定のオーバーラップ区間を有するように設計されるウィンドウを利用し、前記第2フィルタリングされたオーディオ信号に対してウィンドウイングを行い、
前記ウィンドウのオーバーラップ区間を基に符号化遅延を決定し、
前記決定された符号化遅延により、前記ピッチに係わる情報を遅延させて出力し、
前記第2フィルタリングされたオーディオ信号、及び前記ピッチに係わる情報を含むビットストリームを生成して出力する、
ことを特徴とするオーディオ符号化装置。 - 請求項1ないし8のうちいずれか1項に記載の方法を実行するためのプログラムを記録したコンピュータで判読可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130156643A KR102251833B1 (ko) | 2013-12-16 | 2013-12-16 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
KR10-2013-0156643 | 2013-12-16 | ||
PCT/KR2014/011365 WO2015093742A1 (en) | 2013-12-16 | 2014-11-25 | Method and apparatus for encoding/decoding an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017504054A JP2017504054A (ja) | 2017-02-02 |
JP6573887B2 true JP6573887B2 (ja) | 2019-09-11 |
Family
ID=53403046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016540509A Expired - Fee Related JP6573887B2 (ja) | 2013-12-16 | 2014-11-25 | オーディオ信号の符号化方法、復号方法及びその装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10186273B2 (ja) |
EP (1) | EP3069337B1 (ja) |
JP (1) | JP6573887B2 (ja) |
KR (1) | KR102251833B1 (ja) |
CN (1) | CN106030704B (ja) |
TW (1) | TWI555010B (ja) |
WO (1) | WO2015093742A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10210871B2 (en) * | 2016-03-18 | 2019-02-19 | Qualcomm Incorporated | Audio processing for temporally mismatched signals |
CN108550371B (zh) * | 2018-03-30 | 2021-06-01 | 云知声智能科技股份有限公司 | 智能语音交互设备快速稳定的回声消除方法 |
CN108550369B (zh) * | 2018-04-14 | 2020-08-11 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
US11405739B2 (en) * | 2020-12-01 | 2022-08-02 | Bose Corporation | Dynamic audio headroom management system |
CN112992161A (zh) * | 2021-04-12 | 2021-06-18 | 北京世纪好未来教育科技有限公司 | 音频编码方法、音频解码方法、装置、介质及电子设备 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5819213A (en) | 1996-01-31 | 1998-10-06 | Kabushiki Kaisha Toshiba | Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
JP2002515610A (ja) * | 1998-05-11 | 2002-05-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 位相変化からの雑音寄与度の決定に基づく音声符号化 |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
FI116992B (fi) | 1999-07-05 | 2006-04-28 | Nokia Corp | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
GB2357231B (en) * | 1999-10-01 | 2004-06-09 | Ibm | Method and system for encoding and decoding speech signals |
DE07003891T1 (de) * | 2001-08-31 | 2007-11-08 | Kabushiki Kaisha Kenwood, Hachiouji | Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale |
JP4287637B2 (ja) * | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7844451B2 (en) * | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
US7418013B2 (en) | 2004-09-22 | 2008-08-26 | Intel Corporation | Techniques to synchronize packet rate in voice over packet networks |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7769584B2 (en) | 2004-11-05 | 2010-08-03 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
JP4599558B2 (ja) | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
WO2006137425A1 (ja) * | 2005-06-23 | 2006-12-28 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
KR100735246B1 (ko) * | 2005-09-12 | 2007-07-03 | 삼성전자주식회사 | 오디오 신호 전송 장치 및 방법 |
WO2007102782A2 (en) * | 2006-03-07 | 2007-09-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for audio coding and decoding |
US20100161323A1 (en) * | 2006-04-27 | 2010-06-24 | Panasonic Corporation | Audio encoding device, audio decoding device, and their method |
CN101000768B (zh) * | 2006-06-21 | 2010-12-08 | 北京工业大学 | 嵌入式语音编解码的方法及编解码器 |
WO2008007699A1 (en) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Audio decoding device and audio encoding device |
KR20080034819A (ko) | 2006-10-17 | 2008-04-22 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
EP2099026A4 (en) * | 2006-12-13 | 2011-02-23 | Panasonic Corp | POST-FILTER AND FILTERING METHOD |
WO2009081568A1 (ja) * | 2007-12-21 | 2009-07-02 | Panasonic Corporation | 符号化装置、復号装置および符号化方法 |
ATE518224T1 (de) | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
WO2012159370A1 (zh) * | 2011-08-05 | 2012-11-29 | 华为技术有限公司 | 语音增强方法和设备 |
US9418674B2 (en) * | 2012-01-17 | 2016-08-16 | GM Global Technology Operations LLC | Method and system for using vehicle sound information to enhance audio prompting |
KR20150032614A (ko) * | 2012-06-04 | 2015-03-27 | 삼성전자주식회사 | 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 및 이를 채용하는 멀티미디어 기기 |
US9633652B2 (en) * | 2012-11-30 | 2017-04-25 | Stmicroelectronics Asia Pacific Pte Ltd. | Methods, systems, and circuits for speaker dependent voice recognition with a single lexicon |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
-
2013
- 2013-12-16 KR KR1020130156643A patent/KR102251833B1/ko active IP Right Grant
-
2014
- 2014-11-25 JP JP2016540509A patent/JP6573887B2/ja not_active Expired - Fee Related
- 2014-11-25 EP EP14872819.9A patent/EP3069337B1/en not_active Not-in-force
- 2014-11-25 WO PCT/KR2014/011365 patent/WO2015093742A1/en active Application Filing
- 2014-11-25 CN CN201480075642.6A patent/CN106030704B/zh not_active Expired - Fee Related
- 2014-11-25 US US15/105,363 patent/US10186273B2/en not_active Expired - Fee Related
- 2014-12-11 TW TW103143185A patent/TWI555010B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP3069337A4 (en) | 2017-05-10 |
WO2015093742A1 (en) | 2015-06-25 |
TWI555010B (zh) | 2016-10-21 |
CN106030704B (zh) | 2020-07-31 |
EP3069337B1 (en) | 2019-01-02 |
US10186273B2 (en) | 2019-01-22 |
KR102251833B1 (ko) | 2021-05-13 |
US20170018280A1 (en) | 2017-01-19 |
EP3069337A1 (en) | 2016-09-21 |
JP2017504054A (ja) | 2017-02-02 |
TW201539432A (zh) | 2015-10-16 |
CN106030704A (zh) | 2016-10-12 |
KR20150069919A (ko) | 2015-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11631417B2 (en) | Stereo audio encoder and decoder | |
US11094331B2 (en) | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing | |
RU2449387C2 (ru) | Способ и устройство для обработки сигнала | |
EP2224433A1 (en) | An apparatus for processing an audio signal and method thereof | |
JP6573887B2 (ja) | オーディオ信号の符号化方法、復号方法及びその装置 | |
JP6457625B2 (ja) | 独立したノイズ充填を用いた強化された信号を生成するための装置および方法 | |
CN110047500B (zh) | 音频编码器、音频译码器及其方法 | |
KR20150032614A (ko) | 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 및 이를 채용하는 멀티미디어 기기 | |
EP3080805B1 (en) | Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder | |
KR101108955B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
Lin et al. | Adaptive bandwidth extension of low bitrate compressed audio based on spectral correlation | |
RU2798009C2 (ru) | Стереофонический кодер и декодер аудиосигналов | |
WO2010035972A2 (en) | An apparatus for processing an audio signal and method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190716 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190814 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6573887 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |