JP6262668B2 - 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 - Google Patents
帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 Download PDFInfo
- Publication number
- JP6262668B2 JP6262668B2 JP2014558299A JP2014558299A JP6262668B2 JP 6262668 B2 JP6262668 B2 JP 6262668B2 JP 2014558299 A JP2014558299 A JP 2014558299A JP 2014558299 A JP2014558299 A JP 2014558299A JP 6262668 B2 JP6262668 B2 JP 6262668B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- tone
- frequency
- floor
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Description
一般的に、音信号(スピーチ信号およびオーディオ信号)の符号化には、パラメトリック符号化ツールとコア符号化ツールとの少なくとも2種類のツールが用いられる。まず、パラメトリック符号化ツールについて説明する。
実施の形態1では、本発明の帯域幅拡張技術を用いた符号化装置について説明する。図3は、実施の形態1に係る符号化装置の機能構成を示すブロック図である。図4は、実施の形態1に係る符号化装置の動作のフローチャートである。
実施の形態2では、符号化装置100aに対応する復号装置について説明する。図6は、実施の形態2に係る復号装置の機能構成を示すブロック図である。図7は、実施の形態2に係る復号装置の動作のフローチャートである。
本発明の帯域幅拡張技術は、MDCT処理を行う符号化装置にも適用可能である。実施の形態3では、このような符号化装置について説明する。図8は、実施の形態3に係る符号化装置の機能構成を示すブロック図である。図9は、実施の形態3に係る符号化装置の動作のフローチャートである。
実施の形態4では、符号化装置100bに対応する復号装置について説明する。図12は、実施の形態4に係る復号装置の機能構成を示すブロック図である。図13は、実施の形態4に係る復号装置の動作のフローチャートである。
本発明は、帯域幅拡張パラメータ生成装置として実現されてもよい。
上記実施の形態に係る帯域幅拡張パラメータ生成装置および符号化装置は、入力信号の高域部分のトーンエネルギーおよびフロアエネルギーを推定し、これらのエネルギーの大きさを示す帯域幅拡張パラメータを生成する。
200、204 QMF分析
200a、200b 復号装置
201 コピーアップ
202 臨界サンプリング
203 QMF合成
205 時間的伸長および再サンプリング
206 HF調整
207 コピーアップモード
208 ハーモニックモード
300 フィルタ部
301、602 符号化部
302、502 QMF分析部
303、604 抽出部
304、605 算出部
305、606 ビットストリーム・マルチプレクサ
306、607 帯域幅拡張パラメータ生成装置
500、900 ビットストリーム・デマルチプレクサ
501、911 復号部
503、903 分割部
504、904 トーン拡張部
505、905 フロア拡張部
506、906 トーン調整部
507、907 フロア調整部
508、908 加算部
509 QMF合成部
600、910 フレーマー
601 MDCT部
603 MDST部
700 フレーム
701 窓関数
702 MDCT処理
703 IMDCT処理
704 窓処理
901 コア復号部
902 複素信号生成部
909 IMDCT部
Claims (9)
- ビットストリームを復号する復号装置であって、
前記ビットストリームには、符号化された入力音信号の低域部分であるコアパラメータと、前記入力音信号の高域部分を示す高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとが含まれ、
前記復号装置は、
前記コアパラメータを復号することによって復号済み狭帯域信号を生成する復号部と、
前記復号済み狭帯域信号のトーン成分を示す信号である低域トーン信号と、前記復号済み狭帯域信号のフロア成分を示す信号である低域フロア信号とを生成する分割部と、
前記低域トーン信号を用いて前記高域信号のトーン成分に対応する信号である高域トーン信号を生成するトーン拡張部と、
前記低域フロア信号を用いて前記高域信号のフロア成分に対応する信号である高域フロア信号を生成するフロア拡張部と、
前記トーンパラメータを用いて前記高域トーン信号を調整した調整済みトーン信号を生成するトーン調整部と、
前記フロアパラメータを用いて前記高域フロア信号を調整した調整済みフロア信号を生成するフロア調整部と、
前記コアパラメータから得られる信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した帯域幅拡張信号を生成する加算部とを備える
復号装置。 - 前記トーン拡張部は、前記低域トーン信号に含まれるトーン成分の高調波成分を示す信号を前記高域トーン信号として生成する
請求項1に記載の復号装置。 - さらに、前記復号済み狭帯域信号をサブバンド信号に変換するQMF分析部を備え、
前記分割部は、前記サブバンド信号を分割することによって、前記低域トーン信号と、前記低域フロア信号とを生成し、
前記加算部は、前記コアパラメータから得られる信号である前記サブバンド信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した前記帯域幅拡張信号を生成する
請求項1に記載の復号装置。 - 前記トーン拡張部は、前記低域トーン信号におけるサブバンドの中から、トーン成分のエネルギーが(1)隣接するサブバンドのトーン成分のエネルギーの所定倍よりも大きく、かつ、(2)当該サブバンドのフロア成分のエネルギーの所定倍よりも大きいサブバンドを選択し、選択したサブバンドの整数倍のサブバンドに、当該選択したサブバンドの前記低域トーン信号を複製することによって前記高域トーン信号を生成する
請求項3に記載の復号装置。 - さらに、
前記ビットストリームから、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを生成するビットストリーム・デマルチプレクサと、
前記帯域幅拡張信号を時間領域に変換するQMF合成部とを備える
請求項3または4に記載の復号装置。 - 前記復号部は、(1)前記コアパラメータを復号してMDCT信号を生成し、(2)前記MDCT信号をMDST領域に変換したMDST信号を生成し、(3)生成した前記MDCT信号および前記MDST信号から得られる複素信号を前記復号済み狭帯域信号として生成し、
前記加算部は、前記コアパラメータから得られる信号である前記MDCT信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した前記帯域幅拡張信号を生成する
請求項1に記載の復号装置。 - 前記トーン拡張部は、前記低域トーン信号における周波数ビンの中から、トーン成分のエネルギーが隣接する周波数ビンのトーン成分のエネルギーの所定倍よりも大きい周波数ビンを選択し、選択した周波数ビンの整数倍の周波数ビンに、当該選択した周波数ビンの前記低域トーン信号を複製することによって前記高域トーン信号を生成する
請求項6に記載の復号装置。 - さらに、
前記ビットストリームから、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを生成するビットストリーム・デマルチプレクサと、
前記帯域幅拡張信号を時間領域に変換するIMDCT(Inverse Modified Discrete Cosine Transform)部とを備える
請求項6または7に記載の復号装置。 - ビットストリームを復号する復号方法であって、
前記ビットストリームには、符号化された入力音信号の低域部分であるコアパラメータと、前記入力音信号の高域部分を示す高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとが含まれ、
前記復号方法は、
前記コアパラメータを復号することによって復号済み狭帯域信号を生成する復号ステップと、
前記復号済み狭帯域信号のトーン成分を示す信号である低域トーン信号と、前記復号済み狭帯域信号のフロア成分を示す信号である低域フロア信号とを生成する分割ステップと、
前記低域トーン信号を用いて前記高域信号のトーン成分に対応する信号である高域トーン信号を生成するトーン拡張ステップと、
前記低域フロア信号を用いて前記高域信号のフロア成分に対応する信号である高域フロア信号を生成するフロア拡張ステップと、
前記トーンパラメータを用いて前記高域トーン信号を調整した調整済みトーン信号を生成するトーン調整ステップと、
前記フロアパラメータを用いて前記高域フロア信号を調整した調整済みフロア信号を生成するフロア調整ステップと、
前記コアパラメータから得られる信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した帯域幅拡張信号を生成する加算ステップとを含む
復号方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013009652 | 2013-01-22 | ||
JP2013009652 | 2013-01-22 | ||
PCT/JP2013/007448 WO2014115225A1 (ja) | 2013-01-22 | 2013-12-18 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014115225A1 JPWO2014115225A1 (ja) | 2017-01-19 |
JP6262668B2 true JP6262668B2 (ja) | 2018-01-17 |
Family
ID=51227042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014558299A Active JP6262668B2 (ja) | 2013-01-22 | 2013-12-18 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9424847B2 (ja) |
EP (1) | EP2950308B1 (ja) |
JP (1) | JP6262668B2 (ja) |
CN (1) | CN104584124B (ja) |
WO (1) | WO2014115225A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3011560B1 (en) * | 2013-06-21 | 2018-08-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder having a bandwidth extension module with an energy adjusting module |
EP2963645A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Calculator and method for determining phase correction data for an audio signal |
TW202242853A (zh) | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI732403B (zh) * | 2015-03-13 | 2021-07-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CN105261373B (zh) * | 2015-09-16 | 2019-01-08 | 深圳广晟信源技术有限公司 | 用于带宽扩展编码的自适应栅格构造方法和装置 |
EP3182411A1 (en) * | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
JP6769299B2 (ja) * | 2016-12-27 | 2020-10-14 | 富士通株式会社 | オーディオ符号化装置およびオーディオ符号化方法 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
EP3435376B1 (en) * | 2017-07-28 | 2020-01-22 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
JP6962386B2 (ja) | 2018-01-17 | 2021-11-05 | 日本電信電話株式会社 | 復号装置、符号化装置、これらの方法及びプログラム |
US10978083B1 (en) | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
WO2021143691A1 (zh) * | 2020-01-13 | 2021-07-22 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN113192523A (zh) * | 2020-01-13 | 2021-07-30 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN113593586A (zh) * | 2020-04-15 | 2021-11-02 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
CN113539281A (zh) * | 2020-04-21 | 2021-10-22 | 华为技术有限公司 | 音频信号编码方法和装置 |
CN113808596A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
CN113808597A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
CN113963703A (zh) * | 2020-07-03 | 2022-01-21 | 华为技术有限公司 | 一种音频编码的方法和编解码设备 |
CN113948094A (zh) * | 2020-07-16 | 2022-01-18 | 华为技术有限公司 | 音频编解码方法和相关装置及计算机可读存储介质 |
WO2023147650A1 (en) * | 2022-02-03 | 2023-08-10 | Voiceage Corporation | Time-domain superwideband bandwidth expansion for cross-talk scenarios |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6356211B1 (en) | 1997-05-13 | 2002-03-12 | Sony Corporation | Encoding method and apparatus and recording medium |
JPH1132399A (ja) * | 1997-05-13 | 1999-02-02 | Sony Corp | 符号化方法及び装置、並びに記録媒体 |
US7469206B2 (en) * | 2001-11-29 | 2008-12-23 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US6879954B2 (en) * | 2002-04-22 | 2005-04-12 | Matsushita Electric Industrial Co., Ltd. | Pattern matching for large vocabulary speech recognition systems |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR20070001115A (ko) * | 2004-01-28 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복소수 값 데이터를 이용하는 오디오 신호 디코딩 |
US7668711B2 (en) | 2004-04-23 | 2010-02-23 | Panasonic Corporation | Coding equipment |
KR100707174B1 (ko) * | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
EP1839297B1 (en) * | 2005-01-11 | 2018-11-14 | Koninklijke Philips N.V. | Scalable encoding/decoding of audio signals |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
JP4736812B2 (ja) * | 2006-01-13 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US9177569B2 (en) * | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
JP5203077B2 (ja) * | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
PL4231290T3 (pl) * | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
CA2780971A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget L M Ericsson (Publ) | Improved excitation signal bandwidth extension |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
KR101679209B1 (ko) * | 2012-02-23 | 2016-12-06 | 돌비 인터네셔널 에이비 | 고 주파수 오디오 콘텐트의 효율적인 복구를 위한 방법들 및 시스템들 |
-
2013
- 2013-12-18 JP JP2014558299A patent/JP6262668B2/ja active Active
- 2013-12-18 CN CN201380043203.2A patent/CN104584124B/zh active Active
- 2013-12-18 EP EP13872902.5A patent/EP2950308B1/en active Active
- 2013-12-18 WO PCT/JP2013/007448 patent/WO2014115225A1/ja active Application Filing
-
2015
- 2015-02-13 US US14/621,885 patent/US9424847B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2014115225A1 (ja) | 2017-01-19 |
US9424847B2 (en) | 2016-08-23 |
CN104584124A (zh) | 2015-04-29 |
EP2950308A1 (en) | 2015-12-02 |
EP2950308A4 (en) | 2016-02-24 |
CN104584124B (zh) | 2019-04-16 |
WO2014115225A1 (ja) | 2014-07-31 |
EP2950308B1 (en) | 2020-02-19 |
US20150162010A1 (en) | 2015-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6262668B2 (ja) | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 | |
JP7092809B2 (ja) | 再構築帯域に対するエネルギ情報を用いてオーディオ信号を復号化または符号化する装置および方法 | |
JP7228607B2 (ja) | 全帯域ギャップ充填を備えた周波数ドメインプロセッサと時間ドメインプロセッサとを使用するオーディオ符号器及び復号器 | |
JP6229957B2 (ja) | 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号 | |
JP5551692B2 (ja) | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム | |
TWI541795B (zh) | 編碼器、解碼器、用於解碼之方法、用於編碼之方法及電腦程式 | |
RU2668397C2 (ru) | Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации | |
JP6126006B2 (ja) | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 | |
KR20080109299A (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
Quackenbush | MPEG Audio Compression Future |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161129 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171214 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6262668 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |