JPWO2011086923A1 - 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法 - Google Patents
符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法 Download PDFInfo
- Publication number
- JPWO2011086923A1 JPWO2011086923A1 JP2011549935A JP2011549935A JPWO2011086923A1 JP WO2011086923 A1 JPWO2011086923 A1 JP WO2011086923A1 JP 2011549935 A JP2011549935 A JP 2011549935A JP 2011549935 A JP2011549935 A JP 2011549935A JP WO2011086923 A1 JPWO2011086923 A1 JP WO2011086923A1
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- unit
- decoding
- component
- celp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 74
- 238000004364 calculation method Methods 0.000 title claims description 71
- 238000000034 method Methods 0.000 title claims description 37
- 230000003595 spectral effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 description 144
- 230000006872 improvement Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
図2は、本実施の形態に係る符号化装置の要部構成を示すブロック図である。図2の符号化装置100は、予め設定された時間間隔(フレーム)単位で入力信号に対して符号化処理を行うことでビットストリームを生成し、生成したビットストリームを後述する復号装置へ伝送する。
本実施の形態では、実施の形態1に加え、さらにCELP符号化におけるピッチゲインを用いて、特徴パラメータを算出する場合について説明する。
実施の形態1及び実施の形態2では、符号化装置は、変換係数(入力変換係数又はCELP復号変換係数)をピーク成分とフロア成分とに分類する際に1つの閾値を用いる場合について説明した。これに対して、本実施の形態では、符号化装置は、変換係数をピーク成分に分類するための閾値、及び、変換係数をフロア成分に分類するための閾値の2つの閾値を用いる場合について説明する。
本実施の形態では、低位レイヤ(又は基本レイヤ)にCELP符号化を用いて、高位レイヤ(又は拡張レイヤ)に変換符号化を用いるスケーラブル符号化を行う場合について説明する。
200、400、600 復号装置
101 CELP符号化部
102、202、301、401 CELP復号部
103、105、203、502 T/F変換部
104 遅延部
106、106a、302 特徴パラメータ符号化部
107、504 多重化部
201、601 分離部
204 特徴パラメータ復号部
205、205a、402、603 変換係数強調部
206 F/T変換部
111、114、211、612 包絡成分除去部
112、112a、115、115a、212、212a、311、312、411、613 閾値算出部
113、113a、116、116a、213、213a、614 変換係数分類部
117 特徴パラメータ算出部
118 特徴パラメータ符号化部
214、615 強調部
215 包絡成分付与部
216 エネルギー調整部
501 減算部
503 変換符号化部
602 変換復号部
611 加算部
616 強調変換係数生成部
Claims (9)
- 入力信号を符号化して第1符号化データを生成する第1符号化手段と、
前記第1符号化データを復号して復号信号を生成する復号手段と、
前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを算出する算出手段と、
を具備する符号化装置。 - 前記パラメータを符号化して第2符号化データを生成する第2符号化手段を、さらに具備する、
請求項1記載の符号化装置。 - 前記第1符号化手段は、前記入力信号に対してCELP(Code Excited Linear Prediction)符号化を行い、
前記第2符号化手段は、前記前記入力信号、前記復号信号及び前記CELP符号化におけるピッチゲインを用いて前記パラメータを算出する、
請求項2記載の符号化装置。 - 符号化装置において入力信号を符号化して得られた第1符号化データを復号して、復号信号を生成する第1復号手段と、
前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを用いて、前記復号信号のスペクトルのピーク成分の振幅調整を行う調整手段と、
を具備する復号装置。 - 前記符号化装置は、入力信号を符号化して第1符号化データを生成し、前記第1符号化データを復号して復号信号を生成し、前記入力信号及び前記復号信号を用いて前記パラメータを算出し、前記パラメータを符号化して第2符号化データを生成し、
前記第2符号化データを復号して、前記パラメータを得る第2復号手段を、さらに具備し、
前記調整手段は、前記パラメータを用いて前記振幅調整を行う、
請求項4記載の復号装置。 - 前記符号化装置は、前記入力信号に対してCELP(Code Excited Linear Prediction)符号化を行う符号化装置であって、前記入力信号、前記復号信号及び前記CELP符号化におけるピッチゲインを用いて前記パラメータを算出する、
請求項5記載の復号装置。 - 前記符号化装置は、少なくとも低位レイヤと高位レイヤとを有するスケーラブル符号化を行う符号化装置であって、低位レイヤにおいて前記第1符号化データを生成し、高位レイヤにおいて前記入力信号の一部の帯域における前記復号信号と前記入力信号との差である誤差信号を符号化して第2符号化データを生成し、
前記第2符号化データを復号して、前記誤差信号を得る第2復号手段を、さらに具備し、
前記調整手段は、前記復号信号及び前記誤差信号を用いて得られる復号入力信号と、前記復号信号との間における、前記一部の帯域でのスペクトルのピーク成分とフロア成分との比の変動量を示す前記パラメータを用いて、前記一部の帯域以外の帯域における前記復号信号のスペクトルのピーク成分の前記振幅調整を行う、
請求項4記載の復号装置。 - 入力信号を符号化して第1符号化データを生成する符号化ステップと、
前記第1符号化データを復号して復号信号を生成する復号ステップと、
前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを算出する算出ステップと、
を具備するスペクトル変動量算出方法。 - 符号化装置において入力信号を符号化して得られた第1符号化データを復号して、復号信号を生成する復号ステップと、
前記復号信号と前記入力信号との間におけるスペクトルのピーク成分とフロア成分との比の変動量を示すパラメータを用いて、前記復号信号のスペクトルのピーク成分の振幅調整を行う調整ステップと、
を具備するスペクトル振幅調整方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011549935A JP5602769B2 (ja) | 2010-01-14 | 2011-01-13 | 符号化装置、復号装置、符号化方法及び復号方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010006260 | 2010-01-14 | ||
JP2010006260 | 2010-01-14 | ||
JP2011549935A JP5602769B2 (ja) | 2010-01-14 | 2011-01-13 | 符号化装置、復号装置、符号化方法及び復号方法 |
PCT/JP2011/000133 WO2011086923A1 (ja) | 2010-01-14 | 2011-01-13 | 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011086923A1 true JPWO2011086923A1 (ja) | 2013-05-16 |
JP5602769B2 JP5602769B2 (ja) | 2014-10-08 |
Family
ID=44304199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011549935A Expired - Fee Related JP5602769B2 (ja) | 2010-01-14 | 2011-01-13 | 符号化装置、復号装置、符号化方法及び復号方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8892428B2 (ja) |
JP (1) | JP5602769B2 (ja) |
CN (1) | CN102714040A (ja) |
WO (1) | WO2011086923A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
LT2774145T (lt) * | 2011-11-03 | 2020-09-25 | Voiceage Evs Llc | Nekalbinio turinio gerinimas mažos spartos celp dekoderiui |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
US9997165B2 (en) * | 2013-10-18 | 2018-06-12 | Telefonaktiebolaget L M Ericsson (Publ) | Coding and decoding of spectral peak positions |
CN106663437B (zh) * | 2014-05-01 | 2021-02-02 | 日本电信电话株式会社 | 编码装置、解码装置、编码方法、解码方法、记录介质 |
CN110444217B (zh) | 2014-05-01 | 2022-10-21 | 日本电信电话株式会社 | 解码装置、解码方法、记录介质 |
KR101837153B1 (ko) * | 2014-05-01 | 2018-03-09 | 니폰 덴신 덴와 가부시끼가이샤 | 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 |
KR102061300B1 (ko) * | 2015-04-13 | 2020-02-11 | 니폰 덴신 덴와 가부시끼가이샤 | 선형 예측 부호화 장치, 선형 예측 복호 장치, 이들의 방법, 프로그램 및 기록 매체 |
JP6962269B2 (ja) * | 2018-05-10 | 2021-11-05 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
EP3844749B1 (en) * | 2018-08-30 | 2023-12-27 | Dolby International AB | Method and apparatus for controlling enhancement of low-bitrate coded audio |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6260009B1 (en) | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
JP3453116B2 (ja) * | 2000-09-26 | 2003-10-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化方法及び装置 |
JP3590342B2 (ja) * | 2000-10-18 | 2004-11-17 | 日本電信電話株式会社 | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 |
CN1430204A (zh) | 2001-12-31 | 2003-07-16 | 佳能株式会社 | 波形信号分析、基音探测以及句子探测的方法和设备 |
AU2003234763A1 (en) * | 2002-04-26 | 2003-11-10 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
KR100446242B1 (ko) | 2002-04-30 | 2004-08-30 | 엘지전자 주식회사 | 음성 부호화기에서 하모닉 추정 방법 및 장치 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
CN101308659B (zh) * | 2007-05-16 | 2011-11-30 | 中兴通讯股份有限公司 | 一种基于先进音频编码器的心理声学模型的处理方法 |
US8990073B2 (en) | 2007-06-22 | 2015-03-24 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
CN101903945B (zh) | 2007-12-21 | 2014-01-01 | 松下电器产业株式会社 | 编码装置、解码装置以及编码方法 |
JPWO2009084221A1 (ja) | 2007-12-27 | 2011-05-12 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
-
2011
- 2011-01-13 CN CN2011800054913A patent/CN102714040A/zh active Pending
- 2011-01-13 WO PCT/JP2011/000133 patent/WO2011086923A1/ja active Application Filing
- 2011-01-13 US US13/521,341 patent/US8892428B2/en active Active
- 2011-01-13 JP JP2011549935A patent/JP5602769B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102714040A (zh) | 2012-10-03 |
US20120296659A1 (en) | 2012-11-22 |
WO2011086923A1 (ja) | 2011-07-21 |
JP5602769B2 (ja) | 2014-10-08 |
US8892428B2 (en) | 2014-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5602769B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP6570151B2 (ja) | 符号化装置、復号装置、符号化方法および復号方法 | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
JP6336086B2 (ja) | 適合的帯域幅拡張およびそのための装置 | |
JP5036317B2 (ja) | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 | |
KR101414354B1 (ko) | 부호화 장치 및 부호화 방법 | |
KR102070432B1 (ko) | 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치 | |
CN110097896B (zh) | 语音处理的清浊音判决方法及装置 | |
US8121850B2 (en) | Encoding apparatus and encoding method | |
WO2007037361A1 (ja) | 音声符号化装置および音声符号化方法 | |
KR20100063127A (ko) | 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치 | |
US20130173275A1 (en) | Audio encoding device and audio decoding device | |
JP2020204784A (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
WO2006041055A1 (ja) | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 | |
US20130151255A1 (en) | Method and device for extending bandwidth of speech signal | |
CN105765653B (zh) | 自适应高通后滤波器 | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP5711733B2 (ja) | 復号装置、符号化装置及びこれらの方法 | |
Żernicki et al. | Enhanced coding of high-frequency tonal components in MPEG-D USAC through joint application of ESBR and sinusoidal modeling | |
WO2013057895A1 (ja) | 符号化装置及び符号化方法 | |
JPWO2007037359A1 (ja) | 音声符号化装置および音声符号化方法 | |
JP3612260B2 (ja) | 音声符号化方法及び装置並びに及び音声復号方法及び装置 | |
JP3785363B2 (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
JPH08221098A (ja) | 音声符号化・復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140507 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140703 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140812 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5602769 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |