JP6148342B2 - 低または中ビットレートに対する知覚品質に基づくオーディオ分類 - Google Patents
低または中ビットレートに対する知覚品質に基づくオーディオ分類 Download PDFInfo
- Publication number
- JP6148342B2 JP6148342B2 JP2015531459A JP2015531459A JP6148342B2 JP 6148342 B2 JP6148342 B2 JP 6148342B2 JP 2015531459 A JP2015531459 A JP 2015531459A JP 2015531459 A JP2015531459 A JP 2015531459A JP 6148342 B2 JP6148342 B2 JP 6148342B2
- Authority
- JP
- Japan
- Prior art keywords
- digital signal
- signal
- audio
- pitch correlation
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 36
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000005284 excitation Effects 0.000 description 39
- 238000012545 processing Methods 0.000 description 17
- 230000007774 longterm Effects 0.000 description 16
- 230000003044 adaptive effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000012805 post-processing Methods 0.000 description 10
- 238000007906 compression Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 9
- 230000000873 masking effect Effects 0.000 description 9
- 230000015654 memory Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000004979 auditory behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
/* 低ビットレートのためのAUDIOからVOICEDへの安全な補正 */
if (coder_type== AUDIO & localVAD==1 & dpit1<=3.f & dpit2<=3.f & dpit3<=3.f & Voicing>0.95f & Voicing_sm>0.97)
{coder_type = VOICED;}
ANNEXE C-CODE
/* 低ビットレートのためのAUDIOからVOICEDへの安全な補正 */
voicing=(voicing_fr[0]+voicing_fr[1]+voicing_fr[2]+voicing_fr[3])/4;
*voicing_sm = 0.75f*(*voicing_sm) + 0.25f*voicing;
dpit1 = (float)fabs(T_op_fr[0]-T_op_fr[1]);
dpit2 = (float)fabs(T_op_fr[1]-T_op_fr[2]);
dpit3 = (float)fabs(T_op_fr[2]-T_op_fr[3]);
if( *coder_type>UNVOICED && localVAD==1 && dpit1<=3.f && dpit2<=3.f
&& dpit3<=3.f && *coder_type==AUDIO && voicing>0.95f
&& *voicing_sm>0.97)
{
*coder_type = VOICED;
B(z) = 1 − gp・z-pitch
102 合成音声
103 短期線形予測フィルタ
105 長期線形予測フィルタ
107 Gc
108 符号化励起
109 重み付けされた誤差
110 重み付けフィルタ
201 符号化励起
203 長期予測
205 短期予測
206 合成音声
207 後処理ブロック
303 短期線形予測フィルタ
304 過去の合成された励起
305 Gp
307 適応コードブック
308 符号化励起コードブック
401 適応コードブック
402 符号化励起
406 短期予測
407 合成音声
408 後処理ブロック
502 サブフレームサイズ
503 ピッチ周期
602 サブフレームサイズ
603 ピッチ周期
701 入力信号
702 非量子化周波数領域係数
703 ビットストリーム
704 受信されたビット
705 量子化係数
706 適切に設計されたモジュール
707 向上した係数
708 最終的な時間領域出力
801 原信号
802 基準励起信号
803 非量子化周波数領域係数
805 受信されたビット
806 量子化係数
807 適切に設計されたモジュール
808 向上した係数
809 時間領域励起
810 最終的な出力信号
Claims (13)
- 信号を分類するための方法であって、前記方法は、
オーディオデータを有するデジタル信号を受信するステップであって、前記デジタル信号は、初めは、AUDIO信号として分類される、ステップと、
基準が満たされるとき、前記デジタル信号を、VOICED信号として再分類するステップであって、前記基準は前記デジタル信号におけるサブフレーム間のピッチ差が閾値よりも小さいことを有する、ステップと、
前記デジタル信号の分類に従って、前記デジタル信号を符号化するステップであって、前記デジタル信号がAUDIO信号として分類される場合、前記デジタル信号は周波数領域において符号化され、または、前記デジタル信号がVOICED信号として再分類される場合、前記デジタル信号は時間領域において符号化される、ステップと
を有する方法。 - 前記基準は、前記デジタル信号におけるサブフレームに対する、平均正規化ピッチ相関値が閾値を超えることをさらに有する、請求項1に記載の方法。
- 前記デジタル信号におけるサブフレームに対する、前記平均正規化ピッチ相関値は、
前記デジタル信号における各サブフレームに対して正規化ピッチ相関値を決定するステップと、
前記平均正規化ピッチ相関値を取得するために、前記デジタル信号におけるサブフレームの数によって、全ての正規化ピッチ相関値の合計を割るステップと
によって得られる、請求項2に記載の方法。 - 前記基準は、
前記デジタル信号の符号化レートが閾値を下回ることをさらに有する、請求項1に記載の方法。 - 前記デジタル信号は、非音声データおよび音楽データのうちの少なくとも1つを搬送する、請求項1乃至4のいずれか1項に記載の方法。
- オーディオエンコーダであって、前記オーディオエンコーダは、
プロセッサと、
前記プロセッサによる実行のためのプログラムを格納するコンピュータ可読記憶媒体であって、前記プログラムは、
オーディオデータを有するデジタル信号を受信することであって、前記デジタル信号は、初めは、AUDIO信号として分類される、ことと、
基準が満たされるとき、前記デジタル信号を、VOICED信号として再分類することであって、前記基準は前記デジタル信号におけるサブフレーム間のピッチ差が閾値よりも小さいことを有する、再分類することと、
前記デジタル信号の分類に従って、前記デジタル信号を符号化することであって、前記デジタル信号がAUDIO信号として分類される場合、前記デジタル信号は周波数領域において符号化され、または、前記デジタル信号がVOICED信号として分類される場合、前記デジタル信号は時間領域において符号化される、ことと
を行うための命令を有する、コンピュータ可読記憶媒体と
を有する、エンコーダ。 - 前記基準は、前記デジタル信号におけるサブフレームに対する、平均正規化ピッチ相関値が閾値を超えることをさらに有する、請求項6に記載のエンコーダ。
- 前記デジタル信号におけるサブフレームに対する、前記平均正規化ピッチ相関値は、
前記デジタル信号における各サブフレームに対して正規化ピッチ相関値を決定することと、
前記平均正規化ピッチ相関値を取得するために、前記デジタル信号におけるサブフレームの数によって、全ての正規化ピッチ相関値の合計を割ることと
によって得られる、請求項7に記載のエンコーダ。 - 前記基準は、前記デジタル信号の符号化レートが閾値を下回ることをさらに有する、請求項6に記載のエンコーダ。
- 前記デジタル信号は、非音声データおよび音楽データのうちの少なくとも1つを搬送する、請求項6乃至9のいずれか1項に記載のエンコーダ。
- 信号を分類するための方法であって、前記方法は、
オーディオデータを有するデジタル信号を受信するステップであって、前記デジタル信号は、初めは、AUDIO信号として分類される、ステップと、
前記デジタル信号におけるサブフレームに対して、正規化ピッチ相関値を決定するステップと、
前記正規化ピッチ相関値を平均することによって、平均正規化ピッチ相関値を決定するステップと、
前記それぞれのサブフレームに関連付けられた前記正規化ピッチ相関値を比較することによって、前記デジタル信号におけるサブフレーム間のピッチ差を決定するステップと、
前記ピッチ差の各々が第1閾値を下回るとともに、前記平均された正規化ピッチ相関値が第2閾値を越える場合、前記デジタル信号をVOICED信号として再分類するステップと、
前記デジタル信号の分類に従って、前記デジタル信号を符号化するステップであって、前記デジタル信号がAUDIO信号として分類される場合、前記デジタル信号は周波数領域において符号化され、または、前記デジタル信号がVOICED信号として分類される場合、前記デジタル信号は時間領域において符号化される、ステップと
を有する方法。 - 前記デジタル信号は、音楽を搬送する、請求項11に記載の方法。
- その上に記録されたプログラムを有するコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに、請求項1乃至5および請求項11および請求項12のいずれか1項の方法を実行させる、コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261702342P | 2012-09-18 | 2012-09-18 | |
US61/702,342 | 2012-09-18 | ||
PCT/CN2013/083794 WO2014044197A1 (en) | 2012-09-18 | 2013-09-18 | Audio classification based on perceptual quality for low or medium bit rates |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017098855A Division JP6545748B2 (ja) | 2012-09-18 | 2017-05-18 | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015534109A JP2015534109A (ja) | 2015-11-26 |
JP6148342B2 true JP6148342B2 (ja) | 2017-06-14 |
Family
ID=50275348
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015531459A Active JP6148342B2 (ja) | 2012-09-18 | 2013-09-18 | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
JP2017098855A Active JP6545748B2 (ja) | 2012-09-18 | 2017-05-18 | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
JP2019113750A Active JP6843188B2 (ja) | 2012-09-18 | 2019-06-19 | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017098855A Active JP6545748B2 (ja) | 2012-09-18 | 2017-05-18 | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
JP2019113750A Active JP6843188B2 (ja) | 2012-09-18 | 2019-06-19 | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
Country Status (9)
Country | Link |
---|---|
US (3) | US9589570B2 (ja) |
EP (2) | EP2888734B1 (ja) |
JP (3) | JP6148342B2 (ja) |
KR (2) | KR101705276B1 (ja) |
BR (1) | BR112015005980B1 (ja) |
ES (1) | ES2870487T3 (ja) |
HK (2) | HK1245988A1 (ja) |
SG (2) | SG11201502040YA (ja) |
WO (1) | WO2014044197A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
US9589570B2 (en) * | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US9685166B2 (en) * | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
WO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、及び、符号化方法 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6226604B1 (en) * | 1996-08-02 | 2001-05-01 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
US6456965B1 (en) * | 1997-05-20 | 2002-09-24 | Texas Instruments Incorporated | Multi-stage pitch and mixed voicing estimation for harmonic speech coders |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6496797B1 (en) * | 1999-04-01 | 2002-12-17 | Lg Electronics Inc. | Apparatus and method of speech coding and decoding using multiple frames |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6694293B2 (en) | 2001-02-13 | 2004-02-17 | Mindspeed Technologies, Inc. | Speech coding system with a music classifier |
US6738739B2 (en) * | 2001-02-15 | 2004-05-18 | Mindspeed Technologies, Inc. | Voiced speech preprocessing employing waveform interpolation or a harmonic model |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US6917912B2 (en) * | 2001-04-24 | 2005-07-12 | Microsoft Corporation | Method and apparatus for tracking pitch in audio analysis |
US6871176B2 (en) * | 2001-07-26 | 2005-03-22 | Freescale Semiconductor, Inc. | Phase excited linear prediction encoder |
US7124075B2 (en) * | 2001-10-26 | 2006-10-17 | Dmitry Edward Terez | Methods and apparatus for pitch determination |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
KR100546758B1 (ko) * | 2003-06-30 | 2006-01-26 | 한국전자통신연구원 | 음성의 상호부호화시 전송률 결정 장치 및 방법 |
US7447630B2 (en) * | 2003-11-26 | 2008-11-04 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement |
US7783488B2 (en) * | 2005-12-19 | 2010-08-24 | Nuance Communications, Inc. | Remote tracing and debugging of automatic speech recognition servers by speech reconstruction from cepstra and pitch information |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
CN101256772B (zh) | 2007-03-02 | 2012-02-15 | 华为技术有限公司 | 确定非噪声音频信号归属类别的方法和装置 |
US20080249783A1 (en) * | 2007-04-05 | 2008-10-09 | Texas Instruments Incorporated | Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding |
KR100925256B1 (ko) | 2007-05-03 | 2009-11-05 | 인하대학교 산학협력단 | 음성 및 음악을 실시간으로 분류하는 방법 |
US8185388B2 (en) * | 2007-07-30 | 2012-05-22 | Huawei Technologies Co., Ltd. | Apparatus for improving packet loss, frame erasure, or jitter concealment |
US8473283B2 (en) * | 2007-11-02 | 2013-06-25 | Soundhound, Inc. | Pitch selection modules in a system for automatic transcription of sung or hummed melodies |
AU2009267507B2 (en) | 2008-07-11 | 2012-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and discriminator for classifying different segments of a signal |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
US8185384B2 (en) * | 2009-04-21 | 2012-05-22 | Cambridge Silicon Radio Limited | Signal pitch period estimation |
KR20120032444A (ko) * | 2010-09-28 | 2012-04-05 | 한국전자통신연구원 | 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치 |
TR201815402T4 (tr) | 2010-10-25 | 2018-11-21 | Voiceage Corp | Düşük bit hızları ve düşük gecikmede genel audio sinyallerinin kodlanması. |
TWI488176B (zh) * | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
EP2777041B1 (en) * | 2011-11-10 | 2016-05-04 | Nokia Technologies Oy | A method and apparatus for detecting audio sampling rate |
ES2757700T3 (es) * | 2011-12-21 | 2020-04-29 | Huawei Tech Co Ltd | Detección y codificación de altura tonal muy débil |
US9015039B2 (en) * | 2011-12-21 | 2015-04-21 | Huawei Technologies Co., Ltd. | Adaptive encoding pitch lag for voiced speech |
US9111531B2 (en) * | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
US9589570B2 (en) * | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
US9685166B2 (en) * | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
-
2013
- 2013-09-13 US US14/027,052 patent/US9589570B2/en active Active
- 2013-09-18 BR BR112015005980-5A patent/BR112015005980B1/pt active IP Right Grant
- 2013-09-18 WO PCT/CN2013/083794 patent/WO2014044197A1/en active Application Filing
- 2013-09-18 SG SG11201502040YA patent/SG11201502040YA/en unknown
- 2013-09-18 ES ES17192499T patent/ES2870487T3/es active Active
- 2013-09-18 KR KR1020157009481A patent/KR101705276B1/ko active IP Right Grant
- 2013-09-18 SG SG10201706360RA patent/SG10201706360RA/en unknown
- 2013-09-18 EP EP13839606.4A patent/EP2888734B1/en active Active
- 2013-09-18 JP JP2015531459A patent/JP6148342B2/ja active Active
- 2013-09-18 EP EP17192499.6A patent/EP3296993B1/en active Active
- 2013-09-18 KR KR1020177003091A patent/KR101801758B1/ko active IP Right Grant
-
2015
- 2015-07-31 HK HK18105294.2A patent/HK1245988A1/zh unknown
- 2015-07-31 HK HK15107348.7A patent/HK1206863A1/xx unknown
-
2017
- 2017-01-04 US US15/398,321 patent/US10283133B2/en active Active
- 2017-05-18 JP JP2017098855A patent/JP6545748B2/ja active Active
-
2019
- 2019-04-04 US US16/375,583 patent/US11393484B2/en active Active
- 2019-06-19 JP JP2019113750A patent/JP6843188B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
BR112015005980A2 (pt) | 2017-07-04 |
JP6545748B2 (ja) | 2019-07-17 |
EP2888734A1 (en) | 2015-07-01 |
EP3296993B1 (en) | 2021-03-10 |
JP2015534109A (ja) | 2015-11-26 |
US20170116999A1 (en) | 2017-04-27 |
JP6843188B2 (ja) | 2021-03-17 |
EP2888734B1 (en) | 2017-11-15 |
KR101801758B1 (ko) | 2017-11-27 |
US20140081629A1 (en) | 2014-03-20 |
ES2870487T3 (es) | 2021-10-27 |
US11393484B2 (en) | 2022-07-19 |
SG10201706360RA (en) | 2017-09-28 |
JP2019174834A (ja) | 2019-10-10 |
EP2888734A4 (en) | 2015-11-04 |
KR20170018091A (ko) | 2017-02-15 |
SG11201502040YA (en) | 2015-04-29 |
US20190237088A1 (en) | 2019-08-01 |
US10283133B2 (en) | 2019-05-07 |
HK1206863A1 (en) | 2016-01-15 |
JP2017156767A (ja) | 2017-09-07 |
KR101705276B1 (ko) | 2017-02-22 |
WO2014044197A1 (en) | 2014-03-27 |
KR20150055035A (ko) | 2015-05-20 |
HK1245988A1 (zh) | 2018-08-31 |
EP3296993A1 (en) | 2018-03-21 |
US9589570B2 (en) | 2017-03-07 |
BR112015005980B1 (pt) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10885926B2 (en) | Classification between time-domain coding and frequency domain coding for high bit rates | |
EP3039676B1 (en) | Adaptive bandwidth extension and apparatus for the same | |
JP6843188B2 (ja) | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160517 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160817 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6148342 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |