JP6023311B2 - ピッチ周期の正確性を検出するための方法および装置 - Google Patents
ピッチ周期の正確性を検出するための方法および装置 Download PDFInfo
- Publication number
- JP6023311B2 JP6023311B2 JP2015511902A JP2015511902A JP6023311B2 JP 6023311 B2 JP6023311 B2 JP 6023311B2 JP 2015511902 A JP2015511902 A JP 2015511902A JP 2015511902 A JP2015511902 A JP 2015511902A JP 6023311 B2 JP6023311 B2 JP 6023311B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- pitch period
- pitch
- accuracy
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 103
- 238000001514 detection method Methods 0.000 claims description 80
- 238000001228 spectrum Methods 0.000 claims description 34
- 239000011295 pitch Substances 0.000 description 218
- 238000009499 grossing Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- SYHGEUNFJIGTRX-UHFFFAOYSA-N methylenedioxypyrovalerone Chemical group C=1C=C2OCOC2=CC=1C(=O)C(CCC)N1CCCC1 SYHGEUNFJIGTRX-UHFFFAOYSA-N 0.000 description 2
- 102000016550 Complement Factor H Human genes 0.000 description 1
- 108010053085 Complement Factor H Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
F_op=N/Top
Diff_sum[0]=0;
for (i=1; i < 2*F_op; i++){
Spec_sum[i] = Spec_sum[i-1] + S[i];
Diff_sum[i] = Diff_sum[i-1] + (S[F_op] - S[i]);
},
Spec_avg=Spec_sum/(2*F_op-1)
Spec_sm=0.2*Spec_sm_pre+0.8*Spec_avg
ここで、Spec_sm_preは、過去のフレームのスペクトル差分の重み付き平滑化値であるパラメータである。このケースでは、0.2と0.8は重み付け係数および平滑化係数である。異なる重み付け係数および平滑化係数を、様々な入力信号の特徴に従って選択してもよい。
Diff_sm=0.4*Diff_sm_pre+0.6*Diff_sum
ここで、Diff_sm_preは、過去のフレームのスペクトル差分の重み付き平滑化値であるパラメータである。ここで、0.4と0.6は重み付け係数および平滑化係数である。異なる重み付け係数および平滑化係数を、様々な入力信号の特徴に従って選択してもよい。
Diff_ratio=Diff_sum/Spec_avg
平滑化平均スペクトル振幅パラメータSpec_smとスペクトル差分パラメータDiff_sm
22 パラメータ生成ユニット
23 正確性判定ユニット
24 精密検出ユニット
25 エネルギ検出ユニット
Claims (13)
- ピッチ周期の正確性を検出するための方法であって、
時間領域における入力信号の初期ピッチ周期に従って、前記入力信号のピッチ周波数ビンを決定するステップであって、前記初期ピッチ周期は開ループ検出を前記入力信号に対して行うことによって取得されるステップと、
周波数領域における前記入力信号の振幅スペクトルに基づいて、前記ピッチ周波数ビンに関連付けられた前記入力信号のピッチ周期正確性判定パラメータを決定するステップと、
前記ピッチ周期正確性判定パラメータに従って、前記初期ピッチ周期の正確性を決定するステップと、
を含み、
前記ピッチ周期正確性判定パラメータはスペクトル差分パラメータ、平均スペクトル振幅パラメータ、および差分振幅比パラメータを含み、前記スペクトル差分パラメータは、前記ピッチ周波数ビンの両側での所定数の周波数ビンのスペクトル差分の和または前記ピッチ周波数ビンの両側での前記所定数の周波数ビンの前記スペクトル差分の和の重み付き平滑化値であり、前記平均スペクトル振幅パラメータは、前記ピッチ周波数ビンの両側での前記所定数の周波数ビンのスペクトル振幅の平均または前記ピッチ周波数ビンの両側での前記所定数の周波数ビンのスペクトル振幅の前記平均の重み付き平滑化値であり、前記差分振幅比パラメータは、前記ピッチ周波数ビンの両側での前記所定数の周波数ビンの前記スペクトル差分の和の、前記ピッチ周波数ビンの両側での前記所定数の周波数ビンのスペクトル振幅の平均に対する比率である、
方法。 - 前記ピッチ周期正確性判定パラメータに従って、前記初期ピッチ周期の正確性を決定するステップは、
前記ピッチ周期正確性判定パラメータが正確性判定条件を満たすとき、前記初期ピッチ周期が正確であると判定するステップと、
前記ピッチ周期正確性判定パラメータが不正確性判定条件を満たすとき、前記初期ピッチ周期が不正確であると判定するステップと、
を含む、請求項1に記載の方法。 - 前記正確性判定条件は、前記スペクトル差分パラメータが第2の差分パラメータ閾値より大きいこと、前記平均スペクトル振幅パラメータが第2のスペクトル振幅パラメータ閾値より大きいこと、および、前記差分振幅比パラメータは第2の比率因子パラメータ閾値より大きいこと、の全てを満たし、
前記不正確性判定条件は、前記スペクトル差分パラメータが第1の差分パラメータ閾値より小さいこと、前記平均スペクトル振幅パラメータが第1のスペクトル振幅パラメータ閾値より小さいこと、および前記差分振幅比パラメータが第1の比率因子パラメータ閾値より小さいこと、の全てを満たす、
請求項2に記載の方法。 - 前記ピッチ周期正確性判定パラメータに従って前記初期ピッチ周期の正確性を検出している間に、前記初期ピッチ周期が不正確であることが検出されたとき、精密検出を前記入力信号に対して実施する、請求項1乃至3の何れか1項に記載の方法。
- 前記ピッチ周期正確性判定パラメータに従って、前記初期ピッチ周期の正確性を決定した後に、
低周波数範囲でエネルギを検出するステップと、
前記エネルギが低周波数エネルギ判定条件を満たすとき、短ピッチ検出を前記入力信号に対して実施するステップと、
をさらに含む、請求項1乃至3の何れか1項に記載の方法。 - 時間領域における入力信号の初期ピッチ周期に従って、前記入力信号のピッチ周波数ビンを決定するステップは、
前記入力信号の前記ピッチ周波数ビンは前記初期ピッチ周期に逆比例し、前記入力信号に対して行った高速フーリエ変換の点の数に直接比例すること
を含む、請求項1乃至5の何れか1項に記載の方法。 - ピッチ周期の正確性を検出するための装置であって、
時間領域における入力信号の初期ピッチ周期に従って、前記入力信号のピッチ周波数ビンを決定するように構成されたピッチ周波数ビン決定ユニットであって、前記初期ピッチ周期は開ループ検出を前記入力信号に対して行うことによって取得されるピッチ周波数ビン決定ユニットと、
周波数領域における前記入力信号の振幅スペクトルに基づいて、前記ピッチ周波数ビンに関連付けられた前記入力信号のピッチ周期正確性判定パラメータを決定するように構成されたパラメータ生成ユニットと、
前記ピッチ周期正確性判定パラメータに従って、前記初期ピッチ周期の正確性を決定するように構成された正確性判定ユニットと、
を備え、
前記パラメータ生成ユニットにより生成された前記ピッチ周期正確性判定パラメータはスペクトル差分パラメータ、平均スペクトル振幅パラメータ、および差分振幅比パラメータを含み、前記スペクトル差分パラメータは、前記ピッチ周波数ビンの両側での所定数の周波数ビンのスペクトル差分の和または前記ピッチ周波数ビンの両側での前記所定数の周波数ビンの前記スペクトル差分の和の重み付き平滑化値であり、前記平均スペクトル振幅パラメータは、前記ピッチ周波数ビンの両側での前記所定数の周波数ビンのスペクトル振幅の平均または前記ピッチ周波数ビンの両側での前記所定数の周波数ビンのスペクトル振幅の前記平均の重み付き平滑化値であり、前記差分振幅比パラメータは、前記ピッチ周波数ビンの両側での前記所定数の周波数ビンの前記スペクトル差分の和の、前記ピッチ周波数ビンの両側での前記所定数の周波数ビンのスペクトル振幅の平均に対する比率である、
装置。 - 前記正確性判定ユニットは特に、
前記ピッチ周期正確性判定パラメータが正確性判定条件を満たすと判定されたとき、前記初期ピッチ周期が正確であると判定し、
前記ピッチ周期正確性判定パラメータが不正確性判定条件を満たすと判定されたとき、前記初期ピッチ周期が不正確であると判定する、
ように構成された、請求項7に記載の装置。 - 前記正確性判定条件は、前記スペクトル差分パラメータが第2の差分パラメータ閾値より大きいこと、前記平均スペクトル振幅パラメータが第2のスペクトル振幅パラメータ閾値より大きいこと、および、前記差分振幅比パラメータは第2の比率因子パラメータ閾値より大きいこと、の全てを満たし、
前記不正確性判定条件は、前記スペクトル差分パラメータが第1の差分パラメータ閾値より小さいこと、前記平均スペクトル振幅パラメータが第1のスペクトル振幅パラメータ閾値より小さいこと、および、前記差分振幅比パラメータが第1の比率因子パラメータ閾値より小さいこと、の全てを満たす、
請求項8に記載の装置。 - 前記ピッチ周期正確性判定パラメータに従って前記初期ピッチ周期の正確性を検出している間に、前記初期ピッチ周期が不正確であることが検出されたとき、精密検出を前記入力信号に対して実施するように構成された精密検出ユニットをさらに備える、請求項7乃至9の何れか1項に記載の装置。
- 前記ピッチ周期正確性判定パラメータに従って前記初期ピッチ周期の正確性を検出している間に、不正確な初期ピッチ周期が検出されたとき、低周波数範囲において前記初期ピッチ周期のエネルギを検出するように構成されたエネルギ検出ユニットと、
前記エネルギが低周波数エネルギ判定条件を満たすとき、短ピッチ検出を前記入力信号に対して実施するように構成された精密検出ユニットと、
をさらに備える、請求項7乃至9の何れか1項に記載の装置。 - 前記ピッチ周波数ビン決定ユニットは、前記入力信号の前記ピッチ周波数ビンは前記初期ピッチ周期に逆比例し、前記入力信号に対して行った高速フーリエ変換の点の数に直接比例することに基づいて、前記ピッチ周波数ビンを決定するように構成された、請求項7乃至11の何れか1項に記載の装置。
- 請求項1乃至6の何れか1項に記載の方法をコンピュータに実行させるプログラムを記録した、コンピュータ可読記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210155298.4 | 2012-05-18 | ||
CN201210155298.4A CN103426441B (zh) | 2012-05-18 | 2012-05-18 | 检测基音周期的正确性的方法和装置 |
PCT/CN2012/087512 WO2013170610A1 (zh) | 2012-05-18 | 2012-12-26 | 检测基音周期的正确性的方法和装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016197932A Division JP6272433B2 (ja) | 2012-05-18 | 2016-10-06 | ピッチ周期の正確性を検出するための方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015516597A JP2015516597A (ja) | 2015-06-11 |
JP6023311B2 true JP6023311B2 (ja) | 2016-11-09 |
Family
ID=49583070
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015511902A Active JP6023311B2 (ja) | 2012-05-18 | 2012-12-26 | ピッチ周期の正確性を検出するための方法および装置 |
JP2016197932A Active JP6272433B2 (ja) | 2012-05-18 | 2016-10-06 | ピッチ周期の正確性を検出するための方法および装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016197932A Active JP6272433B2 (ja) | 2012-05-18 | 2016-10-06 | ピッチ周期の正確性を検出するための方法および装置 |
Country Status (10)
Country | Link |
---|---|
US (5) | US9633666B2 (ja) |
EP (2) | EP2843659B1 (ja) |
JP (2) | JP6023311B2 (ja) |
KR (2) | KR101649243B1 (ja) |
CN (1) | CN103426441B (ja) |
DK (1) | DK2843659T3 (ja) |
ES (2) | ES2627857T3 (ja) |
HU (1) | HUE034664T2 (ja) |
PL (1) | PL2843659T3 (ja) |
WO (1) | WO2013170610A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426441B (zh) * | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
CN106373594B (zh) * | 2016-08-31 | 2019-11-26 | 华为技术有限公司 | 一种音调检测方法及装置 |
US11282407B2 (en) | 2017-06-12 | 2022-03-22 | Harmony Helper, LLC | Teaching vocal harmonies |
US10249209B2 (en) | 2017-06-12 | 2019-04-02 | Harmony Helper, LLC | Real-time pitch detection for creating, practicing and sharing of musical harmonies |
CN110600060B (zh) * | 2019-09-27 | 2021-10-22 | 云知声智能科技股份有限公司 | 一种硬件音频主动探测hvad系统 |
CN111223491B (zh) * | 2020-01-22 | 2022-11-15 | 深圳市倍轻松科技股份有限公司 | 一种提取音乐信号主旋律的方法、装置及终端设备 |
US11335361B2 (en) * | 2020-04-24 | 2022-05-17 | Universal Electronics Inc. | Method and apparatus for providing noise suppression to an intelligent personal assistant |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8400552A (nl) * | 1984-02-22 | 1985-09-16 | Philips Nv | Systeem voor het analyseren van menselijke spraak. |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
CA1245363A (en) * | 1985-03-20 | 1988-11-22 | Tetsu Taguchi | Pattern matching vocoder |
US4776014A (en) * | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4809334A (en) | 1987-07-09 | 1989-02-28 | Communications Satellite Corporation | Method for detection and correction of errors in speech pitch period estimates |
US5127053A (en) | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US7171016B1 (en) * | 1993-11-18 | 2007-01-30 | Digimarc Corporation | Method for monitoring internet dissemination of image, video and/or audio files |
US6463406B1 (en) | 1994-03-25 | 2002-10-08 | Texas Instruments Incorporated | Fractional pitch method |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
JP3528258B2 (ja) * | 1994-08-23 | 2004-05-17 | ソニー株式会社 | 符号化音声信号の復号化方法及び装置 |
US6136548A (en) * | 1994-11-22 | 2000-10-24 | Rutgers, The State University Of New Jersey | Methods for identifying useful T-PA mutant derivatives for treatment of vascular hemorrhaging |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5729694A (en) * | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
US5864795A (en) | 1996-02-20 | 1999-01-26 | Advanced Micro Devices, Inc. | System and method for error correction in a correlation-based pitch estimator |
US5774836A (en) | 1996-04-01 | 1998-06-30 | Advanced Micro Devices, Inc. | System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator |
AU3708597A (en) | 1996-08-02 | 1998-02-25 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
US6014622A (en) * | 1996-09-26 | 2000-01-11 | Rockwell Semiconductor Systems, Inc. | Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization |
JPH10105195A (ja) * | 1996-09-27 | 1998-04-24 | Sony Corp | ピッチ検出方法、音声信号符号化方法および装置 |
JP4121578B2 (ja) | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
US6456965B1 (en) | 1997-05-20 | 2002-09-24 | Texas Instruments Incorporated | Multi-stage pitch and mixed voicing estimation for harmonic speech coders |
US6438517B1 (en) | 1998-05-19 | 2002-08-20 | Texas Instruments Incorporated | Multi-stage pitch and mixed voicing estimation for harmonic speech coders |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
DE69939086D1 (de) * | 1998-09-17 | 2008-08-28 | British Telecomm | Audiosignalverarbeitung |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
US6496797B1 (en) * | 1999-04-01 | 2002-12-17 | Lg Electronics Inc. | Apparatus and method of speech coding and decoding using multiple frames |
WO2001013360A1 (en) | 1999-08-17 | 2001-02-22 | Glenayre Electronics, Inc. | Pitch and voicing estimation for low bit rate speech coders |
US6151571A (en) * | 1999-08-31 | 2000-11-21 | Andersen Consulting | System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters |
US6418405B1 (en) | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
AU2001260162A1 (en) | 2000-04-06 | 2001-10-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Pitch estimation in a speech signal |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
AU2001294974A1 (en) * | 2000-10-02 | 2002-04-15 | The Regents Of The University Of California | Perceptual harmonic cepstral coefficients as the front-end for speech recognition |
SE522553C2 (sv) | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
GB2375028B (en) * | 2001-04-24 | 2003-05-28 | Motorola Inc | Processing speech signals |
US6917912B2 (en) * | 2001-04-24 | 2005-07-12 | Microsoft Corporation | Method and apparatus for tracking pitch in audio analysis |
WO2002101717A2 (en) * | 2001-06-11 | 2002-12-19 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
US6871176B2 (en) * | 2001-07-26 | 2005-03-22 | Freescale Semiconductor, Inc. | Phase excited linear prediction encoder |
KR100393899B1 (ko) | 2001-07-27 | 2003-08-09 | 어뮤즈텍(주) | 2-단계 피치 판단 방법 및 장치 |
JP3888097B2 (ja) | 2001-08-02 | 2007-02-28 | 松下電器産業株式会社 | ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置 |
DE02765393T1 (de) * | 2001-08-31 | 2005-01-13 | Kabushiki Kaisha Kenwood, Hachiouji | Vorrichtung und verfahren zum erzeugen eines tonhöhen-kurvenformsignals und vorrichtung und verfahren zum komprimieren, dekomprimieren und synthetisieren eines sprachsignals damit |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7233894B2 (en) | 2003-02-24 | 2007-06-19 | International Business Machines Corporation | Low-frequency band noise detection |
SG120121A1 (en) * | 2003-09-26 | 2006-03-28 | St Microelectronics Asia | Pitch detection of speech signals |
CA2566368A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
KR100724736B1 (ko) * | 2006-01-26 | 2007-06-04 | 삼성전자주식회사 | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 |
KR100770839B1 (ko) | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
CN100541609C (zh) * | 2006-09-18 | 2009-09-16 | 华为技术有限公司 | 一种实现开环基音搜索的方法和装置 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
CN101556795B (zh) * | 2008-04-09 | 2012-07-18 | 展讯通信(上海)有限公司 | 计算语音基音频率的方法及设备 |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
US9336785B2 (en) * | 2008-05-12 | 2016-05-10 | Broadcom Corporation | Compression for speech intelligibility enhancement |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
CN101354889B (zh) * | 2008-09-18 | 2012-01-11 | 北京中星微电子有限公司 | 一种语音变调方法及装置 |
CN101599272B (zh) | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
EP2211335A1 (en) * | 2009-01-21 | 2010-07-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
CN102016530B (zh) * | 2009-02-13 | 2012-11-14 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
CN101814291B (zh) * | 2009-02-20 | 2013-02-13 | 北京中星微电子有限公司 | 在时域提高语音信号信噪比的方法和装置 |
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
US8620672B2 (en) | 2009-06-09 | 2013-12-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal |
WO2011013244A1 (ja) * | 2009-07-31 | 2011-02-03 | 株式会社東芝 | 音声処理装置 |
WO2012131438A1 (en) * | 2011-03-31 | 2012-10-04 | Nokia Corporation | A low band bandwidth extender |
CN102231274B (zh) * | 2011-05-09 | 2013-04-17 | 华为技术有限公司 | 基音周期估计值修正方法、基音估计方法和相关装置 |
CN102842305B (zh) * | 2011-06-22 | 2014-06-25 | 华为技术有限公司 | 一种基音检测的方法和装置 |
EP3301677B1 (en) * | 2011-12-21 | 2019-08-28 | Huawei Technologies Co., Ltd. | Very short pitch detection and coding |
CN103426441B (zh) * | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
CN105976830B (zh) * | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
-
2012
- 2012-05-18 CN CN201210155298.4A patent/CN103426441B/zh active Active
- 2012-12-26 KR KR1020147034975A patent/KR101649243B1/ko active IP Right Grant
- 2012-12-26 ES ES12876916.3T patent/ES2627857T3/es active Active
- 2012-12-26 KR KR1020167021709A patent/KR101762723B1/ko active IP Right Grant
- 2012-12-26 EP EP12876916.3A patent/EP2843659B1/en active Active
- 2012-12-26 WO PCT/CN2012/087512 patent/WO2013170610A1/zh active Application Filing
- 2012-12-26 JP JP2015511902A patent/JP6023311B2/ja active Active
- 2012-12-26 EP EP17150741.1A patent/EP3246920B1/en active Active
- 2012-12-26 ES ES17150741T patent/ES2847150T3/es active Active
- 2012-12-26 PL PL12876916T patent/PL2843659T3/pl unknown
- 2012-12-26 HU HUE12876916A patent/HUE034664T2/hu unknown
- 2012-12-26 DK DK12876916.3T patent/DK2843659T3/en active
-
2014
- 2014-11-17 US US14/543,320 patent/US9633666B2/en active Active
-
2016
- 2016-10-06 JP JP2016197932A patent/JP6272433B2/ja active Active
-
2017
- 2017-03-23 US US15/467,356 patent/US10249315B2/en active Active
-
2019
- 2019-02-15 US US16/277,739 patent/US10984813B2/en active Active
-
2021
- 2021-04-16 US US17/232,807 patent/US11741980B2/en active Active
-
2023
- 2023-08-28 US US18/457,121 patent/US20230402048A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
HUE034664T2 (hu) | 2018-02-28 |
US20210335377A1 (en) | 2021-10-28 |
US11741980B2 (en) | 2023-08-29 |
JP6272433B2 (ja) | 2018-01-31 |
JP2017027076A (ja) | 2017-02-02 |
DK2843659T3 (en) | 2017-07-03 |
WO2013170610A1 (zh) | 2013-11-21 |
EP2843659B1 (en) | 2017-04-05 |
CN103426441B (zh) | 2016-03-02 |
EP3246920B1 (en) | 2020-10-28 |
US20150073781A1 (en) | 2015-03-12 |
EP2843659A4 (en) | 2015-07-15 |
US20230402048A1 (en) | 2023-12-14 |
US10249315B2 (en) | 2019-04-02 |
CN103426441A (zh) | 2013-12-04 |
ES2847150T3 (es) | 2021-08-02 |
US20170194016A1 (en) | 2017-07-06 |
ES2627857T3 (es) | 2017-07-31 |
EP2843659A1 (en) | 2015-03-04 |
JP2015516597A (ja) | 2015-06-11 |
KR101762723B1 (ko) | 2017-07-28 |
US9633666B2 (en) | 2017-04-25 |
PL2843659T3 (pl) | 2017-10-31 |
EP3246920A1 (en) | 2017-11-22 |
US20190180766A1 (en) | 2019-06-13 |
KR20150014492A (ko) | 2015-02-06 |
KR20160099729A (ko) | 2016-08-22 |
KR101649243B1 (ko) | 2016-08-18 |
US10984813B2 (en) | 2021-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6272433B2 (ja) | ピッチ周期の正確性を検出するための方法および装置 | |
CN106486131B (zh) | 一种语音去噪的方法及装置 | |
EP2828856B1 (en) | Audio classification using harmonicity estimation | |
KR100744352B1 (ko) | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 | |
US20150081287A1 (en) | Adaptive noise reduction for high noise environments | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
US9058821B2 (en) | Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels | |
CN108682432B (zh) | 语音情感识别装置 | |
CN110890087A (zh) | 一种基于余弦相似度的语音识别方法和装置 | |
US8086449B2 (en) | Vocal fry detecting apparatus | |
de Fréin | Power-weighted LPC formant estimation | |
CN111108551B (zh) | 一种声纹鉴定方法和相关装置 | |
CN112201279B (zh) | 一种基音检测方法及装置 | |
CN117935789A (zh) | 语音识别方法及系统、设备、存储介质 | |
CN116884438B (zh) | 基于声学特征的练琴音准检测方法及系统 | |
US20150162014A1 (en) | Systems and methods for enhancing an audio signal | |
KR101671305B1 (ko) | 입력 신호의 특징 파라미터 추출 장치 및 그를 이용한 화자 인식 장치 | |
CN112397087A (zh) | 共振峰包络估计、语音处理方法及装置、存储介质、终端 | |
CN114360580B (zh) | 基于多特征决策融合的音频copy-move篡改检测与定位方法和系统 | |
JP2006113298A (ja) | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 | |
CN118314919A (zh) | 语音修复方法、装置、音频设备及存储介质 | |
Hsieh et al. | A study on the application of an average energy entropy method for the endpoint extraction of frog croak syllables | |
Shahnaz et al. | A cepstral-domain algorithm for pitch estimation from noise-corrupted speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141127 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6023311 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |