JP2016527570A - 音声処理のための無声/有声判定 - Google Patents
音声処理のための無声/有声判定 Download PDFInfo
- Publication number
- JP2016527570A JP2016527570A JP2016533810A JP2016533810A JP2016527570A JP 2016527570 A JP2016527570 A JP 2016527570A JP 2016533810 A JP2016533810 A JP 2016533810A JP 2016533810 A JP2016533810 A JP 2016533810A JP 2016527570 A JP2016527570 A JP 2016527570A
- Authority
- JP
- Japan
- Prior art keywords
- unvoiced
- voiced
- parameter
- speech
- pronunciation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 42
- 230000005236 sound signal Effects 0.000 claims description 83
- 230000003595 spectral effect Effects 0.000 claims description 27
- 230000005284 excitation Effects 0.000 description 62
- 239000013598 vector Substances 0.000 description 27
- 238000000695 excitation spectrum Methods 0.000 description 26
- 230000003044 adaptive effect Effects 0.000 description 24
- 238000001228 spectrum Methods 0.000 description 19
- 230000007774 longterm Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 16
- 230000000875 corresponding effect Effects 0.000 description 14
- 230000000737 periodic effect Effects 0.000 description 13
- 230000015654 memory Effects 0.000 description 9
- 230000001413 cellular effect Effects 0.000 description 8
- 238000012805 post-processing Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Time-Division Multiplex Systems (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Description
Pc_unvoicing = (1-Pvoicing)・(1-Ptilt)・・・ (5)
式(11)の終わりの点は他のパラメータが追加され得ることを示す。Pc_unvoicingの「絶対」値が大きくなるとき、それは無声音声信号になるようである。結合された有声発音パラメータは下記の式(6)のように記載することが可能である。
Pc_voicing = Pvoicing・Ptilt・・・ (6)
式(6)の終わりの点は他のパラメータが追加され得ることを同様に示す。Pc_voicingの「絶対」値が大きくなるとき、それは有声音声信号になるようである。Pc_unvoicingまたはPc_voicingの「相対」値が定義される前に、Pc_unvoicingまたはPc_voicingの強く平滑化されたパラメータがまず定義される。例えば、現在のフレームのパラメータは、式(7)において下記の不等式によって記載されるように前のフレームから平滑化され得る。
Pc_unvoicing_diff = Pc_unvoicing - Pc_unvoicing_sm (9)
Pc_unvoicing_diffはPc_unvoicingの「相対」値であり、同様に、
Pc_voicing_diff = Pc_voicing - Pc_voicing_sm (10)
Pc_voicing_diffはPc_voicingの「相対」値である。
if (Pc_unvoicing_diff > 0.1) {
Unvoiced_flag = TRUE;
}
else if (Pc_unvoicing_diff < 0.05) {
Unvoiced_flag = FALSE;
}
else {
Unvoiced_flagは変化しない(以前のUnvoiced_flagが維持される)
}
if (Pc_voicing_diff > 0.1) {
Voiced_flag = TRUE;
}
else if (Pc_voicing_diff < 0.05) {
Voiced_flag = FALSE;
}
else {
Voiced_flagは変化しない(以前のVoiced_flagが維持される)
}
B(z) = 1 - Gp・z-Pitch (13)
e(n) = Gp・ep(n) + Gc・ec(n) (16)
ここで、ep(n)は、フィードバック・ループ(図5)を通して過去の励振304を含む適応型コードブック307から来る、nによってインデックス付けされるサンプルの連続の1つのサブフレームである。低周波数領域はしばしば高周波数領域より周期的またはより高調波的であるので、ep(n)は適応的に低域通過フィルタリングされ得る。ec(n)は、現在の励振の寄与である符号励振コードブック308(固定型コードブックとも呼ばれる)からのものである。さらに、ec(n)は、例えば、高域通過フィルタリングの向上、ピッチの向上、分散の向上、フォルマントの向上、および他を使用することによって、向上させることも可能である。
10 通信システム
12 マイクロホン
14 ラウドスピーカ
16 マイクロホンインタフェース
18 スピーカインタフェース
20 CODEC
22 エンコーダ
24 デコーダ
26 ネットワークインタフェース
28 アナログオーディオ入力信号
30 オーディオ信号
33、34 デジタルオーディオ信号
36 ネットワーク
38、40 通信リンク
81 利得デコーダ
82 長期予測デコーダ
83 短期予測デコーダ
84 ピッチデコーダ
85 適応型コードブック利得デコーダ
101 元の信号
102 合成された音声
103 短期線形予測フィルタ
105 長期予測フィルタ
108 符号励振
109 重み付けされた誤差
110 重み付けフィルタ
201 符号励振
203 長期予測
205 短期予測
206 合成された音声
207 後処理ブロック
303 短期線形予測フィルタ
304 過去の合成された励振
305 利得Gp
306 利得Gc
307 適応型コードブック
308 固定型符号励振
401 適応型コードブック
402 符号励振
406 短期予測
407 合成された音声
408 後処理ブロック
701、801、901 低帯域励振スペクトル
702、802、902 励振スペクトル
703、803、903 高帯域スペクトル
704、804、904 LPCスペクトル包絡線
1001 低帯域信号
1002 低帯域パラメータ
1003 ビットストリームチャネル
1004 オーディオ信号
1005 高帯域側パラメータ
1006 ビットストリームチャネル
1007 低帯域ビットストリーム
1008 低帯域信号
1009 最終的なオーディオ信号
1010 高帯域ビットストリーム
1011 高帯域側パラメータ
1012 高帯域信号
1101、1201 時間ドメインエネルギー包絡線
1102、1202 第1の背景ノイズ領域
1103、1203 無声音声領域
1104、1204 有声音声領域
1105、1205 第2の背景ノイズ領域
Pc_unvoicing = (1-Pvoicing)・(1-Ptilt)・・・ (5)
式(5)の終わりの点は他のパラメータが追加され得ることを示す。Pc_unvoicingの「絶対」値が大きくなるとき、それは無声音声信号になるようである。結合された有声発音パラメータは下記の式(6)のように記載することが可能である。
Pc_voicing = Pvoicing・Ptilt・・・ (6)
式(6)の終わりの点は他のパラメータが追加され得ることを同様に示す。Pc_voicingの「絶対」値が大きくなるとき、それは有声音声信号になるようである。Pc_unvoicingまたはPc_voicingの「相対」値が定義される前に、Pc_unvoicingまたはPc_voicingの強く平滑化されたパラメータがまず定義される。例えば、現在のフレームのパラメータは、式(7)において下記の不等式によって記載されるように前のフレームから平滑化され得る。
Claims (21)
- 音声処理のための方法であって、
複数のフレームを含む音声信号の現在のフレームにおいて無声/有声発音音声の特性を反映する無声発音/有声発音パラメータを決定するステップと、
前記音声信号の現在のフレームより前のフレームにおける無声発音/有声発音パラメータの情報を含むように、平滑化された無声発音/有声発音パラメータを決定するステップと、
前記無声発音/有声発音パラメータと前記平滑化された無声発音/有声発音パラメータの間の差を計算するステップと、
判定パラメータとして、前記計算された差を使用して、前記現在のフレームが無声音声を含むか、または有声音声を含むかを決定するための無声/有声判定点を作成するステップと、
を含む方法。 - 前記無声発音/有声発音パラメータは無声/有声音声の少なくとも2つの特性を反映する結合されたパラメータである、請求項1に記載の方法。
- 前記結合されたパラメータは周期性パラメータとスペクトル傾斜パラメータの積である、請求項2に記載の方法。
- 前記無声発音/有声発音パラメータは無声音声の特性を反映する無声発音パラメータ(Punvoicing)であり、前記平滑化された無声発音/有声発音パラメータは平滑化された無声発音パラメータ(Punvoicing_sm)である、請求項1に記載の方法。
- 前記無声発音パラメータと前記平滑化された無声発音パラメータの間の差が0.1より大きいとき、前記無声/有声判定を決定することは、前記音声信号の現在のフレームが無声信号であると決定することを含み、前記無声発音パラメータと前記平滑化された無声発音パラメータの間の差が0.05より小さいとき、前記音声信号の現在のフレームが無声音声でないと決定する、請求項4に記載の方法。
- 前記無声発音パラメータと前記平滑化された無声発音パラメータの間の差が0.05と0.1の間であるとき、前記無声/有声判定を決定することは、前記音声信号の現在のフレームが前のフレームと同じ音声の種類を有すると決定することを含む、請求項5に記載の方法。
- 前記無声発音/有声発音パラメータは有声音声の特性を反映する有声発音パラメータ(Pvoicing)であり、前記平滑化された無声発音/有声発音パラメータは平滑化された有声発音パラメータ(Pvoicing_sm)である、請求項1に記載の方法。
- 前記有声発音パラメータと前記平滑化された有声発音パラメータの間の差が0.1より大きいとき、前記無声/有声判定を決定することは、前記音声信号の現在のフレームが有声信号であると決定することを含み、前記有声発音パラメータと前記平滑化された有声発音パラメータの間の差が0.05より小さいとき、前記音声信号の現在のフレームが有声音声でないと決定する、請求項8に記載の方法。
- 現在のフレームにおいて無声/有声発音音声の特性を反映する無声発音/有声発音パラメータを決定するステップは、第1の周波数帯域内での時間ドメインにおける前記音声信号の第1のエネルギー包絡線および異なる第2の周波数帯域内での時間ドメインにおける前記音声信号の第2のエネルギー包絡線を決定するステップを含む、請求項1から10のいずれかに記載の方法。
- 前記第2の周波数帯域は前記第1の周波数帯域より高い周波数帯域である、請求項11に記載の方法。
- 音声処理装置であって、
プロセッサと、
前記プロセッサによる実行のためのプログラミングを記憶するコンピュータ読み取り可能な記憶媒体と、を含み、前記プログラミングは、
複数のフレームを含む音声信号の現在のフレームにおいて無声/有声発音音声の特性を反映する無声発音/有声発音パラメータを決定し、
前記音声信号の現在のフレームより前のフレームにおける無声発音/有声発音パラメータの情報を含むように、平滑化された無声発音/有声発音パラメータを決定し、
前記無声発音/有声発音パラメータと前記平滑化された無声発音/有声発音パラメータの間の差を計算し、
判定パラメータとして、前記計算された差を使用して、前記現在のフレームが無声音声を含むか、または有声音声を含むかを決定するための無声/有声判定点を作成する
ための命令を含む、装置。 - 前記無声発音/有声発音パラメータは周期性パラメータとスペクトル傾斜パラメータの積を反映する結合されたパラメータである、請求項13に記載の装置。
- 前記無声発音/有声発音パラメータと前記平滑化された無声発音/有声発音パラメータの間の差が0.1より大きいとき、前記無声/有声判定を決定することは、前記音声信号の現在のフレームが無声/有声信号であると決定することを含み、前記無声発音/有声発音パラメータと前記平滑化された無声発音/有声発音パラメータの間の差が0.05より小さいとき、前記音声信号の現在のフレームが無声/有声音声でないと決定する、請求項13に記載の装置。
- 前記無声発音/有声発音パラメータは無声音声の特性を反映する無声発音パラメータであり、前記平滑化された無声発音/有声発音パラメータは平滑化された無声発音パラメータである、請求項13に記載の装置。
- 前記無声発音/有声発音パラメータは有声音声の特性を反映する有声発音パラメータであり、前記平滑化された無声発音/有声発音パラメータは平滑化された有声発音パラメータである、請求項13に記載の装置。
- 現在のフレームにおいて無声/有声発音音声の特性を反映する無声発音/有声発音パラメータを決定することは、第1の周波数帯域内での時間ドメインにおける前記音声信号の第1のエネルギー包絡線および異なる第2の周波数帯域内での時間ドメインにおける前記音声信号の第2のエネルギー包絡線を決定することを含む、請求項13から17のいずれか一項に記載の装置。
- 前記第2の周波数帯域は前記第1の周波数帯域より高い周波数帯域である、請求項18に記載の装置。
- 音声処理のための方法であって、
音声信号の現在のフレームについて、時間ドメインにおける前記音声信号の第1のエネルギー包絡線からの第1の周波数帯域についての第1のパラメータ、および前記時間ドメインにおける前記音声信号の第2のエネルギー包絡線からの第2の周波数帯域についての第2のパラメータを決定するステップと、
前記音声信号の現在のフレームより前のフレームから、平滑化された第1のパラメータおよび平滑化された第2のパラメータを決定するステップと、
前記第1のパラメータを前記平滑化された第1のパラメータと、前記第2のパラメータを前記平滑化された第2のパラメータと比較するステップと、
判定パラメータとして、前記比較を使用して、前記現在のフレームが無声音声を含むか、または有声音声を含むかを決定するために無声/有声判定点を作成するステップと、
を含む方法。 - 前記第2の周波数帯域は前記第1の周波数帯域より高い周波数帯域である、請求項20に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361875198P | 2013-09-09 | 2013-09-09 | |
US61/875,198 | 2013-09-09 | ||
US14/476,547 | 2014-09-03 | ||
US14/476,547 US9570093B2 (en) | 2013-09-09 | 2014-09-03 | Unvoiced/voiced decision for speech processing |
PCT/CN2014/086058 WO2015032351A1 (en) | 2013-09-09 | 2014-09-05 | Unvoiced/voiced decision for speech processing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018020794A Division JP6470857B2 (ja) | 2013-09-09 | 2018-02-08 | 音声処理のための無声/有声判定 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016527570A true JP2016527570A (ja) | 2016-09-08 |
JP6291053B2 JP6291053B2 (ja) | 2018-03-14 |
Family
ID=52626401
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016533810A Active JP6291053B2 (ja) | 2013-09-09 | 2014-09-05 | 音声処理のための無声/有声判定 |
JP2018020794A Active JP6470857B2 (ja) | 2013-09-09 | 2018-02-08 | 音声処理のための無声/有声判定 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018020794A Active JP6470857B2 (ja) | 2013-09-09 | 2018-02-08 | 音声処理のための無声/有声判定 |
Country Status (16)
Country | Link |
---|---|
US (4) | US9570093B2 (ja) |
EP (2) | EP3005364B1 (ja) |
JP (2) | JP6291053B2 (ja) |
KR (3) | KR102007972B1 (ja) |
CN (2) | CN105359211B (ja) |
AU (1) | AU2014317525B2 (ja) |
BR (1) | BR112016004544B1 (ja) |
CA (1) | CA2918345C (ja) |
ES (2) | ES2908183T3 (ja) |
HK (1) | HK1216450A1 (ja) |
MX (1) | MX352154B (ja) |
MY (1) | MY185546A (ja) |
RU (1) | RU2636685C2 (ja) |
SG (2) | SG10201701527SA (ja) |
WO (1) | WO2015032351A1 (ja) |
ZA (1) | ZA201600234B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
US9972334B2 (en) | 2015-09-10 | 2018-05-15 | Qualcomm Incorporated | Decoder audio classification |
WO2017196422A1 (en) * | 2016-05-12 | 2017-11-16 | Nuance Communications, Inc. | Voice activity detection feature based on modulation-phase differences |
US10249305B2 (en) * | 2016-05-19 | 2019-04-02 | Microsoft Technology Licensing, Llc | Permutation invariant training for talker-independent multi-talker speech separation |
RU2668407C1 (ru) * | 2017-11-07 | 2018-09-28 | Акционерное общество "Концерн "Созвездие" | Способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи |
CN108447506A (zh) * | 2018-03-06 | 2018-08-24 | 深圳市沃特沃德股份有限公司 | 语音处理方法和语音处理装置 |
US10957337B2 (en) | 2018-04-11 | 2021-03-23 | Microsoft Technology Licensing, Llc | Multi-microphone speech separation |
CN109119094B (zh) * | 2018-07-25 | 2023-04-28 | 苏州大学 | 一种利用声带建模反演的嗓音分类方法 |
WO2021156375A1 (en) * | 2020-02-04 | 2021-08-12 | Gn Hearing A/S | A method of detecting speech and speech detector for low signal-to-noise ratios |
CN112885380A (zh) * | 2021-01-26 | 2021-06-01 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种清浊音检测方法、装置、设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07212296A (ja) * | 1994-01-17 | 1995-08-11 | Japan Radio Co Ltd | Vox制御通信装置 |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5216747A (en) * | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JPH06110489A (ja) * | 1992-09-24 | 1994-04-22 | Nitsuko Corp | 音声信号処理装置及びその方法 |
JP3655652B2 (ja) * | 1993-09-02 | 2005-06-02 | シーメンス アクチエンゲゼルシヤフト | 自動的通話方向切換のための方法および回路装置 |
US5991725A (en) * | 1995-03-07 | 1999-11-23 | Advanced Micro Devices, Inc. | System and method for enhanced speech quality in voice storage and retrieval systems |
KR20000022285A (ko) | 1996-07-03 | 2000-04-25 | 내쉬 로저 윌리엄 | 음성 액티비티 검출기 및 검출 방법 |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6556967B1 (en) * | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
US6415029B1 (en) * | 1999-05-24 | 2002-07-02 | Motorola, Inc. | Echo canceler and double-talk detector for use in a communications unit |
JP3454214B2 (ja) * | 1999-12-22 | 2003-10-06 | 三菱電機株式会社 | パルス雑音除去装置およびこれを含む中波am音声放送受信機 |
JP3689616B2 (ja) * | 2000-04-27 | 2005-08-31 | シャープ株式会社 | 音声認識装置及び音声認識方法、音声認識システム、並びに、プログラム記録媒体 |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US7606703B2 (en) * | 2000-11-15 | 2009-10-20 | Texas Instruments Incorporated | Layered celp system and method with varying perceptual filter or short-term postfilter strengths |
US7171357B2 (en) * | 2001-03-21 | 2007-01-30 | Avaya Technology Corp. | Voice-activity detection using energy ratios and periodicity |
RU2331933C2 (ru) * | 2002-10-11 | 2008-08-20 | Нокиа Корпорейшн | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7519530B2 (en) * | 2003-01-09 | 2009-04-14 | Nokia Corporation | Audio signal processing |
US7698141B2 (en) * | 2003-02-28 | 2010-04-13 | Palo Alto Research Center Incorporated | Methods, apparatus, and products for automatically managing conversational floors in computer-mediated communications |
US7469209B2 (en) * | 2003-08-14 | 2008-12-23 | Dilithium Networks Pty Ltd. | Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications |
KR101008022B1 (ko) * | 2004-02-10 | 2011-01-14 | 삼성전자주식회사 | 유성음 및 무성음 검출방법 및 장치 |
KR100744352B1 (ko) | 2005-08-01 | 2007-07-30 | 삼성전자주식회사 | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 |
JP2007149193A (ja) * | 2005-11-25 | 2007-06-14 | Toshiba Corp | ディフェクト信号生成回路 |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP2007292940A (ja) * | 2006-04-24 | 2007-11-08 | Toyota Motor Corp | 音声識別装置及び音声識別方法 |
US8010352B2 (en) * | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
MY144271A (en) * | 2006-10-20 | 2011-08-29 | Dolby Lab Licensing Corp | Audio dynamics processing using a reset |
US7817286B2 (en) * | 2006-12-22 | 2010-10-19 | Hitachi Global Storage Technologies Netherlands B.V. | Iteration method to improve the fly height measurement accuracy by optical interference method and theoretical pitch and roll effect |
US7873114B2 (en) * | 2007-03-29 | 2011-01-18 | Motorola Mobility, Inc. | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate |
JP5618826B2 (ja) * | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
EP2162880B1 (en) | 2007-06-22 | 2014-12-24 | VoiceAge Corporation | Method and device for estimating the tonality of a sound signal |
CN101221757B (zh) | 2008-01-24 | 2012-02-29 | 中兴通讯股份有限公司 | 高频杂音处理方法及分析方法 |
CN101261836B (zh) * | 2008-04-25 | 2011-03-30 | 清华大学 | 基于过渡帧判决及处理的激励信号自然度提高方法 |
US8321214B2 (en) * | 2008-06-02 | 2012-11-27 | Qualcomm Incorporated | Systems, methods, and apparatus for multichannel signal amplitude balancing |
US20110123121A1 (en) * | 2009-10-13 | 2011-05-26 | Sony Corporation | Method and system for reducing blocking artefacts in compressed images and video signals |
EP2561508A1 (en) * | 2010-04-22 | 2013-02-27 | Qualcomm Incorporated | Voice activity detection |
TWI403304B (zh) * | 2010-08-27 | 2013-08-01 | Ind Tech Res Inst | 隨身語能偵知方法及其裝置 |
CN102655480B (zh) | 2011-03-03 | 2015-12-02 | 腾讯科技(深圳)有限公司 | 相似邮件处理系统和方法 |
KR101352608B1 (ko) * | 2011-12-07 | 2014-01-17 | 광주과학기술원 | 음성 신호의 대역폭 확장 방법 및 그 장치 |
US8909539B2 (en) | 2011-12-07 | 2014-12-09 | Gwangju Institute Of Science And Technology | Method and device for extending bandwidth of speech signal |
US20130151125A1 (en) * | 2011-12-08 | 2013-06-13 | Scott K. Mann | Apparatus and Method for Controlling Emissions in an Internal Combustion Engine |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
CN102664003B (zh) * | 2012-04-24 | 2013-12-04 | 南京邮电大学 | 基于谐波加噪声模型的残差激励信号合成及语音转换方法 |
US8924209B2 (en) * | 2012-09-12 | 2014-12-30 | Zanavox | Identifying spoken commands by templates of ordered voiced and unvoiced sound intervals |
US9984706B2 (en) * | 2013-08-01 | 2018-05-29 | Verint Systems Ltd. | Voice activity detection using a soft decision mechanism |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
-
2014
- 2014-09-03 US US14/476,547 patent/US9570093B2/en active Active
- 2014-09-05 EP EP14842028.4A patent/EP3005364B1/en active Active
- 2014-09-05 EP EP18156608.4A patent/EP3352169B1/en active Active
- 2014-09-05 SG SG10201701527SA patent/SG10201701527SA/en unknown
- 2014-09-05 CN CN201480038204.2A patent/CN105359211B/zh active Active
- 2014-09-05 CA CA2918345A patent/CA2918345C/en active Active
- 2014-09-05 SG SG11201600074VA patent/SG11201600074VA/en unknown
- 2014-09-05 MY MYPI2016700076A patent/MY185546A/en unknown
- 2014-09-05 KR KR1020187024060A patent/KR102007972B1/ko active IP Right Grant
- 2014-09-05 MX MX2016002561A patent/MX352154B/es active IP Right Grant
- 2014-09-05 BR BR112016004544-0A patent/BR112016004544B1/pt active IP Right Grant
- 2014-09-05 CN CN201910358523.6A patent/CN110097896B/zh active Active
- 2014-09-05 JP JP2016533810A patent/JP6291053B2/ja active Active
- 2014-09-05 KR KR1020167002696A patent/KR101774541B1/ko active IP Right Grant
- 2014-09-05 AU AU2014317525A patent/AU2014317525B2/en active Active
- 2014-09-05 ES ES18156608T patent/ES2908183T3/es active Active
- 2014-09-05 RU RU2016106637A patent/RU2636685C2/ru active
- 2014-09-05 WO PCT/CN2014/086058 patent/WO2015032351A1/en active Application Filing
- 2014-09-05 ES ES14842028.4T patent/ES2687249T3/es active Active
- 2014-09-05 KR KR1020177024222A patent/KR101892662B1/ko active IP Right Grant
-
2016
- 2016-01-12 ZA ZA2016/00234A patent/ZA201600234B/en unknown
- 2016-04-18 HK HK16104383.9A patent/HK1216450A1/zh unknown
- 2016-12-27 US US15/391,247 patent/US10043539B2/en active Active
-
2018
- 2018-02-08 JP JP2018020794A patent/JP6470857B2/ja active Active
- 2018-07-19 US US16/040,225 patent/US10347275B2/en active Active
-
2019
- 2019-07-09 US US16/506,357 patent/US11328739B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07212296A (ja) * | 1994-01-17 | 1995-08-11 | Japan Radio Co Ltd | Vox制御通信装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10249313B2 (en) | Adaptive bandwidth extension and apparatus for the same | |
JP6470857B2 (ja) | 音声処理のための無声/有声判定 | |
KR102039399B1 (ko) | 시간 도메인 코딩과 주파수 도메인 코딩 간의 분류 향상 | |
US9418671B2 (en) | Adaptive high-pass post-filter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6291053 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |