JP5425682B2 - ロバストな音声分類のための方法および装置 - Google Patents
ロバストな音声分類のための方法および装置 Download PDFInfo
- Publication number
- JP5425682B2 JP5425682B2 JP2010072646A JP2010072646A JP5425682B2 JP 5425682 B2 JP5425682 B2 JP 5425682B2 JP 2010072646 A JP2010072646 A JP 2010072646A JP 2010072646 A JP2010072646 A JP 2010072646A JP 5425682 B2 JP5425682 B2 JP 5425682B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- parameter
- classification
- nacf
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 230000001052 transient effect Effects 0.000 claims description 85
- 238000011144 upstream manufacturing Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 18
- 230000007704 transition Effects 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Exchange Systems With Centralized Control (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Machine Translation (AREA)
Description
[その他の実施例1]
音声分類方法であって、
外部の構成要素から音声分類器へ分類パラメータを入力することと、
音声分類器において、入力パラメータの少なくとも1つから、内部分類パラメータを生成することと、
正規化された自己相関係数の関数の閾値を設定して、信号環境にしたがってパラメータ解析器を選択することと、
入力パラメータおよび内部パラメータを解析して、音声モードの分類を生成することとが含まれる音声分類方法。
[その他の実施例2]
入力パラメータには、ノイズを抑圧された音声信号が含まれるその他の実施例1記載の方法。
[その他の実施例3]
入力パラメータには、ノイズを抑圧された音声信号のための信号対雑音比の情報が含まれるその他の実施例1記載の方法。
[その他の実施例4]
入力パラメータには、音声活動情報が含まれるその他の実施例1記載の方法。
[その他の実施例5]
入力パラメータには、線形予測反射係数が含まれるその他の実施例1記載の方法。
[その他の実施例6]
入力パラメータには、正規化された自己相関係数の関数の情報が含まれるその他の実施例1記載の方法。
[その他の実施例7]
入力パラメータには、ピッチ情報における正規化された自己相関係数の関数が含まれるその他の実施例1記載の方法。
[その他の実施例8]
ピッチ情報における正規化された自己相関係数の関数は、値の配列であるその他の実施例7記載の方法。
[その他の実施例9]
内部パラメータには、ゼロ交差レートのパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例10]
内部パラメータには、現在のフレームのエネルギーのパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例11]
内部パラメータには、予見フレームのエネルギーのパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例12]
内部パラメータには、帯域エネルギー比のパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例13]
内部パラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例14]
内部パラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例15]
内部パラメータには、現在のフレームのエネルギー対前の3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例16]
内部パラメータには、現在のフレームのエネルギー対3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例17]
内部パラメータには、最大のサブフレームのエネルギーの指標のパラメータが含まれるその他の実施例1記載の方法。
[その他の実施例18]
正規化された自己相関係数の関数の閾値を設定することには、信号対雑音比の情報のパラメータと、所定の信号対雑音比の値とを比較することが含まれるその他の実施例1記載の方法。
[その他の実施例19]
解析することには、パラメータを状態機械に適用することが含まれるその他の実施例1記載の方法。
[その他の実施例20]
状態機械には、各音声分類モードの状態が含まれるその他の実施例19記載の方法。
[その他の実施例21]
音声モード分類には、過渡部モードが含まれるその他の実施例1記載の方法。
[その他の実施例22]
音声モード分類には、上り過渡部モードが含まれるその他の実施例1記載の方法。
[その他の実施例23]
音声モード分類には、下り過渡部モードが含まれるその他の実施例1記載の方法。
[その他の実施例24]
音声モード分類には、有声音モードが含まれるその他の実施例1記載の方法。
[その他の実施例25]
音声モード分類には、無声音モードが含まれるその他の実施例1記載の方法。
[その他の実施例26]
音声モード分類には、無音モードが含まれるその他の実施例1記載の方法。
[その他の実施例27]
少なくとも1つのパラメータを更新することがさらに含まれるその他の実施例1記載の方法。
[その他の実施例28]
更新パラメータには、ピッチパラメータにおける正規化された自己相関係数の関数が含まれるその他の実施例27記載の方法。
[その他の実施例29]
更新パラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例27記載の方法。
[その他の実施例30]
更新パラメータには、予見フレームのエネルギーのパラメータが含まれるその他の実施例27記載の方法。
[その他の実施例31]
更新パラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例27記載の方法。
[その他の実施例32]
更新パラメータには、音声活動検出のパラメータが含まれるその他の実施例27記載の方法。
[その他の実施例33]
音声分類器であって、
分類パラメータを生成するための生成器と、
正規化された自己相関係数の関数の閾値を設定し、かつ信号環境にしたがってパラメータ解析器を選択するための正規化された自己相関係数の関数の閾値の生成器と、
少なくとも1つの外部入力パラメータと内部パラメータとを解析して、音声モードを分類するためのパラメータ解析器とが構成されている音声分類器。
[その他の実施例34]
分類パラメータを生成するための生成器が、ノイズを抑圧された音声信号からパラメータを生成するその他の実施例33記載の音声分類器。
[その他の実施例35]
分類パラメータを生成するための生成器が、信号対雑音比の情報からパラメータを生成するその他の実施例33記載の音声分類器。
[その他の実施例36]
分類パラメータを生成するための生成器が、音声活動情報からパラメータを生成するその他の実施例33記載の音声分類器。
[その他の実施例37]
分類パラメータを生成するための生成器が、線形予測反射係数からパラメータを生成するその他の実施例33記載の音声分類器。
[その他の実施例38]
分類パラメータを生成するための生成器が、正規化された自己相関係数の関数の情報からのパラメータを生成するその他の実施例33記載の音声分類器。
[その他の実施例39]
分類パラメータを生成するための生成器が、ピッチ情報における正規化された自己相関係数の関数の情報からパラメータを生成するその他の実施例33記載の音声分類器。
[その他の実施例40]
ピッチ情報における正規化された自己相関係数の関数が、値の配列であるその他の実施例39記載の音声分類器。
[その他の実施例41]
生成されたパラメータには、ゼロ交差レートのパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例42]
生成されるパラメータには、現在のフレームのエネルギーのパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例43]
生成されるパラメータには、予見フレームのエネルギーのパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例44]
生成されるパラメータには、帯域エネルギー比のパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例45]
生成されるパラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例46]
生成されるパラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例47]
生成されるパラメータには、現在のフレームのエネルギー対前の3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例48]
生成されるパラメータには、現在のフレームのエネルギー対3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例49]
生成されるパラメータには、最大のサブフレームのエネルギー指標のパラメータが含まれるその他の実施例33記載の音声分類器。
[その他の実施例50]
正規化された自己相関係数の関数の閾値を設定することには、信号対雑音比の情報のパラメータと、所定の信号対雑音比の値とを比較することが含まれるその他の実施例33記載の音声分類器。
[その他の実施例51]
解析することには、パラメータを状態機械へ適用することが含まれるその他の実施例33記載の音声分類器。
[その他の実施例52]
状態機械には、各音声分類モードの状態が含まれるその他の実施例51記載の音声分類器。
[その他の実施例53]
音声モードの分類には、過渡部モードが含まれるその他の実施例33記載の音声分類器。
[その他の実施例54]
音声モードの分類には、上り過渡部モードが含まれるその他の実施例33記載の音声分類器。
[その他の実施例55]
音声モードの分類には、下り過渡部モードが含まれるその他の実施例33記載の音声分類器。
[その他の実施例56]
音声モードの分類には、有声音モードが含まれるその他の実施例33記載の音声分類。
[その他の実施例57]
音声モードの分類には、無声音モードが含まれるその他の実施例33記載の音声分類器。
[その他の実施例58]
音声モードの分類には、無音モードが含まれるその他の実施例33記載の音声分類器。
[その他の実施例59]
少なくとも1つのパラメータを更新することがさらに含まれるその他の実施例33記載の音声分類器。
[その他の実施例60]
更新パラメータには、ピッチパラメータにおける正規化された自己相関係数の関数が含まれるその他の実施例59記載の音声分類器。
[その他の実施例61]
更新パラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例59記載の音声分類器。
[その他の実施例62]
更新パラメータには、予見フレームのエネルギーのパラメータが含まれるその他の実施例59記載の音声分類器。
[その他の実施例63]
更新パラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれるその他の実施例59記載の音声分類器。
[その他の実施例64]
更新パラメータには、音声活動検出のパラメータが含まれるその他の実施例59記載の音声分類器。
Claims (60)
- 各音声フレームの音声モードの分類を生成するために音声フレーム周期毎に下記ステップを周期的に実行する音声分類方法:
音声分類器の前段に配置された外部の構成要素から前記音声分類器へ現在の音声フレーム周期に関する分類パラメータを入力すること、ここで、前記分類パラメータは前記音声フレームを構成する入力された音声サンプル系列について計算された正規化された自己相関係数の関数(NACF)のピッチ周期における値および信号対雑音比(SNR)情報を含み、前記NACFの前記ピッチ周期における値は前記音声サンプル系列の周期性の測度である;
前記音声分類器において、前記分類パラメータの少なくとも1つから、前記現在の音声フレーム周期に関する内部パラメータを生成すること;
前記NACFの閾値を設定して、信号環境にしたがってパラメータ解析器を選択すること、ここで、前記閾値を設定することは前記信号対雑音比(SNR)情報の値がノイズの有る音声環境に対応するか、またはノイズの無い音声環境に対応するかに応じて前記閾値に対して異なる値を設定することを含む;および、
前記分類パラメータおよび前記内部パラメータを解析して、有声音、過渡音、および無声音を含む音声モードの分類を生成すること、ここにおいて、前記解析することは、前記ピッチ周期におけるNACFの値をNACFの前記閾値と比較することにより複数の内部状態の中から前記音声サンプル系列の周期性に最も適合した1つの内部状態を選択し、前記選択された1つの内部状態に前記分類パラメータおよび内部パラメータを適用することを含む、
ここで、前記パラメータ解析器を選択することは、前記NACFの前記ピッチ周期における値を前記閾値と比較し、前記音声サンプル系列の前記周期性に最も適合した前記パラメータ解析器を選択することを含み、前記パラメータ解析器は、各々が分類される各音声モードに対応する複数の内部状態を有し、前記分類パラメータと前記内部パラメータの値および以前の音声フレーム周期において選択された内部状態に基づいて前記現在の音声フレーム周期における前記音声モードの分類を生成する状態機械である、ここにおいて、前記内部状態は、音声の前の状態が有声音、無声音、無音、過渡部またはそれらの組み合わせであることを含む。 - 前記分類パラメータには、ノイズを抑圧された音声信号が含まれる請求項1記載の方法。
- 前記分類パラメータには、ノイズを抑圧された音声信号のための信号対雑音比(SNR)情報が含まれる請求項1記載の方法。
- 前記分類パラメータには、音声活動情報が含まれる請求項1記載の方法。
- 前記分類パラメータには、線形予測反射係数が含まれる請求項1記載の方法。
- 前記分類パラメータには、正規化された自己相関係数の関数の情報が含まれる請求項1記載の方法。
- 前記分類パラメータには、正規化された自己相関係数の関数(NACF)値および前記NACFの周囲のピッチ情報が含まれる請求項1記載の方法。
- 前記正規化された自己相関係数の関数(NACF)値および前記NACFの周囲のピッチ情報は、複数の値の配列である請求項7記載の方法。
- 前記内部パラメータには、ゼロ交差レートのパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、現在のフレームのエネルギーのパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、予見フレームのエネルギーのパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、帯域エネルギー比のパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、現在のフレームのエネルギー対前の3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、現在のフレームのエネルギー対3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれる請求項1記載の方法。
- 前記内部パラメータには、最大のサブフレームのエネルギーの指標のパラメータが含まれる請求項1記載の方法。
- 前記音声モードの分類には、過渡部モードが含まれる請求項1記載の方法。
- 前記音声モードの分類には、上り過渡部モードが含まれる請求項1記載の方法。
- 前記音声モードの分類には、下り過渡部モードが含まれる請求項1記載の方法。
- 前記音声モードの分類には、有声音モードが含まれる請求項1記載の方法。
- 前記音声モードの分類には、無声音モードが含まれる請求項1記載の方法。
- 前記音声モードの分類には、無音モードが含まれる請求項1記載の方法。
- 少なくとも1つのパラメータを更新することがさらに含まれる請求項1記載の方法。
- 更新されるパラメータには、正規化された自己相関係数の関数(NACF)値および前記NACFの周囲のピッチパラメータが含まれる請求項24記載の方法。
- 更新されるパラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項24記載の方法。
- 更新されるパラメータには、予見フレームのエネルギーのパラメータが含まれる請求項24記載の方法。
- 更新されるパラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項24記載の方法。
- 更新されるパラメータには、音声活動検出のパラメータが含まれる請求項24記載の方法。
- 各音声フレームの音声モードの分類を生成するために音声フレーム周期毎に音声モードの分類生成を周期的に実行する音声分類器、該音声分類器は下記を備える:
現在の音声フレーム周期に関する分類パラメータを生成するための生成器、ここで前記分類パラメータは前記音声フレームを構成する入力された音声サンプル系列について計算された正規化された自己相関係数の関数(NACF)のピッチ周期における値および信号対雑音比(SNR)情報を含み、前記NACFの前記ピッチ周期における値は前記音声サンプル系列の周期性の測度である;
前記NACFの閾値を設定し、かつ信号環境にしたがってパラメータ解析器を選択するための前記NACFの閾値の生成器、ここで、前記閾値を前記設定することは前記信号対雑音比(SNR)情報の値がノイズの有る音声環境に対応するか、またはノイズの無い音声環境に対応するかに応じて前記閾値に対して異なる値を設定することを含む;
前記分類パラメータと前記分類パラメータから生成された前記現在の音声フレーム周期に関する内部パラメータとを解析して、有声音、過渡音、および無声音を含む音声モードの分類を生成するためのパラメータ解析器、ここにおいて、前記パラメータ解析器は、前記ピッチ周期におけるNACFの値をNACFの前記閾値と比較することにより複数の内部状態の中から前記音声サンプル系列の周期性に最も適合した1つの内部状態を選択し、前記選択された1つの内部状態に前記分類パラメータおよび内部パラメータを適用するパラメータ解析器を含む、
ここで、前記パラメータ解析器は、前記NACFの前記ピッチ周期における値と前記NACFの閾値との比較に応じて前記音声サンプル系列の前記周期性に最も適合するものとして複数のパラメータ解析器の中から選択された1つのパラメータ解析器であり、
前記パラメータ解析器は、各々が分類される各音声モードに対応する複数の内部状態を有し、前記分類パラメータと前記内部パラメータの値および以前の音声フレーム周期において選択された内部状態に基づいて前記現在の音声フレーム周期における前記音声モードの分類を生成する状態機械である、ここにおいて、前記内部状態は、音声の前の状態が有声音、無声音、無音、過渡部またはそれらの組み合わせであることを含む。 - 前記分類パラメータを生成するための生成器が、ノイズを抑圧された音声信号からパラメータを生成する請求項30記載の音声分類器。
- 前記分類パラメータを生成するための生成器が、前記信号対雑音比(SNR)情報からパラメータを生成する請求項30記載の音声分類器。
- 前記分類パラメータを生成するための生成器が、音声活動情報からパラメータを生成する請求項30記載の音声分類器。
- 前記分類パラメータを生成するための生成器が、線形予測反射係数からパラメータを生成する請求項30記載の音声分類器。
- 前記分類パラメータを生成するための生成器が、正規化された自己相関係数の関数の情報からパラメータを生成する請求項30記載の音声分類器。
- 前記分類パラメータを生成するための生成器が、正規化された自己相関係数の関数(NACF)値および前記NACFの周囲のピッチ情報からパラメータを生成する請求項30記載の音声分類器。
- 前記正規化された自己相関係数の関数(NACF)値および前記NACFの周囲のピッチ情報が、複数の値の配列である請求項36記載の音声分類器。
- 生成された内部パラメータには、ゼロ交差レートのパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、現在のフレームのエネルギーのパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、予見フレームのエネルギーのパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、帯域エネルギー比のパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、現在のフレームのエネルギー対前の3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、現在のフレームのエネルギー対3つのフレームの平均の有声音のエネルギーの比のパラメータが含まれる請求項30記載の音声分類器。
- 生成される内部パラメータには、最大のサブフレームのエネルギー指標のパラメータが含まれる請求項30記載の音声分類器。
- 前記音声モードの分類には、過渡部モードが含まれる請求項30記載の音声分類器。
- 前記音声モードの分類には、上り過渡部モードが含まれる請求項30記載の音声分類器。
- 前記音声モードの分類には、下り過渡部モードが含まれる請求項30記載の音声分類器。
- 前記音声モードの分類には、有声音モードが含まれる請求項30記載の音声分類。
- 前記音声モードの分類には、無声音モードが含まれる請求項30記載の音声分類器。
- 前記音声モードの分類には、無音モードが含まれる請求項30記載の音声分類器。
- 少なくとも1つのパラメータを更新することがさらに含まれる請求項30記載の音声分類器。
- 更新されるパラメータには、ピッチパラメータにおける正規化された自己相関係数の関数が含まれる請求項53記載の音声分類器。
- 更新されるパラメータには、3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項53記載の音声分類器。
- 更新されるパラメータには、予見フレームのエネルギーのパラメータが含まれる請求項53記載の音声分類器。
- 更新されるパラメータには、前の3つのフレームの平均の有声音のエネルギーのパラメータが含まれる請求項53記載の音声分類器。
- 更新されるパラメータには、音声活動検出のパラメータが含まれる請求項53記載の音声分類器。
- 各音声フレームに関して音声モードの分類を生成するための音声分類器、該音声分類器は下記を備える:
音声分類器の前段に配置された外部の構成要素から前記音声分類器へ現在の音声フレーム周期に関する分類パラメータを入力する手段、ここで、前記分類パラメータは前記音声フレームを構成する入力された音声サンプル系列について計算された正規化された自己相関係数の関数(NACF)のピッチ周期における値および信号対雑音比(SNR)情報を含み、前記NACFの前記ピッチ周期における値は前記音声サンプル系列の周期性の測度である;
前記音声分類器において、前記分類パラメータの少なくとも1つから、前記現在の音声フレーム周期に関する内部パラメータを生成する手段;
前記NACFの閾値を設定して、信号環境にしたがってパラメータ解析器を選択する手段、ここで、前記閾値を設定することは前記信号対雑音比(SNR)情報の値がノイズの有る音声環境に対応するか、またはノイズの無い音声環境に対応するかに応じて前記閾値に対して異なる値を設定することを含む;および、
前記分類パラメータおよび前記内部パラメータを解析して、有声音、過渡音、および無声音を含む音声モードの分類を生成する手段、ここにおいて、前記解析する手段は、前記ピッチ周期におけるNACFの値をNACFの前記閾値と比較することにより複数の内部状態の中から前記音声サンプル系列の周期性に最も適合した1つの内部状態を選択し、前記選択された1つの内部状態に前記分類パラメータおよび内部パラメータを適用する手段を含む、
ここで、前記解析することは、前記NACFの前記ピッチ周期における値を前記閾値と比較し、前記音声サンプル系列の周期性に最も適合した前記パラメータ解析器を選択することを含み、
前記パラメータ解析器は、各々が分類される各音声モードに対応する複数の内部状態を有し、前記分類パラメータと前記内部パラメータの値および以前の音声フレーム周期において選択された内部状態に基づいて前記現在の音声フレーム周期における前記音声モードの分類を生成する状態機械である、ここにおいて、前記内部状態は、音声の前の状態が有声音、無声音、無音、過渡部またはそれらの組み合わせであることを含む。 - 各音声フレームに関して音声モードの分類を生成するための下記手順を実行可能な命令が記録されたコンピュータ読み出し可能記録媒体:
音声分類器の前段に配置された外部の構成要素から前記音声分類器へ現在の音声フレーム周期に関する分類パラメータを入力すること、ここで、前記分類パラメータは前記音声フレームを構成する入力された音声サンプル系列について計算された正規化された自己相関係数の関数(NACF)のピッチ周期における値および信号対雑音比(SNR)情報を含み、前記NACFの前記ピッチ周期における値は前記音声サンプル系列の周期性の測度である;
前記音声分類器において、前記分類パラメータの少なくとも1つから、前記現在の音声フレーム周期に関する内部パラメータを生成すること;
前記NACFの閾値を設定して、信号環境にしたがってパラメータ解析器を選択すること、ここで、前記閾値を設定することは前記信号対雑音比(SNR)情報の値がノイズの有る音声環境に対応するか、またはノイズの無い音声環境に対応するかに応じて前記閾値に対して異なる値を設定することを含む;および、
前記分類パラメータおよび前記内部パラメータを解析して、有声音、過渡音、および無声音を含む音声モードの分類を生成すること、ここにおいて、前記解析することは、前記ピッチ周期におけるNACFの値を正規化されたNACFの前記閾値と比較することにより複数の内部状態の中から前記音声サンプル系列の周期性に最も適合した1つの内部状態を選択し、前記選択された1つの内部状態に前記分類パラメータおよび内部パラメータを適用することを含む、
ここで、前記パラメータ解析器を選択することは、前記NACFの前記ピッチ周期における値を前記閾値と比較し、前記音声サンプル系列の周期性に最も適合した前記パラメータ解析器を選択することを含み、
前記パラメータ解析器は、各々が分類される各音声モードに対応する複数の内部状態を有し、前記分類パラメータと前記内部パラメータの値および以前の音声フレーム周期において選択された内部状態に基づいて前記現在の音声フレーム周期における前記音声モードの分類を生成する状態機械である、ここにおいて、前記内部状態は、音声の前の状態が有声音、無声音、無音、過渡部またはそれらの組み合わせであることを含む。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/733,740 | 2000-12-08 | ||
US09/733,740 US7472059B2 (en) | 2000-12-08 | 2000-12-08 | Method and apparatus for robust speech classification |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002548711A Division JP4550360B2 (ja) | 2000-12-08 | 2001-12-04 | ロバストな音声分類のための方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176145A JP2010176145A (ja) | 2010-08-12 |
JP5425682B2 true JP5425682B2 (ja) | 2014-02-26 |
Family
ID=24948935
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002548711A Expired - Lifetime JP4550360B2 (ja) | 2000-12-08 | 2001-12-04 | ロバストな音声分類のための方法および装置 |
JP2010072646A Expired - Lifetime JP5425682B2 (ja) | 2000-12-08 | 2010-03-26 | ロバストな音声分類のための方法および装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002548711A Expired - Lifetime JP4550360B2 (ja) | 2000-12-08 | 2001-12-04 | ロバストな音声分類のための方法および装置 |
Country Status (13)
Country | Link |
---|---|
US (1) | US7472059B2 (ja) |
EP (1) | EP1340223B1 (ja) |
JP (2) | JP4550360B2 (ja) |
KR (2) | KR100908219B1 (ja) |
CN (2) | CN100350453C (ja) |
AT (1) | ATE341808T1 (ja) |
AU (1) | AU2002233983A1 (ja) |
BR (2) | BRPI0116002B1 (ja) |
DE (1) | DE60123651T2 (ja) |
ES (1) | ES2276845T3 (ja) |
HK (1) | HK1067444A1 (ja) |
TW (1) | TW535141B (ja) |
WO (1) | WO2002047068A2 (ja) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
GB0003903D0 (en) * | 2000-02-18 | 2000-04-05 | Canon Kk | Improved speech recognition accuracy in a multimodal input system |
US8090577B2 (en) | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
US7472057B2 (en) * | 2003-10-17 | 2008-12-30 | Broadcom Corporation | Detector for use in voice communications systems |
KR20050045764A (ko) * | 2003-11-12 | 2005-05-17 | 삼성전자주식회사 | 무선 단말기에서의 음성 저장/재생 장치 및 방법 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
EP1861846B1 (en) * | 2005-03-24 | 2011-09-07 | Mindspeed Technologies, Inc. | Adaptive voice mode extension for a voice activity detector |
US20060262851A1 (en) | 2005-05-19 | 2006-11-23 | Celtro Ltd. | Method and system for efficient transmission of communication traffic |
KR100744352B1 (ko) * | 2005-08-01 | 2007-07-30 | 삼성전자주식회사 | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 |
US20070033042A1 (en) * | 2005-08-03 | 2007-02-08 | International Business Machines Corporation | Speech detection fusing multi-class acoustic-phonetic, and energy features |
US7962340B2 (en) * | 2005-08-22 | 2011-06-14 | Nuance Communications, Inc. | Methods and apparatus for buffering data for use in accordance with a speech recognition system |
KR100735343B1 (ko) * | 2006-04-11 | 2007-07-04 | 삼성전자주식회사 | 음성신호의 피치 정보 추출장치 및 방법 |
EP2033489B1 (en) | 2006-06-14 | 2015-10-28 | Personics Holdings, LLC. | Earguard monitoring system |
EP2044804A4 (en) | 2006-07-08 | 2013-12-18 | Personics Holdings Inc | PERSONAL HEARING AID AND METHOD |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
CA2663904C (en) * | 2006-10-10 | 2014-05-27 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
CA2672165C (en) * | 2006-12-12 | 2014-07-29 | Ralf Geiger | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
US11750965B2 (en) | 2007-03-07 | 2023-09-05 | Staton Techiya, Llc | Acoustic dampening compensation system |
WO2008126347A1 (ja) * | 2007-03-16 | 2008-10-23 | Panasonic Corporation | 音声分析装置、音声分析方法、音声分析プログラム、及びシステム集積回路 |
US8111839B2 (en) | 2007-04-09 | 2012-02-07 | Personics Holdings Inc. | Always on headwear recording system |
US11856375B2 (en) | 2007-05-04 | 2023-12-26 | Staton Techiya Llc | Method and device for in-ear echo suppression |
US11683643B2 (en) | 2007-05-04 | 2023-06-20 | Staton Techiya Llc | Method and device for in ear canal echo suppression |
US8502648B2 (en) | 2007-08-16 | 2013-08-06 | Broadcom Corporation | Remote-control device with directional audio system |
PT2186090T (pt) | 2007-08-27 | 2017-03-07 | ERICSSON TELEFON AB L M (publ) | Detetor de transitórios e método para suportar codificação de um sinal de áudio |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8600067B2 (en) | 2008-09-19 | 2013-12-03 | Personics Holdings Inc. | Acoustic sealing analysis system |
US9129291B2 (en) | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
FR2944640A1 (fr) * | 2009-04-17 | 2010-10-22 | France Telecom | Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal. |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
WO2011145249A1 (ja) | 2010-05-17 | 2011-11-24 | パナソニック株式会社 | 音声分類装置、方法、プログラム及び集積回路 |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
US8311817B2 (en) * | 2010-11-04 | 2012-11-13 | Audience, Inc. | Systems and methods for enhancing voice quality in mobile device |
JP2012203351A (ja) * | 2011-03-28 | 2012-10-22 | Yamaha Corp | 子音識別装置、およびプログラム |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
WO2013075753A1 (en) * | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
US8731911B2 (en) * | 2011-12-09 | 2014-05-20 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
US20150039300A1 (en) * | 2012-03-14 | 2015-02-05 | Panasonic Corporation | Vehicle-mounted communication device |
CN103903633B (zh) * | 2012-12-27 | 2017-04-12 | 华为技术有限公司 | 检测语音信号的方法和装置 |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
US9167082B2 (en) | 2013-09-22 | 2015-10-20 | Steven Wayne Goldstein | Methods and systems for voice augmented caller ID / ring tone alias |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
EP2922056A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
CN105374367B (zh) | 2014-07-29 | 2019-04-05 | 华为技术有限公司 | 异常帧检测方法和装置 |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
US9886963B2 (en) * | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10616693B2 (en) | 2016-01-22 | 2020-04-07 | Staton Techiya Llc | System and method for efficiency among devices |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
EP3324407A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
EP3324406A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
WO2018118744A1 (en) * | 2016-12-19 | 2018-06-28 | Knowles Electronics, Llc | Methods and systems for reducing false alarms in keyword detection |
KR20180111271A (ko) * | 2017-03-31 | 2018-10-11 | 삼성전자주식회사 | 신경망 모델을 이용하여 노이즈를 제거하는 방법 및 장치 |
US10951994B2 (en) | 2018-04-04 | 2021-03-16 | Staton Techiya, Llc | Method to acquire preferred dynamic range function for speech enhancement |
CN109545192B (zh) * | 2018-12-18 | 2022-03-08 | 百度在线网络技术(北京)有限公司 | 用于生成模型的方法和装置 |
WO2020223797A1 (en) * | 2019-05-07 | 2020-11-12 | Voiceage Corporation | Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack |
CN110310668A (zh) * | 2019-05-21 | 2019-10-08 | 深圳壹账通智能科技有限公司 | 静音检测方法、系统、设备及计算机可读存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US574906A (en) * | 1897-01-12 | Chain | ||
US4281218A (en) * | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
JPS58143394A (ja) * | 1982-02-19 | 1983-08-25 | 株式会社日立製作所 | 音声区間の検出・分類方式 |
CA2040025A1 (en) | 1990-04-09 | 1991-10-10 | Hideki Satoh | Speech detection apparatus with influence of input level and noise reduced |
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
BR9206143A (pt) * | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
FR2684226B1 (fr) * | 1991-11-22 | 1993-12-24 | Thomson Csf | Procede et dispositif de decision de voisement pour vocodeur a tres faible debit. |
JP3277398B2 (ja) | 1992-04-15 | 2002-04-22 | ソニー株式会社 | 有声音判別方法 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
IN184794B (ja) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
GB2317084B (en) | 1995-04-28 | 2000-01-19 | Northern Telecom Ltd | Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals |
JPH09152894A (ja) | 1995-11-30 | 1997-06-10 | Denso Corp | 有音無音判別器 |
DE69831991T2 (de) * | 1997-03-25 | 2006-07-27 | Koninklijke Philips Electronics N.V. | Verfahren und Vorrichtung zur Sprachdetektion |
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
JP2000010577A (ja) | 1998-06-19 | 2000-01-14 | Sony Corp | 有声音/無声音判定装置 |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
-
2000
- 2000-12-08 US US09/733,740 patent/US7472059B2/en not_active Expired - Lifetime
-
2001
- 2001-12-04 WO PCT/US2001/046971 patent/WO2002047068A2/en active IP Right Grant
- 2001-12-04 ES ES01984988T patent/ES2276845T3/es not_active Expired - Lifetime
- 2001-12-04 KR KR1020097001337A patent/KR100908219B1/ko active IP Right Grant
- 2001-12-04 CN CNB018224938A patent/CN100350453C/zh not_active Expired - Lifetime
- 2001-12-04 KR KR1020037007641A patent/KR100895589B1/ko active IP Right Grant
- 2001-12-04 CN CN200710152618XA patent/CN101131817B/zh not_active Expired - Lifetime
- 2001-12-04 AU AU2002233983A patent/AU2002233983A1/en not_active Abandoned
- 2001-12-04 DE DE60123651T patent/DE60123651T2/de not_active Expired - Lifetime
- 2001-12-04 BR BRPI0116002-8A patent/BRPI0116002B1/pt unknown
- 2001-12-04 BR BRPI0116002-8A patent/BR0116002A/pt active IP Right Grant
- 2001-12-04 AT AT01984988T patent/ATE341808T1/de not_active IP Right Cessation
- 2001-12-04 EP EP01984988A patent/EP1340223B1/en not_active Expired - Lifetime
- 2001-12-04 JP JP2002548711A patent/JP4550360B2/ja not_active Expired - Lifetime
- 2001-12-07 TW TW090130379A patent/TW535141B/zh not_active IP Right Cessation
-
2004
- 2004-12-30 HK HK04110328A patent/HK1067444A1/xx not_active IP Right Cessation
-
2010
- 2010-03-26 JP JP2010072646A patent/JP5425682B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR20090026805A (ko) | 2009-03-13 |
CN101131817B (zh) | 2013-11-06 |
CN101131817A (zh) | 2008-02-27 |
DE60123651T2 (de) | 2007-10-04 |
WO2002047068A3 (en) | 2002-08-22 |
CN100350453C (zh) | 2007-11-21 |
HK1067444A1 (en) | 2005-04-08 |
JP2004515809A (ja) | 2004-05-27 |
JP4550360B2 (ja) | 2010-09-22 |
BR0116002A (pt) | 2006-05-09 |
EP1340223A2 (en) | 2003-09-03 |
ES2276845T3 (es) | 2007-07-01 |
WO2002047068A2 (en) | 2002-06-13 |
KR20030061839A (ko) | 2003-07-22 |
ATE341808T1 (de) | 2006-10-15 |
EP1340223B1 (en) | 2006-10-04 |
DE60123651D1 (de) | 2006-11-16 |
CN1543639A (zh) | 2004-11-03 |
AU2002233983A1 (en) | 2002-06-18 |
US20020111798A1 (en) | 2002-08-15 |
US7472059B2 (en) | 2008-12-30 |
TW535141B (en) | 2003-06-01 |
KR100895589B1 (ko) | 2009-05-06 |
KR100908219B1 (ko) | 2009-07-20 |
BRPI0116002B1 (pt) | 2018-04-03 |
JP2010176145A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5425682B2 (ja) | ロバストな音声分類のための方法および装置 | |
US6584438B1 (en) | Frame erasure compensation method in a variable rate speech coder | |
US8990074B2 (en) | Noise-robust speech coding mode classification | |
JP5543405B2 (ja) | フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ | |
JP4907826B2 (ja) | 閉ループのマルチモードの混合領域の線形予測音声コーダ | |
US7191125B2 (en) | Method and apparatus for high performance low bit-rate coding of unvoiced speech | |
US6640209B1 (en) | Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder | |
US6260017B1 (en) | Multipulse interpolative coding of transition speech frames | |
US20050119880A1 (en) | Method and apparatus for subsampling phase spectrum information | |
JP4567289B2 (ja) | 準周期信号の位相を追跡するための方法および装置 | |
JP2011090311A (ja) | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130104 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131127 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5425682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |