JP2016500847A - デジタルプロセッサベースの複素音響共鳴デジタル音声分析システム - Google Patents
デジタルプロセッサベースの複素音響共鳴デジタル音声分析システム Download PDFInfo
- Publication number
- JP2016500847A JP2016500847A JP2015539586A JP2015539586A JP2016500847A JP 2016500847 A JP2016500847 A JP 2016500847A JP 2015539586 A JP2015539586 A JP 2015539586A JP 2015539586 A JP2015539586 A JP 2015539586A JP 2016500847 A JP2016500847 A JP 2016500847A
- Authority
- JP
- Japan
- Prior art keywords
- digital
- bandwidth
- complex
- filter
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title abstract description 52
- 230000005236 sound signal Effects 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims description 109
- 238000012545 processing Methods 0.000 claims description 93
- 230000008569 process Effects 0.000 claims description 92
- 238000012937 correction Methods 0.000 claims description 30
- 230000010354 integration Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 24
- 238000012805 post-processing Methods 0.000 claims description 23
- 230000004044 response Effects 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 7
- 230000001934 delay Effects 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 4
- 230000001755 vocal effect Effects 0.000 description 15
- 238000013459 approach Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000003111 delayed effect Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本願は、同時係属中の米国特許出願第12/629,006号(2009年12月1日出願)の一部継続(CIP)であり、その出願は、参照によって本明細書に援用される。
本発明は、概して、音声認識の分野に関し、より具体的には、音声認識信号処理および分析のためのシステムに関する。
現代の人間のコミュニケーションは、遠距離にわたる音声のデジタル表現の伝送にますます依存している。本デジタル表現は、人間の声に関する情報のわずかしか含まないが、それにもかかわらず、人間は、デジタル音声信号を完璧に理解することが可能である。
図1aは、人間の声道10の切断図を図示する。示されるように、声道10は、音波12を産出する。音波12の質は、音声産出中の声道10の構成によって決定される。具体的には、図示されるように、声道10は、それぞれ音波12を生成することに寄与する、4つの共振器1、2、3、4を含む。4つの図示した共振器は、咽頭共振器1、口腔共振器2、口唇共振器3、鼻腔共振器4である。4つ全ての共振器は、個別に、かつともに、音声産出中に音声共鳴を生成する。これらの音声共鳴は、音波12を形成するように寄与する。
gn(t)=複素ガンマトーンフィルタn
bn=フィルタnの帯域幅パラメータ
fn=フィルタnの中心周波数
の関数であり、以下によって求められる。
ФN(t)=N遅延を伴う積分積行列
φm,n(t)=遅延m,n≦Nを伴う積分積行列要素
y=再構成モジュール210におけるCF312の複素信号出力
k=推定器モジュール320内の積分カーネル322
推定器オブジェクト320は、各サンプリング時間に積分積行列の要素を更新し、時間積分は、長さlの積分カーネルk[τ]上で各要素について別々に行われる。
Claims (38)
- 音声内容をデジタル音声信号から抽出するための音声処理システムであって、前記音声内容は、少なくとも1つのフォルマントによって特徴付けられ、前記少なくとも1つのフォルマントはそれぞれ、瞬時周波数および瞬時帯域幅によって特徴付けられ、前記音声信号は、前記少なくとも1つのフォルマントのうちの1つ以上についてのシーケンスを含み、前記音声処理システムは、
少なくとも1つのデジタルプロセッサ
を含み、前記少なくとも1つのデジタルプロセッサは、少なくとも1つの読み取り可能な記憶媒体上に記憶される命令でプログラムされ、前記少なくとも1つのデジタルプロセッサによる前記命令の実行は、前記少なくとも1つのデジタルプロセッサに、
前記デジタル音声信号から、前記少なくとも1つのフォルマントのうちの1つ以上の前記シーケンスのそれぞれ1つを抽出することであって、前記抽出することは、
複数の複素デジタルフィルタを使用して、前記デジタル音声信号をフィルタ処理することであって、前記複数のデジタルフィルタは、そのデジタルフィルタ処理機能を並行して行うように実装され、前記デジタルフィルタはそれぞれ、前記デジタル音声信号の総帯域幅の増分部分を包含する所定の帯域幅を有し、各所定の帯域幅は、前記所定の帯域幅の少なくとも1つの他の帯域幅と重複し、前記複素デジタルフィルタはそれぞれ、複数の複素デジタルフィルタ処理信号のうちの1つを生成し、前記複素デジタルフィルタ処理信号はそれぞれ、実数成分および虚数成分を含む、ことと、
前記複数のデジタルフィルタ処理信号のそれぞれの単一遅れ遅延と組み合わせて前記複数のデジタルフィルタ処理信号のそれぞれから形成される積集合を使用して、前記複数のデジタルフィルタ処理信号のそれぞれから推定瞬時周波数および推定瞬時帯域幅を生成することと、
前記推定瞬時周波数および推定瞬時帯域幅に基づいて、前記少なくとも1つのフォルマントのうちの1つとして、前記デジタル音声信号の1つ以上のフォルマントの前記シーケンスのそれぞれを識別することと
をさらに含む、ことと、
前記識別されたフォルマントのシーケンスに基づいて、前記デジタル音声信号の音声内容を再構成することと
を含む方法を行わせる、音声処理システム。 - 前記複数の複素デジタルフィルタの前記重複する所定の帯域幅は、まとめると、実質的に、前記デジタル音声信号の前記帯域幅に及ぶ、請求項1に記載の音声処理システム。
- 前記複数の複素デジタルフィルタのうちの少なくとも1つは、有限インパルス応答(FIR)フィルタの特性を示す、請求項1に記載のデジタル音声処理システム。
- 前記複数の複素デジタルフィルタのうちの少なくとも1つは、無限インパルス応答(IIR)フィルタの特性を示す、請求項1に記載の音声処理システム。
- 前記複数の複素デジタルフィルタのうちの少なくとも1つは、ガンマトーンフィルタの特性を示す、請求項1に記載の音声処理システム。
- 前記複素デジタルフィルタのそれぞれの前記所定の帯域幅はさらに、所定の中心周波数によって特徴付けられ、前記複素デジタルフィルタの前記所定の中心周波数は、それと重複する所定の帯域幅を有する前記複数の複素デジタルフィルタのうちの少なくとも1つの所定の中心周波数から所定の中心周波数間隔だけ分離されている、請求項1に記載の音声処理システム。
- 前記所定の中心周波数間隔は、約2%である、請求項6に記載の音声処理システム。
- 前記複数の複素フィルタのそれぞれの前記所定の帯域幅は、その所定の中心周波数の約0.75である、請求項7に記載の音声処理システム。
- 前記少なくとも1つのデジタルプロセッサは、汎用マイクロプロセッサである、請求項1に記載の音声処理システム。
- 前記少なくとも1つのデジタルプロセッサは、前記フィルタ処理することおよび前記推定することに固有の特定の計算を取り扱うように設計された計算リソースを有するデジタル信号プロセッサ(DSP)である、請求項1に記載の音声処理システム。
- 前記生成することはさらに、所定の期間にわたって、前記複数のデジタルフィルタ処理信号の各々に対して形成される前記積集合を積分することにより、デジタルフィルタ処理信号の各々に対して前記推定瞬時周波数および前記瞬時帯域幅を生成することを含む、請求項1に記載の音声処理システム。
- 前記生成することはさらに、前記複素デジタルフィルタのうちの1つによって生成された前記デジタルフィルタ処理信号の各1つに対して、前記推定瞬時帯域幅を補正することを含み、前記補正することはさらに、
補正される前記デジタルフィルタ処理信号を生成した前記デジタルフィルタのうちの1つの帯域幅に重複する帯域幅を有するデジタルフィルタによって生成される前記デジタルフィルタ処理信号の2つに対する前記推定瞬時周波数間の差異を決定することと、
前記決定された差異を前記所定の中心周波数間隔で除算することと
を含む、請求項6に記載の音声処理システム。 - 音声内容をデジタル音声信号から抽出するための音声処理システムであって、前記音声内容は、少なくとも1つのフォルマントによって特徴付けられ、前記少なくとも1つのフォルマントはそれぞれ、瞬時周波数および瞬時帯域幅によって特徴付けられ、前記音声信号は、前記少なくとも1つのフォルマントのうちの1つ以上についてのシーケンスを含み、前記音声処理システムは、
少なくとも1つのデジタルプロセッサ
を含み、前記少なくとも1つのデジタルプロセッサは、少なくとも1つの読み取り可能な記憶媒体上に記憶される命令でプログラムされ、前記少なくとも1つのデジタルプロセッサによる前記命令の実行は、前記少なくとも1つのデジタルプロセッサに、
前記デジタル音声信号から、フォルマントの前記シーケンスのそれぞれ1つを抽出することであって、前記抽出することは、
重複帯域幅を伴って実装される複数の複素デジタルフィルタを用いて、前記音声共鳴信号をフィルタ処理することにより、仮想並列処理チェーンを形成し、実数成分および虚数成分を有する複数の複素デジタルフィルタ処理信号を生成することと、
積分カーネルを使用して、前記複数の複素デジタルフィルタ処理信号の各々に対して、積分積集合を形成することであって、前記積分積集合は、少なくとも1つのゼロ遅れ複素積および少なくとも1つの単一遅れ複素積を有する、ことと、
前記積分積集合のそれぞれから、推定瞬時周波数および推定瞬時帯域幅を生成することと、
前記推定瞬時周波数および推定瞬時帯域幅に基づいて、前記少なくとも1つのフォルマントのうちの1つとして、前記デジタル音声信号の1つ以上のフォルマントの前記シーケンスのそれぞれを識別することと
をさらに含む、ことと、
前記識別されたフォルマントのシーケンスに基づいて、前記デジタル音声信号の前記音声内容を再構成することと
を含む方法を行わせる、音声処理システム。 - 前記仮想並列処理チェーンの前記複数の複素デジタルフィルタのうちの少なくとも1つは、有限インパルス応答(FIR)フィルタの特性を示す、請求項13に記載の音声処理システム。
- 前記仮想並列処理チェーンの前記複数の複素デジタルフィルタのうちの少なくとも1つは、無限インパルス応答(IIR)フィルタの特性を示す、請求項13に記載の音声処理システム。
- 前記仮想並列処理チェーンの前記複数の複素デジタルフィルタのうちの少なくとも1つは、ガンマトーンフィルタの特性を示す、請求項13に記載の音声処理システム。
- 前記複数の複素デジタルフィルタは、そのデジタルフィルタ処理機能を並行して行うように実装され、
前記複数の複素デジタルフィルタは、まとめると実質的に前記デジタル音声信号の前記帯域幅に及ぶ重複帯域幅を有するように実装される、請求項13に記載の音声処理システム。 - 前記複素デジタルフィルタはそれぞれ、所定の帯域幅および所定の中心周波数によって特徴付けられ、前記複素デジタルフィルタのそれぞれの所定の中心周波数は、前記仮想処理チェーンにおいて前記複素デジタルフィルタに隣接する複数の複素デジタルフィルタの前記所定の中心周波数から分離されている、請求項13に記載の音声処理システム。
- 前記複素デジタルフィルタの重複帯域幅間の前記所定の中心周波数の間隔は、約2%である、請求項18に記載の音声処理システム。
- 前記並列処理チェーンを形成する前記複素デジタルフィルタのそれぞれの前記所定の帯域幅は、その所定の中心周波数の0.75である、請求項18に記載の音声処理システム。
- 前記積分カーネルは、二次ガンマIIRフィルタの特性を示す、請求項13に記載の音声処理システム。
- 前記積分積集合は、前記少なくとも1つの単一遅れ複素積の代わりに、少なくとも1つのゼロ遅れ複素積および少なくとも1つの2以上遅れ複素積を有する、請求項13に記載の音声処理システム。
- 前記生成することはさらに、所定の期間にわたって、前記複数のデジタルフィルタ処理信号の各々に対して形成される前記積集合を積分することにより、デジタルフィルタ処理信号の各々に対して前記推定瞬時周波数および前記瞬時帯域幅を生成することを含む、請求項13に記載の音声処理システム。
- 前記生成することはさらに、前記複素デジタルフィルタのうちの1つによって生成された前記デジタルフィルタ処理信号の各1つに対して、前記推定瞬時帯域幅を補正することを含み、前記補正ことはさらに、
補正される前記デジタルフィルタ処理信号を生成した前記デジタルフィルタのうちの1つの帯域幅に重複する帯域幅を有するデジタルフィルタによって生成される前記デジタルフィルタ処理信号の2つに対する前記推定瞬時周波数間の差異を決定することと、
前記決定された差異を前記所定の中心周波数間隔で除算することと
を含む、請求項18に記載の音声処理システム。 - デジタル化された音声信号内の音声内容を抽出するための装置であって、前記音声内容は、少なくとも1つのフォルマントによって特徴付けられ、前記少なくとも1つのフォルマントはそれぞれ、瞬時周波数および瞬時帯域幅によって特徴付けられ、前記音声信号は、前記少なくとも1つのフォルマントのうちの1つ以上のシーケンスを含み、前記装置は、
前記デジタル音声信号のサンプルを受信し、それに対して動作するようにプログラム命令によって構成された再構成プロセッサであって、前記再構成プロセッサは、複数の複素デジタルフィルタを計算的に実装し、前記複数の複素デジタルフィルタは、前記デジタル音声信号の各サンプルに対して、並行してその処理を行うように実装され、前記複素デジタルフィルタはそれぞれ、前記複数の複素フィルタの少なくとも1つの他のフィルタの帯域幅と重複する帯域幅によって特徴付けられ、前記複素デジタルフィルタはそれぞれ、出力として、複数のデジタルフィルタ処理信号のうちの1つを生成し、前記デジタルフィルタ処理信号はそれぞれ、処理された前記デジタル音声信号の各サンプルに対する離散(discreet)値を備え、前記デジタルフィルタ処理信号はそれぞれ、実数成分および虚数成分を含む、再構成プロセッサと、
前記再構成プロセッサから前記複数のデジタルフィルタ処理信号を受信するようにプログラム命令によって構成された推定器プロセッサであって、前記推定器プロセッサは、推定器オブジェクトを計算的に実装し、前記推定器オブジェクトは、前記生成されたデジタルフィルタ処理信号の1つ毎にインスタンス化され、前記推定器オブジェクトの各インスタンス化は、前記複数のデジタルフィルタ処理信号のそれぞれから形成される積集合を使用して、前記複数のデジタルフィルタ処理信号のそれぞれから、推定瞬時周波数および推定瞬時帯域幅を生成するように構成されている、推定器プロセッサと、
前記推定器プロセッサから、前記複数のデジタルフィルタ処理信号の各々に対する前記推定瞬時周波数および瞬時帯域幅推定値を受信するようにプログラム命令によって構成された後処理プロセッサであって、前記後処理プロセッサはさらに、前記複数のフィルタ処理信号の前記受信した推定瞬時周波数および推定瞬時帯域幅に基づいて、前記デジタル音声信号の1つ以上のフォルマントの前記シーケンスのそれぞれを前記少なくとも1つのフォルマントのうちの1つとして識別するようにプログラム命令によって構成され、前記後処理プロセッサはまた、前記識別されたフォルマントを使用して、前記デジタル音声信号の前記音声内容を再構成するようにプログラム命令によって構成されている、後処理プロセッサと
を備える、装置。 - 前記推定器オブジェクトの各インスタンス化はさらに、計算的に実装された積分カーネルを含み、前記積分カーネルは、所定の期間にわたって、前記複数のフィルタ処理信号の各々に対して形成される前記積集合を積分し、フィルタ処理信号の各々に対して前記推定瞬時周波数および前記瞬時帯域幅を生成するように構成されている、請求項25に記載の装置。
- 前記積分カーネルは、二次ガンマIIRフィルタの特性を示す、請求項26に記載の装置。
- 前記複数のデジタルフィルタ処理信号のそれぞれからの前記推定瞬時周波数および前記推定瞬時帯域幅は、前記複数のデジタルフィルタ処理信号のそれぞれの少なくとも1つの単一遅れ遅延と組み合わせて、前記複数のフィルタ処理信号のそれぞれから前記推定器オブジェクトによって形成される積集合を使用して生成される、請求項26に記載の装置。
- 前記複数のデジタルフィルタ処理信号のそれぞれからの前記推定瞬時周波数および前記推定瞬時帯域幅は、前記複数のデジタルフィルタ処理信号のそれぞれの2以上遅れ遅延と組み合わせて、前記複数のフィルタ処理信号のそれぞれから前記推定器オブジェクトによって形成される積集合を使用して生成される、請求項26に記載の装置。
- 前記再構成プロセッサによって計算的に実装される前記複素デジタルフィルタのうちの少なくとも1つは、ガンマトーンフィルタの特性を示す、請求項25に記載の装置。
- 前記複素デジタルフィルタはそれぞれ、所定の帯域幅および所定の中心周波数を含み、前記複素デジタルフィルタのそれぞれの所定の中心周波数は、それと重複する帯域幅を有するそれらの複素デジタルフィルタの前記所定の中心周波数から所定の中心周波数間隔だけ分離されている、請求項25に記載の装置。
- 前記所定の中心周波数間隔は、約2%である、請求項30に記載の装置。
- 前記複素デジタルフィルタのそれぞれの前記所定の帯域幅は、その所定の中心周波数の約0.75である、請求項32に記載の装置。
- 前記推定器プロセッサはさらに、前記推定器プロセッサから、前記推定瞬時周波数および前記推定瞬時帯域幅を受信する補正プロセスを実装するように構成され、前記補正プロセスは、前記所定の中心周波数間隔で除算された、前記チェーンにおける2つの隣接する複素フィルタに対する前記推定瞬時周波数間の差異を使用して、前記フィルタ処理信号の各々に対する補正された推定瞬時帯域幅を前記後処理モジュールに提供する、請求項31に記載の装置。
- 前記補正プロセスはさらに、前記フィルタ処理信号毎に補正された帯域幅を最良適合式に当てはめることによって、前記フィルタ処理信号毎に補正された推定瞬時周波数を前記後処理プロセッサに提供する、請求項34に記載の装置。
- 前記再構成プロセッサ、前記推定器プロセッサ、および前記後処理プロセッサは、1つ以上のデジタルプロセッサとして実装されている、請求項25に記載の装置。
- 前記1つ以上のデジタルプロセッサのうちの少なくとも1つは、汎用マイクロプロセッサである、請求項25に記載の装置。
- 前記再構成プロセッサ、前記推定器プロセッサ、および前記後処理プロセッサは、1つ以上のDSP構成要素として実装される、請求項25に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/665,486 US9311929B2 (en) | 2009-12-01 | 2012-10-31 | Digital processor based complex acoustic resonance digital speech analysis system |
US13/665,486 | 2012-10-31 | ||
PCT/US2013/055347 WO2014070283A1 (en) | 2012-10-31 | 2013-08-16 | A digital processor based complex acoustic resonance digital speech analysis system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016500847A true JP2016500847A (ja) | 2016-01-14 |
Family
ID=50548148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015539586A Pending JP2016500847A (ja) | 2012-10-31 | 2013-08-16 | デジタルプロセッサベースの複素音響共鳴デジタル音声分析システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US9311929B2 (ja) |
EP (1) | EP2915167A4 (ja) |
JP (1) | JP2016500847A (ja) |
IL (1) | IL237020B (ja) |
WO (1) | WO2014070283A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102032365B1 (ko) * | 2016-05-03 | 2019-10-16 | 한국전자통신연구원 | 디지털 rf 신호 수신 장치 및 방법 |
US10193683B2 (en) | 2016-07-20 | 2019-01-29 | Intel Corporation | Methods and devices for self-interference cancelation |
US11223376B2 (en) * | 2017-02-27 | 2022-01-11 | Apple Inc. | Frequency dependent envelope tracking |
CN111245399B (zh) * | 2020-02-14 | 2023-06-23 | 北京数码视讯软件技术发展有限公司 | 抑制窄带干扰的滤波器的设计方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124696A (ja) * | 1997-07-01 | 1999-01-29 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 信号分析方法および信号分析装置 |
JP2007156337A (ja) * | 2005-12-08 | 2007-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム |
US20110131039A1 (en) * | 2009-12-01 | 2011-06-02 | Kroeker John P | Complex acoustic resonance speech analysis system |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL188189C (nl) * | 1979-04-04 | 1992-04-16 | Philips Nv | Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting. |
CA1250368A (en) * | 1985-05-28 | 1989-02-21 | Tetsu Taguchi | Formant extractor |
JP3417880B2 (ja) * | 1999-07-07 | 2003-06-16 | 科学技術振興事業団 | 音源情報の抽出方法及び装置 |
US6577968B2 (en) | 2001-06-29 | 2003-06-10 | The United States Of America As Represented By The National Security Agency | Method of estimating signal frequency |
KR20040001131A (ko) | 2002-06-27 | 2004-01-07 | 주식회사 하이닉스반도체 | 반도체소자의 제조방법 |
US7624195B1 (en) | 2003-05-08 | 2009-11-24 | Cisco Technology, Inc. | Method and apparatus for distributed network address translation processing |
US6970547B2 (en) | 2003-05-12 | 2005-11-29 | Onstate Communications Corporation | Universal state-aware communications |
US7522594B2 (en) | 2003-08-19 | 2009-04-21 | Eye Ball Networks, Inc. | Method and apparatus to permit data transmission to traverse firewalls |
US7643989B2 (en) * | 2003-08-29 | 2010-01-05 | Microsoft Corporation | Method and apparatus for vocal tract resonance tracking using nonlinear predictor and target-guided temporal restraint |
KR20050072976A (ko) | 2004-01-08 | 2005-07-13 | 주식회사 팬택 | 이동통신 단말기의 통화감도 개선용 도금구조 |
KR100600628B1 (ko) | 2004-08-06 | 2006-07-13 | 주식회사 케이티 | 통화 시스템 및 통화 연결 방법 |
US8938390B2 (en) * | 2007-01-23 | 2015-01-20 | Lena Foundation | System and method for expressive language and developmental disorder assessment |
KR100634526B1 (ko) * | 2004-11-24 | 2006-10-16 | 삼성전자주식회사 | 포만트 트래킹 장치 및 방법 |
US7457756B1 (en) | 2005-06-09 | 2008-11-25 | The United States Of America As Represented By The Director Of The National Security Agency | Method of generating time-frequency signal representation preserving phase information |
US7492814B1 (en) | 2005-06-09 | 2009-02-17 | The U.S. Government As Represented By The Director Of The National Security Agency | Method of removing noise and interference from signal using peak picking |
JP4766976B2 (ja) | 2005-09-29 | 2011-09-07 | 富士通株式会社 | ノード間接続方法及び装置 |
US20070112954A1 (en) | 2005-11-15 | 2007-05-17 | Yahoo! Inc. | Efficiently detecting abnormal client termination |
KR100731330B1 (ko) | 2006-02-10 | 2007-06-21 | 두산중공업 주식회사 | 용융탄산염 연료전지의 분리판 및 그의 제조방법 |
US8150065B2 (en) * | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
EP1930879B1 (en) * | 2006-09-29 | 2009-07-29 | Honda Research Institute Europe GmbH | Joint estimation of formant trajectories via bayesian techniques and adaptive segmentation |
JP4469883B2 (ja) * | 2007-08-17 | 2010-06-02 | 株式会社東芝 | 音声合成方法及びその装置 |
-
2012
- 2012-10-31 US US13/665,486 patent/US9311929B2/en active Active
-
2013
- 2013-08-16 WO PCT/US2013/055347 patent/WO2014070283A1/en active Application Filing
- 2013-08-16 JP JP2015539586A patent/JP2016500847A/ja active Pending
- 2013-08-16 EP EP13851793.3A patent/EP2915167A4/en not_active Withdrawn
-
2015
- 2015-02-01 IL IL237020A patent/IL237020B/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124696A (ja) * | 1997-07-01 | 1999-01-29 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 信号分析方法および信号分析装置 |
JP2007156337A (ja) * | 2005-12-08 | 2007-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム |
US20110131039A1 (en) * | 2009-12-01 | 2011-06-02 | Kroeker John P | Complex acoustic resonance speech analysis system |
Also Published As
Publication number | Publication date |
---|---|
US9311929B2 (en) | 2016-04-12 |
EP2915167A1 (en) | 2015-09-09 |
EP2915167A4 (en) | 2016-07-20 |
IL237020B (en) | 2018-10-31 |
US20140122067A1 (en) | 2014-05-01 |
WO2014070283A1 (en) | 2014-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767783B (zh) | 语音增强方法、装置、设备及存储介质 | |
CN105788607B (zh) | 应用于双麦克风阵列的语音增强方法 | |
CN107408394B (zh) | 确定在主信道与参考信道之间的噪声功率级差和声音功率级差 | |
KR101266894B1 (ko) | 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법 | |
KR101831078B1 (ko) | 보이스 활성화 탐지 방법 및 장치 | |
KR20140079369A (ko) | 사운드 신호를 주파수 처프 도메인으로 변환하는 것을 포함하는 사운드 신호 프로세싱 시스템 및 방법 | |
JP2016006536A (ja) | 複素音響共鳴音声分析システム | |
JP2016500847A (ja) | デジタルプロセッサベースの複素音響共鳴デジタル音声分析システム | |
Kumar | Comparative performance evaluation of greedy algorithms for speech enhancement system | |
FR3031225A1 (fr) | Procede de separation ameliore et produit programme d'ordinateur | |
JPH03266899A (ja) | 雑音抑圧装置 | |
CN115223583A (zh) | 一种语音增强方法、装置、设备及介质 | |
CN107210029A (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
TWI767696B (zh) | 自我語音抑制裝置及方法 | |
Shenoy et al. | Spectral zero-crossings: Localization properties and applications | |
JP2013512475A5 (ja) | フォルマントの速い抽出のための複数の並列複素フィルタを用いる音声認識 | |
Slaney | An introduction to auditory model inversion | |
Agcaer et al. | Optimization of amplitude modulation features for low-resource acoustic scene classification | |
Bagchi et al. | Extending instantaneous de-mixing algorithms to anechoic mixtures | |
Slaney | Pattern playback in the 90s | |
Douglas et al. | Single-channel Wiener filtering of deterministic signals in stochastic noise using the panorama | |
Childers et al. | Co--Channel speech separation | |
Mustière et al. | Low-cost modifications of Rao-Blackwellized particle filters for improved speech denoising | |
Sharma et al. | Time-varying sinusoidal demodulation for non-stationary modeling of speech | |
EP2840570A1 (en) | Enhanced estimation of at least one target signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170727 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171026 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171225 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180320 |