JP2005258068A - 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム - Google Patents
音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム Download PDFInfo
- Publication number
- JP2005258068A JP2005258068A JP2004069436A JP2004069436A JP2005258068A JP 2005258068 A JP2005258068 A JP 2005258068A JP 2004069436 A JP2004069436 A JP 2004069436A JP 2004069436 A JP2004069436 A JP 2004069436A JP 2005258068 A JP2005258068 A JP 2005258068A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- speech
- synthesized
- components
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims description 88
- 238000000034 method Methods 0.000 title description 66
- 238000009826 distribution Methods 0.000 claims abstract description 19
- 239000002131 composite material Substances 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 70
- 230000015572 biosynthetic process Effects 0.000 claims description 40
- 238000003786 synthesis reaction Methods 0.000 claims description 40
- 230000005236 sound signal Effects 0.000 claims description 33
- 230000002194 synthesizing effect Effects 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 abstract description 31
- 239000000203 mixture Substances 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 52
- 239000011159 matrix material Substances 0.000 description 25
- 238000012545 processing Methods 0.000 description 23
- 239000000284 extract Substances 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 238000012880 independent component analysis Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】 信号分解部45では、互いに異なる周波数帯域の信号成分を通過させる複数のフィルタFL0,FL1,FL2を用い、単一のマイクロフォンから入力された音声信号から、互いに独立な信号成分y0,y1,y2を抽出する。信号合成部47では、第一の規則に従って信号成分y0,y1,y2を合成し、第一の合成信号Y1を生成すると共に、第二の規則に従って信号成分y0,y1,y2を合成し、第二の合成信号Y2を生成する。尚、第一及び第二の規則は、合成信号Y1の確率密度関数p1(z)と、合成信号Y2の確率密度関数p2(z)との差異が最大となるように決定される。選択出力部49では、合成信号Y1,Y2の内、ガウス分布との差異の大きい合成信号を選択的に出力する。
【選択図】 図2
Description
テ−ウォン・リー(Te-Won Lee),アンソニー・ジェイ・ベル( Anthony J. Bell), レインホールド・オーグルメイスター(Reinhold Orglmeister)著, 「実世界の源信号のブラインド分離(Blind Source Separation of Real World Signals)」, 「IEEE(米国電気電子技術者協会)主催神経回路網国際会議講演論論文集(Proceedings of IEEE International Conference Neural Networks)」,(米国),1997年6月,p.2129−2135
即ち、独立成分分析を用いた従来の音声抽出方法では、目的とする音声成分を抽出するために、音声信号に含まれる独立成分の数と等しい数(即ち、雑音成分の数に、抽出すべき音声成分として1を加えた数)、マイクロフォンを空間内に設けなければならないといった問題があった。また、マイクロフォンを複数設けて、従来の独立成分分析の手法を用い、音声成分を抽出しても、雑音成分の数(即ち、雑音源の数)が時々刻々と変化する場合などには、音声成分を適切に抽出することができないといった問題があった。
音声認識装置30は、マイクロフォンMCから入力されるアナログ音声信号を、ディジタル信号(以下、「ディジタル音声信号」と表現する。)に変換するアナログ−ディジタル変換器31と、そのアナログ−ディジタル変換器31から入力されるディジタル音声信号から、音声成分を選択的に抽出して出力する音声抽出部33と、音声抽出部33から出力される信号に基づいて、利用者がマイクロフォンMCを通じて入力した音声を認識する認識部35と、を備える。
a1=b1(r+1)
a2=b2(r+1)
続いて、この信号合成部47から合成信号Y1(u),Y2(u)が入力される選択出力部49の構成について説明する。図5は、選択出力部49が、合成信号Y1(u),Y2(u)を信号合成部47から取得すると実行する選択出力処理を表すフローチャートである。
Ya2(u)=Y2(u)−<Y2(u)> …(32)
但し、<Y1(u)>は、Y1(u)の平均値、即ち、Y1(2),Y1(3),…,Y1(N−2),Y1(N−1)の総和を、データ数(N−2)で除算した値である。同様に、<Y2(u)>は、Y2(u)の平均値、即ち、Y2(2),Y2(3),…,Y2(N−2),Y2(N−1)の総和を、データ数(N−2)で除算した値である。
Yb1(u)=Ya1(u)/<Ya1(u)2>1/2 …(33)
Yb2(u)=Ya2(u)/<Ya2(u)2>1/2 …(34)
但し、<Ya1(u)2>は、Ya1(u)2の平均値、即ち、Ya1(2)2,Ya1(3)2,…,Ya1(N−2)2,Ya1(N−1)2の総和を、データ数(N−2)で除算した値である。同様に、<Ya2(u)2>は、Ya2(u)2の平均値である。
γ1=(γ10 γ11 γ12)t
γ2=(γ20 γ21 γ22)t
S620の処理後、信号分解部45は、S620で算出した固有ベクトルγ0,γ1,γ2を用いて、行列Γを生成する(S630)。
例えば、上記実施例では、フィルタFL0,FL1,FL2として、FIR型のディジタルフィルタを用いたが、IIR(Infinite Impulse Response)型のディジタルバンドパスフィルタを用いてもよい。尚、IIR型のディジタルフィルタを用いる場合には、周知の技法を用いて、インパルス応答をフィルタ学習部45aで更新して、信号成分y0(u),y1(u),y2(u)が、互いに独立、若しくは、互いに無相関となるようにすればよい。
Claims (18)
- 音声成分及び雑音成分からなるディジタル音声信号から、音声成分を選択的に抽出するための音声抽出方法であって、
複数のフィルタを用いて、前記ディジタル音声信号から、複数種の信号成分を抽出するステップ(a)と、
前記ステップ(a)にて抽出された各信号成分を、第一の規則に従って合成して、第一の合成信号を生成すると共に、前記ステップ(a)にて抽出された各信号成分を、第一の規則とは異なる第二の規則に従って合成し、第二の合成信号を生成するステップ(b)と、
前記ステップ(b)にて生成された前記第一及び第二の合成信号の内、音声成分の特徴が表れている合成信号を選択的に出力するステップ(c)と、
を有し、
前記ステップ(b)では、第一及び第二の合成信号の統計的特徴量に基づき、第一及び第二の規則を決定すること
を特徴とする音声抽出方法。 - 前記ステップ(a)では、各フィルタにより抽出される信号成分が相互に独立又は無相関となるように、前記複数のフィルタのインパルス応答を設定し、それら複数のフィルタを用いて、前記ディジタル音声信号から、前記複数種の信号成分を抽出することを特徴とする請求項1記載の音声抽出方法。
- 前記フィルタは、FIR型又はIIR型のディジタルバンドパスフィルタであることを特徴とする請求項1記載の音声抽出方法。
- 前記ステップ(b)では、前記統計的特徴量としての第一及び第二の合成信号の確率密度関数の差異を表す量、が最大となるように、前記第一及び第二の規則を決定することを特徴とする請求項1〜請求項3のいずれかに記載の音声抽出方法。
- 前記ステップ(b)では、前記統計的特徴量としての第一及び第二の合成信号についての相互情報量、が最小となるように、前記第一及び第二の規則を決定することを特徴とする請求項1〜請求項3のいずれかに記載の音声抽出方法。
- 前記ステップ(b)では、前記統計的特徴量としての第一及び第二の合成信号の確率密度関数の差異を表す量と、該第一及び第二の合成信号についての相互情報量と、に基づき、前記第一及び第二の規則を決定することを特徴とする請求項1〜請求項3のいずれかに記載の音声抽出方法。
- 前記ステップ(b)では、前記第一及び第二の規則として、前記ステップ(a)にて抽出された各信号成分の重み付けに関する規則を決定し、前記ステップ(a)にて抽出された各信号成分を、該第一の規則で重み付けして加算することで、前記第一の合成信号を生成し、前記ステップ(a)にて抽出された各信号成分を、前記第二の規則で重み付けして加算することで、前記第二の合成信号を生成することを特徴とする請求項1〜請求項6のいずれかに記載の音声抽出方法。
- 前記ステップ(c)では、前記ステップ(b)で生成された前記第一及び第二の合成信号の夫々について、ガウス分布との差異を評価し、ガウス分布との差異が最も大きく評価された合成信号を、前記音声成分の特徴が表れている合成信号として、選択的に出力することを特徴とする請求項1〜請求項7のいずれかに記載の音声抽出方法。
- 音声成分及び雑音成分からなるディジタル音声信号から、音声成分を選択的に抽出するための音声抽出装置であって、
複数のフィルタと、
前記複数のフィルタを用いて、外部入力されたディジタル音声信号から複数種の信号成分を抽出する抽出手段と、
前記抽出手段にて抽出された各信号成分を、第一の規則に従って合成して、第一の合成信号を生成する第一合成手段と、
前記抽出手段にて抽出された各信号成分を、前記第一の規則とは異なる第二の規則に従って合成して、第二の合成信号を生成する第二合成手段と、
前記第一合成手段で生成された第一の合成信号及び前記第二合成手段で生成された第二の合成信号の内、音声成分の特徴が表れている合成信号を選択的に出力する選択出力手段と、
前記第一合成手段で生成される第一の合成信号及び前記第二合成手段で生成される第二の合成信号の統計的特徴量に基づき、第一及び第二の規則を決定する決定手段と、
を備えることを特徴とする音声抽出装置。 - 前記抽出手段は、前記各フィルタにより抽出される信号成分が相互に独立又は無相関となるように、前記複数のフィルタのインパルス応答を設定し、それら複数のフィルタを用いて、前記ディジタル音声信号から、複数種の信号成分を抽出することを特徴とする請求項9記載の音声抽出装置。
- 前記各フィルタは、FIR型又はIIR型のディジタルバンドパスフィルタであることを特徴とする請求項9記載の音声抽出装置。
- 前記決定手段は、前記統計的特徴量としての第一及び第二の合成信号の確率密度関数の差異を表す量、が最大となるように、前記第一及び第二の規則を決定することを特徴とする請求項9〜請求項11のいずれかに記載の音声抽出装置。
- 前記決定手段は、前記統計的特徴量としての第一及び第二の合成信号についての相互情報量、が最小となるように、前記第一及び第二の規則を決定することを特徴とする請求項9〜請求項11のいずれかに記載の音声抽出装置。
- 前記決定手段は、前記統計的特徴量としての第一及び第二の合成信号の確率密度関数の差異を表す量と、該第一及び第二の合成信号についての相互情報量と、に基づき、前記第一及び第二の規則を決定することを特徴とする請求項9〜請求項11のいずれかに記載の音声抽出装置。
- 前記決定手段は、前記第一及び第二の規則として、前記抽出手段にて抽出された各信号成分の重み付けに関する規則を決定し、
前記第一合成手段は、前記抽出手段にて抽出された各信号成分を、前記第一の規則で重み付けして加算することで、前記第一の合成信号を生成し、
前記第二合成手段は、前記抽出手段にて抽出された各信号成分を、前記第二の規則で重み付けして加算することで、前記第二の合成信号を生成することを特徴とする請求項9〜請求項14のいずれかに記載の音声抽出装置。 - 前記選択出力手段は、
前記第一合成手段で生成された第一の合成信号及び前記第二合成手段で生成された前記第二の合成信号の夫々について、ガウス分布との差異を評価する評価手段、
を備え、該評価手段によってガウス分布との差異が最も大きく評価された合成信号を、前記音声成分の特徴が表れている合成信号として、選択的に出力することを特徴とする請求項9〜請求項15のいずれかに記載の音声抽出装置。 - 請求項9〜請求項16のいずれかに記載の音声抽出装置を備え、該音声抽出装置の前記選択出力手段が出力する合成信号を用いて音声認識を行うことを特徴とする音声認識装置。
- コンピュータに、
複数のフィルタと、
前記複数のフィルタを用いて、外部入力された音声成分及び雑音成分からなるディジタル音声信号から複数種の信号成分を抽出する抽出手段と、
前記抽出手段にて抽出された各信号成分を、第一の規則に従って合成して、第一の合成信号を生成する第一合成手段と、
前記抽出手段にて抽出された各信号成分を、前記第一の規則とは異なる第二の規則に従って合成して、第二の合成信号を生成する第二合成手段と、
前記第一合成手段で生成された第一の合成信号及び前記第二合成手段で生成された第二の合成信号の内、音声成分の特徴が表れている合成信号を選択的に出力する選択出力手段と、
前記第一合成手段で生成される第一の合成信号及び前記第二合成手段で生成される第二の合成信号の統計的特徴量に基づき、第一及び第二の規則を決定する決定手段、
としての機能を実現させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004069436A JP4529492B2 (ja) | 2004-03-11 | 2004-03-11 | 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム |
US11/073,922 US7440892B2 (en) | 2004-03-11 | 2005-03-08 | Method, device and program for extracting and recognizing voice |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004069436A JP4529492B2 (ja) | 2004-03-11 | 2004-03-11 | 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005258068A true JP2005258068A (ja) | 2005-09-22 |
JP4529492B2 JP4529492B2 (ja) | 2010-08-25 |
Family
ID=34918493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004069436A Expired - Fee Related JP4529492B2 (ja) | 2004-03-11 | 2004-03-11 | 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7440892B2 (ja) |
JP (1) | JP4529492B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217063A (ja) * | 2008-03-11 | 2009-09-24 | Toyota Motor Corp | 信号分離装置及び信号分離方法 |
JP2009540344A (ja) * | 2006-06-05 | 2009-11-19 | イーエックスオーディオ アクチボラゲット | ブラインド信号抽出 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060031067A1 (en) * | 2004-08-05 | 2006-02-09 | Nissan Motor Co., Ltd. | Sound input device |
KR100714721B1 (ko) * | 2005-02-04 | 2007-05-04 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
JP4225356B2 (ja) * | 2007-04-09 | 2009-02-18 | トヨタ自動車株式会社 | 車両用ナビゲーション装置 |
TWI467568B (zh) * | 2007-07-13 | 2015-01-01 | Dolby Lab Licensing Corp | 使用位準時變評估機率密度之時變音訊信號位準 |
US8442099B1 (en) | 2008-09-25 | 2013-05-14 | Aquantia Corporation | Crosstalk cancellation for a common-mode channel |
US9912375B1 (en) | 2008-09-25 | 2018-03-06 | Aquantia Corp. | Cancellation of alien interference in communication systems |
US8625704B1 (en) | 2008-09-25 | 2014-01-07 | Aquantia Corporation | Rejecting RF interference in communication systems |
US9118469B2 (en) * | 2010-05-28 | 2015-08-25 | Aquantia Corp. | Reducing electromagnetic interference in a received signal |
US8724678B2 (en) | 2010-05-28 | 2014-05-13 | Aquantia Corporation | Electromagnetic interference reduction in wireline applications using differential signal compensation |
US8891595B1 (en) | 2010-05-28 | 2014-11-18 | Aquantia Corp. | Electromagnetic interference reduction in wireline applications using differential signal compensation |
US8792597B2 (en) | 2010-06-18 | 2014-07-29 | Aquantia Corporation | Reducing electromagnetic interference in a receive signal with an analog correction signal |
US8861663B1 (en) | 2011-12-01 | 2014-10-14 | Aquantia Corporation | Correlated noise canceller for high-speed ethernet receivers |
US8929468B1 (en) | 2012-06-14 | 2015-01-06 | Aquantia Corp. | Common-mode detection with magnetic bypass |
CN106463125B (zh) * | 2014-04-25 | 2020-09-15 | 杜比实验室特许公司 | 基于空间元数据的音频分割 |
WO2018105614A1 (ja) * | 2016-12-06 | 2018-06-14 | 日本電信電話株式会社 | 信号特徴抽出装置、信号特徴抽出方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09160590A (ja) * | 1995-12-13 | 1997-06-20 | Denso Corp | 信号抽出装置 |
JP2005031524A (ja) * | 2003-07-09 | 2005-02-03 | Denso Corp | 音声信号抽出方法および音声認識装置 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4972490A (en) * | 1981-04-03 | 1990-11-20 | At&T Bell Laboratories | Distance measurement control of a multiple detector system |
US4897878A (en) * | 1985-08-26 | 1990-01-30 | Itt Corporation | Noise compensation in speech recognition apparatus |
US5157215A (en) * | 1989-09-20 | 1992-10-20 | Casio Computer Co., Ltd. | Electronic musical instrument for modulating musical tone signal with voice |
US5450522A (en) * | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
US5473728A (en) * | 1993-02-24 | 1995-12-05 | The United States Of America As Represented By The Secretary Of The Navy | Training of homoscedastic hidden Markov models for automatic speech recognition |
JP3563772B2 (ja) * | 1994-06-16 | 2004-09-08 | キヤノン株式会社 | 音声合成方法及び装置並びに音声合成制御方法及び装置 |
US5642464A (en) * | 1995-05-03 | 1997-06-24 | Northern Telecom Limited | Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding |
US5710866A (en) * | 1995-05-26 | 1998-01-20 | Microsoft Corporation | System and method for speech recognition using dynamically adjusted confidence measure |
JP3680380B2 (ja) * | 1995-10-26 | 2005-08-10 | ソニー株式会社 | 音声符号化方法及び装置 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JP3584458B2 (ja) * | 1997-10-31 | 2004-11-04 | ソニー株式会社 | パターン認識装置およびパターン認識方法 |
US6308155B1 (en) * | 1999-01-20 | 2001-10-23 | International Computer Science Institute | Feature extraction for automatic speech recognition |
JP2000242624A (ja) | 1999-02-18 | 2000-09-08 | Retsu Yamakawa | 信号分離装置 |
US6947890B1 (en) * | 1999-05-28 | 2005-09-20 | Tetsuro Kitazoe | Acoustic speech recognition method and system using stereo vision neural networks with competition and cooperation |
US7035790B2 (en) * | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
JP2002073072A (ja) * | 2000-08-31 | 2002-03-12 | Sony Corp | モデル適応装置およびモデル適応方法、記録媒体、並びにパターン認識装置 |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6993481B2 (en) * | 2000-12-04 | 2006-01-31 | Global Ip Sound Ab | Detection of speech activity using feature model adaptation |
US7571095B2 (en) * | 2001-08-15 | 2009-08-04 | Sri International | Method and apparatus for recognizing speech in a noisy environment |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
US7054454B2 (en) * | 2002-03-29 | 2006-05-30 | Everest Biomedical Instruments Company | Fast wavelet estimation of weak bio-signals using novel algorithms for generating multiple additional data frames |
US20060241937A1 (en) * | 2005-04-21 | 2006-10-26 | Ma Changxue C | Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments |
-
2004
- 2004-03-11 JP JP2004069436A patent/JP4529492B2/ja not_active Expired - Fee Related
-
2005
- 2005-03-08 US US11/073,922 patent/US7440892B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09160590A (ja) * | 1995-12-13 | 1997-06-20 | Denso Corp | 信号抽出装置 |
JP2005031524A (ja) * | 2003-07-09 | 2005-02-03 | Denso Corp | 音声信号抽出方法および音声認識装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009540344A (ja) * | 2006-06-05 | 2009-11-19 | イーエックスオーディオ アクチボラゲット | ブラインド信号抽出 |
JP2009217063A (ja) * | 2008-03-11 | 2009-09-24 | Toyota Motor Corp | 信号分離装置及び信号分離方法 |
US8452592B2 (en) | 2008-03-11 | 2013-05-28 | Toyota Jidosha Kabushiki Kaisha | Signal separating apparatus and signal separating method |
Also Published As
Publication number | Publication date |
---|---|
US7440892B2 (en) | 2008-10-21 |
JP4529492B2 (ja) | 2010-08-25 |
US20050203744A1 (en) | 2005-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4529492B2 (ja) | 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム | |
KR101807948B1 (ko) | 잔향 환경에서의 음성인식을 위한 결합 학습된 심화신경망 앙상블 기반의 음향 모델 및 이를 이용한 음성인식 방법 | |
KR100578260B1 (ko) | 인식장치및인식방법과,학습장치및학습방법 | |
US8370139B2 (en) | Feature-vector compensating apparatus, feature-vector compensating method, and computer program product | |
US20050159945A1 (en) | Noise cancellation system, speech recognition system, and car navigation system | |
US10262678B2 (en) | Signal processing system, signal processing method and storage medium | |
EP1505571A1 (en) | Car navigation system and speech recognizing device thereof | |
WO2012073275A1 (ja) | 音声認識装置及びナビゲーション装置 | |
JP2007279349A (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
US20140078867A1 (en) | Sound direction estimation device, sound direction estimation method, and sound direction estimation program | |
KR101704510B1 (ko) | 사운드 신호 처리 방법, 사운드 신호 처리 장치 및 상기 사운드 신호 처리 장치가 설치된 차량 | |
JP4996156B2 (ja) | 音声信号変換装置 | |
JP2002236497A (ja) | ノイズリダクションシステム | |
CN110675890B (zh) | 声音信号处理装置以及声音信号处理方法 | |
KR101066472B1 (ko) | 초성 기반 음성인식장치 및 음성인식방법 | |
JP4244524B2 (ja) | 音声認証装置、音声認証方法、及びプログラム | |
JP4611823B2 (ja) | 音声認識候補文字列選択装置 | |
JP2006084664A (ja) | 音声認識装置および音声認識プログラム | |
JP2006106300A (ja) | 音声認識装置及びそのプログラム | |
CN117012216A (zh) | 一种篇章级别语音转换方法、电子设备及存储介质 | |
JP3817784B2 (ja) | 音声認識装置および音声認識方法 | |
Droppo et al. | Quadratic Time–Frequency Features for Speech Recognition | |
JP2000322079A (ja) | 音声認識装置及び音声認識方法 | |
JPH10133683A (ja) | 音声認識・合成方法及び音声認識・合成装置 | |
JPH11212587A (ja) | 音声認識における雑音適応方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060529 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140618 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |