JP7211419B2 - パターン認識装置、パターン認識方法及びパターン認識プログラム - Google Patents
パターン認識装置、パターン認識方法及びパターン認識プログラム Download PDFInfo
- Publication number
- JP7211419B2 JP7211419B2 JP2020518850A JP2020518850A JP7211419B2 JP 7211419 B2 JP7211419 B2 JP 7211419B2 JP 2020518850 A JP2020518850 A JP 2020518850A JP 2020518850 A JP2020518850 A JP 2020518850A JP 7211419 B2 JP7211419 B2 JP 7211419B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern recognition
- model
- input signal
- unit
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003909 pattern recognition Methods 0.000 title claims description 202
- 238000012567 pattern recognition method Methods 0.000 title claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 114
- 238000012546 transfer Methods 0.000 claims description 93
- 238000000605 extraction Methods 0.000 claims description 38
- 238000012937 correction Methods 0.000 claims description 24
- 239000007787 solid Substances 0.000 claims description 17
- 230000010354 integration Effects 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 description 36
- 238000010586 diagram Methods 0.000 description 20
- 239000002023 wood Substances 0.000 description 18
- 238000000034 method Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000000644 propagated effect Effects 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 238000009825 accumulation Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 238000005314 correlation function Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 230000001902 propagating effect Effects 0.000 description 4
- 230000008054 signal transmission Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
前記第1の視点の変形として、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部と、前記モデルを用いて、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力として、入力信号のパターン認識を行うパターン認識部と、入力信号の特徴量から伝達パスを識別する伝達パス識別部と、前記パターン認識部の出力と、前記伝達パス識別部の出力とを統合して、認識結果を出力する情報統合部と、を含むパターン認識装置が提供される。
前記第2の視点の変形として、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部を備えるコンピュータが、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力するステップと、前記モデルを用いて、前記入力信号と、前記伝達パス情報とを入力として、入力信号のパターン認識を行うステップと、入力信号の特徴量から伝達パスを識別するステップと、前記入力信号のパターン認識を行った認識結果と、前記伝達パスを識別した識別結果とを統合して情報を出力するステップと、を含むパターン認識方法が提供される。
以下の実施形態では、入力信号が音響信号である例を挙げて説明する。はじめに、音源信号と受音点における音響信号の関係を、伝達パスによる信号の周波数特性変化の観点から説明する。
[数1]
音響デジタル信号処理分野において、関数f(・)は、時不変FIRフィルタによって近似するのが一般的であり、つまりフィルタ長がTであるFIRフィルタh(t)を用いて、[数1]の右辺は、[数2]のようにh(t)とs(t)の畳み込みとして表現できる。
[数2]
また、伝達パスによる音源信号の周波数特性変化は、h(t)の周波数応答として表現できる。本発明では、フィルタh(t)が伝達パスを特徴づけるベクトルであるとみなし、伝達パス特徴ベクトルhとして用いる。
受音信号001は伝達パス特徴抽出部002に入力される。ここで、受音信号をx(t)と記す。
次に、上記第1の実施形態におけるモデルの切替を省略可能とした本発明の第2実施形態に係るパターン認識装置200について、図4を用いて説明する。
次に、伝達パス特徴ベクトルhをモデルの補正に用いるように構成した本発明の第3の実施形態のパターン認識装置300について、図5を用いて説明する。
受音信号x(t)のパターン認識を行う場合、受音信号x(t)には伝達パスの影響が含まれる。換言すると、受音信号x(t)は、パターン認識時に特徴量空間上にて伝達パス特徴ベクトルhに相当するズレが生じている。そのため、モデル補正部304ではモデルPをそのズレの分だけ補正する。以下、モデルPで用いるx(t)に関する音響特徴量が周波数スペクトルである場合を例としてその原理を説明する。
[数2]
[数3]
つまり、特徴量空間において、受音信号x(t)は、F(h)分だけズレが生じているといえる。そのため、モデルPのパラメータに対してF(h)分の線形変換を加えることで、モデルPを補正し、ズレを除去したモデルP_newを得ることができる。
次に、伝達パス特徴ベクトルhを用いて入力信号を補正するように構成した本発明の第4の実施形態のパターン認識装置400について、図6を用いて説明する。
[数4]
次に、本発明の第5の実施形態のパターン認識装置500について、図7を用いて説明する。
次に、本発明の第6実施形態の統合型のパターン認識装置600について、図8を用いて説明する。
また、この第6の実施形態の構成に、図3にて説明した識別モデル学習部に相当する構成を追加することも可能である。図9は、本発明の第6の実施形態のパターン認識装置の変形構成を示す図である。図9を参照すると、上段の学習部に相当する部分及び情報統合部718が組み込まれたパターン認識装置700の下段に、識別モデル学習部を構成する、伝達パス特徴抽出部722、パス識別モデル学習部723及びパス識別モデル記憶部724が追加されている。これらは、第1の実施形態の説明したものと同様であるもので、説明を省略する。
続いて上記第1、第5、第6、第7の実施形態の伝達パス識別部においてモデルを用いずに伝達パスを特定できるようにした第8の実施形態を説明する。図10は、本発明の第8の実施形態の伝達パス識別部の構成を示すブロック図である。図10を参照すると、本発明の第8の実施形態の伝達パス識別部800は、複数のセンサ8101と8102(以降、センサ1、センサ2とも記す)と、特徴量算出部8201と、伝達パス判断部8202とを含む。
続いて、上記伝達パスの判定精度をより向上できるようにした第9の実施形態について図面を参照して詳細に説明する。図17は、本発明の第9の実施形態の構成を示すブロック図である。図17を参照すると、本発明の第9の実施形態の伝達パス識別部8100Aは、第8の実施形態の構成に加えて、蓄積部8203、範囲決定部8204及び判断モデル8205を有する。その他の構成は第1の実施形態と同様であるので、以下、その相違点を中心に説明する。
(上記第1の視点によるパターン認識装置参照)
上記したパターン認識装置において、前記モデルは、少なくとも2以上の異なる伝達パス毎に、前記伝達パスを介して観測された信号を用いて作成される複数のモデルであり、
さらに、
入力信号の特徴量から伝達パスを識別する伝達パス識別部を含み、
前記パターン認識部は、
前記複数のモデルから前記識別した伝達パスに対応するモデルを選択して入力信号のパターン認識を行う構成を採ることができる。
前記モデルは、学習用信号の伝達パスの特徴を表す伝達パス特徴ベクトルを含む、前記学習用信号を用いて作成されたモデルであり、
上記したパターン認識装置は、さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部を含み、
前記パターン認識部は、前記モデルを用いて、入力信号の特徴に加え、前記入力信号から計算した伝達パス特徴ベクトルを用いて、入力信号のパターン認識を行う構成を採ることができる。
上記したパターン認識装置は、さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部と、
前記伝達パス特徴ベクトルを用いて、前記モデルを補正するモデル補正部とを含み、
前記パターン認識部は、前記補正後のモデルを用いて、入力信号のパターン認識を行う構成を採ることができる。
上記したパターン認識装置は、さらに、
前記伝達パス特徴ベクトルを用いて、前記入力信号を補正する入力信号補正部とを含み、
前記パターン認識部は、前記補正後の入力信号を用いて、パターン認識を行う構成を採ることができる。
上記したパターン認識装置は、さらに、
入力信号の特徴量から伝達パスを識別する第2の伝達パス識別部と、
前記パターン認識部の出力と、前記第2の伝達パス識別部の出力とを統合して、認識結果を出力する情報統合部と、を含む構成を採ることができる。
上記したパターン認識装置に入力される入力信号が音響信号であり、少なくとも前記伝達パスが空気中か固体中かを識別してパターン認識を行う構成を採ることができる。
上記したパターン認識装置において、
前記伝達パス識別部及び前記第2のパス識別部の少なくとも一方が、
複数のセンサのセンサ出力信号から特徴量を計算する特徴量算出部と、
該当特徴量に対応して伝搬パスを判断する伝搬パス判断部と、
を含んで構成されている構成を採ることができる。
(上記第2の視点によるパターン認識方法参照)
(上記第3の視点によるプログラム参照)
なお、上記第9~第10の形態は、第1の形態と同様に、第2~第8の形態に展開することが可能である。
002、012、202、212、302、402、412,502、512、702、712、714、722 伝達パス特徴抽出部
003、724 パス識別モデル記憶部
004 パス識別部
011 パス学習用信号とそのラベルの組
013、723 パス識別モデル学習部
100、200、300、400、500、602、900 パターン認識装置
101、201、401、501、701 学習信号
004、102、112、603、715、800、8100A 伝達パス識別部
103、203、404、504、704 モデル学習部
104、204、303、405、505、705、901 モデル記憶部
113 モデル切替部
114、214、305、414、515、717、902 パターン認識部
304 モデル補正部
403、413、503、513、703、713 入力信号補正部
514、716 モデル補正・切替部
600 統合型パターン認識装置
604、718 情報統合部
721 パス学習信号
8101、8102 センサ
8201 特徴量算出部
8202 伝達パス判断部
8203 蓄積部
8204 範囲決定部
8205 判断モデル
8300 音源
8301 壁
8401 判断結果
9000 コンピュータ
9010 CPU
9020 通信インタフェース
9030 メモリ
9040 補助記憶装置
Claims (9)
- 学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部と、
前記モデルを用いて、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力として、入力信号のパターン認識を行うパターン認識部と、
入力信号の特徴量から伝達パスを識別する伝達パス識別部と、
前記パターン認識部の出力と、前記伝達パス識別部の出力とを統合して、認識結果を出力する情報統合部と、
を含むパターン認識装置。 - 前記モデルは、少なくとも2以上の異なる伝達パス毎に、前記伝達パスを介して観測された信号を用いて作成される複数のモデルであり、
さらに、
入力信号の特徴量から伝達パスを識別する第2の伝達パス識別部を含み、
前記パターン認識部は、
前記複数のモデルから前記第2の伝達パス識別部で識別した伝達パスに対応するモデルを選択して入力信号のパターン認識を行う請求項1のパターン認識装置。 - 前記モデルは、学習用信号の伝達パスの特徴を表す伝達パス特徴ベクトルを含む、前記学習用信号を用いて作成されたモデルであり、
さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部を含み、
前記パターン認識部は、前記モデルを用いて、入力信号の特徴に加え、前記入力信号から計算した伝達パス特徴ベクトルを用いて、入力信号のパターン認識を行う請求項1又は2のパターン認識装置。 - さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部と、
前記伝達パス特徴ベクトルを用いて、前記モデルを補正するモデル補正部とを含み、
前記パターン認識部は、前記補正後のモデルを用いて、入力信号のパターン認識を行う請求項1又は2のパターン認識装置。 - さらに、
前記伝達パス特徴ベクトルを用いて、前記入力信号を補正する入力信号補正部とを含み、
前記パターン認識部は、前記補正後の入力信号を用いて、パターン認識を行う請求項4のパターン認識装置。 - さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部と、
前記伝達パス特徴ベクトルを用いて、前記入力信号を補正する入力信号補正部とを含み、
前記パターン認識部は、前記補正後の入力信号を用いて、パターン認識を行う請求項1又は2のパターン認識装置。 - 前記入力信号が音響信号であり、少なくとも前記伝達パスが空気中か固体中かを識別してパターン認識を行う請求項1から6いずれか一のパターン認識装置。
- 前記伝達パス識別部及び前記第2の伝達パス識別部の少なくとも一方が、
複数のセンサのセンサ出力信号から特徴量を計算する特徴量算出部と、
当該特徴量に対応して伝達パスを判断する伝達パス判断部と、
を含んで構成されている請求項2のパターン認識装置。 - 学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部を備えるコンピュータがパターンを認識するパターン認識方法であって、
入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力するステップと、
前記モデルを用いて、前記入力信号と、前記伝達パス情報とを入力として、入力信号のパターン認識を行うステップと、
入力信号の特徴量から伝達パスを識別するステップと、
前記入力信号のパターン認識を行った認識結果と、前記伝達パスを識別した識別結果とを統合して情報を出力するステップと、
を含むパターン認識方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/018740 WO2019220532A1 (ja) | 2018-05-15 | 2018-05-15 | パターン認識装置、パターン認識方法及びパターン認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019220532A1 JPWO2019220532A1 (ja) | 2021-05-20 |
JP7211419B2 true JP7211419B2 (ja) | 2023-01-24 |
Family
ID=68539687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020518850A Active JP7211419B2 (ja) | 2018-05-15 | 2018-05-15 | パターン認識装置、パターン認識方法及びパターン認識プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11620985B2 (ja) |
JP (1) | JP7211419B2 (ja) |
WO (1) | WO2019220532A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006285103A (ja) | 2005-04-04 | 2006-10-19 | Nissan Motor Co Ltd | 音声認識装置および方法 |
JP2009157337A (ja) | 2007-12-06 | 2009-07-16 | Sanyo Electric Co Ltd | 集音環境判定装置及びそれを備えた電子機器並びに集音環境判定方法 |
JP2015082036A (ja) | 2013-10-23 | 2015-04-27 | 日本電信電話株式会社 | 音響分析フレーム信頼度計算装置と音響モデル適応装置と音声認識装置とそれらのプログラムと、音響分析フレーム信頼度計算方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5970446A (en) * | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
US6389393B1 (en) * | 1998-04-28 | 2002-05-14 | Texas Instruments Incorporated | Method of adapting speech recognition models for speaker, microphone, and noisy environment |
JP3204654B2 (ja) | 2000-01-14 | 2001-09-04 | 富士技研センター株式会社 | 反射音を考慮した道路騒音の予測方法 |
US7516071B2 (en) * | 2003-06-30 | 2009-04-07 | International Business Machines Corporation | Method of modeling single-enrollment classes in verification and identification tasks |
JP2005031258A (ja) | 2003-07-09 | 2005-02-03 | Canon Inc | 認識モデル学習装置及び方法 |
US8611560B2 (en) * | 2007-04-13 | 2013-12-17 | Navisense | Method and device for voice operated control |
US8050142B2 (en) | 2007-12-06 | 2011-11-01 | Sanyo Electric Co., Ltd. | Sound collection environment deciding device, sound processing device, electronic appliance, sound collection environment deciding method and sound processing method |
JP2011085824A (ja) | 2009-10-19 | 2011-04-28 | Sony Corp | 音響識別装置、その処理方法およびプログラム |
US20130083929A1 (en) | 2011-09-30 | 2013-04-04 | Hitachi, Ltd. | Method for analyzing sound transmission paths in a system |
US9984678B2 (en) * | 2012-03-23 | 2018-05-29 | Microsoft Technology Licensing, Llc | Factored transforms for separable adaptation of acoustic models |
US8768695B2 (en) * | 2012-06-13 | 2014-07-01 | Nuance Communications, Inc. | Channel normalization using recognition feedback |
WO2014018004A1 (en) * | 2012-07-24 | 2014-01-30 | Nuance Communications, Inc. | Feature normalization inputs to front end processing for automatic speech recognition |
US9135915B1 (en) * | 2012-07-26 | 2015-09-15 | Google Inc. | Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors |
US9620116B2 (en) * | 2013-12-24 | 2017-04-11 | Intel Corporation | Performing automated voice operations based on sensor data reflecting sound vibration conditions and motion conditions |
US10313782B2 (en) * | 2017-05-04 | 2019-06-04 | Apple Inc. | Automatic speech recognition triggering system |
JP7103353B2 (ja) * | 2017-05-08 | 2022-07-20 | ソニーグループ株式会社 | 情報処理装置 |
US20190043509A1 (en) * | 2017-08-04 | 2019-02-07 | Cirrus Logic International Semiconductor Ltd. | Audio privacy based on user identification |
US10854186B1 (en) * | 2019-07-22 | 2020-12-01 | Amazon Technologies, Inc. | Processing audio data received from local devices |
US11356783B2 (en) * | 2020-10-02 | 2022-06-07 | Oticon A/S | Hearing device comprising an own voice processor |
-
2018
- 2018-05-15 JP JP2020518850A patent/JP7211419B2/ja active Active
- 2018-05-15 US US17/054,646 patent/US11620985B2/en active Active
- 2018-05-15 WO PCT/JP2018/018740 patent/WO2019220532A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006285103A (ja) | 2005-04-04 | 2006-10-19 | Nissan Motor Co Ltd | 音声認識装置および方法 |
JP2009157337A (ja) | 2007-12-06 | 2009-07-16 | Sanyo Electric Co Ltd | 集音環境判定装置及びそれを備えた電子機器並びに集音環境判定方法 |
JP2015082036A (ja) | 2013-10-23 | 2015-04-27 | 日本電信電話株式会社 | 音響分析フレーム信頼度計算装置と音響モデル適応装置と音声認識装置とそれらのプログラムと、音響分析フレーム信頼度計算方法 |
Non-Patent Citations (2)
Title |
---|
CHU, Selina, et al.,"Environmental Sound Recognition with Time-Frequency Audio Features",IEEE Transactions on Audio, Speech, and Language Processing,2009年06月23日,Vol.17, No.6,pp.1142-1158 |
LI, Jinyu, et al.,"An Overview of Noise-Robust Automatic Speech Recognition",IEEE/ACM Transactions on Audio, Speech, and Language Processing,2014年02月05日,Vol.22, No.4,pp.745-777 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2019220532A1 (ja) | 2021-05-20 |
WO2019220532A1 (ja) | 2019-11-21 |
US20210074268A1 (en) | 2021-03-11 |
US11620985B2 (en) | 2023-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110352349B (zh) | 异常音检测装置、异常度计算装置、异常音生成装置、异常信号检测装置、及其方法、记录介质 | |
CN105810193B (zh) | 训练语言模型的方法和设备及识别语言的方法和设备 | |
EP3142106B1 (en) | Apparatus and method for generating acoustic model, and apparatus and method for speech recognition | |
da Silva et al. | Structural damage detection by fuzzy clustering | |
JP6235938B2 (ja) | 音響イベント識別モデル学習装置、音響イベント検出装置、音響イベント識別モデル学習方法、音響イベント検出方法及びプログラム | |
US10565699B2 (en) | Apparatus and method for detecting anomaly in plant pipe using multiple meta-learning | |
CN110767223B (zh) | 一种单声道鲁棒性的语音关键词实时检测方法 | |
JP6236282B2 (ja) | 異常検出装置、異常検出方法、及びコンピュータ読み取り可能な記憶媒体 | |
JP2010122912A (ja) | 異常判定装置、方法、及びプログラム | |
JP2018529298A (ja) | 環境コンテキストにおいて人間のような制御行動をシミュレーションするためのシステム及びコンピュータに基づく方法。 | |
JP6439682B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
WO2019220620A1 (ja) | 異常検出装置、異常検出方法及びプログラム | |
JP6729577B2 (ja) | 信号検知装置、信号検知方法およびプログラム | |
JP7014295B2 (ja) | 異常検出装置、異常検出方法及びプログラム | |
Zheng et al. | Recursive adaptive algorithms for fast and rapidly time-varying systems | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JP5791081B2 (ja) | 音源分離定位装置、方法、及びプログラム | |
JP7211419B2 (ja) | パターン認識装置、パターン認識方法及びパターン認識プログラム | |
JP2022092827A (ja) | 計算機システム及びデータ処理方法 | |
CN115758237A (zh) | 基于智能巡检机器人的轴承故障分类方法及系统 | |
US11297418B2 (en) | Acoustic signal separation apparatus, learning apparatus, method, and program thereof | |
JP2020030373A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
JP6984744B2 (ja) | 伝搬パス推定装置、伝搬パス推定方法及びプログラム | |
CN114495974B (zh) | 音频信号处理方法 | |
CN115579019A (zh) | 语音分类模型的优化训练方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7211419 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |