JP5989576B2 - パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 - Google Patents
パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 Download PDFInfo
- Publication number
- JP5989576B2 JP5989576B2 JP2013045895A JP2013045895A JP5989576B2 JP 5989576 B2 JP5989576 B2 JP 5989576B2 JP 2013045895 A JP2013045895 A JP 2013045895A JP 2013045895 A JP2013045895 A JP 2013045895A JP 5989576 B2 JP5989576 B2 JP 5989576B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- subclass
- input pattern
- identification
- weak classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 67
- 238000003860 storage Methods 0.000 claims description 52
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 11
- 238000013500 data storage Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
従来技術の問題についてさらに説明する。AdaBoostを応用した手法として、最初に、粗い識別器で、顔領域を抽出し、次に正面用、左向き用、および、右向き用に学習しておいた識別器で識別をかけることによって高精度に顔領域を識別する手法が知られている。しかし、この手法は、入力パターンから推測されるサブクラスに対して適用されるものであり、予め入力パターンと共にサブクラス属性が与えられるケースについては考慮されていない。
if MFCC(1)≦30
hN0(x)=−1
else
hN0(x)=1
・・・(1)
SN=αN0hN0(x) ・・・(2)
TsN=TsN−1+SN ・・・(3)
第2の実施形態では、第1の実施形態のパターン識別装置で用いる識別器を学習する学習装置について説明する。図7は、第2の実施形態の学習装置200の機能構成例を示すブロック図である。学習装置200は、学習データ記憶部221と、ルール記憶部222と、弱識別器記憶部223、224と、分割部201と、探索部202と、ルール選択部203と、更新部204と、判定部205と、を備えている。
101 音声入力部
102 出力部
110 認識処理部
111 候補生成部
112 識別部
113 候補選択部
121 記憶部
200 学習装置
201 分割部
202 探索部
203 ルール選択部
204 更新部
205 判定部
221 学習データ記憶部
222 ルール記憶部
223,224 弱識別器記憶部
501 受付部
502 決定部
503 実行部
504 算出部
505 判定部
521 ルール記憶部
522 弱識別器記憶部
523 出力記憶部
Claims (7)
- 複数のサブクラスに分割されるクラスに入力パターンが属するか否かを識別するパターン識別装置であって、
前記入力パターンと、前記入力パターンの属性情報と、を受付ける受付部と、
前記入力パターンが属する前記サブクラスを少なくとも前記属性情報に基づいて決定する決定部と、
決定された前記サブクラスに割り当てられた弱識別器を用いて、前記入力パターンが前記クラスに属するか否かを識別し、識別結果と前記弱識別器の信頼度を出力する実行部と、
前記識別結果および前記信頼度に基づく評価値を積算した積算値を算出する算出部と、
前記決定部、前記実行部、および、前記算出部による識別処理の終了条件が満たされたか否かを判定し、前記終了条件が満たされていない場合は、前記識別処理を繰り返し、前記終了条件が満たされた場合は、前記識別処理を終了し、終了したときの前記積算値を出力する判定部と、
を備えるパターン識別装置。 - 前記決定部は、前記入力パターンと、前記属性情報とに基づいて、前記入力パターンが属する前記サブクラスを決定する、
請求項1に記載のパターン識別装置。 - 音声を入力する音声入力部と、
前記音声に含まれる音素の1以上の候補を生成する候補生成部と、をさらに備え、
前記受付部は、前記候補を入力パターンとして受付け、
前記判定部は、前記積算値に基づいて前記候補が前記クラスに属するか否かを判定し、
前記判定部による判定結果に基づいて、前記候補から1の候補を選択する候補選択部と、をさらに備える、
請求項1に記載のパターン識別装置。 - 複数のサブクラスに分割されるクラスに入力パターンが属するか否かを識別するパターン識別装置で実行されるパターン識別方法であって、
前記入力パターンと、前記入力パターンの属性情報と、を受付ける受付ステップと、
前記入力パターンが属する前記サブクラスを少なくとも前記属性情報に基づいて決定する決定ステップと、
決定された前記サブクラスに割り当てられた弱識別器を用いて、前記入力パターンが前記クラスに属するか否かを識別し、識別結果と前記弱識別器の信頼度を出力する実行ステップと、
前記識別結果および前記信頼度に基づく評価値を積算した積算値を算出する算出ステップと、
前記決定ステップ、前記実行ステップ、および、前記算出ステップによる識別処理の終了条件が満たされたか否かを判定し、前記終了条件が満たされていない場合は、前記識別処理を繰り返し、前記終了条件が満たされた場合は、前記識別処理を終了し、終了したときの前記積算値を出力する判定ステップと、
を含むパターン識別方法。 - 複数のサブクラスに分割されるクラスに入力パターンが属するか否かを識別するパターン識別装置を、
前記入力パターンと、前記入力パターンの属性情報と、を受付ける受付部と、
前記入力パターンが属する前記サブクラスを少なくとも前記属性情報に基づいて決定する決定部と、
決定された前記サブクラスに割り当てられた弱識別器を用いて、前記入力パターンが前記クラスに属するか否かを識別し、識別結果と前記弱識別器の信頼度を出力する実行部と、
前記識別結果および前記信頼度に基づく評価値を積算した積算値を算出する算出部と、
前記決定部、前記実行部、および、前記算出部による識別処理の終了条件が満たされたか否かを判定し、前記終了条件が満たされていない場合は、前記識別処理を繰り返し、前記終了条件が満たされた場合は、前記識別処理を終了し、終了したときの前記積算値を出力する判定部と、
として機能させるためのプログラム。 - 入力パターンの属性情報に基づいて、入力パターンをサブクラスに分割するルールを表す複数の分割ルールを記憶するルール記憶部と、
前記入力パターンと重みとを含む複数の学習データを、前記分割ルールおよび前記属性情報に基づいて複数の前記サブクラスに対応する複数のサブクラスデータに分割する分割部と、
分割された前記サブクラスデータそれぞれに対して、複数の弱識別器のうち、前記サブクラスデータに対する適合度が高い弱識別器を探索する探索部と、
探索された前記弱識別器の信頼度を算出し、複数の前記分割ルールから、前記信頼度が高い前記弱識別器に対応する前記分割ルールを選択するルール選択部と、
選択された前記分割ルールに対応する前記弱識別器の前記信頼度に基づいて前記学習データに含まれる前記重みを更新する更新部と、
を備える学習装置。 - 学習装置で実行される学習方法であって、
前記学習装置は、入力パターンの属性情報に基づいて、入力パターンをサブクラスに分割するルールを表す複数の分割ルールを記憶するルール記憶部を備え、
前記入力パターンと重みとを含む複数の学習データを、前記分割ルールおよび前記属性情報に基づいて複数の前記サブクラスに対応する複数のサブクラスデータに分割する分割ステップと、
分割された前記サブクラスデータそれぞれに対して、複数の弱識別器のうち、前記サブクラスデータに対する適合度が高い弱識別器を探索する探索ステップと、
探索された前記弱識別器の信頼度を算出し、複数の前記分割ルールから、前記信頼度が高い前記弱識別器に対応する前記分割ルールを選択するルール選択ステップと、
選択された前記分割ルールに対応する前記弱識別器の前記信頼度に基づいて前記学習データに含まれる前記重みを更新する更新ステップと、
を含む学習方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013045895A JP5989576B2 (ja) | 2013-03-07 | 2013-03-07 | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 |
US14/162,888 US9330662B2 (en) | 2013-03-07 | 2014-01-24 | Pattern classifier device, pattern classifying method, computer program product, learning device, and learning method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013045895A JP5989576B2 (ja) | 2013-03-07 | 2013-03-07 | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014174693A JP2014174693A (ja) | 2014-09-22 |
JP5989576B2 true JP5989576B2 (ja) | 2016-09-07 |
Family
ID=51488931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013045895A Active JP5989576B2 (ja) | 2013-03-07 | 2013-03-07 | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9330662B2 (ja) |
JP (1) | JP5989576B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9171259B1 (en) * | 2015-01-12 | 2015-10-27 | Bank Of America Corporation | Enhancing classification and prediction using predictive modeling |
US9280740B1 (en) * | 2015-01-12 | 2016-03-08 | Bank Of America Corporation | Transforming predictive models |
JP6859247B2 (ja) * | 2017-10-26 | 2021-04-14 | 日本電信電話株式会社 | 学習装置、分析システム、学習方法および学習プログラム |
CN111652281B (zh) * | 2020-04-30 | 2023-08-18 | 中国平安财产保险股份有限公司 | 信息数据的分类方法、装置及可读存储介质 |
CN112750448B (zh) * | 2020-08-07 | 2024-01-16 | 腾讯科技(深圳)有限公司 | 声音场景的识别方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5394959B2 (ja) * | 2010-03-23 | 2014-01-22 | 富士フイルム株式会社 | 判別器生成装置および方法並びにプログラム |
-
2013
- 2013-03-07 JP JP2013045895A patent/JP5989576B2/ja active Active
-
2014
- 2014-01-24 US US14/162,888 patent/US9330662B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20140257810A1 (en) | 2014-09-11 |
JP2014174693A (ja) | 2014-09-22 |
US9330662B2 (en) | 2016-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10002290B2 (en) | Learning device and learning method for object detection | |
CN107180084B (zh) | 词库更新方法及装置 | |
JP5989576B2 (ja) | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 | |
CN107229627B (zh) | 一种文本处理方法、装置及计算设备 | |
JP2008175955A (ja) | インデキシング装置、方法及びプログラム | |
US20180005087A1 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
JP2020053073A (ja) | 学習方法、学習システム、および学習プログラム | |
JP6004015B2 (ja) | 学習方法、情報処理装置および学習プログラム | |
JP2010181884A (ja) | 隠れマルコフモデル作成プログラム、情報記憶媒体、隠れマルコフモデル作成システム、音声認識システム及び音声認識方法 | |
JP4039708B2 (ja) | パターン認識方法およびパターン認識装置 | |
JP4802176B2 (ja) | パターン認識装置、パターン認識プログラム及びパターン認識方法 | |
WO2016181474A1 (ja) | パターン認識装置、パターン認識方法およびプログラム | |
CN117334186A (zh) | 一种基于机器学习的语音识别方法及nlp平台 | |
US10891942B2 (en) | Uncertainty measure of a mixture-model based pattern classifer | |
Dileep et al. | Speaker recognition using pyramid match kernel based support vector machines | |
JP4533160B2 (ja) | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 | |
JP2016062249A (ja) | 識別辞書学習システム、認識辞書学習方法および認識辞書学習プログラム | |
Viszlay et al. | Alternative phonetic class definition in linear discriminant analysis of speech | |
CN114333840A (zh) | 语音鉴别方法及相关装置、电子设备和存储介质 | |
WO2020183807A1 (ja) | 情報処理方法、および、情報処理システム | |
CN113807377A (zh) | 信息处理装置、信息处理方法和计算机可读存储介质 | |
JP6235368B2 (ja) | パターン認識装置、パターン認識方法およびプログラム | |
JP4226942B2 (ja) | アクセント位置推定方法、装置およびプログラム | |
Matton et al. | A discriminative locally weighted distance measure for speaker independent template based speech recognition. | |
CN109146002B (zh) | 一种gmm识别器的快速识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150914 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20151102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160810 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5989576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |