JP2011065579A - 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム - Google Patents
標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム Download PDFInfo
- Publication number
- JP2011065579A JP2011065579A JP2009217804A JP2009217804A JP2011065579A JP 2011065579 A JP2011065579 A JP 2011065579A JP 2009217804 A JP2009217804 A JP 2009217804A JP 2009217804 A JP2009217804 A JP 2009217804A JP 2011065579 A JP2011065579 A JP 2011065579A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- data
- model
- identification
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】ラベルあり学習データと、ラベルなし学習データとを用いて、識別モデルと生成モデルとを当該2つのモデルのパラメタ間の乖離に対する罰則項を含んだ制約のもと統合的に学習する識別生成モデル統合学習手段500と、識別生成モデル統合学習手段500に与えられる各ラベルなし学習データに対して、識別生成モデル統合学習手段500により学習された識別モデルと生成モデルのそれぞれによりクラスの識別処理を行い、識別モデルと生成モデルの識別結果の差異に基づいて、追加ラベルの付与の必要度を示すラベル付与基準を算出するラベル付与基準算出手段501とを備える。
【選択図】図5
Description
以下の式(1)に示すように、特徴量xとそのxが属するクラスcが与えられたデータ集合をL、クラスラベル(教師ラベル)が与えられない特徴量の集合をUとし、ラベルあり学習データとしてLを、ラベルなし学習データとしてDをそれぞれ記憶する。なお、以下の式(2)に示すように、全データ集合はLとUの和集合でDとする。
D=L∪U・・・式(2)
また、識別モデルパラメタθ、生成モデルパラメタθ’が与えられた時、特徴量xとクラスcの同時出力確率分布qを、以下の式(3)のように定義する。
式(3)で示したモデルqを用いて、識別モデルと生成モデルの学習を行う。本例では、以下に示す式(7)により、全データ集合Dが与えられた時の尤度が最大となるように、識別モデルパラメタθと生成モデルパラメタθ’を同時最適化する。
110 ラベルあり学習データ記憶部
111 ラベルなし学習データ記憶部
112 識別・生成モデル統合学習部
113 識別モデルパラメタ記憶部
114 生成モデルパラメタ記憶部
115 ラベル付与基準算出部
116 追加ラベル付与基準出力部
117 追加ラベル入力部
118 学習データ更新部
119 標準パタン出力部
500 識別生成モデル統合学習手段
501 ラベル付与基準算出手段
502 ラベルあり学習データ記憶手段
503 ラベルなし学習データ記憶手段
504 学習データ更新手段
505 ラベル付与基準出力手段
506 ラベル情報入力手段
Claims (10)
- 入力されたデータが属するクラスを識別するためのモデルである識別モデルと、クラスラベルに対してデータ出力の確率分布を求めるためのモデルである生成モデルとを用いて導出される、入力されたデータが属するクラスの情報であるクラスラベルに対するデータをモデル化した情報である標準パタンを学習する標準パタン学習装置であって、
学習用に与えられるデータまたはその特徴量であってクラスラベルが付与されたデータまたはその特徴量であるラベルあり学習データと、学習用に与えられるデータまたはその特徴量であってクラスラベルが付与されていないデータまたはその特徴量であるラベルなし学習データとを用いて、識別モデルと生成モデルとを当該2つのモデルのパラメタ間の乖離に対する罰則項を含んだ制約のもと統合的に学習する識別生成モデル統合学習手段と、
前記識別生成モデル統合学習手段に与えられる各ラベルなし学習データに対して、前記識別生成モデル統合学習手段により学習された識別モデルと生成モデルのそれぞれによりクラスの識別処理を行い、前記識別モデルと前記生成モデルの識別結果の差異に基づいて、追加ラベルの付与の必要度を示すラベル付与基準を算出するラベル付与基準算出手段とを備えた
ことを特徴とする標準パタン学習装置。 - ラベル付与基準算出手段は、推定結果が異なるデータについて追加にラベルを付与すべきであるとするラベル付与基準を算出する
請求項1に記載の標準パタン学習装置。 - 学習用に与えられるデータまたはその特徴量のうち、クラスラベルが付与されたデータまたはその特徴量であるラベルあり学習データを記憶するラベルあり学習データ記憶手段と、
学習用に与えられるデータまたはその特徴量のうち、クラスラベルが付与されていないデータまたはその特徴量であるラベルなし学習データを記憶するラベルなし学習データ記憶手段と、
ラベル付与基準算出手段が算出したラベル付与基準に従って追加されたラベルを該当するラベルなし学習データに付与してラベルあり学習データとし、前記ラベルあり学習データ記憶手段および前記ラベルなし学習データ記憶手段の記憶内容を更新する学習データ更新手段とを備え、
識別生成モデル統合学習手段は、前記ラベルなし学習データ記憶手段に記憶されているラベルなし学習データと、前記ラベルあり学習データ記憶手段に記憶されているラベルあり学習データとを用いて、識別モデルと生成モデルとを学習する
請求項1または請求項2に記載の標準パタン学習装置。 - 識別生成モデル統合学習手段は、学習データ更新手段による学習データの更新に応じて、識別モデルと生成モデルの統合学習を繰り返し行う
請求項3に記載の標準パタン学習装置。 - ラベル付与基準算出手段が算出したラベル付与基準の情報をユーザに提示するラベル付与基準出力手段と、
ユーザ操作に応じて、ラベル付与基準に従って追加されるラベルの情報を入力するラベル情報入力手段とを備えた
請求項1から請求項4のうちのいずれか1項に記載の標準パタン学習装置。 - 入力されたデータが属するクラスを識別するためのモデルである識別モデルと、クラスラベルに対してデータ出力の確率分布を求めるためのモデルである生成モデルとを統合的に学習する学習装置に学習用に与えられるデータまたはその特徴量であって、当該データが属するクラスの情報であるクラスラベルが付与されていないデータまたはその特徴量であるラベルなし学習データに対して、前記学習装置によって学習された識別モデルと生成モデルのそれぞれによりクラスの識別処理を行い、前記識別モデルと前記生成モデルの識別結果の差異に基づいて、追加ラベルの付与の必要度を示すラベル付与基準を算出するラベル付与基準算出手段を備えた
ことを特徴とするラベル付与基準算出装置。 - 入力されたデータが属するクラスを識別するためのモデルである識別モデルと、クラスラベルに対してデータ出力の確率分布を求めるためのモデルである生成モデルとを用いて導出される、入力されたデータが属するクラスの情報であるクラスラベルに対するデータをモデル化した情報である標準パタンを学習するための標準パタン学習方法であって、
学習用に与えられるデータまたはその特徴量であってクラスラベルが付与されたデータまたはその特徴量であるラベルあり学習データと、学習用に与えられるデータまたはその特徴量であってクラスラベルが付与されていないデータまたはその特徴量であるラベルなし学習データとを用いて、識別モデルと生成モデルとを当該2つのモデルのパラメタ間の乖離に対する罰則項を含んだ制約のもと統合的に学習し、
前記識別モデルと前記生成モデルの統合学習用に与えられる各ラベルなし学習データに対して、学習結果として得られた前記識別モデルと前記生成モデルのそれぞれによりクラスの識別処理を行い、前記識別モデルと前記生成モデルの識別結果の差異に基づいて、追加ラベルの付与の必要度を示すラベル付与基準を算出する
ことを特徴とする標準パタン学習方法。 - 算出されたラベル付与基準に従って追加されたラベルを該当するラベルなし学習データに付与して、ラベルあり学習データとして更新する
請求項7に記載の標準パタン学習方法。 - 入力されたデータが属するクラスを識別するためのモデルである識別モデルと、クラスラベルに対してデータ出力の確率分布を求めるためのモデルである生成モデルとを用いて導出される、入力されたデータが属するクラスの情報であるクラスラベルに対するデータをモデル化した情報である標準パタンを学習するための標準パタン学習用プログラムであって、
コンピュータに、
学習用に与えられるデータまたはその特徴量であってクラスラベルが付与されたデータまたはその特徴量であるラベルあり学習データと、学習用に与えられるデータまたはその特徴量であってクラスラベルが付与されていないデータまたはその特徴量であるラベルなし学習データとを用いて、識別モデルと生成モデルとを当該2つのモデルのパラメタ間の乖離に対する罰則項を含んだ制約のもと統合的に学習する識別生成モデル統合学習処理と、
前記識別生成モデル統合学習処理に与えられる各ラベルなし学習データに対して、前記識別生成モデル統合学習処理で学習された識別モデルと生成モデルのそれぞれによりクラスの識別処理を行い、前記識別モデルと前記生成モデルの識別結果の差異に基づいて、追加ラベルの付与の必要度を示すラベル付与基準を算出するラベル付与基準算出処理とを
実行させるための標準パタン学習用プログラム。 - コンピュータに、
ラベル付与基準算出処理で算出されたラベル付与基準に従って追加されたラベルを該当するラベルなし学習データに付与して、ラベルあり学習データとして更新する学習データ更新処理を含む
請求項9に記載の標準パタン学習用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009217804A JP5387274B2 (ja) | 2009-09-18 | 2009-09-18 | 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009217804A JP5387274B2 (ja) | 2009-09-18 | 2009-09-18 | 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011065579A true JP2011065579A (ja) | 2011-03-31 |
JP5387274B2 JP5387274B2 (ja) | 2014-01-15 |
Family
ID=43951724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009217804A Active JP5387274B2 (ja) | 2009-09-18 | 2009-09-18 | 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5387274B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013161191A1 (ja) * | 2012-04-26 | 2013-10-31 | 日本電気株式会社 | 保健指導対象者選定条件作成支援装置 |
WO2016084336A1 (ja) * | 2014-11-27 | 2016-06-02 | 日本電気株式会社 | 追学習装置、追学習方法、および、記憶媒体 |
WO2018116921A1 (ja) * | 2016-12-21 | 2018-06-28 | 日本電気株式会社 | 辞書学習装置、辞書学習方法、データ認識方法およびプログラム記憶媒体 |
CN112712795A (zh) * | 2020-12-29 | 2021-04-27 | 北京有竹居网络技术有限公司 | 标注数据确定方法、装置、介质及电子设备 |
JP2021111101A (ja) * | 2020-01-09 | 2021-08-02 | Awl株式会社 | 機械学習システム、学習用データセット生成システム、及び機械学習プログラム |
US11537930B2 (en) | 2013-03-04 | 2022-12-27 | Nec Corporation | Information processing device, information processing method, and program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008225907A (ja) * | 2007-03-13 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 言語解析モデル学習装置、言語解析モデル学習方法、言語解析モデル学習プログラムならびにその記録媒体 |
JP2008292789A (ja) * | 2007-05-25 | 2008-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 |
-
2009
- 2009-09-18 JP JP2009217804A patent/JP5387274B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008225907A (ja) * | 2007-03-13 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 言語解析モデル学習装置、言語解析モデル学習方法、言語解析モデル学習プログラムならびにその記録媒体 |
JP2008292789A (ja) * | 2007-05-25 | 2008-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 |
Non-Patent Citations (4)
Title |
---|
CSNJ201010037041; 岡谷 一宏 他: '共同学習における分類器の合意度を用いた追加データ選択法の提案' 2009年度人工知能学会全国大会(第23回)論文集 1C4-2, 20090619, pp.1-2, 社団法人人工知能学会 * |
JPN6013044186; Julia A. Lasserre et al.: 'Principled Hybrids of Generative and Discriminative Models' Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Vol.1, 20060622, pp.87-94, IEEE * |
JPN6013044189; Tom Minka: 'Discriminative models, not Discriminative training' Technical Report , 20051017, Microsoct Research Cambridge * |
JPN6013044192; 岡谷 一宏 他: '共同学習における分類器の合意度を用いた追加データ選択法の提案' 2009年度人工知能学会全国大会(第23回)論文集 1C4-2, 20090619, pp.1-2, 社団法人人工知能学会 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013161191A1 (ja) * | 2012-04-26 | 2013-10-31 | 日本電気株式会社 | 保健指導対象者選定条件作成支援装置 |
JP5392444B1 (ja) * | 2012-04-26 | 2014-01-22 | 日本電気株式会社 | 保健指導対象者選定条件作成支援装置 |
US11537930B2 (en) | 2013-03-04 | 2022-12-27 | Nec Corporation | Information processing device, information processing method, and program |
WO2016084336A1 (ja) * | 2014-11-27 | 2016-06-02 | 日本電気株式会社 | 追学習装置、追学習方法、および、記憶媒体 |
JPWO2016084336A1 (ja) * | 2014-11-27 | 2017-10-05 | 日本電気株式会社 | 追学習装置、追学習方法、および、追学習プログラム |
WO2018116921A1 (ja) * | 2016-12-21 | 2018-06-28 | 日本電気株式会社 | 辞書学習装置、辞書学習方法、データ認識方法およびプログラム記憶媒体 |
JPWO2018116921A1 (ja) * | 2016-12-21 | 2019-10-31 | 日本電気株式会社 | 辞書学習装置、辞書学習方法、データ認識方法およびコンピュータプログラム |
JP7095599B2 (ja) | 2016-12-21 | 2022-07-05 | 日本電気株式会社 | 辞書学習装置、辞書学習方法、データ認識方法およびコンピュータプログラム |
JP2021111101A (ja) * | 2020-01-09 | 2021-08-02 | Awl株式会社 | 機械学習システム、学習用データセット生成システム、及び機械学習プログラム |
JP7437738B2 (ja) | 2020-01-09 | 2024-02-26 | Awl株式会社 | 機械学習システム、学習用データセット生成システム、及び機械学習プログラム |
CN112712795A (zh) * | 2020-12-29 | 2021-04-27 | 北京有竹居网络技术有限公司 | 标注数据确定方法、装置、介质及电子设备 |
CN112712795B (zh) * | 2020-12-29 | 2024-04-02 | 北京有竹居网络技术有限公司 | 标注数据确定方法、装置、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP5387274B2 (ja) | 2014-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5321596B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
JP6933264B2 (ja) | ラベル生成装置、モデル学習装置、感情認識装置、それらの方法、プログラム、および記録媒体 | |
Somervuo et al. | Parametric representations of bird sounds for automatic species recognition | |
CN104424943B (zh) | 语音处理系统和方法 | |
US10008209B1 (en) | Computer-implemented systems and methods for speaker recognition using a neural network | |
JP5387274B2 (ja) | 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム | |
CN102411931B (zh) | 用于大词汇量连续语音识别的深度信任网络 | |
Dileep et al. | GMM-based intermediate matching kernel for classification of varying length patterns of long duration speech using support vector machines | |
CN108885870A (zh) | 用于通过将言语到文本系统与言语到意图系统组合来实现声音用户接口的系统和方法 | |
CN109196495A (zh) | 细粒度自然语言理解 | |
Williams | Multi-domain learning and generalization in dialog state tracking | |
US20100169093A1 (en) | Information processing apparatus, method and recording medium for generating acoustic model | |
WO2004057574A1 (en) | Sensor based speech recognizer selection, adaptation and combination | |
US11705105B2 (en) | Speech synthesizer for evaluating quality of synthesized speech using artificial intelligence and method of operating the same | |
US11568863B1 (en) | Skill shortlister for natural language processing | |
CN110428803B (zh) | 一种基于发音属性的发音人国别识别模型建模方法及系统 | |
CN114830139A (zh) | 使用模型提供的候选动作训练模型 | |
Yang et al. | Modeling dynamics of expressive body gestures in dyadic interactions | |
Henter et al. | Gaussian process dynamical models for nonparametric speech representation and synthesis | |
JPWO2007105409A1 (ja) | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム | |
Roy et al. | A survey of classification techniques in speech emotion recognition | |
Jeon et al. | Automatic prosodic event detection using a novel labeling and selection method in co-training | |
US10978076B2 (en) | Speaker retrieval device, speaker retrieval method, and computer program product | |
JP2012108429A (ja) | 音声選択装置、発話選択装置、音声選択システム、音声選択方法および音声選択プログラム | |
Sarker et al. | Emotion recognition from speech based on relevant feature and majority voting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130923 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5387274 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |