JP5229478B2 - 統計モデル学習装置、統計モデル学習方法、およびプログラム - Google Patents
統計モデル学習装置、統計モデル学習方法、およびプログラム Download PDFInfo
- Publication number
- JP5229478B2 JP5229478B2 JP2008331530A JP2008331530A JP5229478B2 JP 5229478 B2 JP5229478 B2 JP 5229478B2 JP 2008331530 A JP2008331530 A JP 2008331530A JP 2008331530 A JP2008331530 A JP 2008331530A JP 5229478 B2 JP5229478 B2 JP 5229478B2
- Authority
- JP
- Japan
- Prior art keywords
- statistical model
- data
- learning
- learning data
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
前記複数の学習データセットそれぞれ毎に統計モデルを構築する統計モデル構築部と、
前記統計モデルの構築後に、前記複数の学習データセットそれぞれから、一部のデータをランダムに取り出す学習データ取出部と、
取り出された一部のデータを、再度、前記複数の学習データセットそれぞれに、ランダムに分配する学習データ分配部とを備え、
前記統計モデル構築部は、前記学習データ分配部による分配後に、前記取り出された一部のデータが分配された、前記複数の学習データセットそれぞれ毎に、再度、統計モデルを構築する、ことを特徴とする。
(a)前記複数の学習データセットそれぞれ毎に統計モデルを構築するステップと、
(b)前記(a)のステップによる前記統計モデルの構築後に、前記複数の学習データセットそれぞれから、一部のデータをランダムに取り出すステップと、
(c)前記(b)のステップで取り出された一部のデータを、再度、前記複数の学習データセットそれぞれに、ランダムに分配するステップと、
(d)前記(c)のステップの実行後に、前記(b)のステップで取り出された一部のデータが分配された、前記複数の学習データセットそれぞれ毎に、再度、統計モデルを構築するステップとを有する、ことを特徴とする。
前記コンピュータに、
(a)前記複数の学習データセットそれぞれ毎に統計モデルを構築するステップと、
(b)前記(a)のステップによる前記統計モデルの構築後に、前記複数の学習データセットそれぞれから、一部のデータをランダムに取り出すステップと、
(c)前記(b)のステップで取り出された一部のデータを、再度、前記複数の学習データセットそれぞれに、ランダムに分配するステップと、
(d)前記(c)のステップの実行後に、前記(b)のステップで取り出された一部のデータが分配された、前記複数の学習データセットそれぞれ毎に、再度、統計モデルを構築するステップとを実行させる、ことを特徴とする。
以下、本発明の実施の形態1における統計モデル学習装置、統計モデル学習方法、及びプログラムについて、図1〜図3を参照しながら説明する。最初に、図1及び図2を用いて、本実施の形態1における統計モデル学習装置の概略構成について説明する。図1は、本発明の実施の形態1における統計モデル学習装置の概略構成を示すブロック図である。図2は、本発明の実施の形態1における統計モデル学習装置の他の例の概略構成を示すブロック図である。
次に、本発明の実施の形態2における統計モデル学習装置、統計モデル学習方法、及びプログラムについて、図4及び図5を参照して詳細に説明する。最初に、図4を用いて、本実施の形態2における統計モデル学習装置の概略構成について説明する。図4は、本発明の実施の形態2における統計モデル学習装置の概略構成を示すブロック図である。
次に、本発明の実施の形態3における統計モデル学習装置、統計モデル学習方法、及びプログラムについて、図6及び図7を参照して詳細に説明する。最初に、図6を用いて、本実施の形態3における統計モデル学習装置の概略構成について説明する。図6は、本発明の実施の形態3における統計モデル学習装置の概略構成を示すブロック図である。
2 データ処理装置
10 学習データ記憶部
11 学習データ記憶部
11−1〜11−N 学習データ記憶部
12 統計モデル記憶部
12−1〜12−N 統計モデル記憶部
13 評価データ記憶部
14 十分統計量記憶部
14−1〜14−N 十分統計量記憶部
21 統計モデル構築部
22 評価部
23 収束判定部
24 学習データ取出部
25 学習データ分配部
26 統計モデル選択部
28 統計モデル合成部
29 学習データ置換部
Claims (21)
- 複数の学習データセットに分割された学習データに基づいて統計モデルを学習する統計モデル学習装置であって、
前記複数の学習データセットそれぞれ毎に統計モデルを構築する統計モデル構築部と、
前記統計モデルの構築後に、前記複数の学習データセットそれぞれから、一部のデータをランダムに取り出す学習データ取出部と、
取り出された一部のデータを、再度、前記複数の学習データセットそれぞれに、ランダムに分配する学習データ分配部とを備え、
前記統計モデル構築部は、前記学習データ分配部による分配後に、前記取り出された一部のデータが分配された、前記複数の学習データセットそれぞれ毎に、再度、統計モデルを構築する、ことを特徴とする統計モデル学習装置。 - 予め設定された評価データに基づいて、前記各統計モデルに対して評価を行う評価部を更に備え、
前記学習データ取出部が、前記複数の学習データセットそれぞれ毎に、各学習データセットに対応する統計モデルの前記評価に応じて、取り出されるデータの量を算出し、算出した量のデータをランダムに取り出す、請求項1に記載の統計モデル学習装置。 - 統計モデル選択部を更に備え、
前記統計モデル選択部は、前記各統計モデルの前記評価が設定された状態に達したときに、前記各統計モデルの中から、前記評価が最も高い統計モデルを選択する、請求項2に記載の統計モデル学習装置。 - 統計モデル合成部を更に備え、
前記統計モデル構築部が、更に、前記複数の学習データセットそれぞれ毎に、十分統計量を算出し、
前記統計モデル合成部は、前記各統計モデルの前記評価が設定された状態に達したときに、前記評価に応じた重み付けに基づいて、前記各十分統計量を統合し、これによって、一つの新たな統計モデルを合成する、請求項2に記載の統計モデル学習装置。 - 前記学習データ取出部が、前記評価が低い程、取り出されるデータの量が大きくなる関数を用いて、取り出されるデータの量を算出する、請求項2に記載の統計モデル学習装置。
- 学習データ置換部を更に備え、
前記学習データ置換部は、前記学習データ分配部による分配が行われた学習データセットの一部のデータと、他の学習データセットの一部のデータとを、予め設定された確率に基づいて入れ替える、請求項1から請求項5のいずれかに記載の統計モデル学習装置。 - 前記学習データが音声データ、顔画像データ、又は文字画像データであり、
前記モデル構築部が、前記統計モデルとして、音響モデル、顔モデル、又は文字モデルを構築する、請求項1から請求項6のいずれかに記載の統計モデル学習装置。 - 複数の学習データセットに分割された学習データに基づいて統計モデルを学習するための統計モデル学習方法であって、
(a)前記複数の学習データセットそれぞれ毎に統計モデルを構築するステップと、
(b)前記(a)のステップによる前記統計モデルの構築後に、前記複数の学習データセットそれぞれから、一部のデータをランダムに取り出すステップと、
(c)前記(b)のステップで取り出された一部のデータを、再度、前記複数の学習データセットそれぞれに、ランダムに分配するステップと、
(d)前記(c)のステップの実行後に、前記(b)のステップで取り出された一部のデータが分配された、前記複数の学習データセットそれぞれ毎に、再度、統計モデルを構築するステップとを有する、ことを特徴とする統計モデル学習方法。 - (e)予め設定された評価データに基づいて、前記各統計モデルに対して評価を行うステップを更に有し、
前記(b)のステップにおいて、前記複数の学習データセットそれぞれ毎に、各学習データセットに対応する統計モデルの、前記(e)のステップで取得された前記評価に応じて、取り出されるデータの量を算出し、算出した量のデータをランダムに取り出す、請求項8に記載の統計モデル学習方法。 - (f)前記(e)のステップで取得された、前記各統計モデルの前記評価が、設定された状態に達したときに、前記各統計モデルの中から、前記評価が最も高い統計モデルを選択するステップを更に有する、請求項9に記載の統計モデル学習方法。
- 前記(a)の工程において、更に、前記複数の学習データセットそれぞれ毎に、十分統計量を算出し、そして、
(g)前記(e)のステップで取得された、前記各統計モデルの前記評価が、設定された状態に達したときに、前記評価に応じた重み付けに基づいて、前記(a)のステップで算出された各十分統計量を統合し、これによって、一つの新たな統計モデルを合成するステップを更に有する、請求項9に記載の統計モデル学習方法。 - 前記(b)のステップにおいて、前記評価が低い程、取り出されるデータの量が大きくなる関数を用いて、取り出されるデータの量を算出する、請求項9に記載の統計モデル学習方法。
- (h)前記(c)のステップによる分配が行われた学習データセットの一部のデータと、他の学習データセットの一部のデータとを、予め設定された確率に基づいて入れ替えるステップを更に有する、請求項8から請求項12のいずれかに記載の統計モデル学習方法。
- 前記学習データが音声データ、顔画像データ、又は文字画像データであり、
前記(a)のステップにおいて、前記統計モデルとして、音響モデル、顔モデル、又は文字モデルを構築する、請求項8から請求項13のいずれかに記載の統計モデル学習方法。 - 複数の学習データセットに分割された学習データに基づいて統計モデルを、コンピュータに、学習させるためのプログラムであって、
前記コンピュータに、
(a)前記複数の学習データセットそれぞれ毎に統計モデルを構築するステップと、
(b)前記(a)のステップによる前記統計モデルの構築後に、前記複数の学習データセットそれぞれから、一部のデータをランダムに取り出すステップと、
(c)前記(b)のステップで取り出された一部のデータを、再度、前記複数の学習データセットそれぞれに、ランダムに分配するステップと、
(d)前記(c)のステップの実行後に、前記(b)のステップで取り出された一部のデータが分配された、前記複数の学習データセットそれぞれ毎に、再度、統計モデルを構築するステップとを実行させる、ことを特徴とするプログラム。 - (e)予め設定された評価データに基づいて、前記各統計モデルに対して評価を行うステップを更に前記コンピュータに実行させ、
前記(b)のステップにおいて、前記複数の学習データセットそれぞれ毎に、各学習データセットに対応する統計モデルの、前記(e)のステップで取得された前記評価に応じて、取り出されるデータの量を算出し、算出した量のデータをランダムに取り出す、請求項15に記載のプログラム。 - (f)前記(e)のステップで取得された、前記各統計モデルの前記評価が、設定された状態に達したときに、前記各統計モデルの中から、前記評価が最も高い統計モデルを選択するステップを更に前記コンピュータに実行させる、請求項16に記載のプログラム。
- 前記(a)の工程において、更に、前記複数の学習データセットそれぞれ毎に、十分統計量を算出し、そして、
(g)前記(e)のステップで取得された、前記各統計モデルの前記評価が、設定された状態に達したときに、前記評価に応じた重み付けに基づいて、前記(a)のステップで算出された各十分統計量を統合し、これによって、一つの新たな統計モデルを合成するステップを更に前記コンピュータに実行させる、請求項16に記載のプログラム。 - 前記(b)のステップにおいて、前記評価が低い程、取り出されるデータの量が大きくなる関数を用いて、取り出されるデータの量を算出する、請求項16に記載のプログラム。
- (h)前記(c)のステップによる分配が行われた学習データセットの一部のデータと、他の学習データセットの一部のデータとを、予め設定された確率に基づいて入れ替えるステップを更に前記コンピュータに実行させる、請求項15から請求項19のいずれかに記載のプログラム。
- 前記学習データが音声データ、顔画像データ、又は文字画像データであり、
前記(a)のステップにおいて、前記統計モデルとして、音響モデル、顔モデル、又は文字モデルを構築する、請求項15から請求項20のいずれかに記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008331530A JP5229478B2 (ja) | 2008-12-25 | 2008-12-25 | 統計モデル学習装置、統計モデル学習方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008331530A JP5229478B2 (ja) | 2008-12-25 | 2008-12-25 | 統計モデル学習装置、統計モデル学習方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010152751A JP2010152751A (ja) | 2010-07-08 |
JP5229478B2 true JP5229478B2 (ja) | 2013-07-03 |
Family
ID=42571744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008331530A Active JP5229478B2 (ja) | 2008-12-25 | 2008-12-25 | 統計モデル学習装置、統計モデル学習方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5229478B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5656946B2 (ja) * | 2012-09-27 | 2015-01-21 | 株式会社東芝 | データ分析装置及びプログラム |
US9679224B2 (en) * | 2013-06-28 | 2017-06-13 | Cognex Corporation | Semi-supervised method for training multiple pattern recognition and registration tool models |
US9336770B2 (en) | 2013-08-13 | 2016-05-10 | Mitsubishi Electric Corporation | Pattern recognition apparatus for creating multiple systems and combining the multiple systems to improve recognition performance and pattern recognition method |
CN105095755A (zh) * | 2015-06-15 | 2015-11-25 | 安一恒通(北京)科技有限公司 | 文件识别方法和装置 |
BR112020022270A2 (pt) | 2018-05-14 | 2021-02-23 | Quantum-Si Incorporated | sistemas e métodos para unificar modelos estatísticos para diferentes modalidades de dados |
US11967436B2 (en) | 2018-05-30 | 2024-04-23 | Quantum-Si Incorporated | Methods and apparatus for making biological predictions using a trained multi-modal statistical model |
EP3803884A2 (en) * | 2018-05-30 | 2021-04-14 | Quantum-Si Incorporated | Methods and apparatus for multi-modal prediction using a trained statistical model |
US11971963B2 (en) | 2018-05-30 | 2024-04-30 | Quantum-Si Incorporated | Methods and apparatus for multi-modal prediction using a trained statistical model |
JP7095467B2 (ja) * | 2018-08-01 | 2022-07-05 | 株式会社デンソー | 訓練データ評価装置、訓練データ評価方法、およびプログラム |
JP7176285B2 (ja) * | 2018-08-08 | 2022-11-22 | 株式会社デンソー | 訓練データ評価装置、訓練データ評価方法、およびプログラム |
US11257001B2 (en) | 2018-10-09 | 2022-02-22 | International Business Machines Corporation | Prediction model enhancement |
CN109492675B (zh) * | 2018-10-22 | 2021-02-05 | 深圳前海达闼云端智能科技有限公司 | 医学影像的识别方法、装置、存储介质和电子设备 |
JP7075056B2 (ja) * | 2018-12-27 | 2022-05-25 | オムロン株式会社 | 画像判定装置、画像判定方法及び画像判定プログラム |
CN110909761B (zh) * | 2019-10-12 | 2024-08-02 | 平安科技(深圳)有限公司 | 图像识别方法、装置、计算机设备及存储介质 |
WO2021074973A1 (ja) * | 2019-10-15 | 2021-04-22 | 日本電気株式会社 | モデル生成方法、モデル生成装置、プログラム |
JP7452149B2 (ja) * | 2020-03-20 | 2024-03-19 | 株式会社アイシン | ブロックノイズ検出の為の学習装置及びコンピュータプログラム |
KR20220104432A (ko) * | 2021-01-18 | 2022-07-26 | 한국전자통신연구원 | 음성인식을 위한 반자동 정제-음성데이터 추출 및 전사 데이터 생성 방법 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3559334B2 (ja) * | 1995-01-17 | 2004-09-02 | 富士通株式会社 | 最適化問題解法装置 |
JP2005242803A (ja) * | 2004-02-27 | 2005-09-08 | Mitsubishi Heavy Ind Ltd | 機械の性能推定器、性能推定方法及び性能推定プログラム |
JP2006330935A (ja) * | 2005-05-24 | 2006-12-07 | Fujitsu Ltd | 学習データ作成プログラム、学習データ作成方法および学習データ作成装置 |
JP4571922B2 (ja) * | 2006-03-17 | 2010-10-27 | 日本電信電話株式会社 | 音響モデル作成装置、音響モデル作成方法、そのプログラムおよびその記録媒体 |
JP2008250856A (ja) * | 2007-03-30 | 2008-10-16 | Sony Corp | 学習装置、学習方法、及びプログラム |
-
2008
- 2008-12-25 JP JP2008331530A patent/JP5229478B2/ja active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11455864B2 (en) | 2018-07-25 | 2022-09-27 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US12106630B2 (en) | 2018-07-25 | 2024-10-01 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Also Published As
Publication number | Publication date |
---|---|
JP2010152751A (ja) | 2010-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5229478B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
US9536525B2 (en) | Speaker indexing device and speaker indexing method | |
JP5229219B2 (ja) | 話者選択装置、話者適応モデル作成装置、話者選択方法、話者選択用プログラムおよび話者適応モデル作成プログラム | |
US8290773B2 (en) | Information processing apparatus, method and recording medium for generating acoustic model | |
JP3933750B2 (ja) | 連続密度ヒドンマルコフモデルを用いた音声認識方法及び装置 | |
KR101153078B1 (ko) | 음성 분류 및 음성 인식을 위한 은닉 조건부 랜덤 필드모델 | |
JP7342915B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP2012037619A (ja) | 話者適応化装置、話者適応化方法および話者適応化用プログラム | |
EP1465154B1 (en) | Method of speech recognition using variational inference with switching state space models | |
CN112017694B (zh) | 语音数据的评测方法和装置、存储介质和电子装置 | |
KR20040068023A (ko) | 은닉 궤적 은닉 마르코프 모델을 이용한 음성 인식 방법 | |
JPWO2007105409A1 (ja) | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム | |
CN113674733A (zh) | 用于说话时间估计的方法和设备 | |
Herbig et al. | Self-learning speaker identification for enhanced speech recognition | |
US20060074657A1 (en) | Transformation and combination of hidden Markov models for speaker selection training | |
JP2009086581A (ja) | 音声認識の話者モデルを作成する装置およびプログラム | |
JP4829871B2 (ja) | 学習データ選択装置、学習データ選択方法、プログラムおよび記録媒体、音響モデル作成装置、音響モデル作成方法、プログラムおよび記録媒体 | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
JP2007078943A (ja) | 音響スコア計算プログラム | |
JP2006201265A (ja) | 音声認識装置 | |
KR100915638B1 (ko) | 고속 음성 인식 방법 및 시스템 | |
JP4861941B2 (ja) | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム | |
JP5914119B2 (ja) | 音響モデル性能評価装置とその方法とプログラム | |
JP2004117503A (ja) | 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置 | |
JP5315976B2 (ja) | 音声認識装置、音声認識方法、および、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130305 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5229478 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |