JP6662301B2 - 学習装置、識別器、学習方法およびプログラム - Google Patents
学習装置、識別器、学習方法およびプログラム Download PDFInfo
- Publication number
- JP6662301B2 JP6662301B2 JP2016568362A JP2016568362A JP6662301B2 JP 6662301 B2 JP6662301 B2 JP 6662301B2 JP 2016568362 A JP2016568362 A JP 2016568362A JP 2016568362 A JP2016568362 A JP 2016568362A JP 6662301 B2 JP6662301 B2 JP 6662301B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- labeled
- sample
- loss
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
本発明の第1の実施の形態について、図面を参照して詳細に説明する。図1は、本実施の形態に係る学習装置100の機能構成の一例を示す機能ブロック図である。なお、図面中の矢印の方向は、一例を示すものであり、ブロック間の信号の向きを限定するものではない。以降に参照する、他のブロック図においても同様に、図面中の矢印の方向は、一例を示すものであり、ブロック間の信号の向きを限定するものではない。図1に示す通り、本実施の形態に係る学習装置100は、選択部101と、取得部102と、更新部103と、算出部104と、比較部(判定部)105と、出力部106と、記憶部107とを備えている。
算出部104は、損失LNの算出に用いるラベル有サンプルの数Nを、記憶部107に格納されたラベル有サンプルの数を数えることにより、取得してもよいし、取得部102から更新部103を介して取得するものであってもよい。
次に、本実施の形態に係る学習装置100の処理の流れについて説明する。図5は、本実施の形態に係る学習装置100の処理の流れの一例を示すフローチャートである。
本実施の形態に係る学習装置100によれば、学習のための工数および処理時間をより改善することができる。
本実施の形態に係る学習装置100の比較部105が比較する損失の変形例について説明する。比較部105は、算出部104から、損失LNを受け取ると、該損失LNを含む1以上の損失(LN、LN−1、・・・、LN−h(hはNより小さい任意の自然数))の平均を算出し、該平均をLnewとしてもよい。また、比較部105は、以前に算出された損失のうち、上記Lnewを算出する際に使用していない損失(LN−h−1、LN−h−2、・・・、LN−h−p(pはN−hより小さい任意の自然数))の平均を算出し、該平均をLoldとしてもよい。そして、比較部105は、上記LoldとLnewとを比較してもよい。
次に、本発明の第2の実施の形態について説明する。前述した第1の実施の形態では、学習装置100の比較部105は、N個のラベル有サンプルに対する損失と、以前に算出された(N−1)個のラベル有サンプルに対する損失とを比較した。しかしながら、比較部105が比較する損失はこれに限定されるものではない。本実施の形態では、比較部105の動作の他の例について説明する。なお、説明の便宜上、前述した第1の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
次に、本実施の形態に係る学習装置200の処理の流れについて説明する。図7は、本実施の形態に係る学習装置200の処理の流れの一例を示すフローチャートである。
本発明の第3の実施の形態について、図面を参照して説明する。本実施の形態では、本発明の課題を解決する最小の構成について説明を行う。図8は、本実施の形態に係る学習装置300の機能構成の一例を示す機能ブロック図である。
次に、図9を参照して、上述した各実施の形態に係る学習装置(100、200、300)を含むシステムの構成について説明する。図9は、各実施の形態に係る学習装置(100、200、300)を含むシステムの構成の一例を示す図である。
ここで、上述した各実施の形態に係る学習装置(100、200、300)を実現可能なハードウェアの構成例について説明する。上述した学習装置(100、200、300)は、専用の装置として実現してもよいが、コンピュータ(情報処理装置)を用いて実現してもよい。
・CPU(Central Processing Unit)11、
・通信インタフェース(I/F)12、入出力ユーザインタフェース13、
・ROM(Read Only Memory)14、
・RAM(Random Access Memory)15、
・記憶装置17、及び
・コンピュータ読み取り可能な記憶媒体19のドライブ装置18。
また、これらはバス16を介して接続されている。入出力ユーザインタフェース13は、入力デバイスの一例であるキーボードや、出力デバイスとしてのディスプレイ等のマンマシンインタフェースである。通信インタフェース12は、上述した各実施の形態に係る装置(図1、図6および図8)が、外部装置と、通信ネットワーク20を介して通信するための一般的な通信手段である。係るハードウェア構成において、CPU11は、各実施の形態に係る学習装置(100、200、300)を実現する情報処理装置10について、全体の動作を司る。
・CD(Compact Disc)−ROM、フラッシュメモリ等のコンピュータ読み取り可能な各種の記録媒体(19)を介して当該装置内にインストールする方法、
・インターネット等の通信回線(20)を介して外部よりダウンロードする方法。
そして、このような場合において、本発明の各実施の形態は、係るコンピュータプログラムを構成するコード(プログラム群17A)或いは係るコードが格納された記憶媒体(19)によって構成されると捉えることができる。
101 選択部
102 取得部
103 更新部
104 算出部
105 比較部
106 出力部
107 記憶部
200 学習装置
205 比較部
300 学習装置
303 更新部
304 算出部
305 判定部
1 識別器
Claims (10)
- 識別器に用いる辞書を更新する更新手段と、
前記更新手段によって更新された辞書と、1以上のサンプルであって、ラベルが付与されたラベル付きサンプルとを用いて、前記ラベル付きサンプルの数に対する比を、該ラベル付きサンプル全体に対する損失として算出する算出手段と、
前記損失を用いて、前記辞書の更新を行うか否かの判定を行う判定手段と、を備え、
前記更新手段は、前記判定手段によって前記辞書の更新を行うと判定された場合、新たなラベル付きサンプルを加えた前記ラベル付きサンプルを用いて、前記辞書を更新し、
前記判定手段は、前記更新された辞書を用いて算出された損失と、更新前の前記辞書を用いて前記新たなラベル付きサンプルを加える前の前記ラベル付きサンプル全体に対して算出された損失と、を用いて、前記辞書の更新を行うか否かの判定を行う、ことを特徴とする学習装置。 - 前記判定手段は、前記更新された辞書を用いて算出された損失が、前記ラベル付きサンプルの数に反比例して減少している場合に、前記辞書の更新を行わないと判定する、ことを特徴とする請求項1に記載の学習装置。
- 前記判定手段は、前記更新された辞書を用いて算出された損失が、前記ラベル付きサンプルの数が一つ少ない数のときに前記算出手段が算出した過去の損失より小さい場合に、前記辞書の更新を行わないと判定する、ことを特徴とする請求項2に記載の学習装置。
- 前記判定手段は、前記更新された辞書を用いて算出された損失および所定数の過去の損失の平均が、前記所定数の過去の損失を算出するより更に前に、前記算出手段が算出した所定数の損失の平均より小さい場合に、前記辞書の更新を行わないと判定する、ことを特徴とする請求項2に記載の学習装置。
- 前記判定手段は、前記ラベル付きサンプルの数の、該ラベル付きサンプルの数が所定数少ない第1のサンプル数に対する比と、前記ラベル付きサンプル全体に対する損失に対する、前記ラベル付きサンプルの数が前記第1のサンプル数の際の損失の比との、相関関数を算出し、前記相関関数が所定の閾値より大きい場合、前記辞書の更新を行わないと判定する、ことを特徴とする請求項2に記載の学習装置。
- ラベルが付与されていないサンプルのうち、正解クラスではないクラスに判別されやすいサンプルを、ラベルを付与する対象のサンプルとして選択する選択手段と、
前記選択手段によって選択された前記ラベルを付与する対象のサンプルに対してラベルが付与されると、前記ラベルを付与する対象のサンプルを含む、前記ラベル付きサンプルを取得する取得手段と、を更に備え、
前記更新手段は、前記取得手段が取得した前記ラベル付きサンプルを用いて、前記辞書を更新する、ことを特徴とする請求項1から5の何れか1項に記載の学習装置。 - 前記判定手段が、前記辞書の更新を行わないと判定したとき、該辞書を出力する出力手段を更に備えることを特徴とする、請求項1から6の何れか1項に記載の学習装置。
- 請求項1から7の何れか1項に記載の学習装置において更新を行わないと判定された前記辞書を用いて、データの識別を行うことを特徴とする識別器。
- 識別器に用いる辞書を更新し、
前記更新された辞書と、1以上のサンプルであって、ラベルが付与されたラベル付きサンプルとを用いて、前記ラベル付きサンプルの数に対する比を、該ラベル付きサンプル全体に対する損失として算出し、
前記損失を用いて、前記辞書の更新を行うか否かの判定を行い、
前記辞書の更新を行うと判定された場合に、新たな前記ラベル付きサンプルを加えたラベル付きサンプルを用いて、前記辞書を更新し、
前記更新された辞書と、前記新たなラベル付きサンプルを加えた前記ラベル付きサンプルとを用いて、前記ラベル付きサンプルの数に対する比を、該ラベル付きサンプル全体に対する損失として算出し、
前記更新された辞書を用いて算出された損失と、更新前の前記辞書を用いて前記新たなラベル付きサンプルを加える前の前記ラベル付きサンプル全体に対して算出された損失と、を用いて、前記辞書の更新を行うか否かの判定を行う、ことを特徴とする学習方法。 - 識別器に用いる辞書を更新する処理と、
前記更新された辞書と、1以上のサンプルであって、ラベルが付与されたラベル付きサンプルとを用いて、前記ラベル付きサンプルの数に対する比を、該ラベル付きサンプル全体に対する損失として算出する処理と、
前記損失を用いて、前記辞書の更新を行うか否かの判定を行う処理と、をコンピュータに実行させ、
前記辞書を更新する処理は、前記辞書の更新を行うと判定された場合、新たな前記ラベル付きサンプルを加えた前記ラベル付きサンプルを用いて、前記辞書を更新する処理であり、
前記辞書の更新を行うか否かの判定を行う処理は、前記更新された辞書を用いて算出された損失と、更新前の前記辞書を用いて前記新たなラベル付きサンプルを加える前の前記ラベル付きサンプル全体に対して算出された損失と、を用いて、前記辞書の更新を行うか否かの判定を行う処理であるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015001271 | 2015-01-07 | ||
JP2015001271 | 2015-01-07 | ||
PCT/JP2016/000015 WO2016111241A1 (ja) | 2015-01-07 | 2016-01-05 | 学習装置、識別器、学習方法および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016111241A1 JPWO2016111241A1 (ja) | 2017-10-12 |
JP6662301B2 true JP6662301B2 (ja) | 2020-03-11 |
Family
ID=56355934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016568362A Active JP6662301B2 (ja) | 2015-01-07 | 2016-01-05 | 学習装置、識別器、学習方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11631025B2 (ja) |
JP (1) | JP6662301B2 (ja) |
WO (1) | WO2016111241A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7213138B2 (ja) * | 2019-05-10 | 2023-01-26 | 株式会社日立システムズ | 学習データ作成支援システムおよび学習データ作成支援方法 |
US12050866B2 (en) * | 2020-12-13 | 2024-07-30 | International Business Machines Corporation | Maintenance of a data glossary |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060112028A1 (en) * | 2004-11-24 | 2006-05-25 | Weimin Xiao | Neural Network and Method of Training |
WO2008047835A1 (fr) | 2006-10-19 | 2008-04-24 | Nec Corporation | Système, procédé et programme d'étude active |
US7925505B2 (en) * | 2007-04-10 | 2011-04-12 | Microsoft Corporation | Adaptation of language models and context free grammar in speech recognition |
US8219511B2 (en) * | 2009-02-24 | 2012-07-10 | Microsoft Corporation | Unbiased active learning |
US8499008B2 (en) * | 2009-07-24 | 2013-07-30 | Yahoo! Inc. | Mixing knowledge sources with auto learning for improved entity extraction |
JP2011203991A (ja) | 2010-03-25 | 2011-10-13 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
WO2014136316A1 (ja) * | 2013-03-04 | 2014-09-12 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US9122681B2 (en) | 2013-03-15 | 2015-09-01 | Gordon Villy Cormack | Systems and methods for classifying electronic information using advanced active learning techniques |
US9892238B2 (en) * | 2013-06-07 | 2018-02-13 | Scientific Design Company, Inc. | System and method for monitoring a process |
-
2016
- 2016-01-05 JP JP2016568362A patent/JP6662301B2/ja active Active
- 2016-01-05 WO PCT/JP2016/000015 patent/WO2016111241A1/ja active Application Filing
- 2016-01-05 US US15/536,783 patent/US11631025B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11631025B2 (en) | 2023-04-18 |
US20170344908A1 (en) | 2017-11-30 |
WO2016111241A1 (ja) | 2016-07-14 |
JPWO2016111241A1 (ja) | 2017-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6941123B2 (ja) | 適応型追加学習を用いた細胞のアノテーション法及びアノテーションシステム | |
US11537930B2 (en) | Information processing device, information processing method, and program | |
WO2019151507A1 (ja) | 学習装置、学習方法及び学習プログラム | |
EP2991003A2 (en) | Method and apparatus for classification | |
JP7448562B2 (ja) | 人工知能のための希な訓練データへの対処 | |
US11527259B2 (en) | Learning device, voice activity detector, and method for detecting voice activity | |
CN112784581B (zh) | 文本纠错方法、装置、介质及电子设备 | |
CN115810135A (zh) | 样本分析的方法、电子设备、存储介质和程序产品 | |
US10339471B2 (en) | Ensemble based labeling | |
KR20210050087A (ko) | 신뢰도 측정 방법 및 장치 | |
JP6662301B2 (ja) | 学習装置、識別器、学習方法およびプログラム | |
US11145308B2 (en) | Symbol sequence estimation in speech | |
JP5989576B2 (ja) | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 | |
CN112700766B (zh) | 语音识别模型的训练方法及装置、语音识别方法及装置 | |
JP4533160B2 (ja) | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 | |
WO2020166125A1 (ja) | 翻訳用データ生成システム | |
KR101628602B1 (ko) | 프로그램의 유사도를 판단하기 위한 유사도 판단 방법 및 유사도 판단 장치 | |
JP6241790B2 (ja) | 生成モデル作成装置、推定装置、それらの方法およびプログラム | |
JP5980142B2 (ja) | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム | |
CN111814813A (zh) | 神经网络训练和图像分类方法与装置 | |
KR20090065102A (ko) | 어휘 디코딩 방법 및 장치 | |
CN111883109B (zh) | 语音信息处理及验证模型训练方法、装置、设备及介质 | |
CN115240704A (zh) | 音频识别方法、装置、电子设备和计算机程序产品 | |
CN109710927B (zh) | 命名实体的识别方法、装置、可读存储介质及电子设备 | |
CN112347826B (zh) | 一种基于强化学习的视频连续手语识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170615 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6662301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |