JP2019040335A - 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム - Google Patents
教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム Download PDFInfo
- Publication number
- JP2019040335A JP2019040335A JP2017161140A JP2017161140A JP2019040335A JP 2019040335 A JP2019040335 A JP 2019040335A JP 2017161140 A JP2017161140 A JP 2017161140A JP 2017161140 A JP2017161140 A JP 2017161140A JP 2019040335 A JP2019040335 A JP 2019040335A
- Authority
- JP
- Japan
- Prior art keywords
- image
- label
- teacher
- teacher data
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000010801 machine learning Methods 0.000 claims abstract description 67
- 238000012360 testing method Methods 0.000 claims description 17
- 238000002372 labelling Methods 0.000 abstract description 33
- 238000012545 processing Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 10
- 210000002569 neuron Anatomy 0.000 description 9
- 238000012937 correction Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】機械学習システム10は、機械学習用の教師画像Tを生成する。機械学習システム10は、「白杖」というラベルが与えられた白杖画像T1と、「白杖」というラベルが与えられていない非白杖画像T2とを用いて機械学習を行うことにより、教師データと「白杖」というラベルとの関係を表す第1ラベリングモデル(第1学習済みモデル)を生成する(第1学習ステップ)。機械学習システム10は、第1ラベリングモデルに基づいて、未分類教師画像TUに「白杖」というラベルを与えるべきか否かを判定する(判定ステップ)。
【選択図】図3
Description
コンピュータが機械学習用の教師データを生成する方法であって、
第1ラベルが与えられた第1教師データと、前記第1ラベルが与えられていない第2教師データとを用いて機械学習を行うことにより、教師データと前記第1ラベルとの関係を表す第1学習済みモデルを生成する、第1学習ステップと、
前記第1学習済みモデルに基づいて、未分類の教師データに前記第1ラベルを与えるべきか否かを判定する、判定ステップと
を備える。
特定の態様によれば、前記判定ステップの結果に応じて、前記未分類の教師データに基づき、前記第1ラベルが与えられた第3教師データを生成するか、または、前記第1ラベルが与えられていない第4教師データを生成する、教師データ生成ステップを備える。
特定の態様によれば、
前記教師データ生成ステップの後に、
前記第3教師データに与えられていた前記第1ラベルを削除するか、または、前記第4教師データに前記第1ラベルを与える、修正ステップ
を備える。
また、この発明に係る方法は、コンピュータが機械学習によって学習済みモデルを生成する方法であって、
上述の方法を用いて教師データを生成するステップと、
前記第1教師データと、前記第2教師データと、前記第3教師データおよび前記第4教師データのうち少なくとも一方とを用いて機械学習を行うことにより、教師データと前記第1ラベルとの関係を表す第2学習済みモデルを生成する、第2学習ステップと
を備える。
特定の態様によれば、前記第1学習ステップおよび前記第2学習ステップは、同一の学習前モデルに基づいて実行される。
また、この発明に係る学習済みモデルは、上述の方法を用いて生成される第2学習済みモデルであって、教師データに基づいて、テストデータに前記第1ラベルを与えるべきか否かを判定するよう、コンピュータを機能させる。
また、この発明に係るコンピュータは、上述の方法を実行する。
また、この発明に係るプログラムは、上述の方法をコンピュータに実行させる。
実施の形態1.
図1に、本発明の実施の形態1に係る機械学習システム10の構成の例を示す。機械学習システム10は、機械学習方法を実行するシステムであり、データに対するラベリングを行うためのラベリングモデルを機械学習によって生成する。また、機械学習システム10は、本明細書に記載される方法を実行するコンピュータである。
図2は、機械学習システム10が実行する処理の流れを説明するフローチャートである。図2のうち、とくにステップS1〜S3は、機械学習用の教師データを生成する方法に係る。
図3は、図2のステップS1〜S3の処理の入出力を説明する図である。
判定されるラベルの種類の数および組合せは任意に設計可能である。単一のラベルを与えるか否かのみを判定してもよいし、複数のラベルのうちいずれを与えるか(またはいずれも与えないか)を選択してもよいし、複数のラベルのそれぞれについてそのラベルを与えるか否かを個別に判定してもよい。
変形例として、ステップS2〜ステップS3の処理を繰り返すように構成する。未分類教師画像TUを例えば500個ずつに分けてステップS2で500個について新たな分類された教師画像を生成し、ステップS3で新たに分類された教師データを生成する。ステップS3の次に、教師データの累積数を算出し、累積数が所定数に達しているかどうかの判定処理を加え、累積数が所定数に達していないと判定したときは、次の500個についてステップS2〜ステップS3の処理を繰り返すように構成する。ステップS3の次で、教師データの累積数が所定数に達すると判定したときは、処理を終了する。
未分類教師画像TUに関して一度の処理で教師画像TCを生成しようとすると処理時間を要してしまう可能性があるが、このように未分類教師画像TUの一定数を順次処理するように構成することで、所定数の教師画像TCを効率的に生成できる可能性が高まる。
なお所定数とは、予め設定している教師画像TCを必要とする数である。
コンピュータが機械学習用の教師データを生成する方法であって、
第1ラベルが与えられた所定数A個の分類済み第1教師データと、前記第1ラベルが与えられていない分類済み第2教師データとを用いて機械学習を行うことにより、教師データと前記第1ラベルとの関係を表す第1学習済みモデルを生成する、第1学習ステップと、
前記第1学習済みモデルに基づいて、所定数B個の、未分類の教師データに前記第1ラベルを与えるべきか否かを判定する、判定ステップと、
X個の、未分類の教師データに、前記判定ステップを実行すべきか否かを判定する、追加判定ステップと、
を備え、
X=B・(C−A−D)/Dであり、
Cは、第1ラベルを与えられた分類済み教師データの必要数であり、
Dは、前記判定ステップにおいて第1ラベルを与えるべきと判定された教師データの数である。
特定の態様によれば、前記判定ステップの結果に応じて、前記未分類の教師データに基づき、前記第1ラベルが与えられた分類済み第3教師データを生成するか、または、前記第1ラベルが与えられていない分類済み第4教師データを生成する、教師データ生成ステップを備える。
特定の態様によれば、
前記教師データ生成ステップの後に、
前記分類済み第3教師データに与えられていた前記第1ラベルを削除するか、または、前記分類済み第4教師データに前記第1ラベルを与える、修正ステップ
を備える。
また、この発明に係る方法は、コンピュータが機械学習によって学習済みモデルを生成する方法であって、
上述の方法を用いて教師データを生成するステップと、
前記分類済み第1教師データと、前記分類済み第2教師データと、前記分類済み第3教師データおよび前記分類済み第4教師データのうち少なくとも一方とを用いて機械学習を行うことにより、教師データと前記第1ラベルとの関係を表す第2学習済みモデルを生成する、第2学習ステップと
を備える。
特定の態様によれば、前記第1学習ステップおよび前記第2学習ステップは、同一の学習前モデルに基づいて実行される。
また、この発明に係る学習済みモデルは、上述の方法を用いて生成される第2学習済みモデルであって、教師データに基づいて、テストデータに前記第1ラベルを与えるべきか否かを判定するよう、コンピュータを機能させる。
また、この発明に係るコンピュータは、上述の方法を実行する。
また、この発明に係るプログラムは、上述の方法をコンピュータに実行させる。
Claims (8)
- コンピュータが機械学習用の教師データを生成する方法であって、
第1ラベルが与えられた第1教師データと、前記第1ラベルが与えられていない第2教師データとを用いて機械学習を行うことにより、教師データと前記第1ラベルとの関係を表す第1学習済みモデルを生成する、第1学習ステップと、
前記第1学習済みモデルに基づいて、未分類の教師データに前記第1ラベルを与えるべきか否かを判定する、判定ステップと
を備える、方法。 - 前記判定ステップの結果に応じて、前記未分類の教師データに基づき、前記第1ラベルが与えられた第3教師データを生成するか、または、前記第1ラベルが与えられていない第4教師データを生成する、教師データ生成ステップを備える、請求項1に記載の方法。
- 前記教師データ生成ステップの後に、
前記第3教師データに与えられていた前記第1ラベルを削除するか、または、前記第4教師データに前記第1ラベルを与える、修正ステップ
を備える、請求項2に記載の方法。 - コンピュータが機械学習によって学習済みモデルを生成する方法であって、
請求項2に記載の方法を用いて教師データを生成するステップと、
前記第1教師データと、前記第2教師データと、前記第3教師データおよび前記第4教師データのうち少なくとも一方とを用いて機械学習を行うことにより、教師データと前記第1ラベルとの関係を表す第2学習済みモデルを生成する、第2学習ステップと
を備える、方法。 - 前記第1学習ステップおよび前記第2学習ステップは、同一の学習前モデルに基づいて実行される、請求項4に記載の方法。
- 請求項4または5に記載の方法を用いて生成される第2学習済みモデルであって、教師データに基づいて、テストデータに前記第1ラベルを与えるべきか否かを判定するよう、コンピュータを機能させるための学習済みモデル。
- 請求項1〜5のいずれか一項に記載の方法を実行するコンピュータ。
- 請求項1〜5のいずれか一項に記載の方法をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017161140A JP6506360B2 (ja) | 2017-08-24 | 2017-08-24 | 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017161140A JP6506360B2 (ja) | 2017-08-24 | 2017-08-24 | 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019040335A true JP2019040335A (ja) | 2019-03-14 |
JP6506360B2 JP6506360B2 (ja) | 2019-04-24 |
Family
ID=65726569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017161140A Active JP6506360B2 (ja) | 2017-08-24 | 2017-08-24 | 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6506360B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020255301A1 (ja) * | 2019-06-19 | 2020-12-24 | ||
JP2021012494A (ja) * | 2019-07-05 | 2021-02-04 | 公立大学法人会津大学 | ラベリングプログラム、ラベリング装置及びラベリング方法 |
WO2022157892A1 (ja) * | 2021-01-21 | 2022-07-28 | 日本電信電話株式会社 | 画像選出装置、画像選出方法、及び、画像選出プログラム |
JP7355295B2 (ja) | 2021-04-20 | 2023-10-03 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | データラベリング方法、装置、電子機器、及び読み取り可能な記憶媒体 |
US11989799B2 (en) | 2020-01-10 | 2024-05-21 | Nec Corporation | Visualized image display device |
JP7492541B2 (ja) | 2019-06-18 | 2024-05-29 | モロコ,インコーポレイテッド | 機械学習サービスを提供するための方法及びシステム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003141498A (ja) * | 2001-10-30 | 2003-05-16 | Nippon Telegr & Teleph Corp <Ntt> | 解答抽出方法、装置、プログラム、および同プログラムを記録した記録媒体 |
JP2012150586A (ja) * | 2011-01-18 | 2012-08-09 | Toshiba Corp | 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム |
JP2015087903A (ja) * | 2013-10-30 | 2015-05-07 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP2015129988A (ja) * | 2014-01-06 | 2015-07-16 | 日本電気株式会社 | データ処理装置 |
JP2017049681A (ja) * | 2015-08-31 | 2017-03-09 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
-
2017
- 2017-08-24 JP JP2017161140A patent/JP6506360B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003141498A (ja) * | 2001-10-30 | 2003-05-16 | Nippon Telegr & Teleph Corp <Ntt> | 解答抽出方法、装置、プログラム、および同プログラムを記録した記録媒体 |
JP2012150586A (ja) * | 2011-01-18 | 2012-08-09 | Toshiba Corp | 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム |
JP2015087903A (ja) * | 2013-10-30 | 2015-05-07 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP2015129988A (ja) * | 2014-01-06 | 2015-07-16 | 日本電気株式会社 | データ処理装置 |
JP2017049681A (ja) * | 2015-08-31 | 2017-03-09 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7492541B2 (ja) | 2019-06-18 | 2024-05-29 | モロコ,インコーポレイテッド | 機械学習サービスを提供するための方法及びシステム |
JPWO2020255301A1 (ja) * | 2019-06-19 | 2020-12-24 | ||
WO2020255301A1 (ja) * | 2019-06-19 | 2020-12-24 | 日本電信電話株式会社 | 学習データ生成装置、学習装置、学習データ生成方法、及び学習データ生成プログラム |
JP7268731B2 (ja) | 2019-06-19 | 2023-05-08 | 日本電信電話株式会社 | 学習データ生成装置、学習装置、学習データ生成方法、及び学習データ生成プログラム |
JP2021012494A (ja) * | 2019-07-05 | 2021-02-04 | 公立大学法人会津大学 | ラベリングプログラム、ラベリング装置及びラベリング方法 |
JP7333496B2 (ja) | 2019-07-05 | 2023-08-25 | 公立大学法人会津大学 | ラベリングプログラム、ラベリング装置及びラベリング方法 |
US11989799B2 (en) | 2020-01-10 | 2024-05-21 | Nec Corporation | Visualized image display device |
WO2022157892A1 (ja) * | 2021-01-21 | 2022-07-28 | 日本電信電話株式会社 | 画像選出装置、画像選出方法、及び、画像選出プログラム |
JP7355295B2 (ja) | 2021-04-20 | 2023-10-03 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | データラベリング方法、装置、電子機器、及び読み取り可能な記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6506360B2 (ja) | 2019-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6506360B2 (ja) | 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム | |
JP6182242B1 (ja) | データのラベリングモデルに係る機械学習方法、コンピュータおよびプログラム | |
JP7177653B2 (ja) | 敵対的ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 | |
JP6441980B2 (ja) | 教師画像を生成する方法、コンピュータおよびプログラム | |
WO2021027256A1 (zh) | 处理交互序列数据的方法及装置 | |
EP3918472B1 (en) | Techniques to detect fusible operators with machine learning | |
CN110276456A (zh) | 一种机器学习模型辅助构建方法、系统、设备及介质 | |
WO2018025706A1 (ja) | テーブル意味推定システム、方法およびプログラム | |
US20190228302A1 (en) | Learning method, learning device, and computer-readable recording medium | |
US20220414470A1 (en) | Multi-Task Attention Based Recurrent Neural Networks for Efficient Representation Learning | |
JP2018206261A (ja) | 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム | |
JP2015036939A (ja) | 特徴抽出プログラム及び情報処理装置 | |
US20190205361A1 (en) | Table-meaning estimating system, method, and program | |
CN114600196A (zh) | 特定领域的人类模型协同注释工具 | |
US20210304031A1 (en) | Learning device and non-transitory computer readable medium | |
JP2019028484A (ja) | 属性識別装置、属性識別モデル学習装置、方法、及びプログラム | |
EP4064038B1 (en) | Automated generation and integration of an optimized regular expression | |
WO2021255778A1 (ja) | 学習データ選択方法、学習データ選択装置、及び学習データ選択プログラム | |
JP2019106099A (ja) | 提供プログラム、提供装置、および提供方法 | |
JP7063397B2 (ja) | 回答統合装置、回答統合方法および回答統合プログラム | |
JP2013156691A (ja) | 購買予測装置、方法、及びプログラム | |
Fabian et al. | Estimating the execution time of the coupled stage in multiscale numerical simulations | |
JPWO2011016281A1 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム | |
JP5824429B2 (ja) | スパムアカウントスコア算出装置、スパムアカウントスコア算出方法、及びプログラム | |
CN112183714A (zh) | 基于人工神经网络的自动化数据切片 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6506360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |