JP6973197B2 - データセット検証装置、データセット検証方法、およびデータセット検証プログラム - Google Patents
データセット検証装置、データセット検証方法、およびデータセット検証プログラム Download PDFInfo
- Publication number
- JP6973197B2 JP6973197B2 JP2018042764A JP2018042764A JP6973197B2 JP 6973197 B2 JP6973197 B2 JP 6973197B2 JP 2018042764 A JP2018042764 A JP 2018042764A JP 2018042764 A JP2018042764 A JP 2018042764A JP 6973197 B2 JP6973197 B2 JP 6973197B2
- Authority
- JP
- Japan
- Prior art keywords
- data set
- data
- data group
- learning
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
図1は、この発明にかかるデータセット検証装置を適用した1例の機械学習システムの主要部の構成を示すブロック図である。この例にかかる機械学習システムは、データセット検証装置1と、識別モデル構築装置2と、識別モデル評価装置3と、元データセット記憶データベース4(元データセット記憶DB4)とを備えている。
図2は、データセット検証装置の主要部の構成を示すブロック図である。データセット検証装置1は、制御ユニット11と、データベースアクセス部12(DBアクセス部12)と、学習用データセット供給部13と、評価用データセット供給部14とを備えている。
次に、この例にかかるデータセット検証装置1の動作について説明する。図3は、データセット検証装置の動作を示すフローチャートである。データセット検証装置1は、データセットの作成指示にかかる入力を受け付けると、図3に示す処理を実行する。データセット検証装置1には、図示していない操作部におけるオペレータの入力操作、または外部装置からの入力コマンドによってデータセットの作成指示が入力される。
次に、この発明にかかるデータセット検証装置1の別の例について説明する。この例にかかるデータセット検証装置1を適用した機械学習システムも図1に示す構成である。また、この例にかかるデータセット検証装置1は、上記した図2に示す構成である。この例のデータセット検証装置1は、図3に示した処理ではなく、図4に示す処理を実行する点で、上記の例と異なる。図4は、この例にかかるデータセット検証装置1の動作を示すフローチャートである。
<付記>
元データセットから、機械学習に用いる学習用データセット、および前記学習用データセットを用いた前記機械学習で得られた識別モデルを評価する評価用データセットを生成するデータセット生成部(21)と、
前記データセット生成部(21)が生成した前記学習用データセットに属する第1データ群の特徴、および前記データセット生成部(21)が生成した前記評価用データセットに属する第2データ群の特徴を抽出する特徴抽出部(22)と、
前記特徴抽出部(22)が抽出した前記第1データ群の特徴と、前記第2データ群の特徴とに基づいて、前記データセット生成部(21)が生成した前記学習用データセットが適正であるかどうかを判定する判定部(23)と、を備えたデータセット検証装置(1)。
2…識別モデル構築装置
3…識別モデル評価装置
4…元データセット記憶データベース(元データセット記憶DB)
5…学習用データセット記憶データベース(学習用データセット記憶DB)
6…評価用データセット記憶データベース(評価用データセット記憶DB)
11…制御ユニット
12…データベースアクセス部(DBアクセス部)
13…学習用データセット供給部
14…評価用データセット供給部
21…データセット生成部
22…特徴抽出部
23…判定部
Claims (11)
- 元データセットから、機械学習に用いる学習用データセット、および前記学習用データセットを用いた前記機械学習で得られた識別モデルを評価する評価用データセットを生成するデータセット生成部と、
前記データセット生成部が生成した前記学習用データセットに属する第1データ群の特徴、および前記データセット生成部が生成した前記評価用データセットに属する第2データ群の特徴を抽出する特徴抽出部と、
前記特徴抽出部が抽出した前記第1データ群の特徴と、前記第2データ群の特徴とに基づいて、前記データセット生成部が生成した前記学習用データセットが適正であるかどうかを判定する判定部と、を備え、
前記特徴抽出部によって抽出される特徴の種類は、該当するデータセットに属するデータ群の尤度関数である、データセット検証装置。 - 前記判定部は、前記第1データ群の特徴と、前記第2データ群の特徴とに類似性がなければ、前記データセット生成部が生成した前記学習用データセットが適正でないと判定する、請求項1に記載のデータセット検証装置。
- 前記特徴抽出部は、前記元データセットに属する第3データ群についても、前記第1データ群、および前記第2データ群と同じ種類の特徴を抽出し、
前記判定部は、前記特徴抽出部が抽出した前記第1データ群の特徴、前記第2データ群の特徴、および前記第3データ群の特徴に基づいて、前記データセット生成部が生成した前記学習用データセットが適正であるかどうかを判定する、請求項1、または2に記載のデータセット検証装置。 - 前記判定部は、前記第1データ群、前記第2データ群、および前記第3データ群の中から選択した2つのデータ群の組合せのいずれかにおいて、特徴に類似性がなければ、前記データセット生成部が生成した前記学習用データセットが適正でないと判定する、請求項3に記載のデータセット検証装置。
- 元データセットから、機械学習に用いる学習用データセットを生成するデータセット生成部と、
前記データセット生成部が生成した前記学習用データセットに属する第1データ群の特徴、および前記元データセットに属する第3データ群の特徴を抽出する特徴抽出部と、
前記特徴抽出部が抽出した前記第1データ群の特徴と、前記第3データ群の特徴とに基づいて、前記データセット生成部が生成した前記学習用データセットが適正であるかどうかを判定する判定部と、を備え、
前記特徴抽出部によって抽出される特徴の種類は、該当するデータセットに属するデータ群の尤度関数である、データセット検証装置。 - 前記判定部は、前記第1データ群の特徴と、前記第3データ群の特徴とに類似性がなければ、前記データセット生成部が生成した前記学習用データセットが適正でないと判定する、請求項5に記載のデータセット検証装置。
- 前記判定部は、前記データセット生成部が生成した前記学習用データセットが適正でないと判定したとき、前記学習用データセットを前記データセット生成部に再生成させる、請求項1〜6のいずれかに記載のデータセット検証装置。
- 元データセットから、機械学習に用いる学習用データセット、および前記学習用データセットを用いた前記機械学習で得られた識別モデルを評価する評価用データセットを生成するデータセット生成ステップと、
前記データセット生成ステップで生成した前記学習用データセットに属する第1データ群の特徴、および前記データセット生成ステップで生成した前記評価用データセットに属する第2データ群の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出した前記第1データ群の特徴と、前記第2データ群の特徴とに基づいて、前記データセット生成ステップで生成した前記学習用データセットが適正であるかどうかを判定する判定ステップと、をコンピュータが実行し、
前記特徴抽出ステップで抽出する特徴の種類は、該当するデータセットに属するデータ群の尤度関数である、データセット検証方法。 - 元データセットから、機械学習に用いる学習用データセットを生成するデータセット生成ステップと、
前記データセット生成ステップで生成した前記学習用データセットに属する第1データ群の特徴、および前記元データセットに属する第3データ群の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出した前記第1データ群の特徴と、前記第3データ群の特徴とに基づいて、前記データセット生成ステップで生成した前記学習用データセットが適正であるかどうかを判定する判定ステップと、をコンピュータが実行し、
前記特徴抽出ステップで抽出する特徴の種類は、該当するデータセットに属するデータ群の尤度関数である、データセット検証方法。 - 元データセットから、機械学習に用いる学習用データセット、および前記学習用データセットを用いた前記機械学習で得られた識別モデルを評価する評価用データセットを生成するデータセット生成ステップと、
前記データセット生成ステップで生成した前記学習用データセットに属する第1データ群の特徴、および前記データセット生成ステップで生成した前記評価用データセットに属する第2データ群の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出した前記第1データ群の特徴と、前記第2データ群の特徴とに基づいて、前記データセット生成ステップで生成した前記学習用データセットが適正であるかどうかを判定する判定ステップと、をコンピュータに実行させ、
前記特徴抽出ステップで抽出する特徴の種類は、該当するデータセットに属するデータ群の尤度関数である、データセット検証プログラム。 - 元データセットから、機械学習に用いる学習用データセットを生成するデータセット生成ステップと、
前記データセット生成ステップで生成した前記学習用データセットに属する第1データ群の特徴、および前記元データセットに属する第3データ群の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出した前記第1データ群の特徴と、前記第3データ群の特徴とに基づいて、前記データセット生成ステップで生成した前記学習用データセットが適正であるかどうかを判定する判定ステップと、をコンピュータに実行させ、
前記特徴抽出ステップで抽出する特徴の種類は、該当するデータセットに属するデータ群の尤度関数である、データセット検証プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018042764A JP6973197B2 (ja) | 2018-03-09 | 2018-03-09 | データセット検証装置、データセット検証方法、およびデータセット検証プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018042764A JP6973197B2 (ja) | 2018-03-09 | 2018-03-09 | データセット検証装置、データセット検証方法、およびデータセット検証プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159538A JP2019159538A (ja) | 2019-09-19 |
JP6973197B2 true JP6973197B2 (ja) | 2021-11-24 |
Family
ID=67996216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018042764A Active JP6973197B2 (ja) | 2018-03-09 | 2018-03-09 | データセット検証装置、データセット検証方法、およびデータセット検証プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6973197B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190377984A1 (en) * | 2018-06-06 | 2019-12-12 | DataRobot, Inc. | Detecting suitability of machine learning models for datasets |
JP7226226B2 (ja) * | 2019-09-26 | 2023-02-21 | いすゞ自動車株式会社 | モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 |
WO2021229630A1 (ja) * | 2020-05-11 | 2021-11-18 | 富士通株式会社 | 機械学習プログラム,機械学習方法および機械学習装置 |
JP2024081979A (ja) * | 2022-12-07 | 2024-06-19 | 株式会社サキコーポレーション | 撮像画像振り分け装置、撮像画像振り分け方法、データセットおよび学習システム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181928A (ja) * | 2003-12-24 | 2005-07-07 | Fuji Xerox Co Ltd | 機械学習システム及び機械学習方法、並びにコンピュータ・プログラム |
JP6063756B2 (ja) * | 2013-01-25 | 2017-01-18 | 株式会社Screenホールディングス | 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法 |
JP6724922B2 (ja) * | 2015-09-17 | 2020-07-15 | 日本電気株式会社 | 教師データ提供装置、推定装置、推定システム、教師データ提供方法、推定方法、及び、プログラム |
-
2018
- 2018-03-09 JP JP2018042764A patent/JP6973197B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019159538A (ja) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6973197B2 (ja) | データセット検証装置、データセット検証方法、およびデータセット検証プログラム | |
Banfield et al. | A new ensemble diversity measure applied to thinning ensembles | |
Cateni et al. | Variable selection and feature extraction through artificial intelligence techniques | |
JP7024515B2 (ja) | 学習プログラム、学習方法および学習装置 | |
JP7047498B2 (ja) | 学習プログラム、学習方法および学習装置 | |
US9842279B2 (en) | Data processing method for learning discriminator, and data processing apparatus therefor | |
US11556785B2 (en) | Generation of expanded training data contributing to machine learning for relationship data | |
US20080127043A1 (en) | Automatic Extraction of Programming Rules | |
WO2019102984A1 (ja) | 学習装置及び学習方法、識別装置及び識別方法、プログラム並びに記録媒体 | |
CN113011529A (zh) | 文本分类模型的训练方法、装置、设备及可读存储介质 | |
Isberner et al. | Inferring automata with state-local alphabet abstractions | |
JP2017004123A (ja) | 判定装置、判定方法および判定プログラム | |
JP6331756B2 (ja) | テストケース生成プログラム、テストケース生成方法、及びテストケース生成装置 | |
WO2016132550A1 (ja) | 抽出プログラム、抽出装置および抽出方法 | |
CN111950579A (zh) | 分类模型的训练方法和训练装置 | |
US20170039484A1 (en) | Generating negative classifier data based on positive classifier data | |
CN110825873B (zh) | 用于对日志异常分类规则进行扩充的方法及装置 | |
CN112257332A (zh) | 一种仿真模型的评估方法及装置 | |
JP6831221B2 (ja) | 学習装置及び学習方法 | |
JP7143599B2 (ja) | メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム | |
CN110659266A (zh) | 一种模型的数据处理方法 | |
WO2018096686A1 (ja) | 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法 | |
CN113642623A (zh) | 基于酉空间多特征融合的复数支持向量机分类方法 | |
JP6988828B2 (ja) | 照合処理装置、照合処理方法、及び、照合処理プログラム | |
JP6937146B2 (ja) | 多重型学習システムおよび多重型学習プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210629 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211005 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211018 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6973197 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |