JP2019056983A - 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 - Google Patents
学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 Download PDFInfo
- Publication number
- JP2019056983A JP2019056983A JP2017179609A JP2017179609A JP2019056983A JP 2019056983 A JP2019056983 A JP 2019056983A JP 2017179609 A JP2017179609 A JP 2017179609A JP 2017179609 A JP2017179609 A JP 2017179609A JP 2019056983 A JP2019056983 A JP 2019056983A
- Authority
- JP
- Japan
- Prior art keywords
- data
- input data
- input
- learning
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2133—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on naturality criteria, e.g. with non-negative factorisation or negative correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Feedback Control In General (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
Description
一般的な機械学習の分類器を用いた分類では、入力データを分類器が処理可能な次元に変換した変換データを生成し、生成された変換データに対して学習および分類が行われる。
第1の入力データ群に対応した、機械学習モデルに入力される第1の変換データ群、および、第1の変換データ群に対応した機械学習モデルの第1の出力データ群を、それぞれ取得し、
第1の入力データと第1の入力データ群のデータそれぞれとの距離、および、第1の変換データと第1の変換データ群のデータそれぞれとの距離に基づき、第1の入力データ群から、推定モデルの学習対象データを選択することを特徴とする。
図1は、第1の実施形態に係る分類装置10および要因推定装置20の構成例を示す図である。分類装置10は、収集部110、入力データ記憶部112、変換部120、変換データ記憶部122、分類部130、学習結果記憶部132、解析部140、解析結果記憶部142を有する。
次に第2の実施形態について説明する。
a)uとv1の双方に存在するが量が異なる項目は、(S’2、R’3、P’2)の1項目であるので、(2−1)2=2。
b)uのみに存在する項目は、(S’1、R’3、P’1)および(S’3、R’1、P’1)の2項目であり、12+12=2。
c)v1のみに存在する項目は、(S’2、R’3、P’1)および(S’2、R’2、P’1)の2項目であり、12+12=2。 となるから、a)b)c)の合計は5となる。
k31=S’1×R’1
=(w11×S1+w12×S2)×(w21×R1+w22×R2)
=w11×w21×S1×R1+w12×w21×S2×R1+w11×w22×S1×R2+w12×w22×S2×R2
=w11×w21×k11+w12×w21×k12+w11×w22×k13+w12×w22×k14
同様にして、第1類似判断用データ3と第2類似判断用データ4との「数値」の他の値(k31〜k34,k41〜k44)も算出できる。
=(−0.68)×(−0.32)×S1×R1+(−0.73)×(−0.32)×S2×R1+(−0.68)×(−0.94)×S1×R2+(−0.73)×(−0.94)×S2×R2
入力データ距離算出部221は、「S1×R1」、「S2×R1」、「S1×R2」、「S2×R2」の値として、第1データ1031における対応する「量」の値を代入する。図18の例では、「S1×R1=1」、「S2×R1=0」、「S1×R2=1」、「S2×R2=1」である。その結果、中間データ1051における「量」の値が求まる。同様に、入力データ距離算出部221は、第2データ1032を変換行列1043,1044で変換して、中間データ1052を生成する。
第2の実施形態では、単位期間ごとの通信ログ間の類似度および距離を計算する例を示したが、同じ技術により、他の様々な情報の類似度および距離を計算可能である。
110 収集部
112 入力データ記憶部
120 変換部
122 変換データ記憶部
130 分類部
132 学習結果記憶部
140 解析部
142 解析結果記憶部
20 要因推定装置
21 入力データの特徴空間
22 変換データの特徴空間
24 近似識別線
25−1〜25−4 説明ベクトル
26 点uにおける識別要因
210 抽出部
220 選別部
221 入力データ距離算出部
222 入力データ距離記憶部
223 変換データ距離算出部
224 変換データ距離記憶部
225 対象判定部
230 選別データ記憶部
240 推定部
242 学習結果記憶部
Claims (9)
- 入力データを変換した変換データに対し分類または判別を行う機械学習モデルの出力要因を推定する、推定モデルの学習データの選択を、コンピュータに実行させる学習データ選択プログラムであって、
前記機械学習モデルへの入力データ群に含まれる第1の入力データの指定に応じ、前記第1の入力データに関連する第1の入力データ群を抽出し、
前記第1の入力データ群に対応した、前記機械学習モデルに入力される第1の変換データ群、および、前記第1の変換データ群に対応した前記機械学習モデルの第1の出力データ群を、それぞれ取得し、
前記第1の入力データと前記第1の入力データ群のデータそれぞれとの距離、および、前記第1の変換データと前記第1の変換データ群のデータそれぞれとの距離に基づき、前記第1の入力データ群から、前記推定モデルの学習対象データを選択する、
ことを特徴とする学習データ選択プログラム。
- 請求項1記載の学習データ選択プログラムであって、
前記抽出する処理は、前記第1の出力データ群に含まれる出力データそれぞれのデータ内容に基づき、学習対象データを抽出する、
ことを特徴とする学習データ選択プログラム。
- 請求項2記載の学習データ選択プログラムであって、
前記抽出する処理は、前記第1の出力データ群に含まれるデータ内容の比率に基づき、学習対象データを抽出する、
ことを特徴とする学習データ選択プログラム。
- 請求項3記載の学習データ選択プログラムであって、
前記抽出する処理は、前記第1の出力データ群に含まれるデータ内容の正例と負例の比率に基づき、学習対象データを抽出する、
ことを特徴とする学習データ選択プログラム。
- 請求項1記載の学習データ選択プログラムであって、
前記特定する処理は、データ取得タイミングが前記第1の入力データと所定の関係を有する入力データを前記第1の入力データ群と特定する、
ことを特徴とする学習データ選択プログラム。
- 請求項1記載の学習データ選択プログラムであって、
前記特定する処理は、データ生成元が前記第1の入力データと所定の関係を有する入力データを前記第1の入力データ群と特定する、
ことを特徴とする学習データ選択プログラム。
- 請求項1記載の学習データ選択プログラムであって、
前記抽出する処理は、前記第1の入力データと前記第1の入力データ群のデータそれぞれとの距離を、前記第1の入力データと前記第1の入力データ群のデータそれぞれとを個別に変換して算出する、
ことを特徴とする学習データ選択プログラム。
- 入力データを変換した変換データに対し分類または判別を行う機械学習モデルの出力要因を推定する、推定モデルの学習データの選択方法であって、
前記機械学習モデルへの入力データ群に含まれる第1の入力データの指定に応じ、前記第1の入力データに関連する第1の入力データ群を抽出し、
前記第1の入力データ群に対応した、前記機械学習モデルに入力される第1の変換データ群、および、前記第1の変換データ群に対応した前記機械学習モデルの第1の出力データ群を、それぞれ記憶装置より取得し、
前記第1の入力データと前記第1の入力データ群のデータそれぞれとの距離、および、前記第1の変換データと前記第1の変換データ群のデータそれぞれとの距離に基づき、前記第1の入力データ群から、前記推定モデルの学習対象データを選択する、
ことを特徴とする学習データ選択方法。
- 入力データを変換した変換データに対し分類または判別を行う機械学習モデルの出力要因を推定する、推定モデルの学習データの選択装置であって、
前記機械学習モデルへの入力データ群に含まれる第1の入力データの指定に応じ、前記第1の入力データに関連する第1の入力データ群を抽出する抽出部と、
前記第1の入力データ群に対応した、前記機械学習モデルに入力される第1の変換データ群、および、前記第1の変換データ群に対応した前記機械学習モデルの第1の出力データ群を、それぞれ記憶装置より取得する選択部と、を有し、
前記選択部は、前記第1の入力データと前記第1の入力データ群のデータそれぞれとの距離、および、前記第1の変換データと前記第1の変換データ群のデータそれぞれとの距離に基づき、前記第1の入力データ群から、前記推定モデルの学習対象データを選択する、
ことを特徴とする学習データ選択装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017179609A JP7000766B2 (ja) | 2017-09-19 | 2017-09-19 | 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 |
EP18195436.3A EP3462386A3 (en) | 2017-09-19 | 2018-09-19 | Learning data selection program, learning data selection method, and learning data selection device |
CN201811094204.0A CN109522922B (zh) | 2017-09-19 | 2018-09-19 | 学习数据选择方法及设备以及计算机可读记录介质 |
US16/135,446 US11501203B2 (en) | 2017-09-19 | 2018-09-19 | Learning data selection method, learning data selection device, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017179609A JP7000766B2 (ja) | 2017-09-19 | 2017-09-19 | 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019056983A true JP2019056983A (ja) | 2019-04-11 |
JP7000766B2 JP7000766B2 (ja) | 2022-01-19 |
Family
ID=63642837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017179609A Active JP7000766B2 (ja) | 2017-09-19 | 2017-09-19 | 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11501203B2 (ja) |
EP (1) | EP3462386A3 (ja) |
JP (1) | JP7000766B2 (ja) |
CN (1) | CN109522922B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021043888A (ja) * | 2019-09-13 | 2021-03-18 | Kddi株式会社 | 分類装置、学習装置、方法及びプログラム |
US20210295182A1 (en) * | 2020-03-23 | 2021-09-23 | Hitachi, Ltd. | Machine learning system and machine learning method |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7279446B2 (ja) * | 2019-03-20 | 2023-05-23 | 富士通株式会社 | 学習プログラム、学習方法、及び学習装置 |
US20210073686A1 (en) * | 2019-09-06 | 2021-03-11 | Yuan Yuan Ding | Self-structured machine learning classifiers |
CN114521268A (zh) * | 2019-10-07 | 2022-05-20 | 松下知识产权经营株式会社 | 分类系统、分类方法以及程序 |
US11615330B2 (en) * | 2020-03-18 | 2023-03-28 | Kyndryl, Inc. | Virtual subject matter expert provisioning |
JP7478585B2 (ja) * | 2020-04-28 | 2024-05-07 | 株式会社日立製作所 | プログラム部品評価システム、及びプログラム部品評価方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181928A (ja) * | 2003-12-24 | 2005-07-07 | Fuji Xerox Co Ltd | 機械学習システム及び機械学習方法、並びにコンピュータ・プログラム |
JP2017097718A (ja) * | 2015-11-26 | 2017-06-01 | 株式会社リコー | 識別処理装置、識別システム、識別処理方法、およびプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7315826B1 (en) * | 1999-05-27 | 2008-01-01 | Accenture, Llp | Comparatively analyzing vendors of components required for a web-based architecture |
US6957186B1 (en) * | 1999-05-27 | 2005-10-18 | Accenture Llp | System method and article of manufacture for building, managing, and supporting various components of a system |
WO2007147166A2 (en) * | 2006-06-16 | 2007-12-21 | Quantum Leap Research, Inc. | Consilence of data-mining |
US8301768B2 (en) * | 2007-12-20 | 2012-10-30 | Pottenger William M | Peer-to-peer indexing-based marketplace |
JP5178662B2 (ja) * | 2009-07-31 | 2013-04-10 | 富士フイルム株式会社 | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
EP2538388B1 (en) * | 2011-06-20 | 2015-04-01 | Alcatel Lucent | Method and arrangement for image model construction |
US11100420B2 (en) * | 2014-06-30 | 2021-08-24 | Amazon Technologies, Inc. | Input processing for machine learning |
US9672474B2 (en) * | 2014-06-30 | 2017-06-06 | Amazon Technologies, Inc. | Concurrent binning of machine learning data |
US10339465B2 (en) * | 2014-06-30 | 2019-07-02 | Amazon Technologies, Inc. | Optimized decision tree based models |
US10540606B2 (en) * | 2014-06-30 | 2020-01-21 | Amazon Technologies, Inc. | Consistent filtering of machine learning data |
WO2016004075A1 (en) * | 2014-06-30 | 2016-01-07 | Amazon Technologies, Inc. | Interactive interfaces for machine learning model evaluations |
US10963810B2 (en) * | 2014-06-30 | 2021-03-30 | Amazon Technologies, Inc. | Efficient duplicate detection for machine learning data sets |
US9619753B2 (en) * | 2014-12-30 | 2017-04-11 | Winbond Electronics Corp. | Data analysis system and method |
US10769531B2 (en) * | 2015-06-05 | 2020-09-08 | Cisco Technology, Inc. | Methods and systems for counting people |
US10192051B2 (en) * | 2015-06-17 | 2019-01-29 | Accenture Global Services Limited | Data acceleration |
US9792534B2 (en) | 2016-01-13 | 2017-10-17 | Adobe Systems Incorporated | Semantic natural language vector space |
-
2017
- 2017-09-19 JP JP2017179609A patent/JP7000766B2/ja active Active
-
2018
- 2018-09-19 US US16/135,446 patent/US11501203B2/en active Active
- 2018-09-19 EP EP18195436.3A patent/EP3462386A3/en active Pending
- 2018-09-19 CN CN201811094204.0A patent/CN109522922B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181928A (ja) * | 2003-12-24 | 2005-07-07 | Fuji Xerox Co Ltd | 機械学習システム及び機械学習方法、並びにコンピュータ・プログラム |
JP2017097718A (ja) * | 2015-11-26 | 2017-06-01 | 株式会社リコー | 識別処理装置、識別システム、識別処理方法、およびプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021043888A (ja) * | 2019-09-13 | 2021-03-18 | Kddi株式会社 | 分類装置、学習装置、方法及びプログラム |
JP7118938B2 (ja) | 2019-09-13 | 2022-08-16 | Kddi株式会社 | 分類装置、学習装置、方法及びプログラム |
US20210295182A1 (en) * | 2020-03-23 | 2021-09-23 | Hitachi, Ltd. | Machine learning system and machine learning method |
Also Published As
Publication number | Publication date |
---|---|
CN109522922A (zh) | 2019-03-26 |
CN109522922B (zh) | 2023-04-28 |
US20190087384A1 (en) | 2019-03-21 |
EP3462386A3 (en) | 2019-08-21 |
US11501203B2 (en) | 2022-11-15 |
JP7000766B2 (ja) | 2022-01-19 |
EP3462386A2 (en) | 2019-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7000766B2 (ja) | 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置 | |
JP6751235B2 (ja) | 機械学習プログラム、機械学習方法、および機械学習装置 | |
US10884891B2 (en) | Interactive detection of system anomalies | |
US10210189B2 (en) | Root cause analysis of performance problems | |
US10572822B2 (en) | Modular memoization, tracking and train-data management of feature extraction | |
Kamburugamuve et al. | Anatomy of machine learning algorithm implementations in MPI, Spark, and Flink | |
JP6898562B2 (ja) | 機械学習プログラム、機械学習方法、および機械学習装置 | |
US10883345B2 (en) | Processing of computer log messages for visualization and retrieval | |
JP6898561B2 (ja) | 機械学習プログラム、機械学習方法、および機械学習装置 | |
US11551818B2 (en) | Computer system and method of presenting information related to basis of predicted value output by predictor | |
CN111612041A (zh) | 异常用户识别方法及装置、存储介质、电子设备 | |
US20170154107A1 (en) | Determining term scores based on a modified inverse domain frequency | |
US10824694B1 (en) | Distributable feature analysis in model training system | |
JP6773972B2 (ja) | データ変換プログラム、データ変換方法、およびデータ変換装置 | |
JPWO2017203672A1 (ja) | アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置 | |
CN110472659B (zh) | 数据处理方法、装置、计算机可读存储介质和计算机设备 | |
CN112116159A (zh) | 信息交互方法、装置、计算机可读存储介质及电子设备 | |
CN110348581B (zh) | 用户特征群中用户特征寻优方法、装置、介质及电子设备 | |
US20130007019A1 (en) | Logic operation system | |
CN111522888A (zh) | 挖掘兴趣点之间的竞争关系的方法和装置 | |
Charlier et al. | Profiling smart contracts interactions with tensor decomposition and graph mining | |
CN115472257A (zh) | 一种招募用户的方法、装置、电子设备及存储介质 | |
CN111177236B (zh) | 基于医养照护场景的量表生成方法、系统、设备及介质 | |
US9582782B2 (en) | Discovering a reporting model from an existing reporting environment | |
US11500906B1 (en) | Constraint optimization problem solving on subfeatures of a subgraph of a network with classification of features of verbal elements in subgraphs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20180615 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20180618 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7000766 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |