JP7067236B2 - 機械学習用データ生成方法および機械学習用データ生成プログラム - Google Patents
機械学習用データ生成方法および機械学習用データ生成プログラム Download PDFInfo
- Publication number
- JP7067236B2 JP7067236B2 JP2018081906A JP2018081906A JP7067236B2 JP 7067236 B2 JP7067236 B2 JP 7067236B2 JP 2018081906 A JP2018081906 A JP 2018081906A JP 2018081906 A JP2018081906 A JP 2018081906A JP 7067236 B2 JP7067236 B2 JP 7067236B2
- Authority
- JP
- Japan
- Prior art keywords
- tensor
- category
- learning
- unit
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施形態にかかる機械学習の全体例を説明する説明図である。図1に示すように、学習装置100は、社員の日々の出勤、退勤時間、休暇取得、出張などの状況を含む出勤簿データ203、204を機械学習200して予測モデル201を生成し、学習後の予測モデル201を用いて、予測対象のある社員の出勤簿データ205から、当該社員が療養するか療養しないかを予測するコンピュータ装置の一例である。
図6は、実施形態にかかる学習装置100の機能構成例を示すブロック図である。図6に示すように、学習装置100は、通信部101、記憶部102、制御部110を有する。
図12は、学習時の処理の流れを示すフローチャートである。図12に示すように、処理が開始されると、テンソル取得部111は、出勤簿データを出勤簿データDB103から読み込み(S101)、学習対象の従業員1人を選択する(S102)。次いで、学習装置100では、選択した従業員についての出勤簿データをテンソル化する(S103)。
図14は、予測時の処理の流れを示すフローチャートである。図14に示すように、処理が開始されると、予測部116は、予測対象DB106から出勤簿データを読み込み(S201)、予測対象の従業員1人を選択する(S202)。
上述したように、学習装置100は、予測にかかる対象ごとに、当該対象の特徴を多次元で示す入力テンソル210を取得し、取得した入力テンソル210のうち、カテゴリを示す次元を特定する。また、学習装置100は、入力テンソル210について、特定した次元におけるカテゴリの出現頻度に基づき、出現頻度が所定値以下の複数のカテゴリのうちの少なくとも2つを一つのカテゴリとして統一したテンソル210aを生成する。このように、出現頻度が稀なカテゴリを一つのカテゴリに統一したテンソル210aを生成することで、予測において重要な部分パターンの認識に影響を及ぼすことを抑止し、予測精度の劣化を抑制することができる。例えば、出勤簿データから従業員のメンタル不調(療養の有無)を予測する場合において、出現頻度が所定値以下のカテゴリを統一することで、メンタル不調の予測精度の劣化を抑制することができる。
上述した学習処理は、任意の回数だけ実行することもできる。例えば、すべての訓練データを用いて実行することもでき、所定回数だけ実行することもできる。また、分類誤差の算出方法は、最小二乗法など公知の算出手法を採用することができ、ニューラルネットワーク213で用いられる一般的な算出手法を採用することもできる。
上記実施例では、予測の対象を従業員とし、出勤簿データ203、204を学習して療養する可能性がある従業員を予測する例で説明したが、これに限定されるものではない。例えば、電子部品の動作データを用いた故障予測、通信データを用いた攻撃予測、道路の交通量データを用いた渋滞予測など、従業員以外の他の予測対象にも適用することができる。
本実施例では、RNNやCNN(Convolutional Neural Network)など様々なニューラルネットワークを用いることができる。また、学習の手法も、誤差逆伝播以外にも公知の様々な手法を採用することができる。また、ニューラルネットワークは、例えば入力層、中間層(隠れ層)、出力層から構成される多段構成であり、各層は複数のノードがエッジで結ばれる構造を有する。各層は、「活性化関数」と呼ばれる関数を持ち、エッジは「重み」を持ち、各ノードの値は、前の層のノードの値、接続エッジの重みの値(重み係数)、層が持つ活性化関数から計算される。なお、計算方法については、公知の様々な手法を採用できる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値などは、あくまで一例であり、任意に変更することができる。
図15は、ハードウェア構成例を説明する図である。図15に示すように、学習装置100は、通信装置100a、HDD(Hard Disk Drive)100b、メモリ100c、プロセッサ100dを有する。また、図15に示した各部は、バス等で相互に接続される。
予測にかかる対象ごとに、当該対象の特徴を多次元で示す第1のテンソルを取得し、
取得した前記第1のテンソルのうち、カテゴリを示す次元を特定し、
前記第1のテンソルについて、特定した前記次元における前記カテゴリの出現頻度に基づき、当該出現頻度が所定値以下の複数のカテゴリのうちの少なくとも2つを一つのカテゴリとして統一した第2のテンソルを生成する、
処理を実行することを特徴とする学習用データ生成方法。
前記第2のテンソルを入力テンソルデータとしてテンソル分解して、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を実行する、
処理をさらに実行することを特徴とする付記1に記載の学習用データ生成方法。
前記テンソル分解時に、ランダムに生成されたターゲットコアテンソルと類似するように生成されたコアテンソルを、前記ニューラルネットワークに入力して出力された出力値と教師ラベルとの誤差を算出し、
前記誤差を用いて、前記誤差が小さくなるように前記ニューラルネットワークを学習するとともに、前記教師ラベルの特徴を表すように前記ターゲットコアテンソルを更新する、
処理をさらに実行することを特徴とする付記2に記載の学習用データ生成方法。
前記生成する処理は、前記出欠区分の次元において前記出現頻度が所定値以下の区分を一つの区分として統一する、
ことを特徴とする付記1乃至3のいずれか一に記載の学習用データ生成方法。
予測にかかる対象ごとに、当該対象の特徴を多次元で示す第1のテンソルを取得し、
取得した前記第1のテンソルのうち、カテゴリを示す次元を特定し、
前記第1のテンソルについて、特定した前記次元における前記カテゴリの出現頻度に基づき、当該出現頻度が所定値以下の複数のカテゴリのうちの少なくとも2つを一つのカテゴリとして統一した第2のテンソルを生成する、
処理を実行させることを特徴とする学習用データ生成プログラム。
前記第2のテンソルを入力テンソルデータとしてテンソル分解して、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を実行する、
処理をさらに実行させることを特徴とする付記5に記載の学習用データ生成プログラム。
前記テンソル分解時に、ランダムに生成されたターゲットコアテンソルと類似するように生成されたコアテンソルを、前記ニューラルネットワークに入力して出力された出力値と教師ラベルとの誤差を算出し、
前記誤差を用いて、前記誤差が小さくなるように前記ニューラルネットワークを学習するとともに、前記教師ラベルの特徴を表すように前記ターゲットコアテンソルを更新する、
処理をさらに実行させることを特徴とする付記6に記載の学習用データ生成プログラム。
前記生成する処理は、前記出欠区分の次元において前記出現頻度が所定値以下の区分を一つの区分として統一する、
ことを特徴とする付記5乃至7のいずれか一に記載の学習用データ生成プログラム。
前記第2のテンソルと前記正解情報とを学習データとして、ニューラルネットワークの入力層に入力されることにより、演算結果を示す出力値を前記ニューラルネットワークの出力層から出力させ、正解情報と前記出力値との比較に基づく学習を行う、
処理をコンピュータに実行させることを特徴とするデータ構造。
22~24…行列
100…学習装置
100a…通信装置
100b…HDD
100c…メモリ
100d…プロセッサ
101…通信部
102…記憶部
103…出勤簿データDB
104…テンソルDB
105…学習結果DB
106…予測対象DB
107…設定情報
110…制御部
111…テンソル取得部
112…特定部
113…統一化部
114…テンソル生成部
115…学習部
116…予測部
200…機械学習
201…予測モデル
203~205…出勤簿データ
210…入力テンソル
210a、210A~210D…テンソル
210E…部分パターン
211…ターゲットコアテンソル
212…コアテンソル
213…ニューラルネットワーク
214…教師ラベル
221、222…要素
Claims (5)
- コンピュータが、
予測にかかる対象ごとに、当該対象の特徴を多次元で示す第1のテンソルを取得し、
取得した前記第1のテンソルのうち、複数の項目において設定情報に基づいてカテゴリを示す次元を特定し、
前記第1のテンソルについて、特定した前記次元における前記カテゴリの出現頻度に基づき、当該出現頻度が所定値以下の複数のカテゴリのうちの少なくとも2つを一つのカテゴリとして統一した機械学習に用いる第2のテンソルを生成する、
処理を実行することを特徴とする機械学習用データ生成方法。 - 前記コンピュータが、
前記第2のテンソルを入力テンソルデータとしてテンソル分解して、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を実行する、
処理をさらに実行することを特徴とする請求項1に記載の機械学習用データ生成方法。 - 前記コンピュータが、
前記テンソル分解時に、ランダムに生成されたターゲットコアテンソルと類似するように生成されたコアテンソルを、前記ニューラルネットワークに入力して出力された出力値と教師ラベルとの誤差を算出し、
前記誤差を用いて、前記誤差が小さくなるように前記ニューラルネットワークを学習するとともに、前記教師ラベルの特徴を表すように前記ターゲットコアテンソルを更新する、
処理をさらに実行することを特徴とする請求項2に記載の機械学習用データ生成方法。 - 前記第1のテンソルは、従業員ごとに、当該従業員の出勤簿データにおける月度、日付、出欠区分を少なくとも各次元とするテンソルであり、
前記生成する処理は、前記出欠区分の次元において前記出現頻度が所定値以下の区分を一つの区分として統一する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の機械学習用データ生成方法。 - コンピュータに、
予測にかかる対象ごとに、当該対象の特徴を多次元で示す第1のテンソルを取得し、
取得した前記第1のテンソルのうち、複数の項目において設定情報に基づいてカテゴリを示す次元を特定し、
前記第1のテンソルについて、特定した前記次元における前記カテゴリの出現頻度に基づき、当該出現頻度が所定値以下の複数のカテゴリのうちの少なくとも2つを一つのカテゴリとして統一した機械学習に用いる第2のテンソルを生成する、
処理を実行させることを特徴とする機械学習用データ生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018081906A JP7067236B2 (ja) | 2018-04-20 | 2018-04-20 | 機械学習用データ生成方法および機械学習用データ生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018081906A JP7067236B2 (ja) | 2018-04-20 | 2018-04-20 | 機械学習用データ生成方法および機械学習用データ生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019191782A JP2019191782A (ja) | 2019-10-31 |
JP7067236B2 true JP7067236B2 (ja) | 2022-05-16 |
Family
ID=68390363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018081906A Active JP7067236B2 (ja) | 2018-04-20 | 2018-04-20 | 機械学習用データ生成方法および機械学習用データ生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7067236B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818196B (zh) * | 2019-11-18 | 2023-12-22 | 香港科技大学 | 基于电子学习平台的数据处理方法、设备、电子装置及存储介质 |
CN111276183B (zh) * | 2020-02-25 | 2023-03-21 | 云南大学 | 一种基于参数估计的张量分解处理海量基因序列的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008059433A (ja) | 2006-09-01 | 2008-03-13 | Fujitsu Ltd | 属性間の部分関係抽出する装置、方法、及びプログラム |
JP2018013922A (ja) | 2016-07-20 | 2018-01-25 | 株式会社リコー | 情報処理装置、情報処理プログラム及び情報処理方法 |
-
2018
- 2018-04-20 JP JP2018081906A patent/JP7067236B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008059433A (ja) | 2006-09-01 | 2008-03-13 | Fujitsu Ltd | 属性間の部分関係抽出する装置、方法、及びプログラム |
JP2018013922A (ja) | 2016-07-20 | 2018-01-25 | 株式会社リコー | 情報処理装置、情報処理プログラム及び情報処理方法 |
Non-Patent Citations (1)
Title |
---|
丸橋 弘治,研究開発最前線 人やモノのつながりを表すグラフデータから新たな知見を導く新技術Deep Tensor,FUJITSU,日本,富士通株式会社,2017年09月01日, Vol.68 No.5,p. 29-35 |
Also Published As
Publication number | Publication date |
---|---|
JP2019191782A (ja) | 2019-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7063080B2 (ja) | 機械学習プログラム、機械学習方法および機械学習装置 | |
Fong et al. | Composite Monte Carlo decision making under high uncertainty of novel coronavirus epidemic using hybridized deep learning and fuzzy rule induction | |
JP7067235B2 (ja) | 機械学習プログラム、機械学習方法および機械学習装置 | |
JP6562121B1 (ja) | 学習用データ生成プログラムおよび学習用データ生成方法 | |
Petropoulos et al. | ‘Horses for Courses’ in demand forecasting | |
Nsoesie et al. | A simulation optimization approach to epidemic forecasting | |
JP6481794B1 (ja) | 学習用データ生成方法、学習用データ生成プログラム | |
Ellner et al. | Fitting population dynamic models to time‐series data by gradient matching | |
JP7063079B2 (ja) | 機械学習プログラム、機械学習方法および機械学習装置 | |
KR101701954B1 (ko) | 인구통계 시뮬레이션 방법 | |
US11347972B2 (en) | Training data generation method and information processing apparatus | |
Arnold et al. | Forecasting mortality trends allowing for cause-of-death mortality dependence | |
van Benthem et al. | Disentangling evolutionary, plastic and demographic processes underlying trait dynamics: a review of four frameworks | |
JP7067236B2 (ja) | 機械学習用データ生成方法および機械学習用データ生成プログラム | |
Vindenes et al. | Integral projection models for finite populations in a stochastic environment | |
US11836580B2 (en) | Machine learning method | |
Bartz-Beielstein et al. | Optimization and adaptation of a resource planning tool for hospitals under special consideration of the COVID-19 pandemic | |
JP2020047079A (ja) | 学習プログラム、学習方法および学習装置 | |
JP6843109B2 (ja) | 医療用のデータ構造 | |
JP7451935B2 (ja) | 予測プログラム、予測方法及び予測装置 | |
JP2021096511A (ja) | 学習データ生成方法、学習データ生成プログラムおよび情報処理装置 | |
Abdallah et al. | A data mining framework for the analysis of patient arrivals into healthcare centers | |
Zhang et al. | Epidemic spreading combined with age and region in complex networks | |
Templ et al. | Synthetic data | |
Yule et al. | The puzzle of North America's Late Pleistocene megafaunal extinction patterns: Test of new explanation yields unexpected results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7067236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |