JP6334431B2 - データ分析装置、データ分析方法、およびデータ分析プログラム - Google Patents
データ分析装置、データ分析方法、およびデータ分析プログラム Download PDFInfo
- Publication number
- JP6334431B2 JP6334431B2 JP2015029606A JP2015029606A JP6334431B2 JP 6334431 B2 JP6334431 B2 JP 6334431B2 JP 2015029606 A JP2015029606 A JP 2015029606A JP 2015029606 A JP2015029606 A JP 2015029606A JP 6334431 B2 JP6334431 B2 JP 6334431B2
- Authority
- JP
- Japan
- Prior art keywords
- hash
- learning
- data
- value
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 217
- 238000007405 data analysis Methods 0.000 title claims description 64
- 230000008569 process Effects 0.000 claims description 190
- 238000012545 processing Methods 0.000 claims description 144
- 230000006870 function Effects 0.000 claims description 137
- 239000013598 vector Substances 0.000 claims description 124
- 238000004364 calculation method Methods 0.000 claims description 103
- 238000002790 cross-validation Methods 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 11
- 230000004931 aggregating effect Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 description 25
- 239000003814 drug Substances 0.000 description 23
- 229940079593 drug Drugs 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 230000002776 aggregation Effects 0.000 description 11
- 238000004220 aggregation Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000004820 blood count Methods 0.000 description 10
- 210000003743 erythrocyte Anatomy 0.000 description 6
- 210000000265 leukocyte Anatomy 0.000 description 6
- 210000004698 lymphocyte Anatomy 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 238000007449 liver function test Methods 0.000 description 4
- 230000007721 medicinal effect Effects 0.000 description 4
- 230000005713 exacerbation Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Yn={yn p|p∈P}・・・(2)
図3は、データ分析システムのシステム構成例を示すブロック図である。図3では、サーバ−クライアント型のデータ分析システムを例に挙げて説明するが、スタンドアロン型でもよい。(A)は、データ分析システムのハードウェア構成例を示すブロック図であり、(B)は、データ分析システムの機能的構成例を示すブロック図である。(A)および(B)において同一構成には同一符号を付す。
図4は、学習用データ集合364の一例を示す説明図である。学習用データ集合364は、学習用入力DB410と、学習用出力DB420と、を有する。学習用入力DB410は、学習用入力データ群(学習用因子データ群D)を格納するデータベースであり、学習用出力DB420は、学習用出力データ群(学習用診断データ群Y)を格納するデータベースである。
図5は、予測用データ集合の一例を示す説明図である。予測用入力DB510は、データ項目iとして、ID500と、性別(i=1)511と、年齢(i=2)912と、薬剤A(i=3)513と、薬剤B(i=4)514と、…、薬剤Ω(i=200,000)515と、を有し、各データ項目の値の組み合わせにより、予測用因子データD´n´を構成する。実施例1では学習用入力DB410のデータ項目iの総数I´を例としてI´=200,000とした。
図6は、データ分析における設定画面例を示す説明図である。設定画面600は、たとえば、クライアント端末300のモニタ305またはデータ分析装置320のモニタ325により表示される。
図7は、実施例1にかかるデータ分析システムによるデータ分析処理手順例を示すフローチャートである。まず、学習処理部361は、初期設定を実行する(ステップS700)。初期設定では、図6の設定画面600に各値が入力または選択される。なお、初期設定では、図6で図示されていないが、データ項目421〜425から、予測対象となる予測値のいずれかのデータ項目も選択される。選択されたデータ項目の値の列を教師データと称す。
tj m=Hk m(j)×nor(xn j)・・・(10)
・・・(18)
t´j m=Hk m(j)×nor(x´n´ j)・・・(20)
図14は、実施例2にかかる学習用特徴ベクトル生成処理(ステップS805)の詳細な処理手順例を示すフローチャートである。図9に示した実施例1にかかる学習用特徴ベクトル生成処理(ステップS805)と同一ステップには同一ステップ番号を付し、その説明を省略する。
Claims (15)
- 記憶デバイスにアクセス可能なプロセッサが実行するデータ分析装置であって、
前記プロセッサは、
複数の第1データ項目の値を有する学習用入力データの集合である学習用入力データ群を前記記憶デバイスから取得する第1取得処理と、
各々固有の第1ハッシュテーブルを生成することにより第1ハッシュ関数を複数個設定する第1設定処理と、
前記第1取得処理によって取得された学習用入力データ群の各学習用入力データについて、前記第1設定処理によって設定された前記複数の第1ハッシュ関数の各々に与えることにより、前記複数の第1データ項目の値に対応する複数の第1ハッシュ値を前記第1ハッシュ関数ごとに算出する第1算出処理と、
前記各学習用入力データについて、前記第1算出処理によって前記第1ハッシュ関数ごとに算出された前記複数の第1ハッシュ値の中から所定の統計的条件を満たす特定の第1ハッシュ値を前記第1ハッシュ関数ごとに選択する第1選択処理と、
第2ハッシュテーブルを生成することにより第2ハッシュ関数を設定する第2設定処理と、
前記各学習用入力データについて、前記第1選択処理によって前記第1ハッシュ関数ごとに選択された特定の第1ハッシュ値の各々を前記第2設定処理によって設定された第2ハッシュ関数に与えることにより、第2ハッシュ値を複数算出する第2算出処理と、
前記第2算出処理によって算出された結果、前記特定の第1ハッシュ値の各々に対応する前記第2ハッシュ値を集約することにより、前記学習用入力データ群の特徴を示す学習用特徴ベクトルを生成する第1生成処理と、
を実行することを特徴とするデータ分析装置。 - 前記プロセッサは、
前記各学習用入力データについて、前記複数の第1データ項目の値に基づいて、当該第1データ項目の値に対応する前記第1ハッシュ値の各々を重み付けする第1重み付け処理を実行し、
前記第1選択処理では、前記プロセッサは、前記各学習用入力データについて、前記第1重み付け処理による複数の重み付き第1ハッシュ値の中から前記所定の統計的条件を満たす特定の重み付き第1ハッシュ値を前記第1ハッシュ関数ごとに選択し、
前記第2算出処理では、前記プロセッサは、前記各学習用入力データについて、前記第1選択処理によって前記第1ハッシュ関数ごとに選択された特定の重み付き第1ハッシュ値の各々を前記第2ハッシュ関数に与えることにより、前記第2ハッシュ値を複数算出し、
前記第1生成処理では、前記プロセッサは、前記第2算出処理によって算出された結果、前記特定の重み付き第1ハッシュ値の各々に対応する前記第2ハッシュ値を、odd−filteringを用いて集約することにより、前記学習用特徴ベクトルを生成することを特徴とする請求項1に記載のデータ分析装置。 - 前記第1生成処理では、前記プロセッサは、前記第2算出処理によって算出された結果、前記特定の第1ハッシュ値の各々に対応する前記第2ハッシュ値を、フォールディング計算を用いて集約することにより、前記学習用特徴ベクトルを生成することを特徴とする請求項1に記載のデータ分析装置。
- 前記第1取得処理では、前記プロセッサは、さらに、前記学習用入力データの各々に対応し、かつ、複数の第2データ項目の値を有する学習用出力データの集合である学習用出力データ群における、前記複数の第2データ項目の中のいずれかの第2データ項目の値の集合である教師データを取得し、
前記プロセッサは、
前記第1生成処理によって生成された学習用特徴ベクトルと、前記第1取得処理によって取得された教師データと、を用いて、前記学習用入力データ群から前記教師データを出力するための学習パラメータを算出する学習パラメータ算出処理を実行することを特徴とする請求項1〜3のいずれか1つに記載のデータ分析装置。 - 前記学習パラメータ算出処理では、前記プロセッサは、前記教師データが2値である場合、前記学習用特徴ベクトルと、前記教師データと、を識別関数に与えることにより、前記学習パラメータを算出することを特徴とする請求項4に記載のデータ分析装置。
- 前記学習パラメータ算出処理では、前記プロセッサは、前記教師データが多値または実数値である場合、前記学習用特徴ベクトルと、前記教師データと、を回帰関数に与えることにより、前記学習パラメータを算出することを特徴とする請求項4に記載のデータ分析装置。
- 前記プロセッサは、
前記第2算出処理の実行後から前記第1生成処理を実行するまでの間に、前記学習用入力データ群と複数の第2データ項目の値を有する学習用出力データの集合である学習用出力データ群とを用いた交差検証処理を実行し、前記交差検証処理により得られる予測精度がしきい値を超えるまで、前記第1設定処理、前記第1算出処理、前記第1選択処理、前記第2設定処理、および、前記第2算出処理を再実行し、前記交差検証処理により前記予測精度が前記しきい値を超えた場合、前記第1生成処理を実行し、
前記交差検証処理では、前記プロセッサは、
前記学習用入力データ群の中の第1学習用入力データ群と、前記学習用出力データ群の中の前記第1学習用入力データ群に対応する第1学習用出力データ群における、いずれかの第2データ項目の値の集合である第1教師データと、用いて、前記第1学習用入力データ群から前記第1教師データを出力するための第1学習パラメータを算出し、
前記学習用入力データ群の中の第1学習用入力データ群以外の第2学習用入力データ群と、前記第1学習パラメータと、を用いて、前記いずれかの第2データ項目の予測データを算出し、
前記学習用出力データ群の中の前記第2学習用入力データ群に対応する第2学習用出力データ群における、前記いずれかの第2データ項目の値の集合である第2教師データと、前記予測データと、を比較することにより、前記予測データに関する前記予測精度を算出し、
前記予測精度が前記しきい値以下であるか否かを検証することを特徴とする請求項1〜3のいずれか1つに記載のデータ分析装置。 - 前記プロセッサは、
前記複数の第1データ項目の値を有する予測用入力データの集合である予測用入力データ群を前記記憶デバイスから取得する第2取得処理と、
前記第2取得処理によって取得された予測用入力データ群の各予測用入力データについて、前記複数の第1ハッシュ関数の各々に与えることにより、前記複数の第1データ項目の値に対応する複数の第3ハッシュ値を前記第1ハッシュ関数ごとに算出する第3算出処理と、
前記各予測用入力データについて、前記第3算出処理によって前記第1ハッシュ関数ごとに算出された前記複数の第3ハッシュ値の中から前記所定の統計的条件を満たす特定の第3ハッシュ値を前記第1ハッシュ関数ごとに選択する第2選択処理と、
前記各予測用入力データについて、前記第2選択処理によって前記第1ハッシュ関数ごとに選択された特定の第3ハッシュ値の各々を前記第2ハッシュ関数に与えることにより、第4ハッシュ値を複数算出する第4算出処理と、
前記第4算出処理によって算出された結果、前記特定の第3ハッシュ値の各々に対応する前記第4ハッシュ値を集約することにより、前記予測用入力データ群の特徴を示す予測用特徴ベクトルを生成する第2生成処理と、
を実行することを特徴とする請求項4に記載のデータ分析装置。 - 前記プロセッサは、
前記各予測用入力データについて、前記複数の第1データ項目の値に基づいて、当該第1データ項目の値に対応する前記第1ハッシュ値の各々を重み付けする第2重み付け処理を実行し、
前記第2選択処理では、前記プロセッサは、前記各予測用入力データについて、前記第2重み付け処理による複数の重み付き第3ハッシュ値の中から前記所定の統計的条件を満たす特定の重み付き第3ハッシュ値を前記第1ハッシュ関数ごとに選択し、
前記第4算出処理では、前記プロセッサは、前記各予測用入力データについて、前記第2選択処理によって前記第1ハッシュ関数ごとに選択された特定の重み付き第3ハッシュ値の各々を前記第2ハッシュ関数に与えることにより、前記第4ハッシュ値を複数算出し、
前記第2生成処理では、前記プロセッサは、前記第4算出処理によって算出された結果、前記特定の重み付き第3ハッシュ値の各々に対応する前記第4ハッシュ値を、odd−filteringを用いて集約することにより、前記予測用特徴ベクトルを生成することを特徴とする請求項8に記載のデータ分析装置。 - 前記第2生成処理では、前記プロセッサは、前記第4算出処理によって算出された結果、前記特定の第3ハッシュ値の各々に対応する前記第4ハッシュ値を、フォールディング計算を用いて集約することにより、前記予測用特徴ベクトルを生成することを特徴とする請求項8に記載のデータ分析装置。
- 前記プロセッサは、
前記第2生成処理によって生成された予測用特徴ベクトルと、前記学習パラメータと、を用いて、前記いずれかの第2データ項目の予測値を算出する予測値算出処理を実行することを特徴とする請求項8に記載のデータ分析装置。 - 前記予測値算出処理では、前記プロセッサは、前記教師データが2値である場合、前記第2生成処理によって生成された予測用特徴ベクトルと、前記学習パラメータと、を識別関数に与えることにより、前記いずれかの第2データ項目の予測値を算出することを特徴とする請求項11に記載のデータ分析装置。
- 前記予測値算出処理では、前記プロセッサは、前記教師データが多値または実数値である場合、前記第2生成処理によって生成された予測用特徴ベクトルと、前記学習パラメータと、を回帰関数に与えることにより、前記いずれかの第2データ項目の予測値を算出することを特徴とする請求項11に記載のデータ分析装置。
- 記憶デバイスにアクセス可能なプロセッサが実行するデータ分析方法であって、
前記データ分析方法は、
前記プロセッサが、
複数の第1データ項目の値を有する学習用入力データの集合である学習用入力データ群を前記記憶デバイスから取得する第1取得処理と、
各々固有の第1ハッシュテーブルを生成することにより第1ハッシュ関数を複数個設定する第1設定処理と、
前記第1取得処理によって取得された学習用入力データ群の各学習用入力データについて、前記第1設定処理によって設定された前記複数の第1ハッシュ関数の各々に与えることにより、前記複数の第1データ項目の値に対応する複数の第1ハッシュ値を前記第1ハッシュ関数ごとに算出する第1算出処理と、
前記各学習用入力データについて、前記第1算出処理によって前記第1ハッシュ関数ごとに算出された前記複数の第1ハッシュ値の中から所定の統計的条件を満たす特定の第1ハッシュ値を前記第1ハッシュ関数ごとに選択する第1選択処理と、
第2ハッシュテーブルを生成することにより第2ハッシュ関数を設定する第2設定処理と、
前記各学習用入力データについて、前記第1選択処理によって前記第1ハッシュ関数ごとに選択された特定の第1ハッシュ値の各々を前記第2設定処理によって設定された第2ハッシュ関数に与えることにより、第2ハッシュ値を複数算出する第2算出処理と、
前記第2算出処理によって算出された結果、前記特定の第1ハッシュ値の各々に対応する前記第2ハッシュ値を集約することにより、前記学習用入力データ群の特徴を示す学習用特徴ベクトルを生成する第1生成処理と、
を実行することを特徴とするデータ分析方法。 - 記憶デバイスにアクセス可能なプロセッサに、
複数の第1データ項目の値を有する学習用入力データの集合である学習用入力データ群を前記記憶デバイスから取得する第1取得処理と、
各々固有の第1ハッシュテーブルを生成することにより第1ハッシュ関数を複数個設定する第1設定処理と、
前記第1取得処理によって取得された学習用入力データ群の各学習用入力データについて、前記第1設定処理によって設定された前記複数の第1ハッシュ関数の各々に与えることにより、前記複数の第1データ項目の値に対応する複数の第1ハッシュ値を前記第1ハッシュ関数ごとに算出する第1算出処理と、
前記各学習用入力データについて、前記第1算出処理によって前記第1ハッシュ関数ごとに算出された前記複数の第1ハッシュ値の中から所定の統計的条件を満たす特定の第1ハッシュ値を前記第1ハッシュ関数ごとに選択する第1選択処理と、
第2ハッシュテーブルを生成することにより第2ハッシュ関数を設定する第2設定処理と、
前記各学習用入力データについて、前記第1選択処理によって前記第1ハッシュ関数ごとに選択された特定の第1ハッシュ値の各々を前記第2設定処理によって設定された第2ハッシュ関数に与えることにより、第2ハッシュ値を複数算出する第2算出処理と、
前記第2算出処理によって算出された結果、前記特定の第1ハッシュ値の各々に対応する前記第2ハッシュ値を集約することにより、前記学習用入力データ群の特徴を示す学習用特徴ベクトルを生成する第1生成処理と、
を実行させることを特徴とするデータ分析プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015029606A JP6334431B2 (ja) | 2015-02-18 | 2015-02-18 | データ分析装置、データ分析方法、およびデータ分析プログラム |
PCT/JP2015/077796 WO2016132588A1 (ja) | 2015-02-18 | 2015-09-30 | データ分析装置、データ分析方法、およびデータ分析プログラム |
US15/550,508 US11138515B2 (en) | 2015-02-18 | 2015-09-30 | Data analysis device, data analysis method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015029606A JP6334431B2 (ja) | 2015-02-18 | 2015-02-18 | データ分析装置、データ分析方法、およびデータ分析プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016151932A JP2016151932A (ja) | 2016-08-22 |
JP2016151932A5 JP2016151932A5 (ja) | 2017-04-27 |
JP6334431B2 true JP6334431B2 (ja) | 2018-05-30 |
Family
ID=56688863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015029606A Expired - Fee Related JP6334431B2 (ja) | 2015-02-18 | 2015-02-18 | データ分析装置、データ分析方法、およびデータ分析プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11138515B2 (ja) |
JP (1) | JP6334431B2 (ja) |
WO (1) | WO2016132588A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022260293A1 (ko) * | 2021-06-07 | 2022-12-15 | 주식회사 라인웍스 | 기계학습을 위한 의료데이터의 벡터화 방법, 이를 구현한 데이터 변환 장치 및 데이터 변환 프로그램 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7243084B2 (ja) * | 2018-08-31 | 2023-03-22 | 株式会社リコー | 学習方法、プログラムおよび学習装置 |
CN110889034A (zh) * | 2018-09-07 | 2020-03-17 | 台达电子工业股份有限公司 | 数据分析方法及数据分析系统 |
EP3621022A1 (en) | 2018-09-07 | 2020-03-11 | Delta Electronics, Inc. | Data analysis method and data analysis system thereof |
US11494644B2 (en) * | 2019-11-20 | 2022-11-08 | Rakuten Group, Inc. | System, method, and computer program for recommending items using a direct neural network structure |
US12118075B2 (en) * | 2020-05-28 | 2024-10-15 | Mcafee, Llc | Methods and apparatus to improve detection of malware in executable code |
US12038883B2 (en) * | 2022-06-16 | 2024-07-16 | Red Hat, Inc. | Distributed Storage System with machine learning model for selecting a hash function to map a data item to a storage device |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7739314B2 (en) * | 2005-08-15 | 2010-06-15 | Google Inc. | Scalable user clustering based on set similarity |
JP6028567B2 (ja) * | 2012-12-28 | 2016-11-16 | 富士通株式会社 | データ格納プログラム、データ検索プログラム、データ格納装置、データ検索装置、データ格納方法及びデータ検索方法 |
JP6164899B2 (ja) * | 2013-04-05 | 2017-07-19 | キヤノン株式会社 | ハッシュ値生成装置、システム、判定方法、プログラム、記憶媒体 |
US10318882B2 (en) * | 2014-09-11 | 2019-06-11 | Amazon Technologies, Inc. | Optimized training of linear machine learning models |
US9495655B2 (en) * | 2014-09-27 | 2016-11-15 | International Business Machines Corporation | Cross-domain multi-attribute hashed and weighted dynamic process prioritization |
-
2015
- 2015-02-18 JP JP2015029606A patent/JP6334431B2/ja not_active Expired - Fee Related
- 2015-09-30 WO PCT/JP2015/077796 patent/WO2016132588A1/ja active Application Filing
- 2015-09-30 US US15/550,508 patent/US11138515B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022260293A1 (ko) * | 2021-06-07 | 2022-12-15 | 주식회사 라인웍스 | 기계학습을 위한 의료데이터의 벡터화 방법, 이를 구현한 데이터 변환 장치 및 데이터 변환 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
WO2016132588A1 (ja) | 2016-08-25 |
US11138515B2 (en) | 2021-10-05 |
JP2016151932A (ja) | 2016-08-22 |
US20180032910A1 (en) | 2018-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6334431B2 (ja) | データ分析装置、データ分析方法、およびデータ分析プログラム | |
Kosinski et al. | Mining big data to extract patterns and predict real-life outcomes. | |
Bolón-Canedo et al. | Feature selection for high-dimensional data | |
Fan et al. | Challenges of big data analysis | |
Chi et al. | Splitting methods for convex clustering | |
JP6371870B2 (ja) | 機械学習サービス | |
Dempster et al. | Hydra: Competing convolutional kernels for fast and accurate time series classification | |
CN111080360B (zh) | 行为预测方法、模型训练方法、装置、服务器及存储介质 | |
CN109492180A (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
EP2700049A2 (en) | Predictive modeling | |
CN110147502B (zh) | 基于大数据分析的产品推荐方法、装置、介质及服务器 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
WO2013033229A1 (en) | System and method for providing personalized recommendations | |
Yang et al. | Categorical omega with small sample sizes via bayesian estimation: An alternative to frequentist estimators | |
US20240143838A1 (en) | Apparatus and a method for anonymizing user data | |
Raval et al. | A semiparametric discrete choice model: An application to hospital mergers | |
CN110288444B (zh) | 实现用户相关推荐的方法和系统 | |
Fursov et al. | Sequence embeddings help detect insurance fraud | |
CN115222443A (zh) | 客户群体划分方法、装置、设备及存储介质 | |
Praveena et al. | An approach to remove duplication records in healthcare dataset based on Mimic Deep Neural Network (MDNN) and Chaotic Whale Optimization (CWO) | |
Chang et al. | Interpretable (not just posthoc-explainable) medical claims modeling for discharge placement to reduce preventable all-cause readmissions or death | |
CN112529636A (zh) | 商品推荐方法、装置、计算机设备及介质 | |
CN114581177B (zh) | 产品推荐方法、装置、设备及存储介质 | |
US20210133853A1 (en) | System and method for deep learning recommender | |
Theodorou et al. | Synthesize extremely high-dimensional longitudinal electronic health records via hierarchical autoregressive language model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170321 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170321 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6334431 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |