JP7209378B2 - 分散データ統合装置、分散データ統合解析装置、分散データ統合方法、及びプログラム - Google Patents
分散データ統合装置、分散データ統合解析装置、分散データ統合方法、及びプログラム Download PDFInfo
- Publication number
- JP7209378B2 JP7209378B2 JP2020563129A JP2020563129A JP7209378B2 JP 7209378 B2 JP7209378 B2 JP 7209378B2 JP 2020563129 A JP2020563129 A JP 2020563129A JP 2020563129 A JP2020563129 A JP 2020563129A JP 7209378 B2 JP7209378 B2 JP 7209378B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- function
- analysis target
- anchor
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2134—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
- G06F18/21345—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis enforcing sparsity or involving a domain transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2137—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2018年12月26日に、日本に出願された特願2018-243376号に基づき優先権を主張し、その内容をここに援用する。
秘匿情報が含まれる分散されたデータを解析する技術として、例えば、医療情報等の秘匿対象のデータを保護しながら、開示可能なデータを開示して解析しつつ、その結果得られた情報をアクセスレベルが異なる者や組織等の間でデータ通信を行うデータ解析装置が知られている(特許文献1)。
また、本発明の一態様は、上記の分散データ統合装置において、前記第1関数は、教師なし次元削減法、教師あり次元削減法、教師なし次元削減法若しくは教師あり次元削減法に非線形カーネル版を用いた非線形次元削減法、又はオートエンコーダのいずれか1つによってデータを変換する関数である。
また、本発明の一態様は、上記の分散データ統合装置において、前記第1関数は、教師なし次元削減法として主成分分析、局所性保存射影、又はt分布型確率的近傍埋め込み法のいずれか1つによってデータを変換する関数である。
また、本発明の一態様は、上記の分散データ統合装置において、前記第1関数は、教師あり次元削減法として線形判別分析、local FDA、又はsemi-supervised LFDAのうちいずれか1つによってデータを抽象化する関数である。
また、本発明の一態様は、上記の分散データ統合装置によって前記解析対象中間表現が前記第2関数によって変換された結果であるデータコラボレーション表現を前記解析対象データについて統合し解析を行う分散データ統合解析装置である。
[統合データ解析IAの概要]
以下、図面を参照しながら本発明の実施形態について詳しく説明する。図1は、本実施形態に係る統合データ解析システムSSの概略の一例を示す図である。
元データD1~D4は、統合データ解析システムSSにおける解析の対象となるデータである。元データD1~D4は、複数の解析対象データの一例である。元データD1~D4は、サーバ1-1~1-4に分散されてそれぞれ保持される。サーバ1-1~1-4は、例えば、医療機関のサーバである。元データD1~D4は、例えば、患者の個人情報などの秘匿情報を含む医療データである。
図2は、本実施形態に係る統合データ解析システムSSの構成の一例を示す図である。
統合データ解析システムSSは、サーバ1-i(i=1、2、・・・、n:nは元データの数)と、分散データ統合装置2と、解析装置3とを備える。なお、以下では、サーバ1-i(i=1、2、・・・、n:nは元データの数)などの記載を単にサーバ1-1~1-nなどと記載することがある。
サーバ1-1は、元データD1を第1関数f1によって元データ中間表現IR1に変換する。第1関数f1は、元データD1を抽象化する線形もしくは非線形の関数である。ここで抽象化は、例えば、教師なし次元削減法である主成分分析(Principal Component Analysis:PCA)、局所性保存射影(Locality Preserving Projection:LPP)、t分布型確率的近傍埋め込み法(T-distributed Stochastic Neighbor Embedding:t-SNE)など、教師あり次元削減法である線形判別分析(Fisher Discriminant Analysis:FDA)、local FDA(LFDA)、semi-supervised LFDA(SELF)など、またこれらに非線形カーネル版を用いた非線形次元削減法、及びディープニューラルネットワークにおいて用いられるオートエンコーダなどによって実行される。なお、サーバ1-1は、元データD1から秘匿情報を除いた後に、秘匿情報が除かれた元データD1を元データ中間表現IR1に変換してよい。
元データ中間表現IR1は、解析対象データが第1関数によって変換されて得られる中間表現である解析対象中間表現の一例である。
つまり、算出部22は、アンカーデータ中間表現AIR1~AIRnが第2関数g1~gnによって変換された結果である変換後データG1~Gnを相互に一致させるように第2関数g1~gnを算出する。
なお、分散された元データD1~Dnの数は、最小化問題を解く際の精度の点において、所定の数以上であることが好ましい。
図3は、本実施形態に係る各データの一例を示す図である。図3では、分散された解析対象データが元データD1、及び元データD2の2つである場合の一例である。
元データD1は、5次元のデータdata11及びデータdata12を含む。データdata11の成分は[2、1、5、3、2]であり、データdata12の成分は[4、1、2、1、3]である。元データD2は、5次元のデータdata21及びデータdata22を含む。データdata21の成分は[1、2、4、3、2]であり、データdata22の成分は[3、2、1、5、2]である。
5次元のデータであるアンカーデータADの成分は、[1、2、3、4、5]である。
一方、抽象化の結果、データdata21及びデータdata22は、元データ中間表現IR2である3次元のデータ[1.5、3.0、2.5]、及び[2.5、1.5、3.5]に変換される。サーバ1-2に供給されるアンカーデータADは、アンカーデータ中間表現AIR2である3次元のデータ[1.5、2.5、4.5]に変換される。
一方、元データD2(データdata21及びデータdata22)は、データコラボレーション表現CR2である3次元のデータ[1.5、2.0、2.5]及び「2.5、0.5、3.5」に変換される。アンカーデータ中間表現AIR2は、変換後データG2として3次元のデータ[1.5、1.5、4.5]に変換される。
また、元データ中間表現IR1~IRnを得る変換とは、抽象化に限らない。例えば、元データ中間表現IR1~IRnを得る変換は、元データD1~Dnの次元を増やす変換であってもよい。
図4は、本実施形態に係る分散データ統合装置2の処理の一例を示す図である。
本実施形態では、一例として、遺伝子発現データによって白血病の種類を3クラスに分類するクラス分類問題を扱う。当該クラス分類問題では、38個の学習用データが、2つに分割されて、元データD1及び元データD2として、サーバ1-1、及びサーバ1-2にそれぞれ保持されている。ここで学習用データでは、遺伝子発現データに関する複数の種類の特徴量と、白血病の種類とが検体毎に対応づけられている。
以下、図4の説明において、数nは2である。
つまり、取得部20は、分散している複数の解析対象データの統合において共通に用いられるデータであるアンカーデータが第1関数f1~fnによって変換されて得られる中間表現であるアンカーデータ中間表現AIR1~AIRn、及び解析対象データ(この一例において、元データD1~Dn)が第1関数f1~fnによって変換されて得られる中間表現である解析対象中間表現(この一例において、元データ中間表現IR1~IRn)を、解析対象データ毎に取得する。
つまり、算出部22は、アンカーデータ変換部21によって変換されたアンカーデータ中間表現AIR1~AIRn相互間の差を最小にする元データD1~Dn毎の第2関数g1~gnを算出する。
算出部22は、算出した第2関数g1~gnを解析対象データ変換部23に供給する。
つまり、解析対象データ変換部23は、取得部20によって取得された解析対象中間表現を、算出部22によって算出された第2関数g1~gnによって解析対象データ毎に変換する。
解析対象データ変換部23は、変換して得られたデータコラボレーション表現CR1~CRnを解析装置3に供給する。
図5は、本実施形態に係る統合データ解析IA1の結果の一例を示す図である。図5では、遺伝子発現データに関する複数種類の特徴量のうち3種類の特徴量を示す3次元空間において、検体毎のデータが示されている。クラスC1~C3は、白血病の種類に対応し、検体毎のデータが白血病の種類毎に分類されている。クラスC1~C3に含まれるデータは互いに重なっていないほど解析精度が高い。
LPPは、式(1)に示すように定式化される。
ここで図6及び図7を参照し、本実施形態の統合データ解析IA1との比較のために、従来の標準規格化による統合データSD0を用いた統合データ解析IA0について説明する。
図6は、従来の標準規格化による統合データSD0を用いた統合データ解析IA0の一例を示す図である。分散された元データD10及び元データD20は、各サーバにおいて、予め規定された標準規格化によって変換される。標準規格化によって変換された元データD10及び元データD20は、標準規格化による統合データSD0として統合される。標準規格化による統合データSD0が、統合データ解析IA0によって解析される。
図5の本実施形態の統合データ解析IA1の解析精度と、2つに分散された学習データのうち一方のデータを用いたKernel LSPC法の解析精度とを比較すると、本実施形態の統合データ解析IA1の方が解析精度の方が、2つに分散された学習データのうち一方のみのデータを用いたKernel LSPC法の解析精度に比べて高いことがわかる。
この空間とは、10種類の特徴量を示す空間であり、空間の次元は10次元である。なお、図8から図9に示す例では、10種類の特徴量のうち8種類は、乱数を用いてランダムに値が設定されており、残りの2種類に対応する平面上において学習データや解析結果が示されている。
機械学習とは、一例としてKernel LSPC法である。なお、機械学習としては、教師あり学習であればいずれの機械学習の手法が用いられてもよい。
図8(A)では、平面が3つの領域に分けられており、平面を領域に分ける問題において正解となる領域の分け方を示している。図8(B)、(C)、及び(D)に示す学習データは、平面において3つの領域のいずれかに属する複数の点の分布が、正解となる領域の境界を示す閉曲線とともに示されている。ここで複数の点の分布は、属する領域に応じて異なる態様において示されている。複数の点の数は、図8(B)、(C)、及び(D)それぞれについて40個である。図8(B)、(C)、及び(D)に示す学習データは、分散している複数の解析対象データに対応する。
また、図11に、分散している学習データを個別に用いた場合の解析結果を示す。図11(A)、(B)、及び(C)は、図8(B)、(C)、及び(D)に示す学習データがそれぞれ個別に用いられて機械学習による解析が実行された場合の結果である。
以上に説明したように、本実施形態に係る分散データ統合装置2は、取得部20と、アンカーデータ変換部21と、算出部22と、解析対象データ変換部23とを備える。
取得部20は、分散している複数の解析対象データ(この一例において、元データD1~Dn)の統合において共通に用いられるデータであるアンカーデータADが第1関数f1~fnによって変換されて得られる中間表現であるアンカーデータ中間表現AIR1~AIRn、及び解析対象データ(この一例において、元データD1~Dn)が第1関数f1~fnによって変換されて得られる中間表現である解析対象中間表現(この一例において、元データ中間表現IR1~IRn)を、解析対象データ(この一例において、元データD1~Dn)毎に取得する。
従来の標準規格化を用いた分散データの統合解析では、解析対象を考慮し必要なデータの標準規格を制定する必要がある。標準規格を制定することは、元データの種類が多い場合や解析目的が多岐に渡る場合に困難となる。また、将来、元データの種類が増加したり、新たな解析目的が生じたりすることが予想され、標準規格を制定することはますます困難となる。
この構成により、本実施形態に係る分散データ統合装置2では、分散されて保持される元データを抽象化できるため、分散されて保持される複数のデータについて抽象化を用いてデータを共有せずに統合解析を行うことができる。
この構成により、本実施形態に係る分散データ統合装置2では、アンカーデータADに含まれる属性に複数の解析対象データ(この一例において、元データD1~Dn)に含まれる属性の全てが含まれない場合に比べて統合データ解析IAの精度を高くすることができる。
また、上述した実施形態における分散データ統合装置2の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。分散データ統合装置2の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
Claims (9)
- 分散している複数の解析対象データの統合において共通に用いられるデータであるアンカーデータが第1関数によって変換されて得られる中間表現であるアンカーデータ中間表現、及び前記解析対象データが前記第1関数によって変換されて得られる中間表現である解析対象中間表現を、前記解析対象データ毎に取得する取得部と、
前記取得部によって取得された前記複数の前記アンカーデータ中間表現を第2関数によって前記解析対象データ毎に変換するアンカーデータ変換部と、
前記アンカーデータ変換部によって変換された前記アンカーデータ中間表現相互間の差を小さくする前記解析対象データ毎の前記第2関数を算出する算出部と、
前記取得部によって取得された前記解析対象中間表現を、前記算出部によって算出された前記第2関数によって前記解析対象データ毎に変換する解析対象データ変換部と、
を備える分散データ統合装置。 - 前記第1関数は、データを抽象化する関数である
請求項1に記載の分散データ統合装置。 - 前記第1関数は、教師なし次元削減法、教師あり次元削減法、教師なし次元削減法若しくは教師あり次元削減法に非線形カーネル版を用いた非線形次元削減法、又はオートエンコーダのいずれか1つによってデータを変換する関数である
請求項1に記載の分散データ統合装置。 - 前記第1関数は、教師なし次元削減法として主成分分析、局所性保存射影、又はt分布型確率的近傍埋め込み法のいずれか1つによってデータを変換する関数である
請求項3に記載の分散データ統合装置。 - 前記第1関数は、教師あり次元削減法として線形判別分析、local FDA、又はsemi-supervised LFDAのうちいずれか1つによってデータを抽象化する関数である
請求項3に記載の分散データ統合装置。 - 前記アンカーデータに含まれる属性には、前記複数の前記解析対象データに含まれる属性の全てが含まれる
請求項1から請求項5のいずれか一項に記載の分散データ統合装置。 - 請求項1から請求項6のいずれか一項に記載の分散データ統合装置によって前記解析対象中間表現が前記第2関数によって変換された結果であるデータコラボレーション表現を前記解析対象データについて統合し解析を行う
分散データ統合解析装置。 - 分散している複数の解析対象データの統合において共通に用いられるデータであるアンカーデータが第1関数によって変換されて得られる中間表現であるアンカーデータ中間表現、及び前記解析対象データが前記第1関数によって変換されて得られる中間表現である解析対象中間表現を、前記解析対象データ毎に取得する取得過程と、
前記取得過程によって取得された前記複数の前記アンカーデータ中間表現を第2関数によって前記解析対象データ毎に変換するアンカーデータ変換過程と、
前記アンカーデータ変換過程によって変換された前記アンカーデータ中間表現相互間の差を小さくする前記解析対象データ毎の前記第2関数を算出する算出過程と、
前記取得過程によって取得された前記解析対象中間表現を、前記算出過程によって算出された前記第2関数によって前記解析対象データ毎に変換する解析対象データ変換過程と
をコンピュータが実行する分散データ統合方法。 - コンピュータに、
分散している複数の解析対象データの統合において共通に用いられるデータであるアンカーデータが第1関数によって変換されて得られる中間表現であるアンカーデータ中間表現、及び前記解析対象データが前記第1関数によって変換されて得られる中間表現である解析対象中間表現を、前記解析対象データ毎に取得する取得ステップと、
前記取得ステップによって取得された前記複数の前記アンカーデータ中間表現を第2関数によって前記解析対象データ毎に変換するアンカーデータ変換ステップと、
前記アンカーデータ変換ステップによって変換された前記アンカーデータ中間表現相互間の差を小さくする前記解析対象データ毎の前記第2関数を算出する算出ステップと、
前記取得ステップによって取得された前記解析対象中間表現を、前記算出ステップによって算出された前記第2関数によって前記解析対象データ毎に変換する解析対象データ変換ステップと
を実行させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018243376 | 2018-12-26 | ||
JP2018243376 | 2018-12-26 | ||
PCT/JP2019/049551 WO2020137728A1 (ja) | 2018-12-26 | 2019-12-18 | 分散データ統合装置、分散データ統合方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2020137728A1 JPWO2020137728A1 (ja) | 2021-11-18 |
JPWO2020137728A5 JPWO2020137728A5 (ja) | 2022-06-23 |
JP7209378B2 true JP7209378B2 (ja) | 2023-01-20 |
Family
ID=71126298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020563129A Active JP7209378B2 (ja) | 2018-12-26 | 2019-12-18 | 分散データ統合装置、分散データ統合解析装置、分散データ統合方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11934558B2 (ja) |
JP (1) | JP7209378B2 (ja) |
WO (1) | WO2020137728A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014010202A1 (ja) | 2012-07-12 | 2014-01-16 | 日本電気株式会社 | 暗号化統計処理システム、復号システム、鍵生成装置、プロキシ装置、暗号化統計データ生成装置、暗号化統計処理方法、および、暗号化統計処理プログラム |
JP2016027391A (ja) | 2014-06-25 | 2016-02-18 | 公立大学法人広島市立大学 | 秘匿ベクトル内積計算システム、データ処理装置、秘匿ベクトル内積計算方法、秘匿ベクトル内積プログラム、および、記録媒体 |
WO2018124104A1 (ja) | 2016-12-26 | 2018-07-05 | 国立大学法人大阪大学 | データ解析方法およびデータ解析システム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030210820A1 (en) * | 2002-05-07 | 2003-11-13 | Rainer Lachner | Method and device for localizing a structure in a measured data set |
JP2006086568A (ja) * | 2004-09-14 | 2006-03-30 | Sony Corp | 情報処理方法、復号処理方法、および情報処理装置、並びにコンピュータ・プログラム |
US20090018407A1 (en) * | 2007-03-30 | 2009-01-15 | Searete Llc, A Limited Corporation Of The State Of Delaware | Computational user-health testing |
JP5844715B2 (ja) | 2012-11-07 | 2016-01-20 | 学校法人沖縄科学技術大学院大学学園 | データ通信システム、データ解析装置、データ通信方法、および、プログラム |
US10956603B2 (en) * | 2016-04-07 | 2021-03-23 | Samsung Electronics Co., Ltd. | Private dataaggregation framework for untrusted servers |
CN109716345B (zh) * | 2016-04-29 | 2023-09-15 | 普威达有限公司 | 计算机实现的隐私工程系统和方法 |
US10037437B1 (en) * | 2017-06-09 | 2018-07-31 | Microsoft Technology Licensing, Llc | Identifying cohorts with anomalous confidential data submissions using matrix factorization and completion techniques |
US10262154B1 (en) * | 2017-06-09 | 2019-04-16 | Microsoft Technology Licensing, Llc | Computerized matrix factorization and completion to infer median/mean confidential values |
WO2019207176A1 (es) * | 2018-04-25 | 2019-10-31 | Seddi, Inc. | Modelado de dinámica de tejido blando no lineal para avatares interactivos |
KR102035796B1 (ko) * | 2018-07-26 | 2019-10-24 | 주식회사 딥핑소스 | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
-
2019
- 2019-12-18 JP JP2020563129A patent/JP7209378B2/ja active Active
- 2019-12-18 US US17/309,845 patent/US11934558B2/en active Active
- 2019-12-18 WO PCT/JP2019/049551 patent/WO2020137728A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014010202A1 (ja) | 2012-07-12 | 2014-01-16 | 日本電気株式会社 | 暗号化統計処理システム、復号システム、鍵生成装置、プロキシ装置、暗号化統計データ生成装置、暗号化統計処理方法、および、暗号化統計処理プログラム |
JP2016027391A (ja) | 2014-06-25 | 2016-02-18 | 公立大学法人広島市立大学 | 秘匿ベクトル内積計算システム、データ処理装置、秘匿ベクトル内積計算方法、秘匿ベクトル内積プログラム、および、記録媒体 |
WO2018124104A1 (ja) | 2016-12-26 | 2018-07-05 | 国立大学法人大阪大学 | データ解析方法およびデータ解析システム |
Also Published As
Publication number | Publication date |
---|---|
US20220075898A1 (en) | 2022-03-10 |
US11934558B2 (en) | 2024-03-19 |
JPWO2020137728A1 (ja) | 2021-11-18 |
WO2020137728A1 (ja) | 2020-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Martino et al. | A k-means procedure based on a Mahalanobis type distance for clustering multivariate functional data | |
Gorokhov et al. | Convolutional neural networks for unsupervised anomaly detection in text data | |
Chen et al. | A novel information-theoretic approach for variable clustering and predictive modeling using Dirichlet process mixtures | |
Du | Dimensionality reduction techniques for visualizing morphometric data: Comparing principal component analysis to nonlinear methods | |
AU2018271286A1 (en) | Systems and methods for obtaining optimal mother wavelets for facilitating machine learning task | |
US8185480B2 (en) | System and method for optimizing pattern recognition of non-gaussian parameters | |
Shen et al. | Identity management based on PCA and SVM | |
WO2022055964A1 (en) | Generating realistic counterfactuals with residual generative adversarial nets | |
JP7209378B2 (ja) | 分散データ統合装置、分散データ統合解析装置、分散データ統合方法、及びプログラム | |
JP7116969B2 (ja) | 2次元マップ生成装置、2次元マップ生成方法および2次元マップ生成用プログラム | |
JP5569698B2 (ja) | 類型化装置、類型化方法及び類型化プログラム | |
KR102145858B1 (ko) | 문서 이미지로부터 인식된 용어를 표준화하기 위한 방법 | |
WO2020022498A1 (ja) | クラスタリング装置、方法、及びプログラム | |
CN116821299A (zh) | 智能问答方法、智能问答装置、设备及存储介质 | |
US20230023636A1 (en) | Methods and systems for preparing unstructured data for statistical analysis using electronic characters | |
Martín-Merino et al. | Visualizing asymmetric proximities with SOM and MDS models | |
Mishra et al. | Performance analysis of dimensionality reduction techniques: a comprehensive review | |
Gahmousse et al. | Handwriting based personality traits identification using adaptive boosting and textural features | |
Anibal et al. | HAL-X: Scalable hierarchical clustering for rapid and tunable single-cell analysis | |
Kitazono et al. | t-Distributed stochastic neighbor embedding with inhomogeneous degrees of freedom | |
JP7024262B2 (ja) | 学習方法、学習結果の利用方法、学習プログラムおよび学習装置 | |
Münch et al. | Encoding of indefinite proximity data: A structure preserving perspective | |
Sánchez-Gutiérrez et al. | Addressing the class imbalance in tabular datasets from a generative adversarial network approach in supervised machine learning | |
Khan | Privacy in the age of autonomous systems | |
CN113806356B (zh) | 数据识别方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220614 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220614 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7209378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |