JP6926429B2 - データ処理装置、データ処理方法、およびプログラム - Google Patents

データ処理装置、データ処理方法、およびプログラム Download PDF

Info

Publication number
JP6926429B2
JP6926429B2 JP2016188910A JP2016188910A JP6926429B2 JP 6926429 B2 JP6926429 B2 JP 6926429B2 JP 2016188910 A JP2016188910 A JP 2016188910A JP 2016188910 A JP2016188910 A JP 2016188910A JP 6926429 B2 JP6926429 B2 JP 6926429B2
Authority
JP
Japan
Prior art keywords
data
attribute
prediction
prediction model
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016188910A
Other languages
English (en)
Other versions
JP2018054765A (ja
Inventor
善行 後藤
善行 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016188910A priority Critical patent/JP6926429B2/ja
Priority to US15/716,603 priority patent/US20180089574A1/en
Publication of JP2018054765A publication Critical patent/JP2018054765A/ja
Application granted granted Critical
Publication of JP6926429B2 publication Critical patent/JP6926429B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、機械学習を行なうシステムに学習用データを提供するための、データ処理装置、およびデータ処理方法に関し、更には、これらを実現するためのプログラムに関する。
近年、機械学習を利用して、保有するデータを企業運営に活用するという取り組みが盛んに行われている。機械学習とは、コンピュータによって、蓄積されたデータに基づいて、規則性を見出し、判断又は予測を行う技術である。機械学習は、例えば、商品の需要予測、販売価格の予測、物流管理等に利用されつつある。
例えば、特許文献1は、機械学習によって過去の観測値を学習することによって、観測値を精度良く予測する方法を開示している。また、非特許文献1は、数千万以上の大規模データを分析し、混在する規則性を発見する分散版異種混合学習技術を開示している。
また、これらの機械学習を実行するためには、通常、大量のデータ分析が行なう必要があり、高性能なコンピューティングシステムが必要となることから、非特許文献1においては、分散コンピューティング環境が活用されている。また、非特許文献2及び3は、高性能なコンピューティングシステムの利用を容易にするため、クラウドコンピューティング環境によって機械学習プラットフォームを提供するクラウドサービスを提案している。
ところで、クラウドシステムによる機械学習サービスを利用する場合は、利用者はデータを、インターネットを介して、サービスを提供するクラウドシステム側に送信する必要がある。このため、クラウドサービスを提供する事業者側では、システムの脆弱性のチェック、データベース及び通信路における暗号化といった、セキュリティ対策が採用されている。
また、利用者側からのセキュリティ対策を図るために、特許文献2は、ユーザからクラウドシステムに送信されるデータに暗号化処理を行なうシステムを提案している。特許文献2に開示されたシステムによれば、暗号化されたデータのみが、ユーザからクラウドシステムに送信されることになる。
特開2015−82259号公報 特表2016−512612号公報
NEC,"NEC、超大規模データから高速に規則性を発見できる人工知能(AI)技術を開発",[online],平成28年5月16日,NEC ホームページ プレスリリース,[平成28年8月16日検索],インターネット<URL:http://jpn.nec.com/press/201605/20160526_01.html> Google Cloud Platform,"Google Cloud Machine Learning", [online],[平成28年8月16日検索],インターネット<URL:https://cloud.google.com/ml/> Microsoft,"Microsoft Azure", [online],[平成28年8月16日検索],インターネット<URL:https://azure.microsoft.com/ja-jp/services/machine-learning/>
しかしながら、上記特許文献2に開示されたシステムを採用した場合は、事業者側のシステムは、データを受信する度に復号処理を行なう必要があり、システムにかかる負荷が増加してしまう。そして、送信されてくるデータの量が、増加すると、それに応じて、システムの負担が大きくなり、業務処理の性能に悪影響が与えられてしまう。また、クラウドサービスの提供形態によっては、復号処理をクラウドサービス上の分析アプリケーションに実装できない可能性もある。
本発明の目的の一例は、上記問題を解消し、機械学習に用いるデータが暗号化されていても、機械学習を行なうシステムが、復号処理を行なうことなく、機械学習を行なえるようにし得る、データ処理装置、データ処理方法、およびプログラムを提供することにある。
上記目的を達成するため、本発明の一側面におけるデータ処理装置は、機械学習を行なって予測モデルを生成するシステムに学習用データを提供するための装置であって、
外部から入力された前記学習用データを取得する、データ取得部と、
暗号化されていない前記学習用データから生成された予測モデルと、暗号化された前記学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、前記学習用データを暗号化する、暗号化部と、
暗号化された前記学習用データを前記システムへと出力する、データ出力部と、
を備えている、
ことを特徴とする。
また、上記目的を達成するため、本発明の一側面におけるデータ処理方法は、機械学習を行なって予測モデルを生成するシステムに学習用データを提供するための方法であって、
(a)外部から入力された前記学習用データを取得する、ステップと、
(b)暗号化されていない前記学習用データから生成された予測モデルと、暗号化された前記学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、前記学習用データを暗号化する、ステップと、
(c)暗号化された前記学習用データを前記システムへと出力する、ステップと、
を有する、ことを特徴とする。
更に、上記目的を達成するため、本発明の一側面におけるプログラムは、機械学習を行なって予測モデルを生成するシステムに、コンピュータによって、学習用データを提供するためのプログラムであって、
前記コンピュータに、
(a)外部から入力された前記学習用データを取得する、ステップと、
(b)暗号化されていない前記学習用データから生成された予測モデルと、暗号化された前記学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、前記学習用データを暗号化する、ステップと、
(c)暗号化された前記学習用データを前記システムへと出力する、ステップと、
を実行させることを特徴とする。
以上のように、本発明によれば、機械学習に用いるデータが暗号化されていても、機械学習を行なうシステムが、復号処理を行なうことなく、機械学習を行なえるようにすることができる。
図1は、本発明の実施の形態におけるデータ処理装置の概略構成を示すブロック図である。 図2は、本発明の実施の形態におけるデータ処理装置の具体的構成を示すブロック図である。 図3は、本発明の実施の形態におけるデータ処理装置による学習用データの暗号化処理を示すフロー図である。 図4は、本発明の実施の形態で用いられる学習用データの一例を示す図である。 図5は、本発明の実施の形態において属性名が暗号化された学習用データの一例を示す図である。 図6は、本発明の実施の形態において特定の属性が標準化された学習用データの一例を示す図である。 図7は、本発明の実施の形態において特定の属性が二値化された学習用データの一例を示す図である。 図8は、本発明の実施の形態においての分析アプリケーションによる予測モデルの生成処理を示すフロー図である。 図9は、本発明の実施の形態において分析アプリケーションによって標準化された学習用データの一例を示す図である。 図10は、本発明の実施の形態において分析アプリケーションによって二値化された学習用データの一例を示す図である。 図11は、本発明の実施の形態において生成される予測モデルの一例を示す図である。 図12は、本発明の実施の形態におけるデータ処理装置による予測用データの暗号化処理を示すフロー図である。 図13は、本発明の実施の形態で用いられる予測用データの一例を示す図である。 図14は、本発明の実施の形態において属性名が暗号化された予測用データの一例を示す図である。 図15は、本発明の実施の形態において特定の属性が標準化された予測用データの一例を示す図である。 図16は、本発明の実施の形態において特定の属性が二値化された予測用データの一例を示す図である。 図17は、本発明の実施の形態においての予測アプリケーションによる予測処理を示すフロー図である。 図18は、本発明の実施の形態において予測アプリケーションによって標準化された予測用データの一例を示す図である。 図19は、本発明の実施の形態において予測アプリケーションによって二値化された学習用データの一例を示す図である。 図20は、本発明の実施の形態において予測アプリケーションによって予測された結果の一例を示す図である。 図21は、本発明の実施の形態におけるデータ処理装置による予測モデルの可視化処理を示すフロー図である。 図22は、本発明の実施の形態において二値化対象属性が復号された予想モデルの一例を示す図である。 図23は、本発明の実施の形態において標準化対象属性が復号された予測モデルの一例を示す図である。 図24は、本発明の実施の形態において属性名が復号された予測モデルの一例を示す図である。 図25は、本発明の実施の形態におけるデータ処理装置を実現するコンピュータの一例を示すブロック図である。
(発明の概要)
本発明は、クラウドコンピューティング環境によって機械学習プラットフォームを提供するクラウドサービスで有用であり、例えば、クラウドサービス上の分析アプリケーションで行われる学習処理が、前処理と分析処理との2工程を有する場合に有用である。この場合において、本発明では、非暗号化データを用いた前処理の結果と、暗号化データを用いた前処理の結果とが、同一とになるように、データに対して暗号化が行なわれる。
そして、本発明では、クラウドサービス上の分析アプリケーションは、暗号化された入力データに対して前処理及び分析処理を行って、予測モデルを生成するが、この予測モデルは、非暗号化データを用いて生成された予測モデルと同一のものである。このため、本発明によれば、最低限の暗号化処理コストで、非暗号化時と同一の学習処理結果を得ることができる。また、本発明によれば、利用者は、クラウドサービスを提供する事業者に全く依存することなく、セキュリティを確保できる。
(実施の形態)
以下、本発明の実施の形態における、データ処理装置、データ処理方法、及びプログラムについて、図1〜図25を参照しながら説明する。
[装置構成]
最初に、本実施の形態におけるデータ処理装置の構成について図1を参照しながら説明する。図1は、本発明の実施の形態におけるデータ処理装置の概略構成を示すブロック図である。
図1に示す本実施の形態におけるデータ処理装置100は、機械学習を行なって予測モデルを生成するクラウドシステム200に学習用データを提供するための装置である。図1に示すように、本実施の形態では、データ処理装置100には、ユーザが使用する端末装置300が接続されている。また、データ処理装置100は、インターネット400を介して、クラウドシステム200に接続されている。
また、図1に示すように、データ処理装置100は、データ取得部10と、暗号化部20と、データ出力部30とを備えている。このうち、データ取得部10は、外部の端末装置300から入力された学習用データを取得する。
暗号化部20は、暗号化されていない学習用データから生成された予測モデルと、暗号化された学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、学習用データを暗号化する。データ出力部30は、暗号化された学習用データをクラウドシステム200へと出力する。
このように、本実施の形態では、クラウドシステム200は、学習用データが暗号化されている場合でも、暗号化されていない場合と同様の予測モデルを生成する。このため、本実施の形態によれば、機械学習に用いるデータが暗号化されていても、機械学習を行なうクラウドシステム200は、復号処理を行なうことなく、機械学習を行なうことができる。従って、学習用データの量が増大した場合であっても、クラウドシステムにおける負担の増大が抑制される。
続いて、図2を用いて、本実施の形態におけるデータ処理装置の構成をより具体的に説明する。図2は、本発明の実施の形態におけるデータ処理装置の具体的構成を示すブロック図である。
図2に示すように、本実施の形態では、クラウドシステム200は、分析アプリケーション210と、予測アプリケーション220とを備えている。分析アプリケーション210及び予測アプリケーション220は、共に、クラウドシステム200上に配備されたWebアプリケーションである。
分析アプリケーション210は、インターネット400を経由して、データ処理装置100から、暗号化された学習用データを受け取り、受け取った学習用データに基づいて、予測モデルを生成する。また、分析アプリケーション210は、インターネット400を経由して、生成した予測モデルを分析結果記憶装置230に渡す。予測モデルは、後述するように、ユーザが目視によって確認できるようにするため、復号される。
具体的には、分析アプリケーション210は、標準化コンポーネント211と、二値化コンポーネント212と、分析エンジン213とを備えている。このうち、標準化コンポーネント211は、学習用データの特定の属性に所属するデータ値を特定のルールに沿って標準化する。二値化コンポーネント212は、学習用データの標準化されていない属性に所属データ値を二値化する。分析エンジン213は、標準化及び二値化が行なわれた学習用データを用いて、予測モデルを生成する。
また、予測アプリケーション220は、インターネット400を経由して、データ処理装置100から、暗号化された予測用データを受け取ると、分析結果記憶装置230から予測モデルを取得し、取得した予測モデルを用いて、予測処理を実行する。また、予測アプリケーション220は、インターネット400を経由して、予測結果を予測結果記憶装置240に渡す。
具体的には、予測アプリケーション220は、標準化コンポーネント221と、二値化コンポーネント222と、分析エンジン223とを備えている。このうち、標準化コンポーネント221は、予測用データの特定の属性に所属するデータ値を特定のルールに沿って標準化する。二値化コンポーネント222は、予測用データの標準化されていない属性に所属するデータ値を二値化する。分析エンジン223は、標準化及び二値化が行なわれた予測用データを予測モデルに当てはめて、データを予測する。
分析結果記憶装置230は、インターネット400上に配置された一般的なデータベースである。分析結果記憶装置230は、インターネット400を経由して、クラウドシステム200の分析アプリケーション210から、分析プロセス定義と共に予測モデルを受け取り、これらを格納する。
また、分析結果記憶装置230は、予測アプリケーション220からの求めに応じて、分析プロセス定義及び予測モデルを出力する。更に、分析結果記憶装置230は、ローカルネットワークを経由して、データ処理装置100に接続されており、データ処理装置100の復号部40に予測モデルを渡す。
予測結果記憶装置240も、分析結果記憶装置230と同様に、インターネット400上に配置された一般的なデータベースである。予測結果記憶装置240は、インターネット400を経由して、クラウドシステム200の予測アプリケーション220から予測結果を受け取り、これを格納する。
また、本実施の形態では、ユーザの使用する端末装置300は、学習用データ入力部310と、予測用データ入力部320と、分析プロセス定義入力部330と、予測モデル可視化部340とを備えている。
このうち、学習用データ入力部310は、学習用データのファイルをデータ処理装置100に入力する。予測用データ入力部320は、予測用データのファイルをデータ処理装置100に入力する。分析プロセス定義入力部330は、分析プロセス定義のファイルをデータ処理装置100に入力する。予測モデル可視化部340は、予測モデルを可視化するための画像データを生成し、これを端末装置300の表示装置に入力する。
また、分析プロセス定義は、後述する標準化処理と二値化処理との具体的内容を規定している。更に、実際には、端末装置300は、学習用データファイル、予測用データファイル、及び分析プロセス定義ファイルを保持したコンピュータに、各機能部を実現するプログラムをインストールすることによって構築されている。また、端末装置300は、ローカルネットワークを経由して、各ファイルをデータ処理装置100に渡す。
また、図2に示すように、本実施の形態では、暗号化部20は、属性名暗号化部21と、標準化属性暗号化部22と、二値化属性暗号化部23とを備えている。
属性名暗号化部21は、学習用データの属性名を暗号化する。標準化属性暗号化部22は、学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する。二値化属性暗号化部23は、学習用データの特定の属性以外の属性(標準化されていない属性)に所属するデータ値を、閾値を用いた二値化処理によって暗号化する。
つまり、本実施の形態では、属性名の暗号化、標準化、及び二値化により、非暗号化学習用データから生成された予測モデルと、暗号化学習用データから生成された予測モデルとは、パラメータ、数値、及び演算子において、対応関係を有するように、暗号化が行なわれる。
その後、データ出力部30は、属性名暗号化部21、標準化属性暗号化部22、及び二値化属性暗号化部23によって暗号化された学習用データをクラウドシステム200に送信する。これにより、クラウドシステム200において、分析アプリケーション210は、上述したように、予測モデルを生成する。
また、本実施の形態では、データ取得部10は、端末装置300から、学習用データに加えて、予測モデルを用いた予測の対象となる予測用データと分析プロセス定義とを取得することもできる。データ取得部10が、予測用データを取得した場合は、暗号化部20は、学習用データと同様に、予測用データに対しても、暗号化を行なう。
更に、この場合、データ出力部30は、暗号化された予測用データを、クラウドシステム200に送信する。これにより、クラウドシステム200において、予測アプリケーション220は、上述したように、予測用データに対して予測処理を実行する。
また、図2に示すように、本実施の形態では、データ処理装置100は、データ取得部10、暗号化部20、及びデータ出力部30に加えて、予測モデルを復号する復号部40を備えている。復号部40は、属性名復号部41と、標準化属性復号部42と、二重化属性復号部43とを備えている。
属性名復号部41は、予測モデルから、暗号化された属性名に関する部分を特定し、特定した部分を復号する。標準化属性復号部42は、予測モデルから、標準化処理された値に関係する部分を特定し、特定した部分を復号する。二値化属性復号部は、予測モデルから、二値化処理された値に関係する部分を特定し、特定した部分を復号する。
なお、上述したように、予測モデルは、分析アプリケーション210によって、暗号化された学習用データから生成されており、分析結果記憶装置230に格納されている。よって、復号部40は、ローカルネットワークを経由して、分析結果記憶装置230から、予測モデルを取得する。
また、本実施の形態では、データ処理装置100は、後述するように、コンピュータにプログラムをインストールすることによって構築されている。更に、データ処理装置100は、単一のコンピュータではなく、複数のコンピュータによって構築されていても良い。例えば、暗号化部20と復号部40とは、別々のコンピュータによって構築されていても良い。
[装置動作]
次に、本実施の形態におけるデータ処理装置100の動作について図3〜図24を用いて説明する。以下の説明においては、適宜図1を参酌する。また、本実施の形態では、データ処理装置100を動作させることによって、データ処理方法が実施される。よって、本実施の形態におけるデータ処理方法の説明は、以下のデータ処理装置100の動作説明に代える。
学習用データの暗号化処理:
最初に、図3〜図7を用いて、学習用データの暗号化処理について説明する。図3は、本発明の実施の形態におけるデータ処理装置による学習用データの暗号化処理を示すフロー図である。
まず、前提として、ユーザが、端末装置30において、分析プロセス定義を入力すると、分析プロセス定義入力部330は、入力された分析プロセス定義を、データ処理装置100に入力する。また、このとき、分析プロセス定義入力部330は、インターネット400を経由して、クラウドシステム200にも分析プロセス定義を送信する。
図3に示すように、最初に、データ処理装置100において、データ取得部10は、送信されてきた分析プロセス定義を取得する(ステップS301)。また、データ取得部10は、取得した分析プロセス定義を、暗号化部20と復号部40とに渡す。
次に、端末装置300において、学習用データ入力部310から、データ処理装置100に向けて、図4に示す学習用データが送信されると、データ取得部10は、送信されてきた学習用データを取得する(ステップS302)。図4は、本発明の実施の形態で用いられる学習用データの一例を示す図である。また、ステップS302では、データ取得部10は、取得した学習用データを、暗号化部20における属性名暗号化部21に渡す。
次に、属性名暗号化部21は、入力された学習用データ(図4参照)に含まれる属性名を、一定のルールに従って暗号化する(ステップS303)。ここで利用される暗号化方式としては、シーザー暗号、AES(Advanced Encryption Standard)暗号等が挙げられ、これらのうちの任意の暗号化方式が1つ選択される。
また、ステップS303により、学習用データは、図5に示す状態となる。図5は、本発明の実施の形態において属性名が暗号化された学習用データの一例を示す図である。また、ステップS303では、属性名暗号化部21は、属性名を暗号化した学習用データ(図5参照)を、標準化属性暗号化部22に渡す。
次に、標準化属性暗号化部22は、分析プロセス定義に基づいて、どの属性が標準化対象となっているかを特定し、特定した属性(図6の例では属性X)に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する(ステップS304)。
具体的には、図6に示すように、本実施の形態では、標準化属性暗号化部22は、属性Xの全サンプルに対して、一定値(例えば、10)を乗算し、得られた値に別の一定値(例えば、50)を加算する。図6は、本発明の実施の形態において特定の属性が標準化された学習用データの一例を示す図である。
また、ステップS304では、標準化属性暗号化部22は、標準化対象となっている属性を暗号化した学習用データ(図6参照)を、二値化属性暗号化部23に渡す。更に、ステップS304による標準化後の属性Xのサンプルと標準化前の属性Xのサンプルとの間には、一定の対応関係がある。
次に、二値化属性暗号化部23は、分析プロセス定義に基づいて、どの属性が二値化対象となっており、また閾値の値がいくつなのかを特定し、特定した属性に所属するデータ値を、特定した閾値を用いた二値化処理によって暗号化する(ステップS305)。
具体的には、図7に示すように、二値化属性暗号化部23は、二値化対象となっている属性Yの全サンプルのうち、閾値(例えば、50)以上の値に対して任意の値(例えば、50)を加算し、閾値未満の値に対して任意の値(例えば、50)を減算する。図7は、本発明の実施の形態において特定の属性が二値化された学習用データの一例を示す図である。
また、ステップS305では、二値化属性暗号化部23は、二値化対象となっている属性を暗号化した学習用データ(図7参照)を、データ出力部30に渡す。更に、ステップS305による二値化後の属性Yのサンプルと二値化前の属性Yのサンプルとの間には、一定の対応関係がある。
その後、データ出力部30は、図7に示す暗号化した学習用データを、インターネット400を経由して、クラウドシステム200における分析アプリケーション210に送信する(ステップS306)。
予測モデルの生成処理:
続いて、図8〜図11を用いて、分析アプリケーション210による予測モデルの生成処理について説明する。図8は、本発明の実施の形態においての分析アプリケーションによる予測モデルの生成処理を示すフロー図である。
まず、前提として、分析プロセス定義入力部330から、インターネット400を経由して、クラウドシステム200に、分析プロセス定義が送信される。これにより、分析アプリケーション210は、送信されてきた分析プロセス定義に従って、標準化コンポーネント211、二値化コンポーネント212、及び分析エンジン213を配置する。
図8に示すように、最初に、分析アプリケーション210においては、送信されてきた学習用データ(図7参照)が、標準化コンポーネント211に渡される。そして、標準化コンポーネント211は、学習用データにおける標準化対象の属性を標準化する(ステップS311)。
具体的には、標準化コンポーネント211は、図9に示すように、属性Xのデータ値を標準化する。図9は、本発明の実施の形態において分析アプリケーションによって標準化された学習用データの一例を示す図である。図9の例では、標準化処理として、属性Xのデータ値を−1〜+1の範囲で正規化する処理が行なわれている。また、標準化コンポーネント211は、標準化対象の属性を標準化した学習用データ(図9参照)を、二値化コンポーネント212に渡す。
次に、二値化コンポーネント212は、学習用データにおける二値化対象の属性を二値化する(ステップS312)。
具体的には、図10に示すように、二値化コンポーネント212は、属性Yのデータ値を二値化する。図10は、本発明の実施の形態において分析アプリケーションによって二値化された学習用データの一例を示す図である。図10の例では、二値化処理として、属性Yのデータ値が50より小さい場合に、0(bin_Y=0)とし、属性Yの値が50以上の場合に、1(bin_Y=1)とする処理が行なわれている。また、二値化コンポーネント212は、二値化対象の属性を二値化した学習用データ(図10参照)を、分析エンジン213に渡す。
次に、分析エンジン213は、二値化コンポーネント212から受け取った学習用データを用いて、図11に示す予測モデルを生成する(ステップS313)。図11は、本発明の実施の形態において生成される予測モデルの一例を示す図である。
その後、分析エンジン213は、インターネット400を経由して、生成した予測モデルを、使用した分析プロセス定義と共に、分析結果記憶装置230に送信する(ステップS314)。これにより、分析結果記憶装置230は、予測モデルと分析プロセス定義とを格納する。
予測用データの暗号化処理:
続いて、図12〜図16を用いて、予測用データの暗号処理について説明する。図12は、本発明の実施の形態におけるデータ処理装置による予測用データの暗号化処理を示すフロー図である。
図12に示すように、最初に、端末装置300において、予測用データ入力部320から、データ処理装置100に向けて、図13に示す予測用データが送信されと、データ取得部10は、送信されてきた予測用データを取得する(ステップS401)。図13は、本発明の実施の形態で用いられる予測用データの一例を示す図である。また、ステップS401では、データ取得部10は、取得した予測用データを、暗号化部20における属性名暗号化部21に渡す。
次に、属性名暗号化部21は、入力された予測用データ(図13参照)に含まれる属性名を、一定のルールに従って暗号化する(ステップS402)。ここで利用される暗号化方式としても、シーザー暗号、AES(Advanced Encryption Standard)暗号等が挙げられる。
また、ステップS402により、予測用データは、図14に示す状態となる。図14は、本発明の実施の形態において属性名が暗号化された予測用データの一例を示す図である。また、ステップS402では、属性名暗号化部21は、属性名を暗号化した予測用データ(図14参照)を、標準化属性暗号化部22に渡す。
次に、標準化属性暗号化部22は、分析プロセス定義に基づいて、どの属性が標準化対象となっているかを特定し、特定した属性(図15の例では属性X)に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する(ステップS403)。
具体的には、図15に示すように、図3に示したステップS304の例と同様に、標準化属性暗号化部22は、属性Xの全サンプルに対して、一定値(例えば、10)を乗算し、得られた値に別の一定値(例えば、50)を加算する。図15は、本発明の実施の形態において特定の属性が標準化された予測用データの一例を示す図である。
また、ステップS403では、標準化属性暗号化部22は、標準化対象となっている属性を暗号化した予測用データ(図15参照)を、二値化属性暗号化部23に渡す。
次に、二値化属性暗号化部23は、分析プロセス定義に基づいて、どの属性が二値化対象となっており、また閾値の値がいくつなのかを特定し、特定した属性に所属するデータ値を、特定した閾値を用いた二値化処理によって暗号化する(ステップS404)。
具体的には、図16に示すように、図3に示したステップS305の例と同様に、二値化属性暗号化部23は、二値化対象となっている属性Yの全サンプルのうち、閾値以上の値に対して任意の値(例えば、50)を加算し、閾値未満の値に対して任意の値(例えば、50)を減算する。図16は、本発明の実施の形態において特定の属性が二値化された予測用データの一例を示す図である。
また、ステップS404では、二値化属性暗号化部23は、二値化対象となっている属性を暗号化した学習用データ(図16参照)を、データ出力部30に渡す。
その後、データ出力部30は、図16に示す暗号化した学習用データを、インターネット400を経由して、クラウドシステム200における分析アプリケーション210に送信する(ステップS405)。
予測処理:
続いて、図17〜図20を用いて、予測アプリケーション220による予測処理について説明する。図17は、本発明の実施の形態においての予測アプリケーションによる予測処理を示すフロー図である。
まず、前提として、分析プロセス定義入力部330から、インターネット400を経由して、クラウドシステム200に、分析プロセス定義が送信される。これにより、予測アプリケーション220は、送信されてきた分析プロセス定義に従って、標準化コンポーネント221、二値化コンポーネント222、及び分析エンジン223を配置する。
図17に示すように、最初に、予測アプリケーション220においては、送信されてきた予測用データ(図16参照)が、標準化コンポーネント221に渡される。そして、標準化コンポーネント221は、予測用データにおける標準化対象の属性を標準化する(ステップS411)。
具体的には、標準化コンポーネント221は、図18に示すように、属性Xのデータ値を標準化する。図18は、本発明の実施の形態において予測アプリケーションによって標準化された予測用データの一例を示す図である。図18の例では、標準化処理として、属性Xのデータ値を−1〜+1の範囲で正規化する処理が行なわれている。また、標準化コンポーネント221は、標準化対象の属性を標準化した予測用データ(図18参照)を、二値化コンポーネント222に渡す。
次に、二値化コンポーネント222は、予測用データにおける二値化対象の属性を二値化する(ステップS412)。
具体的には、図19に示すように、二値化コンポーネント222は、属性Yのデータ値を二値化する。図19は、本発明の実施の形態において予測アプリケーションによって二値化された学習用データの一例を示す図である。図19の例では、図10の例と同様に、二値化処理として、属性Yのデータ値が50より小さい場合に、0(bin_Y=0)とし、属性Yの値が50以上の場合に、1(bin_Y=1)とする処理が行なわれている。また、二値化コンポーネント222は、二値化対象の属性を二値化した予測用データ(図19参照)を、分析エンジン223に渡す。
次に、分析エンジン223は、インターネット400を経由して、分析結果記憶装置230から、図11に示した予測モデルを取得する(ステップS413)。
次に、分析エンジン223は、二値化コンポーネント222から受け取った予測用データを、予測モデルに適用して、予測処理を実行する(ステップS414)。
その後、分析エンジン223は、インターネット400を経由して、図20に示す予測結果を予測結果記憶装置240に送信する(ステップS415)。図20は、本発明の実施の形態において予測アプリケーションによって予測された結果の一例を示す図である。これにより、予測結果記憶装置240は、予測結果を格納する。ユーザは、端末装置300を介して、予測結果記憶装置240にアクセスすることで、予測結果を確認することができる。
予想モデルの可視化処理:
続いて、図21〜図24を用いて、予測モデルの可視化処理について説明する。図21は、本発明の実施の形態におけるデータ処理装置による予測モデルの可視化処理を示すフロー図である。
図21に示すように、最初に、データ処理装置100において、復号部40は、インターネット400を介して、分析結果記憶装置230から、予測モデル(図11参照)を取得する(ステップS501)。また、復号部40において、取得された予測モデルは、二値化属性復号部43に渡される
次に、二値化属性復号部43は、予測モデルから、二値化処理された値に関係する部分を特定し、特定した部分を復号する(ステップS502)。具体的には、二値化属性復号部43は、分析プロセス定義に基づいて、図22に示すように、二値化対象属性bin_Yに関する値を復号する。図22は、本発明の実施の形態において二値化対象属性が復号された予想モデルの一例を示す図である。
次に、標準化属性復号部42は、予測モデルから、標準化処理された値に関係する部分を特定し、特定した部分を復号する(ステップS503)。具体的には、標準化属性復号部42は、分析プロセス定義に基づいて、図23に示すように、標準化対象属性std_Xに関する値を復号する。図23は、本発明の実施の形態において標準化対象属性が復号された予測モデルの一例を示す図である。
次に、属性名復号部41は、予測モデルから、暗号化された属性名に関する部分を特定し、特定した部分を復号する(ステップS504)。具体的には、属性名復号部41は、分析プロセス定義に基づいて、図24に示すように、属性名を復号する。図24は、本発明の実施の形態において属性名が復号された予測モデルの一例を示す図である。
次に、データ出力部30は、復号された予測モデル(図24参照)を、端末装置300に送信する(ステップS505)。これにより、端末装置300においては、予測モデル可視化部340が、送信されてきた予測モデルを可視化するための画像データを生成し、これを端末装置300の表示装置に入力する。表示装置は、その画面上に予測モデルを表示するので、ユーザは、復号された予測モデルを確認することができる。
[実施の形態における効果]
このように、本実施の形態では、機械学習に用いるデータが暗号化されていても、機械学習を行なうクラウドシステム200は、復号処理を行なうことなく、機械学習を行なって、予測モデルを生成することができる。また、クラウドシステムは、暗号化された予測用データに対して予測処理を行なうことができる。つまり、本実施の形態では、予測モデルの解釈生を損なうことなく、学習用データ及び予測用データに対して暗号化を実行できる。
このため、本実施の形態によれば、クラウドサービスの事業者に依存することなく、セキュリティを確保することができる。また、予測処理において、復号処理を行なう必要がないため、クラウドシステムにおいて、処理に必要なマシンリソースを削減することもできる。
[変形例]
このように、上述した例では、数値の行列から成る入力データの前処理(暗号化処理)は、分析プロセス定義で規定された特定の属性の標準化と二値化とに基づいて行なわれているが、本実施の形態は、上述した例に限定されることはない。本実施の形態では、前処理は、前処理後の結果が非暗号化時と暗号化時とで同一となる処理であれば良い。前処理としては、例えば、外れ値を除去する処理が用いられていても良い。このとき、除去される外れ値は、前処理の前と後とで置き換えられる。
また、テキストデータを入力データとして用い、文字又は単語毎の出現頻度を特徴量として分析する、テキストデータの分析処理においては、入力のテキストデータに対して、前処理として換字式の暗号化を適用することができる。この場合、出現頻度に影響を与えることなく暗号化を行うことができ、暗号化の前後において同様の結果を得ることができる。
また、画像データを入力として用い、明度、彩度、周波数等を特徴量として分析する、画像分析処理においては、分析対象となる一部の特徴量に対しては影響を与えず、その他の特徴量のみを変換する、暗号化を適用することができる。具体的には、この場合は、一部の画素が置換されて暗号化が行なわれる。また、この場合も、暗号化の前後において同様の結果を得ることができる。
[プログラム]
本実施の形態におけるプログラムは、コンピュータに、図3に示すステップS301〜S306、図12に示すステップS401〜S405、図21に示すステップS501〜S505を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態におけるデータ処理装置100とデータ処理方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、データ取得部10、暗号化部20、データ出力部30、及び復号部40として機能し、処理を行なう。
また、本実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、データ取得部10、暗号化部20、データ出力部30、及び復号部40のいずれかとして機能しても良い。
ここで、本実施の形態におけるプログラムを実行することによって、データ処理装置100を実現するコンピュータについて図25を用いて説明する。図25は、本発明の実施の形態におけるデータ処理装置を実現するコンピュータの一例を示すブロック図である。
図25に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。
CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記録媒体、又はCD−ROM(Compact Disk Read Only Memory)などの光学記録媒体が挙げられる。
なお、本実施の形態におけるデータ処理装置100は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、データ処理装置100は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記12)によって表現することができるが、以下の記載に限定されるものではない。
(付記1)
機械学習を行なって予測モデルを生成するシステムに学習用データを提供するための装置であって、
外部から入力された前記学習用データを取得する、データ取得部と、
暗号化されていない前記学習用データから生成された予測モデルと、暗号化された前記学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、前記学習用データを暗号化する、暗号化部と、
暗号化された前記学習用データを前記システムへと出力する、データ出力部と、
を備えている、
ことを特徴とするデータ処理装置。
(付記2)
前記暗号化部が、更に、
前記学習用データの属性名を暗号化する、属性名暗号化部と、
前記学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する、標準化属性暗号化部と、
前記学習用データの前記特定の属性以外の属性に所属するデータ値を、閾値を用いた二値化処理によって暗号化する、二値化属性暗号化部と、
を備えている、付記1に記載のデータ処理装置。
(付記3)
前記データ取得部が、前記予測モデルを用いた予測の対象となる予測用データを取得した場合に、
前記暗号化部が、前記学習用データと同様に、前記予測用データに対して、暗号化を行ない、
前記データ出力部が、暗号化された前記予測用データを、前記システムに出力する、
付記1または2に記載のデータ処理装置。
(付記4)
暗号化された前記学習用データから生成された予測モデルから、暗号化された前記属性名に関する部分を特定し、特定した部分を復号する、属性名復号部と、
前記予測モデルから、標準化処理された値に関係する部分を特定し、特定した部分を復号する、標準化属性復号部と、
前記予測モデルから、二値化処理された値に関係する部分を特定し、特定した部分を復号する、二値化属性復号部と、
を更に備えている付記2に記載のデータ処理装置。
(付記5)
機械学習を行なって予測モデルを生成するシステムに学習用データを提供するための方法であって、
(a)外部から入力された前記学習用データを取得する、ステップと、
(b)暗号化されていない前記学習用データから生成された予測モデルと、暗号化された前記学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、前記学習用データを暗号化する、ステップと、
(c)暗号化された前記学習用データを前記システムへと出力する、ステップと、
を有する、
ことを特徴とするデータ処理方法。
(付記6)
前記(a)のステップが、更に、
前記学習用データの属性名を暗号化する、ステップと、
前記学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する、ステップと、
前記学習用データの前記特定の属性以外の属性に所属するデータ値を、閾値を用いた二値化処理によって暗号化する、ステップと、
を有する、付記5に記載のデータ処理方法。
(付記7)
前記(a)のステップにおいて、前記予測モデルを用いた予測の対象となる予測用データを取得した場合に、
前記(b)のステップにおいて、前記学習用データと同様に、前記予測用データに対して、暗号化を行ない、
前記(c)のステップにおいて、暗号化された前記予測用データを、前記システムに出力する、
付記5または6に記載のデータ処理方法。
(付記8)
(d)暗号化された前記学習用データから生成された予測モデルから、暗号化された前記属性名に関する部分を特定し、特定した部分を復号する、ステップと、
(e)前記予測モデルから、標準化処理された値に関係する部分を特定し、特定した部分を復号する、ステップと、
(f)前記予測モデルから、二値化処理された値に関係する部分を特定し、特定した部分を復号する、ステップと、
を更に有する付記6に記載のデータ処理方法。
(付記9)
機械学習を行なって予測モデルを生成するシステムに、コンピュータによって、学習用データを提供するためのプログラムであって、
前記コンピュータに、
(a)外部から入力された前記学習用データを取得する、ステップと、
(b)暗号化されていない前記学習用データから生成された予測モデルと、暗号化された前記学習用データから生成された予測モデルとが、パラメータ、数値、及び演算子において、対応関係を有するように、前記学習用データを暗号化する、ステップと、
(c)暗号化された前記学習用データを前記システムへと出力する、ステップと、
を実行させるプログラム。
(付記10)
前記(a)のステップが、更に、
前記学習用データの属性名を暗号化する、ステップと、
前記学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する、ステップと、
前記学習用データの前記特定の属性以外の属性に所属するデータ値を、閾値を用いた二値化処理によって暗号化する、ステップと、
を有する、付記9に記載のプログラム。
(付記11)
前記(a)のステップにおいて、前記予測モデルを用いた予測の対象となる予測用データを取得した場合に、
前記(b)のステップにおいて、前記学習用データと同様に、前記予測用データに対して、暗号化を行ない、
前記(c)のステップにおいて、暗号化された前記予測用データを、前記システムに出力する、
付記9または10に記載のプログラム。
(付記12)
前記コンピュータに、
(d)暗号化された前記学習用データから生成された予測モデルから、暗号化された前記属性名に関する部分を特定し、特定した部分を復号する、ステップと、
(e)前記予測モデルから、標準化処理された値に関係する部分を特定し、特定した部分を復号する、ステップと、
(f)前記予測モデルから、二値化処理された値に関係する部分を特定し、特定した部分を復号する、ステップと、
を更に実行させる付記10に記載のプログラム。
以上のように、本発明によれば、機械学習に用いるデータが暗号化されていても、機械学習を行なうシステムが、復号処理を行なうことなく、機械学習を行なえるようにすることができる。本発明は、日配品需要予測ソリューション、自動車販売価格予測ソリューションといった、多様な品目を扱い大量のモデル構築を必要とするシステムに有用である。
100 データ処理装置
10 データ取得部
20 暗号化部
21 属性名暗号化部
22 標準化属性暗号化部
23 二値化属性暗号化部
30 データ出力部
40 復号部
41 属性名復号部
42 標準化属性復号部
43 二重化属性復号部
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
200 クラウドシステム
210 分析アプリケーション
211 標準化コンポーネント
212 二値化コンポーネント
213 分析エンジン
220 予測アプリケーション
221 標準化コンポーネント
222 二値化コンポーネント
223 分析エンジン
230 分析結果記憶装置
240 予測結果記憶装置
300 端末装置
310 学習用データ入力部
320 予測用データ入力部
330 分析プロセス定義入力部
340 予測モデル可視化部
400 インターネット

Claims (5)

  1. 機械学習を行なって予測モデルを生成するシステムに学習用データを出力するための装置であって、
    外部から入力された前記学習用データを取得する、データ取得部と、
    前記学習用データに対して前処理として標準化及び二値化が行われてから前記予測モデルが生成される場合において、暗号化されていない前記学習用データに対する前処理の結果と暗号化された前記学習用データに対する前処理の結果とが同一となるように、前記学習用データを暗号化する、暗号化部と、
    暗号化された前記学習用データを前記システムへと出力する、データ出力部と、
    を備え
    前記暗号化部が、更に、
    前記学習用データの属性名を暗号化する、属性名暗号化部と、
    前記学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する、標準化属性暗号化部と、
    前記学習用データの前記特定の属性以外の属性に所属するデータ値を、閾値を用いた二値化処理によって暗号化する、二値化属性暗号化部と、
    を備えている、
    ことを特徴とするデータ処理装置。
  2. 前記データ取得部が、前記予測モデルを用いた予測の対象となる予測用データを取得した場合に、
    前記暗号化部が、前記学習用データと同様に、前記予測用データに対して、暗号化を行ない、
    前記データ出力部が、暗号化された前記予測用データを、前記システムに出力する、
    請求項1に記載のデータ処理装置。
  3. 暗号化された前記学習用データから生成された予測モデルから、暗号化された前記属性名に関する部分を特定し、特定した部分を復号する、属性名復号部と、
    前記予測モデルから、標準化処理された値に関係する部分を特定し、特定した部分を復号する、標準化属性復号部と、
    前記予測モデルから、二値化処理された値に関係する部分を特定し、特定した部分を復号する、二値化属性復号部と、
    を更に備えている請求項に記載のデータ処理装置。
  4. 機械学習を行なって予測モデルを生成するシステムにコンピュータが学習用データを出力するための方法であって、
    (a)外部から入力された前記学習用データを取得する、ステップと、
    (b)前記学習用データに対して前処理として標準化及び二値化が行われてから前記予測モデルが生成される場合において、暗号化されていない前記学習用データに対する前処理の結果と暗号化された前記学習用データに対する前処理の結果とが同一となるように、前記学習用データを暗号化する、ステップと、
    (c)暗号化された前記学習用データを前記システムへと出力する、ステップと、
    を有し、
    前記(b)のステップが、更に、
    前記学習用データの属性名を暗号化する、ステップと、
    前記学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する、ステップと、
    前記学習用データの前記特定の属性以外の属性に所属するデータ値を、閾値を用いた二値化処理によって暗号化する、ステップと、
    を有する、
    ことを特徴とするデータ処理方法。
  5. 機械学習を行なって予測モデルを生成するシステムに、コンピュータによって、学習用データを出力するためのプログラムであって、
    前記コンピュータに、
    (a)外部から入力された前記学習用データを取得する、ステップと、
    (b)前記学習用データに対して前処理として標準化及び二値化が行われてから前記予測モデルが生成される場合において、暗号化されていない前記学習用データに対する前処理の結果と暗号化された前記学習用データに対する前処理の結果とが同一となるように、前記学習用データを暗号化する、ステップと、
    (c)暗号化された前記学習用データを前記システムへと出力する、ステップと、
    を実行させ
    前記(b)のステップが、更に、
    前記学習用データの属性名を暗号化する、ステップと、
    前記学習用データの特定の属性に所属するデータ値を、特定の計算式を用いた標準化処理によって暗号化する、ステップと、
    前記学習用データの前記特定の属性以外の属性に所属するデータ値を、閾値を用いた二値化処理によって暗号化する、ステップと、
    を有する、
    プログラム。
JP2016188910A 2016-09-27 2016-09-27 データ処理装置、データ処理方法、およびプログラム Active JP6926429B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016188910A JP6926429B2 (ja) 2016-09-27 2016-09-27 データ処理装置、データ処理方法、およびプログラム
US15/716,603 US20180089574A1 (en) 2016-09-27 2017-09-27 Data processing device, data processing method, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016188910A JP6926429B2 (ja) 2016-09-27 2016-09-27 データ処理装置、データ処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2018054765A JP2018054765A (ja) 2018-04-05
JP6926429B2 true JP6926429B2 (ja) 2021-08-25

Family

ID=61686407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016188910A Active JP6926429B2 (ja) 2016-09-27 2016-09-27 データ処理装置、データ処理方法、およびプログラム

Country Status (2)

Country Link
US (1) US20180089574A1 (ja)
JP (1) JP6926429B2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10841337B2 (en) 2016-11-28 2020-11-17 Secureworks Corp. Computer implemented system and method, and computer program product for reversibly remediating a security risk
JP2019066135A (ja) * 2017-10-04 2019-04-25 ファナック株式会社 空調制御システム
US10735470B2 (en) 2017-11-06 2020-08-04 Secureworks Corp. Systems and methods for sharing, distributing, or accessing security data and/or security applications, models, or analytics
US10594713B2 (en) * 2017-11-10 2020-03-17 Secureworks Corp. Systems and methods for secure propagation of statistical models within threat intelligence communities
US11003718B2 (en) 2018-06-12 2021-05-11 Secureworks Corp. Systems and methods for enabling a global aggregated search, while allowing configurable client anonymity
US10785238B2 (en) 2018-06-12 2020-09-22 Secureworks Corp. Systems and methods for threat discovery across distinct organizations
CN109033854B (zh) * 2018-07-17 2020-06-09 阿里巴巴集团控股有限公司 基于模型的预测方法和装置
US20200167669A1 (en) * 2018-11-27 2020-05-28 Oracle International Corporation Extensible Software Tool with Customizable Machine Prediction
US11657124B2 (en) * 2018-12-10 2023-05-23 Apple Inc. Integrating binary inference engines and model data for efficiency of inference tasks
WO2020145113A1 (ja) * 2019-01-11 2020-07-16 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 予測モデル変換方法及びシステム
CN113614754A (zh) * 2019-03-27 2021-11-05 松下知识产权经营株式会社 信息处理系统、计算机系统、信息处理方法和程序
CN110163008B (zh) * 2019-04-30 2023-03-07 创新先进技术有限公司 一种部署的加密模型的安全性审计的方法和系统
US11310268B2 (en) 2019-05-06 2022-04-19 Secureworks Corp. Systems and methods using computer vision and machine learning for detection of malicious actions
US11418524B2 (en) 2019-05-07 2022-08-16 SecureworksCorp. Systems and methods of hierarchical behavior activity modeling and detection for systems-level security
US11381589B2 (en) 2019-10-11 2022-07-05 Secureworks Corp. Systems and methods for distributed extended common vulnerabilities and exposures data management
US11763157B2 (en) * 2019-11-03 2023-09-19 Microsoft Technology Licensing, Llc Protecting deep learned models
US11522877B2 (en) 2019-12-16 2022-12-06 Secureworks Corp. Systems and methods for identifying malicious actors or activities
JP2021105798A (ja) * 2019-12-26 2021-07-26 パナソニックIpマネジメント株式会社 人工知能システム
JP7563451B2 (ja) 2020-05-14 2024-10-08 コニカミノルタ株式会社 情報処理装置、プログラム及び情報処理方法
US11556508B1 (en) * 2020-06-08 2023-01-17 Cigna Intellectual Property, Inc. Machine learning system for automated attribute name mapping between source data models and destination data models
US11588834B2 (en) 2020-09-03 2023-02-21 Secureworks Corp. Systems and methods for identifying attack patterns or suspicious activity in client networks
US11528294B2 (en) 2021-02-18 2022-12-13 SecureworksCorp. Systems and methods for automated threat detection
JPWO2022269743A1 (ja) * 2021-06-22 2022-12-29
US12034751B2 (en) 2021-10-01 2024-07-09 Secureworks Corp. Systems and methods for detecting malicious hands-on-keyboard activity via machine learning
US12015623B2 (en) 2022-06-24 2024-06-18 Secureworks Corp. Systems and methods for consensus driven threat intelligence

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3637412B2 (ja) * 2000-05-17 2005-04-13 中国電力株式会社 時系列データ学習・予測装置
WO2011007569A1 (ja) * 2009-07-15 2011-01-20 国立大学法人筑波大学 分類推定システムおよび分類推定プログラム
US20170039487A1 (en) * 2014-04-11 2017-02-09 Hitachi, Ltd. Support vector machine learning system and support vector machine learning method
EP3192015A1 (en) * 2014-09-09 2017-07-19 Intel Corporation Improved fixed point integer implementations for neural networks
JP6550783B2 (ja) * 2015-02-19 2019-07-31 富士通株式会社 データ出力方法、データ出力プログラムおよびデータ出力装置
CN105512518B (zh) * 2015-11-30 2018-11-16 中国电子科技集团公司第三十研究所 一种基于唯密文的密码算法识别方法和系统

Also Published As

Publication number Publication date
JP2018054765A (ja) 2018-04-05
US20180089574A1 (en) 2018-03-29

Similar Documents

Publication Publication Date Title
JP6926429B2 (ja) データ処理装置、データ処理方法、およびプログラム
US11902413B2 (en) Secure machine learning analytics using homomorphic encryption
US9477836B1 (en) Content modification in served code
US9411958B2 (en) Polymorphic treatment of data entered at clients
US9836612B2 (en) Protecting data
CN110688598B (zh) 业务参数采集方法、装置、计算机设备和存储介质
KR20220041704A (ko) 특징 추출에 기반한 다중 모델 훈련 방법 및 시스템, 전자 장치 및 매체
CN111783124B (zh) 基于隐私保护的数据处理方法、装置和服务器
US20150244737A1 (en) Detecting malicious advertisements using source code analysis
Rahimian et al. On the reverse engineering of the citadel botnet
CN110138818B (zh) 传递参数的方法、网站应用、系统、装置以及服务后端
US11563760B2 (en) Network embeddings model for personal identifiable information protection
CN111898135A (zh) 数据处理方法、数据处理装置、计算机设备和介质
CN114547558B (zh) 授权方法、授权控制方法及装置、设备和介质
CN112270016A (zh) 业务数据请求的处理方法、装置及电子设备
US20170063880A1 (en) Methods, systems, and computer readable media for conducting malicious message detection without revealing message content
Gambhir et al. Multicore implementation and performance analysis of a chaos based LSB steganography technique
JP7184159B2 (ja) システム、クライアント装置、データ処理方法、コンピュータプログラム及び記録媒体
US9729619B2 (en) Information processing system, processing apparatus, and distributed processing method
CN112307449B (zh) 权限分级管理方法、装置、电子设备和可读存储介质
CN114756833A (zh) 代码混淆方法、装置、设备、介质以及程序产品
US9811669B1 (en) Method and apparatus for privacy audit support via provenance-aware systems
CN110032832B (zh) 一种Web应用程序的处理方法及装置
Villares-Jimenez et al. Vulnerability of CAPTCHA Systems Using Bots with Computer Vision Abilities
US20240154802A1 (en) Model protection method and apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210719

R150 Certificate of patent or registration of utility model

Ref document number: 6926429

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150