JP2021103563A - データマイニングシステム、方法、装置、電子機器及び記憶媒体 - Google Patents

データマイニングシステム、方法、装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP2021103563A
JP2021103563A JP2021049847A JP2021049847A JP2021103563A JP 2021103563 A JP2021103563 A JP 2021103563A JP 2021049847 A JP2021049847 A JP 2021049847A JP 2021049847 A JP2021049847 A JP 2021049847A JP 2021103563 A JP2021103563 A JP 2021103563A
Authority
JP
Japan
Prior art keywords
data
execution space
mining
reliable execution
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021049847A
Other languages
English (en)
Other versions
JP7461318B2 (ja
Inventor
ジ リュウ
Ji Liu
ジ リュウ
ハオイ シュン
Haoyi Xiong
ハオイ シュン
ドゥジン ドゥ
Dejing Dou
ドゥジン ドゥ
スユ ファン
Siyu Huang
スユ ファン
ジジョウ ファン
Jizhou Huang
ジジョウ ファン
ジュ フォン
Zhi Feng
ジュ フォン
ハオジュ アン
Haozhe An
ハオジュ アン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021103563A publication Critical patent/JP2021103563A/ja
Application granted granted Critical
Publication of JP7461318B2 publication Critical patent/JP7461318B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24561Intermediate data storage techniques for performance improvement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/52Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems during program execution, e.g. stack integrity ; Preventing unwanted data erasure; Buffer overflow
    • G06F21/53Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems during program execution, e.g. stack integrity ; Preventing unwanted data erasure; Buffer overflow by executing in a restricted environment, e.g. sandbox or secure virtual machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/71Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
    • G06F21/74Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information operating in dual or compartmented mode, i.e. at least one secure mode
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/03Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
    • G06F2221/034Test or assess a computer or a system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Information Transfer Between Computers (AREA)
  • Storage Device Security (AREA)

Abstract

【課題】データのプライバシーを確保することを前提に、データ使用者に大量のデータを提供してイベントの予測を行い、予測精度を向上させるデータマイニングシステムを提供する。【解決手段】データマイニングシステムは、中継マシンと、中継マシンのみがアクセス権限を有する第1の信頼できる実行スペース及び第2の信頼できる実行スペースとを含む。第1の信頼できる実行スペースは、データ提供者の提供可能なデータを記憶する。第2の信頼できる実行スペースは、データ使用者のマイニング関連データを記憶する。中継マシンは、第2の信頼できる実行スペースのデータ呼び出し要求を受信し、データ呼び出し要求に従って第1の信頼できる実行スペースから呼び出し対象データを取得して第2の信頼できる実行スペースに提供することにより、呼び出し対象データ及びマイニング関連データに基づいてデータマイニングを行い、その結果をデータ使用者機器に提供する。【選択図】図1

Description

本出願は、データ処理の技術分野に関し、具体的には、データマイニングの技術分野に関し、特にデータマイニングシステム、方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体に関する。
現在、大量のデータモデリングを用いて、科学研究機関による伝染病の流行の予測など、いくつかのイベントの将来の傾向を予測することが広く応用されている。しかしながら、実際の応用シーンでは、データのプライバシー保護の制約によって、多くの機構、組織、または企業によって構築されたモデルは十分な関連データのサポートを欠如し、予測精度が非常に低い。
本出願は、データマイニングシステム、方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体を提供する。
第1の態様では、中継マシンを介して第1の信頼できる実行スペースにおける提供可能なデータを第2の信頼できる実行スペースに提供し、第2の信頼できる実行スペースが提供可能なデータ及びマイニング関連データに基づいてデータマイニング結果を決定し、中継マシンを介してこのマイニング結果をデータ使用者機器に提供するにより、データのプライバシーを確保することを前提に、データ使用者に大量のデータを提供してイベントの予測を行い、予測精度を向上させるデータマイニングシステムを提供する。
本出願の第2の態様では、データマイニング方法を提供する。
本出願の第3の態様では、データマイニング装置を提供する。
本出願の第4の態様では、電子機器を提供する。
本出願の第5の態様では、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供する。
本出願の第6の態様では、コンピュータプログラムを提供する。
第1の態様では、本出願の実施例は、データマイニングシステムを提供し、前記データマイニングシステムは、中継マシンと、第1の信頼できる実行スペースと、第2の信頼できる実行スペースと、を含み、前記中継マシンのみが第1の信頼できる実行スペース及び前記第2の信頼できる実行スペースへのアクセス権限を有し、前記第1の信頼できる実行スペースは、データ提供者の提供可能なデータを記憶するように構成され、前記第2の信頼できる実行スペースは、データ使用者のマイニング関連データを記憶するように構成され、前記中継マシンは、前記第2の信頼できる実行スペースのデータ呼び出し要求を受信し、前記データ呼び出し要求に従って前記第1の信頼できる実行スペースから呼び出し対象データを取得して前記第2の信頼できる実行スペースに提供することにより、前記呼び出し対象データ及び前記マイニング関連データに基づいてデータマイニングを行い、データマイニング結果を取得し、前記データマイニング結果をデータ使用者機器に提供するように構成される。
本出願の実施例に係るデータマイニングシステムは、中継マシンと、第1の信頼できる実行スペースと、第2の信頼できる実行スペースと、を含み、前記中継マシンのみが第1の信頼できる実行スペース及び前記第2の信頼できる実行スペースへのアクセス権限を有し、前記第1の信頼できる実行スペースは、データ提供者の提供可能なデータを記憶するように構成され、前記第2の信頼できる実行スペースは、データ使用者のマイニング関連データを記憶するように構成され、前記中継マシンは、前記第2の信頼できる実行スペースのデータ呼び出し要求を受信し、前記データ呼び出し要求に従って前記第1の信頼できる実行スペースから呼び出し対象データを取得して前記第2の信頼できる実行スペースに提供することにより、前記呼び出し対象データ及び前記マイニング関連データに基づいてデータマイニングを行い、データマイニング結果を取得し、前記データマイニング結果をデータ使用者機器に提供するように構成される。当該データマイニングシステムは、中継マシンを介して、第1の信頼できる実行スペースにおける提供可能なデータを第2の信頼できる実行スペースに提供し、第2の信頼できる実行スペースが提供可能なデータ及びマイニング関連データに基づいてデータマイニング結果を決定し、中継マシンを介してこのマイニング結果をデータ使用者機器に提供することを実現できる。これにより、データのプライバシーを確保することを前提に、データ使用者に大量のデータを提供してイベントの予測を行い、予測精度を向上させることができる。
第2の態様では、本出願の実施例は、データ使用者に対応する第2の信頼できる実行スペースに適用されるデータマイニング方法であって、中継マシンを介して、データ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信するステップであって、前記データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含むステップと、前記データ提供者が前記呼び出し対象データを呼び出す権限を有する場合、前記第1の信頼できる実行スペースから返された呼び出し対象データを取得するステップと、前記呼び出し対象データと前記データ提供者のマイニング関連データに基づいて、データマイニング結果を決定するステップと、前記中継マシンを介して前記データマイニング結果をデータ使用者機器に提供するステップと、を含むデータマイニング方法を提供する。
第3の態様では、本出願の実施例は、データ使用者に対応する第2の信頼できる実行スペースに適用されるデータマイニング装置であって、中継マシンを介してデータ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信するように構成される送信モジュールであって、前記データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含む送信モジュールと、前記データ提供者が前記呼び出し対象データを呼び出す権限を有する場合、前記第1の信頼できる実行スペースから返された呼び出し対象データを取得するように構成される取得モジュールと、前記中継マシンを介して前記データマイニング結果をデータ使用者機器に提供するように構成される決定モジュールと、を含むデータマイニング装置を提供する。
第4の態様では、本出願の実施例は、電子機器であって、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが上記のデータマイニング方法を実行可能である電子機器を提供する。
第5の態様では、本出願の実施例は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに上記のデータマイニング方法を実行させるコンピュータ読み取り可能な記憶媒体を提供する。
第6の態様では、本願の実施例は、コンピュータに上記のデータマイニング方法を実行させるコンピュータプログラムを提供する。
なお、この部分に記載されたコンテンツは、本開示の実施例の肝心または重要な特徴を限定することを意図するものではなく、本開示の範囲を限定することを意図するものでもない。本開示の他の特徴は、以下の説明によって容易に理解されやすくなる。
図面は、本技術案をよりよく理解するためのものであり、本出願を限定するものではない。
本出願の第1の実施例に係る概略図である。 本出願の第2の実施例に係る概略図である。 本出願の実施例に係るデータマイニングシステムの概略構成図である。 記憶クラスタにおける記憶区間の記憶構造の概略図である。 本出願の第3の実施例に係るデータマイニング方法の概略フローチャートである。 本出願の第4の実施例に係るデータマイニング装置の概略構成図である。 本出願の実施例に係るデータマイニング方法を実現するための電子機器のブロック図である。
以下、図面を参照して本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔するために、以下の説明では、周知の機能及び構造の説明を省略する。
以下、図面を参照して本出願の実施例のデータマイニングシステム、方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体を説明する。
図1は本出願の第1の実施例に係る概略図である。図1に示すように、データマイニングシステムは、中継マシン110と、第1の信頼できる実行スペース120と、第2の信頼できる実行スペース130と、を含むことができる。
ここで、中継マシン110のみは、第1の信頼できる実行スペース120及び第2の信頼できる実行スペース130へのアクセス権限を有し、第1の信頼できる実行スペース120は、データ提供者の提供可能なデータを記憶するように構成され、第2の信頼できる実行スペース130は、データ使用者のマイニング関連データを記憶するように構成される。中継マシン110は、第2の信頼できる実行スペース130のデータ呼び出し要求を受信し、データ呼び出し要求に従って第1の信頼できる実行スペース120から呼び出し対象データを取得して第2の信頼できる実行スペース130に提供し、呼び出し対象データ及びマイニング関連データに基づいてデータマイニングを行い、データマイニング結果を取得し、データマイニング結果をデータ使用者機器に提供するように構成される。ここで、第1の信頼できる実行スペース及び第2の信頼できる実行スペースは記憶機能と計算機能を有するため、第1の信頼できる実行スペース及び第2の信頼できる実行スペースは、それぞれ記憶クラスタと計算クラスタとを含むことができるが、これらに限定されない。提供可能なデータは、複数のデータと、各データの権限情報とを含むことができ、例えば、各データが読み取り可能か否か、書き込み可能か否かなど。マイニング関連データは、データ使用者がイベント予測のために準備したデータ、予測に関連するプログラムファイル、及びモデルなどを含むが、これに限定されない。
データのセキュリティ及びプライバシーの信頼できる保護を確保するために、図2に示すように、図1に示されたものの上で、中継マシン110は、データ使用者機器140に接続され、データ使用者機器140から送信されたマイニング関連データを取得し、マイニング関連データを第2の信頼できる実行スペース130に送信して記憶させるように構成される。中継マシン110は、データ提供者機器150に接続され、データ提供者機器150から送信された提供可能なデータを取得し、提供可能なデータを第1の信頼できる実行スペース120に送信して記憶させるように構成される。
一例として、中継マシンは、マイニング関連データを第2の信頼できる実行スペースに送信して記憶させる前に、マイニング関連データの属性情報を取得し、第2の信頼できる実行スペースがアイドル状態にあるか否かを判断し、第2の信頼できる実行スペースが非アイドル状態にある場合、属性情報に基づいて、データ使用者のために第2の信頼できる実行スペースを作成し、マイニング関連データを、作成した第2の信頼できる実行スペースに送信して記憶させることができる。第2の信頼できる実行スペースがアイドル状態にある場合、属性情報に基づいてマイニング関連データを記憶する。例えば、第2の信頼できる実行スペースが非アイドル状態にある場合、すなわち第2の信頼できる実行スペースにはアイドルスペースがない場合、中継マシンは、マイニング関連データの計算量、データのサイズなどに基づいて、第2の信頼できる実行スペースを作成し、マイニング関連データを、作成した第2の信頼できる実行スペースに送信して記憶させることができる。第2の信頼できる実行スペースがアイドル状態にある場合、データの計算量、データのサイズに基づいて、必要な記憶スペースのサイズを判断し、マイニング関連データを記憶することができる。これにより、マイニング関連データの属性情報及び第2の信頼できる実行スペースの状態に基づいてマイニング関連データを記憶することにより、マイニング関連データを第2の信頼できる実行スペースにより適切に記憶し、関連記憶リソースの無駄を回避することができる。また、中継マシンは、作成した第2の信頼できる実行スペースの使用期限を決定し、作成した第2の信頼できる実行スペースの使用期限が切れた場合、作成した第2の信頼できる実行スペースを破棄することができる。
同時に、中継マシンは、さらに、第1の信頼できる実行スペース及び第2の信頼できる実行スペースの使用期限(例えば、6ヶ月)を決定し、第1の信頼できる実行スペースの使用期限が切れた場合、第1の信頼できる実行スペースのコンテンツをクリアし、第2の信頼できる実行スペースの使用期限が切れた場合、第2の信頼できる実行スペースのコンテンツをクリアすることができる。これにより、第1の信頼できる実行スペース及び第2の信頼できる実行スペースに記憶されたデータのセキュリティが確保される。
データ使用者機器によるデータ提供者の提供可能なデータの利用可能だが不可視であり、計算できるがコピーできない操作を実現し、データのセキュリティを確保するために、本出願の実施例では、第2の信頼できる実行スペースは、中継マシンを介して第1の信頼できる実行スペースにおける提供可能なデータを呼び出し、提供可能なデータ及びマイニング関連データに基づいてデータマイニング結果を決定し、中継マシンを介してデータマイニング結果をデータ使用者機器に提供するように構成できる。
一例として、第2の信頼できる実行スペースは、中継マシンを介して第1の信頼できる実行スペースにデータ呼び出し要求を送信して、第1の信頼できる実行スペースにおける提供可能なデータを呼び出すことができる。ここで、データ呼び出し要求は、データ使用者の識別子、データ提供者の識別子、及び呼び出し対象データの識別子などを含むことができるが、これに限定されない。第1の信頼できる実行スペースは、データ呼び出し要求内のデータ使用者の識別子、呼び出し対象データの識別子及び各データの権限情報に基づいて、データ使用者が呼び出し対象データを呼び出す権限を有するか否かを決定し、データ使用者が呼び出し対象データを呼び出す権限を有すると決定した場合、中継マシンを介して呼び出し対象データを第2の信頼できる実行スペースに返すように構成される。
つまり、データのセキュリティを確保する場合に、第1の信頼できる実行スペースにおける提供可能なデータをより簡単に呼び出し、第2の信頼できる実行スペースは、中継マシンを介して第1の信頼できる実行スペースにデータ呼び出し要求を送信し、第1の信頼できる実行スペースは、データ呼び出し要求内のデータ使用者の識別子、呼び出し対象データの識別子及び各データの権限情報などに基づいて、データ使用者が呼び出し対象データを呼び出す権限を有するか否かを決定し、データ使用者が呼び出し対象データを呼び出す権限を有すると決定した場合、中継マシンを介して呼び出し対象データを第2の信頼できる実行スペースに返すことができる。データ使用者が呼び出し対象データを呼び出す権限を有しないと決定された場合、中継マシンは、呼び出す権限がないという提示情報を第2の信頼できる実行スペースに返すことができる。
なお、関連する計算リソースを節約するために、本出願の実施例では、データ使用者の識別子と、データ提供者のデータを呼び出す権限との対応関係を予め設定でき、中継マシンは、データ呼び出し要求内のデータ使用者の識別子に基づいて、対応するデータ呼び出し要求を転送するか否かを決定することができる。例えば、中継マシンは、データ使用者の識別子に基づいて、当該データ使用者がデータ提供者のデータを呼び出す権限を有しないと決定した場合、そのデータ呼び出し要求を転送しない。また、データのセキュリティをより適切に保護するために、第1の信頼できる実行スペースの数を複数にし、第1の信頼できる実行スペースとデータ提供者とを1対1に対応させ、第2の信頼できる実行スペースの数を複数にし、第2の信頼できる実行スペースとデータ使用者とを1対1に対応させることができる。したがって、中継マシンは、データ呼び出し要求内のデータ提供者の識別子に基づいて、データ呼び出し要求を、対応する第1の信頼できる実行スペースに送信することができる。同時に、中継マシンは、呼び出し対象データを第2の信頼できる実行スペースに提供する際に、データ呼び出し要求内のデータ使用者の識別子に基づいて、呼び出し対象データを対応する第2の信頼できる実行スペースに提供すると決定することもできる。なお、データ提供者とデータ使用者のデータがいずれも1つである場合、データ提供者とデータ使用者のそれぞれが相手のデータを使用する必要があるとき、データ提供者をデータ使用者とし、データ使用者をデータ提供者とすることができる。
本出願の実施例では、第2の信頼できる実行スペースは、データ使用者から提供されたマイニング関連データを、中継マシンから返された第1の信頼できる実行スペースの提供可能なデータと組み合わせて、データマイニング結果を決定することができる。例えば、マイニング関連データがデータ予測のモデルであり、第2の信頼できる実行スペースは、提供可能なデータをデータ予測モデルに入力し、当該モデルから出力された結果をデータマイニング結果とする。なお、データマイニング結果は、少なくとも1つのマイニング結果、及び各マイニング結果の権限情報を含むことができるが、これらに限定されない。
選択可能に、第2の信頼できる実行スペースは、具体的には、中継マシンを介してデータ使用者機器から送信されたマイニング結果取得要求を受信し、マイニング結果取得要求は、データ使用者の識別子、及び取得対象マイニング結果の識別子を含み、データ使用者の識別子、取得対象マイニング結果の識別子及び各マイニング結果の権限情報に基づいて、データ使用者が取得対象マイニング結果を取得する権限を有するか否かを決定し、データ使用者が取得対象マイニング結果を取得する権限を有する場合、取得対象マイニング結果を、中継マシンを介してデータ使用者機器に送信するように構成される。これにより、データ使用者は、データマイニング結果をタイムリーに取得し、マイニング結果をより適切に統合することができる。
つまり、データ使用者機器は、中継マシンを介して第2の信頼できる実行スペースにマイニング結果取得要求を送信し、第2の信頼できる実行スペースは、マイニング結果取得要求内のデータ使用者の識別子、取得対象マイニング結果の識別子及び各マイニング結果の権限情報に基づいて、データ使用者が取得対象マイニング結果を取得する権限を有するか否かを決定し、データ使用者が取得対象マイニング結果を取得する権限を有する場合、第2の信頼できる実行スペースは、取得対象マイニング結果を、中継マシンを介してデータ使用者機器に送信し、データ使用者が取得対象マイニング結果を取得する権限を有しない場合、第2の信頼できる実行スペースは、当該データ使用者機器が取得対象マイニング結果を取得する権限を有しないという提示情報を当該データ使用者機器に送信することができる。
なお、本出願の実施例では、データ使用者の識別子と取得対象マイニング結果の権限との対応関係を予め設定でき、中継マシンは、マイニング結果取得要求内のデータ使用者の識別子に基づいて、対応するマイニング結果取得要求を転送するか否かを決定することができる。例えば、中継マシンは、データ使用者の識別子に基づいて、当該データ使用者が取得対象マイニング結果を取得する権限を有しないと決定した場合、そのマイニング結果取得要求を転送しない。
データマイニングシステムの拡張能力を向上させ、管理を容易にするために、データマイニングシステムは、サーバクラスタに配置でき、ここで、サーバクラスタは、少なくとも1つのサーバを含むことができるが、これに限定されない。第1の信頼できる実行スペース及び第2の信頼できる実行スペースは、サーバクラスタの少なくとも1つの仮想マシンに配置でき、中継マシンはサーバクラスタにおける仮想マシンであってもよい。
なお、第1の信頼できる実行スペース及び第2の信頼できる実行スペースが計算機能と記憶機能を有するため、仮想マシンは計算機能と記憶機能を有する必要があり、各サーバがいずれも計算機能と記憶機能を有し、1つの仮想マシンが1つのサーバの計算機能及び別のサーバの記憶機能を使用できるため、第1の信頼できる実行スペース及び第2の信頼できる実行スペースは、サーバクラスタの少なくとも1つの仮想マシンに配置できる。
上記実施例をよりよく説明するために、例を挙げて説明する。
例えば、図3に示すように、図3は、本出願の実施例に係るデータマイニングシステムの概略構成図である。図3において、データマイニングシステムは、中継マシンと、計算クラスタと、記憶クラスタとなどを含むことができる。記憶クラスタは、異なるBucket(記憶区間)に分割でき、Bucketは、データ提供者から提供されたシステムデータ及び提供可能なデータ、データ使用者から提供されたデータに基づいて決定されたデータ結果、スクリプトデータ及び異常情報などを記憶するように構成できる。データの記憶と検索を容易にするために、図4に示すように、Bucketは、Bucket接尾辞、データの用途、対応する接頭辞、ドメイン外及びドメイン内に基づいて記憶できる。中継マシンは、データ使用者のマイニング関連データを取得して記憶クラスタに送信でき、記憶クラスタと計算クラスタとは直接に相互通信でき、計算クラスタは、データ提供者から提供されたデータに基づいて計算して、データマイニング結果を取得できる。例えば、データ提供者から提供されたデータトレーニングモデルに基づいて、データをデータトレーニングモデルに入力して、モデルのトレーニング結果を取得する。データ使用者は、中継マシンを介して記憶クラスタにマイニング結果取得要求を送信し、計算クラスタによって監査結果を計算し、監査に合格した後、データ使用者がマイニング結果をダウンロードする。なお、マイニングデータ結果の出力方式が異なると、データ使用者がBucketでマイニングデータ結果をダウンロードする方式も異なる。例えば、マイニングデータ結果が単一のデータ出力である場合、記憶クラスタは、データマイニング結果をダウンロードBucketに移動でき、データ使用者はデータマイニング結果を直接ダウンロードして使用できる。また、例えば、マイニングデータ結果がルーチンのデータ出力である場合、記憶クラスタは、データマイニング結果をオンラインサービスインターフェースとしてカプセル化し、インターフェースパラメータの構成をデータ使用者に公開し、データ使用者はオンライン呼び出しの形式でデータマイニング結果を取得することができる。
データのセキュリティを確保するために、記憶クラスタは、異なる形式によってセキュリティ防護を行うことができ、例えば、ドメイン内外でユーザによってはBucketの読み取り及び書き込み権限(例えば、0は禁止、1は許可)が異なり、異なるユーザに対して異なるアカウントパスワードを設定して区別する。また、例えば、ドメイン内外で記憶クラスタの記憶システムにアクセスするには、特定のIP(Internet Protocol,ネットワーク間の相互接続のプロトコル)が必要である。また、例えば、データ使用者と記憶クラスタの記憶システムとは専用回線で接続される。同時に、ユーザは、web(World Wide web,ワールドワイドウェブ)サービスのみを介して中継マシンにログインでき、web側がアップロードとダウンロードの機能を提供しない。また、中継マシンのセキュリティはセキュリティグループによって制御でき、ユーザが固定出口IPを提供する場合に限って、ドメイン内の中継マシンにアクセスでき、メイン内の他のサーバ(記憶クラスタ、計算クラスタ)のそれぞれには外部ネットワーク権限がなく、すなわちメイン内の他のサーバは、外部ネットワークにアクセスすることができず、外部ネットワークからアクセスすることもできない。なお、本出願の実施例では、計算クラスタは、最初に1台のクラウド仮想マシンサーバで構成できるが、計算量を増やす必要がある場合、クラウド仮想マシンサーバの数を増やすことができ、これは、本出願では具体的に限定されない。
本出願の実施例に係るデータマイニングシステムは、中継マシンと、第1の信頼できる実行スペースと、第2の信頼できる実行スペースと、を含み、中継マシンのみは、第1の信頼できる実行スペース及び第2の信頼できる実行スペースへのアクセス権限を有し、第1の信頼できる実行スペースは、データ提供者の提供可能なデータを記憶するように構成され、第2の信頼できる実行スペースは、データ使用者のマイニング関連データを記憶するように構成され、中継マシンは、第2の信頼できる実行スペースのデータ呼び出し要求を受信し、データ呼び出し要求に従って第1の信頼できる実行スペースから呼び出し対象データを取得して第2の信頼できる実行スペースに提供することにより、呼び出し対象データ及びマイニング関連データに基づいてデータマイニングを行い、データマイニング結果を取得し、データマイニング結果をデータ使用者機器に提供するように構成される。当該データマイニングシステムは、中継マシンを介して、第1の信頼できる実行スペースにおける提供可能なデータを呼び出し、提供可能なデータ及びマイニング関連データに基づいてデータマイニング結果を決定し、このマイニング結果をデータ使用者機器に提供することを実現でき、これにより、データのプライバシーを確保することを前提に、データ使用者に大量のデータを提供してイベントの予測を行い、予測精度を向上させることができる。
上記実施例を実現するために、本出願は、データマイニング方法をさらに提供する。
図5は、本出願の第3の実施例に係る概略図である。図5に示すように、当該データマイニング方法は、データ使用者に対応する第2の信頼できる実行スペースに適用でき、データマイニング方法は、以下ステップ510〜ステップ530を含む。
ステップ510において、中継マシンを介して、データ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信し、データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含む。
本出願の実施例では、第2の信頼できる実行スペースは、中継マシンを介して第1の信頼できる実行スペースにデータ呼び出し要求を送信して、第1の信頼できる実行スペースにおける提供可能なデータを呼び出すことができる。ここで、データ呼び出し要求は、データ使用者の識別子、データ提供者の識別子、及び呼び出し対象データの識別子などを含むことができるが、これらに限定されない。
ステップ520において、データ提供者が呼び出し対象データを呼び出す権限を有する場合、第1の信頼できる実行スペースから返された呼び出し対象データを取得する。
次いで、第1の信頼できる実行スペースは、データ呼び出し要求内のデータ使用者の識別子、呼び出し対象データの識別子及び各データの権限情報などに基づいて、データ使用者が呼び出し対象データを呼び出す権限を有するか否かを決定し、データ使用者が呼び出し対象データを呼び出す権限を有すると決定した場合、中継マシンを介して呼び出し対象データを第2の信頼できる実行スペースに返すことができる。データ使用者が呼び出し対象データを呼び出す権限を有しないと決定された場合、中継マシンは、呼び出す権限がないという提示情報を第2の信頼できる実行スペースに返すことができる。
ステップ530において、中継マシンを介してデータマイニング結果をデータ使用者機器に提供する。
本出願の実施例では、第2の信頼できる実行スペースは、データ提供者のマイニング関連データを、中継マシンから返された第1の信頼できる実行スペースの提供可能なデータに基づいて、データマイニング結果を決定することができる。例えば、マイニング関連データがデータ予測モデルであり、第2の信頼できる実行スペースは、提供可能なデータをデータ予測モデルに入力し、当該モデルから出力された結果をデータマイニング結果とする。なお、データマイニング結果は、少なくとも1つのマイニング結果、及び各マイニング結果の権限情報を含むことができるが、これらに限定されない。
次いで、データ使用者機器は、中継マシンを介して第2の信頼できる実行スペースにマイニング結果取得要求を送信し、第2の信頼できる実行スペースは、マイニング結果取得要求内のデータ使用者の識別子、取得対象マイニング結果の識別子及び各マイニング結果の権限情報に基づいて、データ使用者が取得対象マイニング結果を取得する権限を有するか否かを決定し、データ使用者が取得対象マイニング結果を取得する権限を有する場合、第2の信頼できる実行スペースは、取得対象マイニング結果を、中継マシンを介してデータ使用者機器に送信し、データ使用者が取得対象マイニング結果を取得する権限を有しない場合、第2の信頼できる実行スペースは、当該データ使用者機器が取得対象マイニング結果を取得する権限を有しないという提示情報をデータ使用者機器に送信することができる。
本出願の実施例のデータマイニング方法は、データ使用者に対応する第2の信頼できる実行スペースに適用され、中継マシンを介して、データ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信し、データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含み、データ提供者が呼び出し対象データを呼び出す権限を有する場合、第1の信頼できる実行スペースから返された呼び出し対象データを取得し、呼び出し対象データ及びデータ提供者のマイニング関連データに基づいて、データマイニング結果を決定し、中継マシンを介してデータマイニング結果をデータ使用者機器に提供する。当該方法は、中継マシンを介して、第1の信頼できる実行スペースにおける提供可能なデータを第2の信頼できる実行スペースに提供し、第2の信頼できる実行スペースが提供可能なデータ及びマイニング関連データに基づいてデータマイニング結果を決定し、中継マシンを介してこのマイニング結果をデータ使用者機器に提供することにより、データのプライバシーを確保することを前提に、データ使用者に大量のデータを提供してイベントの予測を行い、予測精度を向上させることができる。
上記実施例を実現するために、本出願は、データマイニング装置をさらに提供する。
図6は、本出願の第4の実施例に係る概略図である。図6に示すように、当該データマイニング装置600は、データ使用者に対応する第2の信頼できる実行スペースに適用でき、当該データマイニング装置600は、送信モジュール610と、取得モジュール620と、決定モジュール630と、を含む。
送信モジュール610は、中継マシンを介してデータ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信するように構成され、データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含む。取得モジュール620は、データ提供者が呼び出し対象データを呼び出す権限を有する場合、第1の信頼できる実行スペースから返された呼び出し対象データを取得するように構成される。決定モジュール630は、中継マシンを介してデータマイニング結果をデータ使用者機器に提供するように構成される。
本出願の実施例に係るデータマイニング装置は、データ使用者に対応する第2の信頼できる実行スペースに適用され、中継マシンを介して、データ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信し、データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含み、データ提供者が呼び出し対象データを呼び出す権限を有する場合、第1の信頼できる実行スペースから返された呼び出し対象データを取得し、呼び出し対象データ及びデータ提供者のマイニング関連データに基づいて、データマイニング結果を決定し、中継マシンを介してデータマイニング結果をデータ使用者機器に提供する。当該装置は、中継マシンを介して、第1の信頼できる実行スペースにおける提供可能なデータを第2の信頼できる実行スペースに提供し、第2の信頼できる実行スペースが提供可能なデータ及びマイニング関連データに基づいてデータマイニング結果を決定し、中継マシンを介してこのマイニング結果をデータ使用者機器に提供することを実現でき、これにより、データのプライバシーを確保することを前提に、データ使用者に大量のデータを提供してイベントの予測を行い、予測精度を向上させることができる。
本出願の実施例を実現するために、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
図7は本出願の実施例に係るデータマイニング方法を実現するための電子機器のブロック図である。図7に示すように、電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
図7に示すように、当該電子機器は、一つ又は複数のプロセッサ701と、メモリ702と、高速インターフェースと低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に応じて他の方式で取り付けることができる。プロセッサは、外部入力/出力装置(インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施方式では、必要であれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリと複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、部分的な必要な操作(例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする)を提供することができる。図7では、一つのプロセッサ701を例とする。
メモリ702は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。その中、前記メモリには、少なくとも一つのプロセッサによって実行される命令を記憶して、前記少なくとも一つのプロセッサが本出願により提供されるデータマイニング方法を実行することができるようにする。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータが本出願により提供されるデータマイニング方法を実行するためのコンピュータ命令を記憶する。
メモリ702は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例におけるデータマイニング方法に対応するプログラム命令/モジュール(例えば、図6に示す送信モジュール610、取得モジュール620及び決定モジュール630)ように、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するために用いられる。プロセッサ701は、メモリ702に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、上記の方法の実施例におけるデータマイニング方法を実現する。
メモリ702は、プログラム記憶領域とデータ記憶領域とを含むことができ、その中、プログラム記憶領域は、オペレーティングシステム、少なくとも一つの機能に必要なアプリケーションを記憶することができ、データ記憶領域は、データマイニング方法を実現するための電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ702は、高速ランダム存取メモリを含むことができ、非一時的なメモリをさらに含むことができ、例えば、少なくとも一つのディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ702は、プロセッサ701に対して遠隔に設定されたメモリを含むことができ、これらの遠隔メモリは、ネットワークを介してテストを実行する電子機器に接続されることができる。上記のネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定しない。
データマイニング方法の電子機器は、入力装置703と出力装置704とをさらに含むことができる。プロセッサ701、メモリ702、入力装置703、及び出力装置704は、バス又は他の方式を介して接続することができ、図7では、バスを介して接続することを例とする。
入力装置703は、入力された数字又は文字情報を受信することができ、及びテストを実行する電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、指示杆、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置704は、ディスプレイデバイス、補助照明デバイス(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定しない。いくつかの実施方式では、ディスプレイデバイスは、タッチスクリーンであってもよい。
本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令、高レベルのプロセス及び/又は対象指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することを含む。本明細書に使用されるように、用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械命令及び/又はデータをプログラマブルプロセッサに提供するように構成される任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。用語「機械読み取り可能な信号」は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインターフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント−サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。
上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
上記の具体的な実施方式は、本出願に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び置換を行うことができる。任意の本出願の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims (14)

  1. データマイニングシステムであって、
    中継マシンと、第1の信頼できる実行スペースと、第2の信頼できる実行スペースと、を含み、
    前記中継マシンのみが前記第1の信頼できる実行スペース及び前記第2の信頼できる実行スペースへのアクセス権限を有し、
    前記第1の信頼できる実行スペースは、データ提供者の提供可能なデータを記憶するように構成され、前記第2の信頼できる実行スペースは、データ使用者のマイニング関連データを記憶するように構成され、
    前記中継マシンは、前記第2の信頼できる実行スペースのデータ呼び出し要求を受信し、前記データ呼び出し要求に従って前記第1の信頼できる実行スペースから呼び出し対象データを取得して前記第2の信頼できる実行スペースに提供することにより、前記呼び出し対象データ及び前記マイニング関連データに基づいてデータマイニングを行い、データマイニング結果を取得し、前記データマイニング結果をデータ使用者機器に提供するように構成される、
    ことを特徴とするデータマイニングシステム。
  2. 前記提供可能なデータは、複数のデータと、各データの権限情報とを含み、
    前記データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データ識別子を含み、
    前記第1の信頼できる実行スペースは、データ呼び出し要求中のデータ使用者の識別子、呼び出し対象データの識別子及び各データの権限情報に基づいて、前記データ使用者が前記呼び出し対象データを呼び出す権限を有するか否かを決定し、前記データ使用者が前記呼び出し対象データを呼び出す権限を有すると決定された場合、前記呼び出し対象データを前記中継マシンに返すように構成される、
    ことを特徴とする請求項1に記載のシステム。
  3. 前記中継マシンは、前記データ使用者機器に接続され、前記データ使用者機器から送信された前記マイニング関連データを取得し、前記マイニング関連データを前記第2の信頼できる実行スペースに送信して記憶させるように構成され、
    前記中継マシンは、データ提供者機器に接続され、前記データ提供者機器から送信された前記提供可能なデータを取得し、前記提供可能なデータを前記第1の信頼できる実行スペースに送信して記憶させるように構成される、
    ことを特徴とする請求項1に記載のシステム。
  4. 前記データマイニング結果は、少なくとも1つのマイニング結果、及び各マイニング結果の権限情報を含み、
    前記第2の信頼できる実行スペースは、具体的には、中継マシンを介して前記データ使用者機器から送信されたマイニング結果取得要求を受信し、前記マイニング結果取得要求は、データ使用者の識別子、及び取得対象マイニング結果の識別子を含み、
    前記データ使用者の識別子、取得対象マイニング結果の識別子及び各マイニング結果の権限情報に基づいて、前記データ使用者が前記取得対象マイニング結果を取得する権限を有するか否かを決定し、
    前記データ使用者が前記取得対象マイニング結果を取得する権限を有する場合、前記中継マシンが前記取得対象マイニング結果を前記データ使用者機器に送信するように前記取得対象マイニング結果を前記中継マシンに送信するように構成される、
    ことを特徴とする請求項1に記載のシステム。
  5. 前記第1の信頼できる実行スペースの数は複数であり、前記第1の信頼できる実行スペースと前記データ提供者とが1対1に対応し、及び/又は、
    前記第2の信頼できる実行スペースの数は複数であり、前記第2の信頼できる実行スペースとデータ使用者とが1対1に対応する、
    ことを特徴とする請求項1に記載のシステム。
  6. 前記データマイニングシステムは、サーバクラスタに配置され、前記サーバクラスタは、少なくとも1つのサーバを含み、
    前記第1の信頼できる実行スペース及び前記第2の信頼できる実行スペースは、前記サーバクラスタの少なくとも1つの仮想マシンに配置され、
    前記中継マシンは前記サーバクラスタにおける仮想マシンである、
    ことを特徴とする請求項1又は4に記載のシステム。
  7. 前記中継マシンは、さらに、前記第1の信頼できる実行スペース及び前記第2の信頼できる実行スペースの使用期限を決定し、
    前記第1の信頼できる実行スペースの使用期限が切れた場合、前記第1の信頼できる実行スペースのコンテンツをクリアし、
    前記第2の信頼できる実行スペースの使用期限が切れた場合、前記第2の信頼できる実行スペースのコンテンツをクリアするように構成される、
    ことを特徴とする請求項1に記載のシステム。
  8. 前記中継マシンは、さらに、前記マイニング関連データの属性情報を取得し、
    前記第2の信頼できる実行スペースが非アイドル状態にある場合、前記属性情報に基づいて、前記データ使用者のために第2の信頼できる実行スペースを作成し、
    前記マイニング関連データを、作成された第2の信頼できる実行スペースに送信して記憶させるように構成される、
    ことを特徴とする請求項3に記載のシステム。
  9. 前記中継マシンは、さらに、作成された第2の信頼できる実行スペースの使用期限を決定し、
    作成された第2の信頼できる実行スペースの使用期限が切れた場合、作成された第2の信頼できる実行スペースを破棄するように構成される、
    ことを特徴とする請求項8に記載のシステム。
  10. データ使用者に対応する第2の信頼できる実行スペースに適用されるデータマイニング方法であって、中継マシンを介して、データ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信するステップであって、前記データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含むステップと、
    前記データ提供者が前記呼び出し対象データを呼び出す権限を有する場合、前記第1の信頼できる実行スペースから返された呼び出し対象データを取得するステップと、
    前記呼び出し対象データ及び前記データ提供者のマイニング関連データに基づいて、データマイニング結果を決定するステップと、
    前記中継マシンを介して前記データマイニング結果をデータ使用者機器に提供するステップと、を含む、
    ことを特徴とするデータマイニング方法。
  11. データ使用者に対応する第2の信頼できる実行スペースに適用されるデータマイニング装置であって、
    中継マシンを介して、データ提供者に対応する第1の信頼できる実行スペースにデータ呼び出し要求を送信するように構成される送信モジュールであって、前記データ呼び出し要求は、データ使用者の識別子、及び呼び出し対象データの識別子を含む送信モジュールと、
    前記データ提供者が前記呼び出し対象データを呼び出す権限を有する場合、前記第1の信頼できる実行スペースから返された呼び出し対象データを取得するように構成される取得モジュールと、
    前記中継マシンを介して前記データマイニング結果をデータ使用者機器に提供するように構成される決定モジュールと、を含む、
    ことを特徴とするデータマイニング装置。
  12. 電子機器であって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項10に記載のデータマイニング方法を実行可能である、
    ことを特徴とする電子機器。
  13. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、前記コンピュータに請求項10に記載のデータマイニング方法を実行させる、
    ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
  14. コンピュータに請求項10に記載のデータマイニング方法を実行させる、
    ことを特徴とするコンピュータプログラム。
JP2021049847A 2020-04-26 2021-03-24 データマイニングシステム、方法、装置、電子機器及び記憶媒体 Active JP7461318B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010339533.8A CN111597226B (zh) 2020-04-26 2020-04-26 数据挖掘系统、方法、装置、电子设备及存储介质
CN202010339533.8 2020-04-26

Publications (2)

Publication Number Publication Date
JP2021103563A true JP2021103563A (ja) 2021-07-15
JP7461318B2 JP7461318B2 (ja) 2024-04-03

Family

ID=72183815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021049847A Active JP7461318B2 (ja) 2020-04-26 2021-03-24 データマイニングシステム、方法、装置、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20210248139A1 (ja)
EP (1) EP3832502A3 (ja)
JP (1) JP7461318B2 (ja)
KR (1) KR102586892B1 (ja)
CN (1) CN111597226B (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016189138A (ja) * 2015-03-30 2016-11-04 株式会社Kddi研究所 キャッシュ管理装置、方法及びプログラム
JP2016192126A (ja) * 2015-03-31 2016-11-10 株式会社Kddi研究所 セキュリティゲートウェイ装置、方法及びプログラム
JP2018156293A (ja) * 2017-03-16 2018-10-04 富士通株式会社 プログラム、情報処理方法および情報処理装置
JP2019021055A (ja) * 2017-07-18 2019-02-07 富士ゼロックス株式会社 管理サーバ、データ閲覧システム及びプログラム
JP2020014153A (ja) * 2018-07-19 2020-01-23 帝人ファーマ株式会社 データ中継装置、データ中継装置の制御方法及びデータ中継装置の制御プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008046101A2 (en) * 2006-10-13 2008-04-17 Ariel Silverstone Client authentication and data management system
WO2011144080A2 (zh) * 2011-05-25 2011-11-24 华为技术有限公司 一种通信的方法、系统及装置
US8954965B2 (en) * 2012-08-03 2015-02-10 Microsoft Corporation Trusted execution environment virtual machine cloning
US20140075502A1 (en) * 2012-09-11 2014-03-13 Selim Aissi Resource management of execution environments
GB2541625A (en) 2014-05-23 2017-02-22 Datarobot Systems and techniques for predictive data analytics
US20170317984A1 (en) * 2014-10-10 2017-11-02 Pcms Holdings, Inc. Systems and methods for protecting user privacy in networked data collection
CN105930731B (zh) * 2015-12-21 2018-12-28 中国银联股份有限公司 一种安全应用ta交互的方法及装置
US10375109B2 (en) * 2015-12-23 2019-08-06 Mcafee, Llc Protecting personally identifiable information from electronic user devices
KR102088290B1 (ko) * 2016-01-07 2020-03-12 한국전자통신연구원 보안 영역 기반의 신뢰서비스 제공 방법 및 이를 이용한 장치
US10892942B2 (en) * 2016-01-22 2021-01-12 Equinix, Inc. Container-based cloud exchange disaster recovery
GB201610883D0 (en) * 2016-06-22 2016-08-03 Microsoft Technology Licensing Llc Privacy-preserving machine learning
US20190095879A1 (en) * 2017-09-26 2019-03-28 Cornell University Blockchain payment channels with trusted execution environments
US11184323B2 (en) * 2017-09-28 2021-11-23 L3 Technologies, Inc Threat isolation using a plurality of containers
WO2019100063A1 (en) * 2017-11-20 2019-05-23 Moshe Shadmon A system and apparatus to manage data using a peer-to-peer network and the blockchain
CN108563492B (zh) * 2018-05-07 2022-05-31 联想(北京)有限公司 数据获取方法、虚拟机以及电子设备
US20200067975A1 (en) * 2018-08-27 2020-02-27 Box, Inc. Ransomware remediation in collaboration environments
CN110034924B (zh) * 2018-12-12 2022-05-13 创新先进技术有限公司 一种数据处理方法和装置
CN110213346B (zh) * 2019-05-14 2021-12-14 北京思源理想控股集团有限公司 加密信息的传输方法及装置
CN110275908A (zh) * 2019-06-04 2019-09-24 阚智博 基于大数据的医疗数据挖掘系统和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016189138A (ja) * 2015-03-30 2016-11-04 株式会社Kddi研究所 キャッシュ管理装置、方法及びプログラム
JP2016192126A (ja) * 2015-03-31 2016-11-10 株式会社Kddi研究所 セキュリティゲートウェイ装置、方法及びプログラム
JP2018156293A (ja) * 2017-03-16 2018-10-04 富士通株式会社 プログラム、情報処理方法および情報処理装置
JP2019021055A (ja) * 2017-07-18 2019-02-07 富士ゼロックス株式会社 管理サーバ、データ閲覧システム及びプログラム
JP2020014153A (ja) * 2018-07-19 2020-01-23 帝人ファーマ株式会社 データ中継装置、データ中継装置の制御方法及びデータ中継装置の制御プログラム

Also Published As

Publication number Publication date
US20210248139A1 (en) 2021-08-12
KR102586892B1 (ko) 2023-10-10
CN111597226B (zh) 2023-06-16
EP3832502A2 (en) 2021-06-09
EP3832502A3 (en) 2021-10-13
CN111597226A (zh) 2020-08-28
KR20210043523A (ko) 2021-04-21
JP7461318B2 (ja) 2024-04-03

Similar Documents

Publication Publication Date Title
US10817488B2 (en) Historical data representation in cloud service
US11036696B2 (en) Resource allocation for database provisioning
US10929202B2 (en) Cloud service notifications
AU2013337279B2 (en) Systems and methods for provisioning and managing an elastic computing infrastructure
JP7194162B2 (ja) データ処理方法、装置、電子機器及び記憶媒体
JP7170768B2 (ja) 開発マシン操作タスクの処理方法、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111897694B (zh) 小程序中消息处理方法及装置、设备、存储介质
CN111163096B (zh) 提供数据接口服务的方法、装置、电子设备、存储介质
US10956306B2 (en) Debugging streaming applications using debug regions
US9374417B1 (en) Dynamic specification auditing for a distributed system
US11734454B2 (en) Method for providing applet service capability, electronic device, and storage medium
KR20210042283A (ko) 애플릿용 데이터 처리 방법, 장치, 기기 및 매체
CN113268260A (zh) 用于web前端的路由方法及装置
CN112015468A (zh) 一种接口文档处理方法、装置、电子设备以及存储介质
JP2021103544A (ja) コード再利用処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品
CN114579250A (zh) 一种构建虚拟集群的方法、装置及存储介质
US9588831B2 (en) Preventing recurrence of deterministic failures
JP2021103563A (ja) データマイニングシステム、方法、装置、電子機器及び記憶媒体
US11178216B2 (en) Generating client applications from service model descriptions
CN111597579B (zh) 卫生安全检测方法、装置、电子设备及存储介质
US20230067891A1 (en) Service virtualization platform
US20240187501A1 (en) Techniques for distributed interface component generation
JP2023509812A (ja) データ記憶方法、装置、クエリ方法、電子機器および可読媒体
CN116257240A (zh) 一种子站点页面的生成方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210324

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220411

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221221

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20221221

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230105

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20230110

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20230317

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20230322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240322

R150 Certificate of patent or registration of utility model

Ref document number: 7461318

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150