JP2021002292A - データ処理装置、データ処理方法及びプログラム - Google Patents
データ処理装置、データ処理方法及びプログラム Download PDFInfo
- Publication number
- JP2021002292A JP2021002292A JP2019116675A JP2019116675A JP2021002292A JP 2021002292 A JP2021002292 A JP 2021002292A JP 2019116675 A JP2019116675 A JP 2019116675A JP 2019116675 A JP2019116675 A JP 2019116675A JP 2021002292 A JP2021002292 A JP 2021002292A
- Authority
- JP
- Japan
- Prior art keywords
- value
- attribute items
- attribute
- edge
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 230000008859 change Effects 0.000 claims description 13
- 238000000034 method Methods 0.000 description 36
- 238000012217 deletion Methods 0.000 description 24
- 230000037430 deletion Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000003754 machining Methods 0.000 description 7
- 238000002910 structure generation Methods 0.000 description 7
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 101100217298 Mus musculus Aspm gene Proteins 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
ノード履歴集合H=(h1,...,hl)=[{a(1,1),a(1,2),a(1,3),a(2,2),a(2,1),a(3,1),a(3,2),a(1,4)},...]
探索済みエッジ集合P=(p1,...,pl)=[{null,null,1.0,null,1.0,null,1.0},...]
なお、ノード履歴集合H内の1つの{}が、1つのノード履歴hに対応する。同様に、探索済みエッジ集合P内の1つの{}が、1つの探索済みエッジpに対応する。
ε=n(1−rx)
但し、rx=1の場合、ε=z
但し、rxは、対象エッジの接続可能性である。また、nは、ノイズ量の範囲を調整する調整係数である。更に、zは、最もノイズ付与量が大きくなる値である。すなわち、接続可能性rxが1の場合には、εが0となってしまう。そこで、上記では、接続可能性rxが1の場合には、最もノイズ付与量が多くなる値がεに設定されることを示す。
横探索リスト=(−,null,null,null,0,0,0,0)
縦探索リスト=(−)
また、aが、属性項目a(1,4)であれば、横探索リスト及び縦探索リストは、以下の通りである。
横探索リスト=(−,0,0,0,0)
縦探索リスト=(−,null,null,null)
続いて、経路探索部14は、取得された横探索リスト及び縦探索リストの組の中から、ノード履歴hiに存在しない属性項目であって、有効な値(null又は0より大きい値)に対応する属性項目をランダムに選択する(S205)。ここで、横探索リストの中から該当する属性項目が選択される場合、当該属性項目は、ランダムに選択された有効な値が属する列に対応する属性項目である。一方、縦探索リストの中から該当する属性項目が選択される場合、当該属性項目は、ランダムに選択された有効な値が属する行に対応する属性項目である。
(付記1)
複数のデータベースのそれぞれを構成する属性項目のうちの2つの属性項目の組ごとに、当該2つの属性項目に関してデータベースに記憶されている値の集合に基づいて、当該2つの属性項目の関連性の強さを示す指標の値を計算する計算部と、
前記各属性項目をノードとし、前記指標の値に基づいて関連が有ると判定される属性項目間が当該値を重みとするエッジによって接続されるグラフ構造を表現する情報を生成する生成部と、
を有することを特徴とするデータ処理装置。
(付記2)
前記生成部は、同じデータベースを構成する2つの属性項目に対しては、当該2つの属性項目が同じデータベースに属することを示すエッジによって接続される前記グラフ構造を表現する情報を生成する、
ことを特徴とする付記1記載のデータ処理装置。
(付記3)
前記グラフ構造において特定の属性項目に係るノードを始点とする1以上の経路を探索する探索部と、
前記経路に含まれるエッジの重みの総和が大きい経路から順に、当該経路に含まれるノードに対応する属性項目に関して記憶されている値を変更する変更部と、
を有することを特徴とする付記1又は2記載のデータ処理装置。
(付記4)
前記変更部は、前記エッジの重みの大きさに応じて、当該エッジに接続されるノードに係る属性項目に関してデータベースに記憶されている値の変化の度合いを変える、
ことを特徴とする付記3記載のデータ処理装置。
(付記5)
前記変更部は、差分プライバシーによって前記値を変更し、前記エッジの重みの大きさに応じて差分プライバシーによるノイズ量を変える、
ことを特徴とする付記4記載のデータ処理装置。
(付記6)
複数のデータベースのそれぞれを構成する属性項目のうちの2つの属性項目の組ごとに、当該2つの属性項目に関してデータベースに記憶されている値の集合に基づいて、当該2つの属性項目の関連性の強さを示す指標の値を計算し、
前記各属性項目をノードとし、前記指標の値に基づいて関連が有ると判定される属性項目間が当該値を重みとするエッジによって接続されるグラフ構造を表現する情報を生成する、
処理をコンピュータが実行することを特徴とするデータ処理方法。
(付記7)
前記生成する処理は、同じデータベースを構成する2つの属性項目に対しては、当該2つの属性項目が同じデータベースに属することを示すエッジによって接続される前記グラフ構造を表現する情報を生成する、
ことを特徴とする付記6記載のデータ処理方法。
(付記8)
前記グラフ構造において特定の属性項目に係るノードを始点とする1以上の経路を探索し、
前記経路に含まれるエッジの重みの総和が大きい経路から順に、当該経路に含まれるノードに対応する属性項目に関して記憶されている値を変更する、
を処理を前記コンピュータが実行することを特徴とする付記6又は7記載のデータ処理方法。
(付記9)
前記変更する処理は、前記エッジの重みの大きさに応じて、当該エッジに接続されるノードに係る属性項目に関してデータベースに記憶されている値の変化の度合いを変える、
ことを特徴とする付記8記載のデータ処理方法。
(付記10)
前記変更する処理は、差分プライバシーによって前記値を変更し、前記エッジの重みの大きさに応じて差分プライバシーによるノイズ量を変える、
ことを特徴とする付記9記載のデータ処理方法。
(付記11)
複数のデータベースのそれぞれを構成する属性項目のうちの2つの属性項目の組ごとに、当該2つの属性項目に関してデータベースに記憶されている値の集合に基づいて、当該2つの属性項目の関連性の強さを示す指標の値を計算し、
前記各属性項目をノードとし、前記指標の値に基づいて関連が有ると判定される属性項目間が当該値を重みとするエッジによって接続されるグラフ構造を表現する情報を生成する、
処理をコンピュータに実行させることを特徴とするプログラム。
(付記12)
前記生成する処理は、同じデータベースを構成する2つの属性項目に対しては、当該2つの属性項目が同じデータベースに属することを示すエッジによって接続される前記グラフ構造を表現する情報を生成する、
ことを特徴とする付記11記載のプログラム。
(付記13)
前記グラフ構造において特定の属性項目に係るノードを始点とする1以上の経路を探索し、
前記経路に含まれるエッジの重みの総和が大きい経路から順に、当該経路に含まれるノードに対応する属性項目に関して記憶されている値を変更する、
を処理を前記コンピュータに実行させることを特徴とする付記11又は12記載のプログラム。
(付記14)
前記変更する処理は、前記エッジの重みの大きさに応じて、当該エッジに接続されるノードに係る属性項目に関してデータベースに記憶されている値の変化の度合いを変える、
ことを特徴とする付記13記載のプログラム。
(付記15)
前記変更する処理は、差分プライバシーによって前記値を変更し、前記エッジの重みの大きさに応じて差分プライバシーによるノイズ量を変える、
ことを特徴とする付記14記載のプログラム。
11 設定情報入力部
12 接続可能性計算部
13 グラフ構造生成部
14 経路探索部
15 データ加工部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
B バス
Claims (7)
- 複数のデータベースのそれぞれを構成する属性項目のうちの2つの属性項目の組ごとに、当該2つの属性項目に関してデータベースに記憶されている値の集合に基づいて、当該2つの属性項目の関連性の強さを示す指標の値を計算する計算部と、
前記各属性項目をノードとし、前記指標の値に基づいて関連が有ると判定される属性項目間が当該値を重みとするエッジによって接続されるグラフ構造を表現する情報を生成する生成部と、
を有することを特徴とするデータ処理装置。 - 前記生成部は、同じデータベースを構成する2つの属性項目に対しては、当該2つの属性項目が同じデータベースに属することを示すエッジによって接続される前記グラフ構造を表現する情報を生成する、
ことを特徴とする請求項1記載のデータ処理装置。 - 前記グラフ構造において特定の属性項目に係るノードを始点とする1以上の経路を探索する探索部と、
前記経路に含まれるエッジの重みの総和が大きい経路から順に、当該経路に含まれるノードに対応する属性項目に関して記憶されている値を変更する変更部と、
を有することを特徴とする請求項1又は2記載のデータ処理装置。 - 前記変更部は、前記エッジの重みの大きさに応じて、当該エッジに接続されるノードに係る属性項目に関してデータベースに記憶されている値の変化の度合いを変える、
ことを特徴とする請求項3記載のデータ処理装置。 - 前記変更部は、差分プライバシーによって前記値を変更し、前記エッジの重みの大きさに応じて差分プライバシーによるノイズ量を変える、
ことを特徴とする請求項4記載のデータ処理装置。 - 複数のデータベースのそれぞれを構成する属性項目のうちの2つの属性項目の組ごとに、当該2つの属性項目に関してデータベースに記憶されている値の集合に基づいて、当該2つの属性項目の関連性の強さを示す指標の値を計算し、
前記各属性項目をノードとし、前記指標の値に基づいて関連が有ると判定される属性項目間が当該値を重みとするエッジによって接続されるグラフ構造を表現する情報を生成する、
処理をコンピュータが実行することを特徴とするデータ処理方法。 - 複数のデータベースのそれぞれを構成する属性項目のうちの2つの属性項目の組ごとに、当該2つの属性項目に関してデータベースに記憶されている値の集合に基づいて、当該2つの属性項目の関連性の強さを示す指標の値を計算し、
前記各属性項目をノードとし、前記指標の値に基づいて関連が有ると判定される属性項目間が当該値を重みとするエッジによって接続されるグラフ構造を表現する情報を生成する、
処理をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019116675A JP7322544B2 (ja) | 2019-06-24 | 2019-06-24 | データ処理装置、データ処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019116675A JP7322544B2 (ja) | 2019-06-24 | 2019-06-24 | データ処理装置、データ処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021002292A true JP2021002292A (ja) | 2021-01-07 |
JP7322544B2 JP7322544B2 (ja) | 2023-08-08 |
Family
ID=73995169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019116675A Active JP7322544B2 (ja) | 2019-06-24 | 2019-06-24 | データ処理装置、データ処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7322544B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008027072A (ja) * | 2006-07-19 | 2008-02-07 | Fujitsu Ltd | データベース分析プログラム、データベース分析装置、データベース分析方法 |
JP2014092967A (ja) * | 2012-11-05 | 2014-05-19 | Mitsubishi Electric Building Techno Service Co Ltd | 同一項目検出装置及びプログラム |
US20160292455A1 (en) * | 2013-11-22 | 2016-10-06 | The Trustees Of Columbia University In The City Of New York | Database Privacy Protection Devices, Methods, And Systems |
-
2019
- 2019-06-24 JP JP2019116675A patent/JP7322544B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008027072A (ja) * | 2006-07-19 | 2008-02-07 | Fujitsu Ltd | データベース分析プログラム、データベース分析装置、データベース分析方法 |
JP2014092967A (ja) * | 2012-11-05 | 2014-05-19 | Mitsubishi Electric Building Techno Service Co Ltd | 同一項目検出装置及びプログラム |
US20160292455A1 (en) * | 2013-11-22 | 2016-10-06 | The Trustees Of Columbia University In The City Of New York | Database Privacy Protection Devices, Methods, And Systems |
Also Published As
Publication number | Publication date |
---|---|
JP7322544B2 (ja) | 2023-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zaeem et al. | The effect of the GDPR on privacy policies: Recent progress and future promise | |
US10423963B2 (en) | Systems and methods for fraud detection by transaction ticket size pattern | |
JP6814017B2 (ja) | 匿名化のために属性を自動的に識別するコンピュータ実装システムおよび方法 | |
Almulihi et al. | Analyzing the Implications of Healthcare Data Breaches through Computational Technique. | |
US20020091650A1 (en) | Methods of anonymizing private information | |
US20220122208A1 (en) | Digital Property Authentication and Management System | |
AU2017230349B2 (en) | Published information processing method and device, and information publishing system | |
CN107305615A (zh) | 数据表识别方法和系统 | |
US20240062232A1 (en) | System And Method For Allocating Digital Data According To Valu of Digital Content | |
JP2021197089A (ja) | 出力装置、出力方法及び出力プログラム | |
JP7322544B2 (ja) | データ処理装置、データ処理方法及びプログラム | |
CA3169819C (en) | Systems and methods for automated product classification | |
JPWO2014050837A1 (ja) | 判定装置、判定方法、及びプログラム | |
Ganesh et al. | Implementation of Novel Machine Learning Methods for Analysis and Detection of Fake Reviews in Social Media | |
JP6119101B2 (ja) | 集計装置、集計方法および集計システム | |
KR102418984B1 (ko) | 사용환경에 대한 위험에 따른 정보집합물을 가명 처리하는 시스템 및 그 제어방법 | |
CN113498592B (zh) | 用于数字财产认证和管理的方法和系统 | |
KR20180008499A (ko) | 가격 설정 지원 시스템, 가격 설정 지원 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체, 가격 설정 지원 방법, 지적재산 평가 지원 시스템, 지적재산 평가 지원 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체 및 지적재산 평가 지원 방법 | |
JP6409888B2 (ja) | 集計装置および集計プログラム | |
WO2014073370A1 (ja) | 情報処理装置、情報処理方法及びコンピュータプログラム | |
TW201539217A (zh) | 文件分析系統、文件分析方法、以及文件分析程式 | |
JP4154973B2 (ja) | 貸出し機材管理システム | |
US20240119178A1 (en) | Anonymizing personal information for use in assessing fraud risk | |
CN116934418B (zh) | 一种异常订单的检测预警方法、系统、设备及存储介质 | |
JP7096777B2 (ja) | マーケティング装置、マーケティング方法及びマーケティングプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7322544 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |