JP7285511B2 - Data management device, data management method, program, and data management system - Google Patents

Data management device, data management method, program, and data management system Download PDF

Info

Publication number
JP7285511B2
JP7285511B2 JP2019085404A JP2019085404A JP7285511B2 JP 7285511 B2 JP7285511 B2 JP 7285511B2 JP 2019085404 A JP2019085404 A JP 2019085404A JP 2019085404 A JP2019085404 A JP 2019085404A JP 7285511 B2 JP7285511 B2 JP 7285511B2
Authority
JP
Japan
Prior art keywords
data
vector
database
administrator
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019085404A
Other languages
Japanese (ja)
Other versions
JP2020181469A (en
Inventor
純一 堀口
健一 茂木
尚志 奥村
俊哉 緒方
洋臣 片山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zerobillbank Japan Inc
Original Assignee
Zerobillbank Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zerobillbank Japan Inc filed Critical Zerobillbank Japan Inc
Priority to JP2019085404A priority Critical patent/JP7285511B2/en
Publication of JP2020181469A publication Critical patent/JP2020181469A/en
Application granted granted Critical
Publication of JP7285511B2 publication Critical patent/JP7285511B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データ管理装置、データ管理方法、プロラム、及びデータ管理システムに関する。 The present invention relates to a data management device, data management method, program , and data management system.

近年、顧客情報や商品情報等、種々の種類の情報がリレーショナルデータベース(以下、単に「データベース」と記載する。)で管理されている。これらのデータベースは、本来であれば同一の情報であっても、異なる管理者によってそれぞれ管理される異なるデータベースに個別に登録されることも多い。データベースが異なる場合、同じ情報を格納する場合であっても、各データベースにおけるレコードを構成するフィールドの構成や、各フィールドに格納される値等が異なることが起こりうる。 In recent years, various types of information such as customer information and product information are managed by relational databases (hereinafter simply referred to as "databases"). Even if these databases are originally the same information, they are often individually registered in different databases managed by different administrators. If the databases are different, even if the same information is stored, the configuration of the fields constituting the records in each database, the values stored in each field, and the like may differ.

そのため、異なるデータベースを統合したり、相互に参照し合ったりするための技術が種々提案されている。このような技術の中には、いわゆる「名寄せ」と呼ばれる技術も存在する(例えば、特許文献1を参照)。 Therefore, various techniques have been proposed for integrating different databases and mutually referencing them. Among such techniques, there is a technique called "name identification" (see, for example, Patent Document 1).

特開2012-234343号公報JP 2012-234343 A

名寄せは各データベースに登録されている値の類似度に基づいてデータベースを統合する技術であるため、統合や参照の際にデータベースの値にアクセスする必要がある。このため、名寄せのためにはデータベース全体にアクセスしなければならないが、情報の漏洩の危険性が増すことになる。特に、データベースに個人情報等の機密情報が格納されている場合には、情報の漏洩を抑制することが課題となる。 Name identification is a technology that integrates databases based on the similarity of values registered in each database, so it is necessary to access database values when integrating or referencing. For this reason, the entire database must be accessed for name matching, which increases the risk of information leakage. In particular, when confidential information such as personal information is stored in the database, suppression of information leakage becomes a problem.

本発明はこれらの点に鑑みてなされたものであり、データベースの共有時のセキュリティを向上させるための技術を提供することを目的とする。 The present invention has been made in view of these points, and an object of the present invention is to provide a technique for improving security when databases are shared.

本発明の第1の態様は、データ管理装置である。この装置は、異なる権限設定によってそれぞれ管理される複数のデータベースのテーブルを構成する各レコードを、それぞれベクトルデータに変換するベクトル変換部と、前記ベクトルデータと、前記ベクトルデータを特定するためのデータ識別子と、前記ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、ベクトルデータベースに登録するデータベースアクセス部と、前記ベクトルデータベースに登録された前記管理者識別子をブロックチェーンに登録するブロックチェーンアクセス部と、前記複数のデータベースの管理者のうちのいずれかの管理者である第1管理者から、前記第1管理者が管理するデータベースにおいて更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得する更新データ取得部と、前記ベクトルデータベースに格納されたベクトルデータと、前記更新対象とするレコードのデータ識別子が紐付けられているベクトルデータである更新対象ベクトルデータとの類似度を算出する類似度算出部と、前記類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含むデータベースの管理者である第2管理者に、前記類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、前記更新後のフィールド情報とを通知する更新情報通知部と、を備える。 A first aspect of the present invention is a data management device. This device includes a vector conversion unit that converts each record constituting a table of a plurality of databases managed by different authority settings into vector data, the vector data, and a data identifier for specifying the vector data. and an administrator identifier for identifying an administrator of a database containing records corresponding to the vector data, and registering them in the vector database; and the administrator identifier registered in the vector database. and a record to be updated in the database managed by the first administrator from the first administrator who is one of the administrators of the plurality of databases an update data acquisition unit that acquires the data identifier of the above, the field name to be updated, and the field information after updating; and the vector data stored in the vector database and the data identifier of the record to be updated are linked. a similarity calculation unit that calculates a similarity to the vector data to be updated, which is the vector data that has been updated; and an update information notification unit for notifying the second administrator of a data identifier for specifying the similar vector data, a field name to be updated, and the updated field information.

前記ブロックチェーンアクセス部は、前記ベクトルデータベースにおいて前記管理者それぞれに割り当てられた管理者識別子を、各管理者の前記ベクトルデータベースにおけるアクセス権を示すアクセス権情報と紐づけて前記ブロックチェーンに登録してもよい。 The blockchain access unit associates an administrator identifier assigned to each administrator in the vector database with access right information indicating the access right of each administrator in the vector database, and registers the identifier in the blockchain. good too.

前記ブロックチェーンアクセス部は、前記アクセス権情報を参照して、前記ベクトルデータベースに登録されているベクトルデータのうち前記第1管理者がアクセスすることを許可されたベクトルデータを特定してもよい。 The blockchain access unit may refer to the access right information to specify vector data that the first administrator is permitted to access among the vector data registered in the vector database.

前記ベクトル変換部は、前記第1管理者と前記第2管理者とのそれぞれが管理するデータベースを構成するレコードのうち、少なくとも更新されたレコードをベクトルデータに変換して前記ベクトルデータベースに登録してもよい。 The vector conversion unit converts at least updated records among records constituting databases managed by the first manager and the second manager respectively into vector data and registers them in the vector database. good too.

前記データベースアクセス部は、前記ブロックチェーンアクセス部が前記ブロックチェーンから取得したアクセス権が許可する範囲において前記ベクトルデータベースにアクセスしてもよい。 The database access unit may access the vector database to the extent permitted by the access rights acquired from the blockchain by the blockchain access unit.

本発明の第2の態様は、データ管理方法である。この方法において、プロセッサが、異なる権限設定よってそれぞれ管理される複数のデータベースのテーブルを構成する各レコードを、それぞれベクトルデータに変換するステップと、前記ベクトルデータと、前記ベクトルデータを特定するためのデータ識別子と、前記ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、ベクトルデータベースに登録するステップと、前記ベクトルデータベースに登録された前記管理者識別子をブロックチェーンに登録するステップと、前記複数のデータベースの管理者のうちのいずれかの管理者である第1管理者から、前記第1管理者が管理するデータベースにおいて更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得するステップと、前記ベクトルデータベースに格納されたベクトルデータと、前記更新対象とするレコードのデータ識別子が紐付けられているベクトルデータである更新対象ベクトルデータとの類似度を算出するステップと、前記類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含むデータベースの管理者である第2管理者に、前記類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、前記更新後のフィールド情報とを通知するステップと、を実行する。 A second aspect of the present invention is a data management method. In this method, the processor converts each record constituting tables of a plurality of databases each managed with different authority settings into vector data, and the vector data and data for specifying the vector data. a step of associating an identifier with an administrator identifier for specifying an administrator of a database containing records corresponding to the vector data, and registering the administrator identifier registered in the vector database with the administrator identifier; a step of registering in a blockchain; and a data identifier of a record to be updated in a database managed by said first administrator from a first administrator who is one of administrators of said plurality of databases; a step of acquiring a field name to be updated and field information after update; vector data stored in the vector database and vector data in which a data identifier of the record to be updated is linked; a step of calculating a degree of similarity with vector data to be updated; a step of notifying a data identifier for specifying vector data, a field name to be updated, and the updated field information;

本発明の第3の態様は、プログラムである。このプログラムは、コンピュータに、異なる権限設定によってそれぞれ管理される複数のデータベースのテーブルを構成する各レコードを、それぞれベクトルデータに変換する機能と、前記ベクトルデータと、前記ベクトルデータを特定するためのデータ識別子と、前記ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、ベクトルデータベースに登録する機能と、前記ベクトルデータベースに登録された前記管理者識別子をブロックチェーンに登録する機能と、前記複数のデータベースの管理者のうちのいずれかの管理者である第1管理者から、前記第1管理者が管理するデータベースにおいて更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得する機能と、前記ベクトルデータベースに格納されたベクトルデータと、前記更新対象とするレコードのデータ識別子が紐付けられているベクトルデータである更新対象ベクトルデータとの類似度を算出する機能と、前記類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含むデータベースの管理者である第2管理者に、前記類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、前記更新後のフィールド情報とを通知する機能と、を実現させる。 A third aspect of the present invention is a program. This program provides a computer with a function of converting each record constituting tables of a plurality of databases each managed with different authority settings into vector data, the vector data, and data for specifying the vector data. A function of associating an identifier with an administrator identifier for identifying an administrator of a database containing records corresponding to the vector data and registering the administrator identifier in the vector database; a function of registering in a blockchain; and a data identifier of a record to be updated in a database managed by said first administrator from a first administrator who is one of the administrators of said plurality of databases; , a function of acquiring a field name to be updated and field information after update, and vector data in which the vector data stored in the vector database and the data identifier of the record to be updated are linked. A second administrator, who is an administrator of a database including a function of calculating a similarity to update target vector data and a record corresponding to similar vector data, which is vector data whose similarity satisfies a predetermined condition, is provided with the similarity It realizes a function of notifying a data identifier for specifying vector data, a field name to be updated, and the field information after the update.

このプログラムを提供するため、あるいはプログラムの一部をアップデートするために、このプログラムを記録したコンピュータ読み取り可能な記録媒体が提供されてもよく、また、このプログラムが通信回線で伝送されてもよい。 In order to provide this program or update part of the program, a computer-readable recording medium recording this program may be provided, or this program may be transmitted via a communication line.

本発明の第4の態様は、データ管理システムである。このシステムは、上述のデータ管理装置と、前記ベクトルデータベースと、を備える。 A fourth aspect of the present invention is a data management system. This system includes the data management device described above and the vector database.

なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。 Any combination of the above-described components, and expressions of the present invention converted into methods, devices, systems, computer programs, data structures, recording media, etc. are also effective as aspects of the present invention.

本発明によれば、データベースの共有時のセキュリティを向上させることができる。 According to the present invention, it is possible to improve security when a database is shared.

実施の形態に係るデータ管理装置の概要を説明するための図である。1 is a diagram for explaining an overview of a data management device according to an embodiment; FIG. 実施の形態に係るデータ管理装置の機能構成を模式的に示す図である。1 is a diagram schematically showing the functional configuration of a data management device according to an embodiment; FIG. 実施の形態に係るデータベースのデータ構造の一例を模式的に示す図である。FIG. 4 is a diagram schematically showing an example of the data structure of a database according to the embodiment; FIG. 実施の形態に係るベクトルデータベースのデータ構造を模式的に示す図である。4 is a diagram schematically showing the data structure of a vector database according to the embodiment; FIG. 実施の形態に係るブロックチェーンの構成を模式的に示す図である。It is a figure which shows typically the structure of the block chain which concerns on embodiment. 実施の形態に係るデータ管理装置が実行するデータ管理処理の流れを説明するためのフローチャートである。4 is a flowchart for explaining the flow of data management processing executed by the data management device according to the embodiment;

<実施の形態の概要>
図1は、実施の形態に係るデータ管理装置1の概要を説明するための図である。図1では、第1管理者M1が管理する第1データベースD1と、第2管理者M2が管理する第2データベースD2とが、それぞれ通信ネットワークN1を介してデータ管理装置1と通信可能な態様で接続している。第1データベースD1と第2データベースD2とは、それぞれ管理する管理者Mが異なるため、第1データベースD1と第2データベースD2とはそれぞれ異なる権限設定によって管理されるデータベースといえる。データ管理装置1は通信ネットワークN1を介してブロックチェーンBと通信可能な態様で接続し、かつ安全性が担保された専用回線であるセキュアネットワークN2を介してベクトルデータベースVと通信可能な態様で接続している。なお、データ管理装置1とベクトルデータベースVとで、データ管理システムSを構成する。
<Overview of Embodiment>
FIG. 1 is a diagram for explaining an outline of a data management device 1 according to an embodiment. In FIG. 1, the first database D1 managed by the first manager M1 and the second database D2 managed by the second manager M2 are configured to communicate with the data management device 1 via the communication network N1. Connected. Since the first database D1 and the second database D2 are managed by different administrators M, the first database D1 and the second database D2 can be said to be databases managed by different authority settings. The data management device 1 is communicably connected to the block chain B via the communication network N1, and is communicatively connected to the vector database V via the secure network N2, which is a dedicated line in which security is ensured. are doing. A data management system S is composed of the data management device 1 and the vector database V. FIG.

ここで、ブロックチェーンBは分散型のデータベースとして機能し、ブロックチェーンBに参加しているコンピュータであれば自由に内容を閲覧することができる。一方、ベクトルデータベースVは閲覧のための権限が厳格に管理されており、専用回線であるセキュアネットワークN2を介してデータ管理装置1のみがアクセスできる。以下、第1管理者M1と第2管理者M2とを区別しない場合は単に管理者Mと記載する。同様に、第1管理者M1と第2管理者M2とを区別しない場合は単にデータベースDと記載する。 Here, Blockchain B functions as a distributed database, and any computer participating in Blockchain B can freely browse the contents. On the other hand, the vector database V is subject to strict management of authority for viewing, and can be accessed only by the data management device 1 via the secure network N2, which is a dedicated line. Hereinafter, when the first manager M1 and the second manager M2 are not distinguished from each other, they are simply referred to as the manager M. Similarly, when the first manager M1 and the second manager M2 are not distinguished from each other, they are simply referred to as database D.

以下、図1を参照して、実施の形態に係るデータ管理装置1で行われる処理の手順を(1)から(8)で説明するが、その説明は図1中の(1)から(8)と対応する。 Hereinafter, the procedure of the processing performed by the data management device 1 according to the embodiment will be described by (1) to (8) with reference to FIG. ).

(1)データ管理装置1は、第1データベースD1のテーブルを構成する各レコードを取得する。
(2)記憶部2は、第2データベースD2のテーブルを構成する各レコードを取得する。
(1) The data management device 1 acquires each record that constitutes the table of the first database D1.
(2) The storage unit 2 acquires each record that constitutes the table of the second database D2.

(3)データ管理装置1は、取得した各レコードをそれぞれベクトルデータに変換する。このベクトルデータは、レコードを構成する各フィールドに格納された値を反映して生成されるものである。すなわち、異なる2つのレコードを構成する各フィールドに格納された値が類似するほど、変換後の各ベクトルデータも類似する。一方、ベクトルデータから元のフィールドに格納されている情報を復元することは困難である。データ管理装置1は、ベクトルデータに変換した後はレコードを削除しレコード自体は保持しない。なお、ベクトルデータの変換手法については後述する。 (3) The data management device 1 converts each acquired record into vector data. This vector data is generated by reflecting the values stored in the fields that make up the record. That is, the more similar the values stored in the fields that form two different records, the more similar each vector data after conversion. On the other hand, it is difficult to restore the information stored in the original field from vector data. The data management device 1 deletes the record after converting it into vector data and does not hold the record itself. A vector data conversion method will be described later.

(4)データ管理装置1は、レコードを変換して取得したベクトルデータを、そのベクトルデータを識別するためのデータ識別子と、レコードを含むデータベースの管理者を識別するための管理者識別子とに紐づけてベクトルデータベースVに登録する。これにより、ベクトルデータベースVには、D1が格納する情報と第2データベースD2が格納する情報とがベクトルデータの形で格納されることになる。データ管理装置1は、ベクトルデータベースVに格納されているベクトルデータ同士の類似度を算出することにより、それらの元となるレコードを構成する各フィールドに格納された値の類似度を推定することができる。 (4) The data management device 1 associates the vector data obtained by converting the record with a data identifier for identifying the vector data and an administrator identifier for identifying the administrator of the database containing the record. and register it in the vector database V. As a result, the information stored in D1 and the information stored in the second database D2 are stored in the vector database V in the form of vector data. By calculating the degree of similarity between the vector data stored in the vector database V, the data management device 1 can estimate the degree of similarity between the values stored in the fields that form the records that are the basis of the data. can.

(5)データ管理装置1は、通信ネットワークN1を介して、ベクトルデータベースVに関して各管理者が有するアクセス権を示すアクセス権情報を管理者識別子と紐づけてブロックチェーンBに登録する。アクセス権情報は、管理者M毎にベクトルデータのアクセス許可範囲を定めた情報である。例えば、管理者Mは、自身が管理するデータベースDに関するベクトルデータであれば自由にアクセスできる。一方、他の管理者Mが管理するデータベースDに関するベクトルデータは、管理者Mは他の管理者Mからの了承が得られた範囲以外のデータにはアクセスすることができない。 (5) The data management device 1 associates the access right information indicating the access right of each administrator with respect to the vector database V with the administrator identifier and registers it in the block chain B via the communication network N1. The access right information is information that defines the permitted range of access to vector data for each administrator M. FIG. For example, manager M can freely access vector data related to database D managed by him/herself. On the other hand, the manager M cannot access the vector data related to the database D managed by the other manager M outside the range approved by the other manager M.

(6)データ管理装置1は、第1管理者M1から第1データベースD1において更新対象とするレコードを特定するためのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得する。
(7)データ管理装置1は、更新対象とするレコードをベクトルデータに変換し、ベクトルデータベースVに格納されている各ベクトルデータのうち、第1管理者M1がアクセスすることを許可されたベクトルデータとの類似度を算出する。
(6) The data management device 1 acquires a data identifier for specifying a record to be updated in the first database D1, a field name to be updated, and field information after update from the first manager M1. .
(7) The data management device 1 converts the record to be updated into vector data, and among the vector data stored in the vector database V, the vector data permitted to be accessed by the first manager M1. Calculate the similarity with

(8)データ管理装置1は、類似度が所定の条件を満たすベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを第2管理者M2がアクセス可能な端末に通知する。以下、本明細書において、管理者Mがアクセス可能な管理者端末(不図示)に何らかの情報を通知することを、管理者端末の存在を前提として、単に「管理者Mに通知する」等の表現を用いて記載する。 (8) The data management device 1 allows the second manager M2 to access a data identifier for identifying vector data whose degree of similarity satisfies a predetermined condition, a field name to be updated, and field information after update. terminal. Hereinafter, in the present specification, it is assumed that an administrator terminal (not shown) to which the administrator M can access some information is premised on the existence of the administrator terminal, and simply "notify the administrator M" or the like is used. Describe using expressions.

ここで「所定の条件」とは、第1データベースD1のレコードと第2データベースD2のレコードとが同一の情報を格納するレコードであるとみなすためにあらかじめ定められた類似度が満たすための条件である。所定の条件の具体例は、類似度に関して定められた同一判定用閾値を超えることである。この場合、データ管理装置1は、2つの異なるベクトルデータの類似度が同一判定用閾値を超える場合、それらのベクトルデータにそれぞれ対応するレコードは同一の情報を格納するレコードであるとみなす。 Here, the "predetermined condition" is a condition for satisfying a predetermined degree of similarity in order to consider that the record of the first database D1 and the record of the second database D2 are records storing the same information. be. A specific example of the predetermined condition is exceeding a threshold value for identity determination defined for similarity. In this case, when the degree of similarity between two different vector data exceeds the same determination threshold, the data management device 1 regards the records corresponding to the vector data as records storing the same information.

これにより、第2管理者M2は、第1データベースD1のレコードが第1管理者M1によって変更されたとき、そのレコードに対応するとみなされる第2データベースD2のレコードの内容を修正することができる。すなわち、第1管理者M1と第2管理者M2とは、第1データベースD1のレコードの内容と第2データベースD2のレコードの内容とを共有することができる。 Thereby, when the record of the first database D1 is changed by the first manager M1, the second manager M2 can correct the contents of the record of the second database D2 which is considered to correspond to the record. That is, the first manager M1 and the second manager M2 can share the contents of the records of the first database D1 and the contents of the records of the second database D2.

データ管理装置1は、データベースDを構成するレコードから変換したベクトルデータをベクトルデータベースVに格納して保持するため、インターネット等の公共の通信回線を介してアクセス可能なデータベースに格納する場合と比較して、ベクトルデータの流出の危険性を低減することができる。また、万が一ベクトルデータが第三者に流出したとしても、第三者は、ベクトルデータから元のレコードを復元することは困難である。 Since the data management device 1 stores vector data converted from the records constituting the database D in the vector database V, the data management device 1 stores the vector data in a database accessible via a public communication line such as the Internet. Therefore, the risk of leakage of vector data can be reduced. Also, even if the vector data leaks to a third party, it would be difficult for the third party to restore the original record from the vector data.

このように、実施の形態に係るデータ管理装置1は、データベースDの共有時のセキュリティを向上させることができる。さらに、各管理者Mが管理するデータベースDにおけるデータ識別子を、その管理者Mとは異なる他の管理者Mが管理するデータベースDにおけるデータ識別子と統合することなく、情報を連携することができる。これにより、実施の形態に係るデータ管理装置1は、データベースDの管理の際の生産性を向上させることができる。 Thus, the data management device 1 according to the embodiment can improve security when the database D is shared. Furthermore, information can be linked without integrating the data identifier in the database D managed by each manager M with the data identifier in the database D managed by another manager M different from the manager M. As a result, the data management device 1 according to the embodiment can improve productivity when managing the database D. FIG.

なお、図1は、第1データベースD1と第2データベースD2との2つのデータベースDがある場合を示しているが、データベースDの数は2に限られず、3以上であってもよい。 Although FIG. 1 shows a case where there are two databases D, that is, a first database D1 and a second database D2, the number of databases D is not limited to two, and may be three or more.

<実施の形態に係るデータ管理装置1の機能構成>
図2は、実施の形態に係るデータ管理装置1の機能構成を模式的に示す図である。データ管理装置1は、記憶部2と制御部3とを備える。図2において、矢印は主なデータの流れを示しており、図2に示していないデータの流れがあってもよい。図2において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図2に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
<Functional Configuration of Data Management Device 1 According to Embodiment>
FIG. 2 is a diagram schematically showing the functional configuration of the data management device 1 according to the embodiment. A data management device 1 includes a storage unit 2 and a control unit 3 . In FIG. 2, arrows indicate main data flows, and data flows not shown in FIG. 2 may exist. In FIG. 2, each functional block does not show the configuration in units of hardware (apparatus), but the configuration in units of functions. Therefore, the functional blocks shown in FIG. 2 may be implemented within a single device, or may be implemented separately within a plurality of devices. Data exchange between functional blocks may be performed via any means such as a data bus, network, or portable storage medium.

記憶部2は、データ管理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)やデータ管理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。 The storage unit 2 includes a ROM (Read Only Memory) that stores the BIOS (Basic Input Output System) of the computer that implements the data management device 1, a RAM (Random Access Memory) that serves as a work area for the data management device 1, an OS ( (Operating System), application programs, and a large-capacity storage device such as an HDD (Hard Disk Drive) or an SSD (Solid State Drive) that stores various information referred to when the application program is executed.

制御部3は、データ管理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部2に記憶されたプログラムを実行することによってベクトル変換部30、データベースアクセス部31、ブロックチェーンアクセス部32、更新データ取得部33、類似度算出部34、及び更新情報通知部35として機能する。 The control unit 3 is a processor such as a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit) of the data management device 1, and executes a program stored in the storage unit 2 to perform a vector conversion unit 30, a database access unit 31 , a blockchain access unit 32 , an update data acquisition unit 33 , a similarity calculation unit 34 , and an update information notification unit 35 .

なお、図2は、データ管理装置1が単一の装置で構成されている場合の例を示している。しかしながら、データ管理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部3を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。 Note that FIG. 2 shows an example in which the data management device 1 is composed of a single device. However, the data management device 1 may be realized by calculation resources such as a plurality of processors and memories, such as a cloud computing system. In this case, each unit that configures the control unit 3 is implemented by executing a program by at least one of a plurality of different processors.

ベクトル変換部30は、異なる管理者によってそれぞれ管理される複数のデータベースのテーブルを構成する各レコードを取得する。制御部3は、取得した各レコードを、それぞれベクトルデータに変換する。 The vector conversion unit 30 acquires each record that constitutes tables of a plurality of databases managed by different administrators. The control unit 3 converts each acquired record into vector data.

図3は、実施の形態に係るデータベースDのデータ構造の一例を模式的に示す図である。具体的には、図3は、会員情報を登録するための会員情報データベースのデータ構造を示す図である。以下、図3を参照しながら、ベクトル変換部30が実行するレコードのベクトルデータ変換手法を説明する。 FIG. 3 is a diagram schematically showing an example of the data structure of database D according to the embodiment. Specifically, FIG. 3 is a diagram showing the data structure of a member information database for registering member information. A record vector data conversion method executed by the vector conversion unit 30 will be described below with reference to FIG.

データベースDは、複数のレコードが集まって構成される。ここで、レコードはデータベースDに格納される情報の単位である。データベースDが会員情報データベースある場合、各レコードに会員一人分の情報が格納される。図3に示すように、各レコードは複数のフィールドから構成される。図3に示す例では、各レコードは「データ識別子」、「姓(漢字)」、「名(漢字)」、「姓(ひらがな)」、「名(ひらがな)」、「性別」、「年齢」、「住所」等を格納するためのフィールドを含んでいる。 The database D is configured by collecting a plurality of records. Here, a record is a unit of information stored in the database D. FIG. When the database D is a member information database, information for one member is stored in each record. As shown in FIG. 3, each record consists of multiple fields. In the example shown in FIG. 3, each record has "data identifier", "last name (kanji)", "first name (kanji)", "last name (hiragana)", "first name (hiragana)", "gender", and "age". , "Address", etc.

会員情報を登録するための会員情報データベースであっても、データベースを管理する管理者Mが異なれば、その構造が異なる場合がある。例えば、図3に示す例では会員の姓名の読み方を「ひらがな」を用いて登録しているが、別のデータベースでは「カタカナ」や「ローマ字」を用いて登録する場合がある。また、図3に示す例では会員の性別を漢字を用いて登録しているが、別のデータベースでは男性を「M」、女性を「F」のように記号で表す場合もある。さらに、各会員に会員識別子を割り当てて管理する場合、一般に、識別子を割り当てる者が異なれば識別子も異なると考えられる。 Even a member information database for registering member information may have a different structure if the manager M who manages the database is different. For example, in the example shown in FIG. 3, the names of members are registered using "hiragana", but in other databases, "katakana" or "romaji" may be used for registration. Also, in the example shown in FIG. 3, the member's gender is registered using kanji, but in other databases, there are cases where males are represented by symbols such as "M" and females are represented by symbols such as "F". Furthermore, when a member identifier is assigned to each member and managed, it is generally considered that the identifier will be different if the person assigning the identifier is different.

実施の形態に係るベクトル変換部30は、データベースDを構成するレコードを単位として、各レコードをベクトルデータに変換する。具体的には、ベクトル変換部30は、取得したレコードに含まれる各フィールドの値を並べて1つの文字列を生成する。図3に示す例において、データ識別子がDID00001であるレコードをベクトルデータに変換する場合、ベクトル変換部30は、データ識別子を除いて、「山田太郎やまだたろう男32東京都・・・」という文字列を生成する。 The vector conversion unit 30 according to the embodiment converts each record into vector data in units of records constituting the database D. FIG. Specifically, the vector conversion unit 30 arranges the values of each field included in the obtained record to generate one character string. In the example shown in FIG. 3, when converting a record whose data identifier is DID00001 into vector data, the vector conversion unit 30 removes the data identifier and converts the character string "Taro Yamada Yamada Taro Otoko 32 Tokyo..." to generate

続いて、ベクトル変換部30は、生成した文字列をWord2Vecとして知られる既知の手法を用いてベクトルデータに変換する。既知の技術のため詳細な説明は省略するが、Word2Vecはいくつかの手法があり、いずれもニューラルネットワークによって実現されている。多数の文字列(本実施の形態ではレコードに含まれる各フィールドの値を並べて生成された文字列)を学習データとしてWord2Vecを用いて学習することにより、文字列を入力するとその文字列に対応するベクトルデータを出力する学習モデルが生成できる。ベクトル変換部30は、あらかじめ生成した学習モデルを用いることで、各レコードをベクトルデータに変換する。限定はしないが、一例として、ベクトル変換部30は、各レコードを256ビットのビット列のベクトルデータに変換する。 Subsequently, the vector conversion unit 30 converts the generated character string into vector data using a known method known as Word2Vec. Word2Vec has several methods, all of which are realized by neural networks, although detailed description is omitted because it is a known technology. Many character strings (in this embodiment, character strings generated by arranging the values of each field included in a record) are learned using Word2Vec as learning data. A learning model that outputs vector data can be generated. The vector conversion unit 30 converts each record into vector data by using a learning model generated in advance. As an example, although not limited, the vector conversion unit 30 converts each record into 256-bit bit string vector data.

データベースアクセス部31は、ベクトル変換部30が変換したベクトルデータと、ベクトルデータを特定するためのデータ識別子と、ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、ベクトルデータベースに登録する。なお、ベクトルデータを特定するためのデータ識別子は、そのベクトルデータの元となったレコードを特定するためのデータ識別子と同じであってもよい。 The database access unit 31 receives the vector data converted by the vector conversion unit 30, a data identifier for identifying the vector data, and an administrator identifier for identifying the administrator of the database containing the record corresponding to the vector data. Link it and register it in the vector database. Note that the data identifier for specifying vector data may be the same as the data identifier for specifying the record that is the source of the vector data.

図4は、実施の形態に係るベクトルデータベースVのデータ構造を模式的に示す図である。図4に示すように、ベクトルデータベースVは、管理者識別子毎に、その管理者識別子で特定される管理者Mが管理するデータベースDに由来するベクトルデータをデータ識別子と紐づけて格納している。図4は、管理者識別子がMID00001である管理者Mが管理するデータベースDのレコードから生成されたベクトルデータを示している。図4に示すように、各ベクトルデータにはデータ識別子が割り当てられている。例えば、データ識別子がDID00001であるベクトルデータは、「11001101010010・・・」である。 FIG. 4 is a diagram schematically showing the data structure of the vector database V according to the embodiment. As shown in FIG. 4, the vector database V stores, for each administrator identifier, vector data derived from the database D managed by the administrator M identified by the administrator identifier in association with the data identifier. . FIG. 4 shows vector data generated from records in the database D managed by the administrator M whose administrator identifier is MID00001. As shown in FIG. 4, each vector data is assigned a data identifier. For example, vector data whose data identifier is DID00001 is "11001101010010...".

ブロックチェーンアクセス部32は、ベクトルデータベースVに登録された管理者識別子をブロックチェーンBに登録する。 The blockchain access unit 32 registers the administrator identifier registered in the vector database V in the blockchain B. FIG.

図5は、実施の形態に係るブロックチェーンBの構成を模式的に示す図である。図5に示すように、ブロックチェーンBは、複数のブロックを連結した情報である。複数のブロックのそれぞれは、直前のブロックを示す情報のハッシュ値、管理者識別子、アクセス権情報、及びナンス値が含まれている。ナンス値は、ブロックのハッシュ値が特定の条件を満たされるようにするために用いられる情報である。なお、上述したように、アクセス権情報は、管理者M毎にベクトルデータのアクセス許可範囲を定めた情報である。したがって、アクセス権情報にはアクセスが許可されるデータ識別子の情報が含まれる。 FIG. 5 is a diagram schematically showing the configuration of Blockchain B according to the embodiment. As shown in FIG. 5, Blockchain B is information in which a plurality of blocks are linked. Each of the multiple blocks includes a hash value of information indicating the immediately preceding block, an administrator identifier, access right information, and a nonce value. A nonce value is information used to ensure that the hash value of a block meets certain conditions. It should be noted that, as described above, the access right information is information that defines the permitted range of access to vector data for each administrator M. FIG. Therefore, the access right information includes information on data identifiers to which access is permitted.

図5に示すように、ブロックチェーンアクセス部32は、管理者識別子のみをブロックチェーンBに登録し、ベクトルデータ自体は登録しない。ブロックチェーンBは公開されたデータベースであるからである。これにより、データ管理装置1は、ブロックチェーンBからベクトルデータが流出することを防止できる。 As shown in FIG. 5, the blockchain access unit 32 registers only the administrator identifier in the blockchain B and does not register the vector data itself. This is because Blockchain B is a public database. As a result, the data management device 1 can prevent vector data from leaking from the block chain B. FIG.

更新データ取得部33は、複数のデータベースの管理者Mのうちのいずれかの管理者Mである第1管理者M1から、第1管理者M1が管理する第1データベースD1において更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得する。 The update data acquisition unit 33 obtains records to be updated in the first database D1 managed by the first manager M1 from the first manager M1 who is one of the managers M of the plurality of databases. , the field name to be updated, and the updated field information.

類似度算出部34は、更新データ取得部33が取得したデータ識別子に基づいて、ベクトルデータベースVからそのデータ識別子が紐付けられているベクトルデータを更新対象ベクトルデータとして読み出す。類似度算出部34は、更新対象ベクトルデータと、ベクトルデータベースVに格納された他のベクトルデータとの類似度を算出する。類似度算出部34は、例えば、コサイン類似度やユークリッド距離、gensim等のライブラリ等、既知の手法を用いてベクトルデータ間の類似度を算出する。 Based on the data identifier acquired by the update data acquisition unit 33, the similarity calculation unit 34 reads the vector data associated with the data identifier from the vector database V as update target vector data. The similarity calculator 34 calculates the similarity between the vector data to be updated and other vector data stored in the vector database V. FIG. The similarity calculation unit 34 calculates the similarity between vector data using known techniques such as cosine similarity, Euclidean distance, and libraries such as gensim.

更新情報通知部35は、類似度算出部34が算出した類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含む第2データベースD2の管理者Mである第2管理者M2に、類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを通知する。以下、更新情報通知部35が第2管理者M2に通知する類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とをまとめて、「更新に関する情報」と記載することがある。 The update information notification unit 35 is the second administrator M of the second database D2 that includes records corresponding to similar vector data, which is vector data whose similarity calculated by the similarity calculation unit 34 satisfies a predetermined condition. M2 is notified of the data identifier for specifying similar vector data, the field name to be updated, and the updated field information. Hereinafter, the data identifier for specifying the similar vector data notified to the second manager M2 by the update information notification unit 35, the field name to be updated, and the field information after update will be collectively referred to as "update information". is sometimes described.

第2管理者M2は、更新情報通知部35から通知されたデータ識別子に基づいて、第2データベースD2において更新の対象となるレコードを特定することができる。また、第2管理者M2は、更新情報通知部35から通知された更新対象のフィールド名に基づいて、更新対象のフィールドを推定することができる。このため、第2管理者M2は、更新対象のフィールドの情報を更新情報通知部35から通知されたフィールドの情報に書き換えることができる。 The second administrator M2 can specify the record to be updated in the second database D2 based on the data identifier notified from the update information notifier 35. FIG. Further, the second administrator M2 can estimate the field to be updated based on the field name to be updated notified from the update information notification unit 35 . Therefore, the second administrator M2 can rewrite the information of the field to be updated with the information of the field notified by the update information notification unit 35 .

図5に示すように、ブロックチェーンアクセス部32は、ベクトルデータベースVにおいて管理者それぞれに割り当てられた管理者識別子を、各管理者のベクトルデータベースにおけるアクセス権を示すアクセス権情報と紐づけてブロックチェーンBに登録する。管理者Mは、ブロックチェーンBに登録されているアクセス権情報によって許可される範囲においてのみ、ベクトルデータベースVに格納されているベクトルデータへのアクセスが許可される。言い換えると、ある管理者Mは、他の管理者Mに許可された場合に限り、他の管理者Mが管理するデータベースDに由来するベクトルデータにアクセスすることができる。 As shown in FIG. 5, the blockchain access unit 32 associates the administrator identifier assigned to each administrator in the vector database V with the access right information indicating the access right of each administrator in the vector database to access the blockchain. Register for B. The manager M is permitted to access the vector data stored in the vector database V only within the scope permitted by the access right information registered in the block chain B. In other words, an administrator M can access vector data derived from databases D managed by other administrators M only when permitted by the other administrator M.

ブロックチェーンアクセス部32は、アクセス権情報を参照して、ベクトルデータベースVに登録されているベクトルデータのうち、更新対象とするレコードを含む第2データベースD2の管理者である第1管理者M1がアクセスすることを許可されたベクトルデータを特定する。データベースアクセス部31は、ブロックチェーンアクセス部32がブロックチェーンBから取得したアクセス権が許可する範囲においてベクトルデータベースVに格納されているベクトルデータにアクセスする。このように、アクセス権情報を用いて各管理者Mに関するベクトルデータベースVのアクセス権を管理することにより、データ管理装置1は、ベクトルデータが外部に流出することを抑制できる。 The blockchain access unit 32 refers to the access right information, and the first manager M1 who is the manager of the second database D2 including the record to be updated among the vector data registered in the vector database V Identify the vector data you are authorized to access. The database access unit 31 accesses the vector data stored in the vector database V within the range permitted by the access rights that the blockchain access unit 32 acquires from the block chain B. FIG. In this way, by managing access rights to the vector database V for each manager M using access right information, the data management device 1 can prevent vector data from leaking to the outside.

更新情報通知部35が第2管理者M2に更新に関する情報を通知した後、ベクトル変換部30は、第1管理者M1が管理する第1データベースD1と第2管理者M2が管理する第2データベースD2を構成するレコードのうち、少なくとも更新されたレコードをベクトルデータに変換する。ベクトル変換部30は、変換したベクトルデータをベクトルデータベースVに再度登録する。これにより、データ管理装置1は、ベクトルデータベースVに格納されている情報を最新の情報に保つことができる。 After the update information notification unit 35 notifies the second manager M2 of the information about the update, the vector conversion unit 30 updates the first database D1 managed by the first manager M1 and the second database managed by the second manager M2. At least the updated records among the records constituting D2 are converted into vector data. The vector conversion unit 30 registers the converted vector data in the vector database V again. Thereby, the data management device 1 can keep the information stored in the vector database V up-to-date.

<データ管理装置1が実行するデータ管理方法の処理フロー>
図6は、実施の形態に係るデータ管理装置1が実行するデータ管理処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えばデータ管理装置1が起動したときに開始する。
<Processing Flow of Data Management Method Executed by Data Management Apparatus 1>
FIG. 6 is a flowchart for explaining the flow of data management processing executed by the data management device 1 according to the embodiment. The processing in this flowchart starts, for example, when the data management device 1 is activated.

ベクトル変換部30は、異なる管理者Mによってそれぞれ管理される複数のデータベースDのテーブルを構成する各レコードを取得する(S2)。ベクトル変換部30は、取得した各レコードを、それぞれベクトルデータに変換する(S4)。 The vector conversion unit 30 acquires each record that constitutes tables of a plurality of databases D managed by different administrators M (S2). The vector conversion unit 30 converts each acquired record into vector data (S4).

データベースアクセス部31は、ベクトル変換部30が変換したベクトルデータと、ベクトルデータを特定するためのデータ識別子と、ベクトルデータに対応するレコードを含むデータベースDの管理者Mを特定するための管理者識別子とを紐づけて、ベクトルデータベースVに登録する(S6)。 The database access unit 31 stores the vector data converted by the vector conversion unit 30, a data identifier for identifying the vector data, and an administrator identifier for identifying an administrator M of the database D containing records corresponding to the vector data. are linked and registered in the vector database V (S6).

更新データ取得部33は、複数のデータベースDの管理者Mのうちのいずれかの管理者Mである第1管理者から、フィールドの更新に関する情報を取得する(S8)。類似度算出部34は、ベクトルデータベースVに格納されたベクトルデータと、更新対象ベクトルデータとの類似度を算出する(S10)。 The update data acquisition unit 33 acquires information on field updates from the first administrator M who is one of the administrators M of the plurality of databases D (S8). The similarity calculator 34 calculates the similarity between the vector data stored in the vector database V and the vector data to be updated (S10).

更新情報通知部35は、類似度算出部34が算出した類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含む第2データベースD2の管理者Mである第2管理者M2に、フィールドの更新に関する情報を通知する(S12)。更新情報通知部35が第2管理者M2に更新に関する情報を通知すると、本フローチャートにおける処理は終了する。 The update information notification unit 35 is the second administrator M of the second database D2 that includes records corresponding to similar vector data, which is vector data whose similarity calculated by the similarity calculation unit 34 satisfies a predetermined condition. M2 is notified of the information regarding the update of the field (S12). When the update information notification unit 35 notifies the second manager M2 of the information regarding the update, the processing in this flowchart ends.

<実施の形態に係るデータ管理装置1が奏する効果>
以上説明したように、実施の形態に係るデータ管理装置1によれば、データベースの共有時のセキュリティを向上させることができる。
<Effects of the data management device 1 according to the embodiment>
As described above, according to the data management device 1 according to the embodiment, it is possible to improve security when sharing a database.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果をあわせ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes are possible within the scope of the gist thereof. be. For example, all or part of the device can be functionally or physically distributed and integrated in arbitrary units. In addition, new embodiments resulting from arbitrary combinations of multiple embodiments are also included in the embodiments of the present invention. The effect of the new embodiment caused by the combination has the effect of the original embodiment.

<変形例>
上記では、データベースDが会員データベースである場合について主に説明した。しかしながら、データベースDは会員データベースに限られず、例えば、商品管理やサービス管理用データベース、デジタルコンテンツ管理用データベース、在庫管理用データベース、販売管理や購買履歴管理用データベース、調達管理用データベース、生産管理用データベース、物流管理や配送管理用データベース、物件情報や家財情報を格納するためのデータベース、保険や証券等を始めとした契約を管理するためのデータベース、個人の行動履歴(例えば、心電等の生体情報や、歩数等の活動情報)やIoT(Internet Of Things)機器の挙動データ等を格納するためのデータベースであってもよい。個人の行動履歴は、例えば生体センサを搭載したウェアラブル機器を各ユーザが常時身につけることによって得ることができる。
<Modification>
In the above description, the case where the database D is the member database has been mainly described. However, the database D is not limited to the member database. , database for logistics management and delivery management, database for storing property information and household goods information, database for managing contracts such as insurance and securities, personal behavior history (e.g., biometric information such as electrocardiogram) , activity information such as the number of steps taken), behavior data of IoT (Internet Of Things) devices, and the like. A personal action history can be obtained by, for example, each user always wearing a wearable device equipped with a biosensor.

ここで、個人の生体情報はその個人を他者から識別するための特徴を表すデータといえる。例えば、ある人の心拍のパターンは、他者の心拍のパターンとは異なるものとなる。このため、データベースDが個人の行動履歴を格納するデータベースである場合、ベクトル変換部30がデータベースDの各レコードをベクトルデータに変換すると、得られたベクトルデータは個人毎に異なる特徴を反映したデータとなると考えられる。 Here, the biometric information of an individual can be said to be data representing characteristics for distinguishing the individual from others. For example, one person's heartbeat pattern will be different than another person's heartbeat pattern. Therefore, if the database D is a database that stores the behavior history of an individual, when the vector conversion unit 30 converts each record of the database D into vector data, the obtained vector data is data that reflects characteristics that differ for each individual. It is considered that

例えば、ある個人の姓名や性別等を変更することなく他人にウェアラブル機器を着用させて生体情報を取得した場合は、ある個人がウェアラブル機器を継続して身につけている場合と比較して、現在のベクトルデータと過去のベクトルデータとの類似度は非類似を示すことになる。このように、類似度算出部34は、ある個人について現在のベクトルデータと過去のベクトルデータとの類似度を算出することにより、ある個人がウェアラブル機器を継続して身につけているか否かを推定することができる。 For example, if biometric information is obtained by having someone wear a wearable device without changing the person's name, gender, etc., the current The degree of similarity between the current vector data and past vector data indicates dissimilarity. In this way, the similarity calculation unit 34 calculates the similarity between the current vector data and the past vector data for a given individual, thereby estimating whether the wearable device is continuously worn by the given individual. can do.

なお、データベースDが個人の行動履歴を格納している場合においては、第2管理者M2は、第1管理者M1が管理する第1データベースD1に登録されているある個人の行動履歴が、第2管理者M2が管理している第2データベースD2ではどのような行動履歴として登録されているかを分析することも考えられる。このような場合、第2管理者M2は、更新情報通知部35から通知されたデータ識別子に基づいて、第2データベースD2において更新の対象となるレコード及び更新対象のフィールドを推定することにとどめ、更新対象のフィールドの情報を更新情報通知部35から通知されたフィールドの情報に書き換えない。 In addition, when the database D stores an individual's action history, the second manager M2 may store a certain individual's action history registered in the first database D1 managed by the first manager M1 as the first manager. 2 It is also conceivable to analyze what kind of action history is registered in the second database D2 managed by the manager M2. In such a case, the second administrator M2 only estimates the record to be updated and the field to be updated in the second database D2 based on the data identifier notified from the update information notification unit 35. The information of the field to be updated is not rewritten to the information of the field notified by the update information notification unit 35 .

1・・・データ管理装置
2・・・記憶部
3・・・制御部
30・・・ベクトル変換部
31・・・データベースアクセス部
32・・・ブロックチェーンアクセス部
33・・・更新データ取得部
34・・・類似度算出部
35・・・更新情報通知部
B・・・ブロックチェーン
D・・・データベース
D1・・・第1データベース
D2・・・第2データベース
N1・・・通信ネットワーク
N2・・・セキュアネットワーク
V・・・ベクトルデータベース


Reference Signs List 1 Data management device 2 Storage unit 3 Control unit 30 Vector conversion unit 31 Database access unit 32 Block chain access unit 33 Update data acquisition unit 34 ... similarity calculation unit 35 ... update information notification unit B ... block chain D ... database D1 ... first database D2 ... second database N1 ... communication network N2 ... Secure Network V: Vector database


Claims (7)

データ管理装置であって、
前記データ管理装置と通信可能な態様で接続され、異なる管理者によってそれぞれ管理される複数のデータベースのテーブルを構成する各レコードを、それぞれベクトルデータに変換するベクトル変換部と、
前記ベクトルデータと、前記ベクトルデータを特定するためのデータ識別子と、前記ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、前記データ管理装置と専用回線を介して通信可能な態様で接続されたベクトルデータベースに登録するデータベースアクセス部と、
前記ベクトルデータベースにおいて前記管理者それぞれに割り当てられた管理者識別子を、各管理者の前記ベクトルデータベースにおけるアクセス権を示すアクセス権情報と紐づけてブロックチェーンに登録するブロックチェーンアクセス部と、
前記複数のデータベースの管理者のうちのいずれかの管理者である第1管理者から、前記複数のデータベースのうち前記第1管理者が管理するデータベースにおいて前記第1管理者が更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得する更新データ取得部と、
前記ベクトルデータベースに格納されたベクトルデータと、前記更新対象とするレコードのデータ識別子が紐付けられているベクトルデータである更新対象ベクトルデータとの類似度を算出する類似度算出部と、
前記類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含むデータベースの管理者である第2管理者に、前記類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、前記更新後のフィールド情報とを通知する更新情報通知部と、
を備えるデータ管理装置。
A data management device,
a vector conversion unit that is connected to the data management device in a communicable manner and converts each record constituting a table of a plurality of databases managed by different administrators into vector data;
The vector data, the data identifier for identifying the vector data, and the administrator identifier for identifying the administrator of the database containing the record corresponding to the vector data are associated with each other, and the data management device and the dedicated a database access unit for registering in a vector database connected in a communicable manner via a line ;
a blockchain access unit that associates an administrator identifier assigned to each administrator in the vector database with access right information indicating the access right of each administrator in the vector database and registers the administrator identifier in the blockchain;
A record to be updated by the first administrator in a database managed by the first administrator among the plurality of databases from a first administrator who is one of the administrators of the plurality of databases an update data acquisition unit that acquires the data identifier of, the field name to be updated, and the field information after update;
a similarity calculation unit for calculating a similarity between the vector data stored in the vector database and the vector data to be updated, which is vector data associated with the data identifier of the record to be updated;
A data identifier for specifying the similar vector data and a data identifier for specifying the similar vector data and the update target data to the second administrator who is the administrator of the database containing the records corresponding to the similar vector data, which is the vector data whose similarity satisfies a predetermined condition. an update information notification unit that notifies the field name and the updated field information;
A data management device comprising:
前記ブロックチェーンアクセス部は、前記アクセス権情報を参照して、前記ベクトルデータベースに登録されているベクトルデータのうち前記第1管理者がアクセスすることを許可されたベクトルデータを特定する、
請求項に記載のデータ管理装置。
The blockchain access unit refers to the access right information to identify vector data that the first administrator is permitted to access among the vector data registered in the vector database.
The data management device according to claim 1 .
前記ベクトル変換部は、前記第1管理者と前記第2管理者とのそれぞれが管理するデータベースを構成するレコードのうち、少なくとも更新されたレコードをベクトルデータに変換して前記ベクトルデータベースに登録する、
請求項1又は2に記載のデータ管理装置。
The vector conversion unit converts at least updated records among records constituting databases managed by the first manager and the second manager respectively into vector data and registers the vector data in the vector database.
3. The data management device according to claim 1 or 2.
前記データベースアクセス部は、前記ブロックチェーンアクセス部が前記ブロックチェーンから取得したアクセス権が許可する範囲において前記ベクトルデータベースにアクセスする、
請求項1から3のいずれか1項に記載のデータ管理装置。
The database access unit accesses the vector database to the extent permitted by the access rights acquired from the blockchain by the blockchain access unit.
The data management device according to any one of claims 1 to 3 .
データ管理装置のプロセッサが、
前記データ管理装置と通信可能な態様で接続され、異なる管理者によってそれぞれ管理される複数のデータベースであって前記データ管理装置と通信可能な態様で接続しているデータベースのテーブルを構成する各レコードを、それぞれベクトルデータに変換するステップと、
前記ベクトルデータと、前記ベクトルデータを特定するためのデータ識別子と、前記ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、前記データ管理装置と専用回線を介して通信可能な態様で接続されたベクトルデータベースに登録するステップと、
前記ベクトルデータベースにおいて前記管理者それぞれに割り当てられた管理者識別子を、各管理者の前記ベクトルデータベースにおけるアクセス権を示すアクセス権情報と紐づけてブロックチェーンに登録するステップと、
前記複数のデータベースの管理者のうちのいずれかの管理者である第1管理者から、前記複数のデータベースのうち前記第1管理者が管理するデータベースにおいて前記第1管理者が更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得するステップと、
前記ベクトルデータベースに格納されたベクトルデータと、前記更新対象とするレコードのデータ識別子が紐付けられているベクトルデータである更新対象ベクトルデータとの類似度を算出するステップと、
前記類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含むデータベースの管理者である第2管理者に、前記類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、前記更新後のフィールド情報とを通知するステップと、
を実行するデータ管理方法。
The processor of the data management device
Each record constituting a table of a plurality of databases connected in a manner communicable with the data management device and managed by different administrators , and connected in a manner communicable with the data management device , respectively into vector data; and
The vector data, the data identifier for identifying the vector data, and the administrator identifier for identifying the administrator of the database containing the record corresponding to the vector data are associated with each other, and the data management device and the dedicated registering in a vector database communicatively connected via a line ;
a step of linking an administrator identifier assigned to each of the administrators in the vector database with access right information indicating each administrator's access rights in the vector database and registering the administrator identifier in the blockchain;
A record to be updated by the first administrator in a database managed by the first administrator among the plurality of databases from a first administrator who is one of the administrators of the plurality of databases a step of obtaining a data identifier of, a field name to be updated, and updated field information;
calculating the degree of similarity between the vector data stored in the vector database and the vector data to be updated, which is vector data associated with the data identifier of the record to be updated;
A data identifier for specifying the similar vector data and a data identifier for specifying the similar vector data and the update target data to the second administrator who is the administrator of the database containing the records corresponding to the similar vector data, which is the vector data whose similarity satisfies a predetermined condition. a step of notifying the field name and the updated field information;
data management methods that perform
コンピュータに、
前記コンピュータと通信可能な態様で接続され、異なる管理者によってそれぞれ管理される複数のデータベースのテーブルを構成する各レコードを、それぞれベクトルデータに変換する機能と、
前記ベクトルデータと、前記ベクトルデータを特定するためのデータ識別子と、前記ベクトルデータに対応するレコードを含むデータベースの管理者を特定するための管理者識別子とを紐づけて、前記コンピュータと専用回線を介して通信可能な態様で接続されたベクトルデータベースに登録させる機能と、
前記ベクトルデータベースにおいて前記管理者それぞれに割り当てられた管理者識別子を、各管理者の前記ベクトルデータベースにおけるアクセス権を示すアクセス権情報と紐づけてブロックチェーンに登録する機能と、
前記複数のデータベースの管理者のうちのいずれかの管理者である第1管理者から、前記複数のデータベースのうち前記第1管理者が管理するデータベースにおいて前記第1管理者が更新対象とするレコードのデータ識別子と、更新対象のフィールド名と、更新後のフィールド情報とを取得する機能と、
前記ベクトルデータベースに格納されたベクトルデータと、前記更新対象とするレコードのデータ識別子が紐付けられているベクトルデータである更新対象ベクトルデータとの類似度を算出する機能と、
前記類似度が所定の条件を満たすベクトルデータである類似ベクトルデータに対応するレコードを含むデータベースの管理者である第2管理者に、前記類似ベクトルデータを特定するためのデータ識別子と、更新対象のフィールド名と、前記更新後のフィールド情報とを通知する機能と、
を実現させるプログラム。
to the computer,
A function of converting each record constituting a table of a plurality of databases connected to the computer in a communicable manner and managed by different administrators into vector data;
The vector data, a data identifier for identifying the vector data, and an administrator identifier for identifying an administrator of a database containing records corresponding to the vector data are linked to connect the computer and the dedicated line. a function to register in a vector database connected in a communicable manner via
A function of linking an administrator identifier assigned to each of the administrators in the vector database with access right information indicating the access rights of each administrator in the vector database and registering the identifier in the blockchain;
A record to be updated by the first administrator in a database managed by the first administrator among the plurality of databases from a first administrator who is one of the administrators of the plurality of databases A function to acquire the data identifier of, the field name to be updated, and the field information after updating,
a function of calculating the degree of similarity between the vector data stored in the vector database and the vector data to be updated, which is vector data associated with the data identifier of the record to be updated;
A data identifier for specifying the similar vector data and a data identifier for specifying the similar vector data and the update target data to the second administrator who is the administrator of the database containing the records corresponding to the similar vector data, which is the vector data whose similarity satisfies a predetermined condition. a function of notifying the field name and the updated field information;
program to realize
請求項1からのいずれか1項に記載のデータ管理装置と、
前記ベクトルデータベースと、
を備えるデータ管理システム。
a data management device according to any one of claims 1 to 4 ;
the vector database;
A data management system with
JP2019085404A 2019-04-26 2019-04-26 Data management device, data management method, program, and data management system Active JP7285511B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019085404A JP7285511B2 (en) 2019-04-26 2019-04-26 Data management device, data management method, program, and data management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019085404A JP7285511B2 (en) 2019-04-26 2019-04-26 Data management device, data management method, program, and data management system

Publications (2)

Publication Number Publication Date
JP2020181469A JP2020181469A (en) 2020-11-05
JP7285511B2 true JP7285511B2 (en) 2023-06-02

Family

ID=73024248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019085404A Active JP7285511B2 (en) 2019-04-26 2019-04-26 Data management device, data management method, program, and data management system

Country Status (1)

Country Link
JP (1) JP7285511B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279135A (en) 2001-03-16 2002-09-27 Sanyo Electric Co Ltd Information management device and information management method
JP2003122845A (en) 2001-10-09 2003-04-25 Shinkichi Himeno Retrieval system for medical information, and program for carrying out the system
JP2009099007A (en) 2007-10-18 2009-05-07 Fuji Xerox Co Ltd Service server, update information management server, service system, service program and update information management program
JP2013037567A (en) 2011-08-09 2013-02-21 Nec Biglobe Ltd Data management system and data management method
JP2015187828A (en) 2014-03-13 2015-10-29 株式会社日立ソリューションズ information management system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279135A (en) 2001-03-16 2002-09-27 Sanyo Electric Co Ltd Information management device and information management method
JP2003122845A (en) 2001-10-09 2003-04-25 Shinkichi Himeno Retrieval system for medical information, and program for carrying out the system
JP2009099007A (en) 2007-10-18 2009-05-07 Fuji Xerox Co Ltd Service server, update information management server, service system, service program and update information management program
JP2013037567A (en) 2011-08-09 2013-02-21 Nec Biglobe Ltd Data management system and data management method
JP2015187828A (en) 2014-03-13 2015-10-29 株式会社日立ソリューションズ information management system

Also Published As

Publication number Publication date
JP2020181469A (en) 2020-11-05

Similar Documents

Publication Publication Date Title
US11178182B2 (en) Automated access control management for computing systems
US10831844B2 (en) Accessing databases
US10592837B2 (en) Identifying security risks via analysis of multi-level analytical records
US9202078B2 (en) Data perturbation and anonymization using one way hash
US11907199B2 (en) Blockchain based distributed file systems
US9977922B2 (en) Multi-tier storage based on data anonymization
US11770450B2 (en) Dynamic routing of file system objects
US11366928B2 (en) Systems and method of contextual data masking for private and secure data linkage
JP2023512338A (en) Context-driven data profiling
JP2019512128A (en) System and method for calculating a trade-off between data confidentiality-utility
US20220391365A1 (en) Duplicate determination in a graph
US10248668B2 (en) Mapping database structure to software
US20230169056A1 (en) Systems and methods for determining dataset intersection
Kaur et al. Blockchain‐based framework for secured storage, sharing, and querying of electronic healthcare records
US11868339B2 (en) Blockchain based distributed file systems
US8676844B2 (en) Graph authorization
US20210004360A1 (en) Indexing structured data with security information
JP7285511B2 (en) Data management device, data management method, program, and data management system
US9563845B1 (en) Rule evaluation based on precomputed results
Jain et al. Privacy-preserving record linkage with block-chains
US11556661B2 (en) Data access control system and data access control method
JP6973636B2 (en) Safety assessment equipment, safety assessment methods, and programs
TWI838461B (en) Methods and systems for accessing chainable records
Avinash et al. Privacy Preservation Using Anonymity in Social Networks
Cáceres et al. Data Validation Through Decentralised Blockchain-Based Registries

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230515

R150 Certificate of patent or registration of utility model

Ref document number: 7285511

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150