JP2024011617A

JP2024011617A - データベース管理装置、及びデータベース管理方法

Info

Publication number: JP2024011617A
Application number: JP2022113783A
Authority: JP
Inventors: 常之今木; Tsuneyuki Imaki; 匡通坂田; Tadamichi Sakata
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2022-07-15
Filing date: 2022-07-15
Publication date: 2024-01-25
Also published as: US20240020286A1; US12147406B2

Abstract

【課題】複数のデータベースの各データに対してその内容に応じた適切なアクセス制御を行うための情報を容易に設定するデータベース管理装置及び方法を提供する。
【解決手段】データベース管理装置による機密度伝搬処理であって、データベースの起点カラムの指定を受け付け、起点カラムに格納されているデータの内容と起点カラムに係るデータベース以外の他のデータベースのカラムに格納されているデータの内容との類似度及び起点カラムの機密度に基づき、他のデータベースのカラムの機密度を算出し、算出した機密度と、他のデータベースのカラムのデータの照合容易性を示す値とに基づき、他のデータベースの機密度を算出し、他のデータベースの機密度及び他のデータベースの選択カラムのデータの照合容易性を示す値に基づき、選択カラムの機密度を算出し、選択カラムを新たな起点カラムとして設定し、算出した機密度を新たな起点カラムの機密度として設定する。
【選択図】図６

Description

本発明は、データベース管理装置、及びデータベース管理方法に関する。

AI/ML(Artificial Intelligence: Machine Learning)の発達によって、大量のデータの運用管理が必要となっている。そのようなデータには、機密性の高いデータも多く含まれている。しかし、このようなデータに要求される機密性の程度は常に一定ではなく、社会情勢の変化、法令遵守の要請、又はビジネス手法の変化等により、常に変動する可能性を有している。したがって、これらのデータを記憶しているデータベースの機密度（アクセス制限）の設定を変更することで、機密度の高い情報には特定のユーザのみがアクセスできるようにする必要が生じる。

しかしながら、機密度の変更を行うべきデータを有するデータベースは通常大量に存在し、またデータベース間でもデータが複雑に対応づけられているため、あるデータの機密性の設定を変更する場合には、その機密性と連動する他のデータやデータベースの機密性の設定も変更しなければならない。そして、このような作業の多くは、人手に頼っているのが現状である。そこで、このような処理を自動化するための技術が提案されている。

特許文献１には、複合的な構造を持つデータを複数のテーブル／カラムで管理するオブジェクトデータベースにおいて、該データの構造に基づいてアクセス制御用のメタデータを決定し、クエリが発行された際には、該メタデータを参照し、必要ならばクエリを書き換えることでアクセス制御を実現することが記載されている。

特許文献２には、ユーザが定義したセキュアなテーブルに対してクエリが発行された際に、該クエリの結果に基づいて、クエリのスコア（ユーザ定義のセキュリティに対する遵守度）を算出し、閾値との比較によってアクセス可否を決定することが記載されている。

特許文献３には、複数のSQLクエリの組合せを、データ変換のパイプラインと見做し、
各SQLクエリにおいて、カラムに対して定義される条件（例えば、Join条件のカラム同士
、Projectionの変換元/先カラム）に基いて、カラム間の“derivation”関係を抽出し、
該関係をエッジ（辺）とするグラフ構造を構築し、可視化することが記載されている。

米国特許出願公開第２０１９／０１５５７９４号明細書米国特許出願公開第２０１６／０１７１２３５号明細書米国特許出願公開第２０２０／００２６７９０号明細書

特許文献１の技術は、各データベースのデータ構造に基づいてアクセス制御を行うが、機密性のようなデータ内容の実質に基づいたアクセス制御やデータ間の関連性は充分に考慮されていない。

特許文献２では、複数のデータベース間でのデータの連携について充分に考慮されておらず、各データベースのカラム間の機密度の関連性を特定していくことが難しい。

特許文献３では、カラム間の接続関係を特定しているが、データ内容に基づく接続関係は考慮されない。

このように、複数のデータベースが関連しあっている場合に、そのデータ内容に基づいて適切なアクセス権限設定ができるようにするための技術は充分に開発されていない。

本発明は、このような事情に鑑みてなされたものであり、その目的は、複数のデータベースの各データに対してその内容に応じた適切なアクセス制御を行うための情報を容易に設定することが可能なデータベース管理装置、及びデータベース管理方法を提供することを目的とする。

上記課題を解決するための本発明の一つは、１以上のカラムを有する複数のデータベースを記憶する記憶装置、及び、前記データベースのカラムを起点カラムとしてその指定を受け付け、前記指定された起点カラムに格納されているデータの内容と前記指定された起点カラムに係るデータベース以外の他のデータベースのカラムに格納されているデータの内容との類似度、及び前記起点カラムの機密度に基づき、前記他のデータベースのカラムの機密度を算出し、前記算出した機密度と、前記他のデータベースのカラムのデータの照合容易性を示す値とに基づき、前記他のデータベースの機密度を算出し、前記算出した他のデータベースの機密度、及び前記他のデータベースにおける選択されたカラムのデータの照合容易性を示す値に基づき、前記選択されたカラムの機密度を算出し、前記選択されたカラムを新たな前記起点カラムとして設定し、前記算出した機密度を前記新たな起点カラムの機密度として設定する処理装置を備えるデータベース管理装置である。

本発明によれば、複数のデータベースの各データに対してその内容に応じた適切なアクセス制御を行うための情報を容易に設定することができる。
上記した以外の構成及び効果等は、以下の実施形態の説明により明らかにされる。

本実施形態に係るデータベース管理システムの構成の一例を示す図である。算出方法データの一例を示す図である。データベース管理装置が備えるハードウェアの一例を示す図である。機密度設定処理の一例を説明するフロー図である。機密度設定処理に基づく各テーブルの機密度等の変化の一例を説明する図である。機密度伝搬処理の一例を説明するフロー図である。グラフ画面の一例を示す図である。

以下、図面を参照して、本発明の実施形態について詳細に説明する。

図１は、本実施形態に係るデータベース管理システム１の構成の一例を示す図である。データベース管理システム１は、カラム（列）及びレコード（行）からなる、秘匿性を有するデータを記憶したデータベース（以下、テーブルともいう）を複数記憶している情報処理システムである。そして、データベース管理システム１は、これらのデータベースのうち指定されたデータベースのカラムに対して管理者が機密設定を行った場合に、そのデータベースを含む各データベースの各カラムに対しても適切なレベルの機密設定を行う。

具体的には、データベース管理システム１は、データアクセス装置７５２、機密度設定
装置７５１、機密度算出方法設定装置７５０、及びデータベース管理装置７０１の各情報処理装置を含んで構成される。

データアクセス装置７５２、機密度設定装置７５１、機密度算出方法設定装置７５０、及びデータベース管理装置７０１の間は、例えば、インターネット、ＬＡＮ（Local Area
Network）、ＷＡＮ（Wide Area Network）、又は専用線等の有線又は無線の通信ネット
ワークにより接続される。

機密度設定装置７５１は、管理者から、機密度の初期設定を行うデータベースのカラム（以下、起点カラムという）の指定を受け付け、指定された起点カラムの情報をデータベース管理装置７０１に送信する。機密度は、アクセス制限の程度を示す値であり、後述するデータアクセス装置７５２のユーザは、その機密度の値に応じた内容のアクセス制限を受ける。

機密度算出方法設定装置７５０は、管理者から、機密度の算出方法に関する情報（以下、算出方法情報という）を受け付け、入力された算出方法情報をデータベース管理装置７０１の算出方法データ２００に記憶する。

データベース管理装置７０１は、データ格納部７０３及びデータカタログ部７０２の各機能部を有する。

データ格納部７０３は、各データベースのデータ７１０と、テーブルスキーマ７１１とを記憶している。テーブルスキーマ７１１は、データベースのデータ構造を定義した情報である。

データカタログ部７０２は、メタデータ算出部７１２、メタデータグラフ分析部７０５、メタデータ格納部７０４を備える。

メタデータ算出部７１２は、データ格納部７０３からデータベースのデータ７１０を受信し、受信したデータに基づき、データベース又はカラムに対するパラメータ（次述）を算出する。メタデータ算出部７１２は、算出した各パラメータを、メタデータ格納部７０４のテーブルカラムメタデータ７２０、カラム間類似度７２１、及び信頼度７２２に記憶する。

メタデータ格納部７０４におけるテーブルカラムメタデータ７２０は、データ格納部７０３における各テーブルのデータ及び、後述する類似度及び信頼度を算出するために用いられた、各テーブル及び各カラムに関するデータを含む。

カラム間類似度７２１は、カラム間（異なるテーブル間のカラム間の場合と、同じテーブル内でのカラム間の場合がある）のデータの類似度のデータである。類似度の詳細は後述する。

信頼度７２２は、各カラムにおけるデータの照合容易性（機密性の確度）を示す数値データである。例えば、あるカラムにおけるデータのとりうる値の種類が少ない場合又はデータのばらつきが小さい場合（例えば、「男」又は「女」）には、そのカラムのデータによってレコードの主体（例えば、個人）を特定しにくいため、照合容易性（機密性の確度）が低い。

次に、メタデータグラフ分析部７０５は、機密度算出部７１３、及びグラフデータ構築部７１４を備える。

機密度算出部７１３は、機密度算出方法設定装置７５０から受信した機密度パラメータ、機密度設定装置７５１から受信した起点カラムとその機密度、及びメタデータ格納部７０４の情報等に基づき、算出方法データ２００に従って、各データベースの各カラムの機密度を算出する。機密度算出部７１３は、算出した機密度を、メタデータ格納部７０４のテーブルカラム機密度７２５に記憶する。

グラフデータ構築部７１４は、メタデータ格納部７０４のテーブルカラムメタデータ７２０、カラム間類似度７２１、信頼度７２２、及び機密度７２４と、データ格納部７０３のテーブルスキーマ７１１とに基づき、後述するグラフ画面３００を作成するためのデータ（以下、グラフデータという）を作成する。

データアクセス装置７５２は、ユーザから、指定されたテーブルのカラムに対するアクセス要求を受け付け、アクセス要求をデータベース管理装置７０１に送信する。データベース管理装置７０１は、アクセス要求が示すカラムの機密度（機密度算出部７１３が算出した機密度）に従って、アクセス要求に対応するカラムのデータ（例えば、アクセス指示で指定されたデータの全部、一部、又は送信するデータ無し）をデータアクセス装置７５２に送信する。データアクセス装置７５２は、受信したデータを画面等に出力する。

（算出方法データ）
ここで、図２は、算出方法データ２００の一例を示す図である。算出方法データ２００は、カラムの機密度の第１算出方法２０１、テーブルの機密度の算出方法２０２、及びカラムの機密度の第２算出方法２０３を有する。

カラムの機密度の第１算出方法２０１は、起点カラムの機密度に基づき他のカラムの機密度を算出する方法である。例えば、他のカラムの機密度は、起点カラムの機密度と、類似度との積により求まるとする。また、例えば、他のカラムの機密度は、起点カラムの機密度が所定の閾値より高ければ１００とし、起点カラムの機密度が所定の閾値以下であれば０とする。なお、本実施形態では、前者が選択されているものとする。

テーブルの機密度の算出方法２０２は、カラムの機密度に基づきテーブルの機密度を算出する方法である。例えば、テーブルの機密度は、カラムの機密度と、そのカラムのデータの信頼度との積により求まるとする。また、例えば、テーブルの機密度は、カラムの機密度が所定の閾値より高ければそのカラムのデータの信頼度の値とし、カラムの機密度が所定の閾値以下であれば０とする。なお、本実施形態では、前者が選択されているものとする。

カラムの機密度の第２算出方法２０３は、カラムの機密度に基づき他のカラムの機密度を算出する方法である。例えば、他のカラムの機密度は、カラムの機密度と、そのカラムの信頼性との積により求まるとする。また、例えば、他のカラムの機密度は、カラムの機密度が所定の閾値より高ければそのカラムの信頼度の値とし、カラムの機密度が所定の閾値以下であれば０とする。なお、本実施形態では、前者が選択されているものとする。

管理者は、機密度算出方法設定装置７５０を介して、このような機密度の算出方法を自由に設定することができる。

なお、ここで説明した機密度の算出方法は一例であり、その他の任意の算出方法があり得る。例えば、機密度を算出する対象となるカラム又はテーブルを指定又は限定してもよいし、あるカラムの機密度を算出する場合には、そのカラムと対応づけられた他のカラムの機密度（例えば、類似する項目又は内容のカラム）を用いることにより、機密度を算出
するようにしてもよい。

次に、図３は、データベース管理装置７０１が備えるハードウェアの一例を示す図である。データベース管理装置７０１は、ＣＰＵ（Central Processing Unit）などの処理装
置９１と、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等の主記憶装置９２と、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）等の補助記憶装置９３と、ディスプレイ又はタッチパネル等の表示装置９４と、キーボード、マウス、又はタッチパネル等の入力装置９５と、ＮＩＣ(Network Interface Card)、無線通信モジュール、USB (Universal Serial Interface)モジュール、又はシリアル通信モジュール等で構成される通信装置９６とを備える。なお、機密度算出方法設定装置７５０、データアクセス装置７５２、及び機密度設定装置７５１も同様のハードウェア構成を備える。

以上に説明したデータベース管理装置７０１の各機能部の機能は、処理装置９１が、主記憶装置９２又は補助記憶装置９３から各機能部を実現する所定のプログラムを読み出すことにより実現される。また各プログラムは、例えば、可搬性の又は固定された記録媒体に記録して配布することができる。なお、これらのプログラムは、その全部または一部が、例えば、クラウドシステムによって提供される仮想サーバのように、仮想化技術やプロセス空間分離技術等を用いて提供される仮想的な情報処理資源を用いて実現されるものであってもよい。また、これらのプログラムの全部または一部は、例えば、クラウドシステムがＡＰＩ (Application Programming Interface)等を介して提供するサービスによって実現してもよい。
次に、データベース管理システム１で行われる処理について説明する。

＜機密度設定処理＞
図４は、機密度設定処理の一例を説明するフロー図である。
また、図５は、機密度設定処理に基づく各テーブルの機密度等の変化の一例を説明する図である。
以下、これらの図に従って、機密度設定処理を説明する。なお、機密度設定処理は、例えば、データベース管理装置７０１が機密度算出方法設定装置７５０又は機密度設定装置７５１から所定の開始情報を受信したことを契機に実行される。

まず、図４に示すように、メタデータ算出部７１２は、データ格納部７０３における各テーブルのデータ７１０を読み込んでテーブルカラムメタデータ７２０に読み込みつつ、カラム間類似度７２１及び信頼度７２２を算出する（ｓ８０１）。

信頼度７２２については、本実施形態では、メタデータ算出部７１２は、各テーブルの各カラムについて、そのデータ値の分散又は標準偏差等の、データのばらつきを示すパラメータ値を算出することで、信頼度を算出するものとする。なお、このような信頼度の算出方法は一例である。

また、カラム間類似度７２１については、本実施形態では、メタデータ算出部７１２は、各テーブルの各カラムから２つのカラムを抽出し、抽出した２つのカラム間のデータの内容（値）の分布（確率分布）の類似度を算出するものとする。なお、このような類似度の算出方法は一例である。例えば、類似度は、２つのカラム間のデータ値の共通度（リニエージ：Lineage。例えば、２つのカラムの間で共通する値があるデータ数を共通度とす
る。）であってもよいし、これと前記の類似度との組み合わせとしてもよい。

なお、メタデータ算出部７１２は、ｓ８０１の処理を、後述する機密度伝搬処理ｓ８０３における、類似度又は信頼度の算出が必要になったタイミングで行ってもよい。

まず、図４に示すように、機密度算出部７１３は、機密度算出方法設定装置７５０から、起点カラムの指定を受け付ける（ｓ８０２）。

具体的には、機密度算出部７１３は、管理者が機密度算出方法設定装置７５０に入力した、テーブル及びカラム（すなわち起点カラム）の情報を機密度算出方法設定装置７５０から受信する。そして、機密度算出部７１３は、起点カラムに機密度の値を対応付けて記憶する。なお、機密度算出部７１３は、この起点カラムの機密度の値を自動的に設定してもよいし（例えば、１００）、管理者から機密度の指定を受け付けてもよい。

図５の例では、管理者は、第１テーブル１００、第２テーブル１１０、第３テーブル１３０、及び第４テーブル１４０のうち第１テーブル１００の氏名カラム１０２（又は第１テーブル１００そのものでもよい）に、「Ｃｏｖ」という名称のＣｏｖ機密度１０１を設定し、その値に「１００」を設定する。

次に、機密度算出部７１３は、機密度伝搬処理ｓ８０３を呼び出す。機密度伝搬処理ｓ８０３の詳細は後述する。

その後、グラフデータ構築部７１４は、機密度伝搬処理ｓ８０３により算出した各テーブル及び各カラムの機密性の伝搬の状況を画面に表示するグラフ表示処理ｓ８０４を実行する。グラフ表示処理ｓ８０４の詳細は後述する。以上で機密度設定処理は終了する。

＜機密度伝搬処理＞
図６は、機密度伝搬処理ｓ８０３の一例を説明するフロー図である。
まず、メタデータ算出部７１２は、起点カラムとの類似度が算出されている、起点テーブル以外の他のテーブル（ただし、これまでに選択されていない他のテーブル）のカラムを全て特定する（ｓ９０３）。

メタデータ算出部７１２は、ｓ９０３で特定したカラムの一つを選択する（ｓ９０４）。本実施形態では、メタデータ算出部７１２は、起点カラムと同名のカラム（起点カラムに直接対応づけられているカラム）を選択するものとする。

メタデータ算出部７１２は、ｓ９０４で選択したカラム（以下、選択カラムという）と起点カラムとの間の類似性を特定し、特定した類似性及び起点カラムの機密度に基づき、選択カラムの機密度を算出する（ｓ９０５）。

具体的には、メタデータ算出部７１２は、算出方法データ２００により、起点カラムの機密度から選択カラムの機密度を算出する。

図５の例では、メタデータ算出部７１２は、算出方法データ２００におけるカラムの機密度の第１算出方法２０１に従い、氏名カラム１０２のＣｏｖ機密度である「１００」に、氏名カラム１０２及び、選択カラムである第２テーブル１１０の氏名カラム１１２の間の類似度１５１「５０％」を乗算することで、第２テーブル１１０の氏名カラム１１２のＣｏｖ－接種者機密度１１４「５０」を算出する。

メタデータ算出部７１２は、ｓ９０５で算出した選択カラムの機密度と、選択カラムの信頼性に基づき、選択カラムに属するテーブルの機密度を算出する（ｓ９０６）。

具体的には、メタデータ算出部７１２は、算出方法データ２００により、選択カラムの機密度から選択カラムに属するテーブルの機密度を算出する。

図５の例では、メタデータ算出部７１２は、算出方法データ２００におけるテーブルの機密度の算出方法２０２に従い、第２テーブル１１０の氏名カラム１１２のＣｏｖ－接種者機密度１１４「５０」に、氏名カラム１１２の信頼度１１３を乗算することで、第２テーブル１１０の機密度１１１「５０」を算出する。

メタデータ算出部７１２は、ｓ９０６で機密度を算出したテーブルの他のカラムのうち、機密度を算出していないカラムを全て特定する（ｓ９０７）。

図５の例では、メタデータ算出部７１２は、第２テーブル１１０の種別カラム１１５及び体温カラム１１８を特定する。

メタデータ算出部７１２は、ｓ９０７で特定したカラムの一つを選択する（ｓ９０８）。

図５の例では、メタデータ算出部７１２は、第２テーブル１１０の種別カラム１１５又は体温カラム１１８を選択する。

メタデータ算出部７１２は、ｓ９０６で算出したテーブルの機密度と、ｓ９０８で選択したカラムの信頼性とに基づき、ｓ９０８で選択したカラムの機密度を算出する（ｓ９１０）。

具体的には、メタデータ算出部７１２は、算出方法データ２００により、テーブルの機密度からｓ９０８で選択したカラムの機密度を算出する。

図５の例では、メタデータ算出部７１２は、算出方法データ２００におけるカラムの機密度の第２算出方法２０３に従い、第２テーブル１１０の機密度１１１「５０」に、種別カラム１１５の信頼度１１６「８０％」（又は体温カラム１１８の信頼度１１９「１００％」）を乗算することで、種別カラム１１５のＣｏｖ－種別機密度１１７「４０」（又は体温カラム１１８のＣｏｖ－体温機密度１２０「５０」）を算出する。

メタデータ算出部７１２は、ｓ９０８で選択したカラムを新たな起点カラムとして記憶し（ｓ９１０）、その起点カラムに基づいて、機密度伝搬処理ｓ８０３を呼び出す（再帰呼び出しｓ９１１）。

図５の例では、メタデータ算出部７１２は、第２テーブル１１０の種別カラム１１５を起点カラムとして、第４テーブル１４０のカラム（例えば、種別カラム１４２）を全て特定する。もしくは、メタデータ算出部７１２は、第２テーブル１１０の体温カラム１１８を起点カラムとして、第３テーブル１３０のカラム（例えば、体温カラム１３２）を全て特定する。

なお、メタデータ算出部７１２は、再帰呼び出しｓ９１１において、第４テーブル１４０の種別カラム１４２との類似度１５２に基づき、第４テーブル１４０の種別カラム１４２のＣｏｖ－種別機密度１４４を算出し、種別カラム１４２の信頼度１４３に基づき第４テーブル１４０のＣｏｖ機密度１４１を算出する。また、メタデータ算出部７１２は、再帰呼び出しｓ９１１において、第３テーブル１３０の体温カラム１３２との類似度１５３に基づき、第３テーブル１３０の体温カラム１３２のＣｏｖ－体温機密度１３４を算出し、体温カラム１３２の信頼度１３３に基づき第３テーブル１３０のＣｏｖ機密度１３１を算出する。

メタデータ算出部７１２は、再帰呼び出しｓ９１１から復帰後、ｓ９０７で特定したカ
ラムのうち選択していないカラムがあるか否かを確認する（ｓ９１２）。メタデータ算出部７１２は、選択していないカラムがある場合は、そのカラムを選択すべくｓ９０８の処理を実行し、選択していないカラムがない場合は、メタデータ算出部７１２は、ｓ９１３の処理を実行する。

ｓ９１３においてメタデータ算出部７１２は、ｓ９０３で特定したカラムのうち選択していないカラムがあるか否かを確認する。メタデータ算出部７１２は、選択していないカラムがある場合は、そのカラムを選択すべくｓ９０４の処理を実行し、選択していないカラムがない場合は、機密度伝搬処理ｓ８０３は終了する。

以上の処理により、メタデータ算出部７１２は、全てのテーブル及びカラムについて、機密度を連鎖的に設定することができる。

＜グラフ表示処理＞
図７は、グラフ表示処理ｓ８０４において表示されるグラフ画面３００の一例を示す図である。同図に示すように、このグラフ画面３００におけるグラフは、機密度が対応づけられているテーブル及びカラムをノードとし、類似度又は信頼度（例えば、テーブルとカラムの間の類似度、カラム間の類似度、カラム又はテーブルの機密度の算出根拠であるカラム又はテーブルの信頼度又は類似度）をエッジとするグラフである。同図では、ノードは円で表され、エッジは２つの円の間を結合する矢印で表される。そして、ノードを表す円内には、そのノードの機密度の値が表示され、エッジを表す矢印の近傍には、そのエッジの信頼度又は類似度の値が表示される。なお、ここで示した図形の種類（ノードは円、エッジは矢印）は一例であり、他の任意の図形に変更可能である。

同図の例では、第１テーブル１００の氏名カラム１０２（起点カラム）のＣｏｖ接種者機密度１０４を表す第１の円（機密度の値は１００）と、第２テーブル１１０の氏名カラム１１２のＣｏｖ接種者機密度１１４を表す第２の円（機密度の値は５０）と、第２テーブル１１０のＣｏｖ機密度１１１を表す第３の円（機密度の値は５０）と、第２テーブル１１０の種別カラム１１５のＣｏｖ種別機密度１１７を表す第４の円（機密度の値は４０）と、第４テーブル１４０の種別カラム１４２のＣｏｖ種別機密度１４４を表す第５の円（機密度の値は３０）と、第４テーブル１４０のＣｏｖ機密度１４１を表す第６の円（機密度の値は３０）とが順に表示される。第１の円と第２の円の間は、類似度１５１を表す矢印（類似度の値は５０）で結合され、第２の円と第３の円の間は、信頼度１１３を表す矢印（類似度の値は１００％）で結合され、第３の円と第４の円の間は、信頼度１１６を表す矢印（類似度の値は８０％）で結合され、第４の円と第５の円の間は、類似度１５２を表す矢印（類似度の値は７５％）で結合され、第５の円と第６の円の間は、信頼度１４３を表す矢印（類似度の値は１０％）で結合される。

第３の円からは、さらに、第２テーブル１１０の体温カラム１１８のＣｏｖ－体温機密度１２０を表す第７の円（機密度の値は５０）と、第３テーブル１３０の体温カラム１３２のＣｏｖ体温機密度１３４を表す第８の円（機密度の値は４０）と、第３テーブル１３０のＣｏｖ機密度１３１を表す第９の円（機密度の値は４０）とが順に表示される。第３の円と第７の円の間は、信頼度１１９を表す矢印（信頼度の値は１００％）で結合され、第７の円と第８の円の間は、類似度１５３を表す矢印（類似度の値は８０％）で結合され、第８の円と第９の円の間は、信頼度１３３を表す矢印（信頼度の値は１００％）で結合される。

なお、グラフ画面３００には、機密度が所定値以上のテーブル及びカラムの情報のみを表示してもよい。

以上のグラフ画面３００により、管理者等は、機密度の初期設定を行った起点カラムを起点として、他のテーブルの各カラムに機密度が伝搬した過程を確認することができる。

以上説明したように、本実施形態のデータベース管理装置７０１は、データベースの起点カラムに格納されているデータの内容と、その起点カラムに係るデータベース以外の他のデータベースのカラムに格納されているデータの内容との類似度、及び、起点カラムの機密度に基づき、当該他のデータベースのカラムの機密度を算出し、算出した機密度と、上記他のデータベースのカラムのデータの信頼度とに基づき、上記他のデータベースの機密度を算出し、算出した他のデータベースの機密度、及び上記他のデータベースの選択されたカラムのデータの信頼度に基づき、上記選択されたカラムの機密度を算出し、選択されたカラムを新たな起点カラムとし、上記算出した機密度を新たな起点カラムの機密度として設定する。

すなわち、データベース管理装置７０１は、あるデータベースの起点カラムの初期機密度を基準として、他のデータベースに、データ内容の類似度及び信頼度に応じた機密度を設定し、その他のデータベースにおける他のカラムの機密度を、データの信頼度に応じて設定する。そして、そのカラムを新たな起点カラムとして前記の起点カラムの処理を繰り返す。

したがって、起点カラムの機密度を最初に決定しておけば、関連する他のデータベースの各カラムに、データの類似性及び照合容易性に応じた高さの機密度が設定される。

このように、本実施形態のデータベース管理装置７０１によれば、複数のデータベースの各データに対してその内容に応じた適切なアクセス制御を行うための情報を容易に設定することができる。

また、データベース管理装置７０１は、類似度を、起点カラムに格納されている各データの分布と、他のデータベースのカラムに格納されている各データの分布との類似度に基づいて算出する。

これにより、カラム間の類似性をそのデータ内容に基づいて合理的な基準で算出することができる。

また、データベース管理装置７０１は、起点カラムのデータベース以外の他のデータベースのカラムの機密度の算出方法を算出方法データ２００に記憶し、その算出方法に従って、当該他のデータベースのカラムの機密度を算出する。

また、本実施形態のデータベース管理装置７０１は、起点カラム以外の他のデータベースの機密度の算出方法を算出方法データ２００に記憶し、その算出方法に従って当該他のデータベースの機密度を算出する。

また、本実施形態のデータベース管理装置７０１は、上記他のデータベースにおける選択されたカラムの機密度の算出方法データ２００に記憶し、その算出方法に従ってその選択されたカラムの機密度を算出する。

このように、各機密度の算出方法を予め記憶しておき、それらに基づいて各機密度を算出できるようにすることで、管理者は、データベースやカラムの特性に基づいた適切な機密度の算出方法を設定することができる。

さらに、本実施形態のデータベース管理装置７０１は、各起点カラムの機密度、起点カ
ラムのテーブル以外の他のデータベースのカラムの機密度、その他のデータベースの機密度、及びその他のデータベースの選択されたカラムの機密度をそれぞれノードとし、上記他のデータベースのカラムの算出根拠である類似度、上記他のデータベースの機密度の算出根拠である信頼度、及び上記他のデータベースのカラムの選択されたカラムの機密度の算出根拠である信頼度をエッジとし、ノード間をエッジで結合するグラフを出力する。

このようなグラフを出力することで、管理者は、起点カラムを起点として他のテーブルやカラムに機密度が連鎖的に設定されていることを確認することができる。

また、本実施形態のデータベース管理装置７０１は、データアクセス装置７５２から、複数のデータベースのうちいずれかのデータベースのカラムに対するアクセス要求を受信し、受信したアクセス要求が示すカラムの機密度に応じたデータを、データアクセス装置７５２に送信する。

このように、ユーザからのアクセス要求に対して、各データベースの各カラムに設定された機密度に応じたアクセス制御を行うことで、機密データが多数のデータベースに存在している場合であっても、各ユーザに対する適切なアクセスコントロールを行うことができる。

本発明は、上記実施形態に限定されるものではなく、その要旨を逸脱しない範囲内で、任意の構成要素を用いて実施可能である。以上説明した実施形態や変形例はあくまで一例であり、発明の特徴が損なわれない限り、本発明はこれらの内容に限定されるものではない。また、上記では種々の実施形態や変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。

例えば、本実施形態の各装置が備えるハードウェアの一部は、他の装置に設けてもよい。

また、各装置の各プログラムは他の装置に設けてもよいし、あるプログラムを複数のプログラムからなるものとしてもよいし、複数のプログラムを一つのプログラムに統合してもよい。

１データベース管理システム、７０１データベース管理装置、７０３データ格納部、７１２メタデータ算出部、７１３機密度算出部、７１４グラフデータ構築部、

Claims

１以上のカラムを有する複数のデータベースを記憶する記憶装置、及び、
前記データベースのカラムを起点カラムとしてその指定を受け付け、
前記指定された起点カラムに格納されているデータの内容と前記指定された起点カラムに係るデータベース以外の他のデータベースのカラムに格納されているデータの内容との類似度、及び前記起点カラムの機密度に基づき、前記他のデータベースのカラムの機密度を算出し、
前記算出した機密度と、前記他のデータベースのカラムのデータの照合容易性を示す値とに基づき、前記他のデータベースの機密度を算出し、
前記算出した他のデータベースの機密度、及び前記他のデータベースにおける選択されたカラムのデータの照合容易性を示す値に基づき、前記選択されたカラムの機密度を算出し、前記選択されたカラムを新たな前記起点カラムとして設定し、前記算出した機密度を前記新たな起点カラムの機密度として設定する処理装置
を備えるデータベース管理装置。
前記処理装置は、前記類似度を、前記起点カラムに格納されている各データの分布と、前記他のデータベースのカラムに格納されている各データの分布との類似度に基づいて算出する、請求項１に記載のデータベース管理装置。
前記処理装置は、前記類似度を、前記起点カラムに格納されている各データの値と、前記他のデータベースのカラムに格納されている各データの値との共通度に基づいて算出する、請求項１に記載のデータベース管理装置。
前記処理装置は、前記他のデータベースのカラムの機密度の算出方法を記憶し、前記処理装置は、前記記憶した算出方法に従って、前記他のデータベースのカラムの機密度を算出する、請求項１に記載のデータベース管理装置。
前記記憶装置は、前記他のデータベースの機密度の算出方法を記憶し、前記処理装置は、前記記憶した算出方法に従って、前記他のデータベースの機密度を算出する、請求項１に記載のデータベース管理装置。
前記記憶装置は、前記選択されたカラムの機密度の算出方法を記憶し、前記処理装置は、前記記憶した算出方法に従って、前記選択されたカラムの機密度を算出する、請求項１に記載のデータベース管理装置。
前記処理装置は、前記起点カラムの機密度、前記他のデータベースのカラムの機密度、前記他のデータベースの機密度、及び前記他のデータベースの前記選択されたカラムの機密度をそれぞれノードとし、前記他のデータベースのカラムの算出根拠である類似度、前記他のデータベースの機密度の算出根拠である信頼度、及び前記他のデータベースのカラムの前記選択されたカラムの機密度の算出根拠である信頼度をそれぞれエッジとし、前記ノードを示す図形間を前記エッジを示す図形により結合したグラフを出力する、請求項１に記載のデータベース管理装置。
前記処理装置は、情報処理装置から、前記複数のデータベースのうちいずれかのデータベースのカラムに対するアクセス要求を受信し、受信したアクセス要求が示すカラムの前記機密度に応じたデータを、前記情報処理装置に送信する、請求項１に記載のデータベース管理装置。
情報処理装置が、
１以上のカラムを有する複数のデータベースを記憶し、
前記データベースのカラムを起点カラムとしてその指定を受け付け、
前記指定された起点カラムに格納されているデータの内容と前記指定された起点カラムに係るデータベース以外の他のデータベースのカラムに格納されているデータの内容との類似度、及び前記起点カラムの機密度に基づき、前記他のデータベースのカラムの機密度を算出し、
前記算出した機密度と、前記他のデータベースのカラムのデータの照合容易性を示す値とに基づき、前記他のデータベースの機密度を算出し、
前記算出した他のデータベースの機密度、及び前記他のデータベースにおける選択されたカラムのデータの照合容易性を示す値に基づき、前記選択されたカラムの機密度を算出し、前記選択されたカラムを新たな前記起点カラムとして設定し、前記算出した機密度を前記新たな起点カラムの機密度として設定する
データベース管理方法。