JP2024015853A - 公開データ決定装置、データ公開システム、公開データ決定方法およびプログラム - Google Patents
公開データ決定装置、データ公開システム、公開データ決定方法およびプログラム Download PDFInfo
- Publication number
- JP2024015853A JP2024015853A JP2022118195A JP2022118195A JP2024015853A JP 2024015853 A JP2024015853 A JP 2024015853A JP 2022118195 A JP2022118195 A JP 2022118195A JP 2022118195 A JP2022118195 A JP 2022118195A JP 2024015853 A JP2024015853 A JP 2024015853A
- Authority
- JP
- Japan
- Prior art keywords
- data
- public
- catalog
- access
- transaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims description 31
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 238000010248 power generation Methods 0.000 claims description 5
- 238000007726 management method Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 17
- 238000013500 data storage Methods 0.000 description 17
- 238000013523 data management Methods 0.000 description 12
- 238000012558 master data management Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】効率的に公開データを決定することができる公開データ決定装置を得ること。【解決手段】公開データ決定装置1は、既に公開されている公開データへのアクセスの履歴を示すアクセス情報を用いて、公開データのアクセス頻度を算出し、算出したアクセス頻度を用いてアクセス頻度の高い公開データである高頻度アクセスデータを検出する高頻度アクセス判定部121と、高頻度アクセスデータの属性を示す第1属性情報と、トランザクションデータの属性を示す第2属性情報との類似度を算出する類似度算出部122と、類似度に基づいて高頻度アクセスデータに類似するトランザクションデータを、追加する公開データとして決定するデータ選択部123と、を備える。【選択図】図1
Description
本開示は、公開するデータを決定する公開データ決定装置、データ公開システム、公開データ決定方法およびプログラムに関する。
近年、オープンデータをはじめとした様々なデータの利活用の促進のため、公開されるデータが増加している。公開されるデータは、例えば、ひとまとまりのデータセットとして公開される。データセットを公開する際には、データセットに関する情報やデータセットの所在を示す情報などがデータカタログとして生成される。例えば、ユーザが、データセットを取得する際に、取得を要求するデータセットに関する情報を検索条件として入力すると、データカタログにおける各データ項目と検索条件とが比較され、検索条件に一致するデータ項目があると、一致したデータ項目を含むデータカタログの情報が検索結果として表示される。
特許文献1には、データに付与するタグをデータカタログとして生成する技術が開示されている。特許文献1に記載の技術では、データの分析に用いるアプリケーションの開発者がデータを取得するために検索キーワードを入力すると、検索キーワードと一致するタグのタグ名が表示される。アプリケーションの開発者は、表示されたタグ名のなかからタグ名を選択すると、選択されたタグ名に対応するデータが表示され、アプリケーションの開発者は表示されたデータのなかから所望のデータをダウンロードすることができる。
上記特許文献1に記載の技術では、データの提供先は、アプリケーションの開発者であり、一般ユーザではないため、収集されるデータの全てが提供の対象となる。一方、データをより広いユーザに公開する場合には、一般に、収集されたデータのなかから公開するデータが選択され、選択されたデータが公開される。公開されるデータは、例えば、人手によって選択されることで決定されるが、広く公開されるデータは、アプリケーションの開発者へ公開されるデータと異なり、ユーザのニーズも多様であり、適切な公開データを人手で決定することは困難であり、また手間もかかる。このため、効率的に公開データが決定されることが望まれる。しかしながら、特許文献1には、公開データの決定方法が開示されていない。
本開示は、上記に鑑みてなされたものであって、効率的に公開データを決定することができる公開データ決定装置を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本開示にかかる公開データ決定装置は、トランザクションデータから選択された公開データを公開するデータ公開システムにおける公開データ決定装置であって、既に公開されている公開データへのアクセスの履歴を示すアクセス情報を用いて、公開データのアクセス頻度を算出し、算出したアクセス頻度を用いてアクセス頻度の高い公開データである高頻度アクセスデータを検出する高頻度アクセス判定部、を備える。公開データ決定装置は、さらに、高頻度アクセスデータの属性を示す第1属性情報と、トランザクションデータの属性を示す第2属性情報との類似度を算出する類似度算出部と、類似度に基づいて高頻度アクセスデータに類似するトランザクションデータを、追加する公開データとして決定するデータ選択部と、を備える。
本開示によれば、効率的に公開データを決定することができるという効果を奏する。
以下に、実施の形態にかかる公開データ決定装置、データ公開システム、公開データ決定方法およびプログラムを図面に基づいて詳細に説明する。
実施の形態1.
図1は、実施の形態1にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100は、公開データ決定装置1と、データ公開装置3とを備える。データ公開システム100は、例えば、スマートシティにおいて取得された各種データ、発電プラントをはじめとした各種プラントで取得されたデータ、各種のセンサによって取得されたデータなどを、データセットとしてユーザに公開する。なお、データ公開システム100が公開するデータは、上述した例に限定されず、どのようなものであってもよい。
図1は、実施の形態1にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100は、公開データ決定装置1と、データ公開装置3とを備える。データ公開システム100は、例えば、スマートシティにおいて取得された各種データ、発電プラントをはじめとした各種プラントで取得されたデータ、各種のセンサによって取得されたデータなどを、データセットとしてユーザに公開する。なお、データ公開システム100が公開するデータは、上述した例に限定されず、どのようなものであってもよい。
データ公開システム100は、トランザクションデータから選択された公開データを公開する。詳細には、データ公開システム100は、トランザクションデータを管理するトランザクションデータ管理装置4からトランザクションデータを取得し、取得したトランザクションデータのなかからデータセットとして公開するデータを決定し、公開するデータセットを記憶する。トランザクションデータは、公開するデータセットである公開データセットの元になるデータであり、センサによって取得されたセンサデータを含んでいてもよく、また、監視カメラによって取得された映像データおよび発電プラントにおいて取得されたデータのうち少なくとも1つを含んでいてもよい。トランザクションデータは、これに限らず、例えば、スマートシティにおいて取得された各種のデータ、発電プラント以外の各種プラントで取得されたデータ、スマートシティにおけるビルや会場などの入退場の記録などを含んでいてもよい。また、トランザクションデータは、複数の発電プラントにおいて取得されたデータ、複数のスマートシティにおいて取得されたデータを含んでいてもよい。トランザクションデータは上述した例に限定されない。
トランザクションデータ管理装置4は、トランザクションデータを取得するトランザクションデータ取得部41と、トランザクションデータ取得部41が取得したトランザクションデータを記憶するトランザクションデータ記憶部42と、他の装置との間でデータの送受信を行う送受信部43とを備える。
データカタログ管理装置2は、公開するデータセットのデータカタログを管理する。データカタログは、公開するデータセットごとの、データセットに関する1つ以上のデータ項目を含む情報であり、例えば、公開データセットの属性を示す属性情報と、公開データセットの所在を示す情報とを含む。図2は、本実施の形態のデータカタログのイメージを示す図である。データカタログは、データセットごとに生成される。各データセットのデータカタログを、データセット情報とも呼ぶ。データカタログは、例えば、図2に示すように、データセットの説明、保管場所(所在を示す情報)、作成者、配信情報などの各データ項目の情報を含む。
公開データセットはデータ公開システム100の運用の初期には管理者、運用者、開発者などによって選択される。初期の公開データセットに対応するデータカタログは、例えば、管理者、運用者、開発者などによって入力されたり他の装置から手動で情報が取得されたりすることで生成される。データ公開システム100の運用開始後は、後述するように、データ公開システム100によって追加される公開データセットが決定される。追加される公開データセットに対応するデータカタログは、トランザクションデータ、マスタデータなどに基づいて自動生成される。なお、マスタデータは、トランザクションデータに関する情報であり、マスタデータ管理装置5によって管理される。
図3は、本実施の形態のデータカタログにおけるデータ項目の一例を示す図である。図3に示すように、カタログ化されるデータ項目、すなわちデータカタログに含まれるデータ項目の取得元は、例えば、マスタデータ、トランザクションデータ、設定情報およびその他である。図3に示した例では、トランザクションデータがセンサによって取得されたセンサデータである例を示している。なお、センサは、カメラなどの映像を取得する装置も含んでいてもよい。設定情報は、例えば、運用者、管理者などによって設定される情報である。設定情報は、マスタデータとともにマスタデータ管理装置5に記憶されていてもよいし、図示しない他の場所に記憶されていてもよい。例えば、データの取得元がその他の場合は、運用者、管理者などによってデータカタログの生成時に入力される、または定められた処理によって生成される。
カタログ化されるデータ項目のうち、マスタデータから取得されるデータ項目は、例えば、センサ情報(センサ名称、ID(IDentifier)、・・・)、観測対象(対象の名称)、観測活動(プロジェクトの名称)などを含む。プロジェクトの名称は、センサデータが何らかのプロジェクトのために取得される場合の当該プロジェクトに対応する。プロジェクトの名称の代わりに、センサデータが取得される目的を示す情報が用いられてもよい。図3は、一例であり、データカタログにおけるデータ項目は図3に示した例に限定されない。
カタログ化されるデータ項目のうち、トランザクションデータから取得されるデータ項目は、例えば、日時(観測日時)、センサ名称などを含む。カタログ化されるデータ項目のうち、設定情報から取得されるデータ項目は、例えば、データセット詳細のデータ項目のうちのデータセットの作成者などである。カタログ化されるデータ項目のうち、取得元がその他となるデータ項目は、例えば、ライセンス情報(利用条件、公開範囲、公開地域、データ保護要件、保証、・・・)、配信情報(配信開始日、データセットサイズ、・・・)、公開URL(Uniform Resource Locator)、データセット詳細(タイトル、説明)などを含む。公開URLは、データカタログの生成時に、定められたアルゴリズムによって生成される。公開URLは、例えば、ランダムに生成される。トランザクションデータおよびマスタデータとは、例えば、センサ名称やセンサの番号などのように、トランザクションデータを識別するための識別情報を含んでおり、この識別情報によってトランザクションデータとマスタデータとを対応づけることができる。取得元が設定情報およびその他となる情報についても、トランザクションデータと対応付けが必要な情報については同様に識別情報が含まれる。
なお、図3に示した取得元は一例であり、各データ項目のデータの取得元は図3に示した例に限定されない。例えば、ライセンス情報がマスタデータに含まれていてもよく、この場合、ライセンス情報の取得元はマスタデータであってもよい。
図1の説明に戻る。データカタログ管理装置2は、他の装置との間でデータの送受信を行う送受信部21と、データカタログを記憶するデータカタログ記憶部22と、データカタログへのアクセスを検出するアクセス検出部23と、アクセス検出部23による検出結果をアクセス情報として記憶するアクセス情報記憶部24と、データカタログの編集を受け付ける編集受付部25とを備える。アクセス情報は、既に公開されている公開データセットへのアクセスの履歴を示す。詳細には、例えば、アクセス情報は、ユーザに公開データセットが提供された履歴を示す情報であり、データ公開装置3からアクセスのあった、すなわち取得要求のあったデータカタログを識別する情報と、対応する時刻とを含む。
マスタデータ管理装置5は、他の装置との間でデータの送受信を行う送受信部51と、マスタデータを記憶するマスタデータ記憶部52とを備える。マスタデータは、上述したようにトランザクションデータに関する情報であり、トランザクションデータがセンサによって取得されたデータである場合には、センサの名称などを含む。
データ公開システム100のデータ公開装置3は、公開データセットの取得の要求を受け付けるWebサイトを提供する。なお、以下、Webサイトによりユーザに公開データセットが公開される例を説明するが、公開データセットの公開方法は、Webサイトを用いる例に限定されない。データ公開装置3は、公開データセットの取得の要求を受け付けるための画面である検索受付画面を、ユーザの端末であるユーザ端末6に表示させるための情報をユーザ端末6へ送信する。なお、図1では、ユーザ端末6を1台図示しているが、ユーザ端末6の数に特に制約はなく、ユーザ端末6の数は、図1に示した例に限定されない。
ユーザ端末6は、データ公開装置3から受信した情報に基づいて検索受付画面を表示する。図4は、本実施の形態のユーザ端末6に表示される検索受付画面の一例を示す図である。ユーザは、例えば、図4に示した検索条件入力欄201に、所望の公開データセットを検索するための検索条件を入力する。ユーザ端末6は、検索条件の入力を受け付けると検索条件を含む検索要求をデータ公開装置3へ送信する。
データ公開装置3は、ユーザ端末6から、公開データセットを検索するための検索要求を受け付けると、検索要求にしたがって、データカタログ管理装置2が管理するデータカタログを参照して、検索条件に合致するデータカタログを取得する。データ公開装置3は、取得したデータカタログごとに、データカタログからユーザに提示するデータ項目の情報を提示情報として抽出し、提示情報を検索結果としてユーザ端末6に送信する。提示情報は、データカタログのうちの少なくとも一部を含んでおり、提示情報もデータカタログであるともいえる。また、提示情報は、取得されたデータカタログに対応する公開データセットに関する情報である。
図5は、本実施の形態の検索結果の表示画面の一例を示す図である。ユーザは、ユーザ端末6に検索結果として表示された各提示情報を参照し、提示情報ごとに設けられているチェックボックス202をチェックすることで、ユーザの所望の公開データセットに対応する提示情報を選択する。ユーザが、例えば、ダウンロード開始ボタン203を押下すると、ユーザ端末6は、選択結果が確定したと判断し、選択結果としてユーザが選択した提示情報を示す情報をデータ公開装置3へ送信する。データ公開装置3は、ユーザ端末6から受信した選択結果に対応する公開データセットの所在を対応するデータカタログから把握し、公開データセットをユーザ端末6へ送信する。これにより、ユーザが選択した公開データセットがユーザに提供される。なお、図4および図5は、一例であり、各表示画面に表示される情報、レイアウト、具体的な文字列などはこれらの例に限定されず、図4および図5と同様の入力を受け付けられる画面であればよい。
このように、データカタログにおけるデータ項目の情報と、ユーザによって指定される検索条件とが合致する公開データセットのなかから、ユーザによって選択された公開データセットがユーザに提供される。
図1の説明に戻る。データ公開装置3は、他の装置との間でデータの送受信を行う送受信部31と、公開データセットを公開する公開処理部32と、公開データを記憶する公開データ記憶部33とを備える。公開処理部32は、例えば、公開データセットをWebサイトにより公開する。例えば、公開処理部32は、Webサイトにより公開データセットの検索の要求を受け付け、選択結果を、Webサイトを介してユーザ端末6へ送信する。
データ公開システム100の公開データ決定装置1は、データカタログ管理装置2からアクセス情報を取得し、アクセス情報に基づいてトランザクションデータから公開データセットを選択することで、公開データセットを決定する。公開データ決定装置1は、決定した公開データセットに対応するデータカタログを、対応するトランザクションデータおよびマスタデータを用いて生成し、生成したデータカタログをデータカタログ管理装置2へ送信する。データカタログ管理装置2は、公開データ決定装置1からデータカタログを受信すると受信したデータカタログをデータカタログ記憶部22に格納する。これにより、公開データ決定装置1によって決定された公開データに対応するデータカタログが登録される。
公開データ決定装置1は、他の装置との間でデータの送受信を行う送受信部11と、公開データセットを決定する公開データ決定部12と、公開データ決定部12によって決定された公開データセットに対応するデータカタログを生成するカタログ生成部13とを備える。公開データ決定部12は、高頻度アクセス判定部121と、類似度算出部122と、データ選択部123とを備える。
高頻度アクセス判定部121は、アクセス情報を用いて、公開データセット(公開データ)のアクセス頻度を算出し、算出したアクセス頻度を用いてアクセス頻度の高い公開データセットである高頻度アクセスデータを検出する。詳細には、高頻度アクセス判定部121は、送受信部11を介してデータカタログ管理装置2からアクセス情報を取得し、アクセス情報を用いて、アクセス頻度の高いデータカタログを検出する。アクセス情報は、上述したように、データ公開装置3からアクセスのあったデータカタログを識別する情報と、対応する時刻とを含むが、データ公開装置3は、検索条件に合致するデータカタログを検索する場合と、ユーザ端末6から選択結果を受け取った場合に選択結果に対応するデータセットの所在をデータカタログから取得する場合とに、データカタログにアクセスするが、ここでは、アクセス情報には、後者、すなわち選択結果に対応するデータセットの所在をデータカタログから取得する場合のアクセスに関する情報が含まれるとする。なお、以下では、アクセス情報には、選択結果に対応するデータセットの所在をデータカタログから取得する場合のアクセスに関する情報、すなわちユーザが取得するデータセットとして選択した公開データセットに対応するデータカタログへのアクセスに関する情報が含まれているとするが、これに限らず、アクセス情報に、検索条件に合致するデータカタログが検索される場合のアクセスに関する情報が含まれていてもよい。すなわち、ユーザが指定した検索条件に合致する公開データセットに対応するデータカタログへのアクセスに関する情報が含まれていてもよい。
なお、以下では、アクセス情報としてデータカタログ管理装置2によって検出されたデータカタログへのアクセスに関する情報を用いる例を説明するが、この代わりに、データ公開装置3が、公開データセットへのアクセスに関する情報をアクセス情報として取得してもよい。すなわち、データ公開装置3は、ユーザ端末6から受信した選択結果、または公開データ記憶部33から読み出された公開データセットを検出することで、アクセスのあった公開データセットを識別する情報と、対応する時刻とをアクセス情報として検出するアクセス情報検出部と、アクセス情報を記憶するアクセス情報記憶部とを備えてもよい。この場合、高頻度アクセス判定部121は、送受信部11を介してデータ公開装置3からアクセス情報を取得する。
データカタログへのアクセスは、対応する公開データセットへのアクセスを意味するため、高頻度アクセス判定部121は、アクセス情報に基づいて、例えば、一定期間においてアクセス回数がしきい値以上の公開データセットを高頻度アクセスの公開データセット、すなわち人気のある公開データセットとして検出する。
類似度算出部122は、高頻度アクセスの公開データセット(高頻度アクセスデータ)の属性を示す第1属性情報と、トランザクションデータの属性を示す第2属性情報との類似度を算出する。詳細には、類似度算出部122は、高頻度アクセスの公開データセットに対応するデータカタログと、トランザクションデータおよび対応するマスタデータとを用いて、高頻度アクセスの公開データセットの属性情報とトランザクションデータの属性情報との類似度を算出する。第1属性情報は、高頻度アクセスの公開データセットに対応するデータカタログにおける属性情報のうちの少なくとも一部である。
データ選択部123は、類似度に基づいて高頻度アクセスの公開データセットに類似するトランザクションデータを、追加する公開データとして決定する。データ選択部123は、決定された公開データセットと公開データセットが追加されたことを示す通知とを送受信部11を介してデータ公開装置3へ送信する。データ公開装置3の送受信部31は、公開データ決定装置1から受信した公開データセットを公開データ記憶部33に格納し、公開データセットが追加されたことを示す通知を公開処理部32へ出力する。
また、データ選択部123は、追加する公開データセットに対応するトランザクションデータを示す情報をカタログ生成部13へ通知する。カタログ生成部13は、通知された情報に対応するトランザクションデータのデータカタログを生成し、生成したデータカタログを、送受信部11を介してデータカタログ管理装置2へ送信する。詳細には、カタログ生成部13は、データ選択部123が決定した、追加する公開データセットに対応するデータカタログを、公開データの元になるトランザクションデータとトランザクションデータに関する情報を含むマスタデータと当該公開データセットに類似する高頻度アクセスの公開データセットのデータカタログとを用いて生成する。
なお、データカタログ管理装置2、トランザクションデータ管理装置4およびマスタデータ管理装置5のうちの1つ以上を、データ公開システム100に含めてもよい。
また、図1に示した各装置の切り分けは一例であり、図1に示した各装置のうちの2つ以上が1つの装置として実現されてもよい。例えば、公開データ決定装置1とデータ公開装置3とが一体化されていてもよいし、公開データ決定装置1とデータカタログ管理装置2とが一体化されていてもよいし、公開データ決定装置1とデータカタログ管理装置2とが一体化されていてもよいし、公開データ決定装置1、データカタログ管理装置2およびデータ公開装置3が一体化されていてもよい。複数の装置が一体化される場合、これらの装置におけるデータの送受信には送受信部は用いられなくてもよい。また、各装置を構成する機能部の一部が他の装置内に設けられていてもよい。例えば、公開データ決定装置1のカタログ生成部13が、データカタログ管理装置2内に設けられていてもよい。また、図1に示した各装置がさらに複数の装置に分割されていてもよい。例えば、公開データ記憶部33は、図示しない公開データ管理装置に設けられていてもよい。
次に、本実施の形態の公開データセットの決定方法について説明する。図6は、本実施の形態の公開データセットの決定処理の一例を示すフローチャートである。図6に示すように、公開データ決定装置1は、アクセス頻度を算出する(ステップS1)。詳細には、高頻度アクセス判定部121は、送受信部11を介してデータカタログ管理装置2からアクセス情報を取得し、アクセス情報を用いて、データカタログごと、すなわち公開データセットごとのアクセス頻度を算出する。アクセス頻度は、例えば、一定時間内のアクセス回数である。
次に、公開データ決定装置1は、アクセス頻度の高い公開データセット(公開データ)を選択する(ステップS2)。詳細には、高頻度アクセス判定部121が、例えば、アクセス頻度がしきい値以上となる公開データセットを選択する。または、高頻度アクセス判定部121は、各公開データセットのアクセス頻度を統計処理した結果を用いてアクセス頻度の高い公開データセットを選択してもよい。例えば、各公開データセットのアクセス頻度の平均値と標準偏差を求め、平均値より大きく標準偏差がしきい値以上となるアクセス頻度をしきい値として設定してもよい。また、高頻度アクセス判定部121は、公開データセットをアクセス頻度の順にならべ、アクセス数が多い上位の定められた個数の公開データセットを選択してもよい。アクセス頻度の高い公開データセットの選択方法は、アクセス頻度に基づくものであればよく、これらの例に限定されない。
次に、公開データ決定装置1は、選択した公開データセットのうちの1つを処理対象データに設定する(ステップS3)。詳細には、データ選択部123が、高頻度アクセス判定部121によって選択された公開データセットのうちの1つを処理対象データとして設定する。
次に、公開データ決定装置1は、トランザクションデータと対応するマスタデータを取得する(ステップS4)。詳細には、データ選択部123が、トランザクションデータ管理装置4のトランザクションデータ記憶部42に格納されているトランザクションデータのうち、公開されていないデータを、送受信部11および送受信部43を介してトランザクションデータ記憶部42から取得し、当該データに対応するマスタデータを送受信部11および送受信部51を介してマスタデータ管理装置5のマスタデータ記憶部52から取得する。なお、トランザクションデータは、センサデータのような時系列データの場合には、連続的に取得されており切れ目がないことがあるが、ここでは、例えば時系列データが公開データセットと同様の単位期間ごとのデータとして記憶されている。例えば、一日分のデータを公開データセットの単位とする場合には、各トランザクションデータには、センサデータに対応する観測日時(この例では日単位であるため観測年月日)とセンサ名とが付加される。または、トランザクションデータが公開データセットに対応する期間より長い期間データとして格納されている場合には、公開データセットの期間と同じ長さの期間ごとにトランザクションデータを分割して同様の処理を行ってもよい。なお、公開データ決定装置1は、トランザクションデータ全体を取得する代わりに、トランザクションデータのうち後述する属性情報に対応するデータを取得してもよい。
次に、公開データ決定装置1は、処理対象データの属性情報とトランザクションデータの属性情報との類似度を算出する(ステップS5)。詳細には、類似度算出部122が、送受信部11および送受信部21を介して、処理対象データに対応するデータカタログのうち類似度の算出に用いるデータ項目のデータをデータカタログ記憶部22から属性情報として取得する。また、類似度算出部122が、送受信部11および送受信部51を介して、トランザクションデータに対応するマスタデータのうち類似度の算出に用いるデータ項目のデータをマスタデータ記憶部52から属性情報として取得する。また、類似度算出部122は、トランザクションデータ自身からも、センサ名、観測日時などを属性情報として取得する。類似度算出部122は、トランザクションデータごとに、処理対象データの属性情報とトランザクションデータの属性情報との類似度を算出する。
類似度は、例えば、処理対象データの属性情報(第1属性情報)およびトランザクションデータの属性情報(第2属性情報)に含まれデータ項目ごとに、第1属性情報におけるデータ項目の情報と第2属性情報におけるデータ項目の情報とが一致したか否かの判定結果に基づいて算出される。類似度は、例えば、データ項目ごとに、第1属性情報におけるデータ項目の情報と第2属性情報におけるデータ項目の情報とが一致したデータ項目が多いほど類似度が高くなるように決定されてもよい。例えば、一致したデータ項目の数を類似度としてもよいし、データ項目ごとに重み係数を定めておき、一致したデータ項目の重み係数を加算した値を類似度としてもよい。重み係数は、運用者、管理者などによって定められてもよいし、過去のアクセスを機械学習などによって分析することで、データ項目ごとにアクセス数との相関の高さを求めておき、アクセス数との相関の高いデータ項目の重み係数を大きくするように設定してもよい。
また、属性情報の一致は、完全一致に限らず、両者の差が定められた範囲内であれば一致と判定してもよい。例えば、あるデータ項目が複数の情報で構成されている場合、当該情報のうちの一部が一致している場合にも一致と判定されてもよい。例えば、トランザクションデータがセンサデータであり、データ項目が観測日時であるとすると、処理対象データがある年の7月20日に観測されたものであった場合、類似度算出部122は、同じ年の7月に観測されたトランザクションデータの全てを観測日時の属性情報が一致すると判断してもよいし、さらに別の年の7月に観測されたトランザクションデータについても観測日時の属性情報が一致すると判断してもよい。換言すると、類似度を算出するための属性情報としては、データカタログ、トランザクションデータ、マスタデータなどから取得された情報自体が用いられる例に限らず、取得された情報を用いて算出された情報が用いられてもよい。例えば、処理対象データの観測日時およびトランザクションデータから観測日時の季節(春夏秋冬)が算出され、データ項目のひとつとして季節が一致するかどうかの判定が行われてもよい。
類似度の算出に用いられるデータ項目は、例えば、観測日時(同一の日、時間、曜日、季節など)、センサの設置場所、センサ名称、センサの種類、観測対象、観測活動(プロジェクト名)、データ取得の目的などのうちの少なくとも一部であるが、これに限定されない。
次に、公開データ決定装置1は、類似度の高いトランザクションデータがあるか否かを判断する(ステップS6)。詳細には、データ選択部123が、例えば、類似度がしきい値以上となるトランザクションデータがあるか否かを判断する。
類似度の高いトランザクションデータがある場合(ステップS6 Yes)、公開データ決定装置1は、類似度の高いトランザクションデータを公開データセットに決定する(ステップS7)。詳細には、データ選択部123が、例えば、類似度がしきい値以上となるトランザクションデータを、追加する公開データセットとして決定する。
次に、公開データ決定装置1は、選択した公開データセットのうち未処理の公開データセットがあるか否かを判断する(ステップS8)。詳細には、データ選択部123が、ステップS2で選択された公開データセットのうち、処理対象データとして選択されていない公開データセットがあるか否かを判断する。
選択した公開データセットのうち未処理の公開データセットがある場合(ステップS8 Yes)、公開データ決定装置1は、処理対象データを変更し(ステップS9)、ステップS4からの処理を繰り返す。なお、公開データ決定装置1は、1回目のステップS4で取得したトランザクションデータおよびマスタデータのうち処理に使用する属性情報を図示しない記憶部に記憶しておき、2回目以降のステップS4では記憶している属性情報を読み出してもよい。
選択した公開データセットのうち未処理の公開データセットがない場合(ステップS8 No)、公開データ決定装置1は、決定した公開データセットに対応するデータカタログを生成し(ステップS10)、処理を終了する。詳細には、データ選択部123が、追加する公開データセットとして決定したトランザクションデータを示す情報と当該トランザクションデータと属性情報の類似度が高い処理対象データとをカタログ生成部13へ通知し、カタログ生成部13は、通知に基づいて、トランザクションデータに対応するデータカタログを生成する。
例えば、カタログ生成部13は、送受信部11および送受信部51を介して、マスタデータ記憶部52から、通知されたトランザクションデータに対応するマスタデータのうちデータカタログに用いるデータ項目の情報を取得する。そして、カタログ生成部13は、データカタログのデータ項目のうち、取得元がトランザクションデータおよびマスタデータであるデータ項目については、トランザクションデータおよびマスタデータから対応する情報を取得する。また、取得元が、設定情報およびその他であるデータ項目については、カタログ生成部13は、トランザクションデータに対応する情報が取得できる場合には取得し、トランザクションデータに対応する情報が取得できないデータ項目については類似度が高い処理対象データにおける情報をコピーして用いる。また、カタログ生成部13は、公開URLなどのように、公開データセットごとに、定められたアルゴリズムによって生成されるデータ項目については、定められたアルゴリズムにしたがって情報を生成する。このようにして、決定した公開データセットに対応するデータカタログが生成される。生成されたデータカタログは、送受信部11および送受信部21を介してデータカタログ記憶部22に格納される。また、公開データ決定装置1は、決定した公開データセットをデータ公開装置3へ送信し、データ公開装置3は受信した公開データセットを公開データ記憶部33に格納する。または、公開データ決定装置1は、決定した公開データセット(トランザクションデータ)を示す情報をデータ公開装置3へ通知し、公開データ決定装置1がトランザクションデータ管理装置4から対応するトランザクションデータを取得することで公開データセットを公開データ記憶部33に格納してもよい。
また、ステップS6でNoの場合、公開データ決定装置1は、処理をステップS8へ進める。
図6に例示した処理は、例えば、定期的に行われてもよいし、運用者、管理者などによって処理の実行が指示された場合に行われてもよい。なお、図6は一例であり、処理手順は図6に示した例に限定されない。
図6に示したステップS10でデータカタログが自動で生成されるが、自動で生成されたデータカタログのうちの一部は実際の公開データセットにあったものではない場合もある。例えば、追加される公開データセットのライセンス情報が類似度の高い公開データセットからコピーされる場合、実際の追加される公開データセットに対応するライセンス情報とは異なることもある。このような場合には、運用者、管理者は、データカタログ管理装置2を用いてデータカタログを編集する。詳細には、編集受付部25が、編集内容の入力を受け付け、受け付けた編集内容をデータカタログ記憶部22のデータカタログに反映させる。
また、以上に述べた例では、追加される公開データセットのデータカタログが自動で生成されたが、これに限らず、追加される公開データセットのデータカタログが、初期の公開データセットのデータカタログと同様に、運用者、管理者などによって設定されてもよい。
次に、本実施の形態の公開データ決定装置1のハードウェア構成について説明する。本実施の形態の公開データ決定装置1は、コンピュータシステム上で、公開データ決定装置1における処理が記述されたプログラム(コンピュータプログラム)が実行されることにより、コンピュータシステムが公開データ決定装置1として機能する。図7は、本実施の形態の公開データ決定装置1を実現するコンピュータシステムの構成例を示す図である。図7に示すように、このコンピュータシステムは、制御部101と入力部102と記憶部103と表示部104と通信部105と出力部106とを備え、これらはシステムバス107を介して接続されている。
図7において、制御部101は、例えば、CPU等のプロセッサであり、本実施の形態の公開データ決定装置1における処理が記述されたプログラムを実行する。入力部102は、たとえばキーボード、マウスなどで構成され、コンピュータシステムの使用者が、各種情報の入力を行うために使用する。記憶部103は、RAM(Random Access Memory),ROM(Read Only Memory)などの各種メモリおよびハードディスクなどのストレージデバイスを含み、上記制御部101が実行すべきプログラム、処理の過程で得られた必要なデータ、などを記憶する。また、記憶部103は、プログラムの一時的な記憶領域としても使用される。表示部104は、ディスプレイ、LCD(液晶表示パネル)などで構成され、コンピュータシステムの使用者に対して各種画面を表示する。通信部105は、通信処理を実施する受信機および送信機である。出力部106は、プリンタ、スピーカなどである。なお、図7は、一例であり、コンピュータシステムの構成は図7の例に限定されない。例えば、コンピュータシステムは出力部106を備えていなくてもよい。
ここで、本実施の形態のプログラムが実行可能な状態になるまでのコンピュータシステムの動作例について説明する。上述した構成をとるコンピュータシステムには、たとえば、図示しないCD(Compact Disc)-ROMドライブまたはDVD(Digital Versatile Disc)-ROMドライブにセットされたCD-ROMまたはDVD-ROMから、プログラムが記憶部103にインストールされる。そして、プログラムの実行時に、記憶部103から読み出されたプログラムが記憶部103の主記憶領域に格納される。この状態で、制御部101は、記憶部103に格納されたプログラムに従って、本実施の形態の公開データ決定装置1としての処理を実行する。
なお、上記の説明においては、CD-ROMまたはDVD-ROMを記録媒体として、公開データ決定装置1における処理を記述したプログラムを提供しているが、これに限らず、コンピュータシステムの構成、提供するプログラムの容量などに応じて、たとえば、通信部105を経由してインターネットなどの伝送媒体により提供されたプログラムを用いることとしてもよい。
例えば、本実施の形態のプログラムは、データ公開システムに、既に公開されている公開データへのアクセスの履歴を示すアクセス情報を用いて、公開データのアクセス頻度を算出し、算出したアクセス頻度を用いてアクセス頻度の高い公開データである高頻度アクセスデータを検出する判定ステップと、高頻度アクセスデータの属性を示す第1属性情報と、トランザクションデータの属性を示す第2属性情報との類似度を算出する算出ステップと、類似度に基づいて高頻度アクセスデータに類似するトランザクションデータを、追加する公開データとして決定するデータ選択ステップと、を実行させる。
図1に示した公開データ決定部12およびカタログ生成部13は、図7に示した記憶部103に記憶されたプログラムが図7に示した制御部101により実行されることにより実現される。公開データ決定部12およびカタログ生成部13の実現には、図7に示した記憶部103も用いられる。送受信部11は、図7に示した通信部105により実現される。公開データ決定装置1は複数のコンピュータシステムにより実現されてもよい。例えば、公開データ決定装置1は、クラウドシステムにより実現されてもよい。
データカタログ管理装置2も、例えば、図7に示したコンピュータシステムにより実現される。図1に示したアクセス検出部23は、図7に示した記憶部103に記憶されたプログラムが図7に示した制御部101により実行されることにより実現される。アクセス検出部23の実現には、図7に示した記憶部103も用いられる。図1に示した送受信部21は、図7に示した通信部105により実現される。図1に示したデータカタログ記憶部22およびアクセス情報記憶部24は、記憶部103の一部である。図1に示した編集受付部25は、図7に示した入力部102により実現される。データカタログ管理装置2は複数のコンピュータシステムにより実現されてもよい。例えば、データカタログ管理装置2は、クラウドシステムにより実現されてもよい。
データ公開装置3も、例えば、図7に示したコンピュータシステムにより実現される。図1に示した公開処理部32は、図7に示した記憶部103に記憶されたプログラムが図7に示した制御部101により実行されることにより実現される。公開処理部32の実現には、図7に示した記憶部103および通信部105も用いられる。図1に示した送受信部31は、図7に示した通信部105により実現される。図1に示した公開データ記憶部33は、記憶部103の一部である。データ公開装置3は複数のコンピュータシステムにより実現されてもよい。例えば、データ公開装置3は、クラウドシステムにより実現されてもよい。
また、トランザクションデータ管理装置4およびマスタデータ管理装置5も、同様に、例えば、図7に示したコンピュータシステムにより実現される。トランザクションデータ管理装置4およびマスタデータ管理装置5は、複数のコンピュータシステムにより実現されてもよい。例えば、トランザクションデータ管理装置4およびマスタデータ管理装置5は、クラウドシステムにより実現されてもよい。
また、上述したように、公開データ決定装置1、データカタログ管理装置2、データ公開装置3、トランザクションデータ管理装置4およびマスタデータ管理装置5のうちの2つ以上が1つのコンピュータシステムにより実現されてもよい。
以上述べたように、本実施の形態の公開データ決定装置1は、公開データセットのアクセス頻度に基づいて人気の公開データセットを検出し、人気の公開データセットと属性情報が類似するトランザクションデータを、追加する公開データセットに決定する。これにより、本実施の形態の公開データ決定装置1は、ユーザからのニーズにあった公開データセットを提供することができる。また、本実施の形態の公開データ決定装置1は、運用者、管理者などが公開データを決定する手間および時間を要せず、効率的に公開データ(公開データセット)を決定することができる。また、本実施の形態の公開データ決定装置1は、公開データセットのデータカタログを自動生成することで、効率的にデータカタログを生成することができる。
実施の形態2.
図8は、実施の形態2にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100aは、公開データ決定装置1の代わりに公開データ決定装置1aを備える以外は実施の形態1のデータ公開システム100と同様である。実施の形態1と同様の機能を有する構成要素は、実施の形態1と同一の符号を付して重複する説明を省略する。以下、実施の形態1と異なる点を主に説明する。
図8は、実施の形態2にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100aは、公開データ決定装置1の代わりに公開データ決定装置1aを備える以外は実施の形態1のデータ公開システム100と同様である。実施の形態1と同様の機能を有する構成要素は、実施の形態1と同一の符号を付して重複する説明を省略する。以下、実施の形態1と異なる点を主に説明する。
本実施の形態の公開データ決定装置1aは、カタログ生成通知部14が追加される以外は、公開データ決定装置1と同様である。カタログ生成部13はデータカタログを生成すると、その旨をカタログ生成通知部14へ通知し、カタログ生成通知部14は、データカタログが生成されたことを、データカタログ管理者へ通知する。具体的には、例えば、カタログ生成通知部14は、データカタログが生成されたことを示すカタログ生成通知を生成し、生成したカタログ生成通知を、データカタログの管理者の端末である管理者端末7へ送信する。カタログ生成通知には、例えば、生成されたデータカタログを識別するための情報が含まれているとする。データカタログを識別するための情報は、対応する公開データセットの識別情報であってもよい。カタログ生成通知は、電子メールとして生成されてもよいし、管理者端末7へポップアップ通知などとして表示が行われるための情報であってもよいし、データカタログの管理のためのアプリケーションソフトウェアや、SNS(Social Networking Service)などのアプリケーションソフトウェアによって、表示が行われるための情報であってもよい。カタログ生成通知は、管理者端末7に音声などの音により、データカタログの生成を通知するための情報であってもよい。カタログ生成通知は表示と音による提示との両方で行われてもよい。
管理者は、管理者端末7を用いてカタログ生成通知を確認することで、データカタログが生成されたことを認識することができる。これにより、管理者は、データカタログ管理装置2におけるデータカタログを確認し、必要に応じてデータカタログを編集することができる。
本実施の形態の公開データ決定装置1aは、実施の形態1で述べた公開データ決定装置1と同様に、例えば、図7に示したコンピュータシステムにより実現される。カタログ生成通知部14は、図7に示した制御部101および通信部105により実現される。
なお、図8では、管理者端末7にカタログ生成通知が送信されたが、この代わりに、またはこれに加えて、データカタログ管理装置2にカタログ生成通知が送信されることで、管理者にデータカタログが生成されたことが通知されてもよい。この場合、データカタログ管理装置2における図示しない表示部に、カタログが生成されたことを示す情報が表示されることで、管理者、運用者が、データカタログが生成されたことを認識することができる。
また、図8では、カタログ生成通知部14が公開データ決定装置1a内に設けられたが、データカタログ管理装置2が、カタログ生成通知部を備え、データカタログが追加された場合にカタログ生成通知部が管理者端末7にカタログ生成通知を送信してもよい。また、データカタログ管理装置2が、データカタログが追加された場合に、図示しない表示部に、データカタログが生成されたことを示す情報を表示してもよい。
実施の形態3.
図9は、実施の形態3にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100bは、公開データ決定装置1の代わりに公開データ決定装置1bを備える以外は実施の形態1のデータ公開システム100と同様である。実施の形態1と同様の機能を有する構成要素は、実施の形態1と同一の符号を付して重複する説明を省略する。以下、実施の形態1と異なる点を主に説明する。
図9は、実施の形態3にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100bは、公開データ決定装置1の代わりに公開データ決定装置1bを備える以外は実施の形態1のデータ公開システム100と同様である。実施の形態1と同様の機能を有する構成要素は、実施の形態1と同一の符号を付して重複する説明を省略する。以下、実施の形態1と異なる点を主に説明する。
本実施の形態の公開データ決定装置1bは、削除判定部15が追加される以外は、公開データ決定装置1と同様である。削除判定部15は、アクセス頻度を用いて削除する公開データセットを決定する。詳細には、削除判定部15は、送受信部11を介してデータカタログ管理装置2からアクセス情報を取得し、アクセス情報を用いて、削除する公開データセットを決定する。なお、アクセス情報は、実施の形態1と同様にデータ公開装置3から取得されてもよい。例えば、削除判定部15は、アクセス頻度がしきい値以下の公開データセット、および一定期間以上アクセスのない公開データセットのうちの少なくとも一方を、削除対象の公開データセットとして決定する。削除判定部15は、削除対象の公開データセットを示す情報を、送受信部11を介してデータ公開装置3およびデータカタログ管理装置2へ通知する。データ公開装置3は、通知された公開データセットを公開データ記憶部33から削除し、データカタログ管理装置2は通知された公開データセットに対応するデータカタログを、データカタログ記憶部22から削除する。
なお、図8に示した例では、削除判定部15が公開データ決定装置1bに設けられたが、削除判定部はデータ公開装置3またはデータカタログ管理装置2に設けられてもよい。
本実施の形態では、アクセス情報を用いて、アクセス頻度が少ない公開データセットを削除するようにしたため、公開データセットおよびデータカタログを記憶するために用いられる記憶容量を抑制することができる。
本実施の形態の公開データ決定装置1bは、実施の形態1で述べた公開データ決定装置1と同様に、例えば、図7に示したコンピュータシステムにより実現される。削除判定部15は、図7に示した制御部101により実現される。
実施の形態4.
図10は、実施の形態4にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100cは、公開データ決定装置1の代わりに公開データ決定装置1cを備える以外は実施の形態1のデータ公開システム100と同様である。実施の形態1と同様の機能を有する構成要素は、実施の形態1と同一の符号を付して重複する説明を省略する。以下、実施の形態1と異なる点を主に説明する。
図10は、実施の形態4にかかるデータ公開システムの構成例を示す図である。本実施の形態のデータ公開システム100cは、公開データ決定装置1の代わりに公開データ決定装置1cを備える以外は実施の形態1のデータ公開システム100と同様である。実施の形態1と同様の機能を有する構成要素は、実施の形態1と同一の符号を付して重複する説明を省略する。以下、実施の形態1と異なる点を主に説明する。
本実施の形態の公開データ決定装置1cは、要求データ検索部16が追加される以外は、公開データ決定装置1と同様である。本実施の形態では、データ公開装置3の公開処理部32は、ユーザ端末6から、公開データセットにはないデータの公開を要求する公開要求を受け付ける。データ公開装置3の公開処理部32は、公開要求を受け付けると、送受信部31を介して当該公開要求を公開データ決定装置1cへ送信する。要求データ検索部16は、送受信部11を介して、公開要求を受け取ると、公開要求における要求条件に基づいて、要求条件に対応するトランザクションデータを検索し、要求条件に対応するトランザクションデータがある場合、当該トランザクションデータを、追加する公開データセットとして決定する。詳細には、要求データ検索部16は、トランザクションデータ管理装置4に記憶されているトランザクションデータおよびマスタデータ管理装置5に記憶されているマスタデータから、要求されたデータを検索する。
図11は、本実施の形態の公開要求を受け付ける検索受付画面の一例を示す図である。データ公開装置3の公開処理部32は、例えば、実施の形態1の図4に示した検索受付画面の代わりに、図11に例示した検索受付画面をユーザ端末6に表示させる。ユーザは、要求入力欄204に、公開を要求するデータに関する情報である要求条件を入力する。ユーザ端末6は、要求条件を含む公開要求をデータ公開装置3へ送信する。なお、図11は一例であり、表示される検索受付画面は図11に示した例に限定されない。
要求データ検索部16は、公開要求における要求条件を検索キーワードとして、トランザクションデータおよびマスタデータを検索することで、要求条件に合致するトランザクションデータがあるか否かを判断する。なお、検索対象として上述した設定情報や取得元がその他となる情報が用いられてもよい。要求データ検索部16は、要求条件に合致するトランザクションデータがあった場合、当該トランザクションデータを追加する公開データセットとして決定し、当該公開データセットを示す情報をカタログ生成部13へ通知するとともに、当該トランザクションデータを取得して公開データセットとしてデータ公開装置3へ送信する。カタログ生成部13におけるカタログの生成は、実施の形態1と同様である。
以上のように、本実施の形態では、ユーザから、公開データセットにはないデータの公開の要求を受け付け、対応するトランザクションデータが存在する場合には、当該トランザクションデータを公開データセットに追加するようにした。このため、少ないニーズにも対応することができる。
なお、図10に示した例では、要求データ検索部16が公開データ決定装置1cに設けられたが、要求データ検索部はデータ公開装置3に設けられてもよい。この場合、要求データ検索部は、公開要求に合致するトランザクションデータがあった場合に、トランザクションデータを示す情報を、送受信部31および送受信部11を介してカタログ生成部13へ通知する。
本実施の形態の公開データ決定装置1cは、実施の形態1で述べた公開データ決定装置1と同様に、例えば、図7に示したコンピュータシステムにより実現される。要求データ検索部16は、図7に示した制御部101により実現される。
以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
以下、本開示の諸態様を付記としてまとめて記載する。
(付記1)
トランザクションデータから選択された公開データを公開するデータ公開システムにおける公開データ決定装置であって、
既に公開されている前記公開データへのアクセスの履歴を示すアクセス情報を用いて、前記公開データのアクセス頻度を算出し、算出した前記アクセス頻度を用いてアクセス頻度の高い前記公開データである高頻度アクセスデータを検出する高頻度アクセス判定部と、
前記高頻度アクセスデータの属性を示す第1属性情報と、前記トランザクションデータの属性を示す第2属性情報との類似度を算出する類似度算出部と、
前記類似度に基づいて前記高頻度アクセスデータに類似する前記トランザクションデータを、追加する前記公開データとして決定するデータ選択部と、
を備えることを特徴とする公開データ決定装置。
(付記2)
前記公開データに関する情報を示すデータカタログにおける各データ項目の情報と、ユーザによって指定される検索条件とが合致する前記公開データのなかから、前記ユーザによって選択された前記公開データが前記ユーザに提供され、
前記データカタログは、前記公開データの属性を示す属性情報と、前記公開データの所在を示す情報とを含み、
前記第1属性情報は、前記高頻度アクセスデータに対応する前記データカタログにおける前記属性情報のうちの少なくとも一部であり、
前記アクセス情報は、前記ユーザに前記公開データが提供された履歴を示す情報であることを特徴とする付記1に記載の公開データ決定装置。
(付記3)
前記データ選択部が決定した、追加する前記公開データに対応する前記データカタログを、前記公開データの元になる前記トランザクションデータと前記トランザクションデータに関する情報を含むマスタデータと当該公開データに類似する前記高頻度アクセスデータの前記データカタログとを用いて生成するカタログ生成部、
を備えることを特徴とする付記2に記載の公開データ決定装置。
(付記4)
前記カタログ生成部が前記データカタログを生成すると、前記データカタログが生成されたことを前記データカタログの管理者に通知するカタログ生成通知部、
を備えることを特徴とする付記3に記載の公開データ決定装置。
(付記5)
前記アクセス頻度を用いて削除する前記公開データを決定する削除判定部、
を備えることを特徴とする付記1から4のいずれか1つに記載の公開データ決定装置。
(付記6)
公開されていないデータの公開を要求する公開要求における要求条件に基づいて、要求条件に対応する前記トランザクションデータを検索し、前記要求条件に対応する前記トランザクションデータがある場合、当該トランザクションデータを、追加する前記公開データとして決定する要求データ検索部、
を備えることを特徴とする付記1から5のいずれか1つに記載の公開データ決定装置。
(付記7)
前記類似度は、前記第1属性情報および前記第2属性情報に含まれるデータ項目ごとの、前記第1属性情報における前記データ項目の情報と前記第2属性情報における前記データ項目の情報とが一致したか否かの判定結果に基づいて算出されることを特徴とする付記1から6のいずれか1つに記載の公開データ決定装置。
(付記8)
前記トランザクションデータは、センサによって取得されたセンサデータを含むことを特徴とする付記7に記載の公開データ決定装置。
(付記9)
前記データ項目は、前記トランザクションデータの観測日時、前記センサの種類および前記センサの観測の目的のうち少なくとも1つを含むことを特徴とする付記8に記載の公開データ決定装置。
(付記10)
前記トランザクションデータは、監視カメラによって取得された映像データおよび発電プラントにおいて取得されたデータのうち少なくとも1つを含むことを特徴とする付記1から9のいずれか1つに記載の公開データ決定装置。
トランザクションデータから選択された公開データを公開するデータ公開システムにおける公開データ決定装置であって、
既に公開されている前記公開データへのアクセスの履歴を示すアクセス情報を用いて、前記公開データのアクセス頻度を算出し、算出した前記アクセス頻度を用いてアクセス頻度の高い前記公開データである高頻度アクセスデータを検出する高頻度アクセス判定部と、
前記高頻度アクセスデータの属性を示す第1属性情報と、前記トランザクションデータの属性を示す第2属性情報との類似度を算出する類似度算出部と、
前記類似度に基づいて前記高頻度アクセスデータに類似する前記トランザクションデータを、追加する前記公開データとして決定するデータ選択部と、
を備えることを特徴とする公開データ決定装置。
(付記2)
前記公開データに関する情報を示すデータカタログにおける各データ項目の情報と、ユーザによって指定される検索条件とが合致する前記公開データのなかから、前記ユーザによって選択された前記公開データが前記ユーザに提供され、
前記データカタログは、前記公開データの属性を示す属性情報と、前記公開データの所在を示す情報とを含み、
前記第1属性情報は、前記高頻度アクセスデータに対応する前記データカタログにおける前記属性情報のうちの少なくとも一部であり、
前記アクセス情報は、前記ユーザに前記公開データが提供された履歴を示す情報であることを特徴とする付記1に記載の公開データ決定装置。
(付記3)
前記データ選択部が決定した、追加する前記公開データに対応する前記データカタログを、前記公開データの元になる前記トランザクションデータと前記トランザクションデータに関する情報を含むマスタデータと当該公開データに類似する前記高頻度アクセスデータの前記データカタログとを用いて生成するカタログ生成部、
を備えることを特徴とする付記2に記載の公開データ決定装置。
(付記4)
前記カタログ生成部が前記データカタログを生成すると、前記データカタログが生成されたことを前記データカタログの管理者に通知するカタログ生成通知部、
を備えることを特徴とする付記3に記載の公開データ決定装置。
(付記5)
前記アクセス頻度を用いて削除する前記公開データを決定する削除判定部、
を備えることを特徴とする付記1から4のいずれか1つに記載の公開データ決定装置。
(付記6)
公開されていないデータの公開を要求する公開要求における要求条件に基づいて、要求条件に対応する前記トランザクションデータを検索し、前記要求条件に対応する前記トランザクションデータがある場合、当該トランザクションデータを、追加する前記公開データとして決定する要求データ検索部、
を備えることを特徴とする付記1から5のいずれか1つに記載の公開データ決定装置。
(付記7)
前記類似度は、前記第1属性情報および前記第2属性情報に含まれるデータ項目ごとの、前記第1属性情報における前記データ項目の情報と前記第2属性情報における前記データ項目の情報とが一致したか否かの判定結果に基づいて算出されることを特徴とする付記1から6のいずれか1つに記載の公開データ決定装置。
(付記8)
前記トランザクションデータは、センサによって取得されたセンサデータを含むことを特徴とする付記7に記載の公開データ決定装置。
(付記9)
前記データ項目は、前記トランザクションデータの観測日時、前記センサの種類および前記センサの観測の目的のうち少なくとも1つを含むことを特徴とする付記8に記載の公開データ決定装置。
(付記10)
前記トランザクションデータは、監視カメラによって取得された映像データおよび発電プラントにおいて取得されたデータのうち少なくとも1つを含むことを特徴とする付記1から9のいずれか1つに記載の公開データ決定装置。
1,1a,1b,1c 公開データ決定装置、2 データカタログ管理装置、3 データ公開装置、4 トランザクションデータ管理装置、5 マスタデータ管理装置、6 ユーザ端末、7 管理者端末、11,21,31,43,51 送受信部、12 公開データ決定部、13 カタログ生成部、14 カタログ生成通知部、15 削除判定部、16 要求データ検索部、22 データカタログ記憶部、23 アクセス検出部、24 アクセス情報記憶部、25 編集受付部、32 公開処理部、33 公開データ記憶部、41 トランザクションデータ取得部、42 トランザクションデータ記憶部、52 マスタデータ記憶部、100,100a,100b,100c データ公開システム、121 高頻度アクセス判定部、122 類似度算出部、123 データ選択部。
Claims (13)
- トランザクションデータから選択された公開データを公開するデータ公開システムにおける公開データ決定装置であって、
既に公開されている前記公開データへのアクセスの履歴を示すアクセス情報を用いて、前記公開データのアクセス頻度を算出し、算出した前記アクセス頻度を用いてアクセス頻度の高い前記公開データである高頻度アクセスデータを検出する高頻度アクセス判定部と、
前記高頻度アクセスデータの属性を示す第1属性情報と、前記トランザクションデータの属性を示す第2属性情報との類似度を算出する類似度算出部と、
前記類似度に基づいて前記高頻度アクセスデータに類似する前記トランザクションデータを、追加する前記公開データとして決定するデータ選択部と、
を備えることを特徴とする公開データ決定装置。 - 前記公開データに関する情報を示すデータカタログにおける各データ項目の情報と、ユーザによって指定される検索条件とが合致する前記公開データのなかから、前記ユーザによって選択された前記公開データが前記ユーザに提供され、
前記データカタログは、前記公開データの属性を示す属性情報と、前記公開データの所在を示す情報とを含み、
前記第1属性情報は、前記高頻度アクセスデータに対応する前記データカタログにおける前記属性情報のうちの少なくとも一部であり、
前記アクセス情報は、前記ユーザに前記公開データが提供された履歴を示す情報であることを特徴とする請求項1に記載の公開データ決定装置。 - 前記データ選択部が決定した、追加する前記公開データに対応する前記データカタログを、前記公開データの元になる前記トランザクションデータと前記トランザクションデータに関する情報を含むマスタデータと当該公開データに類似する前記高頻度アクセスデータの前記データカタログとを用いて生成するカタログ生成部、
を備えることを特徴とする請求項2に記載の公開データ決定装置。 - 前記カタログ生成部が前記データカタログを生成すると、前記データカタログが生成されたことを前記データカタログの管理者に通知するカタログ生成通知部、
を備えることを特徴とする請求項3に記載の公開データ決定装置。 - 前記アクセス頻度を用いて削除する前記公開データを決定する削除判定部、
を備えることを特徴とする請求項1から4のいずれか1つに記載の公開データ決定装置。 - 公開されていないデータの公開を要求する公開要求における要求条件に基づいて、要求条件に対応する前記トランザクションデータを検索し、前記要求条件に対応する前記トランザクションデータがある場合、当該トランザクションデータを、追加する前記公開データとして決定する要求データ検索部、
を備えることを特徴とする請求項1から4のいずれか1つに記載の公開データ決定装置。 - 前記類似度は、前記第1属性情報および前記第2属性情報に含まれるデータ項目ごとの、前記第1属性情報における前記データ項目の情報と前記第2属性情報における前記データ項目の情報とが一致したか否かの判定結果に基づいて算出されることを特徴とする請求項1から4のいずれか1つに記載の公開データ決定装置。
- 前記トランザクションデータは、センサによって取得されたセンサデータを含むことを特徴とする請求項7に記載の公開データ決定装置。
- 前記データ項目は、前記トランザクションデータの観測日時、前記センサの種類および前記センサの観測の目的のうち少なくとも1つを含むことを特徴とする請求項8に記載の公開データ決定装置。
- 前記トランザクションデータは、監視カメラによって取得された映像データおよび発電プラントにおいて取得されたデータのうち少なくとも1つを含むことを特徴とする請求項7に記載の公開データ決定装置。
- トランザクションデータから選択された公開データを公開する公開処理部と、
既に公開されている前記公開データへのアクセスの履歴を示すアクセス情報を用いて、前記公開データのアクセス頻度を算出し、算出した前記アクセス頻度を用いてアクセス頻度の高い前記公開データである高頻度アクセスデータを検出する高頻度アクセス判定部と、
前記高頻度アクセスデータの属性を示す第1属性情報と、前記トランザクションデータの属性を示す第2属性情報との類似度を算出する類似度算出部と、
前記類似度に基づいて前記高頻度アクセスデータに類似する前記トランザクションデータを、追加する前記公開データとして決定するデータ選択部と、
を備えることを特徴とするデータ公開システム。 - トランザクションデータから選択された公開データを公開するデータ公開システムにおける公開データ決定方法であって、
既に公開されている前記公開データへのアクセスの履歴を示すアクセス情報を用いて、前記公開データのアクセス頻度を算出し、算出した前記アクセス頻度を用いてアクセス頻度の高い前記公開データである高頻度アクセスデータを検出する判定ステップと、
前記高頻度アクセスデータの属性を示す第1属性情報と、前記トランザクションデータの属性を示す第2属性情報との類似度を算出する算出ステップと、
前記類似度に基づいて前記高頻度アクセスデータに類似する前記トランザクションデータを、追加する前記公開データとして決定するデータ選択ステップと、
を含むことを特徴とする公開データ決定方法。 - トランザクションデータから選択された公開データを公開するデータ公開システムに、
既に公開されている前記公開データへのアクセスの履歴を示すアクセス情報を用いて、前記公開データのアクセス頻度を算出し、算出した前記アクセス頻度を用いてアクセス頻度の高い前記公開データである高頻度アクセスデータを検出する判定ステップと、
前記高頻度アクセスデータの属性を示す第1属性情報と、前記トランザクションデータの属性を示す第2属性情報との類似度を算出する算出ステップと、
前記類似度に基づいて前記高頻度アクセスデータに類似する前記トランザクションデータを、追加する前記公開データとして決定するデータ選択ステップと、
を実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022118195A JP2024015853A (ja) | 2022-07-25 | 2022-07-25 | 公開データ決定装置、データ公開システム、公開データ決定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022118195A JP2024015853A (ja) | 2022-07-25 | 2022-07-25 | 公開データ決定装置、データ公開システム、公開データ決定方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024015853A true JP2024015853A (ja) | 2024-02-06 |
Family
ID=89772601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022118195A Pending JP2024015853A (ja) | 2022-07-25 | 2022-07-25 | 公開データ決定装置、データ公開システム、公開データ決定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024015853A (ja) |
-
2022
- 2022-07-25 JP JP2022118195A patent/JP2024015853A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6759844B2 (ja) | 画像を施設に対して関連付けるシステム、方法、プログラム及び装置 | |
US8393002B1 (en) | Method and system for testing an entity | |
KR101934449B1 (ko) | 검색 쿼리에 응답하여 콘텐츠에 매칭될 이미지에 대해 동적 랭킹을 진행하기 위한 방법 및 시스템 | |
TWI604325B (zh) | 搜尋輔助系統與方法 | |
TWI461939B (zh) | 補充文章內容之方法、設備、電腦可讀取紀錄媒體、電腦程式產品、以及電腦系統 | |
JP5727512B2 (ja) | 検索提案のクラスタ化及び提示 | |
US8271501B2 (en) | Web search among rich media objects | |
US9116992B2 (en) | Providing time series information with search results | |
US20160055164A1 (en) | News alert system and method | |
US20090287676A1 (en) | Search results with word or phrase index | |
US20090043749A1 (en) | Extracting query intent from query logs | |
US20080021891A1 (en) | Searching a document using relevance feedback | |
JP2011520193A (ja) | 最もクリックされた次オブジェクトを有する検索結果 | |
JP6162664B2 (ja) | 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム | |
WO2017121076A1 (zh) | 信息推送方法和装置 | |
JP2009266204A (ja) | コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム | |
JP6593873B2 (ja) | 情報分析装置及び情報分析方法 | |
KR100856916B1 (ko) | 관심사를 반영하여 추출한 정보 제공 방법 및 시스템 | |
JP2011191862A (ja) | ファイル管理装置、ファイル管理システム、およびファイル管理プログラム | |
CN113688310A (zh) | 一种内容推荐方法、装置、设备及存储介质 | |
JP2007256992A (ja) | コンテンツ特定方法及び装置 | |
JP5284064B2 (ja) | 商品idサーバ装置、および商品idサーバ装置の制御方法 | |
JP2008268985A (ja) | タグを付与する方法 | |
JP2007164633A (ja) | コンテンツ検索方法及び装置及びプログラム | |
JP2006331014A (ja) | 情報提供装置、情報提供方法及び情報提供プログラム |