JP2019139577A - データ検索方法、データ検索装置及びプログラム - Google Patents

データ検索方法、データ検索装置及びプログラム Download PDF

Info

Publication number
JP2019139577A
JP2019139577A JP2018023314A JP2018023314A JP2019139577A JP 2019139577 A JP2019139577 A JP 2019139577A JP 2018023314 A JP2018023314 A JP 2018023314A JP 2018023314 A JP2018023314 A JP 2018023314A JP 2019139577 A JP2019139577 A JP 2019139577A
Authority
JP
Japan
Prior art keywords
data
search
item
data item
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018023314A
Other languages
English (en)
Other versions
JP6852002B2 (ja
Inventor
大石 巧
Takumi Oishi
巧 大石
洋 花木
Hiroshi Hanaki
洋 花木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi GE Nuclear Energy Ltd
Original Assignee
Hitachi GE Nuclear Energy Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi GE Nuclear Energy Ltd filed Critical Hitachi GE Nuclear Energy Ltd
Priority to JP2018023314A priority Critical patent/JP6852002B2/ja
Publication of JP2019139577A publication Critical patent/JP2019139577A/ja
Application granted granted Critical
Publication of JP6852002B2 publication Critical patent/JP6852002B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】検索対象データが付加情報をもたない場合においても、データ構造が互いに異なる多種多様な情報システムを横断して検索する。【解決手段】計算機が、第1のデータと第2のデータで検索を行うデータ検索方法であって、前記第1のデータと第2のデータを読み込み、前記第1のデータのデータ項目のデータ値と、第2のデータのデータ項目のデータ値から相関分析を行って、前記第1のデータのデータ項目と前記第2のデータのデータ項目の関連度を算出して関連付け情報を生成し、検索キーワードを受け付けて、前記受け付けた検索キーワードと一致または部分一致する前記第1のデータのデータ項目を検索し、前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目で前記関連付け情報を検索し、当該第1のデータのデータ項目に関連する前記第2のデータのデータ項目を特定する。【選択図】図5

Description

本発明は、電子データ検索システムに関する。
発電所では建物や設備の設計情報、発電機器の仕様書、実体として存在する設備の構成情報、建物や設備の保全情報など多種多様で膨大な量のデータを管理する必要がある。特に原子力発電所はライフサイクルが40年やそれ以上にわたるため、発電所のデータも40年以上の長期間管理する必要がある。
ユーザが管理している膨大なデータの中から、ユーザが望むデータを迅速かつ正確に探し出せるよう、データ構造が互いに異なる情報システムを横断して検索するため、特許文献1、あるいは特許文献2に記載の技術が知られている。
特許文献1には「少なくとも日時情報が付加データとして付加された複数の検索対象データの検索を行うデータ検索システムであって、複数の検索対象データのうちから検索キーワードを含むキーワード一致データを検索し、該キーワード一致データに付加されている付加データに含まれる日時情報を連動検索キーワードとして抽出する検索手段と、複数の検索対象データのうちから連動検索キーワードと近似する付加データが付加された連動一致データが存在するかを検索する連動検索手段と、キーワード一致データ及び連動一致データを出力する出力手段と、を備えることを特徴とする。」と記載がある。
また、特許文献2には「画像に付与されている文字情報に基づいて類似画像を検索する文字検索部4と、この文字検索部4によって検索された類似画像を用いて画像の特徴情報を検出する特徴量数値化部5aと、特徴情報を用いて、さらに類似する画像を検索する画像検索部5を具備」と記載がある。
特開2013−206387号公報 特開2010−049300号公報
ライフサイクルが40年以上の長期間にわたるため、既存の発電所には古いデータが膨大に存在し、それらのデータにはそもそも付加情報(タグやメタ情報等)がない場合もある。また、同一のデータであっても、長期間のうちに法律の改正等外部要因により付与すべき付加情報そのものが変化することも考えられる。
さらに、長期間のうちに付加情報を管理する人員が交代せざるを得ないが、同一のデータであっても人により付与する付加情報が異なることが考えられる。これらの理由により、付加情報を利用するデータ検索では迅速かつ正確にデータを探し出せない場合がある。
特許文献1では、検索対象データに少なくとも日時情報が付加データとして付加されていることを前提としている。また、特許文献2では、画像データに付与されている文字情報に基づいて画像を検索している。すなわち検索対象のデータが付加情報のあるものに限定される。
そこで本発明では、検索対象データが付加情報をもたない場合においても、データ構造が互いに異なる多種多様な情報システムを横断して検索するデータ検索システムの提供を目的とする。
本発明は、プロセッサとメモリを有する計算機が、第1のデータと第2のデータで検索を行うデータ検索方法であって、前記計算機が、前記第1のデータと第2のデータを読み込む第1のステップと、前記計算機が、前記第1のデータのデータ項目のデータ値と、第2のデータのデータ項目のデータ値から相関分析を行って、前記第1のデータのデータ項目と前記第2のデータのデータ項目の関連度を算出して関連付け情報を生成する第2のステップと、前記計算機が、検索キーワードを受け付ける第3のステップと、前記計算機が、前記受け付けた検索キーワードと一致または部分一致する前記第1のデータのデータ項目を検索する第3のステップと、前記計算機が、前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目で前記関連付け情報を検索し、当該第1のデータのデータ項目に関連する前記第2のデータのデータ項目を特定する第4のステップと、を含む。
したがって、本発明は、付加情報を持たないデータに対して、ある情報システムにおいてある検索キーワードに該当するデータが存在した場合に、他の情報システムにおいてこのデータと関連するデータを特定することができるため、検索対象データが付加情報をもたない場合においても、データ構造が互いに異なる情報システムを横断して検索可能となる。
本発明の実施例1を示し、データ検索システムの機能の一例を示すブロック図である。 本発明の実施例1を示し、データ検索装置のハードウェア構成の一例を示すブロック図である。 本発明の実施例1を示し、検索キーワード入力画面の一例を示す図である。 本発明の実施例1を示し、検索結果表示画面の一例を示す図である。 本発明の実施例1を示し、データ検索装置で行われる処理の一例を示すシーケンス図である。 本発明の実施例1を示し、相関分析の一例を示すフローチャートである。 本発明の実施例1を示し、データ検索の一例を示すフローチャートである。 本発明の実施例1を示し、絞り込み検索の一例を示すフローチャートである。 本発明の実施例3を示し、検索結果のフィードバック処理の一例を示すフローチャートである。 本発明の実施例1を示し、データ項目リストの一例を示す図である。 本発明の実施例1を示し、関連付け情報表の一例を示す図である。 本発明の実施例1を示し、相関分析データテーブルの一例を示す図である。 本発明の実施例1を示し、検索対象データの一例を示す図である。 本発明の実施例1を示し、検索対象データの他の例を示す図である。 本発明の実施例4を示し、検索結果のフィードバック処理の一例を示すフローチャートである。
以下、本発明の実施形態を添付図面に基づいて説明する。
図1は本発明によるデータ検索システムの機能の一例を示すブロック図である。本データ検索システムは、データ2−1〜2−nが蓄積された業務システム1−A、1−Bと、ネットワーク16を介して業務システム1−A、1−Bに接続されたデータ検索装置100とを含む。なお、以下では業務システム1−A、1−Bを特定しない場合には、「−」以降を省略した符号「1」を使用する。他の構成要素の符号についても同様である。
データ検索装置100は、データ整形部101と、データ収集部102と、データ項目リスト103と、相関分析部104と、関連付け情報表105と、データAPI107と、データ検索部108及び相関分析データテーブル109を含む計算機である。以下、本データ検索システムの概要を説明する。
データ検索装置100は、ユーザによる業務システム1のデータ2の検索を実行する前に、まず複数の業務システム1が保持するデータ2の項目間の関連付けを行う。データ検索装置100では、外部の複数の業務システム1が保持するデータ2をデータ整形部101が読み込み、読み込んだデータに含まれる時間データで並べ替えたデータ2をデータ収集部102へ送信する。
データ収集部102は、データ2の項目のみを抽出し、データ項目リスト103に登録する。相関分析部104は、データ2の値を用いてデータ項目間の相関係数を計算することでデータ項目間の関連度を算出し、関連付け情報表105に記憶する。
データ検索装置100のユーザはGUI106から検索キーワードを入力してデータ検索を行う。データAPI107で受信した検索キーワードはデータ検索部108に送られる。データ検索部108では、検索キーワードでデータ項目リスト103全体を検索し、一致(または部分一致)するデータ項目を探す(以下、一致項目と呼ぶ)。
データ検索部108は、一致項目があった場合、業務システム1−A、1−B間を横断した検索を実行するため、さらに関連付け情報表105を一致項目で検索し、一致項目と関連度が大きいデータ項目(以下、関連項目と呼ぶ)を探す。データ検索部108は、こうして得られた、一致項目および、関連項目を検索結果としてGUI106に表示する。
このとき、データ検索部108は、一致項目と関連項目でそれぞれ外部の業務システム1を検索し、データ値を収集してGUI106に表示する。これにより、ユーザのデータ検索回数を低減し、より迅速に所望のデータが得られるよう支援することができる。
なお、業務システム1のデータ2は、各業務システム1で稼働する図示しないデータベース(DB)で管理される。
図2は、データ検索装置100のハードウェア構成の一例を示すブロック図である。データ検索装置100は、CPU10と、主記憶11と、外部記憶装置12と、ネットワークインタフェース13と、入力装置14と、出力装置15を含む計算機である。
データ検索装置100は、ネットワークインタフェース13により、外部の業務システム1とデータを送受信する。また、図1のデータ整形部101と、データ収集部102と、相関分析部104と、データAPI107と、データ検索部108のプログラムデータは主記憶11上にロードされ、CPU10で実行され、結果をGUI106へ出力する。データ項目リスト103と、関連付け情報表105は外部記憶装置12に格納される。なお、相関分析データテーブル109は、主記憶11に格納される例を示すが、外部記憶装置12に格納されても良い。
出力装置15は、ディスプレイなどで構成されてGUI106を表示する。入力装置14は、キーボードやマウスやタッチパネル等で構成されGUI106に対する操作を実施する。
CPU10は、各部のプログラムに従って処理することによって、所定の機能を提供する部として稼働する。例えば、CPU10は、データ検索プログラムに従って処理することでデータ検索部108として機能する。他のプログラムについても同様である。さらに、CPU10は、各プログラムが実行する複数の処理のそれぞれの機能を提供する部としても稼働する。計算機及び計算機システムは、これらの部を含む装置及びシステムである。
図3はユーザが検索キーワードを入力するための検索キーワード入力画面200の一例を示す図である。検索キーワード入力画面200は、検索対象となる業務システム1のリストと、それらを実際に検索対象とするか選択するボタン207と、検索キーワードの履歴を表示する領域208と、検索キーワード入力領域201と、検索キーワードの候補をプルダウンメニューで表示する領域203−1〜203−4と、絞り込み用のキーを入力する領域202と、検索ボタン204と、絞り込み実行ボタン205と、追加検索ボタン206などを含む。
図4はユーザに検索結果を表示するための検索結果表示画面210の一例を示す図である。検索結果表示画面210は、検索結果表示領域214と、検索キーワードと検索結果のデータ項目との関連度表示領域212と、ファイル出力するデータ項目の選択ボタン211と、ファイル出力実行ボタン213と、検索されたデータ項目を含んでいる元のデータベースを呼び出すためのリンクボタン215などを含む。
ファイル出力実行ボタン213は、検索結果表示領域214に表示された検索結果の一覧をCSV形式のファイルで出力する例を示すが、このファイル形式に限定されるものではない。
図5は本発明によるデータ検索システムで行われる処理の一例を示すシーケンス図である。処理は大きく2つに分けられる。1つは外部の業務システム1のデータ2を本データ検索装置100に接続してから、業務システム1−A、1−Bにまたがり、データ項目間の関連度を計算する処理である。
もう1つの処理が、ユーザがデータ検索する部分である。前者は相関分析手続き300まで、後者が検索キーワード入力301以降である。以下2つの処理を順番に説明する。
外部の業務システム1を本データ検索装置100に接続した後、本データ検索装置100は外部の業務システム1が保持するデータ2をすべて読み込み、相関分析手続き300によりデータ2間の関連度を計算する。
相関分析手続き300の詳細については図6で説明する。このデータ間の関連度の計算が終わるまでの間は、ユーザによるデータ検索を実行してもよいが、通常のキーワード検索と同等の機能を提供する。すなわち、外部の業務システム1のそれぞれに合った適切なキーワードを入力する必要がある。
ユーザが入力装置14を介して検索キーワード入力画面200から検索キーワードを入力して検索ボタン204をクリックする(301)と、検索キーワードが本データ検索装置100に入力される。データ検索手続き302により、入力された検索キーワードに一致するデータと、一致はしないが関連度が大きいデータを検索結果表示画面に表示する(303)。このデータ検索手続き302の詳細は図7で説明する。
続いてユーザは、次のデータ検索を行う(308)こともできるし、さらに絞り込み検索304を行うこともできる。また、検索結果を他の業務システム1で活用するため、ファイル出力306することもできる。
絞り込み検索304とそれに伴うフィルタリング手続き305の詳細は図8で説明する。ファイル出力306の際のフィードバック手続き307の詳細については実施例3で説明する。
なお、図5においては、説明のためGUI106とデータ検索装置100を分けて表示したが、図1、図2で示したようにGUI106は、データ検索装置100が提供するユーザインタフェースである。なお、本実施例1では、データ検索装置100のユーザがGUI106を利用する例を示したが、データ検索装置100に接続された計算機でGUI106を利用することができる。
図6は複数の業務システム1−A、1−Bの間で、データ項目間の関連度を計算する手続き300のフローチャートである。ここでは、2つの業務システム1−A、1−Bが新規に本データ検索装置100に接続された場合を説明するが、3つ以上の業務システム1が新規に接続された場合も同様である。また、すでに接続済の業務システム1がある場合に、別の業務システム1を追加する場合、接続済の業務システム1の間で再計算を行わない以外は同様である。
2つの業務システム1−A、1−Bを説明の都合上業務システムA、B(図中A、B)と呼ぶ。データ検索装置100のデータ整形部101において業務システムA、Bからそれぞれデータを読み込む(400、401)。
業務システム1のデータ2はデータ項目(データ名称)と複数のデータ値から成り、複数のデータ項目を含む。データ検索装置100では、業務システムA、Bのデータ2のそれぞれから1つずつデータ項目を選択し、2つのデータ項目からなる組を生成する。データ検索装置100は、この組をすべてのデータ項目の組み合わせについて生成し、すべての組の相関係数を算出する(402)。相関係数の算出にあたり、データ値が文字列の場合はデータ検索装置100で数値化する必要がある。
相関係数の算出については、公知または周知の技術を適用すればよく、例えば、日本工業規格JIS Z 8101−1 統計‐用語及び記号‐第1部:一般統計用語及び確率で用いられる用語の1.23項が知られている(http://kikakurui.com/z8/Z8101-1-2015-01.html)。
文字列の数値化についても、公知または周知の技術を適用すればよく、たとえば次のような方法がある。データ項目ごとに、データ値である文字列に1から順番に番号を付与する。また、文字列が完全に一致する場合は同じ番号を付与する。以下の説明において文字列に対して相関分析すると記載がある場合は上記数値化をしてから相関分析するものとする。
相関係数算出の詳細は次の通りである。説明のため、業務システムAのデータ項目をp、業務システムBのデータ項目をqとする(403)。まず、データ検索装置100のデータ収集部102は、読み込んだ項目pと項目qをすべて時間順に並べ替える(404)。
次に、データ収集部102において、項目p、項目qをその業務システム1のDBの名称とともにデータ項目リスト103に記憶する。また、データ収集部102は、項目p、qのそれぞれにつき、データ値が共に変化する変化タイミング1101(図12参照)と、変化の前後のデータ値の組み合わせ、とを抽出し、相関分析データテーブル109に格納する(405)。データ値の組み合わせは、業務システムAの変化タイミングの前後の項目pのデータ値の組み合わせ(第1の組合せ)と、業務システムBの変化タイミングの前後の項目qのデータ値の組み合わせ(第2の組合せ)である。
本実施例1の相関分析部104は、データ値が変化する時間(または時間帯)を中心に相関分析を実施する(406)。データ値の変化点だけで相関分析する理由は、異なるデータ項目を時間情報で横並びにし、そのデータ値の変化を考えたとき、関連するデータであれば同じように変化すると考えられるためである。
図12は、相関分析部104が使用する相関分析データテーブル109の一例を示す図である。相関分析データテーブル109は、変化タイミング1101と、データ項目1(項目p)のデータ値変化1102と、データ項目2(項目q)のデータ値変化1103をひとつのエントリに含む。
図示の例では、変化タイミング1101=「T3」で、項目pの値(データ値変化1102)が「1」から「3」に変化し、項目qの値(データ値変化1103)が「100」から「101」へ変化した例を示す。
相関分析部104において、項目pのデータ値が変化する変化タイミング1101と、項目pの変化の前後のデータ値の組み合わせ(データ値変化1102)と、項目qのデータ値が変化する変化タイミング1101と変化の前後のデータ値の組み合わせ(データ値変化1103)を用いて相関係数を計算し、この相関係数の値を項目pと項目qの関連度とする(406)。最後に相関分析部104は、項目pと項目qと関連度を関連付け情報表105に記憶する(407)。
データ検索装置100は、業務システムAのデータ項目と、業務システムBのデータ項目の全ての組合せについて、上記ステップ400〜407の処理を繰り返して実行する。
上記処理によって、業務システムAのデータ項目の値と、業務システムBのデータ項目の値を時系列でソートされ、業務システムA、Bの2つの値が共に変化する時刻または時間帯が抽出され、データ検索装置100は、2つの値の相関係数を算出して関連度とする。そして、データ検索装置100は、業務システムAのデータ項目と、業務システムBのデータ項目と、関連度を関連付け情報表105に格納していく。関連付け情報表105には、同じ時間帯や同じ時刻に値が変化したデータ項目の組合せが関連度と共に格納される。
なお、2つのデータ項目の値が共に変化する変化タイミング1101は、同一の時刻に限定されるものではなく、所定の時間帯(5分間、1時間、1日)など検索対象となるデータ2の内容や性質に応じて適宜設定されるものである。
図7はユーザ入力によるデータ検索手続き302を実施するフローチャートである。データ検索装置100のユーザは検索キーワード入力画面200において、検索キーワード入力領域201に検索キーワードを入力するか、または、本データ検索装置100が提示する候補リスト203から検索の候補を選択する(500)。
検索キーワード入力画面200の候補リスト203は、たとえば、データ項目リスト103を参照して生成する。この時、ユーザが業務システム1−A、1−Bを指定して、検索の候補となるデータ項目リスト103を指定することもできる。これら、GUI106へ入力された検索キーワード、または検索の候補はデータAPI107で受信され、データ検索部108へ送られる。
データ検索部108において、受信した検索キーワード、または検索の候補でデータ項目リスト103全体を検索する(501)。ステップ502では、データ検索部108が検索キーワードまたは検索の候補でヒットしたデータ項目の有無を判定する(502)。検索結果のデータ項目がない場合には、ステップ500へ戻ってユーザに再度検索キーワードを入力してもらう。
検索の結果、1つ、または複数のデータ項目名1000(図10参照)、業務システム1のDB名称1001が得られた場合、データ検索部108は、ステップ503へ進んで、検索結果のデータ項目名1000と業務システム1のDB名称1001で関連付け情報表105を検索する。
データ検索部108は、関連付け情報表105のデータ項目900とデータ項目900の業務システム1のDB名称901を検索し、2つとも検索結果と一致する場合には、さらなるデータ項目902とその業務システム1のDB名称903と、関連度904を取得する。
ステップ504では、データ検索部108が、ステップ503で取得した関連度904があらかじめ決められた閾値以上か否かを判定する。関連度904が閾値以上の場合、ステップ505へ進み、そうでない場合には、ステップ500へ戻って上記処理を繰り返す。なお、関連度904が未満の場合には、検索キーワードに関連するデータ項目が無かったことをGUI106へ出力しても良い。
ステップ505では、データ検索部108が、関連付け情報表105から取得した該当するデータ項目902と業務システム1のDB名称903を関連度904とともに検索結果表示画面210を生成してGUI106へ出力する。このとき、関連度904の大きな順に並び替えて出力することもできる。また、検索キーワード、または検索の候補に一致したデータ項目とその業務システム1のDB名称も検索結果として出力してもよい。
データ検索部108は、これらデータ項目900、902と業務システム1のDB名称901、903を検索キーワードとして外部の業務システム1を検索し(図5のステップ302)、得られたデータ値を検索結果表示画面210に出力する(図5のステップ303)。これら検索結果の一例が図4の検索結果表示画面210である。
上記処理によって、データ検索装置100は、受け付けた検索キーワード(または検索候補)でデータ項目リスト103を検索し、データ項目名1000と一致する場合には、当該データ項目名1000とDB名称1001で関連付け情報表105を検索して、関連度904が閾値以上のデータ項目902とDB名称903を取得する。
そして、データ検索部108は、業務システム1のDB名称901、903からデータ項目900、902のデータ値を取得して検索結果表示画面210に出力する。これにより、検索対象データが付加情報を持たない場合においても、データ構造が互いに異なる多種多様な業務システム1を横断して検索することが可能となる。
図8は、検索結果に対して、ユーザ入力による絞り込み検索304(図5)を実施するフローチャートである。この処理は、図7の検索処理の後に、所定の操作で検索キーワード入力画面200を出力装置15(GUI106)に表示させてから実行される。あるいは、検索キーワード入力画面200の下方に検索結果表示画面210を表示するようにしてもよい。
ユーザが検索キーワード入力画面200において、絞り込み入力領域202に絞り込みキーを入力し、絞り込み実行ボタン205をクリックすると、データAPI107がGUI106から絞り込みキーを受信する(600)。
続いて、データ検索部108は、検索結果表示領域214から、絞り込みキーに一致するデータ項目を選択する(601)。最後に、データ検索部108は、選択されたもののみを検索結果表示領域214に表示し、選択されなかったものを検索結果表示領域214から削除する(602、図5のステップ305)。
図10はデータ項目リスト103の一例である。データ収集部102が外部の業務システム1からデータ2を読み込んで抽出したデータ項目1000と、当該業務システム1のDB名称(DB名)1001とを組にして保持するテーブルである。
図11は関連付け情報表105の一例である。異なる業務システム1−A、1−Bから選択した2つのデータのそれぞれについて、業務システム1−Aのデータ項目(データ名称)900と業務システム1−AのDB名称901と、業務システム1−Bのデータ項目(データ名称)902と業務システム1−BのDB名称903と、データ項目900、902の間の関連度904と、関連度の補正値905、をひとつのエントリに格納する。
関連度904は、値が1に近づくほどデータ項目900、902間の関連性が高いことを示す。また、関連度の補正値905は、1.0〜−1.0の範囲の値となる。
図13と図14は外部の業務システム1が保持するデータ2の一例である。本実施例1では、検索対象のデータとして、時刻や日付あるいはタイムスタンプ等の時系列情報と、データ項目名と、時系列情報に対応するデータ項目の値を含んでいれば良い。
以上のように、本実施例1では、データ収集部102が検索対象の業務システム1のデータ2を読み込んで、データ項目名1000と、データ2を格納するDB名1001を収集してデータ項目リスト103を生成する。
次に、データ収集部102は、業務システム1−Aのデータ項目と、業務システム1−Bのデータ項目のそれぞれについて時系列でソートしてから、データ値が共に変化する変化タイミング1101を検出し、変化の前後のデータ値の組み合わせを抽出して相関分析データテーブル109を生成する。
そして、相関分析部104は、データ値から業務システム1−Aのデータ項目と、業務システム1−Bのデータ項目の関連度を算出して関連付け情報表105を生成する。
このように、2つのデータ値が共に変化する変化タイミング1101を検出して、関連度904を算出することにより、検索対象データが付加情報をもたない場合においても、データ構造が互いに異なる多種多様な業務システムを横断して検索する情報を生成することができる。
そして、データ検索装置100は、受け付けた検索キーワードでデータ項目リスト103を検索し、データ項目名1000と一致する場合には、当該データ項目名1000とDB名称1001で関連付け情報表105を検索して、関連度904が閾値以上のデータ項目902とDB名称903を取得する。
そして、データ検索部108は、業務システム1−A、1−BのDB名称901、903からデータ項目900、902のデータ値を取得して検索結果表示画面210に出力する。これにより、検索対象データが付加情報を持たない場合においても、データ構造が互いに異なる多種多様な業務システム1を横断して検索することが可能となる。
本実施例2では、データ検索装置100のユーザが望むデータをより迅速に探し出せるように実施例1の検索、表示機能を拡張する例を示す。以下、特段の説明がない場合は実施例1と同様とする。
実施例1の図5で説明したように、データ検索装置100ではユーザが1度検索を実行した後に検索結果表示領域214(図4)に対して絞り込み検索304を行うこともできる。この絞り込み検索304の前や後に、さらに広く検索を行うため検索キーワードを追加して検索する、追加検索を実行する。
検索結果表示領域214を参考にしつつこの追加検索と絞り込み検索を複数回繰り返し実行することでユーザは望むデータをより迅速に探し出すことが可能となる。以下追加検索について説明する。
追加検索は、図3に示した検索キーワード入力画面200において、検索キーワード入力領域201に追加で検索したい追加検索キーワードを入力し、追加検索ボタン206を押下することで実行される。この追加検索キーワード202はまったく新たなキーでも可能だが、通常は検索結果のうち、さらに詳細に調べたい検索キーワードを選択して入力する。追加検索の実行手順は前記実施例1の図7と同様であり、異なる点は前回の検索結果表示領域214の結果を破棄せずに維持し、これに加えて追加検索結果を出力することである。
また、図4の検索結果表示画面210においてリンクボタン215を押下することで、図13や図14のような、検索されたデータ項目を含んでいる元のデータベース(業務システム1のデータ2)を呼び出すことも可能となる。
元のデータベースに存在しているデータ項目を追加検索キーワードとして追加検索も可能である。すなわち、リンクボタン215と追加検索ボタン206を組合せて検索することで、関連度の高いキーワードをたどってデータ検索が可能となる。
本実施例3では、データ検索装置100のユーザの入力履歴を活用し、実施例1または実施例2の検索機能の精度向上を図る例を示す。以下、特段の説明がない場合は実施例1または実施例2と同様とする。
実施例1の図5で説明したように、ユーザが1度検索を実行した後、次のデータ検索を行う(308)こともできるし、さらに絞り込み検索304を行うこともできる。また、検索結果124を他の業務システム1で活用するため、ファイル出力306を実施することもできる。ファイル出力306の際のフィードバック手続き307の詳細について説明する。
図9はユーザによる検索結果をもとに、データ項目間の関連付け情報表105を更新するフィードバック手続き307のフローチャートである。ユーザが検索結果表示画面210において、ファイル出力実行ボタン213をクリックし(図5の306)、データAPI107がCSV出力要求を受信する(700)。
データ検索装置100のデータ検索部108は、ユーザが検索結果表示画面210上で、選択ボタン211によって選択したデータ項目に正の補正値、たとえば+0.1点を、選択しなかったデータ項目に負の補正値、たとえば−0.1点を与える(701)。この時、ユーザごとに点数を可変にしてもよい。たとえば、ユーザが熟練者であれば、検索結果の選択が正解とみなして重みを増して+0.3点、−0.3点とすることが可能である。最後に、図11の関連付け情報表105において、前記データ項目に該当するエントリの補正値905に前記補正値を加算する(702)。
この補正値905は、ユーザの入力によるデータ検索手続き302で適用する。具体的には図7のフローチャートの手続き504において、検索の結果得られた関連度904に補正値905を加算してから閾値と比較する。こうすることにより、検索結果に対するユーザの判断結果をデータ項目間の関連付けに反映して、検索精度の向上が可能となる。
なお、ユーザが熟練者か否かの判定は、ユーザの識別子に応じてユーザの属性を予め設定したテーブルを用いれば良く、ユーザの属性に応じて閾値を補正する値を変更することができる。なお、ユーザの属性に応じて閾値を変更してもよい。
実施例1において、図7で説明した、検索結果として出力するデータ項目の範囲を決める閾値を、ユーザの入力履歴を活用し変更する手順を説明する。
閾値を増やすと、検索結果表示画面210に出力するデータ項目の数が減り、閾値を減らすと、検索結果表示画面210に出力するデータ項目の数が増える。閾値を変化させ、出力するデータ項目数を適切に保つことにより、ユーザがCSV出力するデータを選択する負荷を軽減することが可能となる。
図15はその具体的手順を示すフローチャートである。データ検索装置100のユーザが検索結果表示画面210において、ファイル出力実行ボタン213をクリックした際に、ユーザが選択ボタン211により選択したデータ項目数が、あらかじめ定めた同時選択限度数未満の場合は閾値を0.01減らし、同時選択限度数以上の場合は閾値を0.01増やす。これにより、ユーザの入力履歴をステップ504の判定処理にフィードバックすることができる。
<まとめ>
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。
また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
1−A、1−B 業務システム
2−1〜2−n データ
100 データ検索装置
101 データ整形部、
102 データ収集部
103 データ項目リスト
104 相関分析部
105 関連付け情報表
107 データAPI
108 データ検索部
109 相関分析データテーブル

Claims (13)

  1. プロセッサとメモリを有する計算機が、第1のデータと第2のデータで検索を行うデータ検索方法であって、
    前記計算機が、前記第1のデータと前記第2のデータを読み込む第1のステップと、
    前記計算機が、前記第1のデータのデータ項目のデータ値と、第2のデータのデータ項目のデータ値から相関分析を行って、前記第1のデータのデータ項目と前記第2のデータのデータ項目の関連度を算出して関連付け情報を生成する第2のステップと、
    前記計算機が、検索キーワードを受け付ける第3のステップと、
    前記計算機が、前記受け付けた検索キーワードと一致または部分一致する前記第1のデータのデータ項目を検索する第3のステップと、
    前記計算機が、前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目で前記関連付け情報を検索し、当該第1のデータのデータ項目に関連する前記第2のデータのデータ項目を特定する第4のステップと、
    を含むことを特徴とするデータ検索方法。
  2. 請求項1に記載のデータ検索方法であって、
    前記第1のデータと第2のデータは、時系列情報をそれぞれ含み、
    前記第2のステップは、
    前記第1のデータと第2のデータのデータ値を前記時系列情報の順序でソートして、前記第1のデータのデータ値と前記第2のデータのデータ値が共に変化するタイミングを抽出するステップと、
    前記第1のデータの前記データ値の変化タイミングの前のデータ値と、変化タイミングの後のデータ値を第1の組として生成するステップと、
    前記第2のデータの前記データ値の変化タイミングの前のデータ値と、変化タイミングの後のデータ値を第2の組として生成するステップと、
    前記第1の組と前記第2の組の相関係数を算出し、当該相関係数を前記関連度とするステップと、
    を含むことを特徴とするデータ検索方法。
  3. 請求項1に記載のデータ検索方法であって、
    前記第4のステップは、
    前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目と前記第2のデータのデータ項目の前記関連度が、所定の閾値以上の関連度のデータ項目を特定することを特徴とするデータ検索方法。
  4. 請求項1に記載のデータ検索方法であって、
    前記計算機が、前記特定された第2のデータのデータ項目と関連する前記第1のデータのデータ項目を出力する第5のステップと、
    前記計算機が、前記出力された前記第1のデータのデータ項目と前記第2のデータのデータ項目の選択を受け付ける第6のステップと、
    前記計算機が、前記選択されたデータ項目の前記関連度に正の値を補正し、前記選択されなかったデータ項目の前記関連度に負の値を補正する第7のステップと、
    をさらに含むことを特徴とするデータ検索方法。
  5. 請求項3に記載のデータ検索方法であって、
    前記計算機が、前記特定された第2のデータのデータ項目と関連する前記第1のデータのデータ項目を出力する第5のステップと、
    前記計算機が、前記出力された前記第1のデータのデータ項目と前記第2のデータのデータ項目の選択を受け付ける第6のステップと、
    前記計算機が、前記選択の有無に応じて前記閾値を変更する第8のステップと、
    をさらに含むことを特徴とするデータ検索方法。
  6. 請求項3に記載のデータ検索方法であって、
    前記計算機が、ユーザの識別子を受け付けて、前記識別子に応じて予め設定された属性を取得し、当該属性に応じて前記閾値を変更する第9のステップと、
    をさらに含むことを特徴とするデータ検索方法。
  7. プロセッサとメモリを有して、第1のデータと第2のデータで検索を行うデータ検索装置であって、
    前記第1のデータと前記第2のデータを読み込んで、前記第1のデータのデータ項目のデータ値と、第2のデータのデータ項目のデータ値から相関分析を行って、前記第1のデータのデータ項目と前記第2のデータのデータ項目の関連度を算出して関連付け情報を生成する相関分析部と、
    検索キーワードを受け付けて、前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目を検索し、前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目で前記関連付け情報を検索し、当該第1のデータのデータ項目に関連する前記第2のデータのデータ項目を特定する検索部と、
    を有することを特徴とするデータ検索装置。
  8. 請求項7に記載のデータ検索装置であって、
    前記第1のデータと第2のデータは、時系列情報をそれぞれ含み、
    前記相関分析部は、
    前記第1のデータと第2のデータのデータ値を前記時系列情報の順序でソートして、前記第1のデータのデータ値と前記第2のデータのデータ値が共に変化するタイミングを抽出し、
    前記第1のデータの前記データ値の変化タイミングの前のデータ値と、変化タイミングの後のデータ値を第1の組として生成し、
    前記第2のデータの前記データ値の変化タイミングの前のデータ値と、変化タイミングの後のデータ値を第2の組として生成し、
    前記第1の組と前記第2の組の相関係数を算出し、当該相関係数を前記関連度とすることを特徴とするデータ検索装置。
  9. 請求項7に記載のデータ検索装置であって、
    前記検索部は、
    前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目と前記第2のデータのデータ項目の前記関連度が、所定の閾値以上の関連度のデータ項目を特定することを特徴とするデータ検索装置。
  10. 請求項7に記載のデータ検索装置であって、
    前記検索部は、
    前記特定された第2のデータのデータ項目と関連する前記第1のデータのデータ項目を出力し、前記出力された前記第1のデータのデータ項目と前記第2のデータのデータ項目の選択を受け付けて、前記選択されたデータ項目の前記関連度に正の値を補正し、前記選択されなかったデータ項目の前記関連度に負の値を補正することを特徴とするデータ検索装置。
  11. 請求項9に記載のデータ検索装置であって、
    前記検索部は、
    前記特定された第2のデータのデータ項目と関連する前記第1のデータのデータ項目を出力し、前記出力された前記第1のデータのデータ項目と前記第2のデータのデータ項目の選択を受け付けて、前記選択の有無に応じて前記閾値を変更することを特徴とするデータ検索装置。
  12. 請求項9に記載のデータ検索装置であって、
    前記検索部は、
    ユーザの識別子を受け付けて、前記識別子に応じて予め設定された属性を取得し、当該属性に応じて前記閾値を変更することを特徴とするデータ検索装置。
  13. プロセッサとメモリを有する計算機で、第1のデータと第2のデータの検索を実行させるプログラムであって、
    前記第1のデータと前記第2のデータを読み込む第1のステップと、
    前記第1のデータのデータ項目のデータ値と、第2のデータのデータ項目のデータ値から相関分析を行って、前記第1のデータのデータ項目と前記第2のデータのデータ項目の関連度を算出して関連付け情報を生成する第2のステップと、
    検索キーワードを受け付ける第3のステップと、
    前記受け付けた検索キーワードと一致または部分一致する前記第1のデータのデータ項目を検索する第3のステップと、
    前記検索キーワードと一致または部分一致する前記第1のデータのデータ項目で前記関連付け情報を検索し、当該第1のデータのデータ項目に関連する前記第2のデータのデータ項目を特定する第4のステップと、
    を前記計算機に実行させるためのプログラム。
JP2018023314A 2018-02-13 2018-02-13 データ検索方法、データ検索装置及びプログラム Active JP6852002B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018023314A JP6852002B2 (ja) 2018-02-13 2018-02-13 データ検索方法、データ検索装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018023314A JP6852002B2 (ja) 2018-02-13 2018-02-13 データ検索方法、データ検索装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019139577A true JP2019139577A (ja) 2019-08-22
JP6852002B2 JP6852002B2 (ja) 2021-03-31

Family

ID=67694082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018023314A Active JP6852002B2 (ja) 2018-02-13 2018-02-13 データ検索方法、データ検索装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6852002B2 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0454564A (ja) * 1990-06-21 1992-02-21 Nippon Telegr & Teleph Corp <Ntt> 重み学習型テキストベース検索装置
JPH08234832A (ja) * 1995-02-24 1996-09-13 Toshiba Corp プラント監視診断装置および方法
JPH09101991A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JP2002149471A (ja) * 2000-11-15 2002-05-24 Mitsubishi Gas Chem Co Inc ファイルシステム
JP2003271656A (ja) * 2002-03-19 2003-09-26 Fujitsu Ltd 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
JP2005346239A (ja) * 2004-06-01 2005-12-15 Ntt Data Corp 類似症例検索システム及びプログラム
JP2017021634A (ja) * 2015-07-13 2017-01-26 トヨタ自動車株式会社 データ処理装置およびデータ処理方法
JP2017041086A (ja) * 2015-08-19 2017-02-23 キヤノン株式会社 情報処理装置、システム、情報処理方法及びプログラム
JP2017129919A (ja) * 2016-01-18 2017-07-27 富士通株式会社 データ処理装置、データ処理方法およびデータ処理プログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0454564A (ja) * 1990-06-21 1992-02-21 Nippon Telegr & Teleph Corp <Ntt> 重み学習型テキストベース検索装置
JPH08234832A (ja) * 1995-02-24 1996-09-13 Toshiba Corp プラント監視診断装置および方法
JPH09101991A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JP2002149471A (ja) * 2000-11-15 2002-05-24 Mitsubishi Gas Chem Co Inc ファイルシステム
JP2003271656A (ja) * 2002-03-19 2003-09-26 Fujitsu Ltd 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
JP2005346239A (ja) * 2004-06-01 2005-12-15 Ntt Data Corp 類似症例検索システム及びプログラム
JP2017021634A (ja) * 2015-07-13 2017-01-26 トヨタ自動車株式会社 データ処理装置およびデータ処理方法
JP2017041086A (ja) * 2015-08-19 2017-02-23 キヤノン株式会社 情報処理装置、システム、情報処理方法及びプログラム
JP2017129919A (ja) * 2016-01-18 2017-07-27 富士通株式会社 データ処理装置、データ処理方法およびデータ処理プログラム

Also Published As

Publication number Publication date
JP6852002B2 (ja) 2021-03-31

Similar Documents

Publication Publication Date Title
US9195952B2 (en) Systems and methods for contextual mapping utilized in business process controls
EP2631815A1 (en) Method and device for ordering search results, method and device for providing information
US9990268B2 (en) System and method for detection of duplicate bug reports
CN113204621A (zh) 文档入库、文档检索方法,装置,设备以及存储介质
JP5281104B2 (ja) 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体
JP2007011604A (ja) 不具合診断システム及びプログラム
JPWO2019123703A1 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
JP2019219848A (ja) ソースコード解析方法およびソースコード解析装置
US11244000B2 (en) Information processing apparatus and non-transitory computer readable medium storing program for creating index for document retrieval
JP5439235B2 (ja) 文書分類方法、文書分類装置、およびプログラム
JP7015320B2 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
JP6852002B2 (ja) データ検索方法、データ検索装置及びプログラム
JP2019148859A (ja) フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法
JP2018060379A (ja) 検索手段選択プログラム、検索手段選択方法及び検索手段選択装置
JP6668271B2 (ja) 業務仕様分析支援装置、業務仕様分析支援方法、及びプログラム
US8775873B2 (en) Data processing apparatus that performs test validation and computer-readable storage medium
JP6639749B1 (ja) 検索装置、検索方法および機械学習装置
JPWO2009008129A1 (ja) 開発書類データ管理装置、開発書類データ管理システム、開発書類データ管理方法及び、そのプログラム並びに記憶媒体
CN111723286A (zh) 一种数据处理的方法及装置
JP2018181121A (ja) 分析装置、分析プログラム及び分析方法
JP2014241056A (ja) 設計書修正支援方法および設計書修正支援システム
JP2011227655A (ja) 情報検索システム、情報検索方法およびプログラム
JP7338298B2 (ja) 関連性評価方法、関連性評価装置、プログラム
US20230359658A1 (en) Business matching support device, business matching support method, and program
JP2018106398A (ja) テスト支援プログラムおよびテスト支援装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210310

R150 Certificate of patent or registration of utility model

Ref document number: 6852002

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150