JP2018073116A - 検索プログラム、検索装置および検索方法 - Google Patents
検索プログラム、検索装置および検索方法 Download PDFInfo
- Publication number
- JP2018073116A JP2018073116A JP2016212018A JP2016212018A JP2018073116A JP 2018073116 A JP2018073116 A JP 2018073116A JP 2016212018 A JP2016212018 A JP 2016212018A JP 2016212018 A JP2016212018 A JP 2016212018A JP 2018073116 A JP2018073116 A JP 2018073116A
- Authority
- JP
- Japan
- Prior art keywords
- child
- parent
- name
- search
- unstructured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
[第1の実施の形態]
図1は、第1の実施の形態の検索装置を示す図である。検索装置1は、記憶部1aおよび検索部1bを有する。記憶部1aは、RAM(Random Access Memory)などの揮発性記憶装置でもよいし、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性記憶装置でもよい。検索部1bは、例えば、プロセッサである。プロセッサには、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)などを含み得る。また、検索部1bは、マルチプロセッサであってもよい。
次に、第2の実施の形態について説明する。第2の実施の形態は、サーバが記憶する関係データベースに基づいて非構造化データベースを作成し、非構造化データベースを用いて検索を可能とする。
端末装置200は、ユーザが使用するクライアントコンピュータである。端末装置200は、サーバ100から取得した検索結果を自装置に表示することができる。
図3は、サーバのハードウェア例を示す図である。サーバ100は、プロセッサ101、RAM102、HDD103、画像信号処理部104、入力信号処理部105、読み取り装置106および通信インタフェース107を有する。各ユニットがサーバ100のバスに接続されている。
次に、サーバ100の機能について説明する。
図4は、サーバの機能例を示す図である。サーバ100は、記憶部110、非構造化処理部120、定義情報作成部130、登録部140および検索部150を有する。
非構造化処理部120は、関係データベース群111を基に非構造文書を作成する。定義情報作成部130は、非構造文書に基づいて、入力定義情報113および文書関係定義情報114を作成する。登録部140は、非構造文書を非構造化データベース112に登録する。検索部150は、端末装置200から検索依頼を受信した場合、非構造化データベース112を用いて検索を行う。
図5は、非構造文書の作成処理の具体例を示す図(その1)である。図5は、顧客情報111aと出荷情報111bとが関係データベース群111に含まれることを示している。
非構造化処理部120は、正規化レベルを変えずに、顧客情報111aの各レコードを基に非構造文書400a,400bを作成する。例えば、非構造化処理部120は、顧客情報111aの顧客ID“C001”、顧客名“A社”、オーダ番号“ORDER001”のレコードを基に非構造文書400aを作成する。非構造文書400a,400bは、XML(Extensible Markup Language)形式で作成される。非構造化処理部120は、非構造文書400a,400bの開始タグと終了タグとに顧客情報111aのテーブル名“顧客情報”を追加する。
問合せ履歴111dは、問合せID、顧客ID、オーダ番号、製品ID、問合せ内容の項目を含む。問合せIDの項目は、問合せの識別子を示す。顧客IDの項目は、顧客の識別子を示す。オーダ番号の項目は、オーダ番号の識別子を示す。製品IDの項目は、製品の識別子を示す。問合せ内容の項目は、製品に対する質問や製品故障などを示す。
図7は、非構造化データベースの具体例を示す図である。登録部140は、非構造化処理部120が作成した非構造文書を非構造化データベース112に登録する。例えば、非構造化データベース112は、非構造文書400aに登録されていた情報(枠112aの内側)を有する。
非構造化データベース112は、順序性を有していなくてもよい。例えば、枠112a内の顧客情報を示す文書と枠112c内の顧客情報を示す文書とが、非構造化データベース112に連続して登録されない。
図8は、入力定義情報の例を示す図である。入力定義情報113は、入力項目、検索対象文書名/項目を含む。入力項目は、サーバ100が端末装置200から取得した検索依頼に含まれる入力項目に対応する。検索対象文書名/項目は、検索対象の文書名と当該文書名の文書に含まれる項目が検索対象の項目であることを示す。
図10は、非構造文書の作成処理の例を示すフローチャートである。例えば、非構造化処理部120は、端末装置200から非構造文書の作成指示を受信することで図10の処理を実行する。以下、図10に示す処理をステップ番号に沿って説明する。
(S14)非構造化処理部120は、テーブル名の開始タグとテーブル名の終了タグとを非構造文書に追加する。
(S16)非構造化処理部120は、全てのレコードを選択したか否かを判定する。全てのレコードを選択した場合、非構造化処理部120は、処理をステップS17に進める。全てのレコードを選択していない場合、非構造化処理部120は、処理をステップS12に進める。
(S22)定義情報作成部130は、非構造文書内から1つの項目を選択する。例えば、定義情報作成部130は、非構造文書400a内から“顧客ID”を選択する。なお、定義情報作成部130は、非構造文書内から項目を選択する場合、文書名を除外する。例えば、定義情報作成部130は、非構造文書400a内の文書名“顧客情報”を除外する。
(S26)定義情報作成部130は、入力定義情報113に入力項目、検索対象文書名/項目を登録する。例えば、ステップS21で読み込んだ非構造文書が非構造文書400a、ステップS22で選択した項目が“顧客名”の場合、定義情報作成部130は、入力定義情報113に“顧客名,顧客情報/顧客名”を登録する。
図12は、定義情報の作成処理の例を示すフローチャート(その2)である。以下、図12に示す処理をステップ番号に沿って説明する。
(S34)定義情報作成部130は、ステップS21で読み込んだ非構造文書の文書名とステップS22で選択した項目とを対応付けて退避領域に格納する。そして、定義情報作成部130は、処理をステップS35に進める。
(S42)検索部150は、入力定義情報113を参照し、入力項目に対応する検索対象文書名を特定する。
(S44)検索部150は、ステップS43の検索で条件を満たす文書を特定する。検索部150は、特定した文書に含まれる情報を取得する。
(S47)検索部150は、ステップS44で取得した情報のうち、ステップS43で検索した項目以外の他の項目と他の項目に対応する項目内容を特定する。また、ステップS47を2回以上実行する場合、検索部150は、ステップS50で取得した情報のうち、ステップS49で検索した項目以外の他の項目と他の項目に対応する項目内容を特定する。
次に、検索処理について、具体例を用いて説明する。
第2の実施の形態によれば、非構造化データベース112は、関係データベース群111に含まれるテーブルと同じ正規化レベルの複数の文書を含む。そのため、非構造化データベース112は、正規化レベルが低い非構造化データベースに比べて冗長性が少ない。すなわち、非構造化データベース112は、正規化レベルが低い非構造化データベースに比べてデータ量が少ない。サーバ100は、データ量が少ない非構造化データベース112を用いて検索することで、非構造化データベースを用いた検索を高速化できる。
1a 記憶部
1aa 非構造化データベース
1a1,1a2 親要素
1b 検索部
2 検索情報
3 検索結果
S1,S2,S3,S4,S5 ステップ
Claims (8)
- コンピュータに、
要素名と要素内容とを示す検索情報を取得し、
子要素名と子要素内容とを含む子要素を複数有する親要素が、複数格納されている非構造化データベースから、前記検索情報が示す前記要素名と前記要素内容とに一致する前記子要素名と前記子要素内容とを含む第1子要素を有する第1親要素を検索し、
前記第1親要素が有する前記子要素のうち、前記第1子要素以外の第2子要素を取得し、
前記非構造化データベースから、前記第2子要素と一致する前記子要素名と前記子要素内容とを含む前記子要素を有する、前記第1親要素以外の第2親要素を検索し、
前記第1親要素または前記第2親要素が有する前記子要素を出力する、
処理を実行させる検索プログラム。 - 前記コンピュータに、さらに、
関係データベースに基づいて、前記関係データベースと同じ正規化レベルの前記非構造化データベースを作成する処理を実行させる、請求項1に記載の検索プログラム。 - 前記非構造化データベースの生成では、前記関係データベースに含まれるテーブル内のレコードに対応する前記親要素を生成し、前記レコードに設定された値に対応する前記子要素を作成し、作成した前記子要素を、前記レコードに対応する前記親要素に含める、請求項2に記載の検索プログラム。
- 前記親要素は、親要素名を含み、
前記第1親要素の検索では、
前記親要素名と前記子要素名とを対応付けた第1定義を参照し、前記検索情報が示す前記要素名と一致する前記子要素名に対応する前記親要素名を特定し、
特定した前記親要素名と一致する前記親要素名を有する前記親要素の中から、前記第1親要素を検索する、請求項1乃至3の何れか1項に記載の検索プログラム。 - 前記第2親要素の検索では、
同じ前記子要素名の前記子要素をそれぞれが有する複数の前記親要素の前記親要素名を関係付けた第2定義を参照し、
前記第1親要素の前記親要素名と関係を有し、前記第2子要素が示す前記要素名と一致する前記子要素名を有する前記親要素の前記親要素名を特定し、
特定した前記親要素名と一致する前記親要素名を有する前記親要素の中から、前記第2親要素を検索する、請求項4に記載の検索プログラム。 - 複数の前記親要素に含まれる前記親要素名と前記子要素とに基づいて、前記第1定義と前記第2定義とを作成する、請求項5に記載の検索プログラム。
- 子要素名と子要素内容とを含む子要素を複数有する親要素を、複数格納する非構造化データベースを記憶する記憶部と、
要素名と要素内容とを示す検索情報を取得し、前記非構造化データベースから、前記検索情報が示す前記要素名と前記要素内容とに一致する前記子要素名と前記子要素内容とを含む第1子要素を有する第1親要素を検索し、前記第1親要素が有する前記子要素のうち、前記第1子要素以外の第2子要素を取得し、前記非構造化データベースから、前記第2子要素と一致する前記子要素名と前記子要素内容とを含む前記子要素を有する、前記第1親要素以外の第2親要素を検索し、前記第1親要素または前記第2親要素が有する前記子要素を出力する検索部と、
有する検索装置。 - コンピュータが、
要素名と要素内容とを示す検索情報を取得し、
子要素名と子要素内容とを含む子要素を複数有する親要素が、複数格納されている非構造化データベースから、前記検索情報が示す前記要素名と前記要素内容とに一致する前記子要素名と前記子要素内容とを含む第1子要素を有する第1親要素を検索し、
前記第1親要素が有する前記子要素のうち、前記第1子要素以外の第2子要素を取得し、
前記非構造化データベースから、前記第2子要素と一致する前記子要素名と前記子要素内容とを含む前記子要素を有する、前記第1親要素以外の第2親要素を検索し、
前記第1親要素または前記第2親要素が有する前記子要素を出力する、
検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016212018A JP6849904B2 (ja) | 2016-10-28 | 2016-10-28 | 検索プログラム、検索装置および検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016212018A JP6849904B2 (ja) | 2016-10-28 | 2016-10-28 | 検索プログラム、検索装置および検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018073116A true JP2018073116A (ja) | 2018-05-10 |
JP6849904B2 JP6849904B2 (ja) | 2021-03-31 |
Family
ID=62114225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016212018A Active JP6849904B2 (ja) | 2016-10-28 | 2016-10-28 | 検索プログラム、検索装置および検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6849904B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003256455A (ja) * | 2002-03-06 | 2003-09-12 | Nec Corp | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム |
JP2004348479A (ja) * | 2003-05-22 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 検索装置、検索方法、検索プログラム、および検索プログラム記録媒体 |
WO2008063974A2 (en) * | 2006-11-13 | 2008-05-29 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
JP2010267081A (ja) * | 2009-05-14 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法及び装置及びプログラム |
WO2012039923A2 (en) * | 2010-09-23 | 2012-03-29 | Microsoft Corporation | Data model dualization |
WO2016086973A1 (en) * | 2014-12-02 | 2016-06-09 | Longsand Limited | Unstructured search query generation from a set of structured data terms |
-
2016
- 2016-10-28 JP JP2016212018A patent/JP6849904B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003256455A (ja) * | 2002-03-06 | 2003-09-12 | Nec Corp | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム |
JP2004348479A (ja) * | 2003-05-22 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 検索装置、検索方法、検索プログラム、および検索プログラム記録媒体 |
WO2008063974A2 (en) * | 2006-11-13 | 2008-05-29 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
JP2010511925A (ja) * | 2006-11-13 | 2010-04-15 | エクセジー・インコーポレイテツド | コプロセッサを使った構造化データおよび非構造化データの高性能の統合、処理および探索の方法およびシステム |
JP2010267081A (ja) * | 2009-05-14 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法及び装置及びプログラム |
WO2012039923A2 (en) * | 2010-09-23 | 2012-03-29 | Microsoft Corporation | Data model dualization |
JP2013542501A (ja) * | 2010-09-23 | 2013-11-21 | マイクロソフト コーポレーション | データモデルの二重化 |
WO2016086973A1 (en) * | 2014-12-02 | 2016-06-09 | Longsand Limited | Unstructured search query generation from a set of structured data terms |
Non-Patent Citations (1)
Title |
---|
星野 努: "Accessシステム超リフォーム術 ポイントを抑えて楽々リフォーム", DOTNET MAGAZINE, vol. 第10巻 第8号, JPN6020043886, 1 September 2004 (2004-09-01), JP, pages 152 - 160, ISSN: 0004388804 * |
Also Published As
Publication number | Publication date |
---|---|
JP6849904B2 (ja) | 2021-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7765236B2 (en) | Extracting data content items using template matching | |
US9639542B2 (en) | Dynamic mapping of extensible datasets to relational database schemas | |
US9501474B2 (en) | Enhanced use of tags when storing relationship information of enterprise objects | |
US8275888B2 (en) | Indexing heterogeneous resources | |
US20100318567A1 (en) | Use of data patterns for rapid search of complex rules in a rules-based search engine | |
JP2009187414A (ja) | 分析用属性項目抽出プログラム、分析用属性項目抽出方法、及び情報分析装置 | |
TW202011224A (zh) | 資料查詢方法、裝置、電子設備及電腦可讀儲存媒體 | |
US20090187530A1 (en) | Enabling users to edit very large xml data | |
US20220207061A1 (en) | Technique for generating views of archived business data | |
CN105760418B (zh) | 用于对关系数据库表进行交叉列搜索的方法和系统 | |
US11244109B2 (en) | Information processing device and information processing method | |
JPWO2004097679A1 (ja) | データベース装置及び作成方法、データベース検索装置及び検索方法 | |
JP5010624B2 (ja) | 検索装置 | |
JP2013041385A (ja) | 文献検索方法、文献検索装置及び文献検索プログラム | |
US9430554B2 (en) | Object-relational mapping based on virtual columns | |
JP2009146084A (ja) | テーブル管理装置 | |
JP5488792B2 (ja) | データベース操作装置、データベース操作方法、及びプログラム | |
JP2018112919A (ja) | テスト入力情報検索装置及び方法 | |
JP6849904B2 (ja) | 検索プログラム、検索装置および検索方法 | |
US8639709B2 (en) | Comparing very large XML data | |
JP2007323546A (ja) | 検索処理方法及び装置 | |
JP2004145706A (ja) | マルチメディアデータ検索システム | |
JP6017055B2 (ja) | データ連携支援装置及びデータ連携支援方法 | |
JP5972461B2 (ja) | データ連携支援装置及びデータ連携支援方法 | |
US20200097552A1 (en) | Synonym determination device and synonym determination method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190709 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190718 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6849904 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |