JP2020042722A - Data search system and data searching program - Google Patents
Data search system and data searching program Download PDFInfo
- Publication number
- JP2020042722A JP2020042722A JP2018171603A JP2018171603A JP2020042722A JP 2020042722 A JP2020042722 A JP 2020042722A JP 2018171603 A JP2018171603 A JP 2018171603A JP 2018171603 A JP2018171603 A JP 2018171603A JP 2020042722 A JP2020042722 A JP 2020042722A
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- unit
- file
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 12
- 240000000220 Panda oleosa Species 0.000 description 6
- 235000016496 Panda oleosa Nutrition 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
この発明は、データ検索システム及びデータ検索用プログラムに関するものである。 The present invention relates to a data search system and a data search program.
従来、大量データを擁するリレーショナルデータベースなどのデータベースシステムにおいて曖昧検索を行う場合には、極めて多くの時間を要するという問題があった。 Heretofore, there has been a problem that it takes an extremely long time to perform an ambiguous search in a database system such as a relational database having a large amount of data.
特許文献1には、全文検索エンジンとRDB(リレーショナルデータベース)を用いて高速検索前処理の状態情報を用いることで、検索時間を短縮することができる文書検索装置が開示されている。 Patent Document 1 discloses a document search device that can reduce a search time by using state information of high-speed search preprocessing using a full-text search engine and an RDB (relational database).
具体的には、複数の文書とフォルダに対し、パターンマッチング部と全文検索部とを備えて、検索対象の種類と状態とを判断して、上記パターンマッチング部と全文検索部とのいずれかにより検索を行うというものである。この特許文献1の発明は、パターンマッチング部は即時検索可能であるが検索時間がかかるというという特徴があり、全文検索部は登録に時間がかかるが検索時間が高速であるという特徴があることに鑑み、これらを切換えてそれぞれを有利な場面で使用するものである。 Specifically, a pattern matching unit and a full-text search unit are provided for a plurality of documents and folders, and the type and state of the search target are determined, and one of the pattern matching unit and the full-text search unit is used. Searching. The invention of Patent Literature 1 is characterized in that the pattern matching unit can perform an immediate search but takes a long search time, and the full-text search unit has a feature that the registration takes a long time but the search time is fast. In view of this, these are switched and each is used in an advantageous situation.
特許文献2には、複数のクライアントと通信可能な全文検索エンジンは文書登録時に全文検索エンジンが文書へのアクセス権を有するクライアントの識別符号(ユーザID)に制御文字(例えば区切り文字)を付加した文字列を上記文書と共に格納すること、また、全文検索エンジンは文書へのアクセス要求時に検索語に対して上記アクセス要求したクライアントの識別符号に上記制御文字を付与した文字列を追加して全文検索を実行することが、開示されている。 According to Patent Document 2, a full-text search engine capable of communicating with a plurality of clients adds a control character (for example, a delimiter) to an identification code (user ID) of a client having access to the document when the document is registered. The character string is stored together with the document, and the full-text search engine adds a character string obtained by adding the control character to the identification code of the client that has made the access request to the search word when the document is requested to be accessed for full-text search. Is disclosed.
更に上記特許文献2の発明では、全文検索エンジンが、文書本体とは別に当該文書の属性値を格納するカラムを有しており、全文検索エンジンは、文書登録時にクライアントの識別符号と制御文字とからなる文字列を文書の属性値としてカラムに格納し、文書へのアクセス要求時に前記アクセス要求したクライアントの識別符号に制御文字を付与した文字列を上記カラムに対する検索語として全文検索する。以上により、全文検索と共にアクセス制御が同時にできることになる、というものである。 Further, in the invention of Patent Document 2, the full-text search engine has a column for storing the attribute value of the document separately from the document main body. Is stored in a column as an attribute value of the document, and a full-text search is performed as a search term for the column by using a character string in which a control character is added to the identification code of the client who has made the access request when the document is requested to be accessed. As described above, the access control can be performed simultaneously with the full-text search.
また、特許文献3には、金融情報検索システムとして、各銘柄について記載された文書データを保持する文書DBを所定タイミングでクローリングして全文検索用の文書インデックスを作成するクローラを備える検索エンジンが開示されている。この検索エンジンは更に、営業端末から受け付けた検索要求に対して文書インデックスからマッチする文書データに係るレコードのうち、上位の所定の件数を検索結果として応答する検索処理部を有しており、営業端末から受け付けた検索要求においてキーワードの指定がなされていない場合に、検索エンジンによる検索ではなく、文書DBに対して直接に検索処理を行うDB検索部を有するというものである。 Patent Document 3 discloses, as a financial information search system, a search engine including a crawler that crawls a document DB holding document data describing each brand at a predetermined timing and creates a document index for full-text search. Have been. The search engine further includes a search processing unit that responds to the search request received from the sales terminal with a predetermined number of high-order records as search results among records related to the document data that matches from the document index. If a keyword is not specified in a search request received from a terminal, a DB search unit that performs a search process directly on the document DB, instead of a search by a search engine, is provided.
上記特許文献3の発明によれば、検索エンジンによる検索の際にキーワードが指定されていない場合においても、検索結果に対するソートの条件で上位の所定件数に入り得るデータが漏れずに表示されるようになる、という効果を奏することになる。 According to the invention of Patent Literature 3, even when a keyword is not specified at the time of a search by a search engine, data that can be included in a predetermined number of upper ranks in a sort condition for search results is displayed without omission. Will be achieved.
更に、特許文献4には、入力部によって入力されたユーザ指定の検索キーワードのデータ構造上の特徴(データ型等)を解析するデータ型解析部と、リレーショナルデータベースに格納されている検索の対象となるテーブルの各カラムのうち、上記解析された検索キーワードのデータ構造上の特徴(データ型等)に合致するカラムを、上記検索対象列として検出する検索対象列検出部とを備える検索対象列決定装置が開示されている。 Further, Patent Literature 4 discloses a data type analysis unit that analyzes a data structure characteristic (such as a data type) of a user-specified search keyword input by an input unit, and a search target stored in a relational database. A search target column detection unit that detects, as the search target column, a column that matches a data structure characteristic (such as a data type) of the analyzed search keyword among the columns of the table. An apparatus is disclosed.
上記特許文献4の発明は、検索キーワードのデータ構造上の特徴から全文検索の対象とすべきカラムを動的に絞ることにより、全文検索時の応答性能を向上させるというものである。 The invention of Patent Document 4 described above improves response performance at the time of full-text search by dynamically narrowing columns to be subjected to full-text search based on characteristics of the data structure of a search keyword.
本発明は、上記のような検索システムより以上に高速な検索を可能とするデータ検索システム及びデータ検索用プログラムを提供することを目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a data search system and a data search program that enable a higher-speed search than the above search system.
本発明に係るデータ検索システムは、管理対象データが蓄積されたデータベースと、前記データベースを検索し、前記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段と、検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段と、前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段と、情報を表示する表示手段と、前記データベース検索手段が取り出したデータに基づく表示を前記表示手段に行う表示制御手段とを具備することを特徴とする。 A data search system according to the present invention searches a database in which data to be managed is stored and the database, identifies a table that is one unit of the data to be managed, and provides a unique value for all identified tables. Is used as primary key information to create a first index table in which search target information in the content data of the corresponding table is attributed to the primary key information as attribute information, and a first index that summarizes the first index table is created. Given first crawler collecting means for generating a file and a keyword to be searched, the first index file is searched to find a first index table including data corresponding to the keyword, and Primary key information obtaining means for obtaining primary key information of a first index table; A database search unit that searches the database based on the primary key information obtained by the key information acquisition unit and retrieves data corresponding to the keyword from the obtained table, a display unit that displays information, and the database search unit. Display control means for performing display based on the extracted data on the display means.
以下添付図面を参照して、本発明に係るデータ検索システム及びデータ検索用プログラムの実施形態を説明する。各図において、同一の構成要素には同一の符号を付して重複する説明を省略する。図1には、本発明に係るデータ検索システムの実施形態の構成図が示されている。実施形態に係るデータ検索システムは、種々のデータが蓄積されたデータベース300と、このデータベース300の全ての文の検索を行う全文検索エンジン500とが備えられている。データベース300としては、例えばリレーショナルデータベースを採用することができる。
Hereinafter, an embodiment of a data search system and a data search program according to the present invention will be described with reference to the accompanying drawings. In the respective drawings, the same components are denoted by the same reference numerals, and redundant description will be omitted. FIG. 1 shows a configuration diagram of an embodiment of a data search system according to the present invention. The data search system according to the embodiment includes a
ここでは、データベース300が蓄積している管理対象データが商品カタログのデータであり、例えば、図2に示されるように1単位の管理対象データのテーブルD11、D12、D13、・・・、D1nが蓄積されている。1つのテーブルについては、ユニークな値に対し、必要な項目が複数配置された構造を有する。本実施形態では、ユニークな値はテーブルの先頭に配置されている商品番号であり、各テーブルD11、D12、D13、・・・、D1nには、項目のデータとして、「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・と並んでいる。なお、項目内のデータの並び順は、例示に過ぎない。
Here, the management target data stored in the
全文検索エンジン500には、第1のクローラ収集手段503が備えられている。第1のクローラ収集手段503は、上記データベース300を検索し、上記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイル501を生成するものである。
The full-
既に説明したように、データベース300のテーブルD11には、商品番号と、項目のデータとして、「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・が記憶されているので、第1のクローラ収集手段503は上記「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・というデータから、SQL(Structured Query Language)で指定した検索対象情報に該当する文字列の項目(カラム)の情報を検索して、帰属情報として帰属させて第1のインデックステーブルを作成する。
As described above, in the table D11 of the
図3に、テーブルD11から第1のインデックステーブルD41を作成する過程を示す。ここでは、SQLにより指定された検索対象情報に「商品番号」「商品名」「商品カナ」が該当したことを示す。テーブルD12〜D1nについても同様に検索が行われ、SQLにより指定された検索対象情報に該当する情報が項目(カラム)に含まれていたテーブルに対応してインデックステーブルが作成される。従って、テーブルD11〜D1nの全てについてインデックステーブルが作成される訳ではない。例えば、テーブルD12には、SQLにより指定された検索対象情報の「商品番号」「商品名」「商品カナ」が含まれていないので、このテーブルに対応するインデックステーブルは作成されない。以上のようにして作成された幾つかのインデックステーブルが全て1つにまとめられて第1のインデックスファイル501とされる。
FIG. 3 shows a process of creating the first index table D41 from the table D11. Here, it is indicated that “product number”, “product name”, and “product kana” correspond to the search target information specified by SQL. Searches are similarly performed on the tables D12 to D1n, and an index table is created corresponding to a table in which information (column) corresponding to the search target information specified by SQL is included. Therefore, an index table is not created for all of the tables D11 to D1n. For example, since the table D12 does not include “product number”, “product name”, and “product kana” of the search target information specified by SQL, an index table corresponding to this table is not created. Several index tables created as described above are all combined into one to be a
本実施形態では、データベース300のデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置400が設けられている。例えば、ファイル装置400中の1つの添付ファイルD21は図4に示すようであり、図2に示したテーブルD11のディレクトリ配下の添付ファイルである。そして、添付ファイルD21のユニークな値は、テーブルD11のディレクトリ配下を示すためにテーブルD11と同じ「商品番号」に対し、この添付ファイルD21にユニークな「連番」が付加されたものとなっている。添付ファイルD21には、上記ユニークな値である「商品番号_連番」以外に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。ファイル装置400には、この添付ファイルD21と同様に複数の添付ファイルが蓄積されており、その添付ファイルにユニークな「商品番号_連番」と共に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。この添付ファイルはそれぞれ、データベース300が蓄積しているテーブルD11、D12、D13、・・・、D1nのディレクトリ配下として記憶されている。なお、添付ファイルは、テーブルD11、D12、D13、・・・、D1nの全てに必ずしも対応付けられているものではなく、添付ファイルが対応付けられていないテーブルも存在する。また、添付ファイルの識別子であるユニークな識別情報である「商品番号_連番」には、「連番」となっていることからも明らかな通り、データベース300中の1つのテーブルに対して複数の添付ファイルが存在していても良く、この場合は「連番」の部分は「01」、「02」、・・・となる。
In the present embodiment, a file device 400 is provided in which an attached file under the data directory of the
全文検索エンジン500には、第2のクローラ収集手段504が備えられている。第2のクローラ収集手段504は、上記ファイル装置400内を検索して、ユニークな値を識別情報に該当添付ファイルの上記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイル502を生成するものである。
The full-
既に説明したように、ファイル装置400には、添付ファイルD21・・・等が蓄積されており、その添付ファイルにユニークな「商品番号_連番」と共に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。第2のクローラ収集手段504は、「商品番号_連番」に対応付けられているパンフレットや取扱説明書などのデータから、SQL(Structured Query Language)で指定された検索対象情報に該当する文字列のデータを帰属情報として帰属させて第2のインデックステーブルを作成する。このSQL(Structured Query Language)で指定された検索対象情報は、第1のインデックステーブルを作成するときに用いた検索対象情報と異なっても良い。上記第1のクローラ収集手段503及び上記第2のクローラ収集手段504は、形態素解析とN−Gramのいずれかにより検索を行う構成とすることができる。
As described above, the file device 400 stores the attached files D21..., Etc., and the pamphlet associated with this product number together with the unique “product number_serial number” in the attached file. And data such as instruction manuals are stored. The second crawler collection unit 504 extracts a character string corresponding to search target information specified by SQL (Structured Query Language) from data such as a pamphlet or an instruction manual associated with “product number_serial number”. The second index table is created by associating the data of FIG. The search target information specified by the SQL (Structured Query Language) may be different from the search target information used when creating the first index table. The first
図5には、ファイル装置400の添付ファイルD21から第2のインデックステーブルD42を作成する過程を示す。ここでは、SQLにより指定された検索対象情報は、パンフレットや取扱説明書などのデータが該当したことを示す。第2のインデックステーブルD42は、添付ファイルD21のユニークな値である「商品番号_連番」を識別情報とし、この識別情報に該当添付ファイルのSQLにより指定された検索対象情報に該当したパンフレットや取扱説明書などのデータを帰属させた第2のインデックステーブルを作成する。ファイル装置400中の添付ファイルD21以外の図示しない添付ファイルについても同様に検索が行われ、SQLにより指定された検索対象情報に該当するデータがヒットした場合には、この添付ファイルの識別情報である「商品番号_連番」に対応してインデックステーブルが作成される。SQLにより指定された検索対象情報に該当するデータがヒットしない場合には、インデックステーブルは作成されない。従って、ファイル装置400内の全ての添付ファイルについてインデックステーブルが作成される訳ではない。以上のようにして作成された幾つかのインデックステーブルが全て1つにまとめられて第2のインデックスファイル502とされる。
FIG. 5 shows a process of creating the second index table D42 from the attached file D21 of the file device 400. Here, the search target information specified by SQL indicates that data such as a pamphlet or an instruction manual is applicable. The second index table D42 uses “product number_serial number”, which is a unique value of the attached file D21, as identification information. The pamphlet corresponding to the search target information specified by the SQL of the attached file corresponds to the identification information. A second index table to which data such as an instruction manual is assigned is created. A similar search is also performed for an attached file (not shown) other than the attached file D21 in the file device 400. If data corresponding to the search target information specified by SQL is hit, this is identification information of the attached file. An index table is created corresponding to “product number_serial number”. If no data corresponding to the search target information specified by SQL is hit, no index table is created. Therefore, an index table is not created for all attached files in the file device 400. The several index tables created as described above are all combined into one to form the
本実施形態では、本検索装置200が設けられる。本検索装置200の「本」の意味は、全文検索エンジン500によっても検索が行われるため、本来的な検索要求が到来してからの検索が、この本検索装置200において行われることを示すものである。この本検索装置200には、検索端末101から検索要求とキーワードが与えられる。検索端末101としては、ネットワーク等により接続されるパーソナルコンピュータやワークステーション、携帯電話機やスマートフォン等の移動携帯端末などを採用することができる。
In the present embodiment, the
本検索装置200には、主キー情報取得手段205とデータベース検索手段201とが備えられている。主キー情報取得手段205は、検索すべきキーワードが与えられると、上記第1のインデックスファイル501を検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求めるものである。具体的は、主キー情報取得手段205は、全文検索エンジン500へ検索要求を与えて第1のインデックスファイル501の検索を行わせ、主キー情報を得るものである。第1のインデックスファイル501には、「商品番号」を主キー情報とし、属性情報が属する第1のインデックステーブルが複数格納されているので、この第1のインデックステーブル全てについてキーワードを用いて検索を行い、該当するキーワードが含まれる第1のインデックステーブルを求めて、その主キー情報である「商品番号」を求める。従って、全文検索エンジン500による第1のインデックスファイル501の検索が終了すると、幾つかの主キー情報である「商品番号」が求まっているか、キーワードにヒットする属性情報が無かったために、「商品番号」が求まっていないかである。この情報は上記主キー情報取得手段205へ送られる。
The
データベース検索手段201は、上記主キー情報取得手段205が求めた主キー情報に基づき上記データベース300を検索し、得られた該当テーブルから上記キーワードに対応するデータを取り出すものである。つまり、データベース検索手段201が主キー情報に基づき上記データベース300を検索するとき、該当のデータが存在しているデータベース300のテーブルへと高速に確実に行き着くので、このテーブルからキーワードに対応する所望のデータを取り出すことができる。
The
本検索装置200には、表示制御手段206が設けられている。上記データベース検索手段201により得られたデータは、表示制御手段206へ送られる。表示制御手段206は、上記データベース検索手段201が取り出したデータに基づく表示を検索端末101に送って、その表示手段において表示を行うようにする。
The
表示制御手段206には、表示データ加工手段203と表示処理手段204が設けられている。表示データ加工手段203は、上記データベース検索手段201により得られたたデータ(キーワードに対応してヒットしたデータ)を検索端末101に一覧表示するデータとして加工する処理を行う。表示処理手段204は、上記加工されたデータを検索端末101の表示手段(LED等の表示器)に表示可能な表示データとして送出する。
The display control means 206 includes a display data processing means 203 and a display processing means 204. The display
更に、本検索装置200には、識別情報取得手段207と添付ファイル検索手段202とが備えられている。識別情報取得手段207は、検索すべきキーワードが与えられると、上記第2のインデックスファイル502を検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求めるものである。具体的には、識別情報取得手段207は、全文検索エンジン500へ検索要求を与えて第2のインデックスファイル502を検索させて、識別情報を得るものである。第2のインデックスファイル502には、「商品番号_連番」を識別情報とし、パンフレットや取扱説明書などのデータを帰属させた第2のインデックステーブルが複数格納されているので、この第2のインデックステーブル全てについてキーワードを用いて検索を行い、該当するキーワードが含まれる第2のインデックステーブルを求めて、その識別情報である「商品番号_連番」を求める。従って、全文検索エンジン500による第2のインデックスファイル502の検索が終了すると、幾つかの識別情報である「商品番号_連番」が求まっているか、キーワードにヒットするデータを有する第2のインデックステーブルが無かったために、「商品番号_連番」が求まっていないかである。この情報は上記識別情報取得手段207へ送られる。
Further, the
添付ファイル検索手段202は、上記識別情報取得手段207が求めた識別情報に基づき上記ファイル装置400を検索し、得られた該当添付ファイルから上記キーワードに対応するデータを取り出すものである。つまり、添付ファイル検索手段202が求めた識別情報に基づき上記ファイル装置400を検索するとき、該当するデータが存在しているファイル装置400のテーブルへと高速に確実に行き着くので、このテーブルからキーワードに対応する所望のデータを取り出すことができる。
The attached
このようにして取り出されたデータは、表示制御手段206へ送られ、表示制御手段206は、上記データベース検索手段201が取り出したデータに基づく表示を検索端末101に送って、その表示手段において表示を行うようにする。
The data extracted in this way is sent to the display control means 206, and the display control means 206 sends a display based on the data extracted by the database search means 201 to the
上記添付ファイル検索手段202が取り出したデータについて、表示データ加工手段203は、上記データベース検索手段201により得られたデータと共に加工を行う。例えば、検索端末101に一覧表示するデータ内に、添付ファイル検索手段202が取り出したパンフレットや取扱説明書などのデータを最小限個別に含ませて加工する処理を行う。表示処理手段204は、上記加工されたデータを検索端末101の表示手段(LED等の表示器)に表示可能な表示データとして送出する。
The display
以上のような構成において、上記第1のクローラ収集手段503は、任意の時刻に処理を行うことができる。例えば、午前0時からの6時間中において1分間隔で処理を行うことができる。また、第2のクローラ収集手段504についても、上記と同様に任意の時刻に処理を行うことができる。
In the above configuration, the first
上記のように、第1のクローラ収集手段503により第1のインデックスファイル501に第1のインデックステーブルが収集されており、第2のクローラ収集手段504により第2のインデックスファイル502に第2のインデックステーブルが収集されている。このときに、検索端末101からキーワードの検索要求がされると、図6に示すフローチャートに示すような処理が行われる。
As described above, the first index table is collected in the
検索端末101からキーワードの検索要求がされると、検索処理が開始される。検索端末101から与えられたキーワードに基づき第1のインデックスファイル501に対する検索を行い、該当する第1のインデックステーブルにおける主キー情報である「商品番号」を取得して、内部メモリテーブルA(図1)へ格納する(S11)。
When a search request for a keyword is made from the
次に、検索端末101から与えられたキーワードに基づき第2のインデックスファイル502に対する検索を行い、該当する第2のインデックステーブルにおける識別情報である「商品番号_連番」を取得して、「商品番号」部分のみを内部メモリテーブルB(図1)へ格納する(S12)。
Next, a search is performed on the
次に、内部メモリテーブルAの主キー情報と内部メモリテーブルBの論理和を作成し、内部メモリテーブルC(図1)に格納する(S13)。つまり、同じ「商品番号」があれば1つとする。このようにして、データベース300とファイル装置400を曖昧検索し、一致した主キー情報(「商品番号」)を高速に得ることができる。次に、内部メモリテーブルCの主キー情報のみを用いてデータベース300へアクセスし、得られた該当テーブルから上記キーワードに対応するデータを取り出すものである(S14:データベース検索手段201)。
Next, a logical sum of the primary key information of the internal memory table A and the internal memory table B is created and stored in the internal memory table C (FIG. 1) (S13). That is, if there is the same “product number”, it is determined to be one. In this way, the
上記で取り出されたデータを加工して(S15:表示データ加工手段203)、検索端末101へ送って表示手段へ表示する(S16:表示処理手段204)。
The data extracted above is processed (S15: display data processing means 203), sent to the
上記表示制御手段206は、上記添付ファイル検索手段が取り出したデータがない場合には、上記データベース検索手段が取り出したデータのみに基づく表示を前記表示手段に行うことができる。また、上記表示制御手段206は、上記データベース検索手段201が取り出したデータ及び上記添付ファイル検索手段202が取り出したデータがない場合には、検索結果が得られないことの表示を上記表示手段に行うことができる。 If there is no data retrieved by the attached file retrieval means, the display control means 206 can provide a display based on only the data retrieved by the database retrieval means on the display means. When there is no data retrieved by the database retrieval means 201 and no data retrieved by the attached file retrieval means 202, the display control means 206 displays on the display means that no retrieval result is obtained. be able to.
なお、本実施形態では、識別情報である「商品番号_連番」を用いてファイル装置400を検索してデータを得る処理を行わないが、内部メモリテーブルBの情報を用いてファイル装置400から添付ファイル検索手段202による検索を行って、得られたデータを表示データ加工手段203が加工して一覧表示する情報としてまとめても良い。これにより、この情報を用いファイル装置400へアクセスし対応するパンフレットや取扱説明書などのデータをダウンロードして表示することが可能となる。
In this embodiment, the process of searching the file device 400 using the “product number_serial number” that is the identification information to obtain the data is not performed, but the process performed by the file device 400 using the information of the internal memory table B is not performed. A search by the attached
上記の構成に対し本実施形態は、データベース検索手段201が第1のインデックスファイル501の検索結果である主キー情報を用いるのではなく、主キー情報取得手段205の処理の処理を行わずに直接にデータベース300をSQLによって検索する構成を採ることはない。即ち、このような構成によると、検索端末101からのキーワードで列項目である「商品番号」、「商品名」、「商品名カナ」をそれぞれ前方後方中間一致の条件により検索する必要が生じ、データベースシステムとしては負荷が大きくレスポンスの悪いものとなる。検索キーワードによる検索が、データベース300における複数テーブルに跨るようなものである場合には、直接にデータベース300を検索するためのSQLが非常に複雑となることから、この点においても上記構成を本実施形態では採用していないことが理解できる。
In contrast to the above configuration, in the present embodiment, the
以上のように本実施形態によれば、データベース及び全文検索エンジンに特殊・特別な変形・加工を加えることなく、データベースの各テーブルに分散する項目(カラム)を検索対象項目にした曖昧処理により、目的のデータを効率良く高速に検索できる効果(本実施形態の効果という)を奏する。 As described above, according to the present embodiment, without applying any special, special deformation or processing to the database and the full-text search engine, the ambiguous processing in which the items (columns) distributed in each table of the database are used as the search target items, There is an effect that the target data can be searched efficiently and at high speed (referred to as an effect of the present embodiment).
なお、上記の実施形態は、添付ファイルが存在する場合の構成であるが、添付ファイルが無く、ファイル装置400を備えない構成を採用することができる。この場合には、ファイル装置400以外に、第2のクローラ収集手段504、第2のインデックスファイル502、識別情報取得手段207、添付ファイル検索手段202は不要である。この場合においても、上記実施形態の効果と同じ効果を得ることが可能である。
Note that the above embodiment is a configuration in a case where an attached file exists, but a configuration without an attached file and not having the file device 400 can be adopted. In this case, other than the file device 400, the second crawler collection unit 504, the
101 検索端末
200 本検索装置
201 データベース検索手段
202 添付ファイル検索手段
203 表示データ加工手段
204 表示処理手段
205 主キー情報取得手段
206 表示制御手段
207 識別情報取得手段
300 データベース
400 ファイル装置
500 全文検索エンジン
501 第1のインデックスファイル
502 第2のインデックスファイル
503 第1のクローラ収集手段
504 第2のクローラ収集手段
101
Claims (14)
前記データベースを検索し、前記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段と、
検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段と、
前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段と、
情報を表示する表示手段と、
前記データベース検索手段が取り出したデータに基づく表示を前記表示手段に行う表示制御手段と
を具備することを特徴とするデータ検索システム。 A database in which managed data is stored,
The database is searched, a table which is one unit of the management target data is specified, and a unique value for all specified tables is set as primary key information. First crawler collecting means for creating a first index table in which the target information is attributed as attribute information, and generating a first index file in which the first index table is put together;
When a keyword to be searched is given, the first index file is searched, a first index table including data corresponding to the keyword is detected, and a main key information of the first index table is obtained. Key information acquisition means;
A database search unit that searches the database based on the primary key information obtained by the primary key information acquisition unit and retrieves data corresponding to the keyword from the obtained corresponding table;
Display means for displaying information;
A display control means for performing a display on the display means based on the data retrieved by the database search means.
前記ファイル装置内を検索して前記添付ファイルの所要データをクローラ収集して、ユニークな値を識別情報に該当添付ファイルの前記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイルを生成する第2のクローラ収集手段と、
検索すべきキーワードが与えられると、前記第2のインデックスファイルを検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求める識別情報取得手段と、
前記識別情報取得手段が求めた識別情報に基づき前記ファイル装置を検索し、得られた該当添付ファイルから前記キーワードに対応するデータを取り出す添付ファイル検索手段と
を具備し、
前記表示手段は、前記添付ファイル検索手段が取り出したデータに基づく表示を前記表示手段に行うことを特徴とする請求項1に記載のデータ検索システム。 A file device in which attached files under a directory of data of the database table are stored;
The file device is searched to collect required data of the attached file by crawler, and a second index table is created in which a unique value is assigned to identification information to the required data of the attached file. Second crawler collection means for generating a second index file that summarizes the index tables of
When a keyword to be searched is given, the second index file is searched, a second index table including data corresponding to the keyword is detected, and identification information for identifying the second index table is obtained. Acquisition means;
Attached file search means for searching the file device based on the identification information obtained by the identification information obtaining means, and extracting data corresponding to the keyword from the obtained attached file,
2. The data search system according to claim 1, wherein the display unit performs a display on the display unit based on the data extracted by the attached file search unit.
前記データベースを検索し、前記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段、
検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段、
前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段、
前記データベース検索手段が取り出したデータに基づく表示を表示手段に行う表示制御手段
として機能させることを特徴とするデータ検索用プログラム。 A computer of a data search system that searches for data in a database in which data to be managed is stored,
The database is searched, a table which is one unit of the management target data is specified, and a unique value for all specified tables is set as primary key information. A first crawler collection unit that creates a first index table in which the target information is attributed as attribute information, and generates a first index file in which the first index table is put together;
When a keyword to be searched is given, the first index file is searched, a first index table including data corresponding to the keyword is detected, and a main key information of the first index table is obtained. Key information acquisition means,
A database search unit that searches the database based on the primary key information obtained by the primary key information acquisition unit and retrieves data corresponding to the keyword from the obtained corresponding table;
A data search program for functioning as display control means for causing a display means to perform display based on data retrieved by the database search means.
前記データベースのテーブルのデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置内を検索して前記添付ファイルの所要データをクローラ収集して、ユニークな値を識別情報に該当添付ファイルの前記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイルを生成する第2のクローラ収集手段、
検索すべきキーワードが与えられると、前記第2のインデックスファイルを検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求める識別情報取得手段、
前記識別情報取得手段が求めた識別情報に基づき前記ファイル装置を検索し、得られた該当添付ファイルから前記キーワードに対応するデータを取り出す添付ファイル検索手段
として機能させ、
前記コンピュータを前記表示制御手段として、前記添付ファイル検索手段が取り出したデータに基づく表示を前記表示手段に行うように機能させることを特徴とする請求項8に記載のデータ検索用プログラム。 Further comprising the computer
The required data of the attached file is crawled and collected by searching the file device in which the attached file under the directory of the data of the database table is stored, and the required data of the attached file is identified by a unique value as identification information. A second crawler collecting means for creating an imputed second index table and generating a second index file summarizing the second index table;
When a keyword to be searched is given, the second index file is searched, a second index table including data corresponding to the keyword is detected, and identification information for identifying the second index table is obtained. Acquisition means,
Searching the file device based on the identification information obtained by the identification information acquisition means, and functioning as an attachment file search means for extracting data corresponding to the keyword from the obtained attachment file;
9. The data search program according to claim 8, wherein the computer is caused to function as the display control unit so that the display unit performs a display based on the data extracted by the attached file search unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018171603A JP6949449B2 (en) | 2018-09-13 | 2018-09-13 | Data search system and data search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018171603A JP6949449B2 (en) | 2018-09-13 | 2018-09-13 | Data search system and data search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020042722A true JP2020042722A (en) | 2020-03-19 |
JP6949449B2 JP6949449B2 (en) | 2021-10-13 |
Family
ID=69799404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018171603A Active JP6949449B2 (en) | 2018-09-13 | 2018-09-13 | Data search system and data search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6949449B2 (en) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029898A (en) * | 1998-07-14 | 2000-01-28 | Hitachi Ltd | Sql generation system |
JP2008009918A (en) * | 2006-06-30 | 2008-01-17 | Fujitsu Ltd | Program, device and method for creating index |
JP2012104075A (en) * | 2010-11-15 | 2012-05-31 | Ricoh Co Ltd | Information retrieval system, information collection apparatus, information retrieval apparatus, information collection method, program and recording medium |
JP2012212212A (en) * | 2011-03-30 | 2012-11-01 | Mitsubishi Electric Corp | Data retrieval device, data retrieval method and program |
JP2013117873A (en) * | 2011-12-02 | 2013-06-13 | Hitachi Systems Ltd | Database processing method |
JP2014013541A (en) * | 2012-07-05 | 2014-01-23 | Sony Corp | Information processing device, information processing method, program, and information processing system |
US20140250097A1 (en) * | 2013-03-04 | 2014-09-04 | Avaya Inc. | Systems and methods for indexing and searching reporting data |
JP2015011629A (en) * | 2013-07-01 | 2015-01-19 | 株式会社リコー | Information processing device, second information processing device, communication terminal, communication system, and program |
JP2019512124A (en) * | 2016-02-26 | 2019-05-09 | アーミク カンパニー,リミテッド | Method and apparatus for archiving database generating index information, search method and apparatus for archived database including index information |
-
2018
- 2018-09-13 JP JP2018171603A patent/JP6949449B2/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029898A (en) * | 1998-07-14 | 2000-01-28 | Hitachi Ltd | Sql generation system |
JP2008009918A (en) * | 2006-06-30 | 2008-01-17 | Fujitsu Ltd | Program, device and method for creating index |
JP2012104075A (en) * | 2010-11-15 | 2012-05-31 | Ricoh Co Ltd | Information retrieval system, information collection apparatus, information retrieval apparatus, information collection method, program and recording medium |
JP2012212212A (en) * | 2011-03-30 | 2012-11-01 | Mitsubishi Electric Corp | Data retrieval device, data retrieval method and program |
JP2013117873A (en) * | 2011-12-02 | 2013-06-13 | Hitachi Systems Ltd | Database processing method |
JP2014013541A (en) * | 2012-07-05 | 2014-01-23 | Sony Corp | Information processing device, information processing method, program, and information processing system |
US20140250097A1 (en) * | 2013-03-04 | 2014-09-04 | Avaya Inc. | Systems and methods for indexing and searching reporting data |
JP2015011629A (en) * | 2013-07-01 | 2015-01-19 | 株式会社リコー | Information processing device, second information processing device, communication terminal, communication system, and program |
JP2019512124A (en) * | 2016-02-26 | 2019-05-09 | アーミク カンパニー,リミテッド | Method and apparatus for archiving database generating index information, search method and apparatus for archived database including index information |
Also Published As
Publication number | Publication date |
---|---|
JP6949449B2 (en) | 2021-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9639579B2 (en) | Determination of a desired repository for retrieving search results | |
CA2583042C (en) | Providing information relating to a document | |
US6792414B2 (en) | Generalized keyword matching for keyword based searching over relational databases | |
US8700568B2 (en) | Entity normalization via name normalization | |
US6801904B2 (en) | System for keyword based searching over relational databases | |
US7657515B1 (en) | High efficiency document search | |
US7672971B2 (en) | Modular architecture for entity normalization | |
US7765209B1 (en) | Indexing and retrieval of blogs | |
US20070250501A1 (en) | Search result delivery engine | |
WO2006076805A1 (en) | Method and apparatus for ordering items within datasets | |
US8423885B1 (en) | Updating search engine document index based on calculated age of changed portions in a document | |
JP6165955B1 (en) | Method and system for matching images and content using whitelist and blacklist in response to search query | |
US7657513B2 (en) | Adaptive help system and user interface | |
US20080059432A1 (en) | System and method for database indexing, searching and data retrieval | |
CN111400323B (en) | Data retrieval method, system, equipment and storage medium | |
KR101892067B1 (en) | Method for storing and searching of text logdata based relational database | |
US20090055374A1 (en) | Method and apparatus for generating search keys based on profile information | |
JP2003173280A (en) | Apparatus, method and program for generating database | |
CN107229714B (en) | Full-text search engine based on distributed database | |
JP6949449B2 (en) | Data search system and data search program | |
JP2005056223A (en) | Text data retrieval system, method therefor and its program | |
Pu et al. | Frisk: Keyword query cleaning and processing in action | |
Sima et al. | Keyword query approach over rdf data based on tree template | |
US9607053B2 (en) | Methods and systems for searching and displaying a plurality of entities within an interactive user interface | |
Sharma et al. | A novel context based indexing of web documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210921 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6949449 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |