JP2020042722A - Data search system and data searching program - Google Patents

Data search system and data searching program Download PDF

Info

Publication number
JP2020042722A
JP2020042722A JP2018171603A JP2018171603A JP2020042722A JP 2020042722 A JP2020042722 A JP 2020042722A JP 2018171603 A JP2018171603 A JP 2018171603A JP 2018171603 A JP2018171603 A JP 2018171603A JP 2020042722 A JP2020042722 A JP 2020042722A
Authority
JP
Japan
Prior art keywords
data
search
unit
file
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018171603A
Other languages
Japanese (ja)
Other versions
JP6949449B2 (en
Inventor
恵哉 生田
Shigeya Ikuta
恵哉 生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Information Systems Japan Corp
Original Assignee
Toshiba Information Systems Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Information Systems Japan Corp filed Critical Toshiba Information Systems Japan Corp
Priority to JP2018171603A priority Critical patent/JP6949449B2/en
Publication of JP2020042722A publication Critical patent/JP2020042722A/en
Application granted granted Critical
Publication of JP6949449B2 publication Critical patent/JP6949449B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a data search system allowing for higher-speed searching, and a data searching program.SOLUTION: A data search system includes: first crawler collection means 503 which searches a database 300 in which data to be managed are accumulated, to generate a first index file 501 having a first index table formed by attributing information to be searched in content data of a corresponding table to main key information, as attribute information; main key information acquisition means 205 which searches the first index file 501 in response to a keyword for search, to obtain main key information; database search means 201 which searches the database 300 on the basis of the main key information obtained by the main key information acquisition means 205; and display control means 206 which performs display based on the data acquired by the database search means 201 on display means.SELECTED DRAWING: Figure 1

Description

この発明は、データ検索システム及びデータ検索用プログラムに関するものである。   The present invention relates to a data search system and a data search program.

従来、大量データを擁するリレーショナルデータベースなどのデータベースシステムにおいて曖昧検索を行う場合には、極めて多くの時間を要するという問題があった。   Heretofore, there has been a problem that it takes an extremely long time to perform an ambiguous search in a database system such as a relational database having a large amount of data.

特許文献1には、全文検索エンジンとRDB(リレーショナルデータベース)を用いて高速検索前処理の状態情報を用いることで、検索時間を短縮することができる文書検索装置が開示されている。   Patent Document 1 discloses a document search device that can reduce a search time by using state information of high-speed search preprocessing using a full-text search engine and an RDB (relational database).

具体的には、複数の文書とフォルダに対し、パターンマッチング部と全文検索部とを備えて、検索対象の種類と状態とを判断して、上記パターンマッチング部と全文検索部とのいずれかにより検索を行うというものである。この特許文献1の発明は、パターンマッチング部は即時検索可能であるが検索時間がかかるというという特徴があり、全文検索部は登録に時間がかかるが検索時間が高速であるという特徴があることに鑑み、これらを切換えてそれぞれを有利な場面で使用するものである。   Specifically, a pattern matching unit and a full-text search unit are provided for a plurality of documents and folders, and the type and state of the search target are determined, and one of the pattern matching unit and the full-text search unit is used. Searching. The invention of Patent Literature 1 is characterized in that the pattern matching unit can perform an immediate search but takes a long search time, and the full-text search unit has a feature that the registration takes a long time but the search time is fast. In view of this, these are switched and each is used in an advantageous situation.

特許文献2には、複数のクライアントと通信可能な全文検索エンジンは文書登録時に全文検索エンジンが文書へのアクセス権を有するクライアントの識別符号(ユーザID)に制御文字(例えば区切り文字)を付加した文字列を上記文書と共に格納すること、また、全文検索エンジンは文書へのアクセス要求時に検索語に対して上記アクセス要求したクライアントの識別符号に上記制御文字を付与した文字列を追加して全文検索を実行することが、開示されている。   According to Patent Document 2, a full-text search engine capable of communicating with a plurality of clients adds a control character (for example, a delimiter) to an identification code (user ID) of a client having access to the document when the document is registered. The character string is stored together with the document, and the full-text search engine adds a character string obtained by adding the control character to the identification code of the client that has made the access request to the search word when the document is requested to be accessed for full-text search. Is disclosed.

更に上記特許文献2の発明では、全文検索エンジンが、文書本体とは別に当該文書の属性値を格納するカラムを有しており、全文検索エンジンは、文書登録時にクライアントの識別符号と制御文字とからなる文字列を文書の属性値としてカラムに格納し、文書へのアクセス要求時に前記アクセス要求したクライアントの識別符号に制御文字を付与した文字列を上記カラムに対する検索語として全文検索する。以上により、全文検索と共にアクセス制御が同時にできることになる、というものである。   Further, in the invention of Patent Document 2, the full-text search engine has a column for storing the attribute value of the document separately from the document main body. Is stored in a column as an attribute value of the document, and a full-text search is performed as a search term for the column by using a character string in which a control character is added to the identification code of the client who has made the access request when the document is requested to be accessed. As described above, the access control can be performed simultaneously with the full-text search.

また、特許文献3には、金融情報検索システムとして、各銘柄について記載された文書データを保持する文書DBを所定タイミングでクローリングして全文検索用の文書インデックスを作成するクローラを備える検索エンジンが開示されている。この検索エンジンは更に、営業端末から受け付けた検索要求に対して文書インデックスからマッチする文書データに係るレコードのうち、上位の所定の件数を検索結果として応答する検索処理部を有しており、営業端末から受け付けた検索要求においてキーワードの指定がなされていない場合に、検索エンジンによる検索ではなく、文書DBに対して直接に検索処理を行うDB検索部を有するというものである。   Patent Document 3 discloses, as a financial information search system, a search engine including a crawler that crawls a document DB holding document data describing each brand at a predetermined timing and creates a document index for full-text search. Have been. The search engine further includes a search processing unit that responds to the search request received from the sales terminal with a predetermined number of high-order records as search results among records related to the document data that matches from the document index. If a keyword is not specified in a search request received from a terminal, a DB search unit that performs a search process directly on the document DB, instead of a search by a search engine, is provided.

上記特許文献3の発明によれば、検索エンジンによる検索の際にキーワードが指定されていない場合においても、検索結果に対するソートの条件で上位の所定件数に入り得るデータが漏れずに表示されるようになる、という効果を奏することになる。   According to the invention of Patent Literature 3, even when a keyword is not specified at the time of a search by a search engine, data that can be included in a predetermined number of upper ranks in a sort condition for search results is displayed without omission. Will be achieved.

更に、特許文献4には、入力部によって入力されたユーザ指定の検索キーワードのデータ構造上の特徴(データ型等)を解析するデータ型解析部と、リレーショナルデータベースに格納されている検索の対象となるテーブルの各カラムのうち、上記解析された検索キーワードのデータ構造上の特徴(データ型等)に合致するカラムを、上記検索対象列として検出する検索対象列検出部とを備える検索対象列決定装置が開示されている。   Further, Patent Literature 4 discloses a data type analysis unit that analyzes a data structure characteristic (such as a data type) of a user-specified search keyword input by an input unit, and a search target stored in a relational database. A search target column detection unit that detects, as the search target column, a column that matches a data structure characteristic (such as a data type) of the analyzed search keyword among the columns of the table. An apparatus is disclosed.

上記特許文献4の発明は、検索キーワードのデータ構造上の特徴から全文検索の対象とすべきカラムを動的に絞ることにより、全文検索時の応答性能を向上させるというものである。   The invention of Patent Document 4 described above improves response performance at the time of full-text search by dynamically narrowing columns to be subjected to full-text search based on characteristics of the data structure of a search keyword.

特開2006−79423号公報JP 2006-79423 A 特開2009−169736号公報JP 2009-169736 A 特開2015−185013号公報JP-A-2015-185013 特開2010−67213号公報JP 2010-67213 A

本発明は、上記のような検索システムより以上に高速な検索を可能とするデータ検索システム及びデータ検索用プログラムを提供することを目的とする。   SUMMARY OF THE INVENTION It is an object of the present invention to provide a data search system and a data search program that enable a higher-speed search than the above search system.

本発明に係るデータ検索システムは、管理対象データが蓄積されたデータベースと、前記データベースを検索し、前記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段と、検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段と、前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段と、情報を表示する表示手段と、前記データベース検索手段が取り出したデータに基づく表示を前記表示手段に行う表示制御手段とを具備することを特徴とする。   A data search system according to the present invention searches a database in which data to be managed is stored and the database, identifies a table that is one unit of the data to be managed, and provides a unique value for all identified tables. Is used as primary key information to create a first index table in which search target information in the content data of the corresponding table is attributed to the primary key information as attribute information, and a first index that summarizes the first index table is created. Given first crawler collecting means for generating a file and a keyword to be searched, the first index file is searched to find a first index table including data corresponding to the keyword, and Primary key information obtaining means for obtaining primary key information of a first index table; A database search unit that searches the database based on the primary key information obtained by the key information acquisition unit and retrieves data corresponding to the keyword from the obtained table, a display unit that displays information, and the database search unit. Display control means for performing display based on the extracted data on the display means.

本発明に係るデータ検索システムの実施形態の構成を示すブロック図。FIG. 1 is a block diagram showing a configuration of an embodiment of a data search system according to the present invention. 本発明に係るデータ検索システムの実施形態において用いられるデータベースの内容の一例を示す図。The figure which shows an example of the content of the database used in embodiment of the data search system which concerns on this invention. 本発明に係るデータ検索システムの実施形態において、データベースのテーブルから第1のインデックスファイル内の第1のインデックステーブルを作成する過程の一例を示す図。FIG. 7 is a diagram showing an example of a process of creating a first index table in a first index file from a table of a database in the embodiment of the data search system according to the present invention. 本発明に係るデータ検索システムの実施形態において用いられるファイル装置に蓄積された添付ファイルの内容の一例を示す図。FIG. 4 is a diagram showing an example of the contents of an attached file stored in a file device used in the embodiment of the data search system according to the present invention. 本発明に係るデータ検索システムの実施形態において、ファイル装置の添付ファイルから第2のインデックスファイル内の第2のインデックステーブルを作成する過程の一例を示す図。FIG. 7 is a diagram showing an example of a process of creating a second index table in a second index file from an attached file of a file device in the embodiment of the data search system according to the present invention. 本発明に係るデータ検索システムの実施形態の動作を示すフローチャート。5 is a flowchart showing the operation of the embodiment of the data search system according to the present invention.

以下添付図面を参照して、本発明に係るデータ検索システム及びデータ検索用プログラムの実施形態を説明する。各図において、同一の構成要素には同一の符号を付して重複する説明を省略する。図1には、本発明に係るデータ検索システムの実施形態の構成図が示されている。実施形態に係るデータ検索システムは、種々のデータが蓄積されたデータベース300と、このデータベース300の全ての文の検索を行う全文検索エンジン500とが備えられている。データベース300としては、例えばリレーショナルデータベースを採用することができる。   Hereinafter, an embodiment of a data search system and a data search program according to the present invention will be described with reference to the accompanying drawings. In the respective drawings, the same components are denoted by the same reference numerals, and redundant description will be omitted. FIG. 1 shows a configuration diagram of an embodiment of a data search system according to the present invention. The data search system according to the embodiment includes a database 300 in which various data are accumulated, and a full-text search engine 500 that searches all sentences in the database 300. As the database 300, for example, a relational database can be adopted.

ここでは、データベース300が蓄積している管理対象データが商品カタログのデータであり、例えば、図2に示されるように1単位の管理対象データのテーブルD11、D12、D13、・・・、D1nが蓄積されている。1つのテーブルについては、ユニークな値に対し、必要な項目が複数配置された構造を有する。本実施形態では、ユニークな値はテーブルの先頭に配置されている商品番号であり、各テーブルD11、D12、D13、・・・、D1nには、項目のデータとして、「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・と並んでいる。なお、項目内のデータの並び順は、例示に過ぎない。   Here, the management target data stored in the database 300 is the data of the product catalog. For example, as shown in FIG. 2, one unit of management target data tables D11, D12, D13,. Has been accumulated. One table has a structure in which a plurality of necessary items are arranged for unique values. In the present embodiment, the unique value is a product number arranged at the top of the table, and each of the tables D11, D12, D13,. "Kana", "Package", "Handling start date", "Handling end date", ... Note that the order of the data in the item is merely an example.

全文検索エンジン500には、第1のクローラ収集手段503が備えられている。第1のクローラ収集手段503は、上記データベース300を検索し、上記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイル501を生成するものである。   The full-text search engine 500 includes a first crawler collection unit 503. The first crawler collection unit 503 searches the database 300, specifies a table that is one unit of the management target data, and sets a unique value for all specified tables as primary key information. A first index table in which information to be searched in the content data of the corresponding table is attributed to the information as attribute information is created, and a first index file 501 in which the first index tables are put together is generated.

既に説明したように、データベース300のテーブルD11には、商品番号と、項目のデータとして、「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・が記憶されているので、第1のクローラ収集手段503は上記「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・というデータから、SQL(Structured Query Language)で指定した検索対象情報に該当する文字列の項目(カラム)の情報を検索して、帰属情報として帰属させて第1のインデックステーブルを作成する。   As described above, in the table D11 of the database 300, the product number and the data of the item include “product name”, “product name Kana”, “package”, “handling start date”, “handling end date”. Are stored, the first crawler collecting means 503 stores the above-mentioned “product name”, “product name Kana”, “package”, “handling start date”, “handling end date”,. From the data, the information of the item (column) of the character string corresponding to the search target information specified by the SQL (Structured Query Language) is searched, and the first index table is created by belonging as the belonging information.

図3に、テーブルD11から第1のインデックステーブルD41を作成する過程を示す。ここでは、SQLにより指定された検索対象情報に「商品番号」「商品名」「商品カナ」が該当したことを示す。テーブルD12〜D1nについても同様に検索が行われ、SQLにより指定された検索対象情報に該当する情報が項目(カラム)に含まれていたテーブルに対応してインデックステーブルが作成される。従って、テーブルD11〜D1nの全てについてインデックステーブルが作成される訳ではない。例えば、テーブルD12には、SQLにより指定された検索対象情報の「商品番号」「商品名」「商品カナ」が含まれていないので、このテーブルに対応するインデックステーブルは作成されない。以上のようにして作成された幾つかのインデックステーブルが全て1つにまとめられて第1のインデックスファイル501とされる。   FIG. 3 shows a process of creating the first index table D41 from the table D11. Here, it is indicated that “product number”, “product name”, and “product kana” correspond to the search target information specified by SQL. Searches are similarly performed on the tables D12 to D1n, and an index table is created corresponding to a table in which information (column) corresponding to the search target information specified by SQL is included. Therefore, an index table is not created for all of the tables D11 to D1n. For example, since the table D12 does not include “product number”, “product name”, and “product kana” of the search target information specified by SQL, an index table corresponding to this table is not created. Several index tables created as described above are all combined into one to be a first index file 501.

本実施形態では、データベース300のデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置400が設けられている。例えば、ファイル装置400中の1つの添付ファイルD21は図4に示すようであり、図2に示したテーブルD11のディレクトリ配下の添付ファイルである。そして、添付ファイルD21のユニークな値は、テーブルD11のディレクトリ配下を示すためにテーブルD11と同じ「商品番号」に対し、この添付ファイルD21にユニークな「連番」が付加されたものとなっている。添付ファイルD21には、上記ユニークな値である「商品番号_連番」以外に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。ファイル装置400には、この添付ファイルD21と同様に複数の添付ファイルが蓄積されており、その添付ファイルにユニークな「商品番号_連番」と共に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。この添付ファイルはそれぞれ、データベース300が蓄積しているテーブルD11、D12、D13、・・・、D1nのディレクトリ配下として記憶されている。なお、添付ファイルは、テーブルD11、D12、D13、・・・、D1nの全てに必ずしも対応付けられているものではなく、添付ファイルが対応付けられていないテーブルも存在する。また、添付ファイルの識別子であるユニークな識別情報である「商品番号_連番」には、「連番」となっていることからも明らかな通り、データベース300中の1つのテーブルに対して複数の添付ファイルが存在していても良く、この場合は「連番」の部分は「01」、「02」、・・・となる。   In the present embodiment, a file device 400 is provided in which an attached file under the data directory of the database 300 is stored. For example, one attached file D21 in the file device 400 is as shown in FIG. 4, and is an attached file under the directory of the table D11 shown in FIG. The unique value of the attached file D21 is obtained by adding a unique “serial number” to the attached file D21 to the same “product number” as the table D11 in order to indicate the directory under the directory of the table D11. I have. In the attached file D21, in addition to the unique value “product number_serial number”, data such as a pamphlet or an instruction manual associated with the product number is stored. A plurality of attached files are stored in the file device 400 in the same manner as the attached file D21. The attached file has a unique “article number_serial number” and a pamphlet or a handling item associated with the article number. Data such as instructions are stored. Each of the attached files is stored under the directory of the tables D11, D12, D13,..., D1n stored in the database 300. Note that the attached file is not always associated with all of the tables D11, D12, D13,..., D1n, and there are tables where the attached file is not associated. In addition, as is clear from the “serial number” in the “article number_serial number” that is the unique identification information that is the identifier of the attached file, a plurality of May be present, and in this case, the “serial number” portion is “01”, “02”,...

全文検索エンジン500には、第2のクローラ収集手段504が備えられている。第2のクローラ収集手段504は、上記ファイル装置400内を検索して、ユニークな値を識別情報に該当添付ファイルの上記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイル502を生成するものである。   The full-text search engine 500 includes a second crawler collection unit 504. The second crawler collecting means 504 searches the file device 400, creates a second index table in which the unique data is assigned to the identification data and the required data of the attached file, and creates a second index table. A second index file 502 in which the index tables are put together is generated.

既に説明したように、ファイル装置400には、添付ファイルD21・・・等が蓄積されており、その添付ファイルにユニークな「商品番号_連番」と共に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。第2のクローラ収集手段504は、「商品番号_連番」に対応付けられているパンフレットや取扱説明書などのデータから、SQL(Structured Query Language)で指定された検索対象情報に該当する文字列のデータを帰属情報として帰属させて第2のインデックステーブルを作成する。このSQL(Structured Query Language)で指定された検索対象情報は、第1のインデックステーブルを作成するときに用いた検索対象情報と異なっても良い。上記第1のクローラ収集手段503及び上記第2のクローラ収集手段504は、形態素解析とN−Gramのいずれかにより検索を行う構成とすることができる。   As described above, the file device 400 stores the attached files D21..., Etc., and the pamphlet associated with this product number together with the unique “product number_serial number” in the attached file. And data such as instruction manuals are stored. The second crawler collection unit 504 extracts a character string corresponding to search target information specified by SQL (Structured Query Language) from data such as a pamphlet or an instruction manual associated with “product number_serial number”. The second index table is created by associating the data of FIG. The search target information specified by the SQL (Structured Query Language) may be different from the search target information used when creating the first index table. The first crawler collection unit 503 and the second crawler collection unit 504 can be configured to perform a search by either morphological analysis or N-Gram.

図5には、ファイル装置400の添付ファイルD21から第2のインデックステーブルD42を作成する過程を示す。ここでは、SQLにより指定された検索対象情報は、パンフレットや取扱説明書などのデータが該当したことを示す。第2のインデックステーブルD42は、添付ファイルD21のユニークな値である「商品番号_連番」を識別情報とし、この識別情報に該当添付ファイルのSQLにより指定された検索対象情報に該当したパンフレットや取扱説明書などのデータを帰属させた第2のインデックステーブルを作成する。ファイル装置400中の添付ファイルD21以外の図示しない添付ファイルについても同様に検索が行われ、SQLにより指定された検索対象情報に該当するデータがヒットした場合には、この添付ファイルの識別情報である「商品番号_連番」に対応してインデックステーブルが作成される。SQLにより指定された検索対象情報に該当するデータがヒットしない場合には、インデックステーブルは作成されない。従って、ファイル装置400内の全ての添付ファイルについてインデックステーブルが作成される訳ではない。以上のようにして作成された幾つかのインデックステーブルが全て1つにまとめられて第2のインデックスファイル502とされる。   FIG. 5 shows a process of creating the second index table D42 from the attached file D21 of the file device 400. Here, the search target information specified by SQL indicates that data such as a pamphlet or an instruction manual is applicable. The second index table D42 uses “product number_serial number”, which is a unique value of the attached file D21, as identification information. The pamphlet corresponding to the search target information specified by the SQL of the attached file corresponds to the identification information. A second index table to which data such as an instruction manual is assigned is created. A similar search is also performed for an attached file (not shown) other than the attached file D21 in the file device 400. If data corresponding to the search target information specified by SQL is hit, this is identification information of the attached file. An index table is created corresponding to “product number_serial number”. If no data corresponding to the search target information specified by SQL is hit, no index table is created. Therefore, an index table is not created for all attached files in the file device 400. The several index tables created as described above are all combined into one to form the second index file 502.

本実施形態では、本検索装置200が設けられる。本検索装置200の「本」の意味は、全文検索エンジン500によっても検索が行われるため、本来的な検索要求が到来してからの検索が、この本検索装置200において行われることを示すものである。この本検索装置200には、検索端末101から検索要求とキーワードが与えられる。検索端末101としては、ネットワーク等により接続されるパーソナルコンピュータやワークステーション、携帯電話機やスマートフォン等の移動携帯端末などを採用することができる。   In the present embodiment, the present search device 200 is provided. The meaning of “book” in the present search device 200 indicates that the search is also performed by the full-text search engine 500, so that the search after the original search request arrives is performed in the book search device 200. It is. This search device 200 is provided with a search request and a keyword from the search terminal 101. As the search terminal 101, a personal computer or a workstation connected via a network or the like, or a mobile portable terminal such as a mobile phone or a smartphone can be employed.

本検索装置200には、主キー情報取得手段205とデータベース検索手段201とが備えられている。主キー情報取得手段205は、検索すべきキーワードが与えられると、上記第1のインデックスファイル501を検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求めるものである。具体的は、主キー情報取得手段205は、全文検索エンジン500へ検索要求を与えて第1のインデックスファイル501の検索を行わせ、主キー情報を得るものである。第1のインデックスファイル501には、「商品番号」を主キー情報とし、属性情報が属する第1のインデックステーブルが複数格納されているので、この第1のインデックステーブル全てについてキーワードを用いて検索を行い、該当するキーワードが含まれる第1のインデックステーブルを求めて、その主キー情報である「商品番号」を求める。従って、全文検索エンジン500による第1のインデックスファイル501の検索が終了すると、幾つかの主キー情報である「商品番号」が求まっているか、キーワードにヒットする属性情報が無かったために、「商品番号」が求まっていないかである。この情報は上記主キー情報取得手段205へ送られる。   The search device 200 includes a primary key information acquisition unit 205 and a database search unit 201. When a keyword to be searched is given, the primary key information obtaining means 205 searches the first index file 501, detects a first index table including data corresponding to the keyword, and detects the first index table. This is for obtaining primary key information of the index table. More specifically, the primary key information obtaining unit 205 obtains primary key information by giving a search request to the full-text search engine 500 to cause the first index file 501 to be searched. In the first index file 501, a plurality of first index tables to which attribute information belongs are stored using "product number" as main key information. Therefore, all the first index tables are searched using a keyword. Then, the first index table including the corresponding keyword is obtained, and the “product number” that is the main key information is obtained. Therefore, when the search of the first index file 501 by the full-text search engine 500 is completed, the "product number", which is some primary key information, has been obtained or the attribute information that hits the keyword has not been found. Is not found. This information is sent to the main key information acquisition means 205.

データベース検索手段201は、上記主キー情報取得手段205が求めた主キー情報に基づき上記データベース300を検索し、得られた該当テーブルから上記キーワードに対応するデータを取り出すものである。つまり、データベース検索手段201が主キー情報に基づき上記データベース300を検索するとき、該当のデータが存在しているデータベース300のテーブルへと高速に確実に行き着くので、このテーブルからキーワードに対応する所望のデータを取り出すことができる。   The database search unit 201 searches the database 300 based on the primary key information obtained by the primary key information acquisition unit 205, and extracts data corresponding to the keyword from the obtained corresponding table. In other words, when the database search means 201 searches the database 300 based on the primary key information, it quickly and reliably reaches a table of the database 300 in which the corresponding data exists. Data can be retrieved.

本検索装置200には、表示制御手段206が設けられている。上記データベース検索手段201により得られたデータは、表示制御手段206へ送られる。表示制御手段206は、上記データベース検索手段201が取り出したデータに基づく表示を検索端末101に送って、その表示手段において表示を行うようにする。   The search device 200 includes a display control unit 206. The data obtained by the database search means 201 is sent to the display control means 206. The display control means 206 sends a display based on the data retrieved by the database search means 201 to the search terminal 101 so that the display means performs the display.

表示制御手段206には、表示データ加工手段203と表示処理手段204が設けられている。表示データ加工手段203は、上記データベース検索手段201により得られたたデータ(キーワードに対応してヒットしたデータ)を検索端末101に一覧表示するデータとして加工する処理を行う。表示処理手段204は、上記加工されたデータを検索端末101の表示手段(LED等の表示器)に表示可能な表示データとして送出する。   The display control means 206 includes a display data processing means 203 and a display processing means 204. The display data processing unit 203 performs a process of processing the data (the data hit according to the keyword) obtained by the database search unit 201 as data to be displayed as a list on the search terminal 101. The display processing unit 204 sends the processed data as display data that can be displayed on a display unit (a display such as an LED) of the search terminal 101.

更に、本検索装置200には、識別情報取得手段207と添付ファイル検索手段202とが備えられている。識別情報取得手段207は、検索すべきキーワードが与えられると、上記第2のインデックスファイル502を検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求めるものである。具体的には、識別情報取得手段207は、全文検索エンジン500へ検索要求を与えて第2のインデックスファイル502を検索させて、識別情報を得るものである。第2のインデックスファイル502には、「商品番号_連番」を識別情報とし、パンフレットや取扱説明書などのデータを帰属させた第2のインデックステーブルが複数格納されているので、この第2のインデックステーブル全てについてキーワードを用いて検索を行い、該当するキーワードが含まれる第2のインデックステーブルを求めて、その識別情報である「商品番号_連番」を求める。従って、全文検索エンジン500による第2のインデックスファイル502の検索が終了すると、幾つかの識別情報である「商品番号_連番」が求まっているか、キーワードにヒットするデータを有する第2のインデックステーブルが無かったために、「商品番号_連番」が求まっていないかである。この情報は上記識別情報取得手段207へ送られる。   Further, the search device 200 includes an identification information acquisition unit 207 and an attached file search unit 202. When a keyword to be searched is given, the identification information obtaining means 207 searches the second index file 502, detects a second index table including data corresponding to the keyword, and detects the second index table. This is for obtaining the identification information of the table. More specifically, the identification information obtaining unit 207 obtains identification information by giving a search request to the full-text search engine 500 to search the second index file 502. Since the second index file 502 stores a plurality of second index tables to which data such as pamphlets and instruction manuals are assigned using “product number_serial number” as identification information, the second index file is stored in the second index file 502. A search is performed for all of the index tables using keywords, a second index table that includes the corresponding keyword is obtained, and “product number_serial number” as its identification information is obtained. Therefore, when the search of the second index file 502 by the full-text search engine 500 is completed, some identification information “product number_serial number” is obtained, or the second index table having data that hits a keyword is obtained. Is missing, so that "product number_serial number" has not been determined. This information is sent to the identification information acquisition means 207.

添付ファイル検索手段202は、上記識別情報取得手段207が求めた識別情報に基づき上記ファイル装置400を検索し、得られた該当添付ファイルから上記キーワードに対応するデータを取り出すものである。つまり、添付ファイル検索手段202が求めた識別情報に基づき上記ファイル装置400を検索するとき、該当するデータが存在しているファイル装置400のテーブルへと高速に確実に行き着くので、このテーブルからキーワードに対応する所望のデータを取り出すことができる。   The attached file search unit 202 searches the file device 400 based on the identification information obtained by the identification information acquisition unit 207, and extracts data corresponding to the keyword from the obtained attached file. In other words, when searching the file device 400 based on the identification information obtained by the attached file search means 202, the user can quickly and reliably reach the table of the file device 400 in which the corresponding data exists. The corresponding desired data can be retrieved.

このようにして取り出されたデータは、表示制御手段206へ送られ、表示制御手段206は、上記データベース検索手段201が取り出したデータに基づく表示を検索端末101に送って、その表示手段において表示を行うようにする。   The data extracted in this way is sent to the display control means 206, and the display control means 206 sends a display based on the data extracted by the database search means 201 to the search terminal 101, and displays the display on the display means. To do.

上記添付ファイル検索手段202が取り出したデータについて、表示データ加工手段203は、上記データベース検索手段201により得られたデータと共に加工を行う。例えば、検索端末101に一覧表示するデータ内に、添付ファイル検索手段202が取り出したパンフレットや取扱説明書などのデータを最小限個別に含ませて加工する処理を行う。表示処理手段204は、上記加工されたデータを検索端末101の表示手段(LED等の表示器)に表示可能な表示データとして送出する。   The display data processing unit 203 processes the data extracted by the attached file search unit 202 together with the data obtained by the database search unit 201. For example, a process is performed in which data such as a pamphlet or an instruction manual extracted by the attached file search means 202 is included at least individually in data displayed in a list on the search terminal 101 and processed. The display processing unit 204 sends the processed data as display data that can be displayed on a display unit (a display such as an LED) of the search terminal 101.

以上のような構成において、上記第1のクローラ収集手段503は、任意の時刻に処理を行うことができる。例えば、午前0時からの6時間中において1分間隔で処理を行うことができる。また、第2のクローラ収集手段504についても、上記と同様に任意の時刻に処理を行うことができる。   In the above configuration, the first crawler collection unit 503 can perform processing at any time. For example, processing can be performed at one-minute intervals during six hours from midnight. Also, the second crawler collecting means 504 can perform processing at an arbitrary time in the same manner as described above.

上記のように、第1のクローラ収集手段503により第1のインデックスファイル501に第1のインデックステーブルが収集されており、第2のクローラ収集手段504により第2のインデックスファイル502に第2のインデックステーブルが収集されている。このときに、検索端末101からキーワードの検索要求がされると、図6に示すフローチャートに示すような処理が行われる。   As described above, the first index table is collected in the first index file 501 by the first crawler collecting unit 503, and the second index file is stored in the second index file 502 by the second crawler collecting unit 504. Tables are being collected. At this time, when a search request for a keyword is made from the search terminal 101, processing as shown in the flowchart in FIG. 6 is performed.

検索端末101からキーワードの検索要求がされると、検索処理が開始される。検索端末101から与えられたキーワードに基づき第1のインデックスファイル501に対する検索を行い、該当する第1のインデックステーブルにおける主キー情報である「商品番号」を取得して、内部メモリテーブルA(図1)へ格納する(S11)。   When a search request for a keyword is made from the search terminal 101, a search process is started. The first index file 501 is searched based on the keyword given from the search terminal 101, and the “product number” which is the primary key information in the corresponding first index table is acquired, and the internal memory table A (FIG. ) (S11).

次に、検索端末101から与えられたキーワードに基づき第2のインデックスファイル502に対する検索を行い、該当する第2のインデックステーブルにおける識別情報である「商品番号_連番」を取得して、「商品番号」部分のみを内部メモリテーブルB(図1)へ格納する(S12)。   Next, a search is performed on the second index file 502 based on the keyword provided from the search terminal 101, and “product number_serial number” which is identification information in the corresponding second index table is obtained. Only the "number" portion is stored in the internal memory table B (FIG. 1) (S12).

次に、内部メモリテーブルAの主キー情報と内部メモリテーブルBの論理和を作成し、内部メモリテーブルC(図1)に格納する(S13)。つまり、同じ「商品番号」があれば1つとする。このようにして、データベース300とファイル装置400を曖昧検索し、一致した主キー情報(「商品番号」)を高速に得ることができる。次に、内部メモリテーブルCの主キー情報のみを用いてデータベース300へアクセスし、得られた該当テーブルから上記キーワードに対応するデータを取り出すものである(S14:データベース検索手段201)。   Next, a logical sum of the primary key information of the internal memory table A and the internal memory table B is created and stored in the internal memory table C (FIG. 1) (S13). That is, if there is the same “product number”, it is determined to be one. In this way, the database 300 and the file device 400 are vaguely searched, and the matched primary key information (“product number”) can be obtained at high speed. Next, the database 300 is accessed using only the primary key information of the internal memory table C, and data corresponding to the keyword is extracted from the obtained table (S14: database search means 201).

上記で取り出されたデータを加工して(S15:表示データ加工手段203)、検索端末101へ送って表示手段へ表示する(S16:表示処理手段204)。   The data extracted above is processed (S15: display data processing means 203), sent to the search terminal 101 and displayed on the display means (S16: display processing means 204).

上記表示制御手段206は、上記添付ファイル検索手段が取り出したデータがない場合には、上記データベース検索手段が取り出したデータのみに基づく表示を前記表示手段に行うことができる。また、上記表示制御手段206は、上記データベース検索手段201が取り出したデータ及び上記添付ファイル検索手段202が取り出したデータがない場合には、検索結果が得られないことの表示を上記表示手段に行うことができる。   If there is no data retrieved by the attached file retrieval means, the display control means 206 can provide a display based on only the data retrieved by the database retrieval means on the display means. When there is no data retrieved by the database retrieval means 201 and no data retrieved by the attached file retrieval means 202, the display control means 206 displays on the display means that no retrieval result is obtained. be able to.

なお、本実施形態では、識別情報である「商品番号_連番」を用いてファイル装置400を検索してデータを得る処理を行わないが、内部メモリテーブルBの情報を用いてファイル装置400から添付ファイル検索手段202による検索を行って、得られたデータを表示データ加工手段203が加工して一覧表示する情報としてまとめても良い。これにより、この情報を用いファイル装置400へアクセスし対応するパンフレットや取扱説明書などのデータをダウンロードして表示することが可能となる。   In this embodiment, the process of searching the file device 400 using the “product number_serial number” that is the identification information to obtain the data is not performed, but the process performed by the file device 400 using the information of the internal memory table B is not performed. A search by the attached file search unit 202 may be performed, and the obtained data may be processed by the display data processing unit 203 and collected as information to be displayed in a list. This makes it possible to access the file device 400 using this information and download and display the corresponding data such as pamphlets and instruction manuals.

上記の構成に対し本実施形態は、データベース検索手段201が第1のインデックスファイル501の検索結果である主キー情報を用いるのではなく、主キー情報取得手段205の処理の処理を行わずに直接にデータベース300をSQLによって検索する構成を採ることはない。即ち、このような構成によると、検索端末101からのキーワードで列項目である「商品番号」、「商品名」、「商品名カナ」をそれぞれ前方後方中間一致の条件により検索する必要が生じ、データベースシステムとしては負荷が大きくレスポンスの悪いものとなる。検索キーワードによる検索が、データベース300における複数テーブルに跨るようなものである場合には、直接にデータベース300を検索するためのSQLが非常に複雑となることから、この点においても上記構成を本実施形態では採用していないことが理解できる。   In contrast to the above configuration, in the present embodiment, the database search unit 201 does not use the primary key information that is the search result of the first index file 501, but directly performs the processing of the process of the primary key information acquisition unit 205. Does not employ a configuration in which the database 300 is searched by SQL. That is, according to such a configuration, it becomes necessary to search for the column items “product number”, “product name”, and “product name Kana” using the keyword from the search terminal 101 under the conditions of front and rear middle match, respectively. As a database system, the load is large and the response is poor. When the search by the search keyword is performed over a plurality of tables in the database 300, the SQL for directly searching the database 300 becomes very complicated. It can be understood that this is not adopted in the form.

以上のように本実施形態によれば、データベース及び全文検索エンジンに特殊・特別な変形・加工を加えることなく、データベースの各テーブルに分散する項目(カラム)を検索対象項目にした曖昧処理により、目的のデータを効率良く高速に検索できる効果(本実施形態の効果という)を奏する。   As described above, according to the present embodiment, without applying any special, special deformation or processing to the database and the full-text search engine, the ambiguous processing in which the items (columns) distributed in each table of the database are used as the search target items, There is an effect that the target data can be searched efficiently and at high speed (referred to as an effect of the present embodiment).

なお、上記の実施形態は、添付ファイルが存在する場合の構成であるが、添付ファイルが無く、ファイル装置400を備えない構成を採用することができる。この場合には、ファイル装置400以外に、第2のクローラ収集手段504、第2のインデックスファイル502、識別情報取得手段207、添付ファイル検索手段202は不要である。この場合においても、上記実施形態の効果と同じ効果を得ることが可能である。   Note that the above embodiment is a configuration in a case where an attached file exists, but a configuration without an attached file and not having the file device 400 can be adopted. In this case, other than the file device 400, the second crawler collection unit 504, the second index file 502, the identification information acquisition unit 207, and the attached file search unit 202 are unnecessary. Also in this case, it is possible to obtain the same effect as that of the above embodiment.

101 検索端末
200 本検索装置
201 データベース検索手段
202 添付ファイル検索手段
203 表示データ加工手段
204 表示処理手段
205 主キー情報取得手段
206 表示制御手段
207 識別情報取得手段
300 データベース
400 ファイル装置
500 全文検索エンジン
501 第1のインデックスファイル
502 第2のインデックスファイル
503 第1のクローラ収集手段
504 第2のクローラ収集手段
101 search terminal 200 main search device 201 database search means 202 attached file search means 203 display data processing means 204 display processing means 205 primary key information acquisition means 206 display control means 207 identification information acquisition means 300 database 400 file device 500 full text search engine 501 First index file 502 Second index file 503 First crawler collecting means 504 Second crawler collecting means

Claims (14)

管理対象データが蓄積されたデータベースと、
前記データベースを検索し、前記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段と、
検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段と、
前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段と、
情報を表示する表示手段と、
前記データベース検索手段が取り出したデータに基づく表示を前記表示手段に行う表示制御手段と
を具備することを特徴とするデータ検索システム。
A database in which managed data is stored,
The database is searched, a table which is one unit of the management target data is specified, and a unique value for all specified tables is set as primary key information. First crawler collecting means for creating a first index table in which the target information is attributed as attribute information, and generating a first index file in which the first index table is put together;
When a keyword to be searched is given, the first index file is searched, a first index table including data corresponding to the keyword is detected, and a main key information of the first index table is obtained. Key information acquisition means;
A database search unit that searches the database based on the primary key information obtained by the primary key information acquisition unit and retrieves data corresponding to the keyword from the obtained corresponding table;
Display means for displaying information;
A display control means for performing a display on the display means based on the data retrieved by the database search means.
前記データベースのテーブルのデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置と、
前記ファイル装置内を検索して前記添付ファイルの所要データをクローラ収集して、ユニークな値を識別情報に該当添付ファイルの前記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイルを生成する第2のクローラ収集手段と、
検索すべきキーワードが与えられると、前記第2のインデックスファイルを検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求める識別情報取得手段と、
前記識別情報取得手段が求めた識別情報に基づき前記ファイル装置を検索し、得られた該当添付ファイルから前記キーワードに対応するデータを取り出す添付ファイル検索手段と
を具備し、
前記表示手段は、前記添付ファイル検索手段が取り出したデータに基づく表示を前記表示手段に行うことを特徴とする請求項1に記載のデータ検索システム。
A file device in which attached files under a directory of data of the database table are stored;
The file device is searched to collect required data of the attached file by crawler, and a second index table is created in which a unique value is assigned to identification information to the required data of the attached file. Second crawler collection means for generating a second index file that summarizes the index tables of
When a keyword to be searched is given, the second index file is searched, a second index table including data corresponding to the keyword is detected, and identification information for identifying the second index table is obtained. Acquisition means;
Attached file search means for searching the file device based on the identification information obtained by the identification information obtaining means, and extracting data corresponding to the keyword from the obtained attached file,
2. The data search system according to claim 1, wherein the display unit performs a display on the display unit based on the data extracted by the attached file search unit.
前記表示制御手段は、前記添付ファイル検索手段が取り出したデータがない場合には、前記データベース検索手段が取り出したデータのみに基づく表示を前記表示手段に行うことを特徴とする請求項1に記載のデータ検索システム。   2. The display control unit according to claim 1, wherein when there is no data extracted by the attached file search unit, the display control unit performs display based on only the data extracted by the database search unit on the display unit. 3. Data retrieval system. 前記表示制御手段は、前記データベース検索手段が取り出したデータ及び前記添付ファイル検索手段が取り出したデータがない場合には、検索結果が得られないことの表示を前記表示手段に行うことを特徴とする請求項2に記載のデータ検索システム。   When there is no data retrieved by the database retrieval unit and no data retrieved by the attached file retrieval unit, the display control unit displays on the display unit that no retrieval result is obtained. The data search system according to claim 2. 前記第1のクローラ収集手段及び前記第2のクローラ収集手段は、形態素解析とN−Gramのいずれかにより検索を行うことを特徴とする請求項2に記載のデータ検索システム。   The data search system according to claim 2, wherein the first crawler collection unit and the second crawler collection unit perform a search by one of morphological analysis and N-Gram. 前記第1のクローラ収集手段は、任意の時刻に処理を行うことを特徴とする請求項1に記載のデータ検索システム。   2. The data search system according to claim 1, wherein the first crawler collection unit performs processing at an arbitrary time. 前記第1のクローラ収集手段及び前記第2のクローラ収集手段は、任意の時刻に処理を行うことを特徴とする請求項2に記載のデータ検索システム。   3. The data search system according to claim 2, wherein the first crawler collection unit and the second crawler collection unit perform processing at an arbitrary time. 管理対象データが蓄積されたデータベースのデータを検索するデータ検索システムのコンピュータを、
前記データベースを検索し、前記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段、
検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段、
前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段、
前記データベース検索手段が取り出したデータに基づく表示を表示手段に行う表示制御手段
として機能させることを特徴とするデータ検索用プログラム。
A computer of a data search system that searches for data in a database in which data to be managed is stored,
The database is searched, a table which is one unit of the management target data is specified, and a unique value for all specified tables is set as primary key information. A first crawler collection unit that creates a first index table in which the target information is attributed as attribute information, and generates a first index file in which the first index table is put together;
When a keyword to be searched is given, the first index file is searched, a first index table including data corresponding to the keyword is detected, and a main key information of the first index table is obtained. Key information acquisition means,
A database search unit that searches the database based on the primary key information obtained by the primary key information acquisition unit and retrieves data corresponding to the keyword from the obtained corresponding table;
A data search program for functioning as display control means for causing a display means to perform display based on data retrieved by the database search means.
前記コンピュータを更に、
前記データベースのテーブルのデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置内を検索して前記添付ファイルの所要データをクローラ収集して、ユニークな値を識別情報に該当添付ファイルの前記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイルを生成する第2のクローラ収集手段、
検索すべきキーワードが与えられると、前記第2のインデックスファイルを検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求める識別情報取得手段、
前記識別情報取得手段が求めた識別情報に基づき前記ファイル装置を検索し、得られた該当添付ファイルから前記キーワードに対応するデータを取り出す添付ファイル検索手段
として機能させ、
前記コンピュータを前記表示制御手段として、前記添付ファイル検索手段が取り出したデータに基づく表示を前記表示手段に行うように機能させることを特徴とする請求項8に記載のデータ検索用プログラム。
Further comprising the computer
The required data of the attached file is crawled and collected by searching the file device in which the attached file under the directory of the data of the database table is stored, and the required data of the attached file is identified by a unique value as identification information. A second crawler collecting means for creating an imputed second index table and generating a second index file summarizing the second index table;
When a keyword to be searched is given, the second index file is searched, a second index table including data corresponding to the keyword is detected, and identification information for identifying the second index table is obtained. Acquisition means,
Searching the file device based on the identification information obtained by the identification information acquisition means, and functioning as an attachment file search means for extracting data corresponding to the keyword from the obtained attachment file;
9. The data search program according to claim 8, wherein the computer is caused to function as the display control unit so that the display unit performs a display based on the data extracted by the attached file search unit.
前記コンピュータを前記表示制御手段として、前記添付ファイル検索手段が取り出したデータがない場合には、前記データベース検索手段が取り出したデータのみに基づく表示を前記表示手段に行うように機能させることを特徴とする請求項8に記載のデータ検索用プログラム。   The computer as the display control unit, wherein when there is no data retrieved by the attached file retrieval unit, the computer is made to function to display on the display unit based only on the data retrieved by the database retrieval unit. The data search program according to claim 8, 前記コンピュータを前記表示制御手段として、前記データベース検索手段が取り出したデータ及び前記添付ファイル検索手段が取り出したデータがない場合には、検索結果が得られないことの表示を前記表示手段に行うように機能させることを特徴とする請求項9に記載のデータ検索用プログラム。   When the computer is used as the display control unit, if there is no data retrieved by the database retrieval unit and no data retrieved by the attached file retrieval unit, a display indicating that a retrieval result cannot be obtained is displayed on the display unit. The data search program according to claim 9, wherein the program is caused to function. 前記コンピュータを前記第1のクローラ収集手段及び前記第2のクローラ収集手段として、形態素解析とN−Gramのいずれかにより検索を行うように機能させることを特徴とする請求項9に記載のデータ検索システム。   10. The data search according to claim 9, wherein the computer functions as the first crawler collection unit and the second crawler collection unit to perform a search by one of morphological analysis and N-Gram. system. 前記コンピュータを前記第1のクローラ収集手段として、任意の時刻に処理を行うように機能させることを特徴とする請求項8に記載のデータ検索用プログラム。   9. The data search program according to claim 8, wherein the computer functions as the first crawler collection unit to perform processing at an arbitrary time. 前記コンピュータを前記第1のクローラ収集手段及び前記第2のクローラ収集手段として、任意の時刻に処理を行うように機能させることを特徴とする請求項9に記載のデータ検索用プログラム。   The computer-readable storage medium according to claim 9, wherein the computer functions as the first crawler collection unit and the second crawler collection unit to perform processing at an arbitrary time.
JP2018171603A 2018-09-13 2018-09-13 Data search system and data search program Active JP6949449B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018171603A JP6949449B2 (en) 2018-09-13 2018-09-13 Data search system and data search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018171603A JP6949449B2 (en) 2018-09-13 2018-09-13 Data search system and data search program

Publications (2)

Publication Number Publication Date
JP2020042722A true JP2020042722A (en) 2020-03-19
JP6949449B2 JP6949449B2 (en) 2021-10-13

Family

ID=69799404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018171603A Active JP6949449B2 (en) 2018-09-13 2018-09-13 Data search system and data search program

Country Status (1)

Country Link
JP (1) JP6949449B2 (en)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029898A (en) * 1998-07-14 2000-01-28 Hitachi Ltd Sql generation system
JP2008009918A (en) * 2006-06-30 2008-01-17 Fujitsu Ltd Program, device and method for creating index
JP2012104075A (en) * 2010-11-15 2012-05-31 Ricoh Co Ltd Information retrieval system, information collection apparatus, information retrieval apparatus, information collection method, program and recording medium
JP2012212212A (en) * 2011-03-30 2012-11-01 Mitsubishi Electric Corp Data retrieval device, data retrieval method and program
JP2013117873A (en) * 2011-12-02 2013-06-13 Hitachi Systems Ltd Database processing method
JP2014013541A (en) * 2012-07-05 2014-01-23 Sony Corp Information processing device, information processing method, program, and information processing system
US20140250097A1 (en) * 2013-03-04 2014-09-04 Avaya Inc. Systems and methods for indexing and searching reporting data
JP2015011629A (en) * 2013-07-01 2015-01-19 株式会社リコー Information processing device, second information processing device, communication terminal, communication system, and program
JP2019512124A (en) * 2016-02-26 2019-05-09 アーミク カンパニー,リミテッド Method and apparatus for archiving database generating index information, search method and apparatus for archived database including index information

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029898A (en) * 1998-07-14 2000-01-28 Hitachi Ltd Sql generation system
JP2008009918A (en) * 2006-06-30 2008-01-17 Fujitsu Ltd Program, device and method for creating index
JP2012104075A (en) * 2010-11-15 2012-05-31 Ricoh Co Ltd Information retrieval system, information collection apparatus, information retrieval apparatus, information collection method, program and recording medium
JP2012212212A (en) * 2011-03-30 2012-11-01 Mitsubishi Electric Corp Data retrieval device, data retrieval method and program
JP2013117873A (en) * 2011-12-02 2013-06-13 Hitachi Systems Ltd Database processing method
JP2014013541A (en) * 2012-07-05 2014-01-23 Sony Corp Information processing device, information processing method, program, and information processing system
US20140250097A1 (en) * 2013-03-04 2014-09-04 Avaya Inc. Systems and methods for indexing and searching reporting data
JP2015011629A (en) * 2013-07-01 2015-01-19 株式会社リコー Information processing device, second information processing device, communication terminal, communication system, and program
JP2019512124A (en) * 2016-02-26 2019-05-09 アーミク カンパニー,リミテッド Method and apparatus for archiving database generating index information, search method and apparatus for archived database including index information

Also Published As

Publication number Publication date
JP6949449B2 (en) 2021-10-13

Similar Documents

Publication Publication Date Title
US9639579B2 (en) Determination of a desired repository for retrieving search results
CA2583042C (en) Providing information relating to a document
US6792414B2 (en) Generalized keyword matching for keyword based searching over relational databases
US8700568B2 (en) Entity normalization via name normalization
US6801904B2 (en) System for keyword based searching over relational databases
US7657515B1 (en) High efficiency document search
US7672971B2 (en) Modular architecture for entity normalization
US7765209B1 (en) Indexing and retrieval of blogs
US20070250501A1 (en) Search result delivery engine
WO2006076805A1 (en) Method and apparatus for ordering items within datasets
US8423885B1 (en) Updating search engine document index based on calculated age of changed portions in a document
JP6165955B1 (en) Method and system for matching images and content using whitelist and blacklist in response to search query
US7657513B2 (en) Adaptive help system and user interface
US20080059432A1 (en) System and method for database indexing, searching and data retrieval
CN111400323B (en) Data retrieval method, system, equipment and storage medium
KR101892067B1 (en) Method for storing and searching of text logdata based relational database
US20090055374A1 (en) Method and apparatus for generating search keys based on profile information
JP2003173280A (en) Apparatus, method and program for generating database
CN107229714B (en) Full-text search engine based on distributed database
JP6949449B2 (en) Data search system and data search program
JP2005056223A (en) Text data retrieval system, method therefor and its program
Pu et al. Frisk: Keyword query cleaning and processing in action
Sima et al. Keyword query approach over rdf data based on tree template
US9607053B2 (en) Methods and systems for searching and displaying a plurality of entities within an interactive user interface
Sharma et al. A novel context based indexing of web documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210921

R150 Certificate of patent or registration of utility model

Ref document number: 6949449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150