JP2014178902A - Retrieval system, search term dictionary generation device, program, storage medium, and search term dictionary generation method - Google Patents

Retrieval system, search term dictionary generation device, program, storage medium, and search term dictionary generation method Download PDF

Info

Publication number
JP2014178902A
JP2014178902A JP2013052548A JP2013052548A JP2014178902A JP 2014178902 A JP2014178902 A JP 2014178902A JP 2013052548 A JP2013052548 A JP 2013052548A JP 2013052548 A JP2013052548 A JP 2013052548A JP 2014178902 A JP2014178902 A JP 2014178902A
Authority
JP
Japan
Prior art keywords
search
word dictionary
appearance frequency
storage unit
search system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013052548A
Other languages
Japanese (ja)
Other versions
JP6131646B2 (en
Inventor
Mitsuhisa Kaneya
光久 金矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013052548A priority Critical patent/JP6131646B2/en
Publication of JP2014178902A publication Critical patent/JP2014178902A/en
Application granted granted Critical
Publication of JP6131646B2 publication Critical patent/JP6131646B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide a retrieval system, search term dictionary generation device, program, storage medium and search term dictionary generation method capable of enhancing retrieval efficiency.SOLUTION: A retrieval system comprises a database server 10 for storing data, a collection unit 211 for collecting data from the database server 10, and an index generation unit 213 for generating an index in which a keyword used for retrieval within the retrieval system and property information designating at least one of inside of the retrieval system and outside of the retrieval system as a target of retrieval are associated with each other on the basis of the collected data, and for registering the index in an index storage unit 205.

Description

本発明は、検索システム、検索語辞書生成装置、プログラム、記憶媒体及び検索語辞書生成方法に関する。   The present invention relates to a search system, a search word dictionary generation device, a program, a storage medium, and a search word dictionary generation method.

従来から、データ検索に関する種々の技術が知られている(例えば、特許文献1〜5参照)。   Conventionally, various techniques relating to data retrieval are known (see, for example, Patent Documents 1 to 5).

ところで、上述したような従来技術では、ユーザ自身で検索対象を選択し、選択した検索対象に対して検索を行う必要があるため、検索の効率性が悪くなることがある。   By the way, in the conventional technology as described above, since it is necessary to select a search target by the user and to perform a search for the selected search target, the search efficiency may be deteriorated.

例えば、上述したような従来技術では、ユーザが、企業システム内にあるデータ群を検索対象とするかインターネット上にあるデータ群を検索対象とするかを選択する。そして、企業システム内にあるデータ群を検索対象とした場合、企業システム検索用の検索エンジンなどで企業システム内にあるデータ群を検索し、インターネット上にあるデータ群を検索対象とした場合、インターネット検索用の検索エンジンなどでインターネット上にあるデータ群を検索する。   For example, in the conventional technology as described above, the user selects whether to search a data group in the corporate system or a data group on the Internet. When a data group in the corporate system is a search target, a data group in the corporate system is searched by a search engine for searching the corporate system and a data group on the Internet is searched. Search the data group on the Internet with a search engine for search.

ここで、例えば、ユーザが、企業システム内にあるデータ群での検索を最初に選択し、この検索結果である検索件数が少なかったとする。この場合、ユーザがインターネット上にあるデータ群を新たに選択して再度検索を行うことが想定されるが、このような検索方法では、検索の効率性が悪い。   Here, for example, it is assumed that the user first selects the search in the data group in the company system, and the number of search results as the search result is small. In this case, it is assumed that the user newly selects a data group on the Internet and performs a search again. However, such a search method has poor search efficiency.

なお、全ての検索対象を無条件に検索するようにすれば、検索回数は1回で足りるが、この場合、検索に時間を要してしまい、やはり、検索の効率性が悪い。   If all the search objects are searched unconditionally, the number of searches is one, but in this case, the search takes time and the efficiency of the search is also poor.

本発明は、上記事情に鑑みてなされたものであり、検索の効率性を高めることが可能な検索システム、検索語辞書生成装置、プログラム、記憶媒体及び検索語辞書生成方法を提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object thereof is to provide a search system, a search word dictionary generation device, a program, a storage medium, and a search word dictionary generation method capable of improving the efficiency of search. And

上述した課題を解決し、目的を達成するために、本発明の一態様にかかる検索システムは、検索システムであって、データを記憶するデータ記憶部と、前記データ記憶部から前記データを収集する収集部と、収集した前記データに基づいて、前記検索システム内部での検索に用いられる検索語と、前記検索システムの内部及び前記検索システムの外部の少なくとも一方を検索対象に指定する属性情報と、を対応付けた検索語辞書を生成し、検索語辞書記憶部に登録する検索語辞書生成部と、を備える。   In order to solve the above-described problems and achieve the object, a search system according to an aspect of the present invention is a search system, and a data storage unit that stores data, and the data is collected from the data storage unit A collection unit, based on the collected data, a search term used for a search inside the search system, and attribute information for designating at least one of the inside of the search system and the outside of the search system as a search target; And a search word dictionary generating unit that generates a search word dictionary associated with the search word dictionary and registers it in the search word dictionary storage unit.

本発明によれば、検索の効率性を高めることが可能という効果を奏する。   According to the present invention, it is possible to increase the efficiency of search.

図1は、本実施形態の検索システムの構成の一例を示すブロック図である。FIG. 1 is a block diagram illustrating an example of a configuration of a search system according to the present embodiment. 図2は、本実施形態のインデックスサーバの構成の一例を示すブロック図である。FIG. 2 is a block diagram showing an example of the configuration of the index server of the present embodiment. 図3は、本実施形態のインデックスサーバで実行されるインデックス生成処理の一例を示すフローチャート図である。FIG. 3 is a flowchart showing an example of index generation processing executed by the index server of this embodiment. 図4は、本実施形態の検索システムで実行される検索処理の一例を示すフローチャート図である。FIG. 4 is a flowchart showing an example of search processing executed by the search system of this embodiment. 図5は、本実施形態のインデックスサーバで実行される属性決定処理の一例を示すフローチャート図である。FIG. 5 is a flowchart showing an example of attribute determination processing executed by the index server of this embodiment. 図6は、変形例のインデックスサーバで実行される属性決定処理の一例を示すフローチャート図である。FIG. 6 is a flowchart illustrating an example of attribute determination processing executed by the index server according to the modification. 図7は、本実施形態及び変形例の検索システムの各装置のハードウェア構成の一例を示す図である。FIG. 7 is a diagram illustrating an example of a hardware configuration of each device of the search system according to the present embodiment and the modification.

以下、添付図面を参照しながら、本発明にかかる検索システム、検索語辞書生成装置、プログラム、記憶媒体及び検索語辞書生成方法の形態を詳細に説明する。   Hereinafter, embodiments of a search system, a search word dictionary generation device, a program, a storage medium, and a search word dictionary generation method according to the present invention will be described in detail with reference to the accompanying drawings.

まず、本実施形態の検索システムの構成について説明する。   First, the configuration of the search system of this embodiment will be described.

図1は、本実施形態の検索システム1の構成の一例を示すブロック図である。図1に示すように、検索システム1は、データベースサーバ10−1〜10−N(N≧2)と、インデックスサーバ20と、管理者端末30と、ユーザ端末40と、検索制御サーバ50とを、備える。データベースサーバ10−1〜10−N(N≧2)、インデックスサーバ20、管理者端末30、ユーザ端末40、及び検索制御サーバ50は、LAN(Local Area Network)2を介して接続されている。   FIG. 1 is a block diagram illustrating an example of a configuration of a search system 1 according to the present embodiment. As shown in FIG. 1, the search system 1 includes a database server 10-1 to 10-N (N ≧ 2), an index server 20, an administrator terminal 30, a user terminal 40, and a search control server 50. Prepare. The database servers 10-1 to 10 -N (N ≧ 2), the index server 20, the administrator terminal 30, the user terminal 40, and the search control server 50 are connected via a LAN (Local Area Network) 2.

本実施形態の検索システム1は、主として、企業等の経済主体において構築されていることを想定しているが、これに限定されるものではない。   Although it is assumed that the search system 1 of the present embodiment is mainly constructed by an economic entity such as a company, it is not limited to this.

また、検索システム1(LAN2)は、ファイアウォール3を介してインターネット4と接続されており、インターネット4上に存在する外部検索サーバ60にアクセス可能となっている。   The search system 1 (LAN 2) is connected to the Internet 4 via the firewall 3 and can access an external search server 60 existing on the Internet 4.

データベースサーバ10−1〜10−N(データ記憶部の一例)は、検索システム1が構築されている経済主体に関するデータを記憶するものであり、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)などの大容量の不揮発性記憶装置を有するコンピュータなどにより実現できる。経済主体に関するデータは、主として、経済主体の経済活動に伴う文書情報(文書ファイル)、画像情報(画像ファイル)、及び音声情報(音声ファイル)などを想定しているが、これに限定されるものではない。   The database servers 10-1 to 10-N (an example of a data storage unit) store data relating to economic entities in which the search system 1 is constructed. For example, HDDs (Hard Disk Drive) and SSDs (Solid State) It can be realized by a computer having a large-capacity nonvolatile storage device such as a drive. Data related to economic entities mainly assumes document information (document files), image information (image files), audio information (audio files) associated with economic activities of economic entities, but is not limited to this. is not.

なお、以下の説明では、データベースサーバ10−1〜10−Nを各々区別する必要がない場合は、単にデータベースサーバ10と称する場合がある。   In the following description, when there is no need to distinguish the database servers 10-1 to 10-N, they may be simply referred to as the database server 10.

インデックスサーバ20は、検索に用いられるインデックスの生成や管理などを行うものであり、コンピュータなどにより実現できる。   The index server 20 generates and manages an index used for search, and can be realized by a computer or the like.

管理者端末30は、検索システム1の管理者が使用する端末装置であり、例えば、PC(Personal Computer)などにより実現できる。   The administrator terminal 30 is a terminal device used by the administrator of the search system 1 and can be realized by, for example, a PC (Personal Computer).

ユーザ端末40は、検索システム1のユーザが使用する端末装置であり、例えば、PCなどにより実現できる。   The user terminal 40 is a terminal device used by a user of the search system 1 and can be realized by, for example, a PC.

検索制御サーバ50は、検索システム1内での検索(インデックスサーバ20での検索)と検索システム1外での検索(インターネット4上での検索)とを制御するものであり、コンピュータなどにより実現できる。また、検索制御サーバ50は、検索システム1内での検索用の検索エンジンなど、検索システム1内での検索サービスを提供する。   The search control server 50 controls the search in the search system 1 (search in the index server 20) and the search outside the search system 1 (search on the Internet 4), and can be realized by a computer or the like. . The search control server 50 provides a search service in the search system 1 such as a search engine for search in the search system 1.

外部検索サーバ60は、インターネット4上での検索用の検索エンジンなど、インターネット4上での検索サービスを提供するものであり、コンピュータなどにより実現できる。外部検索サーバ60の実現主体としては、Google(登録商標)やYahoo!(登録商標)などが挙げられる。   The external search server 60 provides a search service on the Internet 4 such as a search engine for searching on the Internet 4 and can be realized by a computer or the like. As an implementation main body of the external search server 60, Google (registered trademark) or Yahoo! (Registered trademark).

図2は、本実施形態のインデックスサーバ20の構成の一例を示すブロック図である。図2に示すように、インデックスサーバ20は、出現頻度情報記憶部201と、シソーラス記憶部203と、インデックス記憶部205と、収集部211と、インデックス生成部213と、インデックス入出力部215と、インデックス管理部217と、検索入出力部219と、検索条件生成部221と、検索部223とを、備える。   FIG. 2 is a block diagram showing an example of the configuration of the index server 20 of the present embodiment. As shown in FIG. 2, the index server 20 includes an appearance frequency information storage unit 201, a thesaurus storage unit 203, an index storage unit 205, a collection unit 211, an index generation unit 213, an index input / output unit 215, The index management unit 217, the search input / output unit 219, the search condition generation unit 221, and the search unit 223 are provided.

出現頻度情報記憶部201、シソーラス記憶部203、及びインデックス記憶部205は、例えば、HDD、SSD、メモリカード、光ディスク、ROM(Read Only Memory)、及びRAM(Random Access Memory)などの磁気的、光学的、又は電気的に記憶可能な記憶装置により実現できる。収集部211、インデックス生成部213、インデックス入出力部215、インデックス管理部217、検索入出力部219、検索条件生成部221、及び検索部223は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現できる。   The appearance frequency information storage unit 201, the thesaurus storage unit 203, and the index storage unit 205 are, for example, magnetic, optical such as HDD, SSD, memory card, optical disk, ROM (Read Only Memory), and RAM (Random Access Memory). It can be realized by a storage device that can store data electrically or electrically. The collection unit 211, the index generation unit 213, the index input / output unit 215, the index management unit 217, the search input / output unit 219, the search condition generation unit 221, and the search unit 223 are, for example, a processing device such as a CPU (Central Processing Unit) Can be implemented by software.

出現頻度情報記憶部201は、検索語毎に、検索システム1の内部での検索における内部出現頻度と、検索システム1の外部での検索における外部出現頻度と、を対応付けて記憶する。   The appearance frequency information storage unit 201 stores, for each search word, the internal appearance frequency in the search inside the search system 1 and the external appearance frequency in the search outside the search system 1 in association with each other.

検索語は、例えば、キーワードなどである。内部出現頻度は、検索システム1の内部での検索、即ち、データベースサーバ10内でのキーワードの出現頻度である。外部出現頻度は、検索システム1の外部での検索、即ち、インターネット4上でのキーワードの出現頻度である。   The search term is, for example, a keyword. The internal appearance frequency is a search inside the search system 1, that is, an appearance frequency of a keyword in the database server 10. The external appearance frequency is a search outside the search system 1, that is, a keyword appearance frequency on the Internet 4.

内部出現頻度は、例えば、後述の検索部223がキーワードをデータベースサーバ10内で検索することにより、求められる。また、外部出現頻度は、例えば、外部検索サーバ60がキーワードをインターネット4上で検索することにより、求められる。なお、内部出現頻度及び外部出現頻度は、収集対象の母数(全検索件数)により正規化されているものとする。   The internal appearance frequency is obtained by, for example, a search unit 223 (to be described later) searching for keywords in the database server 10. The external appearance frequency is obtained, for example, when the external search server 60 searches for keywords on the Internet 4. It is assumed that the internal appearance frequency and the external appearance frequency are normalized by the population parameter (total number of searches).

シソーラス記憶部203は、キーワードの正規化に用いられるシソーラス辞書を記憶する。キーワードの正規化としては、例えば、表記の「ゆれ」を取りのぞいたり同義語をまとめたりする処理が挙げられる。   The thesaurus storage unit 203 stores a thesaurus dictionary used for keyword normalization. Examples of keyword normalization include a process of removing the notation “sway” and grouping synonyms.

収集部211は、データベースサーバ10からデータを収集する。本実施形態では、収集部211は、データベースサーバ10から、定期的に(例えば、1日1回)データを収集する。   The collection unit 211 collects data from the database server 10. In the present embodiment, the collection unit 211 collects data from the database server 10 periodically (for example, once a day).

インデックス生成部213(検索語辞書生成部の一例)は、収集部211により収集されたデータに基づいて、検索システム1内部での検索に用いられるキーワード(検索語の一例)と、検索システム1の内部及び検索システム1の外部の少なくとも一方を検索対象に指定する属性情報と、を対応付けたインデックス(検索語辞書の一例)を生成する。ここで、インデックス生成部213は、出現頻度情報記憶部201に記憶されている出現頻度情報に基づいて、属性情報が示す検索対象を決定する。   The index generation unit 213 (an example of a search word dictionary generation unit) uses a keyword (an example of a search word) used for a search in the search system 1 based on the data collected by the collection unit 211, and the search system 1 An index (an example of a search word dictionary) is generated that associates attribute information that designates at least one of the inside and the outside of the search system 1 as a search target. Here, the index generation unit 213 determines a search target indicated by the attribute information based on the appearance frequency information stored in the appearance frequency information storage unit 201.

例えば、インデックス生成部213は、収集部211により収集されたデータに自然言語処理を施し、シソーラス記憶部203に記憶されているシソーラス辞書を用いて正規化することにより、キーワードを抽出する。そしてインデックス生成部213は、出現頻度情報記憶部201に記憶されている出現頻度情報を参照し、抽出したキーワードの内部出現頻度が閾値以上外部出現頻度よりも大きければ、検索システム1の内部を少なくとも検索対象に指定した属性情報を当該キーワードに対応付け、インデックスを生成する。またインデックス生成部213は、抽出したキーワードの内部出現頻度が閾値以上外部出現頻度よりも大きくなければ、検索システム1の外部を少なくとも検索対象に指定した属性情報を当該キーワードに対応付け、インデックスを生成する。   For example, the index generation unit 213 performs natural language processing on the data collected by the collection unit 211 and extracts keywords by normalizing using the thesaurus dictionary stored in the thesaurus storage unit 203. Then, the index generation unit 213 refers to the appearance frequency information stored in the appearance frequency information storage unit 201. If the internal appearance frequency of the extracted keyword is greater than or equal to a threshold and greater than the external appearance frequency, at least the inside of the search system 1 is stored. The index information is generated by associating the attribute information designated as the search target with the keyword. Further, if the internal appearance frequency of the extracted keyword is not greater than the threshold and the external appearance frequency, the index generation unit 213 generates an index by associating at least attribute information specifying the outside of the search system 1 as a search target with the keyword. To do.

そしてインデックス生成部213は、生成したインデックスを、インデックス入出力部215を介してインデックス記憶部205(検索語辞書記憶部の一例)に登録する。   Then, the index generation unit 213 registers the generated index in the index storage unit 205 (an example of a search word dictionary storage unit) via the index input / output unit 215.

インデックス入出力部215は、インデックス記憶部205への入出力を制御する。   The index input / output unit 215 controls input / output to the index storage unit 205.

インデックス管理部217(検索語辞書管理部の一例)は、外部入力に基づいて、インデックス記憶部205に登録されているインデックスの属性情報を書き換える。具体的には、インデックス管理部217は、管理者端末30からの入力に基づいて、インデックス入出力部215を介してインデックス記憶部205に登録されているインデックスの属性情報を書き換える。   The index management unit 217 (an example of a search word dictionary management unit) rewrites the attribute information of the index registered in the index storage unit 205 based on the external input. Specifically, the index management unit 217 rewrites the attribute information of the index registered in the index storage unit 205 via the index input / output unit 215 based on the input from the administrator terminal 30.

これにより、検索システム1の管理者が、新製品の開発コード、新製品の重要な仕様に関する語句、及び新規事業参入分野に関する語句などの機密性が高いキーワードの属性情報を、検索システム1の外部を検索対象に指定しない(検索システム1の内部のみを検索対象に指定する)ように書き換えるなど、実情に即した検索対象の指定が可能となる。   As a result, the administrator of the search system 1 can obtain attribute information of highly confidential keywords such as development codes of new products, phrases related to important specifications of new products, and phrases related to new business entry fields. The search target can be specified in accordance with the actual situation, for example, such that the search target is not specified (only the inside of the search system 1 is specified as the search target).

検索入出力部219は、検索制御サーバ50との間の入出力を制御する。例えば、検索入出力部219は、検索制御サーバ50から検索要求(検索対象のキーワードを特定可能な要求)の入力を受け付けたり、後述の検索部223の検索結果であるインデックスを検索制御サーバ50に出力したりする。   The search input / output unit 219 controls input / output with the search control server 50. For example, the search input / output unit 219 receives an input of a search request (a request that can specify a search target keyword) from the search control server 50, or an index that is a search result of the search unit 223, which will be described later, to the search control server 50. Or output.

検索条件生成部221は、検索入出力部219により受け付けられた検索要求から検索条件(検索対象のキーワードを特定した条件)を生成する。具体的には、検索条件生成部221は、シソーラス記憶部203に記憶されているシソーラス辞書を用いて、検索入出力部219により受け付けられた検索要求を正規化することにより、検索条件を生成する。   The search condition generation unit 221 generates a search condition (a condition that specifies a search target keyword) from the search request received by the search input / output unit 219. Specifically, the search condition generation unit 221 generates a search condition by normalizing the search request received by the search input / output unit 219 using the thesaurus dictionary stored in the thesaurus storage unit 203. .

検索部223(内部検索部の一例)は、検索条件生成部221により生成された検索要求を満足するインデックスを、インデックス入出力部215を介してインデックス記憶部205から検索する。   The search unit 223 (an example of an internal search unit) searches the index storage unit 205 via the index input / output unit 215 for an index that satisfies the search request generated by the search condition generation unit 221.

検索入出力部219は、検索部223の検索結果であるインデックスを検索制御サーバ50に返却する。   The search input / output unit 219 returns the index that is the search result of the search unit 223 to the search control server 50.

ここで、検索制御サーバ50について説明する。   Here, the search control server 50 will be described.

検索制御サーバ50(検索制御部の一例)は、ユーザ端末40に対して、検索システム1内での検索サービス(検索システム1内での検索用の検索エンジンや検索ポータルなど)を提供することで、ユーザ端末40から検索要求を受け付け、インデックスサーバ20に出力する。また検索制御サーバ50は、インデックスサーバ20から検索システム1内での検索結果であるインデックスを受け付ける。   The search control server 50 (an example of a search control unit) provides the user terminal 40 with a search service within the search system 1 (such as a search engine for search within the search system 1 or a search portal). The search request is received from the user terminal 40 and output to the index server 20. The search control server 50 also receives an index that is a search result in the search system 1 from the index server 20.

本実施形態では、このように、検索システム1内での検索を、データベースサーバ10に記憶されているデータのインデックスの検索としているため、検索システム1内での検索速度を向上させることができる。   In the present embodiment, the search in the search system 1 is thus performed as a search for an index of data stored in the database server 10, so that the search speed in the search system 1 can be improved.

そして検索制御サーバ50は、検索されたインデックスに含まれる属性情報が検索システム1の外部を少なくとも検索対象に指定している場合、ユーザ端末40から受け付けた検索要求に基づく検索を外部検索サーバ60(外部検索装置の一例)に要求する。これにより外部検索サーバ60は、当該検索要求に基づく検索をインターネット4上で行い、検索結果を検索制御サーバ50に返却し、検索制御サーバ50は、外部検索サーバ60の検索結果を得る。   When the attribute information included in the searched index specifies at least the outside of the search system 1 as a search target, the search control server 50 performs a search based on the search request received from the user terminal 40 on the external search server 60 ( Request to an example of an external search device. Thereby, the external search server 60 performs a search based on the search request on the Internet 4 and returns the search result to the search control server 50, and the search control server 50 obtains the search result of the external search server 60.

検索制御サーバ50は、検索されたインデックスに含まれる属性情報が検索システム1の内部を検索対象に指定している場合、検索結果として、当該インデックスをユーザ端末40に出力する。また検索制御サーバ50は、検索されたインデックスに含まれる属性情報が検索システム1の外部を検索対象に指定している場合、外部検索サーバ60の検索結果をユーザ端末40に出力する。また検索制御サーバ50は、検索されたインデックスに含まれる属性情報が検索システム1の内部及び外部を検索対象に指定している場合、検索結果として、当該インデックス及び外部検索サーバ60の検索結果をユーザ端末40に出力する。   When the attribute information included in the searched index specifies the inside of the search system 1 as a search target, the search control server 50 outputs the index to the user terminal 40 as a search result. The search control server 50 outputs the search result of the external search server 60 to the user terminal 40 when the attribute information included in the searched index specifies the outside of the search system 1 as a search target. Further, when the attribute information included in the searched index designates the inside and outside of the search system 1 as a search target, the search control server 50 uses the search result of the index and the external search server 60 as a search result. Output to the terminal 40.

次に、本実施形態の検索システムの動作について説明する。   Next, the operation of the search system of this embodiment will be described.

図3は、本実施形態のインデックスサーバ20で実行されるインデックス生成処理の一例を示すフローチャート図である。   FIG. 3 is a flowchart showing an example of index generation processing executed by the index server 20 of this embodiment.

まず、収集部211は、データベースサーバ10からデータを収集する(ステップS101)。   First, the collection unit 211 collects data from the database server 10 (step S101).

続いて、インデックス生成部213は、収集部211により収集されたデータに自然言語処理を施し(ステップS103)、シソーラス記憶部203に記憶されているシソーラス辞書を用いて正規化することにより、キーワードを抽出する(ステップS105)。   Subsequently, the index generation unit 213 performs natural language processing on the data collected by the collection unit 211 (step S103), and normalizes the keywords by using the thesaurus dictionary stored in the thesaurus storage unit 203, thereby obtaining the keywords. Extract (step S105).

続いて、インデックス生成部213は、出現頻度情報記憶部201に記憶されている出現頻度情報に基づいて、抽出したキーワードの属性情報を決定し、キーワードを付与することにより、インデックスを生成する(ステップS107)。   Subsequently, the index generation unit 213 determines the attribute information of the extracted keyword based on the appearance frequency information stored in the appearance frequency information storage unit 201, and generates an index by assigning the keyword (step) S107).

続いて、インデックス生成部213は、生成したインデックスを、インデックス入出力部215を介してインデックス記憶部205に登録する(ステップS109)。   Subsequently, the index generation unit 213 registers the generated index in the index storage unit 205 via the index input / output unit 215 (step S109).

図4は、本実施形態の検索システム1で実行される検索処理の一例を示すフローチャート図である。   FIG. 4 is a flowchart showing an example of a search process executed by the search system 1 of this embodiment.

まず、検索制御サーバ50は、ユーザ端末40から検索要求を受け付ける(ステップS201)。   First, the search control server 50 receives a search request from the user terminal 40 (step S201).

続いて、インデックスサーバ20の検索入出力部219は、検索制御サーバ50から検索要求を受け付け、検索条件生成部221は、検索入出力部219により受け付けられた検索要求から検索条件を生成する(ステップS203)。   Subsequently, the search input / output unit 219 of the index server 20 receives a search request from the search control server 50, and the search condition generation unit 221 generates a search condition from the search request received by the search input / output unit 219 (step) S203).

続いて、検索部223は、検索条件生成部221により生成された検索要求を満足するインデックスを、インデックス入出力部215を介してインデックス記憶部205から検索し(ステップS205)、検索入出力部219は、検索部223の検索結果であるインデックスを検索制御サーバ50に返却する。   Subsequently, the search unit 223 searches the index storage unit 205 via the index input / output unit 215 for an index that satisfies the search request generated by the search condition generation unit 221 (step S205), and the search input / output unit 219. Returns the index, which is the search result of the search unit 223, to the search control server 50.

続いて、検索制御サーバ50は、インデックスサーバ20によりインデックスが検索されている場合(ステップS207でYes)、検索されたインデックスに含まれる属性情報が検索システム1の外部を少なくとも検索対象に指定しているか否かを確認する(ステップS209)。   Subsequently, when the index is searched by the index server 20 (Yes in step S207), the search control server 50 designates at least the outside of the search system 1 as the search target by the attribute information included in the searched index. It is confirmed whether or not there is (step S209).

検索されたインデックスに含まれる属性情報が検索システム1の外部を少なくとも検索対象に指定している場合(ステップS209でYes)、検索制御サーバ50は、ユーザ端末40から受け付けた検索要求に基づく検索を外部検索サーバ60に要求し(ステップS211)、外部検索サーバ60から当該検索要求に基づく検索結果を取得する(ステップS213)。   When the attribute information included in the searched index specifies at least the outside of the search system 1 as a search target (Yes in step S209), the search control server 50 performs a search based on the search request received from the user terminal 40. A request is made to the external search server 60 (step S211), and a search result based on the search request is acquired from the external search server 60 (step S213).

続いて、検索制御サーバ50は、インデックスサーバ20により検索されたインデックスと外部検索サーバ60の検索結果とを統合し(ステップS215)、検索結果として、ユーザ端末40に出力する(ステップS217)。   Subsequently, the search control server 50 integrates the index searched by the index server 20 and the search result of the external search server 60 (step S215), and outputs the search result to the user terminal 40 (step S217).

なお、ステップS209において、検索されたインデックスに含まれる属性情報が検索システム1の外部を少なくとも検索対象に指定していない場合(ステップS209でNo)、検索制御サーバ50は、インデックスサーバ20により検索されたインデックスを、検索結果として、ユーザ端末40に出力する(ステップS217)。   In step S209, when the attribute information included in the searched index does not designate at least the outside of the search system 1 as a search target (No in step S209), the search control server 50 is searched by the index server 20. The index is output to the user terminal 40 as a search result (step S217).

また、ステップS207において、インデックスサーバ20によりインデックスが検索されなかった場合(ステップS207でNo)、検索制御サーバ50は、検索結果として、検索結果なしをユーザ端末40に出力する(ステップS217)。   If no index is searched by the index server 20 in step S207 (No in step S207), the search control server 50 outputs no search result to the user terminal 40 as a search result (step S217).

なお、ステップS207において、インデックスサーバ20によりインデックスが検索されなかった場合も(ステップS207でNo)、検索制御サーバ50は、ユーザ端末40から受け付けた検索要求に基づく検索を外部検索サーバ60に要求するようにしてもよい。   Even in the case where the index is not searched by the index server 20 in step S207 (No in step S207), the search control server 50 requests the external search server 60 to perform a search based on the search request received from the user terminal 40. You may do it.

図5は、本実施形態のインデックスサーバ20で実行される属性決定処理の一例を示すフローチャート図である。   FIG. 5 is a flowchart showing an example of attribute determination processing executed by the index server 20 of this embodiment.

まず、インデックス生成部213は、出現頻度情報記憶部201に記憶されている出現頻度情報を参照し、抽出したキーワードの内部出現頻度と外部出現頻度とを比較する(ステップS301)。   First, the index generation unit 213 refers to the appearance frequency information stored in the appearance frequency information storage unit 201, and compares the internal appearance frequency and the external appearance frequency of the extracted keyword (step S301).

比較の結果、内部出現頻度が閾値以上外部出現頻度よりも大きければ(ステップS303でYes)、インデックス生成部213は、検索システム1の内部を少なくとも検索対象(内部検索優先)に指定した属性情報を当該キーワードに付与する(ステップS305)。   As a result of the comparison, if the internal appearance frequency is greater than or equal to the threshold and greater than the external appearance frequency (Yes in step S303), the index generation unit 213 sets the attribute information that designates at least the inside of the search system 1 as the search target (internal search priority) Assigned to the keyword (step S305).

一方、内部出現頻度が閾値以上外部出現頻度よりも大きくなければ(ステップS303でNo)、インデックス生成部213は、検索システム1の外部を少なくとも検索対象(外部検索優先)に指定した属性情報を当該キーワードに付与する(ステップS307)。   On the other hand, if the internal appearance frequency is not less than the threshold and greater than the external appearance frequency (No in step S303), the index generation unit 213 sets the attribute information that designates at least the outside of the search system 1 as a search target (external search priority). It assigns to a keyword (step S307).

以上のように本実施形態によれば、検索対象を指定した属性情報を含むインデックスを生成するため、このインデックスを用いて検索を行えば、検索対象をユーザが選択する必要がなくなるので、検索の効率性を高めることができる。   As described above, according to the present embodiment, since an index including attribute information specifying a search target is generated, if a search is performed using this index, the user need not select the search target. Efficiency can be increased.

また本実施形態によれば、内部出現頻度と外部出現頻度との差に応じて、検索対象を指定しているため、このインデックスを用いて検索を行えば、キーワードの出現頻度が高い方の検索対象で検索を行うことができ、検索の効率性を高めることができる。   In addition, according to the present embodiment, the search target is specified according to the difference between the internal appearance frequency and the external appearance frequency. Therefore, if a search is performed using this index, a search with a higher keyword appearance frequency is performed. A search can be performed on the target, and the efficiency of the search can be improved.

また本実施形態によれば、検索システムの管理者が、属性情報を書き換え可能なので、実情に即した検索対象の指定が可能となる。このため、機密性が高いデータのインデックスが外部に漏洩することを防ぐこともできる。   Further, according to the present embodiment, since the administrator of the search system can rewrite the attribute information, it is possible to specify a search target in accordance with the actual situation. For this reason, it is possible to prevent an index of highly confidential data from leaking to the outside.

(変形例)
なお、本発明は、上記実施形態に限定されるものではなく、種々の変形が可能である。
(Modification)
In addition, this invention is not limited to the said embodiment, A various deformation | transformation is possible.

上記実施形態では、検索システムの管理者が、機密性が高いキーワードの属性情報を、検索システム1の外部を検索対象に指定しない(検索システム1の内部のみを検索対象に指定する)ように手動で書き換える例について説明したが、インデックス生成時に、機密性が高いキーワードの属性情報を、検索システム1の外部を検索対象に指定しないようにしてもよい。   In the above embodiment, the administrator of the search system manually does not specify the attribute information of the highly confidential keyword so that the outside of the search system 1 is not specified as the search target (only the inside of the search system 1 is specified as the search target). The example of rewriting is described above, but the attribute information of keywords with high confidentiality may not be designated as search targets outside the search system 1 at the time of index generation.

この場合、データベースサーバ10−1〜10−Nは、通常のデータを記憶するもの(第1データ記憶部の一例)と、通常のデータよりも機密性が高いデータを記憶するもの(第2データ記憶部の一例)とがある。   In this case, the database servers 10-1 to 10-N store normal data (an example of a first data storage unit) and store data that is more confidential than normal data (second data). An example of a storage unit).

また、出現頻度情報記憶部201は、キーワード毎に、検索システム1の内部かつ通常のデータを記憶するデータベースサーバ10での検索における第1内部出現頻度と、検索システム1の内部かつ機密性が高いデータを記憶するデータベースサーバ10での検索における第2内部出現頻度と、検索システム1の外部での検索における外部出現頻度と、を対応付けて記憶する。   In addition, the appearance frequency information storage unit 201 has a first internal appearance frequency in a search in the database server 10 that stores normal data inside the search system 1 for each keyword, and high internal and confidentiality in the search system 1. The second internal appearance frequency in the search in the database server 10 that stores data and the external appearance frequency in the search outside the search system 1 are stored in association with each other.

図6は、変形例のインデックスサーバ20で実行される属性決定処理の一例を示すフローチャート図である。   FIG. 6 is a flowchart illustrating an example of attribute determination processing executed by the index server 20 according to the modification.

まず、インデックス生成部213は、出現頻度情報記憶部201に記憶されている出現頻度情報を参照し、抽出したキーワードの第1内部出現頻度と外部出現頻度とを比較する(ステップS401)。   First, the index generation unit 213 refers to the appearance frequency information stored in the appearance frequency information storage unit 201, and compares the first internal appearance frequency and external appearance frequency of the extracted keyword (step S401).

比較の結果、第1内部出現頻度が第1閾値以上外部出現頻度よりも大きくなければ(ステップS403でNo)、インデックス生成部213は、検索システム1の外部を少なくとも検索対象(外部検索優先)に指定した属性情報を当該キーワードに付与する(ステップS405)。   As a result of the comparison, if the first internal appearance frequency is not greater than the first threshold and the external appearance frequency (No in step S403), the index generation unit 213 sets at least the outside of the search system 1 as a search target (external search priority). The designated attribute information is assigned to the keyword (step S405).

一方、第1内部出現頻度が第1閾値以上外部出現頻度よりも大きければ(ステップS403でYes)、インデックス生成部213は、抽出したキーワードの第1内部出現頻度と第2内部出現頻度とを比較する(ステップS407)。   On the other hand, if the first internal appearance frequency is greater than or equal to the first threshold and greater than the external appearance frequency (Yes in step S403), the index generation unit 213 compares the first internal appearance frequency of the extracted keyword with the second internal appearance frequency. (Step S407).

比較の結果、第2内部出現頻度が第2閾値以上第1内部出現頻度よりも大きければ(ステップS409でYes)、インデックス生成部213は、検索システム1の外部を検索対象に指定しないよう(外部検索禁止)にした属性情報を当該キーワードに付与する(ステップS411)。   As a result of the comparison, if the second internal appearance frequency is greater than or equal to the second threshold and greater than the first internal appearance frequency (Yes in step S409), the index generation unit 213 does not designate the outside of the search system 1 as a search target (external The attribute information set to “search prohibited” is assigned to the keyword (step S411).

一方、第2内部出現頻度が第2閾値以上第1内部出現頻度よりも大きくなければ(ステップS409でNo)、インデックス生成部213は、検索システム1の内部を少なくとも検索対象(内部検索優先)に指定した属性情報を当該キーワードに付与する(ステップS413)。   On the other hand, if the second internal appearance frequency is not less than the second threshold and greater than the first internal appearance frequency (No in step S409), the index generation unit 213 sets at least the inside of the search system 1 as a search target (internal search priority). The designated attribute information is assigned to the keyword (step S413).

変形例によれば、機密性が高いデータのインデックスが外部に漏洩することを自動で防ぐことができる。   According to the modification, it is possible to automatically prevent an index of highly confidential data from leaking to the outside.

(ハードウェア構成)
図7は、上記実施形態及び変形例のインデックスサーバ20、管理者端末30、ユーザ端末40、及び検索制御サーバ50(以下、上記実施形態及び変形例の検索システム1の各装置と称する)のハードウェア構成の一例を示す図である。
(Hardware configuration)
FIG. 7 shows the hardware of the index server 20, the administrator terminal 30, the user terminal 40, and the search control server 50 (hereinafter referred to as each device of the search system 1 of the above embodiment and the modification) of the above embodiment and the modification. It is a figure which shows an example of a hardware structure.

上記実施形態及び変形例の検索システム1の各装置は、CPUなどの制御装置801と、ROMやRAMなどの記憶装置802と、HDDなどの外部記憶装置803と、ディスプレイなどの表示装置804と、キーボードやマウスなどの入力装置805と、通信I/F(インタフェース)などの通信装置806と、を備えており、通常のコンピュータを利用したハードウェア構成となっている。   Each device of the search system 1 according to the embodiment and the modification includes a control device 801 such as a CPU, a storage device 802 such as a ROM and a RAM, an external storage device 803 such as an HDD, a display device 804 such as a display, An input device 805 such as a keyboard and a mouse and a communication device 806 such as a communication I / F (interface) are provided, and a hardware configuration using a normal computer is provided.

上記実施形態及び変形例の検索システム1の各装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。   The program executed in each device of the search system 1 of the above embodiment and the modification is a file in an installable or executable format, such as a CD-ROM, a CD-R, a memory card, a DVD (Digital Versatile Disk), The program is stored in a computer-readable storage medium such as a flexible disk (FD).

また、上記実施形態及び変形例の検索システム1の各装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記実施形態及び変形例の検索システム1の各装置で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、上記実施形態及び変形例の検索システム1の各装置で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。   The program executed by each device of the search system 1 according to the embodiment and the modification may be provided by storing it on a computer connected to a network such as the Internet and downloading it via the network. . Further, the program executed by each device of the search system 1 of the embodiment and the modification may be provided or distributed via a network such as the Internet. Moreover, you may make it provide the program executed with each apparatus of the search system 1 of the said embodiment and a modification previously incorporated in ROM etc. beforehand.

上記実施形態及び変形例の検索システム1の各装置で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、CPUがHDDからプログラムをRAM上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。   The program executed by each device of the search system 1 according to the embodiment and the modification has a module configuration for realizing the above-described units on a computer. As actual hardware, the CPU reads out a program from the HDD to the RAM and executes the program, whereby the above-described units are realized on the computer.

1 検索システム
2 LAN
3 ファイアウォール
4 インターネット
10−1〜10−N(10) データベースサーバ
20 インデックスサーバ
30 管理者端末
40 ユーザ端末
50 検索制御サーバ
60 外部検索サーバ
201 出現頻度情報記憶部
203 シソーラス記憶部
205 インデックス記憶部
211 収集部
213 インデックス生成部
215 インデックス入出力部
217 インデックス管理部
219 検索入出力部
221 検索条件生成部
223 検索部
801 制御装置
802 記憶装置
803 外部記憶装置
804 表示装置
805 入力装置
806 通信装置
1 Search system 2 LAN
3 Firewall 4 Internet 10-1 to 10-N (10) Database server 20 Index server 30 Administrator terminal 40 User terminal 50 Search control server 60 External search server 201 Appearance frequency information storage unit 203 Thesaurus storage unit 205 Index storage unit 211 Collection Unit 213 Index generation unit 215 Index input / output unit 217 Index management unit 219 Search input / output unit 221 Search condition generation unit 223 Search unit 801 Control device 802 Storage device 803 External storage device 804 Display device 805 Input device 806 Communication device

特開平11−149478号公報JP-A-11-149478 特開2008−181273号公報JP 2008-181273 A 特許第4445699号公報Japanese Patent No. 4445699 特開2004−030466号公報JP 2004-030466 A 特開平11−053382号公報JP-A-11-053382

Claims (12)

検索システムであって、
データを記憶するデータ記憶部と、
前記データ記憶部から前記データを収集する収集部と、
収集した前記データに基づいて、前記検索システム内部での検索に用いられる検索語と、前記検索システムの内部及び前記検索システムの外部の少なくとも一方を検索対象に指定する属性情報と、を対応付けた検索語辞書を生成し、検索語辞書記憶部に登録する検索語辞書生成部と、
を備える検索システム。
A search system,
A data storage unit for storing data;
A collection unit for collecting the data from the data storage unit;
Based on the collected data, the search term used for the search inside the search system is associated with the attribute information that designates at least one of the inside of the search system and the outside of the search system as a search target A search word dictionary generating unit that generates a search word dictionary and registers it in the search word dictionary storage unit;
A search system comprising:
検索要求を満足する検索語辞書を前記検索語辞書記憶部から検索する内部検索部と、
検索された前記検索語辞書に含まれる属性情報が前記検索システムの外部を少なくとも検索対象に指定している場合、前記検索要求に基づく検索を外部検索装置に要求し、検索結果を検索制御部と、
を更に備える請求項1に記載の検索システム。
An internal search unit for searching a search word dictionary satisfying a search request from the search word dictionary storage unit;
When the attribute information included in the searched search word dictionary designates at least the outside of the search system as a search target, the search is requested to an external search device based on the search request, and the search result is sent to the search control unit. ,
The search system according to claim 1, further comprising:
前記検索制御部は、検索された前記検索語辞書に含まれる前記属性情報が前記検索システムの内部を検索対象に指定している場合、前記検索結果として、当該検索語辞書を出力し、検索された前記検索語辞書に含まれる属性情報が前記検索システムの外部を検索対象に指定している場合、前記検索結果として、前記外部検索装置の検索結果を出力し、検索された前記検索語辞書に含まれる前記属性情報が前記検索システムの内部及び外部を検索対象に指定している場合、前記検索結果として、当該検索語辞書と前記外部検索装置の検索結果とを出力する請求項2に記載の検索システム。   When the attribute information included in the searched search word dictionary specifies the search system as a search target, the search control unit outputs the search word dictionary as the search result and is searched. When the attribute information included in the search word dictionary designates the outside of the search system as a search target, the search result of the external search device is output as the search result, and the searched search word dictionary The said search word dictionary and the search result of the said external search device are output as the said search result, when the said attribute information contained specifies the inside and the outside of the said search system as a search object. Search system. 検索語毎に、前記検索システムの内部での検索における内部出現頻度と、前記検索システムの外部での検索における外部出現頻度と、を対応付けた出現頻度情報を記憶する出現頻度情報記憶部を更に備え、
前記検索語辞書生成部は、前記出現頻度情報に基づいて、前記属性情報が示す検索対象を決定する請求項1〜3のいずれか1つに記載の検索システム。
An appearance frequency information storage unit that stores appearance frequency information that associates an internal appearance frequency in a search inside the search system with an external appearance frequency in a search outside the search system for each search word; Prepared,
The search system according to claim 1, wherein the search word dictionary generation unit determines a search target indicated by the attribute information based on the appearance frequency information.
前記検索語辞書生成部は、前記出現頻度情報を参照し、前記検索語辞書の前記検索語の前記内部出現頻度が閾値以上前記外部出現頻度よりも大きければ、前記検索語辞書の前記属性情報が前記検索システムの内部を少なくとも検索対象に指定するように設定し、前記検索語辞書の前記検索語の前記内部出現頻度が閾値以上前記外部出現頻度よりも大きくなければ、前記検索語辞書の前記属性情報が前記検索システムの外部を少なくとも検索対象に指定するように設定する請求項4に記載の検索システム。   The search word dictionary generation unit refers to the appearance frequency information, and if the internal appearance frequency of the search word in the search word dictionary is greater than a threshold value and greater than the external appearance frequency, the attribute information of the search word dictionary is The attribute of the search word dictionary is set so that at least the inside of the search system is designated as a search target, and the internal appearance frequency of the search word in the search word dictionary is greater than a threshold value and greater than the external appearance frequency. The search system according to claim 4, wherein the information is set to designate at least a search target outside the search system. 前記データ記憶部は、通常のデータを記憶する第1データ記憶部と、前記通常のデータよりも機密性が高いデータを記憶する第2データ記憶部とを、有し、
検索語毎に、前記検索システムの内部かつ前記第1データ記憶部での検索における第1内部出現頻度と、前記検索システムの内部かつ前記第2データ記憶部での検索における第2内部出現頻度と、前記検索システムの外部での検索における外部出現頻度と、を対応付けた出現頻度情報を記憶する出現頻度情報記憶部を更に備え、
前記検索語辞書生成部は、前記出現頻度情報に基づいて、前記属性情報が示す検索対象を決定する請求項1〜4のいずれか1つに記載の検索システム。
The data storage unit includes a first data storage unit that stores normal data, and a second data storage unit that stores data having higher confidentiality than the normal data,
For each search term, a first internal appearance frequency in the search in the search system and in the first data storage unit, and a second internal appearance frequency in the search in the search system and in the second data storage unit, An appearance frequency information storage unit that stores appearance frequency information that associates external appearance frequencies in searches outside the search system,
The search system according to claim 1, wherein the search word dictionary generation unit determines a search target indicated by the attribute information based on the appearance frequency information.
前記検索語辞書生成部は、前記出現頻度情報を参照し、前記検索語辞書の前記検索語の前記第1内部出現頻度が第1閾値以上前記外部出現頻度よりも大きく、かつ前記第2内部出現頻度が第2閾値以上前記第1内部出現頻度よりも大きければ、前記検索語辞書の前記属性情報が前記検索システムの外部を検索対象に指定しないように設定し、前記検索語辞書の前記検索語の前記第1内部出現頻度が前記第1閾値以上前記外部出現頻度よりも大きく、かつ前記第2内部出現頻度が前記第2閾値以上前記第1内部出現頻度よりも大きくなければ、前記検索語辞書の前記属性情報が前記検索システムの内部を少なくとも検索対象に指定するように設定し、前記検索語辞書の前記検索語の前記第1内部出現頻度が前記第1閾値以上前記外部出現頻度よりも大きくなければ、前記検索語辞書の前記属性情報が前記検索システムの外部を少なくとも検索対象に指定するように設定する請求項6に記載の検索システム。   The search word dictionary generation unit refers to the appearance frequency information, the first internal appearance frequency of the search word in the search word dictionary is greater than or equal to a first threshold and the external appearance frequency, and the second internal appearance. If the frequency is greater than or equal to a second threshold and greater than the first internal appearance frequency, the attribute information of the search word dictionary is set so as not to designate the outside of the search system as a search target, and the search word of the search word dictionary If the first internal frequency of occurrence is greater than the first threshold and greater than the external frequency, and the second internal frequency is not greater than the second threshold and greater than the first internal frequency, the search word dictionary The attribute information is set so that at least the inside of the search system is designated as a search target, and the first internal appearance frequency of the search word in the search word dictionary is equal to or greater than the first threshold and the external appearance frequency. If not greater, the search system according to claim 6, wherein the attribute information of the keyword dictionary is set to specify at least searched outside of the search system. 外部入力に基づいて、前記検索語辞書記憶部に登録されている前記検索語辞書の前記属性情報を書き換える検索語辞書管理部を更に備える請求項1〜7のいずれか1つに記載の検索システム。   The search system according to claim 1, further comprising a search word dictionary management unit that rewrites the attribute information of the search word dictionary registered in the search word dictionary storage unit based on an external input. . データ記憶部からデータを収集する収集部と、
収集した前記データに基づいて、検索システム内部での検索に用いられる検索語と、前記検索システムの内部及び前記検索システムの外部の少なくとも一方を検索対象に指定する属性情報と、を対応付けた検索語辞書を生成し、検索語辞書記憶部に登録する検索語辞書生成部と、
を備える検索語辞書生成装置。
A collection unit for collecting data from the data storage unit;
A search that associates a search term used for a search inside a search system with attribute information that designates at least one of the inside of the search system and the outside of the search system as a search target based on the collected data A search word dictionary generation unit that generates a word dictionary and registers the word dictionary in the search word dictionary storage unit;
A search word dictionary generation device comprising:
データ記憶部からデータを収集する収集部と、
収集した前記データに基づいて、検索システム内部での検索に用いられる検索語と、前記検索システムの内部及び前記検索システムの外部の少なくとも一方を検索対象に指定する属性情報と、を対応付けた検索語辞書を生成し、検索語辞書記憶部に登録する検索語辞書生成部と、
してコンピュータを機能させるためのプログラム。
A collection unit for collecting data from the data storage unit;
A search that associates a search term used for a search inside a search system with attribute information that designates at least one of the inside of the search system and the outside of the search system as a search target based on the collected data A search word dictionary generation unit that generates a word dictionary and registers the word dictionary in the search word dictionary storage unit;
Program to make the computer function.
請求項10に記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 10. データ記憶部からデータを収集する収集ステップと、
収集した前記データに基づいて、検索システム内部での検索に用いられる検索語と、前記検索システムの内部及び前記検索システムの外部の少なくとも一方を検索対象に指定する属性情報と、を対応付けた検索語辞書を生成し、検索語辞書記憶部に登録する検索語辞書生成ステップと、
を含む検索語辞書生成方法。
A collection step for collecting data from the data store;
A search that associates a search term used for a search inside a search system with attribute information that designates at least one of the inside of the search system and the outside of the search system as a search target based on the collected data A search word dictionary generation step of generating a word dictionary and registering it in the search word dictionary storage unit;
Search word dictionary generation method including
JP2013052548A 2013-03-14 2013-03-14 SEARCH SYSTEM, PROGRAM, STORAGE MEDIUM, AND SEARCH METHOD Expired - Fee Related JP6131646B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013052548A JP6131646B2 (en) 2013-03-14 2013-03-14 SEARCH SYSTEM, PROGRAM, STORAGE MEDIUM, AND SEARCH METHOD

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013052548A JP6131646B2 (en) 2013-03-14 2013-03-14 SEARCH SYSTEM, PROGRAM, STORAGE MEDIUM, AND SEARCH METHOD

Publications (2)

Publication Number Publication Date
JP2014178902A true JP2014178902A (en) 2014-09-25
JP6131646B2 JP6131646B2 (en) 2017-05-24

Family

ID=51698777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013052548A Expired - Fee Related JP6131646B2 (en) 2013-03-14 2013-03-14 SEARCH SYSTEM, PROGRAM, STORAGE MEDIUM, AND SEARCH METHOD

Country Status (1)

Country Link
JP (1) JP6131646B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7042888B1 (en) 2020-11-05 2022-03-28 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266085A (en) * 1992-03-17 1993-10-15 Gakushiyuu Joho Tsushin Syst Kenkyusho:Kk Method and device for similar retrieval using dynamic concept dictionary
JPH11161686A (en) * 1997-10-08 1999-06-18 Hewlett Packard Co <Hp> Successive index mechanism
JP2001188802A (en) * 1999-11-22 2001-07-10 Nec Corp Device and method for retrieving information
JP2003050822A (en) * 2001-05-29 2003-02-21 Nippon Telegraph & Telephone East Corp Content searching device, content searching method, content searching program and computer readable recording medium recorded with the program
WO2010035817A1 (en) * 2008-09-29 2010-04-01 京セラ株式会社 Communication terminal and search method using communication terminal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266085A (en) * 1992-03-17 1993-10-15 Gakushiyuu Joho Tsushin Syst Kenkyusho:Kk Method and device for similar retrieval using dynamic concept dictionary
JPH11161686A (en) * 1997-10-08 1999-06-18 Hewlett Packard Co <Hp> Successive index mechanism
JP2001188802A (en) * 1999-11-22 2001-07-10 Nec Corp Device and method for retrieving information
JP2003050822A (en) * 2001-05-29 2003-02-21 Nippon Telegraph & Telephone East Corp Content searching device, content searching method, content searching program and computer readable recording medium recorded with the program
WO2010035817A1 (en) * 2008-09-29 2010-04-01 京セラ株式会社 Communication terminal and search method using communication terminal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7042888B1 (en) 2020-11-05 2022-03-28 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs
JP2022074948A (en) * 2020-11-05 2022-05-18 ヤフー株式会社 Information processing device, information processing method, and information processing program

Also Published As

Publication number Publication date
JP6131646B2 (en) 2017-05-24

Similar Documents

Publication Publication Date Title
US11163957B2 (en) Performing semantic graph search
US11853334B2 (en) Systems and methods for generating and using aggregated search indices and non-aggregated value storage
US10452691B2 (en) Method and apparatus for generating search results using inverted index
US8977623B2 (en) Method and system for search engine indexing and searching using the index
Cambazoglu et al. Scalability challenges in web search engines
US11770450B2 (en) Dynamic routing of file system objects
US11409775B2 (en) Recommending documents sets based on a similar set of correlated features
US7895210B2 (en) Methods and apparatuses for information analysis on shared and distributed computing systems
KR20060045720A (en) Query to task mapping
JP7062750B2 (en) Methods, computer programs and systems for cognitive file and object management for distributed storage environments
GB2475151A (en) Indexing data for use by multiple applications by extracting tokens from data objects
US9940355B2 (en) Providing answers to questions having both rankable and probabilistic components
KR20130049111A (en) Forensic index method and apparatus by distributed processing
US9298757B1 (en) Determining similarity of linguistic objects
JP2023542632A (en) Protecting sensitive data in documents
CN110291515B (en) Distributed index searching in computing systems
JP2011133928A (en) Retrieval device, retrieval system, retrieval method, and computer program for retrieving document file stored in storage device
JP6131646B2 (en) SEARCH SYSTEM, PROGRAM, STORAGE MEDIUM, AND SEARCH METHOD
US11074278B2 (en) Methods for performing a search and devices thereof
US11615154B2 (en) Unsupervised corpus expansion using domain-specific terms
JP4223756B2 (en) Document search method, document search program, and document search system
WO2016193797A1 (en) Method of and system for generating a hashed complex vector
JP2014232360A (en) Document providing device, document providing system, document providing method, and document providing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170321

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170403

R151 Written notification of patent or utility model registration

Ref document number: 6131646

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees