JP5556876B2 - Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof - Google Patents

Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof Download PDF

Info

Publication number
JP5556876B2
JP5556876B2 JP2012253734A JP2012253734A JP5556876B2 JP 5556876 B2 JP5556876 B2 JP 5556876B2 JP 2012253734 A JP2012253734 A JP 2012253734A JP 2012253734 A JP2012253734 A JP 2012253734A JP 5556876 B2 JP5556876 B2 JP 5556876B2
Authority
JP
Japan
Prior art keywords
search
text
related word
word information
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012253734A
Other languages
Japanese (ja)
Other versions
JP2013145551A (en
Inventor
篤子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2012253734A priority Critical patent/JP5556876B2/en
Publication of JP2013145551A publication Critical patent/JP2013145551A/en
Application granted granted Critical
Publication of JP5556876B2 publication Critical patent/JP5556876B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

大量のテキストデータを対象にキーワードによるテキスト検索を実行する際に、適切な検索結果を高速に取得するテキスト検索サーバに関する。   The present invention relates to a text search server that obtains an appropriate search result at a high speed when a text search using a keyword is performed on a large amount of text data.

大量のテキストデータを対象とし、検索条件となるキーワードを指定することにより検索を行う様々な方法が提案されている。   Various methods for performing a search by specifying a keyword as a search condition for a large amount of text data have been proposed.

例えば、前記大量のテキストデータを解析することにより予め各テキストデータから単語を抽出し、各単語を含むテキストデータと関連付けて索引データを作成する方法がある。この方法においては、検索時に、まずキーワードにより索引データを検索し、索引データに対する検索結果である単語に関連付けられたテキストデータを検索結果とするため、高速な検索処理を実現することが可能である。しかしながら、前記解析により索引データとなる単語の解析精度は必ずしも十分ではなく、またキーワードと索引中の単語が完全に一致する必要があるため、不適切な検索結果が得られる場合が多い。   For example, there is a method in which words are extracted from each text data in advance by analyzing the large amount of text data, and index data is created in association with the text data including each word. In this method, at the time of searching, first, index data is searched using a keyword, and text data associated with a word that is a search result for the index data is used as a search result. Therefore, high-speed search processing can be realized. . However, the analysis accuracy of the words that become the index data by the analysis is not always sufficient, and the keywords and the words in the index need to be completely matched, so that an inappropriate search result is often obtained.

一方、テキストデータを先頭から一文字ずつ走査し、キーワードと一致する文字列が出現すると検索結果とする全文検索という方法がある。全文検索では、検索条件として指定されたキーワード数、検索対象となるテキストデータの件数、走査対象となるテキストの長さ、などに比例して検索処理の時間が増加する。   On the other hand, there is a method of full-text search in which text data is scanned character by character from the beginning and a character string that matches a keyword appears as a search result. In full-text search, the search processing time increases in proportion to the number of keywords specified as a search condition, the number of text data to be searched, the length of text to be scanned, and the like.

特許文献1には、リレーショナルデータベースに格納されているテーブルを検索キーワードに基づいて全文検索する際に、検索キーワードのデータ構造上の特徴から全文検索の対象とすべきカラムを動的に絞るという技術が開示されている。   Patent Document 1 discloses a technique for dynamically narrowing down a column to be subjected to a full-text search based on characteristics of the data structure of a search keyword when a full-text search is performed on a table stored in a relational database based on the search keyword. Is disclosed.

特開2010−67213号公報JP 2010-67213 A

特許文献1に記載の技術は、検索キーワードを「文字列型」、「日付型」、「数値型」の3種類のデータ型に分類し、それぞれのデータ型に一致したテーブルのカラムのみを検索させることにより、検索対象となるカラムを絞ることにより検索処理速度を向上させるものである。   The technique described in Patent Literature 1 classifies search keywords into three types of data types, “character string type”, “date type”, and “numeric type”, and searches only the table columns that match each data type. By doing so, the search processing speed is improved by narrowing down the columns to be searched.

しかしながら、データベースのテーブルにおいては、「文字列型」のデータ長は「日付型」、「数値型」と比較して長い場合が多い。特に、ユーザに対して自由にメッセージを入力可能とするGUIを提供し、ユーザの入力内容をデータベースに登録するアプリケーションにおいては、「文字列型」のデータの比率が大きい場合がある。この場合に「文字列型」である検索キーワードの検索対象カラムを絞り込んだとしても、検索処理速度の向上は十分ではない。   However, in database tables, the data length of the “character string type” is often longer than that of the “date type” and the “numeric type”. In particular, an application that provides a GUI that allows a user to freely input a message and registers the input contents of the user in a database may have a large ratio of “character string type” data. In this case, even if the search target column of the search keyword of “character string type” is narrowed down, the search processing speed is not sufficiently improved.

すなわち、前述同様、検索条件として指定されたキーワード数、検索対象となるテキストデータの件数(テーブル内のレコード数、文字列型のカラム数)、走査対象となるテキストの長さ、などに比例して検索処理の時間が増加するという問題がある。   That is, as described above, it is proportional to the number of keywords specified as the search condition, the number of text data to be searched (number of records in the table, the number of character string columns), the length of the text to be scanned, etc. This increases the search processing time.

さらに単なる全文検索であるため、例えば“ペット”をキーワードとして検索しても“ペット”という単語を含むテキストデータと“カーペット”という文字列を含むテキストデータが同等に検索結果に含まれてしまう、という検索精度上の問題があった。   Furthermore, since it is a mere full-text search, for example, even when searching for “pet” as a keyword, text data including the word “pet” and text data including the character string “carpet” are equally included in the search results. There was a problem in search accuracy.

本発明は、テキストデータに対して関連語情報検索と全文検索という2つの検索処理を使用して、高速かつもれのない検索処理を行い、更に得られた検索結果をユーザに順次提示することで、ユーザにとって全ての検索結果が得られる前であっても、必要な情報を順次確認することを可能とする検索機能を提供することを目的とする。
The present invention performs high-speed and complete search processing by using two search processes of related word information search and full-text search for text data, and further sequentially presents the obtained search results to the user. Therefore, an object of the present invention is to provide a search function that enables a user to sequentially check necessary information even before all search results are obtained .

キーワードを検索条件としてユーザに指定させ、検索結果を表示制御するクライアント装置と、テキストデータの検索を実行するテキスト検索サーバと、がネットワークを介して接続可能なテキスト検索システムであって、前記クライアント装置は、前記テキストデータの検索条件となる複数のキーワードを前記テキスト検索サーバに送信するキーワード送信手段と、前記テキスト検索サーバから、前記テキストデータに対する検索結果が順次送信されるごとに、送信された当該検索結果を順次受信する検索結果受信手段と、前記検索結果受信手段により、前記検索結果が順次受信されるごとに、当該検索結果を順次表示する表示制御手段と、を備え、前記テキスト検索サーバは、前記テキストデータと、該テキストデータに関連付けられた1または複数の関連語と、を対応付けて関連語情報として関連語情報記憶手段に記憶させる関連語情報登録手段と、前記キーワード送信手段により送信された複数のキーワードを受信するキーワード受信手段と、前記キーワード受信手段により受信した複数のキーワードを使用して前記関連語情報記憶手段の関連語情報を検索し、テキストデータを検索結果として取得する関連語情報検索手段と、前記関連語情報検索手段による検索処理を実行した結果、当該関連語情報検索手段による検索結果とはならなかったテキストデータに対して、前記キーワードに基づき当該テキストデータを走査して検索結果を取得する全文検索手段と、前記関連語情報検索手段による検索結果と、前記全文検索手段による検索結果を、それぞれの検索結果が取得されるごとに、順次、前記クライアント装置に送信する検索結果送信手段と、を備えることを特徴とする。
A text search system in which a client device that designates a keyword as a search condition and controls display of search results and a text search server that executes text data search can be connected via a network. The keyword transmission means for transmitting a plurality of keywords as search conditions for the text data to the text search server, and the search result for the text data transmitted from the text search server each time the search results are sequentially transmitted. Search result receiving means for sequentially receiving search results; and display control means for sequentially displaying the search results each time the search results are received by the search result receiving means, wherein the text search server is , and the text data associated with a person the text data One or a plurality of related words and associated word information registering means for storing the relevant word information storage means as the relevant word information in association with each other, and a keyword receiving means for receiving a plurality of keywords transmitted by the keyword transmission means, using multiple keywords received by the keyword receiving means retrieves the relevant word information of the relevant word information storage means, and associated word information retrieval means for acquiring text data search results to the relevant word information retrieval means As a result of executing the search process according to the above, for the text data that did not become the search result by the related word information search means, full-text search means for scanning the text data based on the keyword and obtaining the search results; a search result by the relevant word information retrieval means, the retrieval results by the full text searching unit, collected each search result Each time it is, sequentially, characterized in that it comprises a retrieval result transmitting means for transmitting to said client device.

本発明によりテキストデータに対して関連語情報検索と全文検索という2つの検索処理を使用して、高速かつもれのない検索処理を行い、更に得られた検索結果をユーザに順次提示することで、ユーザにとって全ての検索結果が得られる前であっても、必要な情報を順次確認することを可能とする検索機能を提供することが可能となった
According to the present invention, by using two search processes of related word information search and full-text search for text data, a high-speed and complete search process is performed, and the obtained search results are sequentially presented to the user. Thus, it is possible to provide a search function that enables a user to sequentially check necessary information even before all search results are obtained .

本発明の実施形態に係わるシステム構成の一例を示す図である。It is a figure which shows an example of the system configuration | structure concerning embodiment of this invention. 本発明の実施形態に係わるテキスト検索サーバ、クライアント装置のハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of the text search server and client apparatus concerning embodiment of this invention. 本発明の実施形態に係わるテキスト検索サーバ、クライアント装置におけるソフトウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the software structure in the text search server and client apparatus concerning embodiment of this invention. 本発明の実施形態に係わるクライアント装置における検索のキーワードを入力する画面の一例である。It is an example of the screen which inputs the keyword of the search in the client apparatus concerning embodiment of this invention. 本発明の実施形態に係わる全文検索の検索結果をクライアント装置において表示する画面の一例である。It is an example of the screen which displays the search result of the full text search concerning embodiment of this invention in a client apparatus. 本発明の実施形態に係わる関連語情報記憶部のデータ構成の一例である。It is an example of the data structure of the related word information storage part concerning embodiment of this invention. 本発明の実施形態に係わる検索結果をクライアント装置において表示する画面の一例である。It is an example of the screen which displays the search result concerning embodiment of this invention in a client apparatus. 本発明の実施形態に係わる検索結果をクライアント装置において表示する画面の一例である。It is an example of the screen which displays the search result concerning embodiment of this invention in a client apparatus. 本発明の実施形態に係わる関連語情報検索の処理を示すフローチャートの一例である。It is an example of the flowchart which shows the process of the related term information search concerning embodiment of this invention. 全文検索の処理を示すフローチャートの一例である。It is an example of the flowchart which shows the process of a full text search. 本発明の実施形態に係わるテキスト検索の処理を示すフローチャートの一例である。It is an example of the flowchart which shows the process of the text search concerning embodiment of this invention. 本発明の実施形態に係わるテキスト検索の処理を示すフローチャートの一例である。It is an example of the flowchart which shows the process of the text search concerning embodiment of this invention. 本発明の第3実施形態に係わる関連語検索の処理を示すフローチャートの一例である。It is an example of the flowchart which shows the process of the related term search concerning 3rd Embodiment of this invention. 本発明の第3実施形態に係わる全文検索の処理を示すフローチャートの一例である。It is an example of the flowchart which shows the process of the full text search concerning 3rd Embodiment of this invention. 本発明の実施形態に係わる関連語情報記憶部と、関連語情報検索と全文検索の検索結果を説明するための図である。It is a figure for demonstrating the search result of the related term information storage part concerning embodiment of this invention, a related term information search, and a full text search.

以下、本発明の実施の形態を、図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<第1の実施形態>
図1は、本発明の実施形態に係わるシステム構成の一例を示す図である。
<First Embodiment>
FIG. 1 is a diagram illustrating an example of a system configuration according to an embodiment of the present invention.

このテキスト検索システムでは、テキスト検索サーバ101、クライアント装置102、テキストデータ管理サーバ103が、ネットワーク104を介して接続されている。クライアント装置102からテキストデータの検索を要求すると、要求がテキスト検索サーバ101にて受け付けられ、テキスト検索サーバ101において検索された結果は、クライアント装置102に送信され、クライアント装置102においてユーザが閲覧するために表示、操作される。クライアント装置102a〜102cは本例では3台が図示されているが、何台であってもよい。   In this text search system, a text search server 101, a client device 102, and a text data management server 103 are connected via a network 104. When a search for text data is requested from the client device 102, the request is accepted by the text search server 101, and the search result in the text search server 101 is transmitted to the client device 102 for viewing by the user on the client device 102. Displayed and operated. Although three client apparatuses 102a to 102c are illustrated in the present example, any number may be used.

テキストデータ管理サーバ103には、テキストファイル、アプリケーションファイル、データベースなどが格納されている。テキスト検索サーバ101は、検索要求に基づきテキストデータ管理サーバに格納されている前述のテキストファイル、アプリケーションファイル内のテキストやテキスト形式で抽出可能な属性、データベースに格納されたテキストを検索する。テキストデータ管理サーバ103は1台であってもよいし、複数台あってもよい。   The text data management server 103 stores text files, application files, databases, and the like. The text search server 101 searches the text file stored in the text data management server, the text in the application file, the attributes that can be extracted in the text format, and the text stored in the database based on the search request. There may be one text data management server 103 or a plurality of text data management servers 103.

なお、以降の説明では、前述したアプリケーションファイルやデータベースに格納されたテキストを検索する場合には、それらのファイルやデータ項目から文字列を抽出する処理も含めて“テキストデータを検索する”と呼ぶことにする。あるいは、ファイルやデータ項目が新たに検索対象となった場合に、予めテキスト形式のファイルに抽出しておき、実際に検索する際にはテキストファイルを対象としてもよい。いずれの場合も、本発明の実施形態に係わるテキストデータに対する検索とする。   In the following description, when searching for text stored in the application file or database described above, it is referred to as “searching text data” including processing for extracting a character string from those files and data items. I will decide. Alternatively, when a file or data item is newly searched, it may be extracted in advance into a text format file, and the text file may be targeted when actually searching. In either case, the search is for text data according to the embodiment of the present invention.

また、テキスト検索サーバ101の中には、テキストデータ管理サーバ103における前述のファイルなどと、当該ファイルなどを関連付けるキーワード(関連語)を、本発明の実施形態である後述の関連語情報記憶部として記憶されている。   Further, in the text search server 101, a keyword (related word) for associating the file and the like in the text data management server 103 with the file is used as a related word information storage unit to be described later which is an embodiment of the present invention. It is remembered.

なお、図1では、テキスト検索サーバ101とテキストデータ管理サーバ103は別個の筐体で示されているが、同一筐体内に構成することも可能であり、本発明に係るテキスト検索システムを運用する形態に応じて各種構成をとることが可能である。さらに、テキスト検索サーバ101とクライアント装置102が同一筐体内に構成されること、テキスト検索サーバ101、クライアント装置102、テキストデータ管理サーバ103の全てが同一強体内に構成されることも本発明の実施形態に係わる構成である。   In FIG. 1, the text search server 101 and the text data management server 103 are shown as separate casings, but they can be configured in the same casing and operate the text search system according to the present invention. Various configurations can be adopted depending on the form. Further, the text search server 101 and the client device 102 are configured in the same casing, and the text search server 101, the client device 102, and the text data management server 103 are all configured in the same strong body. This is a configuration related to the form.

図2は、テキスト検索サーバ101およびクライアント装置に適用可能な情報処理装置のハードウェア構成例を示すブロック図である。なお、図2のブロック図は、テキストデータ管理サーバ103にも適用可能である。   FIG. 2 is a block diagram illustrating a hardware configuration example of an information processing apparatus applicable to the text search server 101 and the client apparatus. Note that the block diagram of FIG. 2 can also be applied to the text data management server 103.

図2に示すように、テキスト検索サーバ101およびクライアント装置は、システムバス204を介してCPU(Central Processing Unit)201、RAM(Random Access Memory)203、ROM(Read Only Memory)202、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、通信I/Fコントローラ208等が接続された構成を採る。   As shown in FIG. 2, the text search server 101 and the client device are connected via a system bus 204 to a CPU (Central Processing Unit) 201, a RAM (Random Access Memory) 203, a ROM (Read Only Memory) 202, an input controller 205, A configuration is adopted in which a video controller 206, a memory controller 207, a communication I / F controller 208, and the like are connected.

CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。   The CPU 201 comprehensively controls each device and controller connected to the system bus 204.

また、ROM202あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、各サーバあるいは各PCが実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。また、本発明を実施するために必要な情報が記憶されている。なお外部メモリはデータベースであってもよい。   Further, the ROM 202 or the external memory 211 will be described later, which is necessary for realizing the functions executed by each server or each PC, such as BIOS (Basic Input / Output System) and OS (Operating System) which are control programs of the CPU 201. Various programs are stored. Further, information necessary for carrying out the present invention is stored. The external memory may be a database.

RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。   The RAM 203 functions as a main memory, work area, and the like for the CPU 201. The CPU 201 implements various operations by loading a program or the like necessary for executing the processing from the ROM 202 or the external memory 211 to the RAM 203 and executing the loaded program.

また、入力コントローラ205は、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。   The input controller 205 controls input from a keyboard (KB) 209 or a pointing device such as a mouse (not shown).

ビデオコントローラ206は、ディスプレイ210等の表示器への表示を制御する。尚、表示器は液晶ディスプレイ等の表示器でもよい。これらは、必要に応じて管理者が使用する。   The video controller 206 controls display on a display device such as the display 210. The display device may be a display device such as a liquid crystal display. These are used by the administrator as needed.

メモリコントローラ207は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、あるいは、PCMCIA(Personal Computer Memory Card International Association)カードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。   The memory controller 207 is an external storage device (hard disk (HD)), flexible disk (FD), or PCMCIA (Personal Computer) that stores a boot program, various applications, font data, user files, editing files, various data, and the like. Controls access to an external memory 211 such as a Compact Flash (registered trademark) memory connected to a Memory Card International Association (Card Memory) card slot via an adapter.

通信I/Fコントローラ208は、ネットワーク104を介して外部機器と接続・通信し、ネットワークでの通信制御処理を実行する。例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)を用いた通信等が可能である。   The communication I / F controller 208 is connected to and communicates with an external device via the network 104, and executes communication control processing in the network. For example, communication using TCP / IP (Transmission Control Protocol / Internet Protocol) is possible.

尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上に表示することが可能である。また、CPU201は、ディスプレイ210上のマウスカーソル(図示しない)等によるユーザ指示を可能とする。   The CPU 201 can display on the display 210 by executing an outline font rasterization process on a display information area in the RAM 203, for example. Further, the CPU 201 enables a user instruction using a mouse cursor (not shown) on the display 210.

本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM203にロードされることによりCPU201によって実行されるものである。さらに、上記プログラムの実行時に用いられる定義ファイルおよび各種情報テーブル等も、外部メモリ211に格納されており、これらについての詳細な説明についても後述する。   Various programs to be described later for realizing the present invention are recorded in the external memory 211 and executed by the CPU 201 by being loaded into the RAM 203 as necessary. Furthermore, definition files and various information tables used when executing the program are also stored in the external memory 211, and a detailed description thereof will be described later.

図3は、本発明の実施形態に係わるテキスト検索サーバ、クライアント装置におけるソフトウェア構成の一例を示すブロック図である。   FIG. 3 is a block diagram showing an example of a software configuration in the text search server and the client device according to the embodiment of the present invention.

クライアント装置102は、検索結果受信部301、表示制御部302、操作受付部303、キーワード送信部304、選択情報送信部305から構成される。   The client device 102 includes a search result receiving unit 301, a display control unit 302, an operation receiving unit 303, a keyword transmitting unit 304, and a selection information transmitting unit 305.

検索結果受信部301は、テキスト検索サーバから送信された検索結果であるテキストデータを特定するテキストデータIDや検索結果の一覧表示に用いる情報を受け付ける。テキストデータIDとは、実際にはテキストデータを一意的に特定するものであればよい。テキストデータとは、アプリケーションにより作成されたファイルである場合には、そのファイルからテキストを抽出したもの、ファイル属性などの文字列がある場合には、それらをテキストとして扱うことが可能である。また、データベースを検索対象とするのであればデータ項目の中のテキストを抽出することが可能である。その他、テキストを抽出可能であれば、任意のデータが対象である。   The search result receiving unit 301 receives a text data ID for specifying text data that is a search result transmitted from the text search server and information used for displaying a list of search results. The text data ID may actually be any text data that uniquely identifies the text data. When the text data is a file created by an application, it is possible to treat a text string extracted from the file and a character string such as a file attribute as text. In addition, if a database is a search target, it is possible to extract text in a data item. In addition, if text can be extracted, arbitrary data is targeted.

また、検索結果の一覧表示に用いる情報とは、テキストデータを本発明のテキスト検索システムによる検索結果をユーザに分かりやすく表示するための情報などを含む。例えば、後述の画面例では“タイトル”、“内容”などを含む。“タイトル”は、例えばファイル名でもよいし、テキストデータの1行目やファイルの内容を分かりやすくするための属性やタグなどがあれば、それらから抽出したものでもよい。“内容”は、必ずしもテキストデータの全てである必要はなく、例えばキーワードによりテキストデータを走査した結果、キーワードと一致する文字列が存在する部分を含む前後数文字を切り出したものなどであってもよい。前後数文字を切り出すのは、その文字列によりユーザが意図したテキストデータであるかどうかを判断するなどのためである。   The information used for displaying a list of search results includes information for displaying text data in a user-friendly manner as a result of search by the text search system of the present invention. For example, a screen example described later includes “title”, “content”, and the like. The “title” may be, for example, a file name, or may be extracted from the first line of text data or an attribute or tag for making the contents of the file easier to understand. The “content” does not necessarily need to be all text data. For example, the text data is scanned by a keyword and, as a result, several characters before and after including a portion where a character string matching the keyword exists may be cut out. Good. The reason for cutting out several characters before and after is to determine whether or not the text data is intended by the user based on the character string.

表示制御部302は、検索条件となるキーワードを入力するための画面をクライアント装置102の表示装置に表示させる。また、検索結果受信部301により受け付けた検索結果の一覧表示に用いる情報を表示させる。   The display control unit 302 causes the display device of the client device 102 to display a screen for inputting a keyword serving as a search condition. In addition, information used for displaying a list of search results received by the search result receiving unit 301 is displayed.

操作受付部303は、表示制御部302により表示された画面において、ユーザによるキーワードの入力操作、検索実行をテキスト検索サーバ101に指示する検索ボタンの押下、検索結果一覧からテキストデータに関する情報を選択させる操作を受け付ける。テキストデータに関する情報を選択させる操作により各テキストデータの詳細を閲覧することなどが可能である。   On the screen displayed by the display control unit 302, the operation reception unit 303 causes the user to input a keyword, presses a search button that instructs the text search server 101 to execute search, and selects information related to text data from the search result list. Accept the operation. It is possible to browse details of each text data by an operation of selecting information on the text data.

キーワード送信部304は、操作受付部303においてユーザから受け付けたキーワードをテキスト検索サーバ101に送信する。   The keyword transmission unit 304 transmits the keyword received from the user in the operation reception unit 303 to the text search server 101.

選択情報送信部305は、操作受付部303においてユーザが選択したテキストデータに関する情報に対応するテキストデータIDをテキスト検索サーバ101に送信する。   The selection information transmission unit 305 transmits the text data ID corresponding to the information related to the text data selected by the user in the operation reception unit 303 to the text search server 101.

テキスト検索サーバ101は、関連語情報記憶部311、関連語情報登録部312、キーワード受信部313、関連語情報検索部314、全文検索部315、検索結果送信部316、選択情報受信部317から構成される。   The text search server 101 includes a related word information storage unit 311, a related word information registration unit 312, a keyword reception unit 313, a related word information search unit 314, a full text search unit 315, a search result transmission unit 316, and a selection information reception unit 317. Is done.

関連語情報記憶部311は、テキストデータを特定する情報(以下、テキストデータIDとする)と、該テキストデータが検索時に対応するキーワードを特に関連語として、対応付けて、関連語情報として記憶する記憶部である。テキストデータIDは、テキストデータを一意に特定できる情報であればよい。関連語情報記憶部311は、テキスト検索システム全体において、ユーザ全員、あるいは特定のグループで共有されてもよいし、また個人別に用意されてもよい。また、これらが混在するものであってもよい。関連語情報記憶部311が他のユーザと共有される場合には、あるユーザが検索に用いたキーワードと、そのユーザが選択したテキストデータの対応付けが、他のユーザでも利用されるため、特定のキーワードで検索されるテキストデータのランク付けがなされる効果が得られる。   The related word information storage unit 311 associates information specifying text data (hereinafter referred to as a text data ID) with a keyword corresponding to the text data at the time of search, particularly as a related word, and stores it as related word information. It is a storage unit. The text data ID may be information that can uniquely identify the text data. The related word information storage unit 311 may be shared by all users or a specific group in the entire text search system, or may be prepared for each individual. Moreover, these may be mixed. When the related word information storage unit 311 is shared with other users, the association between the keyword used by a certain user for the search and the text data selected by the user is also used by other users. It is possible to obtain an effect of ranking the text data searched with the keywords.

関連語情報登録部312は、前述のテキストデータIDと、関連語を対応付けて関連語情報として関連語情報記憶部311に記憶させる。   The related word information registration unit 312 associates the text data ID with the related word, and stores the related word information in the related word information storage unit 311 as related word information.

キーワード受信部313は、検索条件であるキーワードをキーワード送信部304により受け付ける。   The keyword receiving unit 313 receives a keyword as a search condition from the keyword transmitting unit 304.

関連語情報検索部314は、キーワード受信部313により受け付けたキーワードが、関連語情報記憶部311に記憶されている関連語情報における関連語と一致する場合に、対応するテキストデータIDを検索結果として取得し、通知する。   When the keyword received by the keyword receiving unit 313 matches the related word in the related word information stored in the related word information storage unit 311, the related word information search unit 314 uses the corresponding text data ID as a search result. Get and notify.

全文検索部315は、キーワード受信部313により受け付けたキーワードに基づき、テキストデータに対して全文検索を実行し、テキストデータIDを検索結果として取得し、通知する。   The full-text search unit 315 performs a full-text search on the text data based on the keyword received by the keyword receiving unit 313, acquires the text data ID as a search result, and notifies it.

検索結果送信部316は、関連語情報検索部314および全文検索部315により取得、通知された検索結果を、クライアント装置102に送信する。送信は、検索結果が全て取得された後に行ってもよい。また、本発明の実施形態においては、例えば、関連語情報検索部314の検索処理完了時点で、全文検索部315の検索処理完了を待たずに、前者の検索結果のみを送信し、後者が完了してから後者の検索結果を送信する、などの構成にしてもよい。また、両者の検索手段による検索結果が1件取得される度に、送信してもよい。なお、送信する検索結果は、検索結果に対応するテキストデータの全体である必要はなく、例えば、クライアント装置102におけるユーザが、検索結果一覧を確認するための表示に必要なデータと、検索結果一覧からユーザが選択したテキストデータを特定するテキストデータIDなどでよい。ユーザにより、後者のテキストデータIDが選択された場合に、そのテキストデータ(この段階では全ては表示されていない)に対する詳細の閲覧要求があったものとして、初めてテキストデータ全体をクライアント装置102に送信する、などであってもよい。   The search result transmission unit 316 transmits the search results acquired and notified by the related word information search unit 314 and the full-text search unit 315 to the client device 102. The transmission may be performed after all the search results are acquired. In the embodiment of the present invention, for example, when the search processing of the related word information search unit 314 is completed, only the search result of the former is transmitted without waiting for the search processing of the full text search unit 315 to be completed, and the latter is completed. Then, the latter search result may be transmitted. Alternatively, it may be transmitted each time one search result is acquired by both search means. Note that the search result to be transmitted does not have to be the entire text data corresponding to the search result. For example, the user in the client apparatus 102 needs to display the search result list and the search result list. The text data ID for specifying the text data selected by the user can be used. When the user selects the latter text data ID, the entire text data is transmitted to the client device 102 for the first time on the assumption that there is a detailed browsing request for the text data (not all are displayed at this stage). It may be.

選択情報受信部317は、選択情報送信部305によりクライアント装置102から送信されたユーザが選択したテキストデータに対応するテキストデータIDを受信する。これにより、前述したように、受信したテキストデータIDに対応するテキストデータをユーザに閲覧させるため、テキストデータ全体をクライアント装置102に送信する、などの処理を呼び出すように実装することが可能となる。   The selection information receiving unit 317 receives the text data ID corresponding to the text data selected by the user transmitted from the client device 102 by the selection information transmitting unit 305. Accordingly, as described above, in order to make the user browse the text data corresponding to the received text data ID, it is possible to implement a process such as calling processing such as transmitting the entire text data to the client device 102. .

次に、図4から図8の画面例、関連語情報記憶部311のデータ構成の例を用いて本発明の実施形態に係わる処理を説明する。   Next, processing according to the embodiment of the present invention will be described using the screen examples of FIGS. 4 to 8 and the data configuration example of the related word information storage unit 311.

図4は、本発明の実施形態に係わるクライアント装置における検索のキーワードを入力する画面の一例である。検索操作画面400aは、キーワード入力フィールド401a、検索結果一覧表示フィールド402a、検索指示ボタン403により構成される。また、本例では検索対象となるテキストデータは404に格納されており、テキストデータはTEXTID405、タイトル406、内容407により構成されている。   FIG. 4 is an example of a screen for inputting a search keyword in the client device according to the embodiment of the present invention. The search operation screen 400a includes a keyword input field 401a, a search result list display field 402a, and a search instruction button 403. In this example, text data to be searched is stored in 404, and the text data includes TEXT ID 405, title 406, and contents 407.

本例では、キーワード入力フィールド401aに検索のキーワードとして“ペット”、“犬”の2つが入力されている。この状態で検索指示ボタン403を押下すると検索指示がテキスト検索サーバ101に送られ、検索結果が検索結果一覧表示フィールド402aに表示される。この時点では、図6で詳細に説明する関連語情報記憶部311は、まだ初期状態で関連語情報は登録されていないものとする。この場合、関連語情報検索は有効ではなく、全文検索のみが処理される。   In this example, two keywords “pet” and “dog” are entered in the keyword input field 401a as search keywords. When the search instruction button 403 is pressed in this state, the search instruction is sent to the text search server 101, and the search result is displayed in the search result list display field 402a. At this point, it is assumed that the related word information storage unit 311 described in detail with reference to FIG. 6 does not yet register related word information in an initial state. In this case, the related word information search is not effective, and only the full text search is processed.

図5は、本発明の実施形態に係わる全文検索の検索結果をクライアント装置において表示する画面の一例である。本例は、図4で説明した条件において、検索処理をした結果の表示画面である。すなわち、404に格納されたTEXT01〜TEXT06を、全文検索により検索した結果であり、検索結果一覧表示フィールド402bに5件の検索結果が表示されている。   FIG. 5 is an example of a screen for displaying the search result of the full-text search according to the embodiment of the present invention on the client device. This example is a display screen of a result of search processing under the conditions described in FIG. That is, it is a result of searching TEXT01 to TEXT06 stored in 404 by full-text search, and five search results are displayed in the search result list display field 402b.

検索結果としては、キーワードである“ペット”に対し、“カーペット”(TEXT02)、“ペットボトル”(TEXT06)などが含まれる。すなわち全文検索による処理であるため“ペット”には関係のないテキストデータ内の文字列がマッチすることによる。また、“ペット”に関する話題であっても、全てのテキストデータについてユーザの興味があるとは限らない。そこで、ユーザの興味があると思われるテキストデータを、ユーザが選択(テキストデータの詳細を閲覧するためなどの選択)したタイミングなどで、テキストデータIDと本例の検索に使用したキーワードを、次の図6で説明する関連語情報記憶部311に登録する。   The search results include “carpet” (TEXT02), “pet bottle” (TEXT06), etc. for the keyword “pet”. That is, since the process is a full text search, the character string in the text data not related to “pet” is matched. Moreover, even if the topic is related to “pet”, the user is not necessarily interested in all text data. Therefore, the text data ID and the keyword used for the search in this example are as follows at the timing when the user selects text data that the user is interested in (selection for viewing the details of the text data). The related word information storage unit 311 described in FIG.

図6は、本発明の実施形態に係わる関連語情報記憶部311のデータ構成の一例である。関連語情報記憶部311は、例としてマトリックス形式のテーブル600aとして構成される。すなわち、縦方向は関連語一覧601を示し、横方向はTEXTID一覧602を示し、関連語とTEXTIDが交わるセルには選択結果603が示される。選択結果603に記載される情報は、本例では、関連語に対応するキーワードに基づき検索を実行し、その検索結果一覧から、TEXTIDに対応するテキストデータをユーザが選択した回数(選択回数)である。また、回数ではなく、単に選択されたことがある(“TRUE”)、ない(“FALSE”)のフラグであってもよい。   FIG. 6 is an example of a data configuration of the related word information storage unit 311 according to the embodiment of the present invention. The related word information storage unit 311 is configured as a matrix-type table 600a as an example. That is, the vertical direction shows the related word list 601, the horizontal direction shows the TEXTID list 602, and the selection result 603 is shown in the cell where the related word and TEXTID intersect. In this example, the information described in the selection result 603 is a search based on a keyword corresponding to a related word, and the number of times (selection count) the user has selected text data corresponding to TEXTID from the search result list. is there. Further, instead of the number of times, the flag may have been simply selected (“TRUE”) or not (“FALSE”).

“ペット”、“犬”のキーワードに基づく検索結果(図5)から、“TEXT01”、“TEXT04”、“TEXT05”をユーザが選択(閲覧など)した結果は、テーブル600aの通りとなる。さらに、“ペット”、“猫”のキーワードに基づく検索結果(不図示)から、“TEXT03”、“TEXT04”をユーザが選択(閲覧など)した結果は、テーブル600bの通りとなる。   Table 600a shows the result of the user selecting (viewing) “TEXT01”, “TEXT04”, and “TEXT05” from the search results based on the keywords “pet” and “dog” (FIG. 5). Furthermore, the result of the user selecting (viewing etc.) “TEXT03” and “TEXT04” from the search results (not shown) based on the keywords “pet” and “cat” is as shown in table 600b.

なお、テーブルは必ずしもマトリックス形式ではなくともよい。例えばテーブル600cのように、関連語が索引形式で並び(604a)、キーワードに対応する索引の中から該当する関連語(例えば“犬”)にリンクして、テキストデータID(605)と選択回数(606)が格納されていてもよい。マトリックス形式のように選択回数が“0”である場合には、対応するテキストデータID(605)は格納されておらず、選択されて初めて格納される。また、前述のように選択されたことがあるか否か判断ができればよい場合には、テーブル600dのように選択回数を格納するデータ(606に対応する部分)はなくともよい。   The table is not necessarily in the matrix format. For example, as shown in the table 600c, related words are arranged in an index form (604a), linked to a related word (for example, “dog”) from the index corresponding to the keyword, and the text data ID (605) and the number of selections. (606) may be stored. When the number of selections is “0” as in the matrix format, the corresponding text data ID (605) is not stored and is stored only after it is selected. Further, if it is sufficient to determine whether or not the selection has been made as described above, there is no need to store data (a portion corresponding to 606) for storing the number of selections as in the table 600d.

また、テキスト数607を関連語毎に格納してもよい。詳細は後述するが、検索においてユーザが入力したキーワードに基づき関連語を検索する際に、効率的な処理をする効果が得られる。   Further, the text number 607 may be stored for each related word. Although details will be described later, an effect of efficient processing can be obtained when a related word is searched based on a keyword input by the user in the search.

図7は、本発明の実施形態に係わる検索結果をクライアント装置において表示する画面の一例である。図4〜図6の600aで説明した状態で、再度、“ペット”、“犬”で検索する。本例では、前述の検索処理の説明とは異なり、関連語情報としてテーブル600aがあるため、関連語情報検索の処理が行われる。   FIG. 7 is an example of a screen for displaying the search result according to the embodiment of the present invention on the client device. In the state described with reference to 600a in FIGS. 4 to 6, the search is performed again with “pet” and “dog”. In this example, unlike the above description of the search process, the related word information search process is performed because the related word information includes the table 600a.

結果として、例えば関連語情報での検索結果に基づき、先にユーザが選択した“TEXT01”、“TEXT04”、“TEXT05”が上位に表示され(402cの701)、逆に先にユーザが選択しなかった“TEXT02”、“TEXT06”は下位に表示される(402cの702)。また、この順位は、選択回数を考慮するよう実装してもよく、例えば、関連語情報記憶部311が600bのようになっている状態で、選択回数の多い“TEXT04”が“TEXT01”より上位に表示されてもよい。すなわち、“ペット”と“犬”の選択回数と合計すると、他のテキストデータは2回であるのに対し、“TEXT04”のみ3回となるため上位に表示してもよい。これにより、検索時に入力したキーワードと関連語情報記憶部311に格納された関連語情報に基づき、関連度が高い情報は分かりやすく上位に表示される。
図6の方法では、関連語検索による検索結果が上位に表示されるものの、会に表示される全文検索による結果との間に区別がつかない。そこで例えば、境界線を明確に引く、タイトルの色や文字の形態を変える、各結果にアイコンを付けて区別するなど、様々な表示形態の変更により区別できるようにしてもよい。また、区別せずに、単なる優先順位の違い、と捉えてもよい。
As a result, for example, “TEXT01”, “TEXT04”, “TEXT05” previously selected by the user based on the search result in the related term information is displayed at the top (701 of 402c), and conversely, the user selects first. “TEXT02” and “TEXT06” which are not present are displayed in the lower order (702c of 402c). In addition, this order may be implemented so that the number of selections is taken into account. For example, in the state where the related word information storage unit 311 is 600b, “TEXT04” having a larger number of selections is higher than “TEXT01”. May be displayed. That is, when the total number of times “pet” and “dog” are selected, the other text data is twice, whereas only “TEXT04” is three times. Thereby, based on the keyword input at the time of the search and the related word information stored in the related word information storage unit 311, information with a high degree of relevance is displayed in an easy-to-understand manner.
In the method of FIG. 6, although the search result by the related word search is displayed at the top, it cannot be distinguished from the result by the full-text search displayed in the meeting. Therefore, for example, it may be possible to distinguish by changing various display forms such as clearly drawing a boundary line, changing the color or character form of the title, and adding an icon to each result. Further, it may be regarded as a mere difference in priority without distinction.

図8は、本発明の実施形態に係わる検索結果をクライアント装置において表示する画面の一例である。本画面の例では、検索結果を関連語情報に基づく検索処理に対応する結果(801の701)と、全文検索に基づく検索処理に対応する結果(802の702)と、異なる表示枠に分けて表示してもよい。   FIG. 8 is an example of a screen for displaying the search result according to the embodiment of the present invention on the client device. In this screen example, the search results are divided into different display frames, the results corresponding to the search processing based on the related term information (801 of 801) and the results corresponding to the search processing based on the full text search (802 of 702). It may be displayed.

図7、図8の表示方法は例であり、その他の方法でもよい。また、後述するが、全ての検索結果が得られてから表示するものであってもよいし、検索結果が1つ得られる度に、テキスト検索サーバ101から検索結果に対応する情報を取得し、表示するものであってもよい。   The display methods in FIGS. 7 and 8 are examples, and other methods may be used. In addition, as described later, it may be displayed after all search results are obtained, and each time one search result is obtained, information corresponding to the search result is obtained from the text search server 101, It may be displayed.

なお、前述の説明は、全てのキーワードをAND条件として、全て含むテキストデータのみを検索結果として取得するように説明した。キーワードをOR条件として検索し、1つでもキーワードを含むテキストデータを検索結果として取得、通知し、クライアント装置102において表示するようにしてもよい。また、この場合は、より多くのキーワードを関連語として含むものを上位に表示する、等の実装をしてもよい。   In the above description, all keywords are set as AND conditions, and only text data including all keywords is acquired as a search result. A keyword may be searched as an OR condition, and text data including at least one keyword may be acquired and notified as a search result and displayed on the client device 102. In this case, an implementation such as displaying a higher-ranking keyword including more keywords as related words may be implemented.

次に図9から図12のフローチャートを用いて処理の流れを説明する。   Next, the flow of processing will be described with reference to the flowcharts of FIGS.

図9は、本発明の実施形態に係わる関連語情報検索の処理を示すフローチャートの一例である。図9の各ステップは、テキスト検索サーバ101のCPU201によって実行される。   FIG. 9 is an example of a flowchart showing related word information search processing according to the embodiment of the present invention. Each step in FIG. 9 is executed by the CPU 201 of the text search server 101.

ステップS901において、キーワード受信部313により受け付けたキーワードの全てが、関連語情報記憶部311に関連語としてあるかを判定する。具体的には、全てのキーワードが、図6の601(テーブル600a)、604a(テーブル600c)、604b(テーブル600d)に格納されているか、検索して判定する。   In step S <b> 901, it is determined whether all of the keywords received by the keyword receiving unit 313 are related words in the related word information storage unit 311. Specifically, it is determined by searching whether all keywords are stored in 601 (table 600a), 604a (table 600c), and 604b (table 600d) in FIG.

ステップS902において、キーワード受信部313により受け付けたキーワードのうちの1つを選択する。選択は任意に行ってもよい。なお、キーワードと一致する関連語のうち、図6のテーブル600dにおけるテキスト数607に記載された数が最も小さいものを選択してもよい。その場合、後続のステップで、他のキーワードと一致するTEXTID一覧を絞り込む処理(ステップS906)の際に、確認するTEXTIDの数が少なくなり、また、早い段階でTEXTID一覧が空になる(ステップS907において“YES”)可能性が高くなるため、処理性能が向上する可能性がある。   In step S902, one of the keywords received by the keyword receiving unit 313 is selected. The selection may be made arbitrarily. Of the related terms matching the keyword, the one with the smallest number described in the number of texts 607 in the table 600d of FIG. 6 may be selected. In this case, in the subsequent step, the number of TEXTIDs to be confirmed is reduced during the process of narrowing down the TEXTID list that matches other keywords (step S906), and the TEXTID list is emptied at an early stage (step S907). In this case, the processing performance may be improved.

ステップS903において、ステップS902で選択したキーワードに一致する関連語に対応するテキストデータIDを、関連語情報記憶部311から取得しTEXTIDの一覧を作成する。   In step S903, the text data ID corresponding to the related word that matches the keyword selected in step S902 is acquired from the related word information storage unit 311 and a list of TEXT IDs is created.

ステップS904からステップS908のループ処理においては、キーワード受信部313により受け付けた全てのキーワードに対する繰り返し処理を実行する。ただし、ステップS902で使用したキーワードを除く。   In the loop processing from step S904 to step S908, iterative processing is executed for all keywords accepted by the keyword receiving unit 313. However, the keyword used in step S902 is excluded.

ステップS905において、1つのキーワードに着目する。ここで着目したキーワードにより、ループ処理の1回分の処理を実行する。   In step S905, attention is focused on one keyword. The loop processing is executed once by the keyword focused here.

ステップS906において、着目中のキーワードと一致する関連語を関連語情報記憶部311から検索する。一致するものがあれば(本説明では、ステップS901により必ず存在する)、その関連語に対応するTEXTIDの一覧を取得する。さらに、ステップS903で作成したTEXTIDの一覧と、本ステップで取得したTEXTIDの一覧の両方に存在するTEXIDのみを、ステップS903で作成したTEXTIDの一覧として残す(すなわちAND条件で絞り込む)。   In step S906, the related word information storage unit 311 is searched for a related word that matches the keyword under attention. If there is a match (in this description, it always exists in step S901), a list of TEXTIDs corresponding to the related word is acquired. Furthermore, only the TEXTIDs that exist in both the TEXTID list created in step S903 and the TEXTID list obtained in this step are left as a list of TEXTID created in step S903 (ie, narrowed down with an AND condition).

ステップS907において、前述のTEXTIDの一覧(ステップS903において作成し、ステップS906においてAND条件で絞り込んだTEXTIDの一覧)が空になっているか否かを判定する。TEXTIDの一覧が空でない(“NO”)場合には、すなわち現状の処理までに使用したキーワードを全て含むテキストデータが存在することとなる。そのため、ステップS908に進み、残りのキーワードがあればループ処理を継続する。TEXTIDの一覧が空である(“YES”)場合には、すなわち、現状の処理までに使用したキーワードを全て含むテキストデータは存在しないこととなる。従って検索処理を継続不要となり、図9のフローチャートを完了する。   In step S907, it is determined whether or not the TEXTID list (the TEXTID list created in step S903 and narrowed down with the AND condition in step S906) is empty. If the list of TEXTIDs is not empty (“NO”), that is, text data including all the keywords used up to the current process exists. Therefore, the process proceeds to step S908, and if there are remaining keywords, the loop process is continued. When the list of TEXTIDs is empty (“YES”), that is, there is no text data including all the keywords used up to the current process. Therefore, it is not necessary to continue the search process, and the flowchart of FIG. 9 is completed.

ステップS909において、前述のTEXTIDの一覧は空ではなく、検索結果とすべきテキストデータIDの全てが取得された。これにより図9のフローチャートを完了する。   In step S909, the list of TEXTIDs described above is not empty, and all text data IDs that should be search results have been acquired. This completes the flowchart of FIG.

なお、本フローチャートでは、全てのキーワードをAND条件で含むテキストデータを関連語情報検索の検索結果として取得、通知する処理の説明をした。前述の通り、OR条件とする場合には、ステップS901の判定をせず、また、ステップS906において着目中のキーワードと一致する関連語に対応するTEXTIDと、現状のTEXTID一覧にあるTEXTIDの両方にあるものを残すのではなく、一方にあればTEXTID一覧に追加していく。   In this flowchart, the process of acquiring and notifying text data including all keywords under AND conditions as a search result of related word information search has been described. As described above, in the case of the OR condition, the determination in step S901 is not performed, and both the TEXTID corresponding to the related word that matches the keyword under attention in step S906 and the TEXTID in the current TEXTID list. Instead of leaving something, add it to the TEXTID list if there is one.

さらに、TEXTID一覧に選択回数を追加し、また再度異なるキーワード(関連語)に対して同じTEXTIDが出現した場合には、その選択回数を累積することにより、図8の最後に説明した選択回数に基づく優先順位を決定し、表示順の変更などの処理をする効果が得られる。
以上で、図9のフローチャートの説明を完了する。
Further, when the number of selections is added to the TEXTID list and the same TEXTID appears again for a different keyword (related word), the number of selections is accumulated to obtain the number of selections described at the end of FIG. It is possible to obtain the effect of determining the priority order based on the processing and changing the display order.
This completes the description of the flowchart in FIG. 9.

図10は、全文検索の処理を示すフローチャートの一例である。図10の各ステップは、テキスト検索サーバ101のCPU201によって実行される。本フローチャートによって、全文検索の流れを説明する。   FIG. 10 is an example of a flowchart showing the full text search process. Each step in FIG. 10 is executed by the CPU 201 of the text search server 101. The flow of full text search will be described with reference to this flowchart.

ステップS1001からステップS1010のループ処理においては、テキストデータ管理サーバ103に格納された全てのテキストデータに対する繰り返し処理を実行する。   In the loop processing from step S1001 to step S1010, repetitive processing is executed for all text data stored in the text data management server 103.

ステップS1002において、1つのテキストデータに着目する。ここで着目したテキストデータに対してループ処理の1回分の処理を実行する。   In step S1002, attention is focused on one text data. The loop processing is executed once for the text data focused here.

ステップS1003において、着目中のテキストデータが既に関連語情報検索(図9で示した処理)による検索結果とされたものか否かを判定する。すなわち、関連語情報検索は、全文検索と比較して短時間で処理されるため、関連語情報検索の最終的な検索結果の一覧に着目中のテキストデータに対応するテキストIDが含まれているか確認し、含まれていれば全文検索する必要はない。   In step S1003, it is determined whether or not the text data of interest has already been obtained as a search result by related word information search (the process shown in FIG. 9). That is, since the related word information search is processed in a short time compared to the full text search, does the final search result list of the related word information search include the text ID corresponding to the text data of interest? If it is confirmed and included, it is not necessary to search the full text.

着目中のテキストデータに対して全文検索を実行する時点では、必ずしも関連語情報検索の検索結果が全て得られているとは限らない。その場合、ステップS1003の判定は一旦保留して、全文検索処理を実行し、関連語情報検索がすべて完了した時点で通知を受け、その時点で暫定的に全文検索の検索結果一覧に含まれているテキストデータIDが、関連語情報検索の検索結果一覧に含まれているか判定して、含まれていれば結果から除外してもよい。   At the time when a full-text search is performed on the text data under consideration, not all search results of related term information search are obtained. In that case, the determination in step S1003 is temporarily suspended, a full-text search process is executed, a notification is received when all the related word information search is completed, and at that time, the full-text search is temporarily included in the search result list. It is determined whether the text data ID is included in the search result list of the related term information search, and if it is included, it may be excluded from the result.

関連語情報検索による検索結果とされたテキストデータ(ステップS1003で“NO”)の場合、ステップS1004に進む。関連語情報検索による検索結果とされたテキストデータではない(ステップS1003で“YES”)場合、ステップS1010に進む(すなわち着目中のテキストデータに対する処理を完了し、次のテキストデータに着目する)。   In the case of text data (“NO” in step S1003) determined as a search result by related word information search, the process proceeds to step S1004. If it is not the text data obtained as the search result by the related term information search (“YES” in step S1003), the process proceeds to step S1010 (that is, the process for the text data of interest is completed and the next text data is focused).

ステップS1004からステップS1008のループ処理においては、着目中のテキストデータにキーワード受信部313で受け付けたキーワードが含まれているかどうか判定するため、各キーワードに対して繰り返し実行される。   In the loop processing from step S1004 to step S1008, in order to determine whether or not the keyword received by the keyword receiving unit 313 is included in the text data of interest, it is repeatedly executed for each keyword.

ステップS1005において、キーワード受信部313で受け付けたキーワードのうち、1つのキーワードに着目する。   In step S1005, attention is focused on one keyword among the keywords received by the keyword receiving unit 313.

ステップS1006において、着目中のキーワードで着目中のテキストデータを走査する。すなわち、文字列であるキーワードが、テキストデータ中の部分文字列として存在する位置を、例えばテキストデータの先頭から探していく。   In step S1006, the text data under attention is scanned with the keyword under attention. That is, a position where a keyword that is a character string exists as a partial character string in the text data is searched from the beginning of the text data, for example.

ステップS1007において、文字列であるキーワードが、テキストデータ中の部分文字列として存在したか否かを判定する。存在した(“YES”である)場合にはステップS1008に進む。すなわち、次のキーワードに着目して同じ処理を行う。存在しない(“NO”である)場合には、着目中のテキストデータは、着目中のキーワードを文字列として含まないとしてステップS1010に進む。すなわち、着目中のテキストデータは、検索結果とはせず次のテキストデータに対する処理を実行する。   In step S1007, it is determined whether a keyword that is a character string exists as a partial character string in the text data. If it exists (“YES”), the process proceeds to step S1008. That is, the same processing is performed by paying attention to the next keyword. If it does not exist ("NO"), the text data being noticed does not include the keyword being noticed as a character string, and the process advances to step S1010. In other words, the text data under attention is not processed as a search result, but the process for the next text data is executed.

着目中のテキストデータに対して、ステップS1004からステップS1008のループ処理により、全てのキーワードが含まれる場合には、該ループ処理を抜け、ステップS1009に進む。   When all the keywords are included in the text data under attention by the loop processing from step S1004 to step S1008, the loop processing is exited and the process proceeds to step S1009.

ステップS1009において、着目中のテキストデータは、キーワード受信部313で受け付けた全てのキーワードが含まれているので、該テキストデータを検索結果とする。次にステップS1010に進み次のテキストデータの処理を実行する。   In step S1009, the text data being focused on includes all the keywords received by the keyword receiving unit 313. Therefore, the text data is used as a search result. In step S1010, the next text data is processed.

ステップS1001からステップS1010のループ処理が完了すると、全てのテキストデータに対して検索処理、すなわち図10のフローチャートの処理が完了する。   When the loop processing from step S1001 to step S1010 is completed, the search processing for all text data, that is, the processing of the flowchart of FIG. 10 is completed.

なお、本フローチャートでは、全てのキーワードをAND条件で含むテキストデータを全文検索の検索結果として取得、通知する処理の説明をした。OR条件とする場合には、ステップS1007の判定の結果、“YES”の場合はステップS1004からステップS1008のループ処理を終了してステップS1009において検索結果とし、また“NO”の場合には同ループ処理を繰り返して全キーワードに対する処理を完了するまで繰り返す。ループ処理を最後まで実行したにもかかわらず1つのキーワードもテキストデータに含まれることがない場合には、ステップS1009をスキップして、ステップS1010に進む(すなわち、次のテキストデータの処理に進む)。以上で、図10のフローチャートの説明を完了する。   In this flowchart, the process of acquiring and notifying text data including all keywords under the AND condition as a search result of the full text search has been described. In the case of the OR condition, as a result of the determination in step S1007, in the case of “YES”, the loop processing from step S1004 to step S1008 is terminated and used as the search result in step S1009. Repeat the process until all the keywords have been processed. If one keyword is not included in the text data even though the loop processing has been executed to the end, the process skips step S1009 and proceeds to step S1010 (that is, proceeds to processing of the next text data). . Above, description of the flowchart of FIG. 10 is completed.

図11は、本発明の実施形態に係わるテキスト検索の処理を示すフローチャートの一例である。図11の検索処理は、テキスト検索サーバ101において関連語検索をまず実行し、その結果をクライアント装置102に返して表示し、その後、全文検索を実行し、その結果をクライアント装置102に返す処理を説明したものである。図11のステップS1101からステップS1106は、クライアント装置102のCPU201、またステップS1111からステップS1115は、テキスト検索サーバ101のCPU201によって実行される。   FIG. 11 is an example of a flowchart showing text search processing according to the embodiment of the present invention. In the search process of FIG. 11, the related word search is first executed in the text search server 101, the result is returned and displayed on the client device 102, and then the full text search is executed and the result is returned to the client device 102. Explained. Steps S1101 to S1106 in FIG. 11 are executed by the CPU 201 of the client apparatus 102, and steps S1111 to S1115 are executed by the CPU 201 of the text search server 101.

ステップS1101において、クライアント装置102は、ユーザから検索条件となるキーワードを受け付ける。   In step S <b> 1101, the client apparatus 102 receives a keyword serving as a search condition from the user.

ステップS1102において、クライアント装置102は、ステップS1101にて受け付けたキーワードを、テキスト検索サーバ101に送信する。   In step S1102, the client apparatus 102 transmits the keyword accepted in step S1101 to the text search server 101.

ステップS1111において、テキスト検索サーバ101は、クライアント装置102から送信されたキーワードを受け付ける。   In step S <b> 1111, the text search server 101 accepts the keyword transmitted from the client device 102.

ステップS1112において、テキスト検索サーバ101は、ステップS1111にて受け付けたキーワードに基づき、関連語情報検索処理を実行する。この処理は、図9で説明したフローチャートなどによる。   In step S1112, the text search server 101 performs related word information search processing based on the keyword received in step S1111. This processing is based on the flowchart described in FIG.

ステップS1113において、テキスト検索サーバ101は、関連語情報検索処理により取得した検索結果一覧をクライアント装置102に送信する。   In step S <b> 1113, the text search server 101 transmits the search result list acquired by the related word information search process to the client device 102.

ステップS1103において、クライアント装置102は、テキスト検索サーバ101のステップS1113にて送信された検索結果一覧を受信する。   In step S1103, the client apparatus 102 receives the search result list transmitted in step S1113 of the text search server 101.

ステップS1104において、クライアント装置102は、ステップS1103にて受信した検索結果一覧を、クライアント装置102の表示装置に表示させる。   In step S <b> 1104, the client device 102 displays the search result list received in step S <b> 1103 on the display device of the client device 102.

ステップS1114において、テキスト検索サーバ101は、ステップS1111にて受け付けたキーワードに基づき、全文検索処理を実行する。この処理は、図10で説明したフローチャートなどによる。   In step S1114, the text search server 101 executes a full-text search process based on the keyword received in step S1111. This processing is based on the flowchart described in FIG.

ステップS1115において、テキスト検索サーバ101は、全文検索処理により取得した検索結果一覧をクライアント装置102に送信する。   In step S <b> 1115, the text search server 101 transmits the search result list acquired by the full text search process to the client device 102.

ステップS1105において、クライアント装置102は、テキスト検索サーバ101のステップS1115にて送信された検索結果一覧を受信する。   In step S1105, the client apparatus 102 receives the search result list transmitted in step S1115 of the text search server 101.

ステップS1106において、クライアント装置102は、ステップS1105にて受信した検索結果一覧を、クライアント装置102の表示装置に表示させる。
なお、1つのテキストデータに対応する各検索結果が、“関連語情報検索”により検索されたものであるか、“全文検索”により検索されたものであるかは、その結果をステップS1103により受信したか、S1105により受信したかで判別可能であるため、表示する位置(順序、あるいは表示する枠)などを変更してもよい。また、同一の枠に表示する場合には、例えば関連語情報検索による結果を上位に表示し、全文検索との間に、境界線を表示してユーザに識別可能とする、検索結果の前にアイコンを付与する、その他、色などによる表示形態を変更してもよい。
以上で、図11のフローチャートの説明を完了する。
In step S1106, the client apparatus 102 displays the search result list received in step S1105 on the display apparatus of the client apparatus 102.
Whether each search result corresponding to one text data is searched by “related word information search” or “full text search” is received in step S1103. Since it can be determined whether it has been received in S1105, the display position (order or frame to be displayed) may be changed. In addition, when displaying in the same frame, for example, the result of related word information search is displayed at the top, and a boundary line is displayed between the full text search so that the user can identify it before the search result. In addition, an icon may be added, or the display form by color or the like may be changed.
Above, description of the flowchart of FIG. 11 is completed.

<第2の実施形態>
図12は、本発明の実施形態に係わるテキスト検索の処理を示すフローチャートの一例である。図12の検索処理は、テキスト検索サーバ101において関連語検索と全文検索を非同期に実行し、検索結果が得られる度に、その結果(1つまたは複数であってもよい)をクライアント装置102に返す処理を説明したものである。図12のステップS1201からステップS1206は、クライアント装置102のCPU201、またステップS1211からステップS1214は、テキスト検索サーバ101のCPU201によって実行される。
<Second Embodiment>
FIG. 12 is an example of a flowchart showing text search processing according to the embodiment of the present invention. In the search processing of FIG. 12, the related word search and the full-text search are executed asynchronously in the text search server 101, and each time a search result is obtained, the result (which may be one or more) is sent to the client device 102. It explains the process to return. Steps S1201 to S1206 in FIG. 12 are executed by the CPU 201 of the client apparatus 102, and steps S1211 to S1214 are executed by the CPU 201 of the text search server 101.

ステップS1201において、クライアント装置102は、ユーザから検索条件となるキーワードを受け付ける。   In step S <b> 1201, the client apparatus 102 receives a keyword serving as a search condition from the user.

ステップS1202において、クライアント装置102は、ステップS1201にて受け付けたキーワードを、テキスト検索サーバ101に送信する。   In step S 1202, the client apparatus 102 transmits the keyword accepted in step S 1201 to the text search server 101.

ステップS1211において、テキスト検索サーバ101は、クライアント装置102から送信されたキーワードを受け付ける。   In step S <b> 1211, the text search server 101 accepts the keyword transmitted from the client device 102.

ステップS1212において、テキスト検索サーバ101は、ステップS1211にて受け付けたキーワードに基づき、関連語情報検索処理を実行する。この処理は、図9で説明したフローチャートなどによる。また、全てのテキストデータに対して検索を完了した場合には、終了の通知をする。   In step S <b> 1212, the text search server 101 executes related word information search processing based on the keyword received in step S <b> 1211. This processing is based on the flowchart described in FIG. When the search is completed for all text data, an end notification is sent.

ステップS1213において、テキスト検索サーバ101は、ステップS1211にて受け付けたキーワードに基づき、全文検索処理を実行する。この処理は、図10で説明したフローチャートなどによる。ただし、関連語情報検索を優先するため、全文検索対象とするのは関連語情報検索を完了し、且つ関連語情報検索の条件を満たさない(検索結果とならない)テキストデータを対象とする。また、全てのテキストデータに対して検索を完了した場合には、終了の通知をする。   In step S1213, the text search server 101 executes full-text search processing based on the keyword received in step S1211. This processing is based on the flowchart described in FIG. However, in order to prioritize related word information search, the target of full-text search is text data that has completed the related word information search and does not satisfy the related word information search condition (is not a search result). When the search is completed for all text data, an end notification is sent.

前述のステップS1212とステップS1213の検索処理は非同期に実行され、各々検索結果を取得する度、あるいは終了の通知をする際に、処理を次のステップS1214に進める。   The above-described search processing in step S1212 and step S1213 is executed asynchronously, and the processing proceeds to the next step S1214 each time a search result is acquired or when an end notification is made.

ステップS1214においてテキスト検索サーバ101は、ステップS1212またはステップS1213から、検索結果あるいは終了通知を取得し、それらをクライアント装置102に送信する。この場合、関連語情報検索(S1212)と全文検索(S1213)のいずれによる検索結果であるかを判別可能な情報を含めて送信する。また、関連語情報検索と全文検索の両方が終了した場合には、前記の送信後、テキスト検索サーバ101側の非同期処理のフローチャートを完了する。   In step S <b> 1214, the text search server 101 acquires the search result or the end notification from step S <b> 1212 or step S <b> 1213 and transmits them to the client apparatus 102. In this case, information including information that can be used to determine whether the search result is a related word information search (S1212) or a full-text search (S1213) is transmitted. If both related word information search and full text search are completed, the flowchart of asynchronous processing on the text search server 101 side is completed after the transmission.

ステップS1203において、クライアント装置102は、テキスト検索サーバ101のステップS1113にて送信された検索結果(1つ又は複数)あるいは終了通知を受信する。また、受信内容が“検索結果”である場合には、1つのテキストデータに対応する各検索結果が、“関連語情報検索”により検索されたものであるか、“全文検索”により検索されたものであるかを判別可能な情報も受信する。検索結果は非同期に送信されてくるため、テキスト検索サーバ101から送信される検索結果を順次受け付ける。   In step S1203, the client apparatus 102 receives the search result (one or more) or the end notification transmitted in step S1113 of the text search server 101. When the received content is “search result”, each search result corresponding to one text data is searched by “related word information search” or searched by “full text search”. It also receives information that can identify whether it is a thing. Since the search results are transmitted asynchronously, the search results transmitted from the text search server 101 are sequentially accepted.

ステップS1204において、クライアント装置102は、ステップS1203における受信内容が、“検索結果”か“終了通知”か、を判定する。受信内容が“検索結果”である場合には、ステップS1205に進む。受信内容が“終了通知”である場合には、ステップS1206に進む。   In step S1204, the client apparatus 102 determines whether the received content in step S1203 is “search result” or “end notification”. If the received content is “search result”, the process proceeds to step S1205. If the received content is “end notification”, the process advances to step S1206.

ステップS1205において、クライアント装置102は、ステップS1203において受信した検索結果をクライアント装置102の表示装置に表示させる。また、前述で説明した通り、1つのテキストデータに対応する各検索結果が、“関連語情報検索”により検索されたものであるか、“全文検索”により検索されたものであるかを判定できる情報も受信しているため、表示する位置(順序、あるいは表示する枠)などを変更してもよい。その他、色など表示形態を変更してもよい。前述の通り、検索結果は順次送信されてくるため、すべて受信されるのを待たずに、受信済みの検索結果を表示する。検索結果一覧がすでに表示されている場合には、その検索結果一覧の表示に追加する。次に、さらにテキスト検索サーバ101からの送信を受信するため、ステップS1203に戻る。   In step S1205, the client device 102 displays the search result received in step S1203 on the display device of the client device 102. Further, as described above, it is possible to determine whether each search result corresponding to one text data is searched by “related word information search” or “full text search”. Since the information is also received, the display position (order or frame to be displayed) may be changed. In addition, the display form such as color may be changed. As described above, since the search results are sequentially transmitted, the received search results are displayed without waiting for all of them to be received. If the search result list is already displayed, it is added to the display of the search result list. Next, in order to receive further transmission from the text search server 101, the process returns to step S1203.

ステップS1206において、クライアント装置102は、関連語情報検索処理の終了通知(ステップS1212に基づく終了通知)と、全文検索処理の終了通知(ステップS1213に基づく終了通知)の両方を受信したか否かを判定する。受信した終了通知がいずれか一方である(“NO”)場合には、テキスト検索サーバ101における検索処理は継続しており、クライアント装置102は受信を継続するため、ステップS1203に戻る。両方から終了通知を受信した(“YES”)場合には、テキスト検索サーバ101における検索処理は完了したとして、図12のフローチャートを完了する。
以上により、図12のフローチャートの説明を完了する。
In step S1206, the client apparatus 102 determines whether or not both of the related word information search processing end notification (end notification based on step S1212) and the full-text search processing end notification (end notification based on step S1213) have been received. judge. If the received end notification is either one (“NO”), the search processing in the text search server 101 continues, and the client apparatus 102 returns to step S1203 to continue receiving. When the end notifications are received from both (“YES”), the search process in the text search server 101 is completed, and the flowchart of FIG. 12 is completed.
Thus, the description of the flowchart in FIG. 12 is completed.

<第3の実施形態>
次に図13〜図15を用いて、本発明の第3実施形態における関連語情報検索と全文検索の処理について説明する。
<Third Embodiment>
Next, the related word information search and the full text search in the third embodiment of the present invention will be described with reference to FIGS.

図13は、本発明の第3実施形態に係わる関連語検索の処理を示すフローチャートの一例である。図13の各ステップは、テキスト検索サーバ101のCPU201によって実行される。   FIG. 13 is an example of a flowchart showing related word search processing according to the third embodiment of the present invention. Each step in FIG. 13 is executed by the CPU 201 of the text search server 101.

図13〜図14の処理は図9〜図12で説明したテキスト検索処理とは異なり、全文検索で各テキストデータを走査するキーワードは、関連語情報記憶部311のTEXTIDに対応する情報(後述する図15の縦方向)に選択結果がない関連語に限定される。すなわち、図9〜図12で説明した処理では、関連語情報検索の検索結果として通知されなかったテキストデータは、全文検索においては全てのキーワードで改めて走査されていた。しかし、キーワードのうち、前記テキストデータの関連語であれば、テキストデータに含まれていることが判明しているため、改めて全文検索をする必要はない。そのため、テキストデータの走査を省略することで、図9〜図12よりさらに効率化(高速化)することができる。   The processing of FIGS. 13 to 14 is different from the text search processing described in FIGS. 9 to 12, and the keyword for scanning each text data in the full text search is information corresponding to TEXTID in the related word information storage unit 311 (described later). It is limited to related terms that have no selection result in the vertical direction of FIG. That is, in the processing described with reference to FIGS. 9 to 12, the text data that has not been notified as the search result of the related word information search is scanned again with all keywords in the full text search. However, since it has been found that any keyword related to the text data is included in the text data, there is no need to perform a full text search again. Therefore, by omitting the scanning of the text data, the efficiency (speedup) can be further increased as compared with FIGS.

ステップS1301からステップS1304のループ処理においては、キーワード受信部313で受け付けた全てのキーワードに対する繰り返し処理を実行する。   In the loop processing from step S1301 to step S1304, iterative processing is executed for all keywords accepted by the keyword receiving unit 313.

ステップS1302においては、1つのキーワードに着目する。ここで着目したキーワードにより、ループ処理の1回分の処理を実行する。   In step S1302, attention is focused on one keyword. The loop processing is executed once by the keyword focused here.

ステップS1303においては、着目中のキーワードに一致する関連語が、関連語情報記憶部311に存在すれば、その関連語に対応するTEXTID一覧を関連語情報記憶部311から取得する。   In step S <b> 1303, if a related word that matches the keyword of interest exists in the related word information storage unit 311, a TEXT ID list corresponding to the related word is acquired from the related word information storage unit 311.

ステップS1305においては、ステップS1303において取得した各関連語に対応するTEXTID一覧の全てに共通して含まれるTEXTIDを関連語検索の検索結果として通知する。すなわち、キーワードの全てが関連語であるTEXTIDにあるテキストデータは、全文検索を処理しなくとも、図13のフローチャートにおいては、テキスト検索処理の結果とされる。   In step S1305, TEXTID included in common in all the TEXTID lists corresponding to each related word acquired in step S1303 is notified as a search result of related word search. That is, the text data in TEXTID, in which all of the keywords are related words, is the result of the text search process in the flowchart of FIG. 13 even if the full text search is not processed.

ここで、キーワードとして「ペット、犬」の2つが指定された場合に、図13のフローチャートが完了した時点の検索結果を、図15を用いて説明する。   Here, the search results when the flowchart of FIG. 13 is completed when two keywords “pet, dog” are specified will be described with reference to FIG. 15.

図15は、本発明の実施形態に係わる関連語情報記憶部と、関連語情報検索と全文検索の検索結果を説明するための図である。具体的に図4の404のテキストデータに対して「犬、ペット」の2つを条件となるキーワードとして検索した結果を説明する図である。   FIG. 15 is a diagram for explaining a related word information storage unit according to the embodiment of the present invention and search results of related word information search and full text search. Specifically, FIG. 5 is a diagram illustrating a result of searching for text data 404 in FIG. 4 using two keywords “dog, pet” as conditions.

図15の600eは、6つのテキストデータのうち、TEXT01、TEXT04、TEXT05の3つが、関連語として「犬、ペット」のいずれをも記憶している。従って、関連語検索が完了した時点で、前述の3つのテキストデータが検索結果として通知される。   In 600e of FIG. 15, among the six text data, three of TEXT01, TEXT04, and TEXT05 store “dog, pet” as related words. Therefore, when the related word search is completed, the above three text data are notified as the search results.

また、TEXT02は「犬」のみ、TEXT03は「ペット」のみが関連語検索における検索結果として記憶される。これらの結果により、次に説明する全文検索においてTEXT02は「ペット」のみテキストデータを走査すればよく、同様にTEXT03においては「犬」のみテキストデータを走査すればよい。   In addition, only “Dog” is stored as TEXT02 and only “Pet” is stored as TEXT03 as a search result in the related word search. Based on these results, in the full-text search described below, TEXT 02 only needs to scan text data for “pet”, and similarly, only text “dog” needs to be scanned for TEXT 03.

さらに、TEXT06においては、「犬、ペット」のいずれも関連語ではないため、次の全文検索においてテキストデータの走査をする必要がある。   Further, in TEXT06, since “dog, pet” is not a related word, it is necessary to scan text data in the next full-text search.

図13のフローチャートの説明により、関連語検索において検索結果となったキーワードが、全キーワードのうちの一部であっても次の全文検索において検索不要となり、全文検索を実行する際にテキストデータを走査すべきキーワードの総数を削減し、全文検索の処理速度を向上させる効果を得ることができる。   According to the description of the flowchart of FIG. 13, even if the keyword that is the search result in the related word search is a part of all the keywords, the search is unnecessary in the next full text search, and the text data is obtained when the full text search is executed. The total number of keywords to be scanned can be reduced, and the effect of improving the processing speed of full text search can be obtained.

以上で、図13のフローチャートのテキスト検索処理、および図15の600eを用いたテキスト検索結果の説明を完了する。   This completes the description of the text search process of the flowchart of FIG. 13 and the text search result using 600e of FIG.

図14は、本発明の第3実施形態に係わる全文検索の処理を示すフローチャートの一例である。図14の各ステップは、テキスト検索サーバ101のCPU201によって実行される。図14のフローチャートでは、図13の関連語検索に対して、ユーザが指定したキーワードの「いずれかを関連語として含まないテキストデータ」に対して、全文テキストを実行するものである。   FIG. 14 is an example of a flowchart showing a full-text search process according to the third embodiment of the present invention. Each step in FIG. 14 is executed by the CPU 201 of the text search server 101. In the flowchart of FIG. 14, the full-text is executed for the keyword specified by the user “text data not including any of the related words” in the related word search of FIG. 13.

ステップS1401からステップS1410のループ処理においては、テキストデータ管理サーバ103に格納された全てのテキストデータに対する繰り返し処理を実行する。ただし、前述の関連語検索の検索結果である(ステップS1305において検索結果として通知された)テキストデータは除く。図15の600fで示すように、TEXT01、TEXT04、TEXT05は全文検索を不要である。   In the loop processing from step S1401 to step S1410, repetitive processing is executed for all text data stored in the text data management server 103. However, the text data that is the search result of the related word search described above (notified as the search result in step S1305) is excluded. As indicated by 600f in FIG. 15, TEXT01, TEXT04, and TEXT05 do not require a full text search.

ステップS1402においては、検索対象とするテキストデータの1つに着目する。   In step S1402, attention is focused on one piece of text data to be searched.

ステップS1403からステップS1408のループ処理においては、着目中のテキストデータに対して、全文検索を実行するため、全てのキーワードに対する繰り返し処理を実行する。   In the loop processing from step S1403 to step S1408, in order to perform full-text search for the text data under attention, iterative processing is executed for all keywords.

ステップS1404においては、検索条件となるキーワードのうちの1つに着目する。   In step S1404, attention is focused on one of the keywords serving as a search condition.

ステップS1405においては、着目中のキーワードに一致するTEXTID一覧(図13のステップS1303で取得したもの)に、着目中のテキストデータ(TEXTID)が含まれるか否かを判定する。例えば、着目中のテキストデータが図15のTEXT02であれば、キーワード「犬」に対するTEXTID一覧に含まれる。TEXT03であれば、キーワード「ペット」に対するTEXTID一覧に含まれる。含まれる場合(YESの場合であってテキストデータの走査が不要な場合)には、ステップS1408に進む。含まれない場合(NOの場合であってテキストデータの走査が必要な場合)には、ステップS1406に進む。   In step S1405, it is determined whether or not the text data (TEXTID) being noticed is included in the TEXTID list matching the keyword being noticed (obtained in step S1303 in FIG. 13). For example, if the text data under consideration is TEXT02 in FIG. 15, it is included in the TEXTID list for the keyword “dog”. TEXT03 is included in the TEXTID list for the keyword “pet”. If it is included (if YES, scanning of text data is not required), the process proceeds to step S1408. If it is not included (if NO, scanning of text data is necessary), the process proceeds to step S1406.

ステップS1406においては、着目中のキーワードで着目中のテキストデータを走査し、テキストデータ中にキーワードが含まれるかどうかをチェックする。   In step S1406, the focused text data is scanned with the focused keyword, and it is checked whether or not the keyword is included in the text data.

ステップS1407においては、ステップS1406の走査の結果、着目中のテキストデータ内に、着目中のキーワードが含まれるか否かを判定する。含まれる場合(YESの場合)にはステップS1408に進む。含まれない場合(NOの場合)には、ステップS   In step S1407, as a result of the scanning in step S1406, it is determined whether the focused keyword is included in the focused text data. If included (in the case of YES), the process proceeds to step S1408. If not included (NO), step S

1410に進む(検索結果として通知されず、処理は次のテキストデータに進む)。 The process proceeds to 1410 (not notified as a search result, and the process proceeds to the next text data).

ステップS1409においては、着目中のテキストデータを検索結果として通知する。   In step S1409, the text data under attention is notified as a search result.

以上の図14のフローチャートの処理では、検索条件であるキーワードが着目中のテキストデータの関連語である場合には、走査を行わないことで、全文検索の速度を向上させる効果が得られる。   In the processing of the flowchart of FIG. 14 described above, when the keyword that is the search condition is a related word of the text data being focused on, the effect of improving the speed of the full-text search can be obtained by not performing scanning.

以上で、図14のフローチャートにおける全文検索の処理の説明を完了する。   This completes the description of the full text search process in the flowchart of FIG.

図13、図14のフローチャートは、図11のそれぞれステップS1112、ステップS1114、あるいは図12のそれぞれステップS1212、ステップS1213から呼び出して実行させることで、関連語検索と全文検索を連携させることが可能となる。   The flowcharts of FIGS. 13 and 14 can be linked to the related word search and the full-text search by calling and executing from steps S1112 and S1114 of FIG. 11 or steps S1212 and S1213 of FIG. 12, respectively. Become.

なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。   It should be noted that the configuration and contents of the various data described above are not limited to this, and it goes without saying that the various data and configurations are configured according to the application and purpose.

以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。   Although one embodiment has been described above, the present invention can take an embodiment as, for example, a system, apparatus, method, program, or recording medium, and specifically includes a plurality of devices. The present invention may be applied to a system including a single device.

また、本発明におけるプログラムは、図9〜図14に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は図9〜図14の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは図9〜図14の各装置の処理方法ごとのプログラムであってもよい。   Further, the program according to the present invention is a program that allows a computer to execute the processing methods of the flowcharts shown in FIGS. 9 to 14, and the storage medium according to the present invention is a program that allows the computer to execute the processing methods of FIGS. Is remembered. The program in the present invention may be a program for each processing method of each device in FIGS.

以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。   As described above, a recording medium that records a program that implements the functions of the above-described embodiments is supplied to a system or apparatus, and a computer (or CPU or MPU) of the system or apparatus stores the program stored in the recording medium. It goes without saying that the object of the present invention can also be achieved by executing the reading.

この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。   In this case, the program itself read from the recording medium realizes the novel function of the present invention, and the recording medium storing the program constitutes the present invention.

プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク、ソリッドステートドライブ等を用いることができる。   As a recording medium for supplying the program, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, DVD-ROM, magnetic tape, nonvolatile memory card, ROM, EEPROM, silicon A disk, solid state drive, or the like can be used.

また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Further, by executing the program read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) operating on the computer based on an instruction of the program is actually It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the processing and the processing is included.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Furthermore, after the program read from the recording medium is written to the memory provided in the function expansion board inserted into the computer or the function expansion unit connected to the computer, the function expansion board is based on the instructions of the program code. It goes without saying that the case where the CPU or the like provided in the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.

また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。   Further, the present invention may be applied to a system composed of a plurality of devices or an apparatus composed of a single device. Needless to say, the present invention can be applied to a case where the present invention is achieved by supplying a program to a system or apparatus. In this case, by reading a recording medium storing a program for achieving the present invention into the system or apparatus, the system or apparatus can enjoy the effects of the present invention. Furthermore, by downloading and reading a program for achieving the present invention from a server, database, etc. on a network using a communication program, the system or apparatus can enjoy the effects of the present invention.

なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。   In addition, all the structures which combined each embodiment mentioned above and its modification are also included in this invention.

101 テキスト検索サーバ
102 クライアント装置
103 テキストデータ管理サーバ
104 ネットワーク
301 検索結果受信部
302 表示制御部
303 操作受付部
304 キーワード送信部
305 選択情報送信部
311 関連語情報記憶部
312 関連語情報登録部
313 キーワード受信部
314 関連語情報検索部
315 全文検索部
316 検索結果送信部
317 選択情報受信部
101 Text Search Server 102 Client Device 103 Text Data Management Server 104 Network 301 Search Result Receiving Unit 302 Display Control Unit 303 Operation Accepting Unit 304 Keyword Transmitting Unit 305 Selection Information Transmitting Unit 311 Related Word Information Storage Unit 312 Related Word Information Registration Unit 313 Keyword Receiving unit 314 Related word information searching unit 315 Full-text searching unit 316 Search result transmitting unit 317 Selection information receiving unit

Claims (11)

キーワードを検索条件としてユーザに指定させ、検索結果を表示制御するクライアント装置と、テキストデータの検索を実行するテキスト検索サーバと、がネットワークを介して接続可能なテキスト検索システムであって、
前記クライアント装置は、
前記テキストデータの検索条件となる複数のキーワードを前記テキスト検索サーバに送信するキーワード送信手段と、
前記テキスト検索サーバから、前記テキストデータに対する検索結果が順次送信されるごとに、送信された当該検索結果を順次受信する検索結果受信手段と、
前記検索結果受信手段により、前記検索結果が順次受信されるごとに、当該検索結果を順次表示する表示制御手段と、
を備え、
前記テキスト検索サーバは、
前記テキストデータと、当該テキストデータに関連付けられた1または複数の関連語と、を対応付けて関連語情報として関連語情報記憶手段に記憶させる関連語情報登録手段と、
前記キーワード送信手段により送信された複数のキーワードを受信するキーワード受信手段と、
前記キーワード受信手段により受信した複数のキーワードを使用して前記関連語情報記憶手段の関連語情報を検索し、テキストデータを検索結果として取得する関連語情報検索手段と、
前記関連語情報検索手段による検索処理を実行した結果、当該関連語情報検索手段による検索結果とはならなかったテキストデータに対して、前記キーワードに基づき当該テキストデータを走査して検索結果を取得する全文検索手段と、
前記関連語情報検索手段による検索結果と、前記全文検索手段による検索結果を、それぞれの検索結果が取得されるごとに、順次、前記クライアント装置に送信する検索結果送信手段と、
を備えることを特徴とするテキスト検索システム。
A text search system in which a user can specify a keyword as a search condition and display control of a search result can be connected to a text search server that executes text data search via a network.
The client device is
A keyword transmitting means for transmitting a plurality of keywords as search conditions for the text data to the text search server;
Search result receiving means for sequentially receiving the search results transmitted each time search results for the text data are sequentially transmitted from the text search server;
Display control means for sequentially displaying the search results each time the search results are received by the search result receiving means;
With
The text search server
Related word information registration means for associating the text data with one or more related words associated with the text data and storing them in related word information storage means as related word information;
Keyword receiving means for receiving a plurality of keywords transmitted by the keyword transmitting means;
Related word information search means for searching related word information in the related word information storage means using a plurality of keywords received by the keyword receiving means, and acquiring text data as a search result;
As a result of executing the search processing by the related word information search means, the text data that has not become the search result by the related word information search means is scanned based on the keyword to obtain the search results. Full-text search means;
Search result transmission means for sequentially transmitting the search result by the related word information search means and the search result by the full-text search means to the client device each time the search results are acquired;
A text search system comprising:
前記検索結果送信手段は、更に、前記関連語情報検索手段による検索結果と、前記全文検索手段による検索結果とを、それぞれの検索結果が取得されるごとに、いずれの検索手段により取得されたかを判別可能に、順次、前記クライアント装置に送信するものであって、
前記表示制御手段は、更に前記検索結果受信手段により受信した検索結果を、前記テキストデータに対応する当該検索結果ごとに、前記関連語情報検索手段に基づく検索結果か、前記全文検索手段に基づく検索結果か、を判別可能に表示するものであることを特徴とする請求項1に記載のテキスト検索システム。
The search result transmission means further determines which search means the search result obtained by the related word information search means and the search result obtained by the full-text search means are acquired by each search result. Sequentially transmitted to the client device in a distinguishable manner,
The display control means further determines whether the search result received by the search result receiving means is a search result based on the related word information search means or a search based on the full-text search means for each search result corresponding to the text data. 2. The text search system according to claim 1, wherein the result is displayed in a distinguishable manner.
前記クライアント装置は、
前記表示制御手段により表示された前記検索結果においてユーザにより選択された前記テキストデータに対する選択を、選択情報として前記テキスト検索サーバに送信する選択情報送信手段と、
を、更に備え、
前記テキスト検索サーバは、
前記クライアント装置から送信された前記選択情報を受信する選択情報受信手段と、を、更に備え、
前記関連語情報登録手段は、更に、前記選択情報に対応する前記テキストデータと、前記キーワード受信手段により受信した前記キーワードと、を対応付けて関連語情報として関連語情報記憶手段に記憶させることを特徴とする請求項1または請求項2に記載のテキスト検索システム。
The client device is
Selection information transmitting means for transmitting a selection for the text data selected by the user in the search result displayed by the display control means to the text search server as selection information;
Further comprising
The text search server
Selection information receiving means for receiving the selection information transmitted from the client device, further comprising:
The related word information registering means further associates the text data corresponding to the selection information with the keyword received by the keyword receiving means, and causes the related word information storage means to store the related word information as related word information. The text search system according to claim 1, wherein the text search system is a text search system.
前記表示制御手段は、前記テキストデータに対応する前記検索結果ごとに、前記関連語情報検索手段に基づく当該検索結果か、前記全文検索手段に基づく当該検索結果か、に応じて、異なる表示枠に表示することを特徴とする請求項1乃至請求項3のいずれか1項に記載のテキスト検索システム。   The display control unit displays a different display frame for each search result corresponding to the text data depending on whether the search result is based on the related word information search unit or the search result based on the full-text search unit. The text search system according to any one of claims 1 to 3, wherein the text search system is displayed. 前記表示制御手段は、前記テキストデータに対応する前記検索結果ごとに、前記関連語情報検索手段に基づく当該検索結果か、前記全文検索手段に基づく当該検索結果かに応じて、優先順位を変えて同一の表示枠に表示することを特徴とする請求項1乃至請求項3のいずれか1項に記載のテキスト検索システム。   The display control means changes the priority for each search result corresponding to the text data depending on whether the search result based on the related word information search means or the search result based on the full-text search means. The text search system according to any one of claims 1 to 3, wherein the text search system is displayed in the same display frame. 前記関連語情報は、前記テキストデータと、前記キーワードとに加え、当該キーワードを前記検索条件された前記検索結果に当該テキストデータが含まれ且つユーザの選択に基づき前記選択情報受信手段により前記選択情報として受信した選択回数と、を対応付けて前記関連語情報記憶手段に記憶されるものであって、
前記関連語情報検索手段は、前記検索結果に含まれる各テキストデータに対して、前記選択回数に基づき優先順位を決定するものであって、
前記表示制御手段は、前記関連語情報検索手段による前記検索結果の優先順位に基づいて、当該検索結果ごとの表示順の変更をすることを特徴とする請求項3乃至請求項5のいずれか1項に記載のテキスト検索システム。
In addition to the text data and the keyword, the related word information includes the text data in the search result in which the keyword is the search condition, and the selection information receiving means based on the selection of the user. Is stored in the related word information storage means in association with the number of selections received as
The related word information search means determines priority for each text data included in the search result based on the number of times of selection,
6. The display control unit according to claim 3, wherein the display control unit changes a display order for each search result based on a priority order of the search results by the related word information search unit. The text search system described in the section.
前記全文検索手段は、
前記関連語情報検索手段による検索処理を終了した前記テキストデータに対して、当該テキストデータが前記検索結果に含まれない場合に実行されるものであって、前記キーワードのうち、当該関連語情報検索手段を実行した結果、対応する前記関連語情報が存在しない当該キーワードにより当該テキストデータを走査することを特徴とする請求項1乃至請求項6のいずれか1項に記載のテキスト検索システム。
The full-text search means
It is executed when the text data for which the search processing by the related word information search means has been completed is not included in the search result, and among the keywords, the related word information search The text search system according to any one of claims 1 to 6, wherein the text data is scanned by the keyword for which the related word information does not exist as a result of executing the means.
キーワードを検索条件としてユーザに指定させ検索結果を表示制御するクライアント装置と、ネットワークを介して接続可能なテキスト検索サーバであって、
テキストデータと、当該テキストデータに関連付けられた1または複数の関連語と、を対応付けて関連語情報として関連語情報記憶手段に記憶させる関連語情報登録手段と、
前記クライアント装置から送信された複数のキーワードを受信するキーワード受信手段と、
前記キーワード受信手段により受信した複数のキーワードを使用して前記関連語情報記憶手段の関連語情報を検索し、テキストデータを検索結果として取得する関連語情報検索手段と、
前記関連語情報検索手段による検索処理を実行した結果、当該関連語情報検索手段による検索結果とはならなかったテキストデータに対して、前記キーワードに基づき当該テキストデータを走査して検索結果を取得する全文検索手段と、
前記関連語情報検索手段による検索結果と、前記全文検索手段による検索結果を、それぞれの検索結果が取得されるごとに、順次、前記クライアント装置に送信する検索結果送信手段と、
を備えることを特徴とするテキスト検索サーバ。
A text search server connectable via a network with a client device that controls the display of search results by specifying a keyword as a search condition;
Related word information registering means for associating the text data with one or more related words associated with the text data and storing them in the related word information storage means as related word information;
Keyword receiving means for receiving a plurality of keywords transmitted from the client device;
Related word information search means for searching related word information in the related word information storage means using a plurality of keywords received by the keyword receiving means, and acquiring text data as a search result;
As a result of executing the search processing by the related word information search means, the text data that has not become the search result by the related word information search means is scanned based on the keyword to obtain the search results. Full-text search means;
Search result transmission means for sequentially transmitting the search result by the related word information search means and the search result by the full-text search means to the client device each time the search results are acquired;
A text search server comprising:
キーワードを検索条件としてユーザに指定させ、検索結果を表示制御するクライアント装置と、テキストデータの検索を実行するテキスト検索サーバと、がネットワークを介して接続可能なテキスト検索システムの制御方法であって、
前記クライアント装置は、
キーワード送信手段が、前記テキストデータの検索条件となる複数のキーワードを前記テキスト検索サーバに送信するキーワード送信ステップと、
検索結果受信手段が、前記テキスト検索サーバから、前記テキストデータに対する検索結果が順次送信されるごとに、送信された当該検索結果を順次受信する検索結果受信ステップと、
表示制御手段が、前記検索結果受信ステップにより、前記検索結果が順次受信されるごとに、当該検索結果を順次表示する表示制御ステップと、
を含み、
前記テキスト検索サーバは、
関連語情報登録手段が、前記テキストデータと、当該テキストデータに関連付けられた1または複数の関連語と、を対応付けて関連語情報として関連語情報記憶手段に記憶させる関連語情報登録ステップと、
キーワード受信手段が、前記キーワード送信ステップにより送信された複数のキーワードを受信するキーワード受信ステップと、
関連語情報検索手段が、前記キーワード受信ステップにより受信した複数のキーワードを使用して前記関連語情報記憶手段の関連語情報を検索し、テキストデータを検索結果として取得する関連語情報検索ステップと、
全文検索手段が、前記関連語情報検索ステップによる検索処理を実行した結果、当該関連語情報検索ステップによる検索結果とはならなかったテキストデータに対して、前記キーワードに基づき当該テキストデータを走査して検索結果を取得する全文検索ステップと、
検索結果送信手段が、前記関連語情報検索ステップによる検索結果と、前記全文検索ステップによる検索結果を、それぞれの検索結果が取得されるごとに、順次、前記クライアント装置に送信する検索結果送信ステップと、
を含むことを特徴とするテキスト検索システムの制御方法。
A control method for a text search system in which a client device that specifies a keyword as a search condition and controls display of search results and a text search server that executes text data search can be connected via a network,
The client device is
A keyword transmitting step for transmitting a plurality of keywords as search conditions for the text data to the text search server;
A search result receiving step for receiving the search results sequentially, each time a search result for the text data is sequentially transmitted from the text search server,
A display control step in which the display control means sequentially displays the search results each time the search results are sequentially received by the search result receiving step;
Including
The text search server
A related word information registration means for associating and storing the text data and one or more related words associated with the text data in the related word information storage means as related word information;
A keyword receiving means for receiving a plurality of keywords transmitted by the keyword transmitting step;
A related word information search means for searching related word information in the related word information storage means using a plurality of keywords received in the keyword receiving step, and acquiring text data as a search result; and
The full-text search means scans the text data based on the keyword with respect to the text data that has not become the search result by the related word information search step as a result of executing the search processing by the related word information search step. A full-text search step to retrieve search results;
A search result transmitting means for transmitting a search result by the related word information search step and a search result by the full-text search step to the client device sequentially each time the search result is acquired; ,
A method for controlling a text search system, comprising:
キーワードを検索条件としてユーザに指定させ検索結果を表示制御するクライアント装置と、ネットワークを介して接続可能なテキスト検索サーバの制御方法であって、
関連語情報登録手段が、テキストデータと、当該テキストデータに関連付けられた1または複数の関連語と、を対応付けて関連語情報として関連語情報記憶手段に記憶させる関連語情報登録ステップと、
キーワード受信手段が、前記クライアント装置から送信された複数のキーワードを受信するキーワード受信ステップと、
関連語情報検索手段が、前記キーワード受信ステップにより受信した複数のキーワードを使用して前記関連語情報記憶手段の関連語情報を検索し、テキストデータを検索結果として取得する関連語情報検索ステップと、
全文検索手段が、前記関連語情報検索ステップによる検索処理を実行した結果、当該関連語情報検索ステップによる検索結果とはならなかったテキストデータに対して、前記キーワードに基づき当該テキストデータを走査して検索結果を取得する全文検索ステップと、
検索結果送信手段が、前記関連語情報検索ステップによる検索結果と、前記全文検索ステップによる検索結果を、それぞれの検索結果が取得されるごとに、順次、前記クライアント装置に送信する検索結果送信ステップと、
を含むことを特徴とするテキスト検索サーバの制御方法。
A client device that specifies a keyword as a search condition and controls display of search results, and a text search server control method that can be connected via a network,
A related word information registration means for associating the text data with one or more related words associated with the text data and storing them in the related word information storage means as related word information;
A keyword receiving means for receiving a plurality of keywords transmitted from the client device;
A related word information search means for searching related word information in the related word information storage means using a plurality of keywords received in the keyword receiving step, and acquiring text data as a search result; and
The full-text search means scans the text data based on the keyword with respect to the text data that has not become the search result by the related word information search step as a result of executing the search processing by the related word information search step. A full-text search step to retrieve search results;
A search result transmitting means for transmitting a search result by the related word information search step and a search result by the full-text search step to the client device sequentially each time the search result is acquired; ,
A method for controlling a text search server, comprising:
キーワードを検索条件としてユーザに指定させ検索結果を表示制御するクライアント装置と、ネットワークを介して接続可能なテキスト検索サーバにおいて実行可能なプログラムであって、
前記テキスト検索サーバを、
テキストデータと、当該テキストデータに関連付けられた1または複数の関連語と、を対応付けて関連語情報として関連語情報記憶手段に記憶させる関連語情報登録手段と、
前記クライアント装置から送信された複数のキーワードを受信するキーワード受信手段、
前記キーワード受信手段により受信した複数のキーワードを使用して前記関連語情報記憶手段の関連語情報を検索し、テキストデータを検索結果として取得する関連語情報検索手段、
前記関連語情報検索手段による検索処理を実行した結果、当該関連語情報検索手段による検索結果とはならなかったテキストデータに対して、前記キーワードに基づき当該テキストデータを走査して検索結果を取得する全文検索手段、
前記関連語情報検索手段による検索結果と、前記全文検索手段による検索結果を、それぞれの検索結果が取得されるごとに、順次、前記クライアント装置に送信する検索結果送信手段、
として機能させることを特徴とするプログラム。
A program that can be executed on a client device that specifies a keyword as a search condition and controls display of search results, and a text search server that can be connected via a network,
The text search server,
Related word information registering means for associating the text data with one or more related words associated with the text data and storing them in the related word information storage means as related word information;
Keyword receiving means for receiving a plurality of keywords transmitted from the client device;
Related word information search means for searching related word information in the related word information storage means using a plurality of keywords received by the keyword receiving means, and acquiring text data as a search result;
As a result of executing the search processing by the related word information search means, the text data that has not become the search result by the related word information search means is scanned based on the keyword to obtain the search results. Full-text search means,
Search result transmission means for sequentially transmitting the search result by the related word information search means and the search result by the full-text search means to the client device each time the search results are acquired;
A program characterized by functioning as
JP2012253734A 2011-12-14 2012-11-19 Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof Expired - Fee Related JP5556876B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012253734A JP5556876B2 (en) 2011-12-14 2012-11-19 Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011273679 2011-12-14
JP2011273679 2011-12-14
JP2012253734A JP5556876B2 (en) 2011-12-14 2012-11-19 Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof

Publications (2)

Publication Number Publication Date
JP2013145551A JP2013145551A (en) 2013-07-25
JP5556876B2 true JP5556876B2 (en) 2014-07-23

Family

ID=49041287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012253734A Expired - Fee Related JP5556876B2 (en) 2011-12-14 2012-11-19 Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof

Country Status (1)

Country Link
JP (1) JP5556876B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528023A (en) * 1991-06-28 1993-02-05 Toshiba Corp Data base system
JP2002092034A (en) * 2000-09-18 2002-03-29 Nec Corp Character string retrieved result display system and its program recording medium
JP2004054367A (en) * 2002-07-17 2004-02-19 Hitachi Ltd Retrieval system and display method for retrieval result
JP4515774B2 (en) * 2004-01-05 2010-08-04 大日本印刷株式会社 Document element search server and program for functioning as document element search server
JP2005309727A (en) * 2004-04-21 2005-11-04 Hitachi Ltd File system

Also Published As

Publication number Publication date
JP2013145551A (en) 2013-07-25

Similar Documents

Publication Publication Date Title
US11263273B2 (en) Systems and methods for graphical exploration of forensic data
US11226976B2 (en) Systems and methods for graphical exploration of forensic data
US6327586B1 (en) System method and computer program product to automate the management and analysis of heterogeneous data
JP2005332212A (en) Retrieval server, retrieval terminal, retrieval method, and retrieval execution method
US7840601B2 (en) Editable table modification
US20070255742A1 (en) Category Topics
US20060112142A1 (en) Document retrieval method and apparatus using image contents
JP2009237912A (en) Search keyword improvement apparatus, server and method
JP2003216650A (en) Graphical user interface for information intermediation system
US20230281377A1 (en) Systems and methods for displaying digital forensic evidence
US20090157661A1 (en) Digital content searching tool
JP5539127B2 (en) Document management system, search specification method, program
JP4084647B2 (en) Information search system, information search method, and information search program
JP2007272465A (en) Schedule management device, document presentation method for schedule management device, and schedule management program
KR101153534B1 (en) Method and system for automatically tagging web data and local data
JP4348357B2 (en) Related document display device
JP5556876B2 (en) Text search system, control method of text search system, and program thereof, text search server, control method of text search server, and program thereof
JPH10228488A (en) Information retrieval collecting method and its system
JP2002132825A (en) System, method, and program for image retrieval, computer-readable storage medium with recorded image retrieving program, and image retrieving device
JP4445699B2 (en) Two-stage search system, search request server, document information server, and program
JP2005196254A (en) Directory structure forming device, its method and directory service system
JP2002117056A (en) Method and system for data search and display, and data search engine equipped with data search and display method
JPH10283367A (en) Hypermedia device
JP2001265785A (en) Device and method for managing document and storage medium
JP2003099466A (en) Method for displaying and editing context data and program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130531

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140320

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140520

R150 Certificate of patent or registration of utility model

Ref document number: 5556876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees