JP2001022787A - Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded - Google Patents

Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded

Info

Publication number
JP2001022787A
JP2001022787A JP11198691A JP19869199A JP2001022787A JP 2001022787 A JP2001022787 A JP 2001022787A JP 11198691 A JP11198691 A JP 11198691A JP 19869199 A JP19869199 A JP 19869199A JP 2001022787 A JP2001022787 A JP 2001022787A
Authority
JP
Japan
Prior art keywords
information
document
language
user
information search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11198691A
Other languages
Japanese (ja)
Inventor
Yoshihiko Hayashi
林  良彦
Genichiro Kikui
玄一郎 菊井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11198691A priority Critical patent/JP2001022787A/en
Publication of JP2001022787A publication Critical patent/JP2001022787A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To accurately retrieve a document of a language different from a user's retrieval request. SOLUTION: This information retrieval system generates an information retrieval expression by an information retrieval expression generation part 200 at an initial information request made by the user and presents the retrieval result based upon this retrieval expression to the user through a user interface part 100, and an information retrieval result display and selection part 400 makes the user to specify a matching document complying with the user's information request and a requested language. A multilinguistic retrieval expression generation part 500 extracts featured words from the matching document to generate a word list, which is translated into the specified language by using a word list translation part 700; and a multilinguistic information retrieval expression is generated on the basis of the translated word list and on the basis of the retrieval expression, information retrieval is carried out. Consequently, while a language which the user is familiar with is mainly used, a matching document of a different language can be retrieved from an document archive 310 as an object of retrieval.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数言語からなる
文書群を検索する多言語情報検索システムに係り、特
に、(1)初期の情報要求による検索結果から情報要求
に適合する文書を選択し、(2)実際に検索したい文書
の言語を指定することにより、指定言語で記述された適
合文書を検索することを可能とする多言語インタラクテ
ィブ情報検索システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multilingual information retrieval system for retrieving a document group composed of a plurality of languages, and more particularly to (1) selecting a document conforming to an information request from a retrieval result of an initial information request. (2) The present invention relates to a multilingual interactive information search system capable of searching for a suitable document described in a specified language by specifying a language of a document to be actually searched.

【0002】[0002]

【従来の技術】ここでは、言語Xを用いて記述されたユ
ーザの情報要求に対して、当該言語Xとは異なる言語Y
で記述された文書を文書群中から検索するシステムを
「多言語情報検索システム」と呼ぶ。
2. Description of the Related Art Here, in response to a user's information request described using a language X, a language Y different from the language X is used.
Is referred to as a "multilingual information search system".

【0003】従来、多言語情報検索システムを実現する
方法には大きく2つの方法が存在する。第1の方法は、
検索対象である文書アーカイブ中に含まれる言語X以外
の言語で記述された文書を全て言語Xへと翻訳する方法
である。また、第2の方法は、言語Xを用いて記述され
たユーザの情報要求に対して、当該情報要求をユーザの
指定した目的言語である言語Yに翻訳してから、言語Y
によって情報検索を行う方法である。
Conventionally, there are roughly two methods for implementing a multilingual information retrieval system. The first method is
This is a method of translating all documents described in languages other than language X included in the document archive to be searched into language X. Further, in the second method, in response to a user's information request described using language X, the information request is translated into language Y, which is the target language specified by the user, and then translated into language Y
This is a method for performing information retrieval by using the following.

【0004】[0004]

【発明が解決しようとする課題】前記第1の方法には、
(1)言語X以外の言語で記述された文書をあらかじめ
翻訳しておく必要がある、(2)翻訳を実行する方法と
しては人手による方法と機械翻訳による方法があるが、
前者はコストが高く、後者は翻訳の精度が不十分である
という問題点があった。また、前記第2の方法において
は、第1の方法における問題は解決できるが、通常は1
〜3語という自動翻訳のためには非常に短い表現で入力
されるユーザの情報要求を適切に言語Yへと翻訳しなけ
ればならないという問題点があった。
The first method includes:
(1) It is necessary to translate a document described in a language other than the language X in advance. (2) As a method of executing the translation, there are a manual method and a machine translation method.
The former has a problem that the cost is high, and the latter has a problem that translation accuracy is insufficient. In the second method, the problem in the first method can be solved.
For automatic translation of up to three words, there is a problem that a user's information request input in a very short expression must be appropriately translated into the language Y.

【0005】一方、初期の情報検索の結果をユーザに提
示し、ユーザに適合文書を選択させることにより検索要
求を再構成し、これにより徐々にユーザに適合した文書
を得ようとするインタラクティブな情報検索を実現する
「関連性フィードバック」などと呼ばれる技術も存在す
るが、「多言語情報検索システム」には適用されていな
かった。
On the other hand, interactive information that presents the result of the initial information search to the user and causes the user to select a suitable document to reconstruct a search request, thereby gradually obtaining a document suitable for the user. There is also a technique called “relevance feedback” that realizes search, but it has not been applied to a “multilingual information search system”.

【0006】本発明は、上記事情に鑑みてなされたもの
であり、その目的とするところは、ユーザの検索要求と
は異なる言語の文書を的確に検索することができる多言
語インタラクティブ情報検索システム及び多言語インタ
ラクティブ情報検索プログラムを記録した記録媒体を提
供することにある。
SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to provide a multilingual interactive information retrieval system and a multilingual interactive information retrieval system capable of accurately retrieving a document in a language different from a user's retrieval request. An object of the present invention is to provide a recording medium on which a multilingual interactive information search program is recorded.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するため
に、請求項1では、複数言語からなる文書群からユーザ
の初期の情報要求の言語とは異なる言語で記述された文
書を検索する多言語インタラクティブ情報検索システム
において、ユーザインタフェース部を介して入力される
ユーザの初期の情報要求に基づいて情報検索式を生成す
る情報検索式生成部と、入力される情報検索式に基づき
文書を検索する情報検索実行部と、情報検索実行部によ
る情報検索結果をユーザインタフェース部を介してユー
ザに提示し、その中からユーザの情報要求に適合する文
書(以下、「適合文書」という)及び要求する文書の言
語(以下、「指定言語」という)をユーザに指定させる
情報検索結果表示選択部と、ある言語における単語リス
トを他の言語における単語リストへ翻訳する単語リスト
翻訳部と、適合文書における特徴的な単語を抽出して単
語リストを生成し、該単語リストを前記単語リスト翻訳
部により指定言語に翻訳し、翻訳した単語リストに基づ
き指定言語における情報検索式を生成する多言語情報検
索式生成部を有し、該多言語情報検索式生成部の生成す
る情報検索式によって前記情報検索実行部を実行するこ
とを特徴とするものを提案する。
To achieve the above object, according to the present invention, a multi-language document group is searched for a document described in a language different from the language of the user's initial information request. In a language interactive information retrieval system, an information retrieval expression generation unit that generates an information retrieval expression based on a user's initial information request input via a user interface unit, and retrieves a document based on the input information retrieval expression An information search execution unit and a document that presents the information search result by the information search execution unit to the user via the user interface unit, and a document that conforms to the user's information request (hereinafter, referred to as a “conforming document”) and a requested document Information search result display selection section that allows the user to specify one language (hereinafter referred to as “designated language”), and a word list in one language in another language. A word list translating unit for translating to a word list to be extracted, and generating a word list by extracting characteristic words in a conforming document; translating the word list into a specified language by the word list translating unit; A multilingual information search formula generation unit for generating an information search formula in a specified language based on the information search formula generated by the multilingual information search formula generation unit, and executing the information search execution unit. Suggest.

【0008】また、請求項2では、請求項1記載の多言
語インタラクティブ情報検索システムにおいて、文書群
中から適合文書における単語頻度分布情報を取得する文
書情報取得部を有するとともに、前記多言語情報検索式
生成部は、該文書情報取得部から得られる単語頻度分布
情報に基づき適合文書における特徴的な単語リストを生
成することを特徴とするものを提案する。
According to a second aspect of the present invention, there is provided the multilingual interactive information retrieval system according to the first aspect, further comprising a document information acquisition section for acquiring word frequency distribution information of a matching document from a document group, and the multilingual information retrieval system. The formula generation unit proposes a feature that generates a characteristic word list in a matching document based on the word frequency distribution information obtained from the document information acquisition unit.

【0009】さらに、請求項3〜4では、プログラムの
実行により請求項1〜2の多言語インタラクティブ情報
検索システムを実現する多言語インタラクティブ情報検
索プログラムを記録した記録媒体を提案する。
Further, the present invention proposes a recording medium on which a multilingual interactive information search program for realizing the multilingual interactive information search system according to claims 1 to 2 by executing the program is recorded.

【0010】本発明によれば、ユーザの得意な言語X
(母国語など)での情報要求により初期の検索を実行す
ると、この言語Xを用いて文書群から情報検索が行わ
れ、ユーザインタフェース部を介して検索結果が提示さ
れる。ユーザが言語Xで記述された検索結果の文書群の
中から適合する文書(適合文書)を選択するとともに、
実際に検索したい文書の言語Yを指定すると、適合文書
において特徴的な単語リストが生成され、この単語リス
トが言語Yに翻訳され、翻訳された単語リストに基づき
文書群から情報検索が行われる。このように、ユーザの
得意な言語Xを主に使用しながら、異なる言語Yにおけ
る適合文書を検索することが可能となる。
According to the present invention, the language X that the user is good at
When an initial search is executed in response to an information request in a native language (such as a native language), an information search is performed from a group of documents using this language X, and a search result is presented via a user interface unit. The user selects a matching document (matching document) from the group of documents of the search result described in the language X, and
When the language Y of the document to be actually searched is specified, a characteristic word list is generated in the matching document, the word list is translated into the language Y, and information retrieval is performed from the document group based on the translated word list. As described above, it is possible to search for a suitable document in a different language Y while mainly using the language X that the user is good at.

【0011】[0011]

【発明の実施の形態】本発明の一実施の形態に係る多言
語インタラクティブ情報検索システムについて図1を参
照して説明する。図1は、本実施の形態に係る多言語イ
ンタラクティブ情報検索システムの構成図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A multilingual interactive information retrieval system according to one embodiment of the present invention will be described with reference to FIG. FIG. 1 is a configuration diagram of a multilingual interactive information search system according to the present embodiment.

【0012】図1に示すように、この多言語インタラク
ティブ情報検索システムは、ユーザインタフェース部1
00と、情報検索式生成部200と、情報検索実行部3
00と、文書アーカイブ310と、情報検索結果表示選
択部400と、多言語情報検索式生成部500と、文書
情報取得部600と、単語リスト翻訳部700とを有し
ている。
As shown in FIG. 1, the multilingual interactive information retrieval system includes a user interface 1
00, the information search formula generation unit 200, and the information search execution unit 3
00, a document archive 310, an information search result display selection unit 400, a multilingual information search expression generation unit 500, a document information acquisition unit 600, and a word list translation unit 700.

【0013】ユーザインタフェース部100は、本発明
の多言語インタラクティブ情報検索システムとのインタ
ラクションを司る。すなわち、ユーザの初期の情報要求
を入力したり、情報検索実行の結果を表示したり、ユー
ザによる適合文書の指定や、実際に検索したい文書の言
語の選択などを行う。
The user interface unit 100 controls the interaction with the multilingual interactive information retrieval system of the present invention. That is, the user inputs an initial information request, displays a result of information search execution, specifies a suitable document by the user, and selects a language of a document to be actually searched.

【0014】情報検索式生成部200は、ユーザインタ
フェース部100を介して入力されるユーザの初期の情
報要求を解釈し、実際に情報検索実行部300が文書ア
ーカイブ310に対する情報検索処理を実行できるよう
な情報検索式を生成し、生成した情報検索式を情報検索
実行部300へと送る。
The information search formula generation unit 200 interprets the user's initial information request input via the user interface unit 100, and enables the information search execution unit 300 to actually execute the information search process for the document archive 310. A new information search formula is generated, and the generated information search formula is sent to the information search execution unit 300.

【0015】情報検索実行部300は、情報検索式生成
部200や、多言語情報検索式生成部500によって生
成された情報検索式を入力として、あらかじめ構築され
た複数の言語による文書を収録した情報検索の対象であ
る文書アーカイブ310を検索し、検索結果を情報検索
結果表示選択部400へと送る。なお、本発明において
は、情報検索実行部300及びその検索対象である文書
アーカイブ310は、既存のサーチエンジンなどを用い
ることができるので、本明細書中では、その詳細は規定
しない。
The information retrieval execution section 300 receives information retrieval expressions generated by the information retrieval expression generation section 200 and the multilingual information retrieval expression generation section 500 as input, and records information recorded in a plurality of languages constructed in advance. The document archive 310 to be searched is searched, and the search result is sent to the information search result display selection unit 400. In the present invention, since the information search execution unit 300 and the document archive 310 to be searched for can use an existing search engine or the like, the details are not specified in this specification.

【0016】情報検索結果表示選択部400は、情報検
索実行部300による情報検索結果の情報をユーザイン
タフェース部100へと送る。また、該情報検索結果中
からユーザが選択した適合文書のID、及び、実際に検
索したい文書の言語名をユーザインタフェース部100
から受け取る。受け取ったこれらの情報を多言語情報検
索式生成部500へと送る。
The information search result display selection unit 400 sends information of the information search result by the information search execution unit 300 to the user interface unit 100. Further, the user interface unit 100 stores the ID of the conforming document selected by the user from the information retrieval result and the language name of the document to be actually retrieved.
Receive from The received information is sent to the multilingual information search formula generation unit 500.

【0017】多言語情報検索式生成部500は、情報検
索結果表示選択部400から送られてくる適合文書のI
D番号、及び、実際に検索したい文書の言語名(指定言
語)を入力として、該指定言語における適合文書を検索
するための多言語情報検索式を生成する。この際、ID
番号によって指定された文書における単語頻度分布情報
を文書情報取得部600により取得する。通常、このよ
うな機能は情報検索実行部300として利用されるサー
チエンジンに具備されているか、又は、付加的な機能と
して容易に実現することができる。また、多言語情報検
索式の生成においては、原言語における単語リストを指
定言語(ターゲット言語)における単語リストへ翻訳す
る処理を行うが、この処理は、単語リスト翻訳部700
を呼び出すことにより行う。なお、単語リスト翻訳部7
00は、例えば出願人が特願平11−153441「訳
語選択辞書自動生成装置及び自動翻訳装置並びにそれら
のプログラムを記録した媒体」で提案したもの等により
実現可能であるので、本明細書中ではその詳細は規定し
ない。生成された多言語情報検索式は、情報検索実行部
300へ送られ、指定言語(ターゲット言語)での適合
文書の検索が行われる。
The multilingual information search expression generation unit 500 is configured to output the I of the conforming document transmitted from the information search result display selection unit 400.
With the D number and the language name (designated language) of the document to be actually searched as input, a multilingual information search formula for searching for a compatible document in the designated language is generated. At this time, ID
The word frequency distribution information in the document specified by the number is obtained by the document information obtaining unit 600. Usually, such a function is provided in a search engine used as the information search execution unit 300, or can be easily realized as an additional function. In generating a multilingual information search formula, a process of translating a word list in a source language into a word list in a designated language (target language) is performed.
By calling. Note that the word list translator 7
00 can be realized by, for example, the one proposed by the applicant in Japanese Patent Application No. 11-153441, “Translation word selection dictionary automatic generation device and automatic translation device, and a medium recording these programs” and the like. Details are not specified. The generated multilingual information search formula is sent to the information search execution unit 300, and a search for a matching document in the designated language (target language) is performed.

【0018】以下、本実施の形態に係る多言語インタラ
クティブ情報検索システムの一実施例について図2〜図
4を参照して具体例を挙げて説明する。図2は本実施の
形態に係る多言語インタラクティブ情報検索システムの
動作を説明するフローチャート、図3及び図4はユーザ
インタフェース部によって生成されるユーザ端末の画面
イメージの一例を説明する図である。
An example of the multilingual interactive information search system according to the present embodiment will be described below with reference to FIGS. FIG. 2 is a flowchart illustrating the operation of the multilingual interactive information search system according to the present embodiment, and FIGS. 3 and 4 are diagrams illustrating an example of a screen image of the user terminal generated by the user interface unit.

【0019】まず、ユーザインタフェース部100を介
して入力されるユーザの初期情報要求が”ATM”,”
ネットワーク”の2語からなるものとする。
First, the user's initial information request input via the user interface unit 100 is "ATM", "
Network ".

【0020】情報検索式生成部200は、入力されたユ
ーザの初期の情報要求をもとに、情報検索実行部300
として利用されるサーチエンジンにおける問い合わせ形
式に適合するような情報検索式を生成する(ステップS
1)。前述したように、本明細書においては、情報検索
実行部300の詳細については規定しないが、以下の説
明では、情報検索実行部300は、問い合わせ形式とし
て単語の順序なしリストを受け付けるものと仮定する。
したがって、前記入力例に対して情報検索式生成部20
0が生成する情報検索式は、(”ATM”,”ネットワ
ーク”)となる。なお、通常のサーチエンジンなどの情
報検索システムにおいては、問い合わせを構成する単語
をand,or,notなどの論理演算子により結合することが許
されることが多い。本発明は、このような情報検索式の
バリエーションを制限するものではないことに注意すべ
きである。
The information search formula generation unit 200 is based on the input initial information request of the user and executes the information search execution unit 300
Generates an information search formula that conforms to the query format of the search engine used as a search engine (step S
1). As described above, in this specification, the details of the information search execution unit 300 are not specified, but in the following description, it is assumed that the information search execution unit 300 accepts an unordered list of words as an inquiry format. .
Therefore, the information search formula generation unit 20
The information retrieval formula generated by 0 is ("ATM", "network"). Note that in an information search system such as a normal search engine, it is often allowed to combine words constituting an inquiry with logical operators such as and, or, and not. It should be noted that the present invention does not limit such variations of the information retrieval formula.

【0021】次に、情報検索実行部300は入力された
情報検索式に基づき文書アーカイブ310を検索する
(ステップS2)。
Next, the information search execution unit 300 searches the document archive 310 based on the input information search formula (step S2).

【0022】次に、情報検索実行部300による情報検
索結果は、情報検索結果表示選択部400を介してユー
ザインタフェース部100へと送られ、ユーザに検索結
果が提示されるとともに、ユーザによる検索結果の中か
ら適合文書及び指定言語(ターゲット言語)が入力され
る(ステップS3)。
Next, the information search result by the information search execution unit 300 is sent to the user interface unit 100 via the information search result display selection unit 400, and the search result is presented to the user, and the search result by the user is displayed. , A conforming document and a designated language (target language) are input (step S3).

【0023】図3は、実際にユーザインタフェース部1
00によって生成されるユーザ端末の画面イメージの一
例を示している。図3に例示されている事項の中で重要
なことの一つは、情報検索実行部300により前記情報
検索式を用いて検索された文書アーカイブ310中の文
書のタイトルなどの情報がユーザに提示されることであ
る。これらの情報は、ユーザが適合文書を選択する際に
必須であるが、本発明では、ユーザに提示される情報の
種別に制限を加えるものではないことに注意されたい。
第2に重要なことは、画面中に、実際にユーザが選択し
た適合文書を選択する手段(図3においては、チェック
ボックスとして実現されている)と、実際に検索したい
文書の言語を指定するための手段(図3においては、メ
ニューとして実現されている)を有していることであ
る。これら2点の事項が本質的に重要なことであり、本
発明では、ユーザ端末に表示される画面デザインの詳細
までも規定するものではない。
FIG. 3 shows the user interface unit 1
9 shows an example of a screen image of the user terminal generated by the user terminal 00. One of the important items illustrated in FIG. 3 is that information such as the title of a document in the document archive 310 searched by the information search execution unit 300 using the information search formula is presented to the user. Is to be done. It should be noted that these pieces of information are essential when the user selects a suitable document, but the present invention does not limit the type of information presented to the user.
The second important thing is to specify, on the screen, a means for selecting a conforming document actually selected by the user (in FIG. 3, realized as a check box) and a language of the document to be actually searched. (In FIG. 3, realized as a menu). These two items are essentially important, and the present invention does not specify the details of the screen design displayed on the user terminal.

【0024】図4は、ユーザが図3に例示される検索結
果に対して、適合文書と実際に検索したい文書の言語を
指定した状態を示している。図4に示されているよう
に、ユーザは、文書ID:101,文書ID:5,文書
ID:280の3つの文書を適合文書として選択し、指
定言語(ターゲット言語)として”英語”を選択したも
のとする。
FIG. 4 shows a state in which the user has specified a conforming document and the language of the document that the user actually wants to search for the search results illustrated in FIG. As shown in FIG. 4, the user selects three documents of document ID: 101, document ID: 5, and document ID: 280 as conforming documents, and selects "English" as a designated language (target language). Shall be done.

【0025】次に、ユーザによる選択情報が情報検索結
果表示選択部400を介して多言語情報検索生成部50
0に送られ、多言語情報検索生成部500により指定言
語による検索が行われる(ステップS4)。図4の例で
は、ユーザが”フィードバック検索実行”のボタンを押
下することにより、これらの情報が情報検索結果表示選
択部400を介して多言語情報検索生成部500へと送
られる。
Next, the information selected by the user is transmitted to the multilingual information search generator 50 via the information search result display selector 400.
0, and the multilingual information search generator 500 performs a search in the designated language (step S4). In the example of FIG. 4, when the user presses the “feedback search execution” button, these pieces of information are sent to the multilingual information search generation unit 500 via the information search result display selection unit 400.

【0026】以下、多言語情報検索式生成部500の前
記ステップS4における動作について説明する。
The operation of the multilingual information retrieval formula generation unit 500 in step S4 will be described below.

【0027】まず、前記情報を受けた多言語情報検索式
生成部500は、文書情報取得部600に対して要求を
発行し、指定された適合文書における単語頻度分布情報
を取得する(ステップS41)。
First, the multilingual information search formula generation unit 500 that has received the information issues a request to the document information acquisition unit 600, and acquires word frequency distribution information in the designated conforming document (step S41). .

【0028】次いで、文書情報取得部600から取得し
た単語頻度分布情報に基づき、それらの文書を特徴づけ
る単語群を抽出する(ステップS42)。
Next, based on the word frequency distribution information acquired from the document information acquiring section 600, a word group characterizing those documents is extracted (step S42).

【0029】次いで、各文書から抽出した単語群から、
単語リスト翻訳部700により翻訳すべき単語リストを
生成する(ステップS43)。
Next, from the word group extracted from each document,
The word list translation unit 700 generates a word list to be translated (step S43).

【0030】次いで、この単語リストを単語リスト翻訳
部700へ送り、指定言語(ターゲット言語)に翻訳さ
れた翻訳結果を受け取る(ステップS44)。
Next, the word list is sent to the word list translating unit 700, and a translation result translated into a specified language (target language) is received (step S44).

【0031】次いで、上記の翻訳結果の指定言語(ター
ゲット言語)における単語リストから情報検索実行部3
00が受け付け可能な情報検索式を生成する(ステップ
S45)。
Next, the information retrieval execution unit 3 is searched from the word list of the translation result in the designated language (target language).
00 generates an information search formula that can be accepted (step S45).

【0032】最後に、上記の情報検索式を情報検索実行
部300へ送り、受け取った検索結果をユーザインタフ
ェース部100へ送ることにより、ユーザに指定言語
(ターゲット言語)による検索結果を提示する(ステッ
プS46)。
Finally, the above-described information search formula is sent to the information search execution unit 300, and the received search results are sent to the user interface unit 100, thereby presenting the search results in the designated language (target language) to the user (step). S46).

【0033】以下、図4の例に即して、多言語情報検索
式生成部500の各ステップにおける動作について更に
具体的に説明する。
Hereinafter, the operation of each step of the multilingual information retrieval formula generation unit 500 will be described more specifically with reference to the example of FIG.

【0034】まず、前記ステップS41について図5を
参照して説明する。図5は、文書情報取得部600より
得られる指定された文書における単語頻度分布情報の一
例を示す図である。図5に示すように、各文書における
単語頻度分布情報は、文書中に含まれる各単語に対し
て、その単語の該文書における重要度を示す実数値を付
与したものとする。ある単語のある文書における重要性
を図る指標としては、単純には出現頻度が考えられる
が、テキスト情報検索においてはtf*idf法と呼ば
れる方法による値が用いられることが多い。本発明にお
いては、情報検索実行部300は、このような標準的な
手法を採用していることを仮定し、その詳細については
規定しない。
First, step S41 will be described with reference to FIG. FIG. 5 is a diagram illustrating an example of word frequency distribution information in a specified document obtained by the document information obtaining unit 600. As shown in FIG. 5, the word frequency distribution information in each document is obtained by adding a real value indicating the importance of the word in the document to each word included in the document. As an index for determining the importance of a certain word in a certain document, an appearance frequency can be simply considered, but a value called a tf * idf method is often used in text information search. In the present invention, it is assumed that the information search execution unit 300 employs such a standard method, and details thereof are not specified.

【0035】次に、前記ステップS42では、ある文書
を特徴づける単語群を抽出する。上述したtf*idf
法のような手法により単語の重要性が付与されているな
らば、例えば、この値が大きい順にN個の単語を選択す
るということによって文書を特徴づける単語群を抽出す
ることができる。ここでは、説明の簡単のため、各文書
から値の大きいものから順に最大5個の単語を選択する
こととする。ここで、Nの値は、検索対象の文書アーカ
イブの特性などを考慮して実験的に決定すべきであるの
で、その決定方法については本発明では規定しない。図
5においては、このような方法によって選択される単語
を網掛け部分で示してある。
Next, in step S42, a word group characterizing a certain document is extracted. Tf * idf described above
If the importance of a word is given by a method such as a method, for example, a word group characterizing a document can be extracted by selecting N words in descending order of this value. Here, for simplicity of explanation, it is assumed that up to five words are selected from each document in descending order of value. Here, since the value of N should be experimentally determined in consideration of the characteristics of the document archive to be searched, the method of determining it is not specified in the present invention. In FIG. 5, words selected by such a method are indicated by shading.

【0036】次に、前記ステップS43では、各文書か
ら抽出された単語群を総合して、ユーザによって適合文
書であると選択された文書群の特徴を表す単語群を抽出
する。これらの単語群は、ユーザが実際に検索する文書
の言語として選択した指定言語(ターゲット言語)へと
翻訳すべき単語群である。ユーザによって選択されたM
件(例えば3件)の各適合文書から最大N個の単語を抽
出するので、翻訳すべき単語数は最大M*N件となる。
単語数が増えれば、検索における再現率を少なくする
(検索漏れを少なくする)ことが期待できるが、逆に適
合率が低くなる(検索されたものの中に不適合のものが
多く含まれる)可能性がある。よって、適当な数の単語
を選択することが望ましい。このような単語の数は、文
書アーカイブ310の特性などを考慮して実験的に決定
すべきであるので、本発明では規定しないが、例えば、
候補となる全ての単語xについて、次式により値W
(x)を計算し、この値の大きいもの順にL個を選択す
ればよい。
Next, in step S43, the word groups extracted from each document are combined to extract a word group representing the characteristics of the document group selected as a suitable document by the user. These words are words to be translated into a designated language (target language) selected as a language of a document actually searched by the user. M selected by user
Since a maximum of N words are extracted from each (for example, three) matching documents, the number of words to be translated is a maximum of M * N.
If the number of words increases, the recall rate in the search can be reduced (reduction of omissions in the search), but on the contrary, the relevance rate may be low (there are many non-conforming ones in the search). There is. Therefore, it is desirable to select an appropriate number of words. Although the number of such words should be determined experimentally in consideration of the characteristics of the document archive 310 and the like, it is not defined in the present invention.
For all candidate words x, the value W
(X) may be calculated, and L values may be selected in descending order of this value.

【0037】[0037]

【数1】 (Equation 1)

【0038】ここで、weight(x,k)とは、文
書kにおける単語xの重要度であり、単語xが文書kに
存在しない場合はweight(x,k)=0とする。
また、df(x)とは、ユーザによって選択されたM件
の文書の中で単語xを含む文書の数である。図5で示し
た選択された各単語に対して、W(x)を計算した結果
を図6に示す。ここで例えばL=6とすると、図6で網
掛けした単語群が選択される。
Here, weight (x, k) is the importance of word x in document k. If word x does not exist in document k, weight (x, k) = 0.
Df (x) is the number of documents including the word x in the M documents selected by the user. FIG. 6 shows the result of calculating W (x) for each selected word shown in FIG. Here, if L = 6, for example, the shaded word group in FIG. 6 is selected.

【0039】次に、前記ステップS44では、ステップ
S43により抽出された単語群から構成される単語リス
ト(”ネットワーク”,”ATM”,”ハブ”,”LA
N”,”スイッチ”,”FDDI”)を単語リスト翻訳
部700へ送り、指定言語(ターゲット言語)への翻訳
結果を受け取る。翻訳結果の単語リストは、例え
ば、(”network”,”ATM”,”hu
b”,”LAN”,”switch”,”FDDI”)
のようになる。
Next, in step S44, a word list ("network", "ATM", "hub", "LA") composed of the word group extracted in step S43 is used.
N "," switch "," FDDI ") to the word list translator 700 to receive the translation result in the specified language (target language). The translation result word list is, for example, (" network "," ATM "). , "Hu
b "," LAN "," switch "," FDDI ")
become that way.

【0040】次に、前記ステップS45では、ステップ
S44により得られた指定言語(ターゲット言語)にお
ける単語リストから多言語情報検索式を生成する。ここ
では、多言語情報検索式としては、原言語における情報
検索式と同様に、(”network”,”AT
M”,”hub”,”LAN”,”switch”,”
FDDI”)という単純な単語の順序なしリストとす
る。
Next, in step S45, a multilingual information retrieval formula is generated from the word list in the designated language (target language) obtained in step S44. Here, as the multilingual information search formula, as in the case of the information search formula in the source language, ("network", "AT
M "," hub "," LAN "," switch ","
FDDI ") as an unordered list of simple words.

【0041】次に、前記ステップS46では、ステップ
S45により生成された多言語情報検索式を情報検索実
行部300へと送り、ユーザが指定したターゲット言語
の文書を対象とした検索結果を受け取る。受け取った検
索結果は、ユーザインタフェース部100へ送られ、ユ
ーザに検索結果が提示される。
Next, in step S46, the multilingual information search expression generated in step S45 is sent to the information search execution unit 300, and a search result for a target language document specified by the user is received. The received search result is sent to the user interface unit 100, and the search result is presented to the user.

【0042】このように、本実施の形態に係る多言語イ
ンタラクティブ情報検索システムでは、ユーザの得意な
言語X(母国語など)での情報要求により初期の検索を
実行すると、この言語Xを用いて文書群から情報検索が
行われ、ユーザインタフェース部100を介して検索結
果が提示される。ユーザが言語Xで記述された検索結果
の文書群の中から適合する文書(適合文書)を選択する
とともに、実際に検索したい文書の言語Yを指定する
と、適合文書において特徴的な単語リストが生成され、
この単語リストが言語Yに翻訳され、翻訳された単語リ
ストに基づき文書アーカイブ310から情報検索が行わ
れる。このように、ユーザの得意な言語Xを主に使用し
ながら、異なる言語Yにおける適合文書を検索すること
が可能となる。
As described above, in the multilingual interactive information search system according to the present embodiment, when an initial search is executed in response to an information request in a language X (such as a native language) that the user is good at, the language X is used. Information retrieval is performed from the document group, and the retrieval result is presented via the user interface unit 100. When the user selects a matching document (matching document) from the group of documents of the search result described in the language X and specifies the language Y of the document to be actually searched, a characteristic word list is generated in the matching document. And
This word list is translated into the language Y, and information retrieval is performed from the document archive 310 based on the translated word list. As described above, it is possible to search for a suitable document in a different language Y while mainly using the language X that the user is good at.

【0043】なお、本実施の形態では、検索対象となる
複数言語を有する文書群として、多数の文書を収録した
文書アーカイブ310を例示したが、本発明はこれに限
定されるものではない。すなわち、検索対象である文書
は、ローカルな場所に収録されていてもグローバルな場
所に分散して収録されていてもよい。例えば、インター
ネット上でアクセス可能な全ての文書を対象としてもよ
い。この場合には、前記検索実行部や文書情報取得部が
各文書にアクセス可能である必要がある。
In this embodiment, the document archive 310 containing a large number of documents is exemplified as a document group having a plurality of languages to be searched, but the present invention is not limited to this. That is, the document to be searched may be recorded at a local location or may be distributed and recorded at a global location. For example, all documents accessible on the Internet may be targeted. In this case, the search execution unit and the document information acquisition unit need to be able to access each document.

【0044】また、本実施の形態では、ユーザによる適
合文書及び指定言語の選択入力は、初期の情報要求の後
において1回のみである場合を例示したが、本発明はこ
れに限定されるものではない。多言語情報検索式を用い
て指定言語(ターゲット言語)による検索結果が提示さ
れた後、この検索結果に基づき更に適合文書及び指定言
語を選択することにより検索対象を絞り込むようにして
もよい。すなわち、図2におけるフローチャートでは、
ステップS3〜S4を複数繰り返すことにより適合文書
を絞り込むようにしてもよい。
Further, in the present embodiment, the case where the user has only once performed the selection input of the conforming document and the designated language after the initial information request has been described, but the present invention is not limited to this. is not. After a search result in a specified language (target language) is presented using a multilingual information search formula, a search target may be narrowed down by further selecting a suitable document and a specified language based on the search result. That is, in the flowchart in FIG.
Relevant documents may be narrowed down by repeating steps S3 and S4 a plurality of times.

【0045】さらに、本実施の形態では、指定された文
書において特徴づけられた単語群を生成する手段は、当
該文書における単語頻度分布情報を取得し、この単語頻
度分布情報に基づき単語群を生成していたが、本発明は
これに限定されるものではない。例えば、文書群におけ
る各文書が当該文書を特徴づける言葉をキーワードとし
て有しているような場合には、当該キーワードを取得す
ればよい。
Further, in the present embodiment, the means for generating a word group characterized in a specified document acquires word frequency distribution information in the document and generates a word group based on the word frequency distribution information. However, the present invention is not limited to this. For example, when each document in a document group has a keyword that characterizes the document as a keyword, the keyword may be acquired.

【0046】[0046]

【発明の効果】以上詳述したように、本発明の多言語イ
ンタラクティブ情報検索システムによれば、ユーザの得
意な言語Xを主に使用しながら、異なる言語Yにおける
適合文書を検索対象である文書群から検索することが可
能となる。
As described in detail above, according to the multilingual interactive information retrieval system of the present invention, a document to be searched for a suitable document in a different language Y while mainly using the language X that the user is good at. It becomes possible to search from a group.

【0047】より具体的には、例えば、説明に用いた例
では、(”ATM”、”ネットワーク”)という初期の
日本語による情報要求に対する検索結果は、図2に示し
たように、高速ネットワークに関するATMについての
文書と、自動出納機械としてのATMに関する文書が混
在することが予想される。しかしながら、図3に示した
ようにユーザが適合文書を適切に選択できれば、ターゲ
ット言語である英語によるフィードバック検索のための
検索式は、上記に説明したように、(”networ
k”,”ATM”,”hub”,”LAN”,”swi
tch”,”FDDI”)となり、前者の意味でのAT
Mを含む英語の文書を検索することが期待できる。
More specifically, for example, in the example used in the description, the search result for the initial information request in Japanese (“ATM”, “network”) is, as shown in FIG. It is expected that documents on ATMs related to ATMs and documents on ATMs as automatic teller machines will coexist. However, if the user can appropriately select a suitable document as shown in FIG. 3, the search expression for the feedback search in English, which is the target language, is (“network”) as described above.
k "," ATM "," hub "," LAN "," swi
tch "," FDDI "), and AT in the former sense
It can be expected to search English documents including M.

【0048】また、この英語における検索式を生成する
際には、”ハブ”には、”hub(中継の意味)”
と、”habu(沖縄に住む蛇の意味)”の翻訳多義が
存在するが、”LAN”や”ネットワーク”,”FDD
I”といった語とリストを形成して翻訳することによ
り、正しく”hub”を訳語として選択することが期待
できる。つまり、多言語における検索精度の向上を図る
ことができる。
When generating a search expression in English, “hub” means “hub (meaning of relay)”.
"Habu (meaning snakes living in Okinawa)" is translated, but "LAN", "network", "FDD"
By forming and translating a list with words such as "I", it is expected that "hub" will be correctly selected as a translated word, that is, search accuracy in multiple languages can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態に係る多言語インタラクティブ情
報検索システムの構成図
FIG. 1 is a configuration diagram of a multilingual interactive information search system according to an embodiment;

【図2】本実施の形態に係る多言語インタラクティブ情
報検索システムの動作を説明するフローチャート
FIG. 2 is a flowchart for explaining the operation of the multilingual interactive information search system according to the embodiment;

【図3】ユーザインタフェース部によって生成されるユ
ーザ端末の画面イメージの一例を説明する図
FIG. 3 illustrates an example of a screen image of a user terminal generated by a user interface unit.

【図4】ユーザインタフェース部によって生成されるユ
ーザ端末の画面イメージの一例を説明する図
FIG. 4 is a diagram illustrating an example of a screen image of a user terminal generated by a user interface unit.

【図5】文書情報取得部より得られる指定された文書に
おける単語頻度分布情報の一例を示す図
FIG. 5 is a diagram showing an example of word frequency distribution information in a specified document obtained by a document information acquisition unit.

【図6】指定された文書において特徴づけられた単語群
を一例を示す図
FIG. 6 is a diagram showing an example of a word group characterized in a designated document;

【符号の説明】[Explanation of symbols]

100…ユーザインタフェース部、200…情報検索式
生成部、300…情報検索実行部、310…文書アーカ
イブ、400…情報検索結果表示選択部、500…多言
語情報検索式生成部、600…文書情報取得部、700
…単語リスト翻訳部
100: User interface unit, 200: Information search formula generation unit, 300: Information search execution unit, 310: Document archive, 400: Information search result display selection unit, 500: Multilingual information search formula generation unit, 600: Document information acquisition Part, 700
… Word list translator

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 複数言語からなる文書群からユーザの初
期の情報要求の言語とは異なる言語で記述された文書を
検索する多言語インタラクティブ情報検索システムにお
いて、 ユーザインタフェース部を介して入力されるユーザの初
期の情報要求に基づいて情報検索式を生成する情報検索
式生成部と、 入力される情報検索式に基づき文書を検索する情報検索
実行部と、 情報検索実行部による情報検索結果をユーザインタフェ
ース部を介してユーザに提示し、その中からユーザの情
報要求に適合する文書(以下、「適合文書」という)及
び要求する文書の言語(以下、「指定言語」という)を
ユーザに指定させる情報検索結果表示選択部と、 ある言語における単語リストを他の言語における単語リ
ストへ翻訳する単語リスト翻訳部と、 適合文書における特徴的な単語を抽出して単語リストを
生成し、該単語リストを前記単語リスト翻訳部により指
定言語に翻訳し、翻訳した単語リストに基づき指定言語
における情報検索式を生成する多言語情報検索式生成部
を有し、 該多言語情報検索式生成部の生成する情報検索式によっ
て前記情報検索実行部を実行することを特徴とする多言
語インタラクティブ情報検索システム。
1. A multilingual interactive information retrieval system for retrieving a document described in a language different from a language of a user's initial information request from a group of documents composed of a plurality of languages, wherein a user input via a user interface unit is provided. An information search formula generation unit that generates an information search formula based on an initial information request of the user, an information search execution unit that searches for a document based on an input information search formula, and a user interface that provides information search results by the information search execution unit Information that is presented to the user via the section and allows the user to specify a document that conforms to the user's information request (hereinafter referred to as “conforming document”) and the language of the requested document (hereinafter referred to as “designated language”) A search result display selection unit; a word list translation unit for translating a word list in one language into a word list in another language; A multilingual information search for extracting a characteristic word in a word list, generating a word list, translating the word list into a specified language by the word list translating unit, and generating an information search formula in the specified language based on the translated word list A multilingual interactive information search system, comprising: a formula generation unit, wherein the information search execution unit is executed by an information search formula generated by the multilingual information search formula generation unit.
【請求項2】 文書群中から適合文書における単語頻度
分布情報を取得する文書情報取得部を有するとともに、
前記多言語情報検索式生成部は、該文書情報取得部から
得られる単語頻度分布情報に基づき適合文書における特
徴的な単語リストを生成することを特徴とする請求項1
記載の多言語インタラクティブ情報検索システム。
2. A document information acquisition unit for acquiring word frequency distribution information on a conforming document from a document group,
2. The multilingual information search formula generating unit generates a characteristic word list in a matching document based on word frequency distribution information obtained from the document information obtaining unit.
The described multilingual interactive information retrieval system.
【請求項3】 複数言語からなる文書群からユーザの初
期の情報要求の言語とは異なる言語で記述された文書を
検索する多言語インタラクティブ情報検索プログラムを
記録した記録媒体において、 前記プログラムは、ユーザインタフェース部を介して入
力されるユーザの初期の情報要求に基づいて情報検索式
を生成するステップと、 生成された情報検索式に基づき文書を検索するステップ
と、 検索結果をユーザインタフェース部を介してユーザに提
示し、その中から適合文書及び指定言語をユーザに指定
させるステップと、 適合文書における特徴的な単語を抽出して単語リストを
生成するステップと、生成した単語リストを指定言語に
翻訳するステップと、 翻訳した単語リストに基づき指定言語における情報検索
式を生成するステップと、 生成した指定言語における情報検索式に基づき文書を検
索するステップとを有することを特徴とする多言語イン
タラクティブ情報検索プログラムを記録した記録媒体。
3. A recording medium storing a multilingual interactive information retrieval program for retrieving a document described in a language different from the language of an initial information request of a user from a group of documents composed of a plurality of languages, wherein the program comprises: Generating an information search formula based on the user's initial information request input via the interface unit; searching for a document based on the generated information search formula; and transmitting the search result via the user interface unit Presenting to the user, causing the user to specify a conforming document and a designated language from among them, extracting characteristic words in the conforming document to generate a word list, and translating the generated word list into the designated language Generating an information search expression in a specified language based on the translated word list; Retrieving a document based on the generated information retrieval formula in the designated language.
【請求項4】 前記単語リストを生成するステップは、 文書群中から適合文書における単語頻度分布情報を取得
するステップと、 取得した単語頻度分布情報に基づき適合文書における特
徴的な単語リストを生成するステップを有することを特
徴とする多言語インタラクティブ情報検索プログラムを
記録した記録媒体。
4. The step of generating the word list includes the steps of acquiring word frequency distribution information of a matching document from a group of documents; and generating a characteristic word list of the matching document based on the acquired word frequency distribution information. A recording medium recording a multilingual interactive information search program, characterized by having a step.
JP11198691A 1999-07-13 1999-07-13 Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded Pending JP2001022787A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11198691A JP2001022787A (en) 1999-07-13 1999-07-13 Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11198691A JP2001022787A (en) 1999-07-13 1999-07-13 Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded

Publications (1)

Publication Number Publication Date
JP2001022787A true JP2001022787A (en) 2001-01-26

Family

ID=16395443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11198691A Pending JP2001022787A (en) 1999-07-13 1999-07-13 Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded

Country Status (1)

Country Link
JP (1) JP2001022787A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050821A (en) * 2001-08-03 2003-02-21 Keio Gijuku Multilanguage literature retrieval system
US7130849B2 (en) 2002-02-05 2006-10-31 Hitachi, Ltd. Similarity-based search method by relevance feedback
JP2014518581A (en) * 2011-04-28 2014-07-31 マイクロソフト コーポレーション Alternative market search results toggle
JP2016115288A (en) * 2014-12-17 2016-06-23 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation System, method and program of collecting data

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232883A (en) * 1996-10-23 1998-09-02 I T I:Kk Document retrieval system coping with many languages
JPH1185794A (en) * 1997-09-12 1999-03-30 Nippon Telegr & Teleph Corp <Ntt> Retrieval word input device and recording medium recording retrieval word input program
JPH11110416A (en) * 1997-07-25 1999-04-23 Kuraritec Corp Method and device for retrieving document from data base
JPH11161658A (en) * 1997-11-27 1999-06-18 Nippon Telegr & Teleph Corp <Ntt> Method and device for calculating priority of additional retrieval word and storing medium housing priority calculating program of additional retrieval word

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232883A (en) * 1996-10-23 1998-09-02 I T I:Kk Document retrieval system coping with many languages
JPH11110416A (en) * 1997-07-25 1999-04-23 Kuraritec Corp Method and device for retrieving document from data base
JPH1185794A (en) * 1997-09-12 1999-03-30 Nippon Telegr & Teleph Corp <Ntt> Retrieval word input device and recording medium recording retrieval word input program
JPH11161658A (en) * 1997-11-27 1999-06-18 Nippon Telegr & Teleph Corp <Ntt> Method and device for calculating priority of additional retrieval word and storing medium housing priority calculating program of additional retrieval word

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050821A (en) * 2001-08-03 2003-02-21 Keio Gijuku Multilanguage literature retrieval system
US7130849B2 (en) 2002-02-05 2006-10-31 Hitachi, Ltd. Similarity-based search method by relevance feedback
JP2014518581A (en) * 2011-04-28 2014-07-31 マイクロソフト コーポレーション Alternative market search results toggle
JP2016115288A (en) * 2014-12-17 2016-06-23 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation System, method and program of collecting data
US10733218B2 (en) 2014-12-17 2020-08-04 International Business Machines Corporation System, method, and program for aggregating data

Similar Documents

Publication Publication Date Title
US6442540B2 (en) Information retrieval apparatus and information retrieval method
JP5264892B2 (en) Multilingual information search
US20060020576A1 (en) Search system reusing search condition and the related method
WO2012000335A1 (en) Input method and device combined with application interfaces
WO2000075809A1 (en) Information sorting method, information sorter, recorded medium on which information sorting program is recorded
JP6723976B2 (en) Test execution device and program
JP2006178599A (en) Document retrieval device and method
JP2001022787A (en) Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded
JP2009080806A (en) Method for inserting link in web page
JP7104390B2 (en) Document creation device, document creation method, database construction device, database construction method, and program
JPH1145261A (en) Information retrieval device and computer-readable recording medium where program making computer function as samd device is recorded
JP2004246422A (en) Information retrieval support device
JP2008026967A (en) Document retrieval system and program
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
JP2000067126A (en) Schedule information processor, display information processor and medium stored with schedule and display information processing control program
JP5656230B2 (en) Application operation case search method, apparatus and program
US6178415B1 (en) Phrase retrieving/selecting method and a computer-readable recording medium with a program making a computer execute each step in the method recorded therein
JP2004157965A (en) Search support device and method, program and recording medium
JP4496797B2 (en) Document management apparatus and method
JP4138048B2 (en) Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device
JP4368550B2 (en) Document search apparatus, document search method, and program causing computer to execute the method
JP2001117942A (en) Device and method for retrieving information and computer readable recording medium recording program for computer to execute the same method
JP2006163645A (en) Method, device and program for retrieving information, computer readable recording medium and device recorded with the program
JP2014146076A (en) Character string extraction method, character string extraction apparatus, and character string extraction program
JP3444592B2 (en) Document search device, query output device, document search method, query output method, and recording medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050201