JP4140343B2 - Information search support method and apparatus, and information search support program - Google Patents

Information search support method and apparatus, and information search support program Download PDF

Info

Publication number
JP4140343B2
JP4140343B2 JP2002314875A JP2002314875A JP4140343B2 JP 4140343 B2 JP4140343 B2 JP 4140343B2 JP 2002314875 A JP2002314875 A JP 2002314875A JP 2002314875 A JP2002314875 A JP 2002314875A JP 4140343 B2 JP4140343 B2 JP 4140343B2
Authority
JP
Japan
Prior art keywords
search
word
language
target language
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002314875A
Other languages
Japanese (ja)
Other versions
JP2004151881A (en
Inventor
林  良彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002314875A priority Critical patent/JP4140343B2/en
Publication of JP2004151881A publication Critical patent/JP2004151881A/en
Application granted granted Critical
Publication of JP4140343B2 publication Critical patent/JP4140343B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、情報検索支援方法及び装置及び情報検索支援プログラムに係り、特に、問い合わせの言語(原言語)と検索対象の言語(目的言語)が異なる場合でのクロス言語情報検索の際に、目的言語において語義の曖昧性を有する場合に対処するための情報検索支援方法及び装置及び情報検索支援プログラムに関する。
【従来の技術】
従来、問い合わせの言語と検索対象の言語が異なるクロス言語情報検索システムに関する研究開発が行われている。その例として、ユーザの母国語による説明情報に基づいて検索要求の適切な訳語を選択するインタラクティブインタフェースや(例えば、非特許文献1参照)、クロスランゲージ情報検索(Cross-Language Information Retrieval,CLIR)(例えば、非特許文献2参照)等がある。
【0002】
特に、検索要求を適切に翻訳する方法に関して多くの提案が行われている。その一つとして、単語Wの用例の集合を単語Wの意味によって自動的に分類し、各分類に対してその分類を特徴付ける単語の集合を分類内の用例から抽出し、得られた各分類に対して、単語Wの可能な訳語の中から抽出した単語の集合を訳したものと最も関連性の高いを訳語を選択する方法がある(例えば、特許文献1を参照)。また、ユーザの得意な言語Xを主に使用しながら、異なる言語Yにおける適合文書を検索対象である文書群から検索する方法がある(例えば、特許文献2参照)。
【0003】
一方で、翻訳された検索要求が目的言語において持つ語義の曖昧性については、十分な検討が行われていない。
【0004】
【特許文献1】
特開2000−348031「訳語選択辞書自動作成装置及び自動翻訳装置並びにそれらのプログラムを記録した媒体」
【特許文献2】
特開2001−022787「多言語インタラクティブ情報検索システム及び多言語インタラクティブ情報検索プログラムを記録した格納媒体」
【非特許文献1】
「多言語情報アクセスシステム」,林他2名,NTT技術ジャーナル,2002年1月号、pp.76-80.
【非特許文献2】
「言語の壁を越えて文書検索する」,菊井,人工知能学会誌,Vol.15, NO.4, pp.550-558.
【発明が解決しようとする課題】
しかしながら、ユーザが問い合わせに用いる言語と検索対象の文書の言語が異なるクロス言語情報検索において、ユーザの検索要求が適切に目的言語に翻訳されたとしても、その翻訳された検索要求が目的言語において持つ語義の曖昧性により、適切な検索が行われない可能性がある。例えば、日本語の“銀行”という単語は、英語において“bank”と訳されるのが適切と考えられているが、“bank”という英語の単語は、「銀行」に相当する語義以外にも「土手・堤防」や、「貯蔵の場所」などの語義を持つ。このため、ユーザは、「銀行」についての検索をしたいにもかかわらず、“bank”という検索語を用いる限り、これらの語義での“bank”を含む文書が検索されてしまう可能性がある。また、このような問題は、目的言語に熟知していないユーザにとっては予想のつかない場合(即ち、“bank”が「銀行」以外の語義を持つことが予想できない)が多い。
【0005】
本発明は、上記の点に鑑みなされたもので、このような翻訳により生成された検索要求の目的言語の語義的曖昧性に関わる課題を解決した情報検索支援方法及び装置及び情報検索支援プログラムを提供することを目的とする。
【0006】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0007】
本発明は、ユーザが問い合わせに用いる言語(原言語)と検索対象の言語(目的言語)が異なるクロス言語情報検索を支援するための情報検索支援方法において、
検索要求解析手段において、ユーザインタフェース手段を介して、ユーザから入力された原言語による検索要求を解析し(ステップ1)、
対訳辞書検索手段において、原言語における単語と該単語の対訳がデータベースに格納されている対訳辞書を検索し(ステップ2)、
検索語選択リスト生成手段において、目的言語の単語をキーとし、該目的言語の単語の持つ語義と、該語義毎に、該語義の曖昧性に対応する複合語、連語、例文を含む複数の目的言語表現とがデータベースに格納されている検索候補語辞書を検索することにより、目的言語における検索語候補リストを生成し、ユーザインタフェース手段を介して、目的言語表現を目的言語の語義毎に区分けして該ユーザに提示し(ステップ3)、
検索式生成手段において、ユーザによって検索語候補リストから選択された検索語候補群を取得し、該検索語候補群から、検索処理で使用する検索式を生成する(ステップ4)。
【0008】
また、本発明の情報検索支援方法では、検索語リスト生成手段において、検索語候補リストを生成する際に、
検索語候補辞書に含まれる目的言語の単語をキーとして、検索語候補と該検索語候補の原言語における訳語とがデータベースに格納されている逆対訳辞書を検索し、エントリが存在すれば、該検索候補語辞書に含まれる目的言語表現に対して原言語による説明を付加する
【0009】
また、本発明の情報検索支援方法では、検索エンジン通信手段において、検索式生成手段で生成された検索式を、検索式を用いて検索処理を行う検索エンジンに送信し、該検索エンジンから検索結果を受信して、ユーザインタフェース手段を介してユーザに送信する
【0010】
図2は、本発明の原理構成図である。
【0011】
本発明は、ユーザが問い合わせに用いる言語(原言語)と検索対象の言語(目的言語)が異なるクロス言語情報検索を支援するための情報検索支援装置であって、
原言語における単語と該単語の対訳とがデータベースに格納されている対訳辞書410と、
目的言語の単語をキーとし、該目的言語の単語の持つ語義と、該語義毎に、該語義の曖昧性に対応する複合語、連語、例文を含む複数の目的言語表現とがデータベースに格納されている検索候補語辞書510と
ーザとの間で検索要求及び選択入力情報とを受信すると共に、選択情報及び検索結果を送信するユーザインタフェース手段200と、
ユーザインタフェース手段200を介して、ユーザから入力された原言語による検索要求を解析する検索要求解析手段300と、
検索要求解析手段300で解析された検索要求に基づいて対訳辞書410を検索する対訳辞書検索手段400と、
検索候補語書510を検索することにより、目的言語における検索語候補リストを生成し、ユーザインタフェース手段200を介して、目的言語表現を目的言語の語義毎に区分けして該ユーザに提示する検索語選択リスト生成手段500と、
ユーザインタフェース手段200を介してユーザによって検索語候補リストから選択された検索語候補群を取得し、該検索語候補群から検索処理で使用する検索式を生成する検索式生成手段600と、を有する。
【0012】
また、本発明の情報検索支援装置の検索語リスト生成手段500は、
検索語候補リストを生成する際に、
検索語候補辞書510に含まれる目的言語の単語をキーとして、検索候補と該検索候補に対応する原言語とがデータベースに格納されている逆対訳辞書520を検索し、エントリが存在すれば、該検索候補語辞書510に含まれる目的言語表現に対して原言語による説明を付加する手段を含む。
【0013】
また、本発明の情報検索支援装置は、検索式生成手段600で生成された検索式を、検索処理を行う検索エンジンに送信し、該検索エンジンから検索結果を受信して、ユーザインタフェース手段200を介してユーザに送信する検索エンジン通信手段を、更に有する。
【0014】
本発明は、ユーザが問い合わせに用いる言語(原言語)と検索対象の言語(目的言語)が異なるクロス言語情報検索を支援するため、コンピュータのCPUにおいて実行される情報検索支援プログラムであって、
ユーザインタフェース手段を介して、ユーザから入力された原言語による検索要求を解析する検索要求解析ステップと、
原言語の単語をキーとし、該単語に対応する目的言語の対訳語とがデータベースに格納されている対訳辞書を検索する対訳辞書検索ステップと、
目的言語の単語をキーとし、該目的言語の単語の持つ語義毎に、該語義の曖昧性に対応する複合語、連語、例文を含む複数の目的言語表現とがデータベースに格納されている検索候補語辞書を検索することにより、目的言語における検索語候補リストを生成し、ユーザインタフェース手段を介して、目的言語表現を目的言語の語義毎に区分けして該ユーザに提示する検索語選択リスト生成ステップと、
ユーザインタフェース手段を介してユーザによって検索語候補リストから選択された検索語候補群を取得し、該検索語候補群から、検索処理で使用する検索式を生成する検索式生成ステップと、からなる。
【0015】
また、本発明の情報検索支援プログラムの検索語リスト生成ステップにおいて、検索語候補リストを生成する際に、
検索語候補辞書に含まれる目的言語の単語をキーとして、検索語候補と該検索語候補の原言語における訳語とがデータベースに格納されている逆対訳辞書を検索し、エントリが存在すれば、該検索候補語辞書に含まれる目的言語表現に対して原言語による説明を付加するステップを含む
【0016】
また、本発明の情報検索支援プログラムは、検索式生成ステップで生成された検索式を、検索式を用いて検索処理を行う検索エンジンに送信し、該検索エンジンから検索結果を受信して、ユーザインタフェース手段を介してユーザに送信する検索エンジン通信ステップを更に有する
【0017】
上記のように、本発明では、利用者がある言語(原言語)から異なる言語(目的言語)の情報検索を支援するシステムにおいて、目的言語に利用者が意図しない語義をもつという曖昧性がある場合に、その語義に対応する検索候補語または、その訳語を提示し、その中から適切なものを利用者に選択させて、適切な語義を持つ目的言語により検索式を生成し、当該検索式を用いて目的言語情報を検索することにより、翻訳された検索要求に対する目的言語に曖昧性があったとしても適切な検索を行うことが可能となる。
【0018】
【発明の実施の形態】
以下、図面と共に本発明の実施の形態について説明する。
【0019】
以下では、日本語を利用するユーザが、日本語による問い合わせによって、英語の文書からなる検索対象を検索する日英語間のクロス言語情報検索を想定し、“銀行の再建”という問い合わせを例として、クロス言語情報検索について説明する。
【0020】
図3は、本発明の一実施の形態におけるクロス言語情報検索装置(情報検索支援装置)の構成を示す。
【0021】
同図に示すクロス言語情報検索装置は、ユーザインタフェース部200、検索要求解析部300、対訳辞書検索部400、対訳辞書410、検索語選択リスト生成部500、検索候補語辞書510、逆対訳辞書520、検索式生成部600、検索エンジン通信部700から構成され、検索エンジン通信部700には、検索エンジン710が接続されている。
【0022】
対訳辞書410は、原言語の単語をキーとして、原言語の単語に対応する対訳を収録したものであり、データベース等の記憶手段に格納される。
【0023】
図4は、本発明の一実施の形態における対訳辞書の構成例を示す。
【0024】
同図に示す対訳辞書410は、日本語単語をキーとして、該日本語単語に対応する英語の対訳語を収録したものである。同図の例においては、“銀行”に対して“bank”、“再建”に対して“reconstruction”が対訳語として得られるものとする。このような対訳辞書は、既存の和英辞書や機械翻訳システムにおける辞書をもとに構築することが可能である。なお、本発明では、当該対訳辞書の構築方法については規定しない。
【0025】
検索候補語辞書510は、対訳によって得られた各対訳語の目的言語における語義の曖昧性に対応した検索語候補を予め収録したものであり、データベース等の記憶手段に格納される。
【0026】
図5は、本発明の一実施の形態における検索候補語辞書の構成例を示す。
【0027】
同図に示す検索候補語辞書510は、英語単語をキーとし、当該英語単語の持つ語義、及び、語義毎に、当該語義に関連する複数の英語表現(複合語、連語、例文等)収録したものである。このような検索候補語辞書510は、既存の英語辞書や概念辞書などをもとに容易に構築することが可能であるし、英語におけるテキストデータの集合から言語処理手段により構築することも可能である(例えば、"The automatic construction of faceted terminological feedback for interactive document retrieval", Peter G. Anick, in "Recent Advances in Computational Terminology", John Benjamins Publishing Company, (2001), pp.29-52)。なお、本発明では、その構築方法等については規定しない。
【0028】
逆対訳辞書520は、検索候補の原言語における訳語を予め収録したものであり、データベース等の記憶手段に格納される。
【0029】
図6は、本発明の一実施の形態における逆対訳辞書の構成例を示す。
【0030】
同図に示す逆対訳辞書520は、英語表現をキーとし、当該英語表現に対応する日本語訳を収録したものである。このような逆対訳辞書520は、既存の英和辞書や機械翻訳システムにおける辞書をもとに容易に構築することが可能である。なお、本発明では、その構築方法については規定しない。
【0031】
ユーザインタフェース部200は、ユーザからの入力を受け付けると共に、当該ユーザに対して情報を出力する。
【0032】
検索要求解析部300は、ユーザインタフェース部200を介してユーザより入力された原言語による検索要求を解析する。
【0033】
対訳辞書検索部400は、検索要求解析部300で解析された検索要求の単語をキーとして対訳辞書4100検索して、入力された検索要求を構成する単語に対する対訳語を得る。
【0034】
検索語選択リスト生成部500は、対訳辞書検索部400から取得した各対訳語に対して、検索候補語辞書510及び逆対訳辞書520を参照して、ユーザに目的言語における語義に対応した適切な検索語を選択させるための検索語選択リストを生成し、ユーザインタフェース部200を介してユーザに提示する。
【0035】
検索式生成部600は、ユーザインタフェース部200を介してユーザにより指定された検索語(検索語候補群)を取得し、検索要求中の各単語から派生する検索条件を「AND」または、「OR」条件により結合し、検索式を生成する。検索エンジン通信部700は、検索式生成部600において生成された検索式を検索エンジン710に送信し、当該検索エンジン710から検索結果を受信し、ユーザインタフェース部200を介してユーザに提示する。
【0036】
以下、上記の構成における一連の動作を説明する。
【0037】
以下では、必要とする原言語、目的言語の組み合わせに対して、これに対応した対訳辞書410、検索候補語辞書510、逆対訳辞書520、検索エンジン710を用意することにより適切に動作するものであり、以下の説明における日英語間の状況に限定されるものではない。
【0038】
図7は、本発明の一実施の形態における動作のフローチャートである。
【0039】
ステップ101) ユーザにより入力された検索要求“銀行の再建”は、ユーザインタフェース部200を介してクロス言語情報検索装置100に入力される。入力された原言語(この例では、日本語)の検索要求は、まず、検索要求解析部300へ送信される。
【0040】
ステップ102) 検索要求部300には、検索要求の文字列をそれを構成する単語列へと分解する手段が内蔵されているものとする。このような単語列への分割手段は、形態素解析処理として公知のものであり(例えば、「形態素、構文解析」、永田、自然言語処理−基礎と応用−(田中監修)、電子情報通信学会,pp.2−38)、適切な手段を利用することができる。本例では、検索要求の“銀行の再建”は、“銀行”と“再建”という2つの単語からなることが解析される。解析された結果は、対訳辞書検索部400へと送信される。
【0041】
ステップ103) 対訳辞書検索部400は、検索要求に用いられる原言語と検索対象の文書の言語である目的言語(この例では英語)に対して予め準備された対訳辞書410を検索することにより、検索要求を構成する単語に対する対訳語を得る。対訳辞書410の構成は前述の図4に示す通りである。得られたこれらの対訳語は、検索語選択リスト生成部500へと送信される。
【0042】
ステップ104) 検索語選択リスト生成部500は、対訳辞書検索部400から送られてきた各対訳語に対して、検索候補語辞書510及び逆対訳辞書520を参照することにより、ユーザに目的言語における語義に対応した適切な検索語を選択させるための検索語選択リストを生成し、ユーザインタフェース部200に送る。検索候補語辞書510の構成は前述の図5に示す通りであり、逆対訳辞書520の構成は前述の図6に示す通りである。
【0043】
本発明の検索候補語辞書510では、図5に示したように、“bank”に対しては、語義が3つ存在することを仮定する。このように複数の語義が存在する場合、ユーザの検索意図は、これらのどれか1つであると想定する。また、意図に合致する語義に対応する検索語であれば、なるべく多くの検索語を用いて網羅的に行うことが望ましい。そこで、検索語選択リスト生成部500の生成する選択リストを概念的に説明すると、図8のようになる。
【0044】
図8は、本発明の一実施の形態における検索語選択リスト生成部が生成する選択リストを概念的に説明するための図である。同図において、“bank”に対しては3つの語義が存在し、ユーザはその中から1つの語義を選択し、選択された語義に関連する英語表現を検索語候補として複数選択可能であることを示している。また、“reconstruction”に対しては、1つの語義しか存在しないので、この語義に対応する検索語候補を複数選択することが可能である。
【0045】
検索語選択リスト生成部500は、このような選択リストをユーザに提示する画面として生成し、ユーザインタフェース部200を介してユーザに提示する。ここで、検索候補語辞書510に含まれる英語表現をキーとして、逆対訳辞書520を検索することにより、逆対訳辞書520にエントリが存在すれば、検索候補語辞書510に収録されている英語表現に対して、ユーザの原言語である日本語によって説明を付加することが可能である。
【0046】
図9は、本発明の一実施の形態におけるユーザに提示される選択リストの例である。同図に示す画面は、インターネット上で標準的に用いられているHTML形式によるものであり、容易にこのような画面を構成することが可能である。同図の例では、ユーザが選択すべき選択肢は、チェックボックスの形で表現されている。また、各検索語候補に対して逆対訳辞書520による日本語の説明がカッコ内に付与されている。
【0047】
ステップ105) ユーザインタフェース部200は、検索語選択リストをユーザに提示する。これにより、ユーザは、図9に示されるような選択画面におけるチェックボックスを利用して、検索意図に対応した、英語における検索語を指定することができる。
【0048】
図10は、本発明の一実施の形態における選択リストのユーザの指定の例を示す。ユーザは、“銀行”に対しては、意図した語義“financial institute ”であり、検索語として“World Bank”と“Tajikistan”を選択することを指定している。また、“再建”に対しては、“reconstruction”を選択することを指定している。
【0049】
上記のように、ユーザによって指定された検索語は、ユーザインタフェース部200を介して検索式生成部600へと送信される。
【0050】
ステップ106) 検索式生成部600は、ユーザインタフェース部200から入力されたユーザ指定による検索語の各単語から派生する検索条件を「AND」または、「OR」条件により統合する。以下の説明では、「AND」条件により統合するものとするが、このどちらを選択するかは、予めシステムに設定されているか、または、ユーザにより指定されるものとする。また、各単語から派生する検索条件は、選択された語義に関連する各英語表現を「OR」条件により結合するものとする。
【0051】
以上の処理により、検索式生成部600は、
((“World Bank” or “Tajikistan”)) and“reconstruction”)
なる検索式を生成し、検索エンジン通信部700へと送信する。
【0052】
ステップ107) 検索エンジン通信部700は、検索式生成部600から送信されてきた検索式を検索エンジン710へ送信し、検索結果を検索エンジン710より取得する。受信した検索結果は、ユーザインタフェース部200を介してユーザに提示される。
【0053】
以上の検索の過程において、ユーザは、日本語の“銀行”という単語の英訳語である“bank”には、「銀行」以外の語義が存在することを知り、検索意図である「銀行」という語義に関連した英語表現を検索候補として知ることができ、これらを検索に用いることで、検索意図に適合した精度の高いクロス言語情報検索を行うことができる。
【0054】
また、上記の動作をプログラムとして構築し、通信回線や記録媒体からクロス言語情報検索装置(情報検索支援装置)として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることも可能である。
【0055】
また、構築されたプログラムをクロス言語情報検索装置(情報検索支援装置)として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることも可能である。
【0056】
なお、本発明は、上記の実施の形態に限定されるとなく、特許請求の範囲内において種々変更・応用が可能である。
【0057】
【発明の効果】
上述のように、本発明によれば、ユーザの検索要求が適切に目的言語の翻訳されたとしても、その翻訳された検索要求が目的言語において持つ語義の曖昧性により、適切な検索が行われない可能性があるという課題を克服し、ユーザの意図に対応する語義に沿うような目的言語における検索式を構成することができる。従って、ユーザの意図する語義に対応する目的言語における検索を、目的言語における特別な知識がなくとも実行することができるようになる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施の形態におけるクロス言語情報検索装置の構成図である。
【図4】本発明の一実施の形態における対訳辞書の構成例である。
【図5】本発明の一実施の形態における検索候補語辞書の構成例である。
【図6】本発明の一実施の形態における逆対訳辞書の構成例である。
【図7】本発明の一実施の形態における動作のフローチャートである。
【図8】本発明の一実施の形態における検索語選択リスト生成部が生成する選択リストの概念を説明するための図である。
【図9】本発明の一実施の形態におけるユーザに提示される選択リストの例である。
【図10】本発明の一実施の形態における選択リストのユーザの指定の例である。
【符号の説明】
100 クロス言語情報検索装置
200 ユーザインタフェース手段、ユーアインタフェース部
300 検索要求解析手段、検索要求解析部
400 対訳辞書検索手段、対訳辞書検索部
410 対訳辞書
500 検索語選択リスト生成手段、検索語選択リスト生成部
510 検索候補語辞書
520 逆対訳辞書
600 検索式生成手段、検索式生成部
700 検索エンジン通信部
710 検索エンジン
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information search support method and apparatus, and an information search support program, and in particular, in cross-language information search when a query language (source language) and a search target language (target language) are different. The present invention relates to an information search support method and apparatus and an information search support program for dealing with a case where there is ambiguity of meaning in a language.
[Prior art]
Conventionally, research and development has been conducted on a cross-language information retrieval system in which a query language and a search target language are different. For example, an interactive interface for selecting an appropriate translation of a search request based on explanation information in the user's native language (see, for example, Non-Patent Document 1), cross-language information retrieval (Cross-Language Information Retrieval, CLIR) ( For example, see Non-Patent Document 2).
[0002]
In particular, many proposals have been made regarding methods for appropriately translating search requests. As one of them, a set of examples of the word W is automatically classified according to the meaning of the word W, a set of words characterizing the classification for each classification is extracted from the examples in the classification, and each obtained classification is assigned to each classification. On the other hand, there is a method of selecting a translated word having the highest relevance to the translated word set extracted from the possible translated words of the word W (see, for example, Patent Document 1). In addition, there is a method of searching a document group to be searched for a conforming document in a different language Y while mainly using a language X that the user is good at (for example, see Patent Document 2).
[0003]
On the other hand, the ambiguity of the meaning of the translated search request in the target language has not been sufficiently studied.
[0004]
[Patent Document 1]
Japanese Patent Laid-Open No. 2000-348031 “Translation Word Selection Dictionary Automatic Creation Device, Automatic Translation Device, and Medium Recording Those Programs”
[Patent Document 2]
JP 2001-022787 “Multilingual Interactive Information Retrieval System and Storage Medium Recording Multilingual Interactive Information Retrieval Program”
[Non-Patent Document 1]
“Multilingual Information Access System”, Hayashi et al., 2 people, NTT Technical Journal, January 2002, pp.76-80.
[Non-Patent Document 2]
“Searching documents across language barriers”, Kikui, Journal of Japanese Society for Artificial Intelligence, Vol.15, NO.4, pp.550-558.
[Problems to be solved by the invention]
However, even if the user's search request is appropriately translated into the target language in the cross-language information search in which the language used for the query and the language of the search target document are different, the translated search request has in the target language. Appropriate search may not be performed due to the ambiguity of meaning. For example, the word “bank” in Japanese is considered appropriate to be translated as “bank” in English, but the English word “bank” has a meaning other than the meaning equivalent to “bank”. It has meanings such as “bank / embankment” and “storage place”. For this reason, even if the user wants to search for “bank”, as long as the search word “bank” is used, a document including “bank” in these meanings may be searched. Such a problem is often unpredictable for a user who is not familiar with the target language (that is, it cannot be predicted that “bank” has a meaning other than “bank”).
[0005]
The present invention has been made in view of the above points, and provides an information search support method and apparatus and an information search support program that solve a problem related to the semantic ambiguity of a target language of a search request generated by such translation. The purpose is to provide.
[0006]
[Means for Solving the Problems]
FIG. 1 is a diagram for explaining the principle of the present invention.
[0007]
The present invention relates to an information search support method for supporting cross-language information search in which a language (source language) used by a user for a query and a search target language (target language) are different.
The search request analysis means analyzes the search request in the source language input by the user via the user interface means (step 1),
The bilingual dictionary search means searches the bilingual dictionary in which the words in the source language and the bilingual translation of the words are stored in the database (step 2),
In the search word selection list generation means, a plurality of objects including a word of a target language as a key, a meaning of the word of the target language, and a compound word, a collocation, and an example sentence corresponding to the ambiguity of the meaning for each meaning by the language expression searches search suggestions Katariji document stored in the database, generates a search word candidate list in the eye language, via the user interface means, for each meaning in the target language to target language expressions Segment and present to the user (step 3)
The search expression generation means acquires a search word candidate group selected from the search word candidate list by the user, and generates a search expression to be used in the search process from the search word candidate group (step 4).
[0008]
In the information search support method of the present invention, when the search word list generation unit generates the search word candidate list,
Using the target language word contained in the search word candidate dictionary as a key, search the reverse translation dictionary in which the search word candidate and the translation of the search word candidate in the source language are stored in the database. A description in the source language is added to the target language expression included in the search candidate word dictionary .
[0009]
In the information search support method of the present invention, the search engine communication means transmits the search expression generated by the search expression generation means to a search engine that performs a search process using the search expression, and the search engine sends the search result. Is transmitted to the user via the user interface means .
[0010]
FIG. 2 is a principle configuration diagram of the present invention.
[0011]
The present invention is an information search support device for supporting cross-language information search in which a language (source language) used by a user for a query and a search target language (target language) are different,
A bilingual dictionary 410 in which a word in the source language and a bilingual translation of the word are stored in a database;
Using the target language word as a key, the meaning of the target language word and a plurality of target language expressions including compound words, collocations, and example sentences corresponding to the ambiguity of the meaning are stored in the database. A search candidate word dictionary 510 ,
Which receives a search request and the selection input information between the User chromatography The, user interface means 200 for transmitting the selection information and the search result,
A search request analysis unit 300 for analyzing a search request in a source language input by a user via the user interface unit 200;
A bilingual dictionary searching unit 400 that searches the bilingual dictionary 410 based on the search request analyzed by the search request analyzing unit 300;
By searching the search candidate dictionaries 510, generates a search word candidate list in the eye language, via the user interface unit 200, and partition the target language expressions for each meaning in the target language is presented to the user search Word selection list generation means 500;
A search expression generation means 600 for acquiring a search word candidate group selected from a search word candidate list by a user via the user interface means 200 and generating a search expression used in search processing from the search word candidate group. .
[0012]
In addition, the search word list generation means 500 of the information search support apparatus of the present invention includes:
When generating the search word candidate list,
Using the target language word contained in the search word candidate dictionary 510 as a key, the reverse translation dictionary 520 in which the search candidate and the source language corresponding to the search candidate are stored in the database is searched. Means for adding a description in the source language to the target language expression contained in the search candidate word dictionary 510;
[0013]
Further, the information search support apparatus of the present invention transmits the search formula generated by the search formula generation means 600 to a search engine that performs search processing, receives the search result from the search engine, and causes the user interface means 200 to And a search engine communication means for transmitting to the user.
[0014]
The present invention is an information search support program executed in a CPU of a computer in order to support cross-language information search in which a language (source language) used for a query and a search target language (target language) are different.
A search request analyzing step for analyzing a search request in a source language input by a user via a user interface means;
A bilingual dictionary search step for searching a bilingual dictionary in which a word in the source language is used as a key and a bilingual word in the target language corresponding to the word is stored in the database;
Search candidates in which a target language word is used as a key and a plurality of target language expressions including compound words, collocations, and example sentences corresponding to the ambiguity of the word meaning are stored in the database for each meaning of the word in the target language by searching the Katariji document, generates a search word candidate list in the eye language, via the user interface unit, the search word selection list by dividing the target language expressions for each meaning in the target language is presented to the user Generation step;
It includes a search expression generation step of acquiring a search word candidate group selected from the search word candidate list by the user via the user interface means, and generating a search expression used in the search process from the search word candidate group.
[0015]
In the search word list generation step of the information search support program of the present invention, when generating a search word candidate list,
Using the target language word contained in the search word candidate dictionary as a key, search the reverse translation dictionary in which the search word candidate and the translation of the search word candidate in the source language are stored in the database. Adding a description in the source language to the target language expression included in the search candidate word dictionary .
[0016]
The information search support program of the present invention transmits the search formula generated in the search formula generation step to a search engine that performs a search process using the search formula, receives the search result from the search engine, and It further comprises a search engine communication step for transmitting to the user via the interface means .
[0017]
As described above, in the present invention, in a system that supports information retrieval in a language (target language) different from a certain language (source language), there is an ambiguity that the target language has a meaning that is not intended by the user. In this case, a search candidate word corresponding to the meaning of the word or a translation thereof is presented, the user selects an appropriate word, and a search expression is generated in a target language having an appropriate meaning, and the search expression By searching the target language information using the, it becomes possible to perform an appropriate search even if the target language for the translated search request is ambiguous.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0019]
In the following, assuming a cross-language information search between Japanese and English in which a user using Japanese searches for a search target consisting of an English document by an inquiry in Japanese, an inquiry of “bank reconstruction” is taken as an example. Cross language information retrieval will be described.
[0020]
FIG. 3 shows a configuration of a cross-language information search apparatus (information search support apparatus) according to an embodiment of the present invention.
[0021]
The cross language information search apparatus shown in FIG. 1 includes a user interface unit 200, a search request analysis unit 300, a bilingual dictionary search unit 400, a bilingual dictionary 410, a search word selection list generation unit 500, a search candidate word dictionary 510, and a reverse bilingual dictionary 520. , A search expression generation unit 600 and a search engine communication unit 700, and a search engine 710 is connected to the search engine communication unit 700.
[0022]
The bilingual dictionary 410 stores parallel translations corresponding to the source language words using the source language words as keys, and is stored in a storage means such as a database.
[0023]
FIG. 4 shows a configuration example of a bilingual dictionary according to an embodiment of the present invention.
[0024]
The bilingual dictionary 410 shown in the figure records English bilingual words corresponding to the Japanese words with Japanese words as keys. In the example of the figure, it is assumed that “bank” is obtained as a parallel translation for “bank” and “reconstruction” is obtained for “reconstruction”. Such a bilingual dictionary can be constructed based on an existing Japanese-English dictionary or a dictionary in a machine translation system. In the present invention, the method for constructing the bilingual dictionary is not defined.
[0025]
The search candidate word dictionary 510 pre-records search word candidates corresponding to the ambiguity of meaning in the target language of each parallel translation word obtained by parallel translation, and is stored in storage means such as a database.
[0026]
FIG. 5 shows a configuration example of a search candidate word dictionary in one embodiment of the present invention.
[0027]
The search candidate word dictionary 510 shown in the figure includes English words as keys, and the meanings of the English words and a plurality of English expressions (compound words, collocations, example sentences, etc.) related to the meanings for each meaning. Is. Such a search candidate word dictionary 510 can be easily constructed based on an existing English dictionary or concept dictionary, or can be constructed from a set of text data in English by language processing means. (For example, "The automatic construction of faceted terminological feedback for interactive document retrieval", Peter G. Anick, in "Recent Advances in Computational Terminology", John Benjamins Publishing Company, (2001), pp. 29-52). In the present invention, the construction method and the like are not specified.
[0028]
The reverse translation dictionary 520 is a pre-recorded translation of the search candidate in the source language, and is stored in a storage means such as a database.
[0029]
FIG. 6 shows a configuration example of the reverse translation dictionary in one embodiment of the present invention.
[0030]
The reverse translation dictionary 520 shown in FIG. 5 is a dictionary in which an English expression is used as a key and a Japanese translation corresponding to the English expression is recorded. Such a reverse translation dictionary 520 can be easily constructed based on an existing English-Japanese dictionary or a dictionary in a machine translation system. In the present invention, the construction method is not specified.
[0031]
The user interface unit 200 receives input from a user and outputs information to the user.
[0032]
The search request analysis unit 300 analyzes a search request in the source language input by the user via the user interface unit 200.
[0033]
The bilingual dictionary search unit 400 searches the bilingual dictionary 4100 using the search request word analyzed by the search request analysis unit 300 as a key, and obtains bilingual words for the words constituting the input search request.
[0034]
The search word selection list generation unit 500 refers to the search candidate word dictionary 510 and the reverse parallel translation dictionary 520 for each parallel word acquired from the parallel translation dictionary search unit 400, and provides the user with an appropriate word meaning corresponding to the meaning in the target language. A search word selection list for selecting a search word is generated and presented to the user via the user interface unit 200.
[0035]
The search expression generation unit 600 acquires a search word (search word candidate group) designated by the user via the user interface unit 200 and sets a search condition derived from each word in the search request to “AND” or “OR”. ”To create a search expression. The search engine communication unit 700 transmits the search formula generated by the search formula generation unit 600 to the search engine 710, receives the search result from the search engine 710, and presents it to the user via the user interface unit 200.
[0036]
Hereinafter, a series of operations in the above configuration will be described.
[0037]
In the following, for a required combination of the source language and the target language, the bilingual dictionary 410, the search candidate word dictionary 510, the reverse bilingual dictionary 520, and the search engine 710 corresponding to the combination will operate appropriately. Yes, it is not limited to the situation between Japanese and English in the following description.
[0038]
FIG. 7 is a flowchart of the operation in one embodiment of the present invention.
[0039]
Step 101) The search request “bank reconstruction” input by the user is input to the cross-language information search apparatus 100 via the user interface unit 200. The input source language search request (in this example, Japanese) is first transmitted to the search request analysis unit 300.
[0040]
Step 102) It is assumed that the search request unit 300 has a built-in means for decomposing a search request character string into word strings constituting the search request character string. Such a means for dividing into word strings is known as morphological analysis processing (for example, “morpheme, syntax analysis”, Nagata, natural language processing—basics and applications—supervised by Tanaka), IEICE, pp. 2-38), suitable means can be used. In this example, it is analyzed that “bank reconstruction” in the search request is composed of two words “bank” and “reconstruction”. The analyzed result is transmitted to the bilingual dictionary search unit 400.
[0041]
Step 103) The bilingual dictionary search unit 400 searches the bilingual dictionary 410 prepared in advance for the source language used for the search request and the target language (in this example, English) that is the language of the document to be searched. Get bilingual words for the words that make up the search request. The configuration of the bilingual dictionary 410 is as shown in FIG. The obtained bilingual words are transmitted to the search word selection list generation unit 500.
[0042]
Step 104) The search word selection list generation unit 500 refers to the search candidate word dictionary 510 and the reverse parallel translation dictionary 520 for each parallel word sent from the parallel translation dictionary search unit 400, so that the user can select the target word in the target language. A search word selection list for selecting an appropriate search word corresponding to the meaning is generated and sent to the user interface unit 200. The configuration of the search candidate word dictionary 510 is as shown in FIG. 5, and the configuration of the reverse translation dictionary 520 is as shown in FIG.
[0043]
In the search candidate word dictionary 510 of the present invention, it is assumed that there are three meanings for “bank”, as shown in FIG. When a plurality of meanings exist in this way, it is assumed that the user's search intention is one of these. In addition, it is desirable to perform the search comprehensively using as many search terms as possible as long as the search terms correspond to meanings that match the intention. Therefore, the selection list generated by the search word selection list generation unit 500 is conceptually described as shown in FIG.
[0044]
FIG. 8 is a diagram for conceptually explaining the selection list generated by the search word selection list generation unit in the embodiment of the present invention. In the figure, there are three meanings for "bank", and the user can select one meaning among them and select a plurality of English expressions related to the selected meaning as search term candidates. Is shown. Further, since there is only one meaning for “reconstruction”, it is possible to select a plurality of search word candidates corresponding to this meaning.
[0045]
The search word selection list generation unit 500 generates such a selection list as a screen for presenting to the user, and presents it to the user via the user interface unit 200. Here, if there is an entry in the reverse translation dictionary 520 by searching the reverse translation dictionary 520 using the English expression included in the search candidate word dictionary 510 as a key, the English expression recorded in the search candidate word dictionary 510 On the other hand, it is possible to add a description in Japanese which is the user's original language.
[0046]
FIG. 9 is an example of a selection list presented to the user in one embodiment of the present invention. The screen shown in the figure is in the HTML format that is used on the Internet as a standard, and such a screen can be easily configured. In the example shown in the figure, options to be selected by the user are represented in the form of check boxes. In addition, Japanese explanation by the reverse translation dictionary 520 is given in parentheses for each search word candidate.
[0047]
Step 105) The user interface unit 200 presents a search word selection list to the user. Thus, the user can specify a search word in English corresponding to the search intention using a check box on the selection screen as shown in FIG.
[0048]
FIG. 10 shows an example of designation of the user in the selection list according to the embodiment of the present invention. The user has the intended meaning “financial institute” for “bank”, and specifies that “World Bank” and “Tajikistan” are selected as search terms. In addition, “reconstruction” is selected for “reconstruction”.
[0049]
As described above, the search term designated by the user is transmitted to the search expression generation unit 600 via the user interface unit 200.
[0050]
Step 106) The search expression generation unit 600 integrates the search conditions derived from each word of the search term specified by the user input from the user interface unit 200 by “AND” or “OR” conditions. In the following description, it is assumed that integration is performed according to the “AND” condition. Which of these is selected is set in the system in advance or specified by the user. The search condition derived from each word is obtained by combining the English expressions related to the selected meaning with the “OR” condition.
[0051]
Through the above processing, the search expression generation unit 600
((“World Bank” or “Tajikistan”)) and “reconstruction”)
Is generated and transmitted to the search engine communication unit 700.
[0052]
Step 107) The search engine communication unit 700 transmits the search formula transmitted from the search formula generation unit 600 to the search engine 710 and acquires the search result from the search engine 710. The received search result is presented to the user via the user interface unit 200.
[0053]
In the above search process, the user knows that there is a meaning other than “bank” in “bank”, which is the English translation of the word “bank” in Japanese. It is possible to know English expressions related to meaning as search candidates, and by using these for search, it is possible to perform cross-language information search with high accuracy adapted to the search intention.
[0054]
It is also possible to construct the above operation as a program and install it on a computer used as a cross-language information search device (information search support device) from a communication line or a recording medium, or distribute it via a network. .
[0055]
Further, the constructed program is stored in a hard disk device connected to a computer used as a cross-language information retrieval device (information retrieval support device), a portable storage medium such as a flexible disk, a CD-ROM, etc. It is also possible to install when carrying out the invention.
[0056]
The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
[0057]
【The invention's effect】
As described above, according to the present invention, even if a user's search request is appropriately translated into the target language, an appropriate search is performed due to the ambiguity of the meaning of the translated search request in the target language. It is possible to overcome the problem that there is no possibility and to construct a search expression in the target language that conforms to the meaning corresponding to the user's intention. Therefore, the search in the target language corresponding to the meaning intended by the user can be executed without special knowledge in the target language.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining the principle of the present invention.
FIG. 2 is a principle configuration diagram of the present invention.
FIG. 3 is a configuration diagram of a cross language information retrieval apparatus according to an embodiment of the present invention.
FIG. 4 is a configuration example of a bilingual dictionary according to an embodiment of the present invention.
FIG. 5 is a configuration example of a search candidate word dictionary according to an embodiment of the present invention.
FIG. 6 is a configuration example of a reverse translation dictionary according to an embodiment of the present invention.
FIG. 7 is a flowchart of the operation according to the embodiment of the present invention.
FIG. 8 is a diagram for explaining the concept of a selection list generated by a search word selection list generation unit according to an embodiment of the present invention.
FIG. 9 is an example of a selection list presented to the user according to the embodiment of the present invention.
FIG. 10 is an example of designation of a user in a selection list according to an embodiment of the present invention.
[Explanation of symbols]
100 Cross Language Information Retrieval Device 200 User Interface Unit, User Interface Unit 300 Search Request Analysis Unit, Search Request Analysis Unit 400 Bilingual Dictionary Search Unit, Bilingual Dictionary Search Unit 410 Bilingual Dictionary 500 Search Word Selection List Generation Unit, Search Word Selection List Generation Unit 510 Search Candidate Dictionary 520 Reverse Translation Dictionary 600 Search Formula Generation Means, Search Formula Generation Unit 700 Search Engine Communication Unit 710 Search Engine

Claims (9)

ユーザが問い合わせに用いる言語(原言語)と検索対象の言語(目的言語)が異なるクロス言語情報検索を支援するための情報検索支援方法において、
検索要求解析手段において、ユーザインタフェース手段を介して、ユーザから入力された原言語による検索要求を解析し、
対訳辞書検索手段において、原言語における単語と該単語の対訳がデータベースに格納されている対訳辞書を検索し、
検索語選択リスト生成手段において、目的言語の単語をキーとし、該目的言語の単語の持つ語義と、該語義毎に、該語義の曖昧性に対応する複合語、連語、例文を含む複数の目的言語表現とがデータベースに格納されている検索候補語辞書を検索することにより、目的言語における検索語候補リストを生成し、前記ユーザインタフェース手段を介して、目的言語表現を目的言語の語義毎に区分けして該ユーザに提示し、
検索式生成手段において、前記ユーザによって前記検索語候補リストから選択された検索語候補群を取得し、該検索語候補群から、検索処理で使用する検索式を生成する
ことを特徴とする情報検索支援方法。
In an information search support method for supporting cross-language information search in which a user uses a query language (source language) and a search target language (target language) are different,
In the search request analysis means, the search request in the source language input by the user is analyzed via the user interface means,
The bilingual dictionary search means searches for a bilingual dictionary in which a word in the source language and a bilingual translation of the word are stored in a database;
In the search word selection list generation means, a plurality of objects including a word of a target language as a key, a meaning of the word of the target language, and a compound word, a collocation, and an example sentence corresponding to the ambiguity of the meaning for each meaning by the language expression searches search suggestions Katariji document stored in the database, generates a search word candidate list in the eye language, via the user interface means, each meaning in the target language to target language expressions And present it to the user,
In the search expression generation means, a search word candidate group selected from the search word candidate list by the user is acquired, and a search expression used in search processing is generated from the search word candidate group. Support method.
前記検索語リスト生成手段において、前記検索語候補リストを生成する際に、
前記検索語候補辞書に含まれる目的言語の単語をキーとして、検索語候補と該検索語候補の原言語における訳語とがデータベースに格納されている逆対訳辞書を検索し、エントリが存在すれば、該検索候補語辞書に含まれる目的言語表現に対して原言語による説明を付加する請求項1記載の情報検索支援方法。
In the search word list generation means, when generating the search word candidate list,
Using the target language word included in the search word candidate dictionary as a key, search the reverse translation dictionary in which the search word candidate and the translation word in the source language of the search word candidate are stored in the database, and if there is an entry, The information search support method according to claim 1, wherein a description in a source language is added to a target language expression included in the search candidate word dictionary.
検索エンジン通信手段において、前記検索式生成手段で生成された前記検索式を、検索式を用いて検索処理を行う検索エンジンに送信し、該検索エンジンから検索結果を受信して、前記ユーザインタフェース手段を介して前記ユーザに送信する請求項1または2記載の情報検索支援方法。In the search engine communication means, the search expression generated by the search expression generation means is transmitted to a search engine that performs search processing using the search expression, and a search result is received from the search engine, and the user interface means claim 1 or 2 the method of information retrieval support according transmits to the user via the. ユーザが問い合わせに用いる言語(原言語)と検索対象の言語(目的言語)が異なるクロス言語情報検索を支援するための情報検索支援装置であって、
原言語における単語と該単語の対訳とがデータベースに格納されている対訳辞書と、
目的言語の単語をキーとし、該目的言語の単語の持つ語義と、該語義毎に、該語義の曖昧性に対応する複合語、連語、例文を含む複数の目的言語表現とがデータベースに格納されている検索候補語辞書と
ーザとの間で検索要求及び選択入力情報とを受信すると共に、選択情報及び検索結果を送信するユーザインタフェース手段と、
ユーザインタフェース手段を介して、ユーザから入力された原言語による検索要求を解析する検索要求解析手段と、
前記検索要求解析手段で解析された検索要求に基づいて前記対訳辞書を検索する対訳辞書検索手段と、
前記検索候補語書を検索することにより、目的言語における検索語候補リストを生成し、前記ユーザインタフェース手段を介して、目的言語表現を目的言語の語義毎に区分けして該ユーザに提示する検索語選択リスト生成手段と、
前記ユーザインタフェース手段を介して前記ユーザによって前記検索語候補リストから選択された検索語候補群を取得し、該検索語候補群から検索処理で使用する検索式を生成する検索式生成手段と、を有する
ことを特徴とする情報検索支援装置。
An information search support device for supporting cross-language information search in which a user uses a query language (source language) and a search target language (target language) are different.
A bilingual dictionary in which a word in the source language and a translation of the word are stored in a database;
Using the target language word as a key, the meaning of the target language word and a plurality of target language expressions including compound words, collocations, and example sentences corresponding to the ambiguity of the meaning are stored in the database. Search candidate word dictionary ,
Which receives a search request and the selection input information between the User chromatography THE, a user interface means for transmitting the selection information and the search result,
Search request analysis means for analyzing a search request in a source language input by a user via a user interface means;
Bilingual dictionary search means for searching the bilingual dictionary based on the search request analyzed by the search request analyzing means;
By searching the search candidate dictionaries, it generates a search word candidate list in the eye language, via the user interface means, by dividing the target language expressions for each meaning in the target language is presented to the user search A word selection list generating means;
A search expression generation means for acquiring a search word candidate group selected from the search word candidate list by the user via the user interface means, and generating a search expression to be used in a search process from the search word candidate group; An information search support apparatus comprising:
前記検索語リスト生成手段は、
前記検索語候補リストを生成する際に、
前記検索語候補辞書に含まれる目的言語の単語をキーとして、前記検索候補と該検索候補に対応する原言語とがデータベースに格納されている逆対訳辞書を検索し、エントリが存在すれば、該検索候補語辞書に含まれる目的言語表現に対して原言語による説明を付加する手段を含む請求項4記載の情報検索支援装置。
The search word list generation means includes:
When generating the search word candidate list,
Using the target language word contained in the search word candidate dictionary as a key, the reverse translation dictionary in which the search candidate and the source language corresponding to the search candidate are stored in a database is searched, and if there is an entry, 5. The information search support device according to claim 4, further comprising means for adding a description in the source language to the target language expression included in the search candidate word dictionary.
前記検索式生成手段で生成された前記検索式を、検索処理を行う検索エンジンに送信し、該検索エンジンから検索結果を受信して、前記ユーザインタフェース手段を介して前記ユーザに送信する検索エンジン通信手段を、更に有する請求項4または5記載の情報検索支援装置。Search engine communication that transmits the search formula generated by the search formula generation means to a search engine that performs search processing, receives search results from the search engine, and transmits the search results to the user via the user interface means The information search support apparatus according to claim 4 or 5 , further comprising means. ユーザが問い合わせに用いる言語(原言語)と検索対象の言語(目的言語)が異なるクロス言語情報検索を支援するため、コンピュータのCPUにおいて実行される情報検索支援プログラムであって、
ユーザインタフェース手段を介して、ユーザから入力された原言語による検索要求を解析する検索要求解析ステップと、
原言語の単語をキーとし、該単語に対応する目的言語の対訳語とがデータベースに格納されている対訳辞書を検索する対訳辞書検索ステップと、
目的言語の単語をキーとし、該目的言語の単語の持つ語義毎に、該語義の曖昧性に対応する複合語、連語、例文を含む複数の目的言語表現とがデータベースに格納されている検索候補語辞書を検索することにより、目的言語における検索語候補リストを生成し、前記ユーザインタフェース手段を介して、目的言語表現を目的言語の語義毎に区分けして該ユーザに提示する検索語選択リスト生成ステップと、
前記ユーザインタフェース手段を介して前記ユーザによって前記検索語候補リストから選択された検索語候補群を取得し、該検索語候補群から、検索処理で使用する検索式を生成する検索式生成ステップと、からなることを特徴とする情報検索支援プログラム。
An information search support program executed in a CPU of a computer in order to support cross-language information search in which a user uses a query language (source language) and a search target language (target language) are different.
A search request analyzing step for analyzing a search request in a source language input by a user via a user interface means;
A bilingual dictionary search step for searching a bilingual dictionary in which a word in the source language is used as a key and a bilingual word in the target language corresponding to the word is stored in the database;
Search candidates in which a target language word is used as a key and a plurality of target language expressions including compound words, collocations, and example sentences corresponding to the ambiguity of the word meaning are stored in the database for each meaning of the word in the target language by searching the Katariji document, it generates a search word candidate list in the eye language, via the user interface unit, the search word selection which is divided for each meaning in the target language is presented to the user the target language expressions A list generation step;
A search expression generation step of acquiring a search word candidate group selected from the search word candidate list by the user via the user interface means, and generating a search expression used in search processing from the search word candidate group; An information search support program characterized by comprising:
前記検索語リスト生成ステップにおいて、前記検索語候補リストを生成する際に、
前記検索語候補辞書に含まれる目的言語の単語をキーとして、検索語候補と該検索語候補の原言語における訳語とがデータベースに格納されている逆対訳辞書を検索し、エントリが存在すれば、該検索候補語辞書に含まれる目的言語表現に対して原言語による説明を付加するステップを含む請求項7記載の情報検索支援プログラム。
In the search word list generation step, when generating the search word candidate list,
Using the target language word included in the search word candidate dictionary as a key, search the reverse translation dictionary in which the search word candidate and the translation word in the source language of the search word candidate are stored in the database, and if there is an entry, The information search support program according to claim 7, further comprising a step of adding a description in the source language to the target language expression included in the search candidate word dictionary.
前記検索式生成ステップで生成された前記検索式を、検索式を用いて検索処理を行う検索エンジンに送信し、該検索エンジンから検索結果を受信して、前記ユーザインタフェース手段を介して前記ユーザに送信する検索エンジン通信ステップを更に有する請求項7または8記載の情報検索支援プログラム。The search formula generated in the search formula generation step is transmitted to a search engine that performs a search process using the search formula, receives a search result from the search engine, and sends the search result to the user via the user interface means. The information search support program according to claim 7 or 8 , further comprising a search engine communication step of transmitting.
JP2002314875A 2002-10-29 2002-10-29 Information search support method and apparatus, and information search support program Expired - Fee Related JP4140343B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002314875A JP4140343B2 (en) 2002-10-29 2002-10-29 Information search support method and apparatus, and information search support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002314875A JP4140343B2 (en) 2002-10-29 2002-10-29 Information search support method and apparatus, and information search support program

Publications (2)

Publication Number Publication Date
JP2004151881A JP2004151881A (en) 2004-05-27
JP4140343B2 true JP4140343B2 (en) 2008-08-27

Family

ID=32459069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002314875A Expired - Fee Related JP4140343B2 (en) 2002-10-29 2002-10-29 Information search support method and apparatus, and information search support program

Country Status (1)

Country Link
JP (1) JP4140343B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5279129B2 (en) * 2009-02-27 2013-09-04 日本電信電話株式会社 Cross-language information search system and cross-language information search method
JP6242226B2 (en) * 2014-02-04 2017-12-06 有限会社ティ辞書企画 SEARCH DEVICE, SEARCH METHOD, AND PROGRAM
CN112989178B (en) * 2019-12-13 2023-10-27 百度在线网络技术(北京)有限公司 Searching method, searching device, searching equipment and storage medium

Also Published As

Publication number Publication date
JP2004151881A (en) 2004-05-27

Similar Documents

Publication Publication Date Title
JP5243167B2 (en) Information retrieval system
CA2458138C (en) Methods and systems for language translation
JP4504555B2 (en) Translation support system
KR101130444B1 (en) System for identifying paraphrases using machine translation techniques
US7672831B2 (en) System and method for cross-language knowledge searching
JP4173774B2 (en) System and method for automatic retrieval of example sentences based on weighted edit distance
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
WO2005059771A1 (en) Translation judgment device, method, and program
JPH10198680A (en) Distributed dictionary managing method and machine translating method using the method
US20090094019A1 (en) Efficiently Representing Word Sense Probabilities
JP2004118740A (en) Question answering system, question answering method and question answering program
US8229970B2 (en) Efficient storage and retrieval of posting lists
JP2006343925A (en) Related-word dictionary creating device, related-word dictionary creating method, and computer program
JP4140343B2 (en) Information search support method and apparatus, and information search support program
JP4401269B2 (en) Parallel translation judgment device and program
JP5279129B2 (en) Cross-language information search system and cross-language information search method
Balakrishnan et al. Digital library of India: a testbed for Indian language research
JP2003323425A (en) Parallel translation dictionary creating device, translation device, parallel translation dictionary creating program, and translation program
JP5148583B2 (en) Machine translation apparatus, method and program
JP2008140204A (en) Data retrieval system and program
JP5909123B2 (en) Machine translation apparatus, machine translation method and program
JP4368550B2 (en) Document search apparatus, document search method, and program causing computer to execute the method
US20230409620A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system
Palani Statistical Machine Translation of English Text to API Code Usages: A comparison of Word Map, Contextual Graph Ordering, Phrase-based, and Neural Network Translations
JP3906820B2 (en) Translation support apparatus and translation support program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees