JP2005011138A - 多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラム - Google Patents
多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラム Download PDFInfo
- Publication number
- JP2005011138A JP2005011138A JP2003175784A JP2003175784A JP2005011138A JP 2005011138 A JP2005011138 A JP 2005011138A JP 2003175784 A JP2003175784 A JP 2003175784A JP 2003175784 A JP2003175784 A JP 2003175784A JP 2005011138 A JP2005011138 A JP 2005011138A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- language
- translation
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】ユーザの用いる言語とは異なる言語の文書を、キーワード選択や、選んだキーワードの訳語の多さによる検索精度の低下に悩まされることなく、的確に検索する。
【解決手段】複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索するために、ある言語で表現された文書が出力手段を介してユーザに提示されている状態において、範囲指定手段によりユーザからの該文書の範囲指定が行われると(S11)、指定範囲を翻訳手段より翻訳し(S15)、翻訳された翻訳結果に基づいて情報検索式生成手段により情報検索式を生成し(S19)、生成された情報検索式に基づいて情報検索手段より検索を行い(S20)、該検索式による検索結果をそのまま、あるいは検索結果翻訳手段により翻訳して(S24)検索結果表示手段によりユーザに提示する(S25)。これにより、ユーザは得意な言語を主に運用しながら、キーワード選択や、選んだキーワードの訳語の多さによる検索精度の低下に悩まされることなく、異なる言語における適合文書を効率的に検索することができる。
【選択図】図2
【解決手段】複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索するために、ある言語で表現された文書が出力手段を介してユーザに提示されている状態において、範囲指定手段によりユーザからの該文書の範囲指定が行われると(S11)、指定範囲を翻訳手段より翻訳し(S15)、翻訳された翻訳結果に基づいて情報検索式生成手段により情報検索式を生成し(S19)、生成された情報検索式に基づいて情報検索手段より検索を行い(S20)、該検索式による検索結果をそのまま、あるいは検索結果翻訳手段により翻訳して(S24)検索結果表示手段によりユーザに提示する(S25)。これにより、ユーザは得意な言語を主に運用しながら、キーワード選択や、選んだキーワードの訳語の多さによる検索精度の低下に悩まされることなく、異なる言語における適合文書を効率的に検索することができる。
【選択図】図2
Description
【0001】
【発明の属する技術分野】
本発明は、複数の言語を対象としてある言語から目的とする他の言語の文書を検索する多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラムに関する。
【0002】
【従来の技術】
ある言語Aを用いて情報を得ているユーザが、当該言語Aで表現された文書Xについて、使い慣れない言語Bで表現された類似文書を文書群中から検索したい場合がある。これには、例えば、言語Aで表現された文書Xの情報元が言語Bの使用圏であり、文書Xの内容についての詳細情報が言語Bで表現された文書として存在することが推定できることから、そうした言語Bによる関連文書を入手したい場合などがある。また、言語Aで書かれた文書から言語Bによる翻訳文書を作成したい場合において、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合なども挙げられる。従来、そうした場合において、極力言語Bを使わずに言語Aの使用で済ませる実現方法としては、文書Xの中から言語Aによるキーワードを選び出して言語Bに翻訳し、この言語Bによるキーワードを用いて言語Bで表現された文書を文書群から検索する方法がある。ただし、この方法においては、文書Aに含まれる語句のうちのどれをキーワードとして用いたらよいかユーザが悩むことがある上に、通常は1〜3語という検索要求キーワードを翻訳するにあたっては、単語が持つ複数の訳語の中から訳語を絞り込むには情報が足りないために、的確な翻訳を行うには困難な点があり、さらに、このような少ない数のキーワードでは情報検索のための情報としても不十分で、検索結果の文書群にはユーザが目的としない無駄な文書がたくさん含まれてしまうという問題点がある。
【0003】
このような問題を解決する方法として、例えば、特開2001−22787号公報には、ユーザの初期情報要求に基づいて、先ず、ある言語の複数の単語を用いた情報検索式を生成し、その情報検索式により文書を検索して、ユーザの情報要求に適合した文書を指定させ、その適合文書から特徴的な単語を抽出して翻訳すべき単語リストを生成し、この単語リストを指定した他の言語に翻訳し、この指定言語に翻訳した翻訳言語を用いて指定言語の文書を検索することが記載されている。
【0004】
【特許文献1】
特開2001−22787号公報
【0005】
【発明が解決しようとする課題】
しかしながら、前記文献記載の検索方法によれば、初期の検索要求の情報量は依然として少ないために、初期の検索結果には多量の文書が含まれている場合があり、そうした多量の文書の中から適合文書をユーザが選択する上で困難な場合がある。また初期の検索要求としてどういう語を選べばよいかユーザが悩む点については、この方法では解決されない。
以上のように、従来の技術では、ユーザが、言語の違いや検索要求に使用する語句の選択について頭を悩ますことなく、異なる言語間における類似内容文書を効率的に検索するには不十分であった。
【0006】
本発明は、上記事情に鑑みてなされたものであり、その目的とするところは、異なる言語における類似文書を、ユーザが言語の違いや検索要求の選択に頭を悩ませることなく、的確に検索することができる多言語情報検索システム、多言語情報検索方法及び多言語情報検索プログラムを提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、請求項1に記載の多言語情報検索システムは、複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索する多言語情報検索システムにおいて、ある言語及び/または他の言語の文書を出力提示する出力手段と、前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定手段と、指定された範囲の文書の言語を他の言語に翻訳する翻訳手段と、前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成手段と、前記情報検索式に基づいて他の言語の文書を検索する情報検索手段とを有することを特徴としている。
【0008】
請求項1に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語の文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。翻訳された翻訳結果に基づいて、情報検索式生成手段により、前記指定された範囲の文書と類似の文書を検索するための情報検索式が生成される。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0009】
これにより、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0010】
請求項2に記載の多言語情報検索システムは、前記情報検索式生成手段が、前記翻訳手段により得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴とするものである。
【0011】
請求項2に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。その際に、翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式生成手段により情報検索式が生成される。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0012】
請求項3に記載の多言語情報検索システムは、前記翻訳手段により得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、前記情報検索式生成手段が、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成するように構成されていることを特徴とするものである。
【0013】
請求項3に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。その際に、翻訳手段により得られる翻訳結果に含まれる情報が記憶手段に記憶されるが、そのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて情報検索式を生成するようにあらかじめ設定されており、情報検索式生成手段では、その設定に基づいて情報検索式を自動生成する。これにより、ユーザが情報検索式について考慮する手間を経ずに検索することが可能となる。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0014】
請求項4に記載の多言語情報検索システムは、前記翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定手段を備え、前記情報検索式生成手段が、前記属性指定手段によって指定した属性情報に基づいて情報検索式を生成することを特徴としている。
【0015】
請求項4に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。その際に、翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を情報検索式に用いるようにユーザが属性指定手段を介して指定する。情報検索式生成手段では、ユーザが指定した属性情報に基づいて情報検索式を生成する。これにより、ユーザは自分の望む属性情報を用いて情報検索式を生成することが可能となる。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0016】
請求項5に記載の多言語情報検索システムは、情報検索手段によって検索された検索結果を表示する検索結果表示手段を備えたことを特徴としている。
【0017】
請求項5に記載の多言語情報検索システムにおいては、情報検索手段によって検索された検索結果が、検索結果表示手段に表示される。
【0018】
請求項6に記載の多言語情報検索システムは、情報検索手段により検索された検索結果の表示言語の指定を行うことができる言語指定手段と、前記検索結果を翻訳する検索結果翻訳手段とを備え、前記検索結果表示手段は、ユーザの前記言語指定手段による指定に基づいて、前記検索結果をそのままの言語で、あるいは前記検索結果翻訳手段により異なる言語に翻訳してから表示することを特徴としている。
【0019】
請求項6に記載の多言語情報検索システムにおいては、ユーザが、情報検索手段により検索された検索結果の表示言語の指定を言語指定手段を介して行う。ユーザの指定が前記検索結果の言語のままであれば、前記検索結果を翻訳せずに検索結果表示手段に表示する。ユーザの指定が前記検索結果の言語と異なる場合は、前記検索結果を検索結果翻訳手段により翻訳した後で、検索結果表示手段に表示する。これにより、ユーザは、検索結果の内容をユーザの得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0020】
請求項7に記載の多言語情報検索方法は、複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索する多言語情報検索方法において、ある言語及び/または他の言語の文書を出力提示する出力工程と、前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定工程と、指定された範囲の文書の言語を他の言語に翻訳する翻訳工程と、前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成工程と、前記情報検索式に基づいて他の言語の文書を検索する情報検索工程と
を有することを特徴としている。
【0021】
請求項7に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語の文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。翻訳された翻訳結果に基づいて、情報検索式生成工程により、前記指定された範囲の文書と類似の文書を検索するための情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0022】
請求項8に記載の多言語情報検索方法は、前記情報検索式生成工程が、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴としている。
【0023】
請求項8に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式生成工程により情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0024】
請求項9に記載の多言語情報検索方法は、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、前記情報検索式生成工程は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成することを特徴としている。
【0025】
請求項9に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程により得られる翻訳結果に含まれる情報が記憶手段に記憶されるが、そのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて情報検索式を生成するようにあらかじめ設定されており、情報検索式生成工程では、その設定に基づいて情報検索式を自動生成する。これにより、ユーザが情報検索式について考慮する手間を経ずに検索することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0026】
請求項10に記載の多言語情報検索方法は、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定工程を備え、前記情報検索式生成工程は、前記属性指定工程において指定した属性情報に基づいて情報検索式を生成することを特徴としている。
【0027】
請求項10に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を情報検索式に用いるようにユーザが属性指定工程を介して指定する。情報検索式生成工程では、ユーザが指定した属性情報に基づいて情報検索式を生成する。これにより、ユーザは自分の望む属性情報を用いて情報検索式を生成することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0028】
請求項11に記載の多言語情報検索方法は、前記情報検索工程において検索された検索結果を表示する検索結果表示工程を備えたことを特徴としている。
【0029】
請求項11に記載の多言語情報検索方法においては、情報検索工程によって検索された検索結果が検索結果表示手段に表示される。
【0030】
請求項12に記載の多言語情報検索方法は、前記情報検索工程において検索された検索結果の表示言語の指定を行うことができる言語指定工程と、前記検索結果を指定された言語に翻訳する検索結果翻訳工程とを備え、前記検索結果表示工程は、前記言語指定工程による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳工程により翻訳して表示することを特徴としている。
【0031】
請求項12に記載の多言語情報検索方法においては、ユーザが、情報検索工程により検索された検索結果の表示言語の指定を言語指定工程を介して行う。ユーザの指定が前記検索結果の言語のままであれば、前記検索結果を翻訳せずに検索結果表示工程により表示する。ユーザの指定が前記検索結果の言語と異なる場合は、前記検索結果を検索結果翻訳工程により翻訳した後で、検索結果表示工程により表示する。これにより、ユーザは、前記検索結果の内容をユーザの得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0032】
請求項13に記載の多言語情報検索プログラムは、複数の言語を対象としてある言語の文書から目的とする他の言語の文書の検索をコンピュータに実行させる多言語情報検索プログラムにおいて、ある言語及び/または他の言語の文書を出力提示する出力工程と、前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定工程と、指定された範囲の文書の言語を他の言語に翻訳する翻訳工程と、前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成工程と、前記情報検索式に基づいて他の言語の文書を検索する情報検索工程とをコンピュータに実行させることを特徴としている。
【0033】
請求項13に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語の文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。翻訳された翻訳結果に基づいて、情報検索式生成工程により、前記指定された範囲の文書と類似の文書を検索するための情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0034】
請求項14に記載の多言語情報検索プログラムは、前記情報検索式生成工程は、前記翻訳機能において得られる翻訳結果に含まれるのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴としている。
【0035】
請求項14に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式生成工程により情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0036】
請求項15に記載の多言語情報検索プログラムは、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、前記情報検索式生成工程は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成することを特徴としている。
【0037】
請求項15に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程により得られる翻訳結果に含まれる情報が記憶手段に記憶されるが、そのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて情報検索式を生成するようにあらかじめ設定されており、情報検索式生成工程では、その設定に基づいて情報検索式を自動生成する。これにより、ユーザが情報検索式について考慮する手間を経ずに検索することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0038】
請求項16に記載の多言語情報検索プログラムは、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定工程を備え、前記情報検索式生成工程は、前記属性指定工程において指定した属性情報に基づいて情報検索式を生成することを特徴としている。
【0039】
請求項16に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を情報検索式に用いるようにユーザが属性指定工程を介して指定する。情報検索式生成工程では、ユーザが指定した属性情報に基づいて情報検索式を生成する。これにより、ユーザは自分の望む属性情報を用いて情報検索式を生成することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0040】
請求項17に記載の多言語情報検索プログラムは、前記情報検索工程において検索された検索結果を表示する検索結果表示工程を備えたことを特徴としている。
【0041】
請求項17に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、情報検索工程によって検索された検索結果が検索結果表示手段に表示される。
【0042】
請求項18に記載の多言語情報検索プログラムは、前記情報検索工程において検索された検索結果の表示言語の指定を行うことができる言語指定工程と、前記検索結果を指定された言語に翻訳する検索結果翻訳工程とを備え、
前記検索結果表示工程は、前記言語指定工程による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳工程により翻訳して表示することを特徴としている。
【0043】
請求項18に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、情報検索工程により検索された検索結果の表示言語の指定を言語指定工程を介して行う。ユーザの指定が前記検索結果の言語のままであれば、前記検索結果を翻訳せずに検索結果表示工程により表示する。ユーザの指定が検索結果の言語と異なる場合は、前記検索結果を検索結果翻訳工程により翻訳した後で、検索結果表示工程により表示する。これにより、ユーザは、前記検索結果の内容をユーザの得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0044】
【発明の実施の形態】
以下に、本発明を具体化した一実施の形態に係る多言語情報検索システムについて図面を参照して説明する。
【0045】
図1は本発明の一実施の形態に係る多言語情報検索システムのシステム構成を示すブロック図である。クライアント端末10は、ネットワーク20(例えばインターネットなど)を介して情報検索装置30と接続されている。情報検索装置30は、検索手段としての検索エンジンを内部に有しており、ネットワーク20を介して各地に存在する文書群40を検索することが可能になっている。
【0046】
クライアント端末10において、入力部15は、ユーザが、ある文書において得たい情報に関連した範囲を指定する範囲指定手段、検索式に用いる属性情報を指定するための属性指定手段、および検索結果の表示言語を指定する言語指定手段として機能する手動操作可能なキーボードやマウス等である。出力部16は、複数の言語のある言語の文書、あるいは同時に複数の言語の文書を出力提示する出力手段、および検索結果を表示する検索結果表示手段として機能し、画面表示によって提示するCRTや、印刷出力するプリンタ等である。入力部15および出力部16は、装置全体を制御するためのCPU11にI/O制御部を介して接続されている。制御プログラムや辞書などを格納するROM12は、CPU11と接続され、各種処理を行うためのプログラムを格納した制御部12−10と、翻訳手段として機能するプログラムを格納した翻訳部12−20とを備えている。CPU11は、ROM12内の制御プログラムに基づいて、クライアント端末10全体の制御を行う。尚、翻訳手段は、内蔵のものに限らず、例えば、外部の翻訳サーバであってもよい。外部の翻訳手段に翻訳を依頼する場合は、翻訳依頼を、翻訳対象のテキスト共に外部翻訳手段に上記ネットワーク20を介して送り、外部翻訳手段に翻訳してもらい、その翻訳結果を受け取る。
【0047】
制御部12−10には、出力部16に対する表示を制御するためのプログラムを格納した表示制御部12−12や、情報検索式生成手段として機能するプログラムを格納した検索式制御部12−13等が組み込まれている。
【0048】
上記翻訳部12−20は、日本語、英語、ドイツ語、フランス語等の予定された複数の言語のそれぞれの文書を翻訳するためにシステムが予め用意した辞書を格納した翻訳辞書としての辞書部12−21と、辞書情報を参照しながら翻訳を進めるための文法ルールを格納した文法部12−22とを備えている。
【0049】
さらに、外部記憶装置14は、I/O制御部を介してCPU11と接続され、使用者が希望に応じて用意する専門用語辞書や、使用者が翻訳結果に反映させるために自ら作成するユーザ辞書等を格納する。
【0050】
記憶手段としてのRAM13は、ROM12に格納された制御プログラムを実行する際に、ワークエリアなどとして使用される。RAM13は、CPU11に接続され、入力されたある言語の文章を記憶するための入力文保存領域13−10と、翻訳結果を記憶するための出力文保存領域13−20と、ワークエリア13−30とを備えている。出力文保存領域13−20は、属性記憶手段としての役割も持つ。
【0051】
情報検索装置30において、入力部35および出力部36は、装置全体を制御するためのCPU31にI/O制御部を介して接続されている。ROM32は、CPU31と接続され、各種処理を行うためのプログラムを格納した制御部32−10を有する。制御部32−10には、出力部32に対する表示を制御するためのプログラムを格納した表示制御部32−12、検索を制御するためのプログラムを格納した検索制御部32−13が組み込まれている。RAM33は、CPU31に接続され、入力された検索式を記憶するための検索式保存領域33−10や、検索結果を記憶するための検索結果保存領域33−20や、ワークエリア13−30等からなる。
【0052】
以下に、本発明の一実施の形態に係る多言語情報検索システムの動作について図2を参照して説明する。図2は、本発明の一実施形態の多言語情報検索システムの動作を示すフローチャートである。
【0053】
先ず、ユーザは、日本語等のある言語の文書を対象としてこの文書を出力部16(CRT)に表示し、得たい情報に関連した内容が記載された範囲をマークするための範囲指定を入力部15においてマウス等で入力する(S11)。続いて、入力部を操作して、指定した範囲について翻訳するように指定すると(S12:YES)、表示制御部12−12の制御に基づいて出力部16(CRT)に「どの言語に翻訳するかを指定しますか?」という問い画面が表示される((図3(a)参照)。この状態で、ユーザが言語を指定するように選択すると(S13:YES)、続いて、言語を選択する画面が現れるので(図3(b)参照)、その画面に従ってユーザはどの言語に翻訳するかを選択することができる(S14)。ユーザがどの言語に翻訳するかを指定しなければ(S13:NO)、予め設定された所定の言語に決定される(S13a)。
【0054】
次に、ユーザが範囲指定した部分の翻訳処理(図2のS15)における詳細について、図4のフローチャートを参照しながら説明する。
【0055】
ここでは一例として、ユーザが日本語の文書を範囲指定した場合を挙げて説明する。翻訳対象文書における範囲指定を入力部15から行い、翻訳実行の指示を与えると、制御部12−10によって、与えられた日本文が1文の時は、その文が文法部12−22に送られ(S201:YES)、翻訳処理がなされる。与えられた日本文が複数ある時は(S201:NO)、制御部によって1文ずつに区切られ(S202)、その一文毎に文法部12−22に送られる。
【0056】
ここで、翻訳対象として与えられた日本文が図5(a)に示した文書であるとする。例えば、図5(a)における下線部の部分をユーザが範囲指定した場合、日本文は複数あるので(S201:NO)、制御部12−10によって1文毎に区切られ(S202)、その結果、最初の文である、「米価の上昇は私達の生活に大きく影響するでしょう。」から順に文法部12−22に送られる。この文法部12−22において、日本文から英文への翻訳が行われるが、既知の技術であるので、詳細な説明は省く。
【0057】
文法部では、先ず、日本文の構造を解析する(S203)。この過程で、日本文中の各語句の文中での役割、即ち、主格や、目的格、また、動詞の時制などが決定される。図6(a)に、一文目の日本語解析結果を模式的に示す。図6(a)では、「影響する」が動詞であり、主格は「米価の上昇」、時制は「未来」であることを示す。
【0058】
日本文の構造を解析した後、それぞれの語句を英語に変換する(S204)。この時の変換結果を図6(b)に模式的に示す。図6(b)に示すように、「影響する」が”affect”、「米価の上昇」がaffectの主格”the rise in the price of rice”に変換される。
【0059】
その後、英語生成処理が行われ、英語として文法的に正しい文章を生成する(S205)。この英語生成処理では、活用語の語尾変化などの処理が行われる。また、このとき、”affect”は、未来形としての助動詞が付加されて”will affect”として生成される。この活用語の生成や時制情報の生成は、辞書部12−21内におけるそれぞれの動詞の辞書に格納された情報を参照して行われるが、既知の技術であるので詳細な説明は省く。
【0060】
図6(c)に、英語の生成結果を模式的に示す。”affect”が”will affect”になっている。この時、以上の過程で明らかになった「未来」という属性を該当語句に付与したままにしておく。同様に“the rise in the price of rice”が主格であるという属性も残しておく。
【0061】
図6(d)に、一文目の英語生成結果に付与されている属性情報を模式的に示す。図6(d)では、動詞”affect”に“属性=時制、属性値=未来”という情報が保存されている。また、“affect”の主格“the rise in the price of rice”の核となる語“rise”に、“属性=格構造、属性値=主格”という情報が出力文保存領域13−20に保存されている。
【0062】
以上で文法部12−22での翻訳処理が終了し、制御部12−10により、翻訳結果として”The rise in the price of rice will greatly affect our living.”という英文が、図6(d)に示す属性情報を付与されたまま出力文保存領域13−20に保存されるとともに、文字コードのみが翻訳結果として出力部16に出力される。
【0063】
そして、初めに与えられた日本文が複数だと、まだ翻訳されていない日本文が残っているので(S206:YES)、以降の日本文も同様に一文ずつ翻訳処理が行われる。図5(a)の例では、「スーパーマーケットのオーナーは、彼のチェーンストアが安く生鮮食品を売る余裕があると言います。」の文もユーザによって選択されているので、同様に翻訳処理を経て、“The owner of the supermarkets says his chain stores can afford to sell perishable foods cheap.”という英文に翻訳され、動詞“say”に“属性=時制、属性値=現在”という情報と、“say”の主格“The owner of the supermarkets”の核となる語“owner”に、“属性=格構造、属性値=主格”という情報が出力文保存領域13−20に保存される。また、動詞“afford”に“属性=時制、属性値=現在”という情報と、三単現のsによる活用がなされているという情報“属性=活用、属性値=三単現”と、“afford”の主格“his chain stores”の核となる語“chain store”に、“属性=格構造、属性値=主格” “属性=複数形、属性値=複数”という情報が出力文保存領域13−20に保存される(図6(e))。図5(b)に、複数の日本文を全て翻訳処理して出力部16に出力された翻訳結果を示す。
【0064】
続いて、図2の説明に戻る。S15において翻訳された結果において、ユーザが入力部15を介して検索を行うように指定すると(S16:YES)、検索式制御部12−13は、翻訳部12−10による翻訳結果に基づいて、情報検索式を生成する。このとき、翻訳結果のどういう情報を検索式に利用するかは、予め自動設定されていてもよいし、ユーザに指定してもらってもよい。また、予め設定されているものに対してユーザが変更を加えてもよい。あらかじめ設定されている場合(S17:NO)、検索式制御部12−13において、出力文保存領域13−20に保存されている属性情報から該当する属性情報を持つ語句が選ばれて(S17a)、所定の検索式生成プログラムにより検索式が生成される(S19)。図5(b)の下線部に示すような翻訳結果において、例えば、属性情報が「主格」である名詞を検索式生成に利用する設定になっていた場合、主格情報を持つ語として“rise” “owner” “chain store”が選ばれて、検索式制御部により検索式が生成される。この条件による検索式の論理式を以下に示す。
【0065】
(rise * owner* chain store)
【0066】
このとき、情報検索式生成に利用された語句についてアンダーラインをつけたり、反転表示をするなどの強調表示を行ってもよい。
【0067】
続いて、ユーザに翻訳結果のどういう情報を検索式に利用するかを指定してもらう場合において(S17:YES)、ユーザに指定させる場合、ユーザによって情報検索の指示が行われると、出力部16において選択メニューが提示される。ユーザは、提示されたメニューにおいて、検索式に用いる属性情報を指定する(S18)。
【0068】
図3(c)は選択メニューの一例を示したものである。ここでは、例えば「名詞」「名詞と動詞」「主格の名詞」「時制の一致する動詞」「主格の名詞と、時制の一致する動詞」という選択肢が選択メニュー画面によってユーザに提示されたとする。このとき、ユーザが使用する属性情報を指定すると、検索式制御部12−13は、出力文保存領域13−20中から指定された属性情報の検索を行い、この属性情報を持つ語句に基づいて検索式を生成する。例えば、ユーザが「主格の名詞と、時制の一致する動詞」を利用する属性情報として選んだ場合、主格情報を持つ語として“rise” “owner” “chain store”、動詞情報を持つ語として“affect” “say” “afford”、さらに、各動詞には時制情報が付与された形で検索式生成利用情報として検索式制御部12−13に送られ、所定の検索式生成プログラムにより検索式が生成される。ここでは仮に検索式利用情報のand条件で検索式を生成する場合について記述する。この場合、検索式は“rise” “owner” “chain store” “affect” “say” “afford”が全て含まれ、かつ“affect”=「未来形」 “say”=「現在形」 “afford”=「現在形」であることが条件となる。ここで、辞書部12−21により動詞の時制活用を行った形が検索される。このとき、例えば“affect”の未来形としては“will”と“is going to”の2つの形が可能であることが分かる。よって、これら2つとも条件に含めることができる。以上の条件による検索式の論理式は以下のようなものになる。
【0069】
{ rise * owner* chain store * affect (属性:未来形(will + is going to) * say(属性:現在形)*afford(属性:現在形)}
【0070】
このとき、情報検索式生成に利用された語句についてアンダーラインをつけたり、反転表示をするなどの強調表示を行ってもよい。
【0071】
再び図2の説明に戻る。検索式制御部12−13により生成された情報検索式は、情報検索装置30へと送られる。情報検索装置30では、受け取った情報検索式を用いて、ネットワーク20を介して文書群40を検索し(S20)、検索結果をクライアント端末側に送信する。
【0072】
検索結果の表示において、表示する言語は検索結果のままでもよいし、ユーザが最初に範囲指定を行った際の言語等、所定の言語に翻訳して表示してもよい。また、ユーザに検索結果表示言語を指定させてもよい。
【0073】
図2においては、ユーザに検索結果表示言語を指定させる場合の一例について説明する。この場合、出力部16に検索結果表示言語を指定するかどうかを問う図3(a)のような画面が表示制御部12−12によって出力部に画面表示される。ユーザが検索結果表示言語を指定するように選択した場合(S21:YES)、例えば、図3(b)のような言語指定選択画面表示が表示制御部12−12によって行われ、ユーザは検索結果表示言語を指定することが出来る(S22)。ユーザが検索結果表示言語を指定しなければ(S21:NO)、予め設定された所定の言語に決定される(S21a)。こうして決定された検索結果表示言語において、その言語が翻訳を要するものであれば(S23:YES)、翻訳部12−20によりユーザの指定した言語への翻訳が行われる(S24)。一方、その言語が検索結果のままの言語である等、翻訳を要しないのであれば(S23:NO)、翻訳を経ずに検索結果が画面表示される。
【0074】
図7(a)(b)に検索結果の表示例を示す。図7(a)は、検索結果が英語であった場合に、それを他言語に翻訳せずにそのまま英語で表示した表示画面であり、図7(b)は、検索結果が英語であった場合に、それを日本語に翻訳して表示した場合である。
【0075】
以上説明したことから明かなように、本実施例における情報検索システムによれば、ユーザの用いる言語(母国語など)での情報閲覧において範囲を指定して他の言語への翻訳処理を実行すると、この翻訳結果を用いて前記他の言語の文書群から情報検索が行われ、検索結果がユーザに提示される。ユーザに提示する際の言語としては、前記他の言語のままとしたり、ユーザの用いる言語に翻訳してユーザに提示することができる。従って、翻訳ソフトによる翻訳結果の別表現として参考にしたい場合などは前記他の言語のままであることが望ましいであろうし、前記他の言語がほとんど使用できないユーザにとっては通常用いる言語に翻訳してくれたほうが望ましい等、ユーザの使い方によって望ましい形に提示することが可能である。このように、ユーザはある言語を主に使用しながら、言語の違いや検索要求キーワードの選定に頭を悩ませることなく、また、選んだキーワードの訳語の多さによる検索精度の低下に悩まされることなく、複雑な検索式に相当する多くの情報を含んだ検索要求を行って異なる言語で表現された類似文書を効率よく検索することが可能となる。
【0076】
本発明は、上記実施の形態のものに限定されることなく、種々の形態のものとすることができる。
【0077】
範囲指定された文書を他の言語に翻訳する際に、ユーザが言語を選択する方法も必ずしも図3(b)のようなチェックボックス方式によるものとは別に、選択した言語表記を白黒反転方式で表示するようにしてもよいし、選択できる言語も図3(b)に記載されているものに限らず、さらに多く、或いは少なく設定されていてもよい。また、翻訳部12−20が予めひとつの言語への翻訳機能しか持っていない場合や、予めある言語へ翻訳するよう設定されている場合などは、S13、S14、あるいはS21、S22のユーザの選択を経ずにそのまま翻訳処理を行うようにしてもよい。
【0078】
また、検索結果を表示する際、検索結果のタイトルのみが一覧提示されてもよいし、要約等の情報を付加したものが提示されてもよい。また優先順位順に中身が提示されてもよい。また、一覧表示や要約表示等、全ての情報が表示されていない場合、ユーザは、例えば画面に表示された情報の近傍をマウスなどでクリック(指定)することにより、情報検索装置30に対して、対応する詳細情報などの表示要求を行うようにしてもよい。
【0079】
また、検索結果を翻訳する手段は内蔵のものに限られず、例えば、外部の翻訳サーバであってもよい。また、クライアント端末10に検索結果が送られる前に情報検索装置30側で翻訳処理が行われてもよい。情報検索装置30側で翻訳処理を行う場合、情報検索装置は内部に翻訳手段を有していてもよいし、情報検索装置30において外部の翻訳サーバに対して翻訳依頼を行ってもよい。
【0080】
また、接続形態において、上記実施形態のように、情報検索手段が別のコンピュータシステムである必要はなく、1つのコンピュータシステム内に設置されていてもよい。かかる場合はバス結合となる。
【0081】
【発明の効果】
本発明の請求項1に記載の多言語情報検索システムによれば、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0082】
また、請求項2に記載の多言語情報検索システムによれば、表層文字列だけではなく、翻訳処理を行うことによって得られる文構造としての属性情報を検索に利用することができるため、効率的に精度良く検索を行うことが可能となる。
【0083】
また、請求項3に記載の多言語情報検索システムによれば、予め設定されている情報検索式に基づいて検索が行われるため、ユーザは、文構造に関する知識を持っているかどうかに関わらず、情報検索式について考慮する手間を経ずに検索することが可能である。
【0084】
また、請求項4に記載の多言語情報検索システムによれば、ユーザは自分の望む属性情報を用いて検索式を自由に生成することが可能となる。
【0085】
また、請求項5に記載の多言語情報検索システムによれば、ユーザは、検索結果の内容を必要に応じて閲覧することが可能となる。
【0086】
また、請求項6に記載の多言語情報検索システムによれば、ユーザは、得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0087】
また、本発明の請求項7に記載の多言語情報検索方法によれば、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0088】
また、請求項8に記載の多言語情報検索方法によれば、表層文字列だけではなく、翻訳処理を行うことによって得られる文構造としての属性情報を検索に利用することができるため、効率的に精度良く検索を行うことが可能となる。
【0089】
また、請求項9に記載の多言語情報検索方法によれば、予め設定されている情報検索式に基づいて検索が行われるため、ユーザは、文構造に関する知識を持っているかどうかに関わらず、情報検索式について考慮する手間を経ずに検索することが可能である。
【0090】
また、請求項10に記載の多言語情報検索方法によれば、ユーザは自分の望む属性情報を用いて検索式を自由に生成することが可能となる。
【0091】
また、請求項11記載の多言語情報検索方法によれば、ユーザは、検索結果の内容を必要に応じて閲覧することが可能となる。
【0092】
また、請求項12に記載の多言語情報検索方法によれば、ユーザは、得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0093】
また、本発明の請求項13に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0094】
また、請求項14に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、表層文字列だけではなく、翻訳処理を行うことによって得られる文構造としての属性情報を検索に利用することができるため、効率的に精度良く検索を行うことが可能となる。
【0095】
また、請求項15に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、予め設定されている情報検索式に基づいて検索が行われるため、ユーザは、文構造に関する知識を持っているかどうかに関わらず、情報検索式について考慮する手間を経ずに検索することが可能である。
【0096】
また、請求項16に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは自分の望む属性情報を用いて検索式を自由に生成することが可能となる。
【0097】
また、請求項17記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは、検索結果の内容を必要に応じて閲覧することが可能となる。
【0098】
また、請求項18に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは、得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【図面の簡単な説明】
【図1】本実施の形態に係る多言語情報検索システムの構成図
【図2】本実施の形態に係る多言語情報検索システムの動作を説明するフローチャート
【図3】出力部においてユーザに提示される属性指定画面の一例を示す図
【図4】本実施の形態に係る多言語情報検索システムの翻訳処理動作の詳細を説明するフローチャート
【図5】出力部においてユーザに提示される翻訳前の文字例の一例及び翻訳結果の文字例の一例を示す図
【図6】本実施の形態に係る多言語情報検索システムの翻訳処理における解析結果、変換結果、生成結果及び属性情報の一例を示す図
【図7】出力部においてユーザに提示される検索結果の文字例の一例を示す図
【符号の説明】
10…クライアント端末、20…ネットワーク、30…情報検索装置、40…文書群、11…CPU、12…ROM、13…RAM、14…外部記憶装置、15…入力部、16…出力部、31…CPU、32…ROM、33…RAM、35…入力部、36…出力部、12−10…制御部、12−12…表示制御部、12−13…検索式制御部、12−20…翻訳部、12−21…辞書部、12−22…文法部、13−20…出力文保存領域、32−10…制御部、32−12…表示制御部、32−13…検索制御部、33−10…検索式保存領域、33−20…検索結果保存領域
【発明の属する技術分野】
本発明は、複数の言語を対象としてある言語から目的とする他の言語の文書を検索する多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラムに関する。
【0002】
【従来の技術】
ある言語Aを用いて情報を得ているユーザが、当該言語Aで表現された文書Xについて、使い慣れない言語Bで表現された類似文書を文書群中から検索したい場合がある。これには、例えば、言語Aで表現された文書Xの情報元が言語Bの使用圏であり、文書Xの内容についての詳細情報が言語Bで表現された文書として存在することが推定できることから、そうした言語Bによる関連文書を入手したい場合などがある。また、言語Aで書かれた文書から言語Bによる翻訳文書を作成したい場合において、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合なども挙げられる。従来、そうした場合において、極力言語Bを使わずに言語Aの使用で済ませる実現方法としては、文書Xの中から言語Aによるキーワードを選び出して言語Bに翻訳し、この言語Bによるキーワードを用いて言語Bで表現された文書を文書群から検索する方法がある。ただし、この方法においては、文書Aに含まれる語句のうちのどれをキーワードとして用いたらよいかユーザが悩むことがある上に、通常は1〜3語という検索要求キーワードを翻訳するにあたっては、単語が持つ複数の訳語の中から訳語を絞り込むには情報が足りないために、的確な翻訳を行うには困難な点があり、さらに、このような少ない数のキーワードでは情報検索のための情報としても不十分で、検索結果の文書群にはユーザが目的としない無駄な文書がたくさん含まれてしまうという問題点がある。
【0003】
このような問題を解決する方法として、例えば、特開2001−22787号公報には、ユーザの初期情報要求に基づいて、先ず、ある言語の複数の単語を用いた情報検索式を生成し、その情報検索式により文書を検索して、ユーザの情報要求に適合した文書を指定させ、その適合文書から特徴的な単語を抽出して翻訳すべき単語リストを生成し、この単語リストを指定した他の言語に翻訳し、この指定言語に翻訳した翻訳言語を用いて指定言語の文書を検索することが記載されている。
【0004】
【特許文献1】
特開2001−22787号公報
【0005】
【発明が解決しようとする課題】
しかしながら、前記文献記載の検索方法によれば、初期の検索要求の情報量は依然として少ないために、初期の検索結果には多量の文書が含まれている場合があり、そうした多量の文書の中から適合文書をユーザが選択する上で困難な場合がある。また初期の検索要求としてどういう語を選べばよいかユーザが悩む点については、この方法では解決されない。
以上のように、従来の技術では、ユーザが、言語の違いや検索要求に使用する語句の選択について頭を悩ますことなく、異なる言語間における類似内容文書を効率的に検索するには不十分であった。
【0006】
本発明は、上記事情に鑑みてなされたものであり、その目的とするところは、異なる言語における類似文書を、ユーザが言語の違いや検索要求の選択に頭を悩ませることなく、的確に検索することができる多言語情報検索システム、多言語情報検索方法及び多言語情報検索プログラムを提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、請求項1に記載の多言語情報検索システムは、複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索する多言語情報検索システムにおいて、ある言語及び/または他の言語の文書を出力提示する出力手段と、前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定手段と、指定された範囲の文書の言語を他の言語に翻訳する翻訳手段と、前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成手段と、前記情報検索式に基づいて他の言語の文書を検索する情報検索手段とを有することを特徴としている。
【0008】
請求項1に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語の文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。翻訳された翻訳結果に基づいて、情報検索式生成手段により、前記指定された範囲の文書と類似の文書を検索するための情報検索式が生成される。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0009】
これにより、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0010】
請求項2に記載の多言語情報検索システムは、前記情報検索式生成手段が、前記翻訳手段により得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴とするものである。
【0011】
請求項2に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。その際に、翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式生成手段により情報検索式が生成される。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0012】
請求項3に記載の多言語情報検索システムは、前記翻訳手段により得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、前記情報検索式生成手段が、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成するように構成されていることを特徴とするものである。
【0013】
請求項3に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。その際に、翻訳手段により得られる翻訳結果に含まれる情報が記憶手段に記憶されるが、そのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて情報検索式を生成するようにあらかじめ設定されており、情報検索式生成手段では、その設定に基づいて情報検索式を自動生成する。これにより、ユーザが情報検索式について考慮する手間を経ずに検索することが可能となる。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0014】
請求項4に記載の多言語情報検索システムは、前記翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定手段を備え、前記情報検索式生成手段が、前記属性指定手段によって指定した属性情報に基づいて情報検索式を生成することを特徴としている。
【0015】
請求項4に記載の多言語情報検索システムにおいては、ユーザが、出力手段により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定手段により指定すると、指定された範囲の文書の言語が翻訳手段により他の言語に翻訳される。その際に、翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を情報検索式に用いるようにユーザが属性指定手段を介して指定する。情報検索式生成手段では、ユーザが指定した属性情報に基づいて情報検索式を生成する。これにより、ユーザは自分の望む属性情報を用いて情報検索式を生成することが可能となる。この情報検索式に基づいて、情報検索手段により、他の言語の文書の検索が行われる。
【0016】
請求項5に記載の多言語情報検索システムは、情報検索手段によって検索された検索結果を表示する検索結果表示手段を備えたことを特徴としている。
【0017】
請求項5に記載の多言語情報検索システムにおいては、情報検索手段によって検索された検索結果が、検索結果表示手段に表示される。
【0018】
請求項6に記載の多言語情報検索システムは、情報検索手段により検索された検索結果の表示言語の指定を行うことができる言語指定手段と、前記検索結果を翻訳する検索結果翻訳手段とを備え、前記検索結果表示手段は、ユーザの前記言語指定手段による指定に基づいて、前記検索結果をそのままの言語で、あるいは前記検索結果翻訳手段により異なる言語に翻訳してから表示することを特徴としている。
【0019】
請求項6に記載の多言語情報検索システムにおいては、ユーザが、情報検索手段により検索された検索結果の表示言語の指定を言語指定手段を介して行う。ユーザの指定が前記検索結果の言語のままであれば、前記検索結果を翻訳せずに検索結果表示手段に表示する。ユーザの指定が前記検索結果の言語と異なる場合は、前記検索結果を検索結果翻訳手段により翻訳した後で、検索結果表示手段に表示する。これにより、ユーザは、検索結果の内容をユーザの得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0020】
請求項7に記載の多言語情報検索方法は、複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索する多言語情報検索方法において、ある言語及び/または他の言語の文書を出力提示する出力工程と、前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定工程と、指定された範囲の文書の言語を他の言語に翻訳する翻訳工程と、前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成工程と、前記情報検索式に基づいて他の言語の文書を検索する情報検索工程と
を有することを特徴としている。
【0021】
請求項7に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語の文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。翻訳された翻訳結果に基づいて、情報検索式生成工程により、前記指定された範囲の文書と類似の文書を検索するための情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0022】
請求項8に記載の多言語情報検索方法は、前記情報検索式生成工程が、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴としている。
【0023】
請求項8に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式生成工程により情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0024】
請求項9に記載の多言語情報検索方法は、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、前記情報検索式生成工程は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成することを特徴としている。
【0025】
請求項9に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程により得られる翻訳結果に含まれる情報が記憶手段に記憶されるが、そのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて情報検索式を生成するようにあらかじめ設定されており、情報検索式生成工程では、その設定に基づいて情報検索式を自動生成する。これにより、ユーザが情報検索式について考慮する手間を経ずに検索することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0026】
請求項10に記載の多言語情報検索方法は、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定工程を備え、前記情報検索式生成工程は、前記属性指定工程において指定した属性情報に基づいて情報検索式を生成することを特徴としている。
【0027】
請求項10に記載の多言語情報検索方法においては、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を情報検索式に用いるようにユーザが属性指定工程を介して指定する。情報検索式生成工程では、ユーザが指定した属性情報に基づいて情報検索式を生成する。これにより、ユーザは自分の望む属性情報を用いて情報検索式を生成することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0028】
請求項11に記載の多言語情報検索方法は、前記情報検索工程において検索された検索結果を表示する検索結果表示工程を備えたことを特徴としている。
【0029】
請求項11に記載の多言語情報検索方法においては、情報検索工程によって検索された検索結果が検索結果表示手段に表示される。
【0030】
請求項12に記載の多言語情報検索方法は、前記情報検索工程において検索された検索結果の表示言語の指定を行うことができる言語指定工程と、前記検索結果を指定された言語に翻訳する検索結果翻訳工程とを備え、前記検索結果表示工程は、前記言語指定工程による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳工程により翻訳して表示することを特徴としている。
【0031】
請求項12に記載の多言語情報検索方法においては、ユーザが、情報検索工程により検索された検索結果の表示言語の指定を言語指定工程を介して行う。ユーザの指定が前記検索結果の言語のままであれば、前記検索結果を翻訳せずに検索結果表示工程により表示する。ユーザの指定が前記検索結果の言語と異なる場合は、前記検索結果を検索結果翻訳工程により翻訳した後で、検索結果表示工程により表示する。これにより、ユーザは、前記検索結果の内容をユーザの得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0032】
請求項13に記載の多言語情報検索プログラムは、複数の言語を対象としてある言語の文書から目的とする他の言語の文書の検索をコンピュータに実行させる多言語情報検索プログラムにおいて、ある言語及び/または他の言語の文書を出力提示する出力工程と、前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定工程と、指定された範囲の文書の言語を他の言語に翻訳する翻訳工程と、前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成工程と、前記情報検索式に基づいて他の言語の文書を検索する情報検索工程とをコンピュータに実行させることを特徴としている。
【0033】
請求項13に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語の文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。翻訳された翻訳結果に基づいて、情報検索式生成工程により、前記指定された範囲の文書と類似の文書を検索するための情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0034】
請求項14に記載の多言語情報検索プログラムは、前記情報検索式生成工程は、前記翻訳機能において得られる翻訳結果に含まれるのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴としている。
【0035】
請求項14に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式生成工程により情報検索式が生成される。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0036】
請求項15に記載の多言語情報検索プログラムは、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、前記情報検索式生成工程は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成することを特徴としている。
【0037】
請求項15に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程により得られる翻訳結果に含まれる情報が記憶手段に記憶されるが、そのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて情報検索式を生成するようにあらかじめ設定されており、情報検索式生成工程では、その設定に基づいて情報検索式を自動生成する。これにより、ユーザが情報検索式について考慮する手間を経ずに検索することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0038】
請求項16に記載の多言語情報検索プログラムは、前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定工程を備え、前記情報検索式生成工程は、前記属性指定工程において指定した属性情報に基づいて情報検索式を生成することを特徴としている。
【0039】
請求項16に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、出力工程により提示されたある言語における文書のうちの、得たい情報に関連した範囲を範囲指定工程により指定すると、指定された範囲の文書の言語が翻訳工程により他の言語に翻訳される。その際に、翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を情報検索式に用いるようにユーザが属性指定工程を介して指定する。情報検索式生成工程では、ユーザが指定した属性情報に基づいて情報検索式を生成する。これにより、ユーザは自分の望む属性情報を用いて情報検索式を生成することが可能となる。この情報検索式に基づいて、情報検索工程により、他の言語の文書の検索が行われる。
【0040】
請求項17に記載の多言語情報検索プログラムは、前記情報検索工程において検索された検索結果を表示する検索結果表示工程を備えたことを特徴としている。
【0041】
請求項17に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、情報検索工程によって検索された検索結果が検索結果表示手段に表示される。
【0042】
請求項18に記載の多言語情報検索プログラムは、前記情報検索工程において検索された検索結果の表示言語の指定を行うことができる言語指定工程と、前記検索結果を指定された言語に翻訳する検索結果翻訳工程とを備え、
前記検索結果表示工程は、前記言語指定工程による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳工程により翻訳して表示することを特徴としている。
【0043】
請求項18に記載の多言語情報検索プログラムにおいては、そのプログラムをコンピュータに実行させることにより、ユーザが、情報検索工程により検索された検索結果の表示言語の指定を言語指定工程を介して行う。ユーザの指定が前記検索結果の言語のままであれば、前記検索結果を翻訳せずに検索結果表示工程により表示する。ユーザの指定が検索結果の言語と異なる場合は、前記検索結果を検索結果翻訳工程により翻訳した後で、検索結果表示工程により表示する。これにより、ユーザは、前記検索結果の内容をユーザの得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0044】
【発明の実施の形態】
以下に、本発明を具体化した一実施の形態に係る多言語情報検索システムについて図面を参照して説明する。
【0045】
図1は本発明の一実施の形態に係る多言語情報検索システムのシステム構成を示すブロック図である。クライアント端末10は、ネットワーク20(例えばインターネットなど)を介して情報検索装置30と接続されている。情報検索装置30は、検索手段としての検索エンジンを内部に有しており、ネットワーク20を介して各地に存在する文書群40を検索することが可能になっている。
【0046】
クライアント端末10において、入力部15は、ユーザが、ある文書において得たい情報に関連した範囲を指定する範囲指定手段、検索式に用いる属性情報を指定するための属性指定手段、および検索結果の表示言語を指定する言語指定手段として機能する手動操作可能なキーボードやマウス等である。出力部16は、複数の言語のある言語の文書、あるいは同時に複数の言語の文書を出力提示する出力手段、および検索結果を表示する検索結果表示手段として機能し、画面表示によって提示するCRTや、印刷出力するプリンタ等である。入力部15および出力部16は、装置全体を制御するためのCPU11にI/O制御部を介して接続されている。制御プログラムや辞書などを格納するROM12は、CPU11と接続され、各種処理を行うためのプログラムを格納した制御部12−10と、翻訳手段として機能するプログラムを格納した翻訳部12−20とを備えている。CPU11は、ROM12内の制御プログラムに基づいて、クライアント端末10全体の制御を行う。尚、翻訳手段は、内蔵のものに限らず、例えば、外部の翻訳サーバであってもよい。外部の翻訳手段に翻訳を依頼する場合は、翻訳依頼を、翻訳対象のテキスト共に外部翻訳手段に上記ネットワーク20を介して送り、外部翻訳手段に翻訳してもらい、その翻訳結果を受け取る。
【0047】
制御部12−10には、出力部16に対する表示を制御するためのプログラムを格納した表示制御部12−12や、情報検索式生成手段として機能するプログラムを格納した検索式制御部12−13等が組み込まれている。
【0048】
上記翻訳部12−20は、日本語、英語、ドイツ語、フランス語等の予定された複数の言語のそれぞれの文書を翻訳するためにシステムが予め用意した辞書を格納した翻訳辞書としての辞書部12−21と、辞書情報を参照しながら翻訳を進めるための文法ルールを格納した文法部12−22とを備えている。
【0049】
さらに、外部記憶装置14は、I/O制御部を介してCPU11と接続され、使用者が希望に応じて用意する専門用語辞書や、使用者が翻訳結果に反映させるために自ら作成するユーザ辞書等を格納する。
【0050】
記憶手段としてのRAM13は、ROM12に格納された制御プログラムを実行する際に、ワークエリアなどとして使用される。RAM13は、CPU11に接続され、入力されたある言語の文章を記憶するための入力文保存領域13−10と、翻訳結果を記憶するための出力文保存領域13−20と、ワークエリア13−30とを備えている。出力文保存領域13−20は、属性記憶手段としての役割も持つ。
【0051】
情報検索装置30において、入力部35および出力部36は、装置全体を制御するためのCPU31にI/O制御部を介して接続されている。ROM32は、CPU31と接続され、各種処理を行うためのプログラムを格納した制御部32−10を有する。制御部32−10には、出力部32に対する表示を制御するためのプログラムを格納した表示制御部32−12、検索を制御するためのプログラムを格納した検索制御部32−13が組み込まれている。RAM33は、CPU31に接続され、入力された検索式を記憶するための検索式保存領域33−10や、検索結果を記憶するための検索結果保存領域33−20や、ワークエリア13−30等からなる。
【0052】
以下に、本発明の一実施の形態に係る多言語情報検索システムの動作について図2を参照して説明する。図2は、本発明の一実施形態の多言語情報検索システムの動作を示すフローチャートである。
【0053】
先ず、ユーザは、日本語等のある言語の文書を対象としてこの文書を出力部16(CRT)に表示し、得たい情報に関連した内容が記載された範囲をマークするための範囲指定を入力部15においてマウス等で入力する(S11)。続いて、入力部を操作して、指定した範囲について翻訳するように指定すると(S12:YES)、表示制御部12−12の制御に基づいて出力部16(CRT)に「どの言語に翻訳するかを指定しますか?」という問い画面が表示される((図3(a)参照)。この状態で、ユーザが言語を指定するように選択すると(S13:YES)、続いて、言語を選択する画面が現れるので(図3(b)参照)、その画面に従ってユーザはどの言語に翻訳するかを選択することができる(S14)。ユーザがどの言語に翻訳するかを指定しなければ(S13:NO)、予め設定された所定の言語に決定される(S13a)。
【0054】
次に、ユーザが範囲指定した部分の翻訳処理(図2のS15)における詳細について、図4のフローチャートを参照しながら説明する。
【0055】
ここでは一例として、ユーザが日本語の文書を範囲指定した場合を挙げて説明する。翻訳対象文書における範囲指定を入力部15から行い、翻訳実行の指示を与えると、制御部12−10によって、与えられた日本文が1文の時は、その文が文法部12−22に送られ(S201:YES)、翻訳処理がなされる。与えられた日本文が複数ある時は(S201:NO)、制御部によって1文ずつに区切られ(S202)、その一文毎に文法部12−22に送られる。
【0056】
ここで、翻訳対象として与えられた日本文が図5(a)に示した文書であるとする。例えば、図5(a)における下線部の部分をユーザが範囲指定した場合、日本文は複数あるので(S201:NO)、制御部12−10によって1文毎に区切られ(S202)、その結果、最初の文である、「米価の上昇は私達の生活に大きく影響するでしょう。」から順に文法部12−22に送られる。この文法部12−22において、日本文から英文への翻訳が行われるが、既知の技術であるので、詳細な説明は省く。
【0057】
文法部では、先ず、日本文の構造を解析する(S203)。この過程で、日本文中の各語句の文中での役割、即ち、主格や、目的格、また、動詞の時制などが決定される。図6(a)に、一文目の日本語解析結果を模式的に示す。図6(a)では、「影響する」が動詞であり、主格は「米価の上昇」、時制は「未来」であることを示す。
【0058】
日本文の構造を解析した後、それぞれの語句を英語に変換する(S204)。この時の変換結果を図6(b)に模式的に示す。図6(b)に示すように、「影響する」が”affect”、「米価の上昇」がaffectの主格”the rise in the price of rice”に変換される。
【0059】
その後、英語生成処理が行われ、英語として文法的に正しい文章を生成する(S205)。この英語生成処理では、活用語の語尾変化などの処理が行われる。また、このとき、”affect”は、未来形としての助動詞が付加されて”will affect”として生成される。この活用語の生成や時制情報の生成は、辞書部12−21内におけるそれぞれの動詞の辞書に格納された情報を参照して行われるが、既知の技術であるので詳細な説明は省く。
【0060】
図6(c)に、英語の生成結果を模式的に示す。”affect”が”will affect”になっている。この時、以上の過程で明らかになった「未来」という属性を該当語句に付与したままにしておく。同様に“the rise in the price of rice”が主格であるという属性も残しておく。
【0061】
図6(d)に、一文目の英語生成結果に付与されている属性情報を模式的に示す。図6(d)では、動詞”affect”に“属性=時制、属性値=未来”という情報が保存されている。また、“affect”の主格“the rise in the price of rice”の核となる語“rise”に、“属性=格構造、属性値=主格”という情報が出力文保存領域13−20に保存されている。
【0062】
以上で文法部12−22での翻訳処理が終了し、制御部12−10により、翻訳結果として”The rise in the price of rice will greatly affect our living.”という英文が、図6(d)に示す属性情報を付与されたまま出力文保存領域13−20に保存されるとともに、文字コードのみが翻訳結果として出力部16に出力される。
【0063】
そして、初めに与えられた日本文が複数だと、まだ翻訳されていない日本文が残っているので(S206:YES)、以降の日本文も同様に一文ずつ翻訳処理が行われる。図5(a)の例では、「スーパーマーケットのオーナーは、彼のチェーンストアが安く生鮮食品を売る余裕があると言います。」の文もユーザによって選択されているので、同様に翻訳処理を経て、“The owner of the supermarkets says his chain stores can afford to sell perishable foods cheap.”という英文に翻訳され、動詞“say”に“属性=時制、属性値=現在”という情報と、“say”の主格“The owner of the supermarkets”の核となる語“owner”に、“属性=格構造、属性値=主格”という情報が出力文保存領域13−20に保存される。また、動詞“afford”に“属性=時制、属性値=現在”という情報と、三単現のsによる活用がなされているという情報“属性=活用、属性値=三単現”と、“afford”の主格“his chain stores”の核となる語“chain store”に、“属性=格構造、属性値=主格” “属性=複数形、属性値=複数”という情報が出力文保存領域13−20に保存される(図6(e))。図5(b)に、複数の日本文を全て翻訳処理して出力部16に出力された翻訳結果を示す。
【0064】
続いて、図2の説明に戻る。S15において翻訳された結果において、ユーザが入力部15を介して検索を行うように指定すると(S16:YES)、検索式制御部12−13は、翻訳部12−10による翻訳結果に基づいて、情報検索式を生成する。このとき、翻訳結果のどういう情報を検索式に利用するかは、予め自動設定されていてもよいし、ユーザに指定してもらってもよい。また、予め設定されているものに対してユーザが変更を加えてもよい。あらかじめ設定されている場合(S17:NO)、検索式制御部12−13において、出力文保存領域13−20に保存されている属性情報から該当する属性情報を持つ語句が選ばれて(S17a)、所定の検索式生成プログラムにより検索式が生成される(S19)。図5(b)の下線部に示すような翻訳結果において、例えば、属性情報が「主格」である名詞を検索式生成に利用する設定になっていた場合、主格情報を持つ語として“rise” “owner” “chain store”が選ばれて、検索式制御部により検索式が生成される。この条件による検索式の論理式を以下に示す。
【0065】
(rise * owner* chain store)
【0066】
このとき、情報検索式生成に利用された語句についてアンダーラインをつけたり、反転表示をするなどの強調表示を行ってもよい。
【0067】
続いて、ユーザに翻訳結果のどういう情報を検索式に利用するかを指定してもらう場合において(S17:YES)、ユーザに指定させる場合、ユーザによって情報検索の指示が行われると、出力部16において選択メニューが提示される。ユーザは、提示されたメニューにおいて、検索式に用いる属性情報を指定する(S18)。
【0068】
図3(c)は選択メニューの一例を示したものである。ここでは、例えば「名詞」「名詞と動詞」「主格の名詞」「時制の一致する動詞」「主格の名詞と、時制の一致する動詞」という選択肢が選択メニュー画面によってユーザに提示されたとする。このとき、ユーザが使用する属性情報を指定すると、検索式制御部12−13は、出力文保存領域13−20中から指定された属性情報の検索を行い、この属性情報を持つ語句に基づいて検索式を生成する。例えば、ユーザが「主格の名詞と、時制の一致する動詞」を利用する属性情報として選んだ場合、主格情報を持つ語として“rise” “owner” “chain store”、動詞情報を持つ語として“affect” “say” “afford”、さらに、各動詞には時制情報が付与された形で検索式生成利用情報として検索式制御部12−13に送られ、所定の検索式生成プログラムにより検索式が生成される。ここでは仮に検索式利用情報のand条件で検索式を生成する場合について記述する。この場合、検索式は“rise” “owner” “chain store” “affect” “say” “afford”が全て含まれ、かつ“affect”=「未来形」 “say”=「現在形」 “afford”=「現在形」であることが条件となる。ここで、辞書部12−21により動詞の時制活用を行った形が検索される。このとき、例えば“affect”の未来形としては“will”と“is going to”の2つの形が可能であることが分かる。よって、これら2つとも条件に含めることができる。以上の条件による検索式の論理式は以下のようなものになる。
【0069】
{ rise * owner* chain store * affect (属性:未来形(will + is going to) * say(属性:現在形)*afford(属性:現在形)}
【0070】
このとき、情報検索式生成に利用された語句についてアンダーラインをつけたり、反転表示をするなどの強調表示を行ってもよい。
【0071】
再び図2の説明に戻る。検索式制御部12−13により生成された情報検索式は、情報検索装置30へと送られる。情報検索装置30では、受け取った情報検索式を用いて、ネットワーク20を介して文書群40を検索し(S20)、検索結果をクライアント端末側に送信する。
【0072】
検索結果の表示において、表示する言語は検索結果のままでもよいし、ユーザが最初に範囲指定を行った際の言語等、所定の言語に翻訳して表示してもよい。また、ユーザに検索結果表示言語を指定させてもよい。
【0073】
図2においては、ユーザに検索結果表示言語を指定させる場合の一例について説明する。この場合、出力部16に検索結果表示言語を指定するかどうかを問う図3(a)のような画面が表示制御部12−12によって出力部に画面表示される。ユーザが検索結果表示言語を指定するように選択した場合(S21:YES)、例えば、図3(b)のような言語指定選択画面表示が表示制御部12−12によって行われ、ユーザは検索結果表示言語を指定することが出来る(S22)。ユーザが検索結果表示言語を指定しなければ(S21:NO)、予め設定された所定の言語に決定される(S21a)。こうして決定された検索結果表示言語において、その言語が翻訳を要するものであれば(S23:YES)、翻訳部12−20によりユーザの指定した言語への翻訳が行われる(S24)。一方、その言語が検索結果のままの言語である等、翻訳を要しないのであれば(S23:NO)、翻訳を経ずに検索結果が画面表示される。
【0074】
図7(a)(b)に検索結果の表示例を示す。図7(a)は、検索結果が英語であった場合に、それを他言語に翻訳せずにそのまま英語で表示した表示画面であり、図7(b)は、検索結果が英語であった場合に、それを日本語に翻訳して表示した場合である。
【0075】
以上説明したことから明かなように、本実施例における情報検索システムによれば、ユーザの用いる言語(母国語など)での情報閲覧において範囲を指定して他の言語への翻訳処理を実行すると、この翻訳結果を用いて前記他の言語の文書群から情報検索が行われ、検索結果がユーザに提示される。ユーザに提示する際の言語としては、前記他の言語のままとしたり、ユーザの用いる言語に翻訳してユーザに提示することができる。従って、翻訳ソフトによる翻訳結果の別表現として参考にしたい場合などは前記他の言語のままであることが望ましいであろうし、前記他の言語がほとんど使用できないユーザにとっては通常用いる言語に翻訳してくれたほうが望ましい等、ユーザの使い方によって望ましい形に提示することが可能である。このように、ユーザはある言語を主に使用しながら、言語の違いや検索要求キーワードの選定に頭を悩ませることなく、また、選んだキーワードの訳語の多さによる検索精度の低下に悩まされることなく、複雑な検索式に相当する多くの情報を含んだ検索要求を行って異なる言語で表現された類似文書を効率よく検索することが可能となる。
【0076】
本発明は、上記実施の形態のものに限定されることなく、種々の形態のものとすることができる。
【0077】
範囲指定された文書を他の言語に翻訳する際に、ユーザが言語を選択する方法も必ずしも図3(b)のようなチェックボックス方式によるものとは別に、選択した言語表記を白黒反転方式で表示するようにしてもよいし、選択できる言語も図3(b)に記載されているものに限らず、さらに多く、或いは少なく設定されていてもよい。また、翻訳部12−20が予めひとつの言語への翻訳機能しか持っていない場合や、予めある言語へ翻訳するよう設定されている場合などは、S13、S14、あるいはS21、S22のユーザの選択を経ずにそのまま翻訳処理を行うようにしてもよい。
【0078】
また、検索結果を表示する際、検索結果のタイトルのみが一覧提示されてもよいし、要約等の情報を付加したものが提示されてもよい。また優先順位順に中身が提示されてもよい。また、一覧表示や要約表示等、全ての情報が表示されていない場合、ユーザは、例えば画面に表示された情報の近傍をマウスなどでクリック(指定)することにより、情報検索装置30に対して、対応する詳細情報などの表示要求を行うようにしてもよい。
【0079】
また、検索結果を翻訳する手段は内蔵のものに限られず、例えば、外部の翻訳サーバであってもよい。また、クライアント端末10に検索結果が送られる前に情報検索装置30側で翻訳処理が行われてもよい。情報検索装置30側で翻訳処理を行う場合、情報検索装置は内部に翻訳手段を有していてもよいし、情報検索装置30において外部の翻訳サーバに対して翻訳依頼を行ってもよい。
【0080】
また、接続形態において、上記実施形態のように、情報検索手段が別のコンピュータシステムである必要はなく、1つのコンピュータシステム内に設置されていてもよい。かかる場合はバス結合となる。
【0081】
【発明の効果】
本発明の請求項1に記載の多言語情報検索システムによれば、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0082】
また、請求項2に記載の多言語情報検索システムによれば、表層文字列だけではなく、翻訳処理を行うことによって得られる文構造としての属性情報を検索に利用することができるため、効率的に精度良く検索を行うことが可能となる。
【0083】
また、請求項3に記載の多言語情報検索システムによれば、予め設定されている情報検索式に基づいて検索が行われるため、ユーザは、文構造に関する知識を持っているかどうかに関わらず、情報検索式について考慮する手間を経ずに検索することが可能である。
【0084】
また、請求項4に記載の多言語情報検索システムによれば、ユーザは自分の望む属性情報を用いて検索式を自由に生成することが可能となる。
【0085】
また、請求項5に記載の多言語情報検索システムによれば、ユーザは、検索結果の内容を必要に応じて閲覧することが可能となる。
【0086】
また、請求項6に記載の多言語情報検索システムによれば、ユーザは、得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0087】
また、本発明の請求項7に記載の多言語情報検索方法によれば、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0088】
また、請求項8に記載の多言語情報検索方法によれば、表層文字列だけではなく、翻訳処理を行うことによって得られる文構造としての属性情報を検索に利用することができるため、効率的に精度良く検索を行うことが可能となる。
【0089】
また、請求項9に記載の多言語情報検索方法によれば、予め設定されている情報検索式に基づいて検索が行われるため、ユーザは、文構造に関する知識を持っているかどうかに関わらず、情報検索式について考慮する手間を経ずに検索することが可能である。
【0090】
また、請求項10に記載の多言語情報検索方法によれば、ユーザは自分の望む属性情報を用いて検索式を自由に生成することが可能となる。
【0091】
また、請求項11記載の多言語情報検索方法によれば、ユーザは、検索結果の内容を必要に応じて閲覧することが可能となる。
【0092】
また、請求項12に記載の多言語情報検索方法によれば、ユーザは、得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【0093】
また、本発明の請求項13に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは閲覧している文書のうちの、関連する内容が知りたい部分をなんとなく範囲指定すればよいだけとなり、厳密にどの語句を検索要求に用いるかについて悩む必要がなくなる。また、翻訳を行った結果から検索式を生成するため、多数の訳語を持つ語についても、翻訳処理において文内の前後の情報を用いて適切な訳語が選択された後で、その訳語を検索式生成に用いるため、不必要な訳語による検索が行われず、無駄な検索結果の増大を防ぐことが可能となる。
【0094】
また、請求項14に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、表層文字列だけではなく、翻訳処理を行うことによって得られる文構造としての属性情報を検索に利用することができるため、効率的に精度良く検索を行うことが可能となる。
【0095】
また、請求項15に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、予め設定されている情報検索式に基づいて検索が行われるため、ユーザは、文構造に関する知識を持っているかどうかに関わらず、情報検索式について考慮する手間を経ずに検索することが可能である。
【0096】
また、請求項16に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは自分の望む属性情報を用いて検索式を自由に生成することが可能となる。
【0097】
また、請求項17記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは、検索結果の内容を必要に応じて閲覧することが可能となる。
【0098】
また、請求項18に記載の多言語情報検索プログラムによれば、このプログラムをコンピュータに実行させることにより、ユーザは、得意とする言語で見たい場合などにおいては翻訳された状態で見ることができ、また、翻訳ソフトによる翻訳結果と類似した文書を入手することによって、翻訳ソフトによる翻訳結果とは別の表現方法を知りたい場合などにおいては、検索結果の言語のままで見ることができるなど、場合に応じて、望む言語で表示された文書を見ることが可能となる。
【図面の簡単な説明】
【図1】本実施の形態に係る多言語情報検索システムの構成図
【図2】本実施の形態に係る多言語情報検索システムの動作を説明するフローチャート
【図3】出力部においてユーザに提示される属性指定画面の一例を示す図
【図4】本実施の形態に係る多言語情報検索システムの翻訳処理動作の詳細を説明するフローチャート
【図5】出力部においてユーザに提示される翻訳前の文字例の一例及び翻訳結果の文字例の一例を示す図
【図6】本実施の形態に係る多言語情報検索システムの翻訳処理における解析結果、変換結果、生成結果及び属性情報の一例を示す図
【図7】出力部においてユーザに提示される検索結果の文字例の一例を示す図
【符号の説明】
10…クライアント端末、20…ネットワーク、30…情報検索装置、40…文書群、11…CPU、12…ROM、13…RAM、14…外部記憶装置、15…入力部、16…出力部、31…CPU、32…ROM、33…RAM、35…入力部、36…出力部、12−10…制御部、12−12…表示制御部、12−13…検索式制御部、12−20…翻訳部、12−21…辞書部、12−22…文法部、13−20…出力文保存領域、32−10…制御部、32−12…表示制御部、32−13…検索制御部、33−10…検索式保存領域、33−20…検索結果保存領域
Claims (18)
- 複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索する多言語情報検索システムにおいて、
ある言語及び/または他の言語の文書を出力提示する出力手段と、
前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定手段と、
指定された範囲の文書の言語を他の言語に翻訳する翻訳手段と、
前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成手段と、
前記情報検索式に基づいて他の言語の文書を検索する情報検索手段と
を有することを特徴とする多言語情報検索システム。 - 前記情報検索式生成手段は、前記翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴とする請求項1に記載の多言語情報検索システム。
- 前記翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、
前記情報検索式生成手段は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成するように構成されていることを特徴とする請求項2に記載の多言語情報検索システム。 - 前記翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定手段を備え、
前記情報検索式生成手段は、前記属性指定手段によって指定した属性情報に基づいて情報検索式を生成することを特徴とする請求項2に記載の多言語情報検索システム。 - 前記情報検索手段によって検索された検索結果を表示する検索結果表示手段を備えたことを特徴とする請求項1〜4のいずれかに記載の多言語情報検索システム。
- 前記情報検索手段によって検索された検索結果の表示言語の指定を行うことができる言語指定手段と、前記検索結果を指定された言語に翻訳する検索結果翻訳手段とを備え、
前記検索結果表示手段は、前記言語指定手段による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳手段により翻訳して表示することを特徴とする請求項5に記載の多言語情報検索システム。 - 複数の言語を対象としてある言語の文書から目的とする他の言語の文書を検索する多言語情報検索方法において、
ある言語及び/または他の言語の文書を出力提示する出力工程と、
前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定工程と、
指定された範囲の文書の言語を他の言語に翻訳する翻訳工程と、
前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成工程と、
前記情報検索式に基づいて他の言語の文書を検索する情報検索工程と
を有することを特徴とする多言語情報検索方法。 - 前記情報検索式生成工程は、前記翻訳手段において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴とする請求項7に記載の多言語情報検索方法。
- 前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、
前記情報検索式生成工程は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成することを特徴とする請求項8に記載の多言語情報検索方法。 - 前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定工程を備え、
前記情報検索式生成工程は、前記属性指定工程において指定した属性情報に基づいて情報検索式を生成することを特徴とする請求項8に記載の多言語情報検索方法。 - 前記情報検索工程において検索された検索結果を表示する検索結果表示工程を備えたことを特徴とする請求項7〜10のいずれかに記載の多言語情報検索方法。
- 前記情報検索工程において検索された検索結果の表示言語の指定を行うことができる言語指定工程と、前記検索結果を指定された言語に翻訳する検索結果翻訳工程とを備え、
前記検索結果表示工程は、前記言語指定工程による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳工程により翻訳して表示することを特徴とする請求項11に記載の多言語情報検索方法。 - 複数の言語を対象としてある言語の文書から目的とする他の言語の文書の検索をコンピュータに実行させる多言語情報検索プログラムにおいて、
ある言語及び/または他の言語の文書を出力提示する出力工程と、
前記出力手段において提示されているある言語の文書情報のうち、得たい情報に関連した範囲を指定する範囲指定工程と、
指定された範囲の文書の言語を他の言語に翻訳する翻訳工程と、
前記翻訳手段による翻訳結果に基づいて、前記指定された範囲の文書と類似の文書を検索するための情報検索式を生成する情報検索式生成工程と、
前記情報検索式に基づいて他の言語の文書を検索する情報検索工程と
をコンピュータに実行させることを特徴とする多言語情報検索プログラム。 - 前記情報検索式生成工程は、前記翻訳機能において得られる翻訳結果に含まれるのうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を用いて、情報検索式の生成を行うことを特徴とする請求項13に記載の多言語情報検索プログラム。
- 前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を記憶する記憶手段を備え、
前記情報検索式生成工程は、前記記憶手段に記憶されている属性情報に基づいて情報検索式を生成することを特徴とする請求項14に記載の多言語情報検索プログラム。 - 前記翻訳工程において得られる翻訳結果に含まれる情報のうち、主格や目的格などの格構造情報、名詞句情報、品詞情報、時制情報、活用情報の少なくともひとつの属性情報を指定するための属性指定工程を備え、
前記情報検索式生成工程は、前記属性指定工程において指定した属性情報に基づいて情報検索式を生成することを特徴とする請求項15に記載の多言語情報検索プログラム。 - 前記情報検索工程において検索された検索結果を表示する検索結果表示工程を備えたことを特徴とする請求項13〜16のいずれかに記載の多言語情報検索プログラム。
- 前記情報検索工程において検索された検索結果の表示言語の指定を行うことができる言語指定工程と、前記検索結果を指定された言語に翻訳する検索結果翻訳工程とを備え、
前記検索結果表示工程は、前記言語指定工程による表示言語の指定に基づいて、前記検索結果をそのまま、あるいは前記検索結果翻訳工程により翻訳して表示することを特徴とする請求項17に記載の多言語情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003175784A JP2005011138A (ja) | 2003-06-20 | 2003-06-20 | 多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003175784A JP2005011138A (ja) | 2003-06-20 | 2003-06-20 | 多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005011138A true JP2005011138A (ja) | 2005-01-13 |
Family
ID=34098829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003175784A Withdrawn JP2005011138A (ja) | 2003-06-20 | 2003-06-20 | 多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005011138A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010534378A (ja) * | 2007-07-20 | 2010-11-04 | グーグル・インコーポレーテッド | 自動拡張言語サーチ |
JP2011138242A (ja) * | 2009-12-28 | 2011-07-14 | Hitachi-Ge Nuclear Energy Ltd | 情報参照支援システム |
JP2011204001A (ja) * | 2010-03-25 | 2011-10-13 | Fujitsu Toshiba Mobile Communications Ltd | 情報処理装置 |
JP2013225200A (ja) * | 2012-04-20 | 2013-10-31 | Ntt Comware Corp | 意味的対応付け装置及びその処理方法とプログラム |
-
2003
- 2003-06-20 JP JP2003175784A patent/JP2005011138A/ja not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010534378A (ja) * | 2007-07-20 | 2010-11-04 | グーグル・インコーポレーテッド | 自動拡張言語サーチ |
US9164987B2 (en) | 2007-07-20 | 2015-10-20 | Google Inc. | Translating a search query into multiple languages |
JP2011138242A (ja) * | 2009-12-28 | 2011-07-14 | Hitachi-Ge Nuclear Energy Ltd | 情報参照支援システム |
JP2011204001A (ja) * | 2010-03-25 | 2011-10-13 | Fujitsu Toshiba Mobile Communications Ltd | 情報処理装置 |
JP2013225200A (ja) * | 2012-04-20 | 2013-10-31 | Ntt Comware Corp | 意味的対応付け装置及びその処理方法とプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4881878B2 (ja) | マルチリンガル情報検索のためのシステム、方法、ソフトウエア、およびインタフェース | |
KR102049034B1 (ko) | 상호대화형 질의 완료 템플릿들 | |
JP2010527494A (ja) | 多言語情報検索 | |
JP2006501582A (ja) | 電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈 | |
US6985147B2 (en) | Information access method, system and storage medium | |
JP2008052548A (ja) | 検索プログラム、情報検索装置及び情報検索方法 | |
JP2007072594A (ja) | 翻訳装置、翻訳方法および翻訳プログラム、媒体 | |
JP2005011138A (ja) | 多言語情報検索システム、多言語情報検索方法および多言語情報検索プログラム | |
JP4469817B2 (ja) | 文書検索システム及びプログラム | |
JPH08287088A (ja) | 情報検索方法及びその装置 | |
JP4845857B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP4000332B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5073423B2 (ja) | 訳語検索支援装置、訳語検索支援方法および訳語検索支援プログラム | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JPH0969087A (ja) | 文書作成装置及び文書作成方法 | |
JP2005234732A (ja) | 文書管理装置および方法 | |
JP5344649B2 (ja) | 文字列変換装置、文字列変換方法、プログラムおよび記録媒体 | |
JPH1145280A (ja) | 他言語文書検索システム、他言語文書検索プログラムが記憶された記憶媒体、及び他言語文書検索方法 | |
JP2003196309A (ja) | 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム | |
JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
JPS61223980A (ja) | 翻訳処理装置 | |
US20170052966A1 (en) | Translating search engine | |
JP2005234771A (ja) | 文書管理装置および方法 | |
JP2000242643A (ja) | 英文作成支援装置及び方法並びに記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050330 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20060220 |