JP2012243130A

JP2012243130A - 情報検索装置、方法、及びプログラム

Info

Publication number: JP2012243130A
Application number: JP2011113493A
Authority: JP
Inventors: Masaaki Nagata; 昌明永田; Yoshihiko Hayashi; 良彦林
Original assignee: Nippon Telegraph and Telephone Corp; Osaka University NUC
Current assignee: Nippon Telegraph and Telephone Corp; Osaka University NUC
Priority date: 2011-05-20
Filing date: 2011-05-20
Publication date: 2012-12-10

Abstract

【課題】言語横断型の情報検索において、ユーザにとって使い易く、かつ精度の高い情報検索を行う。
【解決手段】検索要求解析部２２で、原言語で入力された検索要求に含まれる検索語を抽出し、対訳取得部２３で、検索語に対応する目的言語における翻訳語候補リストを取得し、画像検索部２４で、翻訳語候補リストに含まれる各翻訳語候補に対する画像情報を検索する。画像適合性算出部２５で、原言語の検索語、検索語のある語義に対する翻訳語候補、翻訳語候補対して取得された画像情報集合を含む語義表現データ毎に属性ベクトルを演算し、画像適合性モデル４０を参照して、検索語の示す意味と検索された画像との画像適合性を算出する。ユーザ提示情報生成部２６で、語義表現データ及び画像適合性に基づくユーザ提示情報をユーザに提示する。情報検索部２７は、ユーザによって翻訳語候補リストから選択された翻訳語をキーとして情報検索を行う。
【選択図】図１

Description

本発明は、情報検索装置、方法、及びプログラムに係り、特に、ユーザが検索要求に用いる言語（第１言語）と検索対象となるドキュメントの記述言語(第２言語)が異なる言語横断型の情報検索装置、方法、及びプログラムに関する。

従来、ユーザが検索要求に用いる言語（第１言語、原言語）と検索対象となるドキュメントの記述言語(第２言語、目的言語)が異なる言語横断型の情報検索装置において、ユーザの検索要求を適切に目的言語へと翻訳することは、重要な課題として認識されている（例えば、非特許文献１参照）。この課題を解決する手段として、ユーザの検索要求に含まれる検索語の翻訳語候補を要素として持つ目的言語における言語表現とその原言語への逆翻訳結果を提示し、ユーザに選択させる情報検索支援装置が提案されている（例えば、特許文献１参照）。これにより、ユーザが目的言語の知識が乏しい場合にも、ユーザにより適切な翻訳語が選択できるように支援している。

また、目的言語における翻訳語を検索クエリとする画像を提示することにより、ユーザが目的言語の知識が乏しい場合にも適切な翻訳語の選択ができるように支援する情報検索装置も提案されている（例えば、特許文献２及び非特許文献２参照）。

特許第４１４０３４３号公報特開２０１０−１９８５２５号公報

林他２名、「多言語情報アクセスシステム」、ＮＴＴ技術ジャーナル、２００２年１月号、pp.76-80. 林他２名、「言語横断情報検索のクエリ翻訳曖昧性解消のための画像情報の利用」、言語処理学会第１５回年次大会、２００９年．

言語横断型情報検索において、ユーザの検索要求と検索対象のドキュメントの記述とをマッチングさせることが必要となる。この際、ユーザの用いる原言語におけるユーザの検索要求をドキュメントの記述言語である目的言語へ翻訳する場合、原言語におけるユーザの検索要求が適切に目的言語へと翻訳されることが望ましいが、一般にユーザは目的言語の知識を有しないため、検索要求が適切に目的言語へと翻訳されているか否かを確認することができない。適切な翻訳がなされなければ、精度の高い情報検索を行うことは不可能である。

しかしながら、特許文献１の手法では、この課題に対して言語情報の提示による支援を実施しているが、言語情報は一覧性に欠けるため、効率よく適切な翻訳語を選択することができない、という問題がある。

また、非特許文献２や特許文献２の手法では、ユーザが目的言語の知識が乏しい場合にも適切な翻訳語の選択ができるように、目的言語における翻訳語を検索クエリとする画像を提示しているが、抽象的な概念などを表す検索要求に対しては、そもそもユーザの意図を表す画像が得られ難い、または、翻訳語が目的言語において原言語とは全く異なる意味や用法を持つ場合（例えば、商品名などとして用いられる場合）などにおいては、画像が有用な翻訳語選択の手がかりとなり難い場合がある、という問題がある。

本発明は上記問題点に鑑みてなされたものであり、言語横断型の情報検索において、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる情報検索装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、本発明の情報検索装置は、ユーザにより第１言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、前記第１言語とは異なる第２言語に翻訳された少なくとも１つの翻訳語候補を取得する取得手段と、画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索する画像検索手段と、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出する算出手段と、前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示する提示手段と、前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する情報検索手段と、を含んで構成されている。

本発明の情報検索装置によれば、取得手段が、ユーザにより第１言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、第１言語とは異なる第２言語に翻訳された少なくとも１つの翻訳語候補を取得し、画像検索手段が、画像情報を記憶した記憶手段から、取得手段により取得された翻訳語候補に対応する画像情報を検索する。検索語が複数の語義を有する場合には、複数の翻訳語候補が取得される。

そして、算出手段が、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、検索要求に含まれる検索語が示す意味、及び画像検索手段により検索された画像情報に基づいて、翻訳語候補毎に、検索語と画像情報との適合性を算出する。適合性は、翻訳語候補に対応して検索された画像が、検索語の示す意味とどの程度適合しているかを示すものである。

そして、提示手段が、翻訳語候補及び画像情報と共に、算出手段により算出された適合性をユーザに提示し、情報検索手段が、提示手段による提示に対してユーザにより選択された翻訳語候補を、検索語に対する翻訳語として取得し、選択された翻訳語に対応する情報を検索する。

このように、ユーザの第１言語による検索要求を第２言語へと翻訳する際に得られる翻訳候補語に対応する画像情報を検索し、検索要求に含まれる検索語の示す意味と画像情報との適合性を算出し、翻訳語候補及び画像情報と共にユーザに提示するため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識し、さらに検索語の示す意味に基づいて提示される翻訳語の選択が容易になり、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる。

また、前記画像適合性モデルは、検索語の示す意味及び画像情報から演算される属性ベクトルに、該画像情報が前記検索語の示す意味と適合するか否かを示す情報を追加した学習用データを用いて学習することにより構築され、前記算出手段は、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて演算される属性ベクトルと、前記画像適合性モデルとに基づいて、前記適合性を算出することができる。

また、前記画像情報は、画像及び該画像に付加された付加情報で構成され、前記算出手段は、前記付加情報に含まれる情報を前記属性ベクトルとして抽出することができる。また、前記属性ベクトルに、前記検索語に関する属性、及び前記翻訳語候補に関する属性の少なくとも一方を加えてもよい。これにより、より精度良く適合性を算出することができる。

また、本発明の情報検索装置は、検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築する構築手段をさらに含んで構成してもよい。

また、本発明の情報検索方法は、取得手段と、画像検索手段と、算出手段と、提示手段と、情報検索手段とを含む情報検索装置における情報検索方法であって、前記取得手段は、ユーザにより第１言語で入力された情報の検索要求に含まれる検索語に基づいて、検索対象の情報の記述言語であって、前記第１言語とは異なる第２言語に翻訳された少なくとも１つの翻訳語候補を取得し、前記画像検索手段は、画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索し、前記算出手段は、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出し、前記提示手段は、前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示し、前記情報検索手段は、前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する方法である。

また、上記の情報検索方法において、前記情報検索装置は、構築手段をさらに含み、前記構築手段は、検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築するようにしてもよい。

また、本発明の情報検索プログラムは、コンピュータを、上記の情報検索装置を構成する各手段として機能させるためのプログラムである。

以上説明したように、本発明の情報検索装置、方法、及びプログラムによれば、ユーザの第１言語による検索要求を第２言語へと翻訳する際に得られる翻訳候補語に対応する画像情報を検索し、検索要求に含まれる検索語の示す意味と画像情報との適合性を算出し、翻訳語候補及び画像情報と共にユーザに提示するため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識し、さらに検索語の示す意味に基づいて提示される翻訳語の選択が容易になり、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる、という効果が得られる。

本実施の形態の言語横断型情報検索装置の機能的構成を示すブロック図である。「機織り」の翻訳語候補リストに含まれる各翻訳語候補に対して取得した画像データ集合の一例を示すイメージ図である。「産業」の翻訳語候補リストに含まれる各翻訳語候補に対して取得した画像データ集合の一例を示すイメージ図である。「明日」の翻訳語候補リストに含まれる各翻訳語候補に対して取得した画像データ集合の一例を示すイメージ図である。画像情報の情報構造を説明するための図である。語義表現データを概念的に表した図である。属性ベクトルの概念を示す図である。属性ベクトルの構成の一例を示す図である。画像適合性モデルの概念及び簡単化した数値例を示す図である。ユーザに提示される画面構成の一例を示すイメージ図である。本実施の形態の言語横断型情報検索装置におけるモデル構築処理ルーチンの内容を示すフローチャートである。本実施の形態の言語横断型情報検索装置における情報検索処理ルーチンの内容を示すフローチャートである。

以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、第１言語（原言語）を日本語、第２言語（目的言語）を英語とし、日本語で入力された検索要求に対して、英語で記述されたドキュメントを検索する場合について説明する。ここで、ドキュメントとは、文書ファイルやＷｅｂページなどのテキスト情報だけでなく、画像や映像などのマルチメディア情報も含む。非テキストメディアの情報に関しては、テキストによる何らかの記述（タイトル、キーワード、サマリーなど)が付与されているものとする。

本実施の形態に係る言語横断型情報検索装置１０は、ＣＰＵ（Central Processing Unit）と、ＲＡＭ（Random Access Memory）と、後述する情報検索処理ルーチンを実行するためのプログラムを記憶したＲＯＭ（Read Only Memory）とを備えたコンピュータで構成されている。

このコンピュータは、機能的には、図１に示すように、ユーザインタフェース部２０、検索要求取得部２１、検索要求解析部２２、対訳取得部２３、画像検索部２４、画像適合性算出部２５、ユーザ提示情報生成部２６、情報検索部２７、及び属性解析部５０を含んだ構成で表すことができる。また、画像検索部２４には画像サーチエンジン２４１が接続され、情報検索部２７にはサーチエンジン２７１が接続されている。また、画像適合性算出部２５は、画像適合性モデル４０を参照し、さらに、属性解析部５０を利用する。画像適合性モデル４０は、モデル構築部３０により予め構築されている。なお、検索要求取得部２１、検索要求解析部２２、及び対訳取得部２３が本発明の取得手段の一例である。

ユーザインタフェース部２０は、キーボードやマウス等の入力装置からユーザにより入力された入力情報を受け付けると共に、ユーザに対する情報が表示装置に表示されるなどしてユーザに提示されるように、各種情報を出力する。また、各部間でのデータの授受など、各部の処理を制御する。

検索要求取得部２１は、ユーザインタフェース部２０を介して入力されたユーザの検索要求を取得する。ここでは、「機織り産業の明日」という日本語の検索要求が取得されるものとする。検索要求取得部２１は、取得した検索要求を、ユーザインタフェース部２０を介して検索要求解析部２２へ受け渡す。

検索要求解析部２２は、検索要求取得部２１で取得された原言語による検索要求を解析する。具体的には、公知の形態素解析処理技術（例えば、非特許文献３「「形態素・構文解析」、永田、自然言語処理―基礎と応用―（田中監修）、電子情報通信学会、pp.2-38.」）を用いて、検索要求に含まれる名詞、動詞、形容詞などの内容語を抽出する。検索要求例「機織り産業の明日」に対しては、「機織り」、「産業」、「明日」という３つの内容語が得られる。以下ではこれらの抽出された各語を検索語と呼ぶ。検索要求解析部２２は、抽出した検索語をユーザインタフェース部２０を介して対訳取得部２３へ受け渡す。

対訳取得部２３は、各検索語に対する目的言語の翻訳語候補リストを取得する。翻訳語候補は、対訳辞書を検索するか、または既存の機械翻訳システムを利用することにより取得することができる。ここでは、対訳辞書を利用する場合について説明する。

一般に、対訳辞書は見出しとなっている原言語の単語の語義毎に、目的言語における訳語が定められている。従って、この対訳辞書を検索して得られた訳語を翻訳語候補として、検索語と対応付けることにより、翻訳語候補リストを取得することができる。１つの単語が複数の語義を有する場合には、１つの単語に対して複数の訳語が定められることになり、この場合には、その全ての訳語を取得する。すなわち、翻訳語候補リストは、原言語における検索語と目的語における少なくとも１つの翻訳語候補で構成される。例えば、検索語の１つである「機織り」に対して、「職業としての機織り」、「行為としての機織り」、及び「こおろぎ(昆虫)」の３つの語義があるとし、それぞれについて、「ｗｅａｖｅｒ」、「ｗｅａｖｉｎｇ」、及び「ｇｒａｓｓｈｏｐｐｅｒ」という訳語が対訳辞書に定められている場合、「機織り」の翻訳語候補リストは、以下のように取得される。

検索語“機織り”：｛(“ｗｅａｖｅｒ”)、（“ｗｅａｖｉｎｇ”）、（“ｇｒａｓｓｈｏｐｐｅｒ”）｝
同様にして、他の２つの検索語に関しても、翻訳語候補リストが以下のように取得される。

検索語“産業”：｛（“ｉｎｄｕｓｔｒｙ”）｝
検索語“明日”：｛（“ｔｏｍｏｒｒｏｗ”）、（“ｆｕｔｕｒｅ”）｝

対訳取得部２３は、取得した翻訳語候補リストをユーザインタフェース部２０を介して画像検索部２４へ受け渡す。

画像検索部２４は、画像サーチエンジン２４１を用いて、翻訳語候補リストに含まれる各翻訳語候補に対する画像を取得する。ここで画像サーチエンジン２４１は、データベースなどに蓄積された画像を検索するものでもよいし、適切な通信手段を介して遠隔実行できるサーバー、例えばＷＷＷ上で利用可能な画像検索エンジンであってもよい。以下では、後者の画像検索エンジンを利用する場合について説明する。

「機織り」の翻訳語候補リストに含まれる｛（“ｗｅａｖｅｒ”）、（“ｗｅａｖｉｎｇ”）、（“ｇｒａｓｓｈｏｐｐｅｒ”）｝の各翻訳語候補に対して取得した画像データ集合の例を、それぞれ図２（ａ）、（ｂ）、及び（ｃ）に示す。ここで、同図（ａ）には、“機織り機”の画像に加えて、“ｗｅａｖｅｒ”という語を名前に含む著名人の画像も検索されている。

また、「産業」の翻訳語候補リストに含まれる｛（“ｉｎｄｕｓｔｒｙ”）｝の翻訳語候補に対して取得した画像データ集合の例を図３に、「明日」の翻訳語候補リスト｛（“ｔｏｍｏｒｒｏｗ”）、（“ｆｕｔｕｒｅ”）｝の各翻訳語候補に対して取得した画像データ集合の例をそれぞれ図４（ａ）及び図４（ｂ）に示す。

なお、ＷＷＷ上で利用できる多くの画像検索エンジンにおいては、画像データに加え、その画像が存在するＷｅｂサイトの論理的な所在位置（ＵＲＬ）、画像ファイル名などの情報の他、場合によっては、キーワードやサマリーなどの画像に付加された画像付加情報を取得することができる。以下、１点の画像データとこれに対して得られた画像付加情報とを合わせた情報構造を画像情報と呼ぶ。

図２（ａ）中の（ａ−１）に示した画像に対する画像情報の例を図５に示す。ここでの画像付加情報は、ＷｅｂサイトＵＲＬ、画像ファイル名、サマリーとしている。

また、画像検索部２４は、各画像データに対する画像付加情報を翻訳語候補毎に集約して集約画像付加情報とし、原言語の検索語、検索語のある語義に対する翻訳語候補、翻訳語候補に対して取得された画像情報集合、及び画像情報集合に対する集約画像付加情報を組にした語義表現データを、ユーザインタフェース部２０を介して画像適合性算出部２５に受け渡す。図６に語義表現データを概念的に表した一例を示す。

画像適合性算出部２５は、各語義表現データを用いて、検索語（原言語）と翻訳語候補（目的言語）のペアで表現される意味に対して、得られている画像データ集合がどの程度適合しているかを表す画像適合性を算出する。このような画像適合性算出部２５の構成原理は様々考えられるが、ここでは、ナイーブベイズ法を用いる場合について説明する。ナイーブベイズ法は、比較的単純であるにも関わらず良好な精度を示すことで知られている機械学習の一手法である（例えば、非特許文献４「「言語処理のための機械学習入門」、pp.101-117、高村、コロナ社、２０１０年」参照）。

画像適合性算出部２５は、まず、属性解析部５０を利用することにより、語義表現データに対する属性ベクトルを構成する。

ここで、属性解析部５０で演算される属性ベクトルについて説明する。図７に属性ベクトルの概念を示す。属性ベクトルはＮ次元のベクトルであり、ベクトルの各要素は１つの属性に対応している。また、各要素の値は、語義表現データ中にその要素に対応する属性が存在すれば１、存在しなければ０を取る。ここでは、検索語に関する属性群、翻訳語候補に関する属性群、画像付加情報に関する属性群の３種類の属性群を用いる。

検索語に関する属性群は、検索語の各語義が持ちうる意味属性、検索語の各語義に対する語義親密度レベルの２種類の情報からなる。このような情報を属性として用いるのは、具体的な事物を表す単語や親密度が高い単語に対しては、その語義を表す画像手がかりがＷＷＷから得易いという知見に基づくものである（例えば、非特許文献５「「インタラクティブな言語横断検索における画像手がかりの有効性」、林他２名、言語処理学会第１７回年次大会、２０１１年」参照）。意味属性は、例えば、非特許文献６（「日本語語彙大系」、池原他７名、岩波書店、１９９７年）のような公知の言語資源から得ることができる。語義親密度レベルは、例えば、非特許文献７（「基本語データベース：語義別単語親密度」、天野他１名、学習研究社、２００８年）のような公知の言語資源から得ることのできる語義親密度を適当にレベル化することにより得ることができる。

翻訳語候補に関する属性群は、各翻訳語候補の各語義が持ちうる意味属性、各翻訳語候補の各語義に対する語義親密度レベル、及び各翻訳語候補の固有名分類の３種類の情報からなる。前者の２つの情報を属性として用いるのは、検索語に関する属性群の場合と同様の理由に基づく。また、固有名分類に関する属性は、翻訳語候補の単語が、人名、地名、組織名、製品名などの固有名詞として用いられている場合には、語義を表す画像手がかりがＷＷＷから得難い場合があるという知見に基づくものである（例えば、非特許文献５参照）。意味属性は、例えば、非特許文献８（“WordNet．A lexical database for English、” http://wordnet.princeton.edu/）のような公知の言語資源から得ることができる。語義親密度レベルは、例えば、非特許文献９（「日本人英語学習者の英単語親密度文字編―教育・研究のための第二言語データベース」、横川、くろしお出版、２００６年）のような公知の情報から得ることのできる語義親密度を適当にレベル化することにより得ることができる。固有名分類は、一般に固有名認識として知られている技術（例えば、特許文献１０「「質問応答システム」、磯崎ほか３名、pp.76-89、コロナ社、２０１０年」参照）を適用することにより得ることができる。

画像付加情報に関する属性群は、ＷｅｂサイトのＵＲＬ、キーワードの２種類の情報からなる。前者の情報を属性として用いるのは、特定のＷｅｂサイトはあるタイプ（例えば、人物や商品）の画像を蓄積している場合があるという傾向に基づく。また、後者の情報を属性として用いるのは、特定のキーワードの存在が画像のタイプ（例えば、人物や商品）を表す可能性があるという傾向に基づく。ある画像に対するＷｅｂサイトのＵＲＬは、画像サーチエンジンから取得できる情報に含まれるため、これが特定の既知のＷｅｂサイトであるかは容易に知ることができる。画像付加情報におけるファイル名及びサマリーからは、これらを構成する単語集合を容易に抽出することができ、抽出された単語集合に特定のキーワードが含まれているかは容易に知ることができる。

従って、属性解析部５０は、属性ベクトルを構成するために必要な、各属性に対する属性値を上記の各属性についての説明で示した概略に従って求め、属性ベクトルを演算する。図８に図６中の（ａ）の語義表現データを例とした場合の属性ベクトルの構成例を示す。

画像適合性算出部２５は、属性解析部５０で演算された属性ベクトルに対して、画像適合性モデル４０を参照することにより、画像適合性を算出する。ここで、画像適合性モデル４０は、後述するモデル構築部３０により事前に構築されているものとする。

図９に画像適合性モデル４０の概念、及び簡単化した数値例を示す。本実施の形態では、ナイーブベイズ法に基づいているので、画像適合性モデル４０は、各語義表現データにおいて、
（ｉ）画像データ集合が検索語の示す意味に適合する適合画像である場合（Ａ）の事前確率Ｐ（Ａ）、
（ｉｉ）画像データ集合が適合画像である場合に、語義表現データから演算された属性ベクトルＶ中のある属性ｆ_ｉが関連する条件付き確率Ｐ（ｆ_ｉ｜Ａ）、
（ｉｉｉ）画像データ集合が適合画像でない場合（ＮＡ）に、語義表現データから演算された属性ベクトルＶ中のある属性ｆ_ｉが関連する条件付き確率Ｐ（ｆ_ｉ｜ＮＡ）、
の３種類の確率情報からなる。

図９において、１、２、・・・、１０５、・・・などの数字は、属性に対するインデックス（属性ＩＤ）を表しており、図７及び図８における属性ＩＤと対応している。

画像適合性算出部２５は、画像適合性Ｘを、ある語義表現データから演算されるＮ次元の属性ベクトルＶが適合画像である場合、及び適合画像でない場合の対数尤度比として、上記（ｉ）〜（ｉｉｉ）の３種類の確率情報を用いて、下記（１）式に従って算出する。

Ｘが正の値であれば、与えられた語義表現データに対応する画像データ集合が適合画像であることを示し、Ｘの値が大きいほどその適合性は高いことを示す。

例えば、図６中（ａ）の語義表現データに対しては、適合画像ではないという判定が得られる。これは、「ｗｅａｖｅｒ」がある俳優の人名となっており、取得された画像データ集合において、この人物の写真が５件中４件を占めていることによる。画像適合性算出部２５は、上記と同様の過程により、入力された全ての語義表現データに対して画像適合性を算出し、語義表現データと共に、ユーザインタフェース部２０を介してユーザ提示情報生成部２６へ受け渡す。

ユーザ提示情報生成部２６は、語義表現データ、及び画像適合性に基づいて、ユーザの検索要求に含まれる検索語に対する翻訳語の選択を支援するための画面を構成するユーザ提示情報を生成する。生成されたユーザ提示情報は、ユーザインタフェース部２０を介して表示装置に表示されるなどして、ユーザに提示される。

図１０に図６の語義表現データ、及び上記の画像適合性に対して構成した画面例を示す。この例では、図６の語義表現データ各々に対して、（ａ）：ｘ１、（ｂ）：ｘ２、（ｃ）：ｘ３、（ｄ）：ｘ４、（ｅ）：ｘ５、（ｆ）：ｘ６、という画像適合性（いずれも実数値）が得られ、ｘ３＞ｘ２＞ｘ４＞ｘ１＞ｘ６＞ｘ５、という大小関係が成り立つものとする。各検索語に対して、翻訳語候補が提示され、さらに、各翻訳語候補を用いて画像検索を行った結果として得られる画像が提示される。また、これらの画像が検索語の意味を適切に表している度合いを示す目安である画像適合性の情報が、「高」（ｘ２、ｘ３）、「中」（ｘ４）、「低」（ｘ１、ｘ５、ｘ６）の３段階で表示されている。なお、画像適合性の段階数は、３段階に限定されるものではなく、２段階でもよいし、より細かい段階数としてもよい。また、画像適合性が高い順に翻訳語候補をランキング形式で表示するようにしてもよい。

また、翻訳語候補は、例えば、チェックボックス付きで表示するなど、ユーザによって選択可能な状態で提示される。ユーザは提示された翻訳語候補毎の画像、及び画像適合性を手がかりとして、翻訳語候補の中から適切な翻訳語を選択することができる。選択された翻訳語は、ユーザインタフェース部２０を介して情報検索部２７へ受け渡す。ここでは、ユーザが「ｗｅａｖｉｎｇｍａｃｈｉｎｅ」、「ｉｎｄｕｓｔｒｙ」及び「ｆｕｔｕｒｅ」を選択したものとする。

情報検索部２７は、ユーザに選択された翻訳語から検索クエリを生成し、これをサーチエンジン２７１へ送ることで目的とする情報検索を行う。ここで、サーチエンジン２７１は、データベースなどに蓄積されたドキュメントを検索するものでもよいし、適切な通信手段を介して遠隔実行できるサーバーであっても良い。ここでは、「ｗｅａｖｉｎｇｍａｃｈｉｎｅ」、「ｉｎｄｕｓｔｒｙ」及び「ｆｕｔｕｒｅ」をキーとする情報が検索され、ユーザインタフェース部２０を介して、情報検索結果がユーザに提示される。

モデル構築部３０は、画像適合性データ取得部３１及び画像適合性モデル構築部３２を含んだ構成で表すことができ、画像適合性モデル４０を構築する。また、画像適合性モデル構築部３２は、属性解析部５０を利用する。

画像適合性データ取得部３１は、予め準備された学習用の語義表現データが入力されると、これを画像適合性モデル構築部３２へと受け渡す。学習用の語義表現データとは、図６に示したような検索語、検索語に対応する翻訳語候補、翻訳語候補に基づいて検索された画像情報、及び各画像情報の画像付加情報を集約した集約画像付加情報で構成された語義表現データに対して、その語義表現データに含まれる画像データ集合が検索語の示す意味を適切に表しているか否かに関する人手による評定である適合性評定データを追加したデータである。適合性評定データは、例えば、適合性有（１）または適合性無（０）の２値とすることができる。

画像適合性モデル構築部３２は、各学習用の語義表現データから属性解析部５０を利用して、画像適合性算出部２５と同様の処理により属性ベクトルを演算する。そして演算した属性ベクトル、及びその属性ベクトルに対する適合性評定データに基づいて、画像適合性モデル４０を構築する。本実施の形態では、ナイーブベイズ法に基づいてモデルを構築するため、画像適合性モデル４０は、各学習用の語義表現データに対し、
（Ｉ）画像データ集合が適合画像である場合（Ａ）の事前確率Ｐ（Ａ）、
（ＩＩ）画像データ集合が適合画像である場合に、学習用の語義表現データから演算された属性ベクトルＶ中のある属性ｆ_ｉが関連する条件付き確率Ｐ（ｆ_ｉ｜Ａ）、
（ＩＩＩ）画像データ集合が適合画像でない場合（ＮＡ）に、学習用の語義表現データから演算された属性ベクトルＶ中のある属性ｆ_ｉが関連する条件付き確率Ｐ（ｆ_ｉ｜ＮＡ）、
の３種類の確率情報からなる。これらの確率情報は、最尤推定として知られる方法により推定する。すなわち、
・適合性有という適合性評定データが付与されている学習用の語義表現データ件数を全データ件数で除する。

・各属性ｆ_ｉについて、この属性値が１であるデータ件数を適合性有という適合性評定データが付与されているデータ件数で除する。

・各属性ｆ_ｉについて、この属性値が１であるデータ件数を適合性無という適合性評定データが付与されているデータ件数で除する。
以上により、図９にその概念を示したような画像適合性モデルを構築することができる。

次に、図１１を参照して、本実施の形態の言語横断型情報検索装置１０において実行されるモデル構築処理ルーチンについて説明する。

ステップ１００で、学習用の語義表現データを取得する。次に、ステップ１０２で、上記ステップ１００で取得した学習用の語義表現データ各々について、属性ベクトルを演算する。次に、ステップ１０４で、上記ステップ１０２で演算した属性ベクトル、及びその属性ベクトルに対する適合性評定データに基づいて、ナイーブベイズ法により画像適合性モデルを構築する。次に、ステップ１０６で、上記ステップ１０４で構築された画像適合性モデルを所定の記憶領域に記憶して、処理を終了する。

次に、図１２を参照して、本実施の形態の言語横断型情報検索装置１０において実行される情報検索処理ルーチンについて説明する。

ステップ２００で、ユーザにより原言語で入力された検索要求を取得する。次に、ステップ２０２で、上記ステップ２００で取得した検索要求を公知の形態素解析処理技術を用いて解析し、検索要求に含まれる原言語の検索語を抽出する。

次に、ステップ２０４で、対訳辞書を参照して、上記ステップ２０２で抽出した原言語の検索語に対応する目的言語における少なくとも１つの翻訳語候補を抽出し、各検索語について、翻訳語候補リストを取得する。

次に、ステップ２０６で、上記ステップ２０４で取得した翻訳語候補リストに含まれる各翻訳語候補をキーとして画像検索を行い、各翻訳語候補に対する画像データ及び画像付加情報からなる画像情報集合を取得する。また、各翻訳語候補に対する画像付加情報を集約して集約画像付加情報とし、原言語の検索語、検索語のある語義に対する翻訳語候補、翻訳語候補対して取得された画像情報集合、及び画像情報集合に対する集約画像付加情報を組にした語義表現データを構成する。

次に、ステップ２０８で、上記ステップ２０６で構成された語義表現データに基づいて、語義表現データ毎に属性ベクトルを演算する。次に、ステップ２１０で、上記ステップ２０８で演算された属性ベクトルに対して、画像適合性モデル構築処理（図１０）で構築された画像適合性モデルを参照することにより、画像適合性を算出する。

次に、ステップ２１２で、上記ステップ２０６で構成された語義表現データ、及び上記ステップ２１０で算出された画像適合性に基づいて、ユーザの検索要求に含まれる検索語に対する翻訳語の選択を支援するための画面を構成するユーザ提示情報を生成し、画面をユーザに提示する。

次に、ステップ２１４で、ユーザによって翻訳語候補リストから翻訳語が選択されたか否かを判定する。翻訳語が選択された場合には、ステップ２１６へ移行し、翻訳語が選択されない場合には、本ステップの判定を繰り返す。なお、所定時間経過してもユーザにより翻訳語が選択されない場合には、本ルーチンを終了するようにしてもよい。

ステップ２１６では、上記ステップ２１４でユーザにより選択された翻訳語から検索クエリを生成し、この検索クエリに基づいて情報検索を行う。次に、ステップ２１８で、上記ステップ２１６で検索された情報をユーザに提示して、処理を終了する。

以上説明したように、本実施の形態の言語横断型情報検索装置によれば、ユーザの原言語による検索要求を目的言語へと翻訳する際に得られる各翻訳候補語をキーとする画像検索を行い、検索語、翻訳語候補、及び画像情報から演算される属性ベクトルと画像適合性モデルとに基づいて、検索される画像が検索語の意味とどの程度適合しているかを示す画像適合性を算出し、翻訳語候補毎に検索された画像と共にユーザに提示されるため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識し、さらに検索語に関連する意味に基づいて提示される翻訳語の選択が容易になり、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる。

なお、上記実施の形態では、検索語に関する属性、翻訳語候補に関する属性、及び画像付加情報に関する属性を用いて属性ベクトルを演算する場合ついて説明したが、これに限定されない。検索語と、その検索語の各翻訳語候補に対して検索された画像との適合性を算出することができるものであればよい。また、画像データに必ずしも画像付加情報が付加されている必要はなく、検索された画像データ自体から得られる特徴を属性ベクトルの要素として加えてもよい。

また、上記実施の形態では、画像適合性モデルの構築及び画像適合性の算出に、ナイーブベイズ法を用いる場合について説明したが、これに限定されず、公知の機械学習の手法を用いることができる。他の学習法を適用する場合には、属性ベクトルはその学習法に応じた属性ベクトルを演算するようにするとよい。

また、本実施の形態では、情報検索を行うための各構成と、モデル構築部とを同一のコンピュータで実現する場合について説明したが、個々のコンピュータで構成するようにしてもよい。この場合、構築された画像適合性モデルは、情報検索装置側に記憶してもよいし、モデル構築部側に記憶してもよいし、また他の外部装置に記憶してもよい。画像適合性モデルを、モデル構築部側または他の外部装置に記憶した場合には、情報検索処理の際に、ネットワーク等を介してモデル構築部または他の外部装置に記憶された画像適合性モデルを読み出すようにするとよい。

また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

また、上述の言語横断型情報検索装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。

１０言語横断型情報検索装置
２０ユーザインタフェース部
２１検索要求取得部
２２検索要求解析部
２３対訳取得部
２４画像検索部
２５画像適合性算出部
２６ユーザ提示情報生成部
２７情報検索部
３０モデル構築部
３１画像適合性データ取得部
３２画像適合性モデル構築部
５０属性解析部
２４１画像サーチエンジン
２７１サーチエンジン

Claims

ユーザにより第１言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、前記第１言語とは異なる第２言語に翻訳された少なくとも１つの翻訳語候補を取得する取得手段と、
画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索する画像検索手段と、
検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出する算出手段と、
前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示する提示手段と、
前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する情報検索手段と、
を含む情報検索装置。
前記画像適合性モデルは、検索語の示す意味及び画像情報から演算される属性ベクトルに、該画像情報が前記検索語の示す意味と適合するか否かを示す情報を追加した学習用データを用いて学習することにより構築され、
前記算出手段は、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて演算される属性ベクトルと、前記画像適合性モデルとに基づいて、前記適合性を算出する
請求項１記載の情報検索装置。
前記画像情報は、画像及び該画像に付加された付加情報で構成され、
前記算出手段は、前記付加情報に含まれる情報を用いて前記属性ベクトルを演算する
請求項２記載の情報検索装置。
前記属性ベクトルに、前記翻訳語候補に関する属性を加えた請求項２または請求項３記載の情報検索装置。
検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築する構築手段をさらに含む請求項１〜請求項４のいずれか１項記載の情報検索装置。
取得手段と、画像検索手段と、算出手段と、提示手段と、情報検索手段とを含む情報検索装置における情報検索方法であって、
前記取得手段は、ユーザにより第１言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、前記第１言語とは異なる第２言語に翻訳された少なくとも１つの翻訳語候補を取得し、
前記画像検索手段は、画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索し、
前記算出手段は、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出し、
前記提示手段は、前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示し、
前記情報検索手段は、前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する
情報検索方法。
前記情報検索装置は、構築手段をさらに含み、
前記構築手段は、検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築する
請求項６記載の情報検索方法。
コンピュータを、請求項１〜請求項５のいずれか１項記載の情報検索装置を構成する各手段として機能させるための情報検索プログラム。