JP2012243130A - 情報検索装置、方法、及びプログラム - Google Patents

情報検索装置、方法、及びプログラム Download PDF

Info

Publication number
JP2012243130A
JP2012243130A JP2011113493A JP2011113493A JP2012243130A JP 2012243130 A JP2012243130 A JP 2012243130A JP 2011113493 A JP2011113493 A JP 2011113493A JP 2011113493 A JP2011113493 A JP 2011113493A JP 2012243130 A JP2012243130 A JP 2012243130A
Authority
JP
Japan
Prior art keywords
image
information
search
word
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011113493A
Other languages
English (en)
Inventor
Masaaki Nagata
昌明 永田
Yoshihiko Hayashi
良彦 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Osaka University NUC
Original Assignee
Nippon Telegraph and Telephone Corp
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Osaka University NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011113493A priority Critical patent/JP2012243130A/ja
Publication of JP2012243130A publication Critical patent/JP2012243130A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】言語横断型の情報検索において、ユーザにとって使い易く、かつ精度の高い情報検索を行う。
【解決手段】検索要求解析部22で、原言語で入力された検索要求に含まれる検索語を抽出し、対訳取得部23で、検索語に対応する目的言語における翻訳語候補リストを取得し、画像検索部24で、翻訳語候補リストに含まれる各翻訳語候補に対する画像情報を検索する。画像適合性算出部25で、原言語の検索語、検索語のある語義に対する翻訳語候補、翻訳語候補対して取得された画像情報集合を含む語義表現データ毎に属性ベクトルを演算し、画像適合性モデル40を参照して、検索語の示す意味と検索された画像との画像適合性を算出する。ユーザ提示情報生成部26で、語義表現データ及び画像適合性に基づくユーザ提示情報をユーザに提示する。情報検索部27は、ユーザによって翻訳語候補リストから選択された翻訳語をキーとして情報検索を行う。
【選択図】図1

Description

本発明は、情報検索装置、方法、及びプログラムに係り、特に、ユーザが検索要求に用いる言語(第1言語)と検索対象となるドキュメントの記述言語(第2言語)が異なる言語横断型の情報検索装置、方法、及びプログラムに関する。
従来、ユーザが検索要求に用いる言語(第1言語、原言語)と検索対象となるドキュメントの記述言語(第2言語、目的言語)が異なる言語横断型の情報検索装置において、ユーザの検索要求を適切に目的言語へと翻訳することは、重要な課題として認識されている(例えば、非特許文献1参照)。この課題を解決する手段として、ユーザの検索要求に含まれる検索語の翻訳語候補を要素として持つ目的言語における言語表現とその原言語への逆翻訳結果を提示し、ユーザに選択させる情報検索支援装置が提案されている(例えば、特許文献1参照)。これにより、ユーザが目的言語の知識が乏しい場合にも、ユーザにより適切な翻訳語が選択できるように支援している。
また、目的言語における翻訳語を検索クエリとする画像を提示することにより、ユーザが目的言語の知識が乏しい場合にも適切な翻訳語の選択ができるように支援する情報検索装置も提案されている(例えば、特許文献2及び非特許文献2参照)。
特許第4140343号公報 特開2010−198525号公報
林他2名、「多言語情報アクセスシステム」、NTT技術ジャーナル、2002年1月号、pp.76-80. 林他2名、「言語横断情報検索のクエリ翻訳曖昧性解消のための画像情報の利用」、言語処理学会第15回年次大会、2009年.
言語横断型情報検索において、ユーザの検索要求と検索対象のドキュメントの記述とをマッチングさせることが必要となる。この際、ユーザの用いる原言語におけるユーザの検索要求をドキュメントの記述言語である目的言語へ翻訳する場合、原言語におけるユーザの検索要求が適切に目的言語へと翻訳されることが望ましいが、一般にユーザは目的言語の知識を有しないため、検索要求が適切に目的言語へと翻訳されているか否かを確認することができない。適切な翻訳がなされなければ、精度の高い情報検索を行うことは不可能である。
しかしながら、特許文献1の手法では、この課題に対して言語情報の提示による支援を実施しているが、言語情報は一覧性に欠けるため、効率よく適切な翻訳語を選択することができない、という問題がある。
また、非特許文献2や特許文献2の手法では、ユーザが目的言語の知識が乏しい場合にも適切な翻訳語の選択ができるように、目的言語における翻訳語を検索クエリとする画像を提示しているが、抽象的な概念などを表す検索要求に対しては、そもそもユーザの意図を表す画像が得られ難い、または、翻訳語が目的言語において原言語とは全く異なる意味や用法を持つ場合(例えば、商品名などとして用いられる場合)などにおいては、画像が有用な翻訳語選択の手がかりとなり難い場合がある、という問題がある。
本発明は上記問題点に鑑みてなされたものであり、言語横断型の情報検索において、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる情報検索装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の情報検索装置は、ユーザにより第1言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、前記第1言語とは異なる第2言語に翻訳された少なくとも1つの翻訳語候補を取得する取得手段と、画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索する画像検索手段と、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出する算出手段と、前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示する提示手段と、前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する情報検索手段と、を含んで構成されている。
本発明の情報検索装置によれば、取得手段が、ユーザにより第1言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、第1言語とは異なる第2言語に翻訳された少なくとも1つの翻訳語候補を取得し、画像検索手段が、画像情報を記憶した記憶手段から、取得手段により取得された翻訳語候補に対応する画像情報を検索する。検索語が複数の語義を有する場合には、複数の翻訳語候補が取得される。
そして、算出手段が、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、検索要求に含まれる検索語が示す意味、及び画像検索手段により検索された画像情報に基づいて、翻訳語候補毎に、検索語と画像情報との適合性を算出する。適合性は、翻訳語候補に対応して検索された画像が、検索語の示す意味とどの程度適合しているかを示すものである。
そして、提示手段が、翻訳語候補及び画像情報と共に、算出手段により算出された適合性をユーザに提示し、情報検索手段が、提示手段による提示に対してユーザにより選択された翻訳語候補を、検索語に対する翻訳語として取得し、選択された翻訳語に対応する情報を検索する。
このように、ユーザの第1言語による検索要求を第2言語へと翻訳する際に得られる翻訳候補語に対応する画像情報を検索し、検索要求に含まれる検索語の示す意味と画像情報との適合性を算出し、翻訳語候補及び画像情報と共にユーザに提示するため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識し、さらに検索語の示す意味に基づいて提示される翻訳語の選択が容易になり、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる。
また、前記画像適合性モデルは、検索語の示す意味及び画像情報から演算される属性ベクトルに、該画像情報が前記検索語の示す意味と適合するか否かを示す情報を追加した学習用データを用いて学習することにより構築され、前記算出手段は、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて演算される属性ベクトルと、前記画像適合性モデルとに基づいて、前記適合性を算出することができる。
また、前記画像情報は、画像及び該画像に付加された付加情報で構成され、前記算出手段は、前記付加情報に含まれる情報を前記属性ベクトルとして抽出することができる。また、前記属性ベクトルに、前記検索語に関する属性、及び前記翻訳語候補に関する属性の少なくとも一方を加えてもよい。これにより、より精度良く適合性を算出することができる。
また、本発明の情報検索装置は、検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築する構築手段をさらに含んで構成してもよい。
また、本発明の情報検索方法は、取得手段と、画像検索手段と、算出手段と、提示手段と、情報検索手段とを含む情報検索装置における情報検索方法であって、前記取得手段は、ユーザにより第1言語で入力された情報の検索要求に含まれる検索語に基づいて、検索対象の情報の記述言語であって、前記第1言語とは異なる第2言語に翻訳された少なくとも1つの翻訳語候補を取得し、前記画像検索手段は、画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索し、前記算出手段は、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出し、前記提示手段は、前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示し、前記情報検索手段は、前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する方法である。
また、上記の情報検索方法において、前記情報検索装置は、構築手段をさらに含み、前記構築手段は、検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築するようにしてもよい。
また、本発明の情報検索プログラムは、コンピュータを、上記の情報検索装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の情報検索装置、方法、及びプログラムによれば、ユーザの第1言語による検索要求を第2言語へと翻訳する際に得られる翻訳候補語に対応する画像情報を検索し、検索要求に含まれる検索語の示す意味と画像情報との適合性を算出し、翻訳語候補及び画像情報と共にユーザに提示するため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識し、さらに検索語の示す意味に基づいて提示される翻訳語の選択が容易になり、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる、という効果が得られる。
本実施の形態の言語横断型情報検索装置の機能的構成を示すブロック図である。 「機織り」の翻訳語候補リストに含まれる各翻訳語候補に対して取得した画像データ集合の一例を示すイメージ図である。 「産業」の翻訳語候補リストに含まれる各翻訳語候補に対して取得した画像データ集合の一例を示すイメージ図である。 「明日」の翻訳語候補リストに含まれる各翻訳語候補に対して取得した画像データ集合の一例を示すイメージ図である。 画像情報の情報構造を説明するための図である。 語義表現データを概念的に表した図である。 属性ベクトルの概念を示す図である。 属性ベクトルの構成の一例を示す図である。 画像適合性モデルの概念及び簡単化した数値例を示す図である。 ユーザに提示される画面構成の一例を示すイメージ図である。 本実施の形態の言語横断型情報検索装置におけるモデル構築処理ルーチンの内容を示すフローチャートである。 本実施の形態の言語横断型情報検索装置における情報検索処理ルーチンの内容を示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、第1言語(原言語)を日本語、第2言語(目的言語)を英語とし、日本語で入力された検索要求に対して、英語で記述されたドキュメントを検索する場合について説明する。ここで、ドキュメントとは、文書ファイルやWebページなどのテキスト情報だけでなく、画像や映像などのマルチメディア情報も含む。非テキストメディアの情報に関しては、テキストによる何らかの記述(タイトル、キーワード、サマリーなど)が付与されているものとする。
本実施の形態に係る言語横断型情報検索装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する情報検索処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。
このコンピュータは、機能的には、図1に示すように、ユーザインタフェース部20、検索要求取得部21、検索要求解析部22、対訳取得部23、画像検索部24、画像適合性算出部25、ユーザ提示情報生成部26、情報検索部27、及び属性解析部50を含んだ構成で表すことができる。また、画像検索部24には画像サーチエンジン241が接続され、情報検索部27にはサーチエンジン271が接続されている。また、画像適合性算出部25は、画像適合性モデル40を参照し、さらに、属性解析部50を利用する。画像適合性モデル40は、モデル構築部30により予め構築されている。なお、検索要求取得部21、検索要求解析部22、及び対訳取得部23が本発明の取得手段の一例である。
ユーザインタフェース部20は、キーボードやマウス等の入力装置からユーザにより入力された入力情報を受け付けると共に、ユーザに対する情報が表示装置に表示されるなどしてユーザに提示されるように、各種情報を出力する。また、各部間でのデータの授受など、各部の処理を制御する。
検索要求取得部21は、ユーザインタフェース部20を介して入力されたユーザの検索要求を取得する。ここでは、「機織り産業の明日」という日本語の検索要求が取得されるものとする。検索要求取得部21は、取得した検索要求を、ユーザインタフェース部20を介して検索要求解析部22へ受け渡す。
検索要求解析部22は、検索要求取得部21で取得された原言語による検索要求を解析する。具体的には、公知の形態素解析処理技術(例えば、非特許文献3「「形態素・構文解析」、永田、自然言語処理―基礎と応用―(田中監修)、電子情報通信学会、pp.2-38.」)を用いて、検索要求に含まれる名詞、動詞、形容詞などの内容語を抽出する。検索要求例「機織り産業の明日」に対しては、「機織り」、「産業」、「明日」という3つの内容語が得られる。以下ではこれらの抽出された各語を検索語と呼ぶ。検索要求解析部22は、抽出した検索語をユーザインタフェース部20を介して対訳取得部23へ受け渡す。
対訳取得部23は、各検索語に対する目的言語の翻訳語候補リストを取得する。翻訳語候補は、対訳辞書を検索するか、または既存の機械翻訳システムを利用することにより取得することができる。ここでは、対訳辞書を利用する場合について説明する。
一般に、対訳辞書は見出しとなっている原言語の単語の語義毎に、目的言語における訳語が定められている。従って、この対訳辞書を検索して得られた訳語を翻訳語候補として、検索語と対応付けることにより、翻訳語候補リストを取得することができる。1つの単語が複数の語義を有する場合には、1つの単語に対して複数の訳語が定められることになり、この場合には、その全ての訳語を取得する。すなわち、翻訳語候補リストは、原言語における検索語と目的語における少なくとも1つの翻訳語候補で構成される。例えば、検索語の1つである「機織り」に対して、「職業としての機織り」、「行為としての機織り」、及び「こおろぎ(昆虫)」の3つの語義があるとし、それぞれについて、「weaver」、「weaving」、及び「grasshopper」という訳語が対訳辞書に定められている場合、「機織り」の翻訳語候補リストは、以下のように取得される。
検索語“機織り”:{(“weaver”)、(“weaving”)、(“grasshopper”)}
同様にして、他の2つの検索語に関しても、翻訳語候補リストが以下のように取得される。
検索語“産業”:{(“industry”)}
検索語“明日”:{(“tomorrow”)、(“future”)}
対訳取得部23は、取得した翻訳語候補リストをユーザインタフェース部20を介して画像検索部24へ受け渡す。
画像検索部24は、画像サーチエンジン241を用いて、翻訳語候補リストに含まれる各翻訳語候補に対する画像を取得する。ここで画像サーチエンジン241は、データベースなどに蓄積された画像を検索するものでもよいし、適切な通信手段を介して遠隔実行できるサーバー、例えばWWW上で利用可能な画像検索エンジンであってもよい。以下では、後者の画像検索エンジンを利用する場合について説明する。
「機織り」の翻訳語候補リストに含まれる{(“weaver”)、(“weaving”)、(“grasshopper”)}の各翻訳語候補に対して取得した画像データ集合の例を、それぞれ図2(a)、(b)、及び(c)に示す。ここで、同図(a)には、“機織り機”の画像に加えて、“weaver”という語を名前に含む著名人の画像も検索されている。
また、「産業」の翻訳語候補リストに含まれる{(“industry”)}の翻訳語候補に対して取得した画像データ集合の例を図3に、「明日」の翻訳語候補リスト{(“tomorrow”)、(“future”)}の各翻訳語候補に対して取得した画像データ集合の例をそれぞれ図4(a)及び図4(b)に示す。
なお、WWW上で利用できる多くの画像検索エンジンにおいては、画像データに加え、その画像が存在するWebサイトの論理的な所在位置(URL)、画像ファイル名などの情報の他、場合によっては、キーワードやサマリーなどの画像に付加された画像付加情報を取得することができる。以下、1点の画像データとこれに対して得られた画像付加情報とを合わせた情報構造を画像情報と呼ぶ。
図2(a)中の(a−1)に示した画像に対する画像情報の例を図5に示す。ここでの画像付加情報は、WebサイトURL、画像ファイル名、サマリーとしている。
また、画像検索部24は、各画像データに対する画像付加情報を翻訳語候補毎に集約して集約画像付加情報とし、原言語の検索語、検索語のある語義に対する翻訳語候補、翻訳語候補に対して取得された画像情報集合、及び画像情報集合に対する集約画像付加情報を組にした語義表現データを、ユーザインタフェース部20を介して画像適合性算出部25に受け渡す。図6に語義表現データを概念的に表した一例を示す。
画像適合性算出部25は、各語義表現データを用いて、検索語(原言語)と翻訳語候補(目的言語)のペアで表現される意味に対して、得られている画像データ集合がどの程度適合しているかを表す画像適合性を算出する。このような画像適合性算出部25の構成原理は様々考えられるが、ここでは、ナイーブベイズ法を用いる場合について説明する。ナイーブベイズ法は、比較的単純であるにも関わらず良好な精度を示すことで知られている機械学習の一手法である(例えば、非特許文献4「「言語処理のための機械学習入門」、pp.101-117、高村、コロナ社、2010年」参照)。
画像適合性算出部25は、まず、属性解析部50を利用することにより、語義表現データに対する属性ベクトルを構成する。
ここで、属性解析部50で演算される属性ベクトルについて説明する。図7に属性ベクトルの概念を示す。属性ベクトルはN次元のベクトルであり、ベクトルの各要素は1つの属性に対応している。また、各要素の値は、語義表現データ中にその要素に対応する属性が存在すれば1、存在しなければ0を取る。ここでは、検索語に関する属性群、翻訳語候補に関する属性群、画像付加情報に関する属性群の3種類の属性群を用いる。
検索語に関する属性群は、検索語の各語義が持ちうる意味属性、検索語の各語義に対する語義親密度レベルの2種類の情報からなる。このような情報を属性として用いるのは、具体的な事物を表す単語や親密度が高い単語に対しては、その語義を表す画像手がかりがWWWから得易いという知見に基づくものである(例えば、非特許文献5「「インタラクティブな言語横断検索における画像手がかりの有効性」、林他2名、言語処理学会第17回年次大会、2011年」参照)。意味属性は、例えば、非特許文献6(「日本語語彙大系」、池原他7名、岩波書店、1997年)のような公知の言語資源から得ることができる。語義親密度レベルは、例えば、非特許文献7(「基本語データベース:語義別単語親密度」、天野他1名、学習研究社、2008年)のような公知の言語資源から得ることのできる語義親密度を適当にレベル化することにより得ることができる。
翻訳語候補に関する属性群は、各翻訳語候補の各語義が持ちうる意味属性、各翻訳語候補の各語義に対する語義親密度レベル、及び各翻訳語候補の固有名分類の3種類の情報からなる。前者の2つの情報を属性として用いるのは、検索語に関する属性群の場合と同様の理由に基づく。また、固有名分類に関する属性は、翻訳語候補の単語が、人名、地名、組織名、製品名などの固有名詞として用いられている場合には、語義を表す画像手がかりがWWWから得難い場合があるという知見に基づくものである(例えば、非特許文献5参照)。意味属性は、例えば、非特許文献8(“WordNet.A lexical database for English、” http://wordnet.princeton.edu/)のような公知の言語資源から得ることができる。語義親密度レベルは、例えば、非特許文献9(「日本人英語学習者の英単語親密度 文字編―教育・研究のための第二言語データベース」、横川、くろしお出版、2006年)のような公知の情報から得ることのできる語義親密度を適当にレベル化することにより得ることができる。固有名分類は、一般に固有名認識として知られている技術(例えば、特許文献10「「質問応答システム」、磯崎ほか3名、pp.76-89、コロナ社、2010年」参照)を適用することにより得ることができる。
画像付加情報に関する属性群は、WebサイトのURL、キーワードの2種類の情報からなる。前者の情報を属性として用いるのは、特定のWebサイトはあるタイプ(例えば、人物や商品)の画像を蓄積している場合があるという傾向に基づく。また、後者の情報を属性として用いるのは、特定のキーワードの存在が画像のタイプ(例えば、人物や商品)を表す可能性があるという傾向に基づく。ある画像に対するWebサイトのURLは、画像サーチエンジンから取得できる情報に含まれるため、これが特定の既知のWebサイトであるかは容易に知ることができる。画像付加情報におけるファイル名及びサマリーからは、これらを構成する単語集合を容易に抽出することができ、抽出された単語集合に特定のキーワードが含まれているかは容易に知ることができる。
従って、属性解析部50は、属性ベクトルを構成するために必要な、各属性に対する属性値を上記の各属性についての説明で示した概略に従って求め、属性ベクトルを演算する。図8に図6中の(a)の語義表現データを例とした場合の属性ベクトルの構成例を示す。
画像適合性算出部25は、属性解析部50で演算された属性ベクトルに対して、画像適合性モデル40を参照することにより、画像適合性を算出する。ここで、画像適合性モデル40は、後述するモデル構築部30により事前に構築されているものとする。
図9に画像適合性モデル40の概念、及び簡単化した数値例を示す。本実施の形態では、ナイーブベイズ法に基づいているので、画像適合性モデル40は、各語義表現データにおいて、
(i)画像データ集合が検索語の示す意味に適合する適合画像である場合(A)の事前確率P(A)、
(ii)画像データ集合が適合画像である場合に、語義表現データから演算された属性ベクトルV中のある属性fが関連する条件付き確率P(f|A)、
(iii)画像データ集合が適合画像でない場合(NA)に、語義表現データから演算された属性ベクトルV中のある属性fが関連する条件付き確率P(f|NA)、
の3種類の確率情報からなる。
図9において、1、2、・・・、105、・・・などの数字は、属性に対するインデックス(属性ID)を表しており、図7及び図8における属性IDと対応している。
画像適合性算出部25は、画像適合性Xを、ある語義表現データから演算されるN次元の属性ベクトルVが適合画像である場合、及び適合画像でない場合の対数尤度比として、上記(i)〜(iii)の3種類の確率情報を用いて、下記(1)式に従って算出する。
Figure 2012243130
Xが正の値であれば、与えられた語義表現データに対応する画像データ集合が適合画像であることを示し、Xの値が大きいほどその適合性は高いことを示す。
例えば、図6中(a)の語義表現データに対しては、適合画像ではないという判定が得られる。これは、「weaver」がある俳優の人名となっており、取得された画像データ集合において、この人物の写真が5件中4件を占めていることによる。画像適合性算出部25は、上記と同様の過程により、入力された全ての語義表現データに対して画像適合性を算出し、語義表現データと共に、ユーザインタフェース部20を介してユーザ提示情報生成部26へ受け渡す。
ユーザ提示情報生成部26は、語義表現データ、及び画像適合性に基づいて、ユーザの検索要求に含まれる検索語に対する翻訳語の選択を支援するための画面を構成するユーザ提示情報を生成する。生成されたユーザ提示情報は、ユーザインタフェース部20を介して表示装置に表示されるなどして、ユーザに提示される。
図10に図6の語義表現データ、及び上記の画像適合性に対して構成した画面例を示す。この例では、図6の語義表現データ各々に対して、(a):x1、(b):x2、(c):x3、(d):x4、(e):x5、(f):x6、という画像適合性(いずれも実数値)が得られ、x3>x2>x4>x1>x6>x5、という大小関係が成り立つものとする。各検索語に対して、翻訳語候補が提示され、さらに、各翻訳語候補を用いて画像検索を行った結果として得られる画像が提示される。また、これらの画像が検索語の意味を適切に表している度合いを示す目安である画像適合性の情報が、「高」(x2、x3)、「中」(x4)、「低」(x1、x5、x6)の3段階で表示されている。なお、画像適合性の段階数は、3段階に限定されるものではなく、2段階でもよいし、より細かい段階数としてもよい。また、画像適合性が高い順に翻訳語候補をランキング形式で表示するようにしてもよい。
また、翻訳語候補は、例えば、チェックボックス付きで表示するなど、ユーザによって選択可能な状態で提示される。ユーザは提示された翻訳語候補毎の画像、及び画像適合性を手がかりとして、翻訳語候補の中から適切な翻訳語を選択することができる。選択された翻訳語は、ユーザインタフェース部20を介して情報検索部27へ受け渡す。ここでは、ユーザが 「weaving machine」、「industry」及び「future」を選択したものとする。
情報検索部27は、ユーザに選択された翻訳語から検索クエリを生成し、これをサーチエンジン271へ送ることで目的とする情報検索を行う。ここで、サーチエンジン271は、データベースなどに蓄積されたドキュメントを検索するものでもよいし、適切な通信手段を介して遠隔実行できるサーバーであっても良い。ここでは、「weaving machine」、「industry」及び「future」をキーとする情報が検索され、ユーザインタフェース部20を介して、情報検索結果がユーザに提示される。
モデル構築部30は、画像適合性データ取得部31及び画像適合性モデル構築部32を含んだ構成で表すことができ、画像適合性モデル40を構築する。また、画像適合性モデル構築部32は、属性解析部50を利用する。
画像適合性データ取得部31は、予め準備された学習用の語義表現データが入力されると、これを画像適合性モデル構築部32へと受け渡す。学習用の語義表現データとは、図6に示したような検索語、検索語に対応する翻訳語候補、翻訳語候補に基づいて検索された画像情報、及び各画像情報の画像付加情報を集約した集約画像付加情報で構成された語義表現データに対して、その語義表現データに含まれる画像データ集合が検索語の示す意味を適切に表しているか否かに関する人手による評定である適合性評定データを追加したデータである。適合性評定データは、例えば、適合性有(1)または適合性無(0)の2値とすることができる。
画像適合性モデル構築部32は、各学習用の語義表現データから属性解析部50を利用して、画像適合性算出部25と同様の処理により属性ベクトルを演算する。そして演算した属性ベクトル、及びその属性ベクトルに対する適合性評定データに基づいて、画像適合性モデル40を構築する。本実施の形態では、ナイーブベイズ法に基づいてモデルを構築するため、画像適合性モデル40は、各学習用の語義表現データに対し、
(I)画像データ集合が適合画像である場合(A)の事前確率P(A)、
(II)画像データ集合が適合画像である場合に、学習用の語義表現データから演算された属性ベクトルV中のある属性fが関連する条件付き確率P(f|A)、
(III)画像データ集合が適合画像でない場合(NA)に、学習用の語義表現データから演算された属性ベクトルV中のある属性fが関連する条件付き確率P(f|NA)、
の3種類の確率情報からなる。これらの確率情報は、最尤推定として知られる方法により推定する。すなわち、
・適合性有という適合性評定データが付与されている学習用の語義表現データ件数を全データ件数で除する。
・各属性fについて、この属性値が1であるデータ件数を適合性有という適合性評定データが付与されているデータ件数で除する。
・各属性fについて、この属性値が1であるデータ件数を適合性無という適合性評定データが付与されているデータ件数で除する。
以上により、図9にその概念を示したような画像適合性モデルを構築することができる。
次に、図11を参照して、本実施の形態の言語横断型情報検索装置10において実行されるモデル構築処理ルーチンについて説明する。
ステップ100で、学習用の語義表現データを取得する。次に、ステップ102で、上記ステップ100で取得した学習用の語義表現データ各々について、属性ベクトルを演算する。次に、ステップ104で、上記ステップ102で演算した属性ベクトル、及びその属性ベクトルに対する適合性評定データに基づいて、ナイーブベイズ法により画像適合性モデルを構築する。次に、ステップ106で、上記ステップ104で構築された画像適合性モデルを所定の記憶領域に記憶して、処理を終了する。
次に、図12を参照して、本実施の形態の言語横断型情報検索装置10において実行される情報検索処理ルーチンについて説明する。
ステップ200で、ユーザにより原言語で入力された検索要求を取得する。次に、ステップ202で、上記ステップ200で取得した検索要求を公知の形態素解析処理技術を用いて解析し、検索要求に含まれる原言語の検索語を抽出する。
次に、ステップ204で、対訳辞書を参照して、上記ステップ202で抽出した原言語の検索語に対応する目的言語における少なくとも1つの翻訳語候補を抽出し、各検索語について、翻訳語候補リストを取得する。
次に、ステップ206で、上記ステップ204で取得した翻訳語候補リストに含まれる各翻訳語候補をキーとして画像検索を行い、各翻訳語候補に対する画像データ及び画像付加情報からなる画像情報集合を取得する。また、各翻訳語候補に対する画像付加情報を集約して集約画像付加情報とし、原言語の検索語、検索語のある語義に対する翻訳語候補、翻訳語候補対して取得された画像情報集合、及び画像情報集合に対する集約画像付加情報を組にした語義表現データを構成する。
次に、ステップ208で、上記ステップ206で構成された語義表現データに基づいて、語義表現データ毎に属性ベクトルを演算する。次に、ステップ210で、上記ステップ208で演算された属性ベクトルに対して、画像適合性モデル構築処理(図10)で構築された画像適合性モデルを参照することにより、画像適合性を算出する。
次に、ステップ212で、上記ステップ206で構成された語義表現データ、及び上記ステップ210で算出された画像適合性に基づいて、ユーザの検索要求に含まれる検索語に対する翻訳語の選択を支援するための画面を構成するユーザ提示情報を生成し、画面をユーザに提示する。
次に、ステップ214で、ユーザによって翻訳語候補リストから翻訳語が選択されたか否かを判定する。翻訳語が選択された場合には、ステップ216へ移行し、翻訳語が選択されない場合には、本ステップの判定を繰り返す。なお、所定時間経過してもユーザにより翻訳語が選択されない場合には、本ルーチンを終了するようにしてもよい。
ステップ216では、上記ステップ214でユーザにより選択された翻訳語から検索クエリを生成し、この検索クエリに基づいて情報検索を行う。次に、ステップ218で、上記ステップ216で検索された情報をユーザに提示して、処理を終了する。
以上説明したように、本実施の形態の言語横断型情報検索装置によれば、ユーザの原言語による検索要求を目的言語へと翻訳する際に得られる各翻訳候補語をキーとする画像検索を行い、検索語、翻訳語候補、及び画像情報から演算される属性ベクトルと画像適合性モデルとに基づいて、検索される画像が検索語の意味とどの程度適合しているかを示す画像適合性を算出し、翻訳語候補毎に検索された画像と共にユーザに提示されるため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識し、さらに検索語に関連する意味に基づいて提示される翻訳語の選択が容易になり、ユーザにとって使い易く、かつ精度の高い情報検索を行うことができる。
なお、上記実施の形態では、検索語に関する属性、翻訳語候補に関する属性、及び画像付加情報に関する属性を用いて属性ベクトルを演算する場合ついて説明したが、これに限定されない。検索語と、その検索語の各翻訳語候補に対して検索された画像との適合性を算出することができるものであればよい。また、画像データに必ずしも画像付加情報が付加されている必要はなく、検索された画像データ自体から得られる特徴を属性ベクトルの要素として加えてもよい。
また、上記実施の形態では、画像適合性モデルの構築及び画像適合性の算出に、ナイーブベイズ法を用いる場合について説明したが、これに限定されず、公知の機械学習の手法を用いることができる。他の学習法を適用する場合には、属性ベクトルはその学習法に応じた属性ベクトルを演算するようにするとよい。
また、本実施の形態では、情報検索を行うための各構成と、モデル構築部とを同一のコンピュータで実現する場合について説明したが、個々のコンピュータで構成するようにしてもよい。この場合、構築された画像適合性モデルは、情報検索装置側に記憶してもよいし、モデル構築部側に記憶してもよいし、また他の外部装置に記憶してもよい。画像適合性モデルを、モデル構築部側または他の外部装置に記憶した場合には、情報検索処理の際に、ネットワーク等を介してモデル構築部または他の外部装置に記憶された画像適合性モデルを読み出すようにするとよい。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述の言語横断型情報検索装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 言語横断型情報検索装置
20 ユーザインタフェース部
21 検索要求取得部
22 検索要求解析部
23 対訳取得部
24 画像検索部
25 画像適合性算出部
26 ユーザ提示情報生成部
27 情報検索部
30 モデル構築部
31 画像適合性データ取得部
32 画像適合性モデル構築部
50 属性解析部
241 画像サーチエンジン
271 サーチエンジン

Claims (8)

  1. ユーザにより第1言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、前記第1言語とは異なる第2言語に翻訳された少なくとも1つの翻訳語候補を取得する取得手段と、
    画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索する画像検索手段と、
    検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出する算出手段と、
    前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示する提示手段と、
    前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する情報検索手段と、
    を含む情報検索装置。
  2. 前記画像適合性モデルは、検索語の示す意味及び画像情報から演算される属性ベクトルに、該画像情報が前記検索語の示す意味と適合するか否かを示す情報を追加した学習用データを用いて学習することにより構築され、
    前記算出手段は、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて演算される属性ベクトルと、前記画像適合性モデルとに基づいて、前記適合性を算出する
    請求項1記載の情報検索装置。
  3. 前記画像情報は、画像及び該画像に付加された付加情報で構成され、
    前記算出手段は、前記付加情報に含まれる情報を用いて前記属性ベクトルを演算する
    請求項2記載の情報検索装置。
  4. 前記属性ベクトルに、前記翻訳語候補に関する属性を加えた請求項2または請求項3記載の情報検索装置。
  5. 検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築する構築手段をさらに含む請求項1〜請求項4のいずれか1項記載の情報検索装置。
  6. 取得手段と、画像検索手段と、算出手段と、提示手段と、情報検索手段とを含む情報検索装置における情報検索方法であって、
    前記取得手段は、ユーザにより第1言語で入力された情報の検索要求に含まれる検索語に対して、検索対象の情報の記述言語であって、前記第1言語とは異なる第2言語に翻訳された少なくとも1つの翻訳語候補を取得し、
    前記画像検索手段は、画像情報を記憶した記憶手段から、前記取得手段により取得された翻訳語候補に対応する画像情報を検索し、
    前記算出手段は、検索語の示す意味と画像情報との適合性を算出するための画像適合性モデル、前記検索要求に含まれる検索語が示す意味、及び前記画像検索手段により検索された画像情報に基づいて、前記翻訳語候補毎に、前記検索語と前記画像情報との適合性を算出し、
    前記提示手段は、前記翻訳語候補及び前記画像情報と共に、前記算出手段により算出された適合性を前記ユーザに提示し、
    前記情報検索手段は、前記提示手段による提示に対して前記ユーザにより選択された翻訳語候補を、前記検索語に対する翻訳語として取得し、該翻訳語に対応する情報を検索する
    情報検索方法。
  7. 前記情報検索装置は、構築手段をさらに含み、
    前記構築手段は、検索語の示す意味と画像情報との適合性が既知の学習用データを用いて前記画像適合性モデルを構築する
    請求項6記載の情報検索方法。
  8. コンピュータを、請求項1〜請求項5のいずれか1項記載の情報検索装置を構成する各手段として機能させるための情報検索プログラム。
JP2011113493A 2011-05-20 2011-05-20 情報検索装置、方法、及びプログラム Withdrawn JP2012243130A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011113493A JP2012243130A (ja) 2011-05-20 2011-05-20 情報検索装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011113493A JP2012243130A (ja) 2011-05-20 2011-05-20 情報検索装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2012243130A true JP2012243130A (ja) 2012-12-10

Family

ID=47464763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011113493A Withdrawn JP2012243130A (ja) 2011-05-20 2011-05-20 情報検索装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2012243130A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103869933A (zh) * 2012-12-11 2014-06-18 联想(北京)有限公司 信息处理的方法和终端设备
CN111368117A (zh) * 2018-12-26 2020-07-03 财团法人工业技术研究院 跨语言信息建构与处理方法及跨语言信息系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103869933A (zh) * 2012-12-11 2014-06-18 联想(北京)有限公司 信息处理的方法和终端设备
CN103869933B (zh) * 2012-12-11 2017-06-27 联想(北京)有限公司 信息处理的方法和终端设备
CN111368117A (zh) * 2018-12-26 2020-07-03 财团法人工业技术研究院 跨语言信息建构与处理方法及跨语言信息系统
CN111368117B (zh) * 2018-12-26 2023-05-30 财团法人工业技术研究院 跨语言信息建构与处理方法及跨语言信息系统

Similar Documents

Publication Publication Date Title
US11080295B2 (en) Collecting, organizing, and searching knowledge about a dataset
US10810215B2 (en) Supporting evidence retrieval for complex answers
US10713571B2 (en) Displaying quality of question being asked a question answering system
KR101554293B1 (ko) 교차 언어 정보 검색
US11468238B2 (en) Data processing systems and methods
US20220405484A1 (en) Methods for Reinforcement Document Transformer for Multimodal Conversations and Devices Thereof
US20090119090A1 (en) Principled Approach to Paraphrasing
US20160224566A1 (en) Weighting Search Criteria Based on Similarities to an Ingested Corpus in a Question and Answer (QA) System
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
KR20130056207A (ko) 관계 정보 확장 장치, 관계 정보 확장 방법, 및 프로그램
Zhang et al. X-lisa: Cross-lingual semantic annotation
KR102059743B1 (ko) 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템
US20190188324A1 (en) Enriching a knowledge graph
JP7388256B2 (ja) 情報処理装置及び情報処理方法
JP2024091709A (ja) 文作成装置、文作成方法および文作成プログラム
WO2020079752A1 (ja) 文献検索方法および文献検索システム
Li et al. Infographics retrieval: A new methodology
KR20180082035A (ko) 문맥 정보에 기반한 콘텐츠 제공 서버 및 방법
JP2007164635A (ja) 同義語彙獲得方法及び装置及びプログラム
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
JP4428703B2 (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
JP5279129B2 (ja) 言語横断型情報検索システムおよび言語横断型情報検索方法
JP2014191777A (ja) 語義解析装置、及びプログラム
Eldin et al. Cross-language semantic web service discovery to improve the selection mechanism by using data mining techniques
Tsapatsoulis Web image indexing using WICE and a learning-free language model

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20121001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20121001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20121002

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140805