JP2011248827A - 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム - Google Patents

言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム Download PDF

Info

Publication number
JP2011248827A
JP2011248827A JP2010124151A JP2010124151A JP2011248827A JP 2011248827 A JP2011248827 A JP 2011248827A JP 2010124151 A JP2010124151 A JP 2010124151A JP 2010124151 A JP2010124151 A JP 2010124151A JP 2011248827 A JP2011248827 A JP 2011248827A
Authority
JP
Japan
Prior art keywords
image
search
meaning
word
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010124151A
Other languages
English (en)
Inventor
Masaaki Nagata
昌明 永田
Yoshihiko Hayashi
良彦 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Osaka University NUC
Original Assignee
Nippon Telegraph and Telephone Corp
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Osaka University NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010124151A priority Critical patent/JP2011248827A/ja
Publication of JP2011248827A publication Critical patent/JP2011248827A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザは画像情報により検索語の持つ多義性を視覚的に認識することができ、検索語に関連する意味に基づいて提示される翻訳語と検索関連語を選択できる言語横断型情報検索技術を提供する。
【解決手段】検索要求を解析し、原言語の検索語を取得し、原言語の単語と各単語の目的言語における対訳を記憶する対訳辞書を検索し、検索語の対訳を翻訳語候補として取得し、翻訳語候補をキーとして、画像検索を行い、画像情報を取得し、取得した画像情報を検索語に関連する意味に分類し、分類毎に、目的言語における検索関連語を抽出し、翻訳語候補と分類された画像データと検索関連語とをユーザに提示し、翻訳語候補と検索関連語とを選択させるための画面を生成し、ユーザに選択された翻訳語候補と検索関連語をキーとして、目的言語における情報検索を行う。
【選択図】図1

Description

本発明は原言語による検索要求に対し、この検索要求と適合し、かつ、原言語とは異なる目的言語で記述されたドキュメントを検索する言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラムに関する。
言語横断型情報検索において、ユーザの検索要求を適切に目的言語へと翻訳することは、重要な課題として認識されている(非特許文献1参照)。言語横断型情報検索では、原言語の検索要求を目的言語に翻訳し、翻訳語を用いて目的言語で記述されたドキュメントを検索する。そのため、ユーザの検索要求が適切に目的言語へと翻訳されないと、精度の高い情報検索を行うことができない。しかし、一般に、ユーザは目的言語の知識を有しないため、検索要求が適切に目的言語へと翻訳されているかを確認することができない。
原言語の検索要求を言語的な手段で目的言語へ翻訳する方法として特許文献1が知られている。特許文献1では、ユーザの検索要求に含まれる検索語の翻訳語候補を要素として持つ目的言語における言語表現と、その目的言語における言語表現の(原言語における)逆翻訳結果をユーザに提示し、選択させる。これにより、ユーザが目的言語の知識が乏しい場合にも、逆翻訳結果を参照して、適切な翻訳語を選択できる。
また、画像を利用して、原言語の検索要求を目的言語へ翻訳する方法として非特許文献2が知られている。非特許文献2では、原言語の検索語の翻訳語候補を検索クエリ語として、画像検索を行い、翻訳語候補とその画像検索結果の画像を提示する。これにより、ユーザが目的言語の知識が乏しい場合にも、画像を参照して、適切な翻訳語を選択できる。
特開2004−151881号公報
林良彦、横尾昭男、古瀬蔵著、「多言語情報アクセスシステム」、NTT技術ジャーナル、2002年1月、p.76-80 林良彦, Bora Savas 、永田昌明著、「言語横断情報検索のクエリ翻訳曖昧性解消のための画像情報の利用」、言語処理学会第15回年次大会、2009年3月、p.550-553
しかしながら、特許文献1では、言語情報のみを提示しているため、一覧性に欠け、効率よく適切な翻訳語を選択できないという問題がある。
また、非特許文献2では、選択された翻訳語が目的言語固有の多義性を有する場合に生ずる以下のような問題がある。例えば、鳥の「つる」を想定して日本語の「つる」に対して英語の”crane”が翻訳語として得られる場合、検索クエリ語として”crane”を用いると、「鶴」(鳥)に関する画像だけでなく、「クレーン」(機械)に関する画像が検索されてしまうという問題である。
上記の課題を解決するために、本発明に係る言語横断型情報検索技術は、原言語による検索要求に対し、この検索要求と適合し、かつ、原言語とは異なる目的言語で記述されたドキュメントを検索する。なお、画像データにはテキスト情報である画像付加情報が付与されており、画像情報は画像データと画像付加情報を含むものとする。さらに、本発明に係る言語横断型情報検索技術では、検索要求を解析し、原言語の検索語を取得し、対訳辞書を検索し、検索語の対訳を翻訳語候補として取得し、翻訳語候補をキーとして、画像検索を行い、画像情報を取得し、取得した画像情報を検索語に関連する意味に分類し、分類毎に、目的言語における検索関連語を抽出し、翻訳語候補と分類された画像データと検索関連語とをユーザに提示し、翻訳語候補と検索関連語とを選択させるための画面を生成する。さらに、ユーザに選択された翻訳語候補と検索関連語をキーとして、目的言語における情報検索を行う。
本発明は、翻訳語候補をキーとして、画像検索を行い、取得した画像情報を検索語に関連する意味に分類し、翻訳語候補と分類された画像データとそれに対応する検索関連語とをユーザに提示するため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識することができるという効果を奏する。さらに、検索語に関連する意味に基づいて提示される翻訳語と検索関連語を選択できるという効果を奏する。
言語横断型情報検索システム100の構成図。 言語横断型情報検索システム100のフローチャートを示す図。 ST対訳辞書221のデータ例を示す図。 翻訳語候補リストのデータ例を示す図。 TS対訳辞書222のデータ例を示す図。 逆翻訳語候補リストのデータ例を示す図。 (a)vineを、(b)tendrilを、(c)craneをキーとする画像検索の検索結果例を示す図。 図7の(c)−2を画像情報の概念を表す図。 画像分類部260の構成図。 画像分類部260のフローチャートを示す図。 検索語意味リストのデータ例を示す図。 意味ベクトル辞書300のデータ例を示す図。 検索語意味記述リストのデータ例を示す図。 意味ベクトル辞書300のデータ例を示す図。 画像記述語リストのデータ例を示す図。 画像意味記述リストのデータ例を示す図。 画像分類の結果の概念図。 ユーザ提示画面の概念図。 画像検索エンジンを用いた場合の情報検索結果の例を示す図。 www上で利用可能なWebページ検索エンジンを用いた場合の情報検索結果の例を示す図。 電子辞書から意味ベクトルを構成する概念図。 画像特徴に対する意味ベクトルを構成する概念図。 言語横断型情報検索システム100のハードウェア構成を例示したブロック図。
以下、本発明の実施の形態について、詳細に説明する。
<言語横断型情報検索システム100>
図1及び図2を用いて実施例1に係る言語横断型情報検索システム100を説明する。言語横断型情報検索システム100は、通信部101と、記憶部103と、制御部105と、ユーザインタフェース部200と、検索要求解析部210と、対訳取得部220と、ST対訳辞書221と、TS対訳辞書222と、画像情報取得部240と、画像分類部260と、検索関連語抽出部270と、ユーザ提示情報生成部275と、情報検索式生成部280及び情報検索部290とを有する。
言語横断型情報検索システム100は、原言語(ユーザが用いる言語)による検索要求に対し、この検索要求と適合し、かつ、原言語とは異なる目的言語で記述されたドキュメントを検索する。以下では、日本語を原言語とするユーザが英語のドキュメントを検索する日本語・英語間の言語横断型情報検索を想定し、”つる”という検索要求を具体例として用いて説明する。
<通信部101、記憶部103及び制御部105>
言語横断型情報検索システム100は、通信部101を介して後述する画像サーチエンジン941やサーチエンジン991等とデータを送受信する。通信部101は、例えば、LANアダプタ等により構成される。
記憶部103は入出力される各データや演算過程の各データを、逐一、格納・読み出しする。それにより各演算処理が進められる。但し、必ずしも記憶部103に記憶しなければならないわけではなく、各部間で直接データを受け渡してもよい。後述するST対訳辞書221、TS対訳辞書222及び意味ベクトル辞書300等は、記憶部103の一部であってもよい。
制御部105は、後述する各部の処理やデータの受渡し等を制御する。
<ユーザインタフェース部200>
ユーザインタフェース部200は、ユーザからの入力を受け付けると共に、当該ユーザに対して情報を出力する。例えば、データが入力される入力インタフェース(例えばキーボード、マウス等)とデータが出力される出力インタフェース(例えばディスプレイ、プリンタ等)、または、それらの入出力インタフェースに対する入出力端子からなる。また、言語横断型情報検索システム100がネットワーク上のサーバ等であり、ユーザがネットワークを介してアクセスする場合には、ユーザインタフェース部200は、ユーザとデータを送受信するための通信部等であってもよい。
<検索要求解析部210>
検索要求解析部210は、検索要求を解析し、原言語の検索語を取得する(s210)。例えば、検索要求解析部210は、ユーザインタフェース部210を介してユーザから入力される検索要求(原言語)に含まれる名詞、動詞、形容詞等の内容語を抽出する。本検索要求解析処理は、形態素解析処理として公知である技術(例えば、田中穂積監修、「自然言語処理−基礎と応用−」(永田昌明、「第1章 形態素・構文解析」)、社団法人電子情報通信学会、1999年、p.2-38参照)を基に実現が可能であるため、本発明ではその詳細を規定しない。例えば、日本語の検索要求”つる“に対しては、”つる”という一つの内容語が得られる。さらに、複雑な検索要求に対しては、複数の内容語が得られる場合もある。これらの抽出された1以上の内容語を検索語として取得し、対訳取得部220に送信する。
<対訳取得部220、ST対訳辞書221及びTS対訳辞書222>
対訳取得部220は、原言語の単語と各単語の目的言語における対訳を記憶する対訳辞書を検索し、検索語の対訳を翻訳語候補として取得する(s220)。
例えば、まず、対訳取得部220は、受信した検索語をキーとして、予め準備されたST対訳辞書221(原言語Sから目的言語Tへの対訳辞書、図3参照)を検索することにより、検索語に対する翻訳語候補を得る。一般に、ST対訳辞書221は、キーとなっている原言語Sの単語の語義毎に、目的言語Tにおける1以上の対訳(翻訳語候補)を提示している。対訳取得部220は、語義毎の1以上の翻訳語候補からなる集合を要素とする翻訳語候補リストを生成する(図4参照)。例えば、現在の検索要求(“つる”)に対して、「植物の一部」の語義と「鳥類」の語義があるものとし、語義毎に、(”vine”、“tendril”)、(“crane”)という翻訳語候補が提示されているとする。このとき、対訳取得部220は、翻訳語候補リストを以下のように構成する。
翻訳語候補リスト:{(”vine”、“tendril”)、(“crane”)}
次に、対訳取得部220は、翻訳語候補リストにおける翻訳語候補をキーとして、予め準備されたTS対訳辞書222(目的言語Tから原言語Sへの対訳辞書、図5参照)を検索することにより、翻訳候補語に対する逆翻訳語候補を得る。
TS対訳辞書222も語義毎に1以上の逆対訳語(逆翻訳語候補)を提示している。対訳取得部220は、語義毎の1以上の逆翻訳語候補からなる集合を要素とする逆翻訳語候補リストを生成する(図6参照)。例えば、(“vine”、“tendril”)からは(“植物”、“つる”、“蔓”)が、(“crane”)からは(“鳥“、“つる”、”ツル”、“鶴”)、(“機械”、“クレーン”、“起重機”)が得られるとするとき、対訳取得部220は、逆翻訳語候補リストを以下のように生成する。
逆翻訳語候補リスト:{(“植物”、“つる”、“蔓”)、(“鳥“、“つる”、”ツル”、“鶴”)、(“機械”、“クレーン”、“起重機”)}
対訳取得部220は、翻訳語候補リストを画像情報取得部240へ送信し、翻訳語リストと逆翻訳語リストを画像分類部260に送信する。なお、各リストは記憶部103に格納され、制御部101の指示に従って、記憶部103から各部に送信してもよい。
<画像情報取得部240>
画像情報取得部240は、翻訳語候補をキーとして、画像検索を行い、画像情報を取得する(s240)。
例えば、画像取得部240は、通信部101を介して、画像サーチエンジン941に対し、受信した翻訳語候補リスト中の各翻訳語候補をキーとして、画像検索要求を送信し、検索結果である画像情報を取得する。ここで画像サーチエンジン941は、データベースなどに蓄積された画像情報を検索するものでもよいし、適切な通信手段を介して遠隔実行できるサーバ、例えばWWW上で利用可能な画像検索エンジンであってもよい。例えば、翻訳語候補リスト{(”vine”、“tendril”)、(“crane”)}においては、”vine”、”tendril”、”crane”をキーとする画像情報の集合が図7(a)、(b),(c)に示すように得られるとする(図7で使用している画像・イラストデータは、Microsoftクリップアート(http://office.microsoft.com /ja-jp/help/HA010897061041.aspx)を使用している)。なお、画像データには、テキスト情報であるタイトル、キーワード、サマリー等の画像付加情報が付与されており、画像情報は画像データと画像付加情報を含むものとする。一般に、WWW上で良く用いられる画像サーチエンジンは、このような画像情報を提供する機能を備えている。画像取得部240は、1以上の画像情報から画像情報リストを生成する。図7(c)−2に示した画像に対する画像情報の概念を図8に示す。画像情報取得部240は画像情報リストを、直接、または、記憶部103を介して、画像分類部260に送信する。
<画像分類部260>
画像分類部260は、取得した画像情報を検索語に関連する意味に分類する(s260)。図9及び図10を用いて、画像分類部260を説明する。画像分類部260は、検索語意味記述部230と、画像意味記述部250と、意味ベクトル辞書300及び適合度算出部261を備える。なお、本実施例において検索語に関連する意味とは、原言語及び目的言語における単語の集合により記述されるものとする。
(意味ベクトル辞書300)
意味ベクトル辞書300は、単語と各単語の意味を表現するT次元の意味ベクトルを予め記憶しておく。また、意味ベクトル辞書300は、後述する画像特徴ベクトルの意味を表現するT次元の意味ベクトルを予め記憶しておく。なお、意味ベクトルの各次元はある潜在的な意味の次元を表す。意味ベクトル辞書300は利用に先立ち、予め構築しておく。その構築方法については後述する。
(検索語意味記述部230)
検索語意味記述部230は、意味ベクトル辞書300を参照して、翻訳語候補を基に生成される集合を構成する原言語及び目的言語の意味を表現する意味ベクトルを求め、1以上の意味ベクトルから集合の検索語意味記述を求める(s230)。
例えば、検索語意味記述部230は、翻訳語リストと逆翻訳語リストを受信し、これらのリストから検索語の語義毎の翻訳語候補及びその翻訳語候補の語義毎の逆翻訳語候補からなる1以上の集合を求める。この集合を要素とする検索語意味リストを作成する。なお、本実施例では、この翻訳語(目的言語)と逆翻訳語(原言語)の集合(検索語意味リストの要素)が、検索語に関連する意味を表す。
例えば、検索要求(“つる”)においては、以下の3つの要素からなる検索語意味リストが構成される(図11参照)。
検索語意味リスト:{(”vine”、“tendril”、“植物”、“つる”、“蔓”)、(“crane”、“鳥“、“つる”、”ツル”、“鶴”)、(“crane”、“機械”、“クレーン”、“起重機”)}
次に、検索語意味記述部230は、検索語意味リストを構成する要素である集合を構成する各単語(翻訳語及び逆翻訳語)をキーとして、予め構築されている意味ベクトル辞書300を検索し(図12参照)、各単語の意味を表現するT次元の意味ベクトルを取得する。
検索語意味記述部230は、各単語に対して得られた意味ベクトルの重心ベクトルを求め、これを集合に対する検索語意味記述とする。検索語意味リストのそれぞれの要素について、検索語意味記述を求め、検索語意味記述リストを生成する。つまり、検索語意味記述リストは、検索語意味記述を集約した情報構造である(図13参照、但し、W,X,Yは各単語集合の単語数を表す)。
例えば、図11の検索語意味リストの2つめの要素である集合(“crane”、“鳥“、“つる”、”ツル”、“鶴”)の検索語意味記述は、図12の意味ベクトル辞書300を参照した場合、
となる。検索語意味記述部230は、検索語意味記述リストを直接、または、記憶部103を介して、適合度算出部261へ送信する。
(画像意味記述部250)
画像意味記述部250は、予め構築された意味ベクトル辞書300を参照して、画像情報の意味を表現する意味ベクトルを求め、1以上の意味ベクトルから画像意味記述を求める(s250)。例えば、画像意味記述部250は、画像特徴意味ベクトル取得部251と、重み付け部252と、画像記述意味ベクトル取得部253及び重心ベクトル算出部254を備える(図9参照)。
{画像特徴意味ベクトル取得部251}
画像特徴意味ベクトル取得部251は、画像データを分析することにより得られる画像的な特徴を表現する画像特徴ベクトルを用いて、前記意味ベクトル辞書300を参照して、画像特徴ベクトルに対する意味ベクトルを求める(s251)。
例えば、画像特徴意味ベクトル取得部251は、画像情報リストを構成する画像情報の画像データを受信し、各画像データの画像的な特徴を表現するN次元の画像特徴ベクトル(α1,α2,…,αN)を取得する。画像データからSIFTなどの画像特徴量を取得する方法については、既知の方法(例えば、井手一郎、柳井啓司著、「セマンティックギャップを越えて--画像・映像の内容理解に向けて」、人工知能学会誌、人工知能学会、2009年9月、24巻5号、p.691-699参照)を用いることができるため、本発明ではその詳細を規定しない。
さらに、画像特徴意味ベクトル取得部251は、N次元の画像特徴ベクトルの各次元の画像特徴の意味を表現するT次元の意味ベクトルを、予め構築されている意味ベクトル辞書300から取得する(図14参照)。これにより、1つの画像データに対してN個の意味ベクトルim_1,im_2,…,im_N(但し、T次元の意味ベクトルはim_n=(im_n_1,im_n_2,…,im_n_T)である)を取得する。
{重み付け部252}
重み付け部252は、N個の意味ベクトルim_1,im_2,…,im_Nに、対応する画像特徴ベクトル(α1,…,αN)の各次元の値を乗ずることにより、意味ベクトルに重み付けを行う(s252)。なお、重み付けされた意味ベクトルはα1×im_1,α2×im_2,…,αN×im_Nと表すことができる。
{画像記述意味ベクトル取得部253}
画像記述意味ベクトル取得部253は、画像付加情報を解析することにより得られる画像記述語を用いて、意味ベクトル辞書300を参照して、画像記述語に対する意味ベクトルを求める(s253)。
例えば、画像記述意味ベクトル取得部253は、画像情報リストを構成する画像情報の画像付加情報を受信し、画像付加情報を解析し1以上のキーワードを抽出し、これを画像記述語とする。
また、画像記述意味ベクトル取得部253は、検索要求解析部210における検索語取得と同等の手段によって、画像付加情報のサマリーを解析し、目的言語の画像記述語を取得する。なお、解析対象及び取得対象の言語が原言語ではなく、目的言語である点が検索要求解析部210と異なるが、これは一般的な公知技術により解析できる。例えば、図8に示した画像情報のサマリーにおける画像記述語は、(”species”、“poster”、“whooping”、“crane”)であり、画像記述意味ベクトル取得部253は、画像情報リストを構成する各画像情報の画像付加情報から画像記述語を取得し、画像記述語リストを生成する(図15参照)。
次に、画像記述意味ベクトル取得部253は、画像記述語の各単語をキーとして、予め構築されている意味ベクトル辞書300を検索し、各単語の意味を表現するT次元の意味ベクトルを取得する。単語の数をM(例えばM=4)とするとき、T次元の意味ベクトルがM個得られる。
{重心ベクトル算出部254}
重心ベクトル算出部254は、各画像情報に対して得られたM+N個の意味ベクトルの重心ベクトルを求め、これを各画像情報に対する画像意味記述とする(s254)。
重心ベクトル算出部254は、重み付け部252からN個の重み付けされた(画像データに対する)意味ベクトルを受信し、画像記述意味ベクトル取得部253からM個の(画像付加情報に対する)意味ベクトルを受信する。
例えば、図8の画像情報の画像意味記述は、図14の意味ベクトル辞書300を参照した場合、
となる。このようにして、画像記述部250は、画像情報リストのそれぞれの要素である画像情報について画像意味記述を求め、画像意味記述を要素とする画像意味記述リストを生成する(図16参照、但し、W,X,Yは各画像情報に対する画像記述語に含まれる単語の数を表す)。画像記述部250は、画像意味記述リストを直接、または、記憶部103を介して、適合度算出部261へ送信する。
(適合度算出部261)
適合度算出部261は、検索語意味記述と画像意味記述の適合度を算出し、この適合度に応じて、検索語意味記述に対応する検索語に関連する意味と画像意味記述に対応する画像情報とを紐付ける(s261)。
例えば、検索語意味記述部230から受信した検索語意味記述リスト及び画像意味記述部250から受信した画像意味記述リストを基に、各画像情報を、この画像情報の画像意味記述に対して最も高い適合度を与える検索語意味記述に対応付ける。検索語意味記述も画像意味記述もT次元の意味次元に対する確率分布に対応するベクトルとして表現されるので、これらの間の適合度の算出はベクトル間の類似度計算に帰着できる。このようなベクトル間の類似度計算に関しては、KLダイバージェンスやコサイン尺度などの既知の手法(例えば、Daniel Jurafsky, James H. Martin著、" Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition "、secondedition、PrenticeHall、2008年、p.663-667等参照)が利用できるため、ここではその詳細を規定しない。
画像分類部260は、画像情報と検索語意味リストとの対応を分類結果として出力する。図7の画像情報の分類結果を図17に示す。図17−(a)には植物の一部の「つる」に対応する画像、図17−(b)には「クレーン(機械)」に対応する画像、図17−(c)には「鶴」に対応する画像が分類されている。この中で特に図17−(b)から、原言語の検索語の”つる”には直接対応しない意味が翻訳語候補の”crane”に存在することをユーザは知ることができる。
画像分類部260は、直接、または、記憶部103を介して、分類結果を検索関連語抽出部270に送信する。
<検索関連語抽出部270>
検索関連語抽出部270は、分類毎に、目的言語における検索関連語を抽出し(s270)、検索関連語と分類結果をユーザ提示情報生成部275に送信する。
対応付けられた検索語意味記述と画像意味記述を基に、目的言語における検索関連語を抽出する。例えば、検索語意味リストの要素である単語の集合(図11参照)や画像記述語リストの要素である単語の集合(図15参照)を用いて、その集合内の目的言語の単語から目的言語におけるシソーラスや概念意味辞書を利用して検索関連語を求める。なお、シソーラスとは、意味で整理した辞書であり、ある単語の同義語、広義語、狭義語、関連語等が登録してある。また、概念意味辞書とは、単語の意味及び概念で分類した辞書である。つまり、集合内の目的言語の単語をキーとして、シソーラスや概念意味辞書を検索し、同義語等を検索関連語として取得する。
また、例えば、その集合内の目的言語の単語をキーとして、サーチエンジン991等を用いて情報検索を行い、その検索結果から単語に関連するキーワードを抽出し、これを検索関連語として取得してもよい。これらの方法以外であっても、単語の集合に関連するキーワードを検索関連語として抽出する方法であればよい。
(“crane”、“鳥“、“つる”、”ツル”、“鶴”)から得られる検索語意味記述と、(”species”、“poster”、“whooping”、“crane”、<画像特徴−1>、…、<画像特徴−N>)から得られる画像意味記述とが対応付けられ、図17−(c)に示した分類結果例を得た場合、これらに含まれる目的言語の単語(“crane”、”species”、“poster”、“whooping”)によって、上述の方法を適用し、検索関連語を抽出する。例えば、(“whooping crane”、“wader bird”、“grus”)等の検索関連語が得られる。
なお、上記の方法により複数の検索関連語が得られた場合には、以下の方法により、さらに、限定してもよい。複数の検索関連語について、意味ベクトル辞書300を参照して、意味ベクトルを求め、画像意味記述や検索語意味記述と類似度が高いもの(例えば、類似度の高い上位数件に対応する検索関連語や、類似度が予め定めた閾値以上である検索関連語)を、最終的な検索関連語として抽出してもよい。
<ユーザ提示情報生成部275>
ユーザ提示情報生成部275は、分類結果と検索関連語を受信し、翻訳語候補と分類された画像データと検索関連語とをユーザに提示し、翻訳語候補と検索関連語とを選択させるための画面を生成し(s275)、これをユーザインタフェース部200を介してユーザに提示する(図18参照)。
図18に示すように、ユーザ提示画面は、検索語に関連する意味に応じて、検索語意味リスト及び適合度が高い画像データを表示し、さらに、翻訳語及び検索関連語をチェックボックス付きで提示する。ユーザは、表示された情報を基に、翻訳語及び検索関連語にチェックを入れることで、これを検索クエリ語として選択する。検索クエリ語とは、サーチエンジン991に送られる情報検索式の要素となる語である。
検索クエリ語として、“whooping crane”及び”wader bird”が選択されたものとし、検索式生成条件として、ORが選択されたものとする。検索式生成条件とは、検索クエリ語をどのように組み合わせて情報検索式を生成するかを示す条件で、例えば、図示していないが、AND(全ての検索クエリ語を含む)またはOR(いずれかの検索語を含む)を選択できるものとする。
<情報検索式生成部280及び情報検索部290>
情報検索式生成部280は、ユーザインタフェース部200を介して、受信した検索クエリ語及び検索式生成条件から情報検索式を生成する。例えば、情報検索式(“whooping crane” OR “wader bird”)を生成し、情報検索部290へ検索条件式を送信する。
情報検索部290は、ユーザに選択された翻訳語候補と検索関連語をキーとして、目的言語における情報検索を行う(s290)。例えば、情報検索部290は、通信部101を介して、受信した(検索クエリ語と検索生成条件から生成した)情報検索式をキーとし、接続されているサーチエンジン991に情報検索を依頼する。さらに、サーチエンジン991から返却された情報検索結果をユーザインタフェース部200へ送信する。
ここで、サーチエンジン991は、データベースなどに蓄積されたドキュメントを検索するものでもよいし、適切な通信手段を介して遠隔実行できるサーバであってもよい。
サーチエンジン991としてWWW上で利用可能な画像検索エンジンを用いた場合の情報検索結果の例を図19に示す。この場合、ドキュメントはテキストによる記述が付与された画像または映像である。このような構成とすることで、原言語をキーとして、目的言語の翻訳語に対応する画像情報を取得することができ、目的言語に対する知識がないユーザであっても容易に目的言語の画像付加情報等を有する画像情報を取得することができる。また、サーチエンジン991としてWWW上で利用可能なWebページ検索エンジンを用いた場合の情報検索結果の例を図20に示す。
ユーザインタフェース部200は、受信した情報検索結果をユーザに提示し、一連の言語横断型情報検索が終了する。
<意味ベクトル辞書300の構築方法>
意味ベクトル辞書300は、予め意味ベクトル辞書構築部910により構築されているものとする。テキスト情報を基に意味ベクトル辞書を構成する情報源、及び、構成手段については、既知の様々な情報源や手段が適用可能と考えられるため、本発明ではその詳細は規定しない。
例えば、意味ベクトル辞書構築部910は、同等または類似した内容を持つ原言語テキストと目的言語テキストの対の集合から原言語及び目的言語に共通する単語の潜在的な意味を表す特徴量を、各単語に対して1以上算出し、各単語に対する特徴量の集合を意味ベクトルとして算出し、この単語と意味ベクトルの集合を意味ベクトル辞書300として構築する。
例えば、あるトピックについて、原言語Sによる記述テキストと目的言語Tによる記述テキストを結合したテキストをドキュメントと考え、このようなドキュメントの集合により構成されるコーパスから、潜在的な意味を表すT次元の意味次元を抽出し、ドキュメント中の各単語とこれらの意味次元の関連度をT次元のベクトルとして抽出する手法の適用を仮定する。このような要件を満たす手法としては、LDA(Latent Dirichlet Allocation)と呼ばれるものが知られている(例えば、Xing Wei , W. Bruce Croft著、" LDA-based document models for ad-hoc retriev "、Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval、ACM、2006年、p.178-185等参照)。また、上記のような要件を満たすコーパスとして、日本語と英語を対象とする場合は例えば、EDR電子化辞書が利用できる(例えば、EDR電子化辞書仕様説明書(2.0版)、日本電子化辞書研究所、2001年参照)。EDR電子化辞書においては約40万の概念が日本語、英語を対象に整理されており、各概念に対して日本語と英語による説明テキストが付与されていることから、この概念の説明テキストを集約すれば、上記の要件を満たすコーパスを構成することができる。電子化辞書からの意味ベクトル辞書を構成する概念図を図21に示す。例えば、文書doc_lには、同等または類似した内容を持つ原言語テキスト(鶴.ツル.<<動物>> 首の長い水鳥.)と目的言語テキスト(crane,large long−necked wading bird of marshes and plains)の対が記述されている。この文書に対する単語「鶴」及び「crane」の特徴量f_i_l及びf_j_lを求める。特徴量としては例えば、各文書中の出現頻度等が挙げられる。各単語を行とし、各文書を列として得られた行列に対し、LDA等の手法により次元圧縮処理を行うことにより、各単語に対する意味ベクトルを求めることができる。
一方、画像を特徴づける画像特徴に対する意味ベクトルも、適切なリソースを利用することにより、上記と同様の方法で構成することができる。例えば、英語における概念とWeb画像を対応付けたリソースとして、ImageNetが利用できる(例えばJia Deng、他5名著、" ImageNet: A large-scale hierarchical image database "、Proceedings of CVPR 2009、 2009年等参照)。画像特徴に対する意味ベクトル構成の概念図を図22に示す。リソースに登録されている各画像を画像特徴意味ベクトル取得部251により分析し、画像特徴ベクトル(α1,α2,…,αN)により表現する。すると、各画像特徴を行とし、各ドキュメント(それぞれは1つの英語概念(例えば、crane,large long−necked wading bird of marshes and plains)及びその英語概念に対応付けられたWeb画像から得られる画像特徴ベクトル(例えば、α1,α2,…,αN)に対応する)を列として得られた行列に対し、LDA等の手法により次元圧縮処理を行うことにより、各画像特徴の潜在する意味を表現するT次元の意味ベクトルが得られる。
<効果>
本発明は、翻訳語候補をキーとして、画像検索を行い、取得した画像情報を検索語に関連する意味に分類し、翻訳語候補と分類された画像データとそれに対応する検索関連語とをユーザに提示するため、ユーザは画像情報により検索語の持つ多義性を視覚的に認識することができるという効果を奏する。さらに、検索語に関連する意味に基づいて提示される翻訳語と検索関連語を選択できるので、検索精度が高く、ユーザが使い易いという効果を奏する。
<変形例>
検索語意味記述部250は、画像データのみから画像意味記述を算出してもよい。その場合、画像記述意味ベクトル取得部253を設けなくともよい。また、画像付加情報のみから画像意味記述を算出してもよい。その場合、画像特徴意味ベクトル取得部251及び重み付け部252を設けなくともよい。少なくとも一方の情報を用いれば、画像意味記述を算出することができ、実施例1と同様の効果を得ることができる。さらに、計算量を減らすことができる。但し、画像の分類精度が落ちるため、結果として情報検索の精度は落ちる可能性がある。
本実施例では、各画像データからN次元の画像特徴ベクトルを取得するが、画像データ毎に異なる次元の画像特徴ベクトルを取得する構成としてもよい。その場合には、意味ベクトル辞書300に全ての次元の画像特徴ベクトルに対応する意味ベクトルを記憶しておき、画像データ毎に、(異なる次元の)画像特徴ベクトルに対応する意味ベクトルだけを取得する構成とすればよい。このような構成とすることで、各画像データに対応する画像特徴ベクトルのデータ量を減らすことができ、画像意味記述を求める際の計算を効率的に行うことができる。
本実施例では、検索語意味記述に対応する検索語に関連する意味と画像意味記述に対応する画像情報とを紐付けることにより、画像情報を検索語に関連する意味に分類するが、他の方法により、分類してもよい。
また、本実施例では、検索語に関連する意味を、原言語及び目的言語における単語の集合により表しているが、他の方法により、表してもよいものとする。
<ハードウェア構成>
図23に例示するように、この例の言語横断型情報検索システム100は、それぞれCPU(Central Processing Unit)11、入力部12、出力部13、補助記憶装置14、ROM(Read Only Memory)15、RAM(Random Access Memory)16及びバス17を有している。
この例のCPU11は、制御部11a、演算部11b及びレジスタ11cを有し、レジスタ11cに読み込まれた各種プログラムに従って様々な演算処理を実行する。また、入力部12は、データが入力される入力インタフェース、キーボード、マウス等であり、出力部13は、データが出力される出力インタフェース、ディスプレイ、プリンタ等である。補助記憶装置14は、例えば、ハードディスク、半導体メモリ等であり、言語横断型情報検索システム100としてコンピュータを機能させるためのプログラムや各種データが格納される。また、RAM16には、上記のプログラムや各種データが展開され、CPU11等から利用される。また、バス17は、CPU11、入力部12、出力部13、補助記憶装置14、ROM15及びRAM16を通信可能に接続する。なお、このようなハードウェアの具体例としては、例えば、パーソナルコンピュータの他、サーバ装置やワークステーション等を例示できる。
<プログラム構成>
上述のように、補助記憶装置14には、本実施例の言語横断型情報検索システム100の各処理を実行するための各プログラムが格納される。言語横断型情報検索プログラムを構成する各プログラムは、単一のプログラム列として記載されていてもよく、また、少なくとも一部のプログラムが別個のモジュールとしてライブラリに格納されていてもよい。
<ハードウェアとプログラムとの協働>
CPU11は、読み込まれたOSプログラムに従い、補助記憶装置14に格納されている上述のプログラムや各種データをRAM16に展開する。そして、このプログラムやデータが書き込まれたRAM16上のアドレスがCPU11のレジスタ11cに格納される。CPU11の制御部11aは、レジスタ11cに格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM16上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部11bに順次実行させ、その演算結果をレジスタ11cに格納していく。
図1は、このようにCPU11に上述のプログラムが読み込まれて実行されることにより構成される言語横断型情報検索システム100の機能構成を例示したブロック図である。
ここで、記憶部103、ST対訳辞書221、TS対訳辞書222及び意味ベクトル辞書300は、補助記憶装置14、RAM16、レジスタ11c、その他のバッファメモリやキャッシュメモリ等の何れか、あるいはこれらを併用した記憶領域に相当する。また、制御部105、検索要求解析部210、対訳取得部220、画像情報取得部240、画像分類部260、検索関連語抽出部270、ユーザ提示情報生成部275、情報検索式生成部280及び情報検索部290は、CPU11に言語横断型情報検索プログラムを実行させることにより構成されるものである。
100 言語横断型情報検索システム
101 通信部
103 記憶部
105 制御部
200 ユーザインタフェース部
210 検索要求解析部
220 対訳取得部
240 画像情報取得部
260 画像分類部
270 検索関連語抽出部
275 ユーザ提示情報生成部
280 情報検索式生成部
290 情報検索部

Claims (11)

  1. 原言語による検索要求に対し、この検索要求と適合し、かつ、原言語とは異なる目的言語で記述されたドキュメントを検索する言語横断型情報検索方法であって、
    画像データにはテキスト情報である画像付加情報が付与されており、画像情報は画像データと画像付加情報を含むものとし、
    前記検索要求を解析し、原言語の検索語を取得する検索要求解析ステップと、
    原言語の単語と各単語の目的言語における対訳を記憶する対訳辞書を検索し、前記検索語の対訳を翻訳語候補として取得する対訳取得ステップと、
    前記翻訳語候補をキーとして、画像検索を行い、画像情報を取得する画像情報取得ステップと、
    取得した画像情報を検索語に関連する意味に分類する画像分類ステップと、
    分類毎に、目的言語における検索関連語を抽出する検索関連語抽出ステップと、
    翻訳語候補と分類された画像データと検索関連語とをユーザに提示し、前記翻訳語候補と前記検索関連語とを選択させるための画面を生成するユーザ提示情報生成ステップ、
    ユーザに選択された前記翻訳語候補と前記検索関連語をキーとして、目的言語における情報検索を行う情報検索ステップと、をコンピュータに実行させる、
    ことを特徴とする言語横断型情報検索方法。
  2. 請求項1記載の言語横断型情報検索方法であって、
    前記検索語に関連する意味は、原言語及び目的言語における単語の集合により記述されるものとし、
    前記画像分類ステップは、
    予め構築された意味ベクトル辞書を参照して、前記翻訳語候補を基に生成される単語の集合を構成する原言語及び目的言語の意味を表現する意味ベクトルを求め、1以上の意味ベクトルから前記集合の検索語意味記述を求める検索語意味記述ステップと、
    予め構築された意味ベクトル辞書を参照し、前記画像情報の意味を表現する意味ベクトルを求め、1以上の意味ベクトルから画像意味記述を求める画像意味記述ステップと、
    前記検索語意味記述と画像意味記述の適合度を算出し、この適合度に応じて、前記検索語意味記述に対応する検索語に関連する意味と前記画像意味記述に対応する画像情報とを紐付ける適合度算出ステップと、
    を備える、
    ことを特徴とする言語横断型情報検索方法。
  3. 請求項2記載の言語横断型情報検索方法であって、
    同等または類似した内容を持つ原言語テキストと目的言語テキストの対の集合から原言語及び目的言語に共通する単語の潜在的な意味を表す特徴量を、各単語に対して1以上算出し、各単語に対する特徴量の集合を意味ベクトルとして算出するものとし、
    前記意味ベクトル辞書に単語と各単語に対する意味ベクトルを予め記憶する、
    ことを特徴とする言語横断型情報検索方法。
  4. 請求項2または3記載の言語横断型情報検索方法であって、
    前記画像意味記述ステップは、
    画像データを分析することにより得られる画像的な特徴を表現する画像特徴ベクトルを用いて、前記意味ベクトル辞書を参照して、画像特徴ベクトルに対する意味ベクトルを求める画像特徴意味ベクトル取得ステップと、画像付加情報を解析することにより得られる画像記述語を用いて、前記意味ベクトル辞書を参照して、画像記述語に対する意味ベクトルを求める画像記述意味ベクトル取得ステップと、の少なくとも1つのステップと、
    求まった1以上の意味ベクトルの重心ベクトルを前記画像意味記述として算出する重心ベクトル算出ステップと、
    を含む、
    ことを特徴とする言語横断型情報検索方法。
  5. 請求項1から4の何れかに記載の言語横断型情報検索方法であって、
    前記ドキュメントは、テキストによる記述が付与された画像または映像である、
    ことを特徴とする言語横断型情報検索方法。
  6. 原言語による検索要求に対し、この検索要求と適合し、かつ、原言語とは異なる目的言語で記述されたドキュメントを検索する言語横断型情報検索システムであって、
    画像データにはテキスト情報である画像付加情報が付与されており、画像情報は画像データと画像付加情報を含むものとし、
    前記検索要求を解析し、原言語の検索語を取得する検索要求解析部と、
    原言語の単語と各単語の目的言語における対訳を記憶する対訳辞書と、
    前記対訳辞書を検索し、前記検索語の対訳を翻訳語候補として取得する対訳取得部と、
    前記翻訳語候補をキーとして、画像検索を行い、画像情報を取得する画像情報取得部と、
    取得した画像情報を検索語に関連する意味に分類する画像分類部と、
    分類毎に、目的言語における検索関連語を抽出する検索関連語抽出部と、
    翻訳語候補と分類された画像データと検索関連語とをユーザに提示し、前記翻訳語候補と前記検索関連語とを選択させるための画面を生成するユーザ提示情報生成部、
    ユーザに選択された前記翻訳語候補と前記検索関連語をキーとして、目的言語における情報検索を行う情報検索部と、を有する
    ことを特徴とする言語横断型情報検索システム。
  7. 請求項6記載の言語横断型情報検索システムであって、
    前記検索語に関連する意味は、原言語及び目的言語における単語の集合により記述されるものとし、
    単語と、各単語の意味を表現する意味ベクトルと、画像情報の意味を表現する意味ベクトルとを記憶する意味ベクトル辞書を有し、
    前記画像分類部は、
    前記意味ベクトル辞書を参照して、前記翻訳語候補を基に生成される前記集合を構成する原言語及び目的言語の意味を表現する意味ベクトルを求め、1以上の意味ベクトルから前記集合の検索語意味記述を求める検索語意味記述部と、
    前記意味ベクトル辞書を参照して、前記画像情報の意味を表現する意味ベクトルを求め、1以上の意味ベクトルから画像意味記述を求める画像意味記述部と、
    前記検索語意味記述と画像意味記述の適合度を算出し、この適合度に応じて、前記検索語意味記述に対応する検索語に関連する意味と前記画像意味記述に対応する画像情報とを紐付ける適合度算出部と、
    を備える、
    ことを特徴とする言語横断型情報検索システム。
  8. 請求項7記載の言語横断型情報検索システムであって、
    同等または類似した内容を持つ原言語テキストと目的言語テキストの対の集合から原言語及び目的言語に共通する単語の潜在的な意味を表す特徴量を、各単語に対して1以上算出し、各単語に対する特徴量の集合を意味ベクトルとして算出するものとし、
    前記意味ベクトル辞書に単語と各単語に対する意味ベクトルを予め記憶しておく、
    ことを特徴とする言語横断型情報検索システム。
  9. 請求項7または8記載の言語横断型情報検索システムであって、
    前記画像意味記述部は、
    画像データを分析することにより得られる画像的な特徴を表現する画像特徴ベクトルを用いて、前記意味ベクトル辞書を参照して、画像特徴ベクトルに対する意味ベクトルを求める画像特徴意味ベクトル取得部と、画像付加情報を解析することにより得られる画像記述語を用いて、前記意味ベクトル辞書を参照して、画像記述語に対する意味ベクトルを求める画像記述意味ベクトル取得部と、の少なくとも一方と、
    求まった1以上の意味ベクトルの重心ベクトルを前記画像意味記述として算出する重心ベクトル算出部と、
    を備える、
    ことを特徴とする言語横断型情報検索システム。
  10. 請求項6から9の何れかに記載の言語横断型情報検索システムであって、
    前記ドキュメントは、テキストによる記述が付与された画像または映像である、
    ことを特徴とする言語横断型情報検索システム。
  11. 請求項6から請求項10の何れかに記載の言語横断型情報検索システムとして、コンピュータを機能させるための言語横断型情報検索プログラム。
JP2010124151A 2010-05-31 2010-05-31 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム Pending JP2011248827A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010124151A JP2011248827A (ja) 2010-05-31 2010-05-31 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010124151A JP2011248827A (ja) 2010-05-31 2010-05-31 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム

Publications (1)

Publication Number Publication Date
JP2011248827A true JP2011248827A (ja) 2011-12-08

Family

ID=45413965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010124151A Pending JP2011248827A (ja) 2010-05-31 2010-05-31 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム

Country Status (1)

Country Link
JP (1) JP2011248827A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10055406B2 (en) 2015-09-08 2018-08-21 Samsung Electronics Co., Ltd. Server, user terminal, and method for controlling server and user terminal
CN115878760A (zh) * 2023-02-10 2023-03-31 北京知呱呱科技服务有限公司 一种基于图匹配的跨语种专利检索方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10055406B2 (en) 2015-09-08 2018-08-21 Samsung Electronics Co., Ltd. Server, user terminal, and method for controlling server and user terminal
CN115878760A (zh) * 2023-02-10 2023-03-31 北京知呱呱科技服务有限公司 一种基于图匹配的跨语种专利检索方法及系统

Similar Documents

Publication Publication Date Title
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
KR101754473B1 (ko) 문서를 이미지 기반 컨텐츠로 요약하여 제공하는 방법 및 시스템
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
US11023503B2 (en) Suggesting text in an electronic document
KR102059743B1 (ko) 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템
CN111373386A (zh) 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序
US20200065395A1 (en) Efficient leaf invalidation for query execution
US20160154885A1 (en) Method for searching a database
Song et al. Semi-automatic construction of a named entity dictionary for entity-based sentiment analysis in social media
Spitz et al. EVELIN: Exploration of event and entity links in implicit networks
JP2014102827A (ja) 検索システム及びその検索方法
CN110688559A (zh) 一种检索方法及装置
JP2011248827A (ja) 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム
JP5700007B2 (ja) 情報処理装置、方法、およびプログラム
WO2022130579A1 (ja) 類似度判定プログラム、類似度判定装置、及び、類似度判定方法
JP6976537B1 (ja) 情報検索装置、情報検索方法および情報検索用プログラム
JP2010250359A (ja) 擬似文書検索システム及び擬似文書検索方法
TW201822031A (zh) 以文字資訊建立圖表索引方法及其電腦程式產品
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
Martins et al. A geo-temporal information extraction service for processing descriptive metadata in digital libraries
Schneider et al. Cross-lingual text clustering in a large system
JP2019149102A (ja) 情報処理装置、キーワード抽出装置、情報処理方法、およびプログラム
JP7323484B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2019211884A (ja) 情報検索システム
JP6905724B1 (ja) 情報提供システム及び情報提供方法

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111121