JP2009151630A - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2009151630A
JP2009151630A JP2007330078A JP2007330078A JP2009151630A JP 2009151630 A JP2009151630 A JP 2009151630A JP 2007330078 A JP2007330078 A JP 2007330078A JP 2007330078 A JP2007330078 A JP 2007330078A JP 2009151630 A JP2009151630 A JP 2009151630A
Authority
JP
Japan
Prior art keywords
document
term
unit
information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007330078A
Other languages
English (en)
Inventor
Atsushi Yoshimoto
淳 善本
Toru Shimizu
徹 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2007330078A priority Critical patent/JP2009151630A/ja
Publication of JP2009151630A publication Critical patent/JP2009151630A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】文書を時系列に沿って出力する際に、その文書の内容をよりよく理解できるようにする情報処理装置を提供する。
【解決手段】文書が記憶される文書記憶部11、文書から用語を抽出する用語抽出部12、文書をチャンクに分割し、各チャンクの係り受けを示す係り受け情報を取得する係り受け情報取得部13、係り受け情報を用い、文書から、一のチャンクに係る複数のチャンクの位置を入れ替えた文書を生成する文書生成部14、用語と画像を対応付ける対応情報が2以上記憶される対応情報記憶部16、抽出された用語に対応する画像を取得する画像取得部17、抽出された用語が均等に出現する文書を選択する文書選択部15、選択された文書のテキストを時系列に沿って出力する文書出力部18、取得された画像を、対応する用語が出力されるタイミングで表示する画像表示部19を備える。
【選択図】図1

Description

本発明は、文書に含まれる用語に対応する画像を、文書と共に出力する情報処理装置等に関する。
従来、文書を時系列に沿って出力することが行われている。例えば、テキストデータから音声を合成し、スピーカから音声出力することなどが行われている。そのように、時系列に沿って文書が出力される場合には、視覚的に文書をとらえる場合のように読み返すことができないため、理解されやすいように出力することが重要になる。そのため、文書をそのまま出力するのではなく、言い換えて出力する方法などが考えられ得る。
なお、関連する技術として、文書を言い換える技術が開発されている。より具体的には、話し言葉の文書を書き言葉の文書に変換する装置が開発されている(例えば、特許文献1参照)。
特開2003−132047号公報
前述のように、文書を時系列に沿って出力する際に、その文書の内容の理解をよりよくしたいという要望があった。
本発明は、上記課題を解決するためになされたものであり、文書を時系列に沿って出力する際に、その文書の内容の理解をよりよくすることができうる情報処理装置等を提供することを目的とする。
上記目的を達成するため、本発明による情報処理装置は、文書が記憶される文書記憶部と、前記文書記憶部で記憶されている文書から用語を抽出する用語抽出部と、前記文書記憶部で記憶されている文書をチャンクに分割し、各チャンクの係り受けを示す情報である係り受け情報を取得する係り受け情報取得部と、前記係り受け情報取得部が取得した係り受け情報を用いて、あるチャンクに2以上のチャンクが係っている場合には、当該2以上のチャンクの位置を入れ替え可能であるとして、前記文書記憶部で記憶されている文書から、入れ替え可能なチャンクの位置を入れ替えた文書を生成する文書生成部と、前記用語抽出部が抽出した用語に対応する画像を、用語と画像とを対応付けて有する情報である対応情報が2以上記憶される対応情報記憶部で記憶されている当該2以上の対応情報を用いて取得する画像取得部と、前記用語抽出部が抽出した用語が均等に出現する文書を、前記文書記憶部で記憶されている文書、及び前記文書生成部が生成した文書から選択する文書選択部と、前記文書選択部が選択した文書に含まれるテキストを、時系列に沿って出力する文書出力部と、前記画像取得部が取得した画像を、当該画像に対応する用語が前記文書出力部によって出力されるタイミングで表示する画像表示部と、を備えたものである。
このような構成により、文書を時系列に沿って出力する際に、その文書から抽出した用語に対応する画像を表示することができ、その出力される文書の内容が、よりよく理解されるようにすることができる。時系列に沿って出力される文書に接しているユーザは、各時点でその文書の一部分のみにしか接することができないが、画像が表示されることにより、出力中の文書に含まれる用語を残像のようにユーザに提示することができる。その結果として、ユーザの理解を助けることができる。また、ユーザは、例えば、聞き取れなかった用語や、見落とした用語があった場合でも、文書が時系列に沿って出力されているため、聞き返したり、読み返したりすることができないが、その聞き取れなかった用語や見落とした用語に対応する画像が表示されている場合には、聞き取れなかった用語や見落とした用語が何であったのかを理解することができるようになる。
また、本発明による情報処理装置では、前記文書出力部は、選択された文書に含まれるテキストに対応する音声情報を生成し、当該生成した音声情報を音声出力してもよい。
また、本発明による情報処理装置では、前記文書出力部は、選択された文書に含まれるテキストをティッカー表示してもよい。
また、本発明による情報処理装置では、前記用語抽出部は、前記文書記憶部で記憶されている文書に含まれる内容語と機能語のうち、内容語を抽出してもよい。
このような構成により、機能語よりは視覚化することが容易であると考えられる内容語を抽出することによって、画像を見たユーザが、よりよく文書の内容を理解することができるようになりうる。
また、本発明による情報処理装置では、前記用語抽出部は、前記文書記憶部で記憶されている文書の長さが長いほど、より多くの用語を抽出してもよい。
このような構成により、出力される文書の量に応じた量の画像が出力されることになる。したがって、例えば、短い時間に多くの画像が出力されて、ユーザの文書に対する理解を妨げる事態を回避することができうる。
また、本発明による情報処理装置では、前記用語抽出部は、用語と、当該用語の視覚化の容易さの指標である視覚化容易度とを対応付ける情報を用いて、前記文書記憶部で記憶されている文書から、視覚化容易度の高い用語を抽出してもよい。
このような構成により、視覚化容易度の高い用語を抽出することによって、出力される文書の理解の助けとなる画像を表示することができるようになると考えられる。一般に、視覚化容易度の低い用語に対応する画像を表示したとしても、その画像を見た者が、その画像に対応する用語を想起することは困難であると考えられるからである。
また、本発明による情報処理装置では、前記用語抽出部は、用語と、当該用語を視覚化した際における視覚化された画像の種類の多さを示す指標である視覚化揺らぎ度とを対応付ける情報を用いて、前記文書記憶部で記憶されている文書から、視覚化揺らぎ度の低い用語を抽出してもよい。
このような構成により、視覚化揺らぎ度の低い用語を抽出することによって、出力される文書の理解の助けとなる画像を表示することができるようになると考えられる。一般に、視覚化揺らぎ度の高い用語に対応する画像を表示したとしても、その画像を見た者が、その画像に対応する用語を想起することは困難であると考えられるからである。
また、本発明による情報処理装置では、前記用語抽出部は、用語と当該用語の視覚化の容易さの指標である視覚化容易度とを対応付ける情報、用語と当該用語を視覚化した際における視覚化された画像の種類の多さを示す指標である視覚化揺らぎ度とを対応付ける情報、及び、視覚化容易度が高いほど大きな値となり、視覚化揺らぎ度が低いほど大きな値となる式を用いて、前記文書記憶部で記憶されている文書から、前記式の値の大きい用語を抽出してもよい。
このような構成により、視覚化容易度が高く、視覚化揺らぎ度が低い用語を抽出することができうる。そのことによって、出力される文書の理解の助けとなる画像を表示することができるようになると考えられる。一般に、視覚化容易度の低い用語に対応する画像や、視覚化揺らぎ度の高い用語に対応する画像を表示したとしても、その画像を見た者が、その画像に対応する用語を想起することは困難であると考えられるからである。
また、本発明による情報処理装置では、前記文書選択部は、前記用語抽出部が抽出した用語のうち、前記式の値の最も大きい用語が他の抽出された用語に対して先頭となる文書を、前記文書記憶部で記憶されている文書、及び前記文書生成部が生成した文書から選択してもよい。
このような構成により、視覚化容易度が高く、視覚化揺らぎ度が低い用語に対応する画像がはじめに表示されるようにすることができる。視覚化容易度が高く、視覚化揺らぎ度が低い用語に対応する画像は、その画像に対応する用語を想起しやすい画像であると考えられるため、その画像をユーザの印象に残りやすい先頭の画像に採用することによって、ユーザが正しく文書を理解できるようにサポートすることができうる。
また、本発明による情報処理装置では、発生された原言語の音声をマイクによって集音した情報である原言語音声情報を受け付ける音声情報受付部と、前記音声情報受付部が受け付けた原言語音声情報を音声認識して、当該原言語音声情報に対応するテキスト情報である音声認識結果情報を取得する音声認識部と、前記音声認識部が取得した音声認識結果情報を機械翻訳して、当該音声認識結果情報に対応する目的言語のテキストの文書を取得して、前記文書記憶部に蓄積する機械翻訳部と、をさらに備えてもよい。
このような構成により、音声翻訳装置において、翻訳後の文書を時系列に沿って出力する際に、その文書から抽出した用語に対応する画像を表示することができ、その出力される文書の内容が、よりよく理解されるようにすることができる。また、画像が表示されることによって、原言語の話し手が目的言語を理解できない場合であっても、その話し手の発話が適切に翻訳されたかどうかを、表示された画像を見ることによって、確認することができる。その結果、もしも適切に翻訳されていなかったことが分かった場合には、例えば、言い換えることによって、適切な翻訳がなされるようにすることができうる。
また、本発明による情報処理装置では、前記画像表示部は、表示する画像に対応する用語の属性に応じた表示方法で画像を表示してもよい。
また、本発明による情報処理装置では、前記属性は、用語の単数と複数との違いであってもよい。
本発明による情報処理装置等によれば、文書を時系列に沿って出力する際に、その文書の内容の理解をよりよくすることができうる。
以下、本発明による情報処理装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。
(実施の形態1)
本発明の実施の形態1による情報処理装置について、図面を参照しながら説明する。本実地の形態による情報処理装置は、文書に含まれる用語と、その用語に対応する画像とを同期させて出力するものである。
図1は、本実施の形態による情報処理装置1の構成を示すブロック図である。本実施の形態による情報処理装置は、文書記憶部11と、用語抽出部12と、係り受け情報取得部13と、文書生成部14と、文書選択部15と、対応情報記憶部16と、画像取得部17と、文書出力部18と、画像表示部19とを備える。
文書記憶部11では、文書が記憶される。この文書は、後述する文書出力部18によって出力される文書であるため、例えば、ユーザは、出力したい文書を文書記憶部11で記憶するようにしてもよい。また、実施の形態2で説明するように、この文書は、機械翻訳の結果であってもよい。
文書記憶部11に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が文書記憶部11で記憶されるようになってもよく、通信回線等を介して送信された情報が文書記憶部11で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が文書記憶部11で記憶されるようになってもよい。文書記憶部11での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。文書記憶部11は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
用語抽出部12は、文書記憶部11で記憶されている文書から用語を抽出する。この用語抽出部12によって抽出される用語は、後述するように、その用語に対応する画像が画像表示部19によって表示されるものであるため、文書記憶部11で記憶されている文書を特徴付ける用語であることが好適である。用語抽出部12が抽出した用語は、図示しない記録媒体において一時的に記憶されてもよい。
用語抽出部12は、文書記憶部11で記憶されている文書に含まれる内容語と機能語のうち、内容語を抽出してもよい。機能語とは、文法的な役割を持つ語である。例えば、日本語の助詞や、接続詞等が機能語となる。内容語は、機能語以外の一般的な意味を持つ語である。例えば、名詞や動詞、形容詞等が内容語となる。用語抽出部12は、文書に含まれる内容語のすべてを抽出してもよく、あるいは、一部を抽出してもよい。用語抽出部12は、内容語を抽出する際に、例えば、文書に対して形態素解析を行い、特定の品詞の用語を抽出することによって、内容語を抽出してもよい。例えば、文書から名詞を抽出することによって、内容語を抽出することができる。また、用語抽出部12は、内容語と機能語とを含む辞書を用いて、文書に含まれる各用語が内容語であるのか、機能語であるのかを判断し、内容語であると判断された用語を抽出してもよい。なお、その辞書は、図示しない記録媒体で記憶されていてもよい。
形態素解析については、すでに公知であって、その詳細な説明を省略する。形態素解析のシステムとして、日本語の場合には、例えば、奈良先端科学技術大学院大学で開発された「ChaSen(茶筌)」(http://chasen.naist.jp)等が知られている。また、英語の場合には、英単語に品詞を付与するソフトウェアとして、例えば、「TnT」(http://www.coli.uni−saarland.de/〜thorsten/tnt/)や「Brill Tagger」(http://www.cs.jhu.edu/〜brill/)等が知られている。
また、用語抽出部12が抽出した用語に対応する画像が、後述する画像取得部17によって対応情報を用いて取得されることになるため、用語抽出部12は、その画像の抽出を行うことができるように、対応情報記憶部16で記憶されている対応情報において画像と対応付けられている用語のみを抽出するようにしてもよい。なお、対応情報記憶部16や、対応情報については後述する。
また、用語抽出部12が抽出する用語の数は、例えば、あらかじめ決められていてもよく、あるいは、文書に応じて決められてもよい。前者の場合には、例えば、あらかじめ3個や5個を抽出すると決められており、用語抽出部12は、その決められた個数の用語を抽出する。なお、文書が短い場合などにおいて、その決められた個数の用語を抽出できない場合には、その決められた個数以下の用語を抽出してもよい。後者の場合には、例えば、用語抽出部12は、文書記憶部11で記憶されている文書の長さが長いほど、より多くの用語を抽出してもよい。文書の長さは、文書の文字数であってもよく、文書の単語数、形態素数であってもよく、文書のデータ容量であってもよく、あるいは、文書を出力する際の時間(例えば、音声出力する際の時間や、ティッカー表示する際の時間など)であってもよい。用語抽出部12は、あらかじめ設定されている1個の用語を抽出する単位(用語単位と呼ぶことにする)を保持しており、その用語単位で文書の長さを割ることによって、抽出する用語の数を算出してもよい。すなわち、抽出する用語数は、次式のようにして求められてもよい。
抽出する用語の数=int(文書の長さ/用語単位)
ここで、int(N)は、Nの整数部分のみの値を返す関数である。また、文書の長さを用語単位で割るため、文書の長さの種類と、用語単位の種類が同じでなければならない。例えば、文書の長さがデータ容量で示される場合には、用語単位もデータ容量で示されなければならない。また、文書の長さが文書を出力する際の時間で示される場合には、用語単位もその用語単位を出力する際の時間で示されなければならない。また、用語単位は、一意に決められるものであってもよく、あるいは、文書の長さに応じて変化させてもよい。例えば、長い文の場合には、より長い用語単位を用い、短い文の場合には、より短い用語単位を用いるようにしてもよい。
また、用語抽出部12は、用語と、その用語の視覚化の容易さの指標である視覚化容易度とを対応付ける情報である視覚化容易度対応情報を用いて、文書記憶部11で記憶されている文書から、視覚化容易度の高い用語を抽出してもよい。ここで、視覚化容易度について説明する。例えば、用語「空」は視覚化しやすいが、用語「友情」などの抽象的な用語は視覚化が困難である。したがって、用語「空」や、用語「山」などは、視覚化容易度が高くなり、用語「友情」や、用語「忍耐」などは、視覚化容易度が低くなる。この視覚化容易度は、例えば、100人の被験者に各用語について視覚化しやすいかどうかを質問し、その質問に対する回答で視覚化しやすいと答えた人数を100で割った値にしてもよい。その場合には、視覚化容易度は、0〜1の実数をとることになる。一般に、視覚化容易度の低い用語に対応する画像を表示したとしても、その画像を見た者が、その画像の意味を理解することは困難であると考えられる。例えば、用語「友情」に対応する画像を見た者が、その画像から「友情」を想起することは困難であると考えられる。一方、視覚化容易度の高い用語に対応する画像を表示した場合には、その画像を見た者が、その画像の意味を理解することは容易であると考えられる。例えば、用語「山」に対応する画像を見た者が、その画像から「山」を想起することは容易であると考えられる。したがって、視覚化容易度の高い用語を用語抽出部12が抽出することによって、その用語に対応する画像が表示された際に、その画像の意味がより理解されやすいようにすることができうる。
ここで、視覚化容易度の高い用語とは、他の用語に比べて視覚化容易度が高い用語のことである。例えば、視覚化容易度の高い用語は、視覚化容易度の値がしきい値よりも大きい用語であってもよく、視覚化容易度の大きい方から選択された、あらかじめ決められた個数の用語や、視覚化容易度の大きい方から選択された、あらかじめ決められた割合の用語であってもよい。しきい値よりも大きいとは、しきい値を含んでもよく、あるいは、含まなくてもよい。また、しきい値は、例えば、あらかじめ設定された値であってもよく、得られた視覚化容易度に応じて定められてもよい。後者の場合には、例えば、しきい値は、文書に含まれる用語に対応する視覚化容易度の最大値に0.9などの1よりも小さい値を掛けた値であってもよい。
用語抽出部12は、用語と、その用語を視覚化した際における視覚化された画像の種類の多さを示す指標である視覚化揺らぎ度とを対応付ける情報である視覚化揺らぎ度対応情報を用いて、文書記憶部11で記憶されている文書から、視覚化揺らぎ度の低い用語を抽出してもよい。ここで、視覚化揺らぎ度について説明する。例えば、用語「卍(まんじ)」に対応する画像は、卍そのものの画像であったり、卍が描かれた寺院の画像であったり、卍が描かれた仏像の画像であったりなど、画像に揺らぎがある。また、例えば、用語「ダイヤ」に対応する画像は、ダイヤモンドの画像であったり、時刻表(ダイヤグラム)の画像であったり、トランプの札の種類であるダイヤ(菱形)の画像であったりなど、画像に揺らぎがある。したがって、用語「卍」や、用語「ダイヤ」などは、視覚化揺らぎ度が高くなる。一方、例えば、用語「山」や、用語「雲」などに対応する画像は、ほぼ一定のものであると考えられる(具体的な画像の違いは存在しうるが)。したがって、用語「山」や、用語「雲」などは、視覚化揺らぎ度が低くなる。この視覚化揺らぎ度は、例えば、100人の被験者に各用語について2以上の画像を想起するかどうか質問し、その質問に対する回答で2以上の画像を想起すると答えた人数を100で割った値にしてもよい。あるいは、画像検索エンジン(例えば、http://images.google.co.jp/等)や、画像を検索できるサイト(例えば、http://www.flickr.com等)を用いて用語に応じた画像の検索を行い、その検索された画像において、互いに類似度の低い画像が多数存在する場合には視覚化揺らぎ度を高く設定し、類似度の高い画像が多数存在する場合には、視覚化揺らぎ度を低く設定してもよい。
ここで、視覚化揺らぎ度の低い用語とは、他の用語に比べて視覚化揺らぎ度が低い用語のことである。例えば、視覚化揺らぎ度の低い用語は、視覚化揺らぎ度の値がしきい値よりも小さい用語であってもよく、視覚化揺らぎ度の小さい方から選択された、あらかじめ決められた個数の用語や、視覚化揺らぎ度の小さい方から選択された、あらかじめ決められた割合の用語であってもよい。しきい値よりも小さいとは、しきい値を含んでもよく、あるいは、含まなくてもよい。また、しきい値は、例えば、あらかじめ設定された値であってもよく、得られた視覚化揺らぎ度に応じて定められてもよい。後者の場合には、例えば、しきい値は、文書に含まれる用語に対応する視覚化揺らぎ度の最小値に1.2などの1よりも大きい値を掛けた値であってもよい。
また、用語抽出部12は、用語とその用語の視覚化の容易さの指標である視覚化容易度とを対応付ける情報である視覚化容易度対応情報、用語とその用語を視覚化した際における視覚化された画像の種類の多さを示す指標である視覚化揺らぎ度とを対応付ける情報である視覚化揺らぎ度対応情報、及び、視覚化容易度が高いほど大きな値となり、視覚化揺らぎ度が低いほど大きな値となる式を用いて、文書記憶部11で記憶されている文書から、式の値の大きい用語を抽出してもよい。例えば、その式は、次の式1や式2のようなものであってもよい。
式1:α×視覚化容易度+β/(視覚化揺らぎ度)
式2:α×視覚化容易度+β×(1−視覚化揺らぎ度)
なお、α=1/2,β=1/2であってもよく、α、βは、その他の値であってもよい。
ここで、式の値の大きい用語とは、他の用語に比べて式の値が大きい用語のことである。例えば、式の値の大きい用語は、式の値の値がしきい値よりも大きい用語であってもよく、式の値の大きい方から選択された、あらかじめ決められた個数の用語や、式の値の大きい方から選択された、あらかじめ決められた割合の用語であってもよい。しきい値よりも大きいとは、しきい値を含んでもよく、あるいは、含まなくてもよい。また、しきい値は、例えば、あらかじめ設定された値であってもよく、得られた式の値に応じて定められてもよい。後者の場合には、例えば、しきい値は、文書に含まれる用語に対応する式の値の最大値に0.9などの1よりも小さい値を掛けた値であってもよい。
なお、用語抽出部12が視覚化容易度対応情報や、視覚化揺らぎ度対応情報、式等を用いて用語を抽出する際には、それらの情報は、あらかじめ図示しない記録媒体において記憶されており、用語抽出部12は、適宜、その情報を読み出すことによって用いてもよい。また、用語抽出部12は、式を用いて用語と抽出する際に、式の値があらかじめ設定されているしきい値よりも小さい用語については、抽出しなくてもよい。その場合には、例えば、4個の用語を抽出することになっていたとしても、式の値がしきい値よりも大きい用語が3個しかない場合には、3個の用語を抽出するのみであってもよい。
また、用語抽出部12は、形態素解析された文書から、特定の品詞の用語を抽出するようにしてもよい。また、用語抽出部12は、TFIDFを用いて、文書から特徴的な用語を抽出してもよい。また、用語抽出部12は、文書記憶部11で記憶されている文書が構造化されている場合(例えば、XMLやHTML、TeX等のマークアップ言語で記述されている場合など)に、特定の箇所から、用語を抽出するようにしてもよい。例えば、文書にタイトルが設定されている場合に、用語抽出部12は、そのタイトルの部分から用語を抽出してもよい。なお、用語抽出部12が文書から用語を抽出する方法は、これらに限定されるものでなく、適切に用語と抽出することができるのであれば、これ以外の方法であってもよい。
係り受け情報取得部13は、文書記憶部11で記憶されている文書をチャンクに分割し、各チャンクの係り受けを示す情報である係り受け情報を取得する。チャンクとは、例えば、形態素であってもよく、単語であってもよく、形態素や単語の連続したもの(例えば、意味上ひとまとまりとなる意味チャンク等)であってもよく、あるいは、その他の単位であってもよい。文書をチャンクに分割する処理は、すでに公知であり、その詳細な説明を省略する。また、チャンクの係り受けを示す情報である係り受け情報を取得する処理も、すでに公知であり、その詳細な説明を省略する。例えば、チャンクの係り受けを解析する技術や、チャンクを関係付ける依存関係(ディペンデンシー)の抽出技術として知られている。例えば、「http://chasen.org/〜taku/software/cabocha/」で公開されているものを用いることも可能である。係り受け情報は、チャンクの係り受けを示すことができるものであれば、その構造を問わない。例えば、係り受け情報は、係り受け元となるチャンクの識別情報と、係り受け先となるチャンクの識別情報とを対応付けて有する複数のレコードから構成される情報であってもよく、その他の構造の情報であってもよい。チャンクの識別情報は、例えば、チャンクそのものであってもよく、文書記憶部11で記憶されている文書の先頭からのチャンクの順番を示す情報であってもよく、その他の情報であってもよい。係り受け情報取得部13が取得した係り受け情報は、図示しない記録媒体において一時的に記憶されてもよい。
文書生成部14は、係り受け情報取得部13が取得した係り受け情報を用いて、あるチャンクに2以上のチャンクが係っている場合には、その2以上のチャンクの位置を入れ替え可能であるとして、文書記憶部11で記憶されている文書から、入れ替え可能なチャンクの位置を入れ替えた文書を生成する。文書生成部14は、入れ替え可能なチャンクの位置を入れ替えたすべての文書を生成してもよく、あるいは、一部の文書を生成してもよい。また、文書生成部14は、文書記憶部11で記憶されている文書そのものも、チャンクの位置を入れ替えた文書の一つとして生成してもよく、あるいは、そうでなくてもよい。文書生成部14がチャンクを入れ替えることによって文書を生成する具体的な方法については後述する。文書生成部14が生成した文書は、図示しない記録媒体において一時的に記憶されてもよい。
文書選択部15は、用語抽出部12が抽出した用語が均等に出現する文書を、文書記憶部11で記憶されている文書、及び文書生成部14が生成した文書から選択する。抽出された用語が均等に出現する文書を選択するとは、抽出された用語ができるだけ均等に出てきている文書を選択する、という程度の意味である。したがって、選択された文書において、厳密な意味において、抽出された用語が均等に出現していなくてもよい。抽出された用語が均等に出現する文書が選択されることによって、その文書が、後述する文書出力部18によって出力されることになり、また、その文書に含まれる用語に対応する画像が、後述する画像表示部19によって、その対応する用語の出力タイミングで表示されることになる。したがって、抽出された用語ができるだけ均等に出現する文書が選択されることによって、その画像の表示の時間をできるだけ均等にすることができ、その画像をより見やすくすることができうる。例えば、山の画像が1秒表示され、その後に、海の画像が9秒表示されるよりは、山の画像が5秒表示され、その後に、海の画像が5秒表示される方が、その表示を見るユーザにとっては、山と海の画像の両方をよりよく把握しやすくなると考えられるからである。また、このように画像の表示される時間を均等にすることによって、重要度の低い画像が長い時間表示されることに起因して、出力される文の意味が曲解されることを回避することもできうる。文書選択部15は、例えば、抽出された用語が最も均等に出現する文書を選択してもよく、他の文書と比較すれば、抽出された用語が均等に出現しているが、最も均等に出現しているのではない文書を選択してもよい(この場合には、例えば、2番目に均等に出現している文書や、3番目に均等に出現している文書が選択されることになりうる)。文書選択部15が選択した文書は、図示しない記録媒体において一時的に記憶されてもよい。
ここで、用語が均等に出現しているかどうかを判断する方法について説明する。例えば、前述のように用語単位が設定されている場合には、抽出された用語の間の長さ(隣接する用語の間の長さである)と、用語単位との差の2乗の和(絶対値の和であってもよい)を、文書記憶部11で記憶されている文書や、生成された文書に対して算出し、その算出した和の値が最も小さい文書を、抽出された用語が最も均等に出現している文書であると判断してもよい。また、実質的に同様のことであるが、抽出された用語の間の長さと、用語単位との差の絶対値の標準偏差を、文書記憶部11で記憶されている文書や、生成された文書に対して算出し、その算出した標準偏差の値が最も小さい文書を、抽出された用語が最も均等に出現している文書であると判断してもよい。なお、用語単位に代えて、文書の長さを、抽出される用語の個数で割った長さ(すなわち、抽出された用語あたりの文書の長さ)を用いてもよい。また、用語の間の長さは、前述のように、文字数であってもよく、単語数、形態素数であってもよく、データ容量であってもよく、あるいは、文字を出力する際の時間(例えば、音声出力する際の時間や、ティッカー表示する際の時間など)であってもよい。また、前述のように、用語の間の長さの種類と、用語単位の種類は、同じであることが好適である。また、用語の間の長さは、例えば、各用語の先頭の位置の間の長さであってもよく、各用語の後端の位置の間の長さであってもよく、各用語の中心の位置の間の長さであってもよく、各用語のテキストを含まない用語間の長さであってもよい。
また、文書選択部15は、用語抽出部12が抽出した用語のうち、前述の視覚化容易度、視覚化揺らぎ度を引数とする式の値の最も大きい用語が他の抽出された用語に対して先頭となる文書を、文書記憶部11で記憶されている文書、及び文書生成部14が生成した文書から選択してもよい。前述の式の値の大きい用語は、揺らぎなく視覚化できる用語であると考えられるところ、そのような用語に対応する画像がはじめに表示されることは、出力される文書のイメージを適切に把握するために寄与するものと考えられるからである。具体的な選択方法としては、例えば、文書選択部15は、抽出された用語が均等に出現している文書を、最も均等なものからあらかじめ決められた個数(例えば、3個や5個など)だけ暫定的に選択し、その暫定的に選択したものから、前述の式の値の最も大きい用語と、文書の先頭からの長さが最も短い文書を選択してもよい。または、他の選択方法であってもよい。
また、文書選択部15は、用語抽出部12が抽出した用語のうち、前述の視覚化容易度、視覚化揺らぎ度を引数とする式の値の最も大きい用語が他の抽出された用語に対して後端となる文書を、文書記憶部11で記憶されている文書、及び文書生成部14が生成した文書から選択してもよい。例えば、画像取得部17がインターネット等において保持されている対応情報を用いて画像を取得する場合には、その画像の取得にいくらかの時間がかかることになる。したがって、その時間を確保するために、より重要な用語である、前述の式の値の大きい用語に対応する画像を適切に取得することができるように、その画像が最後に表示されるようにしてもよい。
また、文書選択部15は、抽出された用語が、前述の視覚化容易度、視覚化揺らぎ度を引数とする式の値の降順に、文書の先頭から後端に向かって並ぶ文書を、文書記憶部11で記憶されている文書、及び文書生成部14が生成した文書から選択してもよい。
また、文書選択部15は、抽出された用語が1個だけである場合には、その用語ができるだけ先頭に近い位置となる文書を、文書記憶部11で記憶されている文書、及び文書生成部14が生成した文書から選択してもよい。
対応情報記憶部16では、用語と画像とを対応付けて有する情報である対応情報が2以上記憶される。対応情報に含まれる用語は、用語抽出部12によって抽出されると考えられる用語である。例えば、用語抽出部12が名詞しか抽出しない場合には、対応情報に含まれる用語も名詞だけであってもよい。また、対応情報に含まれる画像は、静止画像であってもよく、動画像であってもよい。また、その画像は、例えば、写真であってもよく、イラストであってもよい。また、対応情報には、用語と画像以外の情報が含まれていてもよい。また、対応情報は、用語と画像とを一対一に対応付ける情報であってもよく、あるいは、そうでなくてもよい。後者として、対応情報は、例えば、画像が富士山の画像である場合に、その富士山の画像と、用語「山」「富士山」とを対応付ける情報であってもよい。また、後者として、対応情報は、例えば、単数の用語(例えば、apple)と複数の用語(apples)と、一のリンゴの画像とを対応付ける情報であってもよい。
また、この対応情報記憶部16で記憶される対応情報に含まれる画像は、視覚化可逆値の値の高いものであることが好適である。ここで、視覚化可逆値とは、画像から、その画像に対応情報で対応付けられている用語を正しく想起できる容易さの指標である。例えば、用語「空」に対応付けられている画像から、用語「空」のみを想起できる場合には、視覚化可逆値が高いと判断されるが、その画像から、用語「空」「昼」「雲」などを想起できる場合には、視覚化可逆値が低いと判断される。この視覚化可逆値は、例えば、100人の被験者に用語「空」に対応付けられている画像から想起される用語を質問し、その質問に対する回答で「空」を答えた人数を100で割った値にしてもよい。その場合には、視覚化可逆値は、0〜1の実数をとることになる。なお、その被験者は、画像に対応付けられている用語を知識として知っているものとする。知識として知っていない単語を画像から想起することは不可能だからである。一般に、視覚化可逆値の低い画像を表示したとしても、その画像を見た者が、その画像に対応付けられている用語を想起することは困難であると考えられるため、前述のように、対応情報記憶部16で記憶される対応情報に含まれる画像は、視覚化可逆値が高いことが好適である。
対応情報記憶部16に対応情報が記憶される過程は問わない。例えば、記録媒体を介して対応情報が対応情報記憶部16で記憶されるようになってもよく、通信回線等を介して送信された対応情報が対応情報記憶部16で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された対応情報が対応情報記憶部16で記憶されるようになってもよい。対応情報記憶部16での記憶は、外部のストレージデバイス等から読み出した対応情報のRAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。対応情報記憶部16は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
画像取得部17は、用語抽出部12が抽出した用語に対応する画像を取得する。画像取得部17は、例えば、用語抽出部12が抽出した用語を検索キーとして複数の対応情報を検索し、ヒットした対応情報に含まれる画像を取得する。なお、取得した画像は、図示しない記録媒体において、一時的に記憶されてもよい。また、画像取得部17は、一の用語に対して、一の画像を取得してもよく、一の用語に対して、二以上の画像を取得してもよい。また、画像取得部17は、例えば、用語抽出部12が抽出した用語を検索キーとして複数の対応情報を検索する際に、用語の単数・複数を考慮しないで検索してもよい。例えば、画像取得部17は、用語が「apples」である場合に、対応情報の「apple」を有するレコードを検索してもよい。
また、画像取得部17は、一の用語に2以上の画像が対応付けられている場合であって、その各画像に前述の視覚化可逆値が対応付けられている場合には、用語抽出部12が抽出した用語に対応する画像であって、視覚化可逆値の大きい画像を取得してもよい。視覚化可逆値の大きい画像とは、視覚化可逆値が他の画像よりも大きい画像のことであって、例えば、視覚化可逆値の値が、しきい値よりも大きい画像であってもよく、視覚化可逆値の値が大きい方から選択された、あらかじめ決められた個数の画像や、視覚化可逆値の値が大きい方から選択された、あらかじめ決められた割合の画像であってもよい。しきい値よりも大きい値とは、しきい値を含んでもよく、あるいは、含まなくてもよい。また、しきい値は、例えば、あらかじめ設定された値であってもよく、取得の対象となる複数の画像に対応付けられた視覚化可逆値に応じて定められてもよい。後者の場合には、例えば、しきい値は、抽出された用語に対応する各画像の視覚化可逆値の最大値に0.9などの1よりも小さい値を掛けた値であってもよい。
また、画像取得部17は、抽出された用語に対応する画像が対応情報記憶部16で記憶されていない場合には、抽出された用語をテキストとして示す画像を生成してもよい。したがって、画像の取得には、画像の生成が含まれるものとする。例えば、画像取得部17は、抽出された用語「ホバークラフト」に対応する画像が存在しなかった場合に、「ホバークラフト」のテキストを示す画像を生成してもよい。
なお、本実施の形態では、情報処理装置1が対応情報記憶部16を有する場合について説明するが、情報処理装置1は対応情報記憶部16を有しなくてもよい。その場合には、画像取得部17は、情報処理装置1の外部に存在する対応情報にアクセスし、その対応情報を用いて、画像を取得してもよい。対応情報が情報処理装置1の外部に存在する場合には、その対応情報は、一箇所に存在するのではなく、複数の箇所に分散して存在していてもよい。例えば、インターネットやイントラネット等に対応情報が存在する場合には、一般に、分散して存在することが多くなると考えられる。
文書出力部18は、文書選択部15が選択した文書に含まれるテキストを、時系列に沿って出力する。「時系列に沿って出力する」とは、文書のテキストを、文書の先頭から文書の後端に向かって、順次、出力することである。したがって、その出力された文書を見たり、聞いたりなどするユーザにとって、一時に受け取ることができるテキストは、文書の一部のテキストになる。具体的には、文書出力部18は、選択された文書に含まれるテキストに対応する音声情報を生成し、その生成した音声情報を音声出力してもよく、選択された文書に含まれるテキストをティッカー表示してもよい。ティッカー表示とは、特定の範囲内にテキストを流しながら表示することである。例えば、右から左に向かって、あるいは上から下に向かってテキストが流れてゆくのを読ませる方式であり、新幹線の車内や証券取引所等での掲示板で用いられる。また、文書出力部18は、選択された文書に含まれるテキストをテロップ表示し、かつ、そのテロップにおいて、ユーザに注目させる部分を時系列に沿って変化させるようにしてもよい。例えば、カラオケでのテロップ表示のように、テロップの色を文書の時系列に沿って変えていくことによって、色の境目を注目させるようにしてもよい。また、文書に含まれるテキストを時系列に沿って出力することができるのであれば、文書出力部18は、その他の方法を用いてもよい。なお、テキストから音声情報を生成する方法は、音声合成の技術としてすでに公知であり、詳細な説明を省略する。
ここで、この出力は、例えば、表示デバイス(例えば、CRTや液晶ディスプレイなど)への表示でもよく、スピーカによる音声出力でもよい。なお、文書出力部18が出力したテキストが最終的に音声出力されたり、ティッカー表示されたりするのであれば、文書出力部18は、出力するテキストを、所定の機器に通信回線を介した送信してもよく、あるいは、記録媒体に蓄積してもよい。また、文書出力部18は、出力を行うデバイス(例えば、表示デバイスやスピーカなど)を含んでもよく、あるいは含まなくてもよい。また、文書出力部18は、ハードウェアによって実現されてもよく、あるいは、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
画像表示部19は、画像取得部17が取得した画像を、その画像に対応する用語が文書出力部18によって出力されるタイミングで表示する。例えば、文書出力部18が文書「…空が…」を出力するものであり、用語抽出部12によって用語「空」が抽出されている場合には、文書出力部18が「空」を出力した時点に、画像表示部19は、用語「空」に対応付けられている画像を表示する。その表示の時間は、例えば、あらかじめ決められた時間(例えば、1秒、3秒など)であってもよく、あるいは、次の新たな画像が表示されるまでであってもよい。また、例えば、用語「バケツをひっくり返したような雨」のように長い用語に対応する画像を表示する際の表示のタイミングは、その用語の先頭の位置にあわせてもよく、その用語の後端の位置にあわせてもよく、あるいは、その用語の先頭から後端までのいずれかの位置にあわせてもよい。
なお、文書出力部18によって出力される用語と、画像表示部19によって表示される画像とを同期させる方法は問わない。例えば、文書出力部18が、抽出された用語を出力する際に、その用語を画像表示部19に渡し、画像表示部19は、その用語を受け取ったタイミングで、その用語に対応する画像であって、画像取得部17によって取得された画像を表示するようにしてもよい。
なお、画像表示部19は、例えば、画像取得部17が一の用語に対して二以上の画像を取得した場合に、それらの画像を、通常は一の画像を表示する時間内において、切り替えながら表示するようにしてもよい。
また、画像表示部19は、表示を行う表示デバイス(例えば、CRTや液晶ディスプレイなど)を含んでもよく、あるいは含まなくてもよい。また、画像表示部19は、ハードウェアによって実現されてもよく、あるいは表示デバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
なお、文書記憶部11と、対応情報記憶部16とは、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体によって実現されてもよい。前者の場合には、文書を記憶している領域が文書記憶部11となり、対応情報を記憶している領域が対応情報記憶部16となる。
次に、本実施の形態による情報処理装置1の動作について、図2のフローチャートを用いて説明する。図2は、文書記憶部11で記憶されている各文書について、画像を取得して、その画像と文書とを出力する処理を示すフローチャートである。
(ステップS101)用語抽出部12は、文書記憶部11で記憶されている、出力対象となる文書から用語を抽出する。この用語を抽出する処理の詳細については、図3のフローチャートを用いて後述する。
(ステップS102)係り受け情報取得部13は、文書記憶部11で記憶されている、出力対象となる文書をチャンクに分割し、各チャンクの係り受けを示す係り受け情報を取得する。
(ステップS103)文書生成部14は、係り受け情報取得部13が取得した係り受け情報を参照し、入れ替え可能なチャンクが存在するかどうか判断する。そして、存在する場合には、ステップS104に進み、存在しない場合には、文書の生成を行わないでステップS106に進む。具体的には、一のチャンクに二以上のチャンクが係っている場合に、文書生成部14は、入れ替え可能なチャンクが存在すると判断してもよい。
(ステップS104)文書生成部14は、入れ替え可能なチャンクを入れ替えることによって文書を生成する。この処理の詳細については、図4のフローチャートを用いて後述する。
(ステップS105)文書選択部15は、文書生成部14が生成した文書、及び文書記憶部11で記憶されている文書から、抽出された用語が均等に出現する文書を選択する。
(ステップS106)画像取得部17は、用語抽出部12が抽出した用語に対応する画像を、対応情報記憶部16から取得する。
(ステップS107)文書出力部18は、文書選択部15が選択した文書を出力し、画像表示部19は、画像取得部17が取得した画像を、その画像に対応する用語が文書出力部18によって出力されるタイミングで表示する。
(ステップS108)図示しない制御部は、出力の対象となる次の文書が文書記憶部11で記憶されているかどうか判断し、記憶されている場合には、ステップS101に戻り、そうでない場合には、文書と画像とを出力する一連の処理が終了となる。
図3は、図2のフローチャートにおける用語の抽出処理(ステップS101の処理)の詳細を示すフローチャートである。図3のフローチャートにおいて、用語抽出部12は、前述の式を用いることによって、用語を抽出するものとする。そのため、図示しない記録媒体において、その式と、視覚化容易度対応情報と、視覚化揺らぎ度対応情報とが記憶されているものとする。
(ステップS201)用語抽出部12は、抽出する用語の候補を抽出する。この候補は、出力の対象となる文書に含まれる内容語であってもよく、あらかじめ決められた品詞の単語や形態素であってもよい。例えば、あらかじめ名詞を用語の候補とすることが決められている場合には、用語抽出部12は、出力の対象となる文書を形態素解析して、その結果を用いて、名詞を用語の候補として抽出してもよい。
(ステップS202)用語抽出部12は、カウンタiを1に設定する。
(ステップS203)用語抽出部12は、図示しない記録媒体で記憶されている視覚化容易度対応情報を参照することにより、i番目の候補に対応する視覚化容易度を取得する。具体的には、用語抽出部12は、例えば、i番目の候補を検索キーとして視覚化容易度対応情報を検索し、ヒットしたレコードに含まれる視覚化容易度を取得してもよい。なお、検索の結果、該当するレコードがなかった場合には、用語抽出部12は、あらかじめ決められている値を、i番目の候補の視覚化容易度としてもよい。例えば、検索の結果、ヒットするレコードがないのであれば、視覚化容易度が0〜1の値をとる場合には、0.3や0.5を視覚化容易度として用いてもよい。その取得した視覚化容易度は、図示しない記録媒体において一時的に記憶されてもよい。
(ステップS204)用語抽出部12は、図示しない記録媒体で記憶されている視覚化揺らぎ度対応情報を参照することにより、i番目の候補に対応する視覚化揺らぎ度を取得する。具体的には、用語抽出部12は、例えば、i番目の候補を検索キーとして視覚化揺らぎ度対応情報を検索し、ヒットしたレコードに含まれる視覚化揺らぎ度を取得してもよい。なお、検索の結果、該当するレコードがなかった場合には、用語抽出部12は、あらかじめ決められている値を、i番目の候補の視覚化揺らぎ度としてもよい。例えば、検索の結果、ヒットするレコードがないのであれば、視覚化揺らぎ度が0〜1の値をとる場合には、0.5や0.8を視覚化容易度として用いてもよい。その取得した視覚化揺らぎ度は、図示しない記録媒体において一時的に記憶されてもよい。
(ステップS205)用語抽出部12は、図示しない記録媒体から式を読み出し、その式の引数として、ステップS203,S204で取得した視覚化容易度、視覚化揺らぎ度を代入することによって、式の値を算出する。
(ステップS206)用語抽出部12は、その式の値を図示しない記録媒体において一時的に記憶する。なお、その記憶の際に、用語の候補に対応付けて記憶することが好適である。
(ステップS207)用語抽出部12は、カウンタiを1だけインクリメントする。
(ステップS208)用語抽出部12は、i番目の候補が存在するかどうか判断する。そして、存在する場合には、ステップS203に戻り、存在しない場合には、ステップS209に進む。
(ステップS209)用語抽出部12は、ステップS206で一時的に記憶した式の値を降順となるようにソートする。
(ステップS210)用語抽出部12は、抽出する用語の数を決定する。なお、あらかじめ抽出する用語の数が決まっている場合には、その決まっている値の記憶されている記録媒体から、その値を読み出すだけであってもよい。
(ステップS211)用語抽出部12は、ソート後の式の値の大きい方から、ステップS210で決定した用語の数だけを特定し、その特定した式の値にそれぞれ対応する用語の候補を、用語として抽出する。この抽出した用語は、図示しない記録媒体において一時的に記憶されてもよい。そして、図2のフローチャートに戻る。
図4は、図2のフローチャートにおける文書の生成の処理(ステップS104の処理)の詳細を示すフローチャートである。
(ステップS301)文書生成部14は、nを全チャンク数に設定する。例えば、全チャンク数が5個である場合には、n=5に設定される。
(ステップS302)文書生成部14は、チャンクごとに固有のIDを割り当てる。この図4のフローチャートでは、チャンクごとに割り当てられたIDは、文頭から順番に1〜nであるとする。
(ステップS303)文書生成部14は、チャンクIDがiであるチャンクの文面をX[i]に設定する処理を、すべてのチャンクについて行う。すなわち、X[1]〜X[n]が準備されることになる。
(ステップS304)文書生成部14は、チャンクIDがiであるチャンクの係り先のチャンクIDを、目標チャンク配列Cd[i]に設定する処理を、すべてのチャンクについて行う。すなわち、Cd[1]〜Cd[n]が準備されることになる。例えば、2番目のチャンクが3番目のチャンクに係る場合には、Cd[2]←3となる。なお、係り先のチャンクが存在しない場合には、Cd[i]←0に設定されるものとする。
(ステップS305)文書生成部14は、チャンクIDがiであるチャンクが係り受けているチャンク数を、受数配列Cr[i]に設定する処理を、すべてのチャンクについて行う。すなわち、Cr[1]〜Cr[n]が準備されることになる。例えば、5番目のチャンクが3番目と4番目の2個のチャンクを係り受けている場合には、Cr[5]←2となる。
(ステップS306)文書生成部14は、生成可能な文書のバリエーション数Vを、「Cr[1]!×…×Cr[n]!」に設定する。なお、Cr[i]!は、Cr[i]の階乗である。
(ステップS307)文書生成部14は、入れ替え後の文書配列T[i]の記憶領域の確保と、その初期化(T[i]←null(空集合)とすることなど)とを、i=1〜Vについて行う。すなわち、T[1]〜T[V]が準備されることになる。ここで、前述のX、Cd、Cr、Tという変数はグローバル変数であり、次に説明する再帰関数F中から自由に参照、代入が可能な変数である。一方、再帰関数F中で用いられるi、j、k、localstart、stp、c、N(これらについては後述する)は、呼び出された再帰関数F内のみで有効なローカル変数である。
(ステップS308)文書生成部14は、再帰関数F(t、start、end)の処理を行う。この再帰関数Fには、3個の引数(t、start、end)が設定されている。tは、ターゲットチャンクのIDである。startは、生成の対象となる文書の開始番号である。endは、生成の対象となる文書の終了番号である。開始番号、終了番号とは、文書配列Tの添え字相当部分を指す。文書のバリエーションは前述の通りT[1]〜T[V]とV個存在し、start番目〜end番目であるT[start]〜T[end]が、この関数で扱う対象となる。このステップS308では、t=n、start=1、end=Vとして再帰関数F(t、start、end)の処理を行う。そして、図2のフローチャートに戻る。なお、再帰関数F(t、start、end)については、図5のフローチャートを用いて後述する。
図5は、再帰関数F(t、start、end)を説明するためのフローチャートである。文書におけるチャンクの係り受け構造は、終末端のチャンクを根(ルート)とする多分木の構造を形成している。ここでは、終末端のチャンクを起点として、葉(リーフ)側へと順次解析を進める方法で説明を行う。
(ステップS401)文書生成部14は、start番目からend番目までの入れ替え処理を行うため、まず、カウンタiを再帰関数Fの引数であるstartに設定する。
(ステップS402)文書生成部14は、i番目の既存の入れ替え後の文書配列T[i]の左側に、t番目のチャンク文字列X[t]を付加する。
(ステップS403)文書生成部14は、カウンタiを1だけインクリメントする。
(ステップS404)文書生成部14は、カウンタiが、endを超えているかどうか判断する。そして、超えている場合には、end番目の処理が終了したためステップS405に進み、超えていない場合には、ステップS402に戻る。
(ステップS405)文書生成部14は、受数配列Cr[t]が0であるかどうか判断する。そして、0である場合には、何も係り受けを受けない葉チャンクであると判断して呼び出し元の処理に戻り、そうでない場合には、ステップS406に進む。
(ステップS406)文書生成部14は、受数配列Cr[t]が1であるかどうか判断する。そして、1である場合には、係り受けを1つだけ受ける節チャンクであると判断してステップS408に進み、そうでない場合、すなわち、Cr[t]が2以上である場合には、係り受けを2以上受ける節チャンクであると判断してステップS407に進む。
(ステップS407)文書生成部14は、係り受けを受けるチャンク数をNに代入し、t番目のチャンクが受けるチャンク数N個の順列処理、及び再帰関数処理を行う。この処理の詳細については、図6のフローチャートを用いて後述する。そして、呼び出し元の処理に戻る。
(ステップS408)文書生成部14は、再帰関数処理を行う。その引数はそれぞれ、t番目のチャンクに係るチャンクID、start、endである。そして、呼び出し元の処理に戻る。
図6は、図5のフローチャートにおける順列処理、及び再帰関数処理(ステップS407)の詳細を示すフローチャートである。例えば、チャンク「A」「B」「C」「D」が、文書においてABCDの順に並んでおり、チャンクDにチャンク「A」「B」「C」が係っている場合には、そのチャンク「A」「B」「C」を入れ替えることになる。そのチャンク「A」「B」「C」を入れ替える処理と、それにともなう文書の生成の処理を示すのが、図6のフローチャートである。
(ステップS501)文書生成部14は、カウンタkを1に設定する。
(ステップS502)文書生成部14は、localstartをstartに設定する。
(ステップS503)文書生成部14は、(end−start+1)/N!を算出し、変数stpを(end−start+1)/N!に設定する。なお、Nは、前述のように、t番目のチャンクが受けるチャンク数である。
(ステップS504)文書生成部14は、t番目のチャンクに係っているN個のチャンクIDを、順列生成用配列c[1]〜c[N]に代入する。すなわち、c[1]〜c[N]が準備されることになる。この場合に、t番目のチャンクに係るi番目のチャンクのIDをc[i]に代入するようにしてもよい。例えば、t番目のチャンクに係っている2個のチャンクIDが1,2である場合には、c[1]=1,c[2]=2となる。
(ステップS505)文書生成部14は、N!種類存在する順列を、c[1]〜c[N]の並び替え、すなわち、c[1]〜c[N]に設定されるチャンクIDの入れ替えによって生成する。N!種類中のk番目(k=1〜N!)の並びを生成させるには、既存の順列生成アルゴリズムを用いればよい。例えば、順列を生成するために用いられる計算機用言語がC++である場合には、ANSI/ISO標準に組み込まれているSTL(Standard Template Library)のnext_permutation()や、prev_permutation()を用いることができる。また、計算機用言語がperlである場合には、CPAN(Comprehensive Perl Archive Network)のList::Permutorモジュールを用いることができる。その他、各計算機用言語の順列生成のためのモジュール等を用いてもよいことは言うまでもない。順列を生成する方法の詳細な説明については、ここでは省略する。
(ステップS506)文書生成部14は、カウンタjをNに設定する。
(ステップS507)文書生成部14は、再帰関数Fの処理を行う。再帰関数Fの3個の引数(ターゲットチャンクID、文書配列開始番号、文書配列終了番号)は、それぞれc[j]、localstart、localstart+stp−1とする。
(ステップS508)文書生成部14は、カウンタjを1だけデクリメントする。
(ステップS509)文書生成部14は、カウンタjが0であるかどうか判断する。そして、カウンタjが0である場合には、ステップS510に進み、そうでない場合には、ステップS507に戻る。
(ステップS510)文書生成部14は、カウンタkを1だけインクリメントする。
(ステップS511)文書生成部14は、localstartにstpを加算する。
(ステップS512)文書生成部14は、カウンタkがN!より大きいかどうか判断する。カウンタkがN!より大きい場合には、カウンタkはすでにN!回だけインクリメントされていることになるため、呼び出し元の処理に戻り、そうでない場合には、ステップS505に戻る。
この図4〜図6のフローチャートの処理を実行することにより、チャンクを順列に並び替えた結果を得ることができる。例えば、チャンク「A」「B」「C」がABCの順に並んでおり、チャンク「A」「B」がチャンク「C」に係る場合について、図4〜図6のフローチャートの処理を実行する場合について説明する。
まず、nが総チャンク数3に設定される(ステップS301)。また、チャンクA、B、Cのそれぞれに対して、ID1〜3が割り当てられる(ステップS302)。また、X[1]=A、X[2]=B、X[3]=Cに設定される(ステップS303)。また、Cd[1]=3、Cd[2]=3、Cd[3]=0に設定される(ステップS304)。また、Cr[1]=0、Cr[2]=0、Cr[3]=2に設定される(ステップS305)。また、V=Cr[1]!×Cr[2]!×Cr[3]!=0!×0!×2!=2に設定される(ステップS306)。また、T[1]=T[2]=nullに設定される(ステップS308)。
次に、t=3、start=1、end=2として、再帰関数Fの処理を実行する(ステップS308)。まず、T[1]=X[3]=C、T[2]=X[3]=Cに設定される(ステップS401〜S404)。その後、Cr[3]=2であるため、順列処理、及び再帰関数処理が行われる(ステップS404〜S407)。
すなわち、N=2、k=1、localstart=1に設定され(ステップS501,S502)、stp=(2−1+1)/2!=1に設定される(ステップS503)。また、c[1]=1,c[2]=2に設定される(ステップS504)。
k=1、すなわち1番目の順列をライブラリ等によって生成させ、c[1]=1,c[2]=2という配列の並びを得たとする(ステップS505)。すると、カウンタj=2に設定され(ステップS506)、再帰関数F(2,1,1)の処理が実行される(ステップS507)。すると、T[1]=BCとなる(ステップS401〜S405)。また、カウンタj=1に更新され(ステップS508)、再帰関数F(1,1,1)の処理が実行される(ステップS509,S507)。すると、T[1]=ABCとなる(ステップS401〜S405)。その後、カウンタk=2に更新され(ステップS508〜S510)、localstart=2に更新される(ステップS511)。そして、k=2、すなわち2番目の順列をライブラリ等によって生成させ、c[1]=2,c[2]=1という配列の並びを得たとする(ステップS512,S505)。その後、前述の処理と同様にして、T[2]=BACとなる。このようにして、チャンクを並び替えた結果として、T[1]=ABCとT[2]=BACとを得ることができる。
なお、本実施の形態では、チャンクの並び替えに図4〜図6のフローチャートの処理を用いる場合について説明したが、他の処理方法を用いて、チャンクを並び替える処理を行ってもよいことは言うまでもない。
次に、本実施の形態による情報処理装置1の動作について、具体例を用いて説明する。
この具体例において、文書記憶部11では、文書「本日、台風の接近により、電車のダイヤが乱れています。」が記憶されているものとする。
また、この具体例において、用語抽出部12が抽出する用語の候補は、名詞の用語であるとする。また、用語抽出部12が用語の抽出で用いる視覚化容易度対応情報は、図7で示されるものであり、視覚化揺らぎ度対応情報は、図8で示されるものであるとする。また、用語抽出部12は、視覚化容易度対応情報に含まれていない用語については、視覚化容易度を0.3に設定するものとする。また、用語抽出部12は、視覚化揺らぎ度対応情報に含まれていない用語については、視覚化揺らぎ度を0.8に設定するものとする。また、用語抽出部12が用語を抽出する際に用いる用語単位は、12文字であるとする。また、用語抽出部12が用語を抽出する際に用いる式は、「視覚化容易度/2+(1−視覚化揺らぎ度)/2」であるとする。また、この具体例において、対応情報記憶部16では、図9で示される対応情報が記憶されているものとする。
次に、この具体例での情報処理装置1の処理について説明する。まず、用語抽出部12は、文書記憶部11で記憶されている文書から用語を抽出する処理を行う(ステップS101)。具体的には、用語抽出部12は、文書記憶部11から文書「本日、台風の接近により、電車のダイヤが乱れています。」を読み出して、形態素解析する。その形態素解析の結果は、例えば、次のようになる。
(形態素) (読み) (基本形) (品詞)
本日 ホンジツ 本日 名詞−副詞可能
、 、 、 記号−読点
台風 タイフウ 台風 名詞−一般
の ノ の 助詞−連体化
接近 セッキン 接近 名詞−サ変接続
により ニヨリ により 助詞−格助詞−連語
、 、 、 記号−読点
電車 デンシャ 電車 名詞−一般
の ノ の 助詞−連体化
ダイヤ ダイヤ ダイヤ 名詞−一般
が ガ が 助詞−格助詞−一般
乱れ ミダレ 乱れる 動詞−自立 一段 連用形
て テ て 助詞−接続助詞
い イ いる 動詞−非自立 一段 連用形
ます マス ます 助動詞 特殊・マス 基本形
。 。 。 記号−句点
したがって、用語抽出部12は、その形態素解析の結果から、品詞が「名詞」である形態素「本日」「台風」「接近」「電車」「ダイヤ」を用語の候補として抽出する(ステップS201)。
次に、用語抽出部12は、1番目の候補「本日」について、図7の視覚化容易度対応情報を参照して、視覚化容易度「0.1」を取得して、図示しない記録媒体で一時的に記憶する(ステップS202,S203)。なお、図8の視覚化揺らぎ度対応情報には、用語「本日」のレコードが存在しないものとする。すると、用語抽出部12は、候補「本日」について、視覚化揺らぎ度「0.8」を取得して、図示しない記録媒体において一時的に記憶する(ステップS204)。用語抽出部12は、それらを用いて式の値「0.15」を算出して、候補「本日」に対応付けて一時記憶する(ステップS205,S206)。図10の1番目のレコードは、そのようにして一時記憶された情報である。
用語抽出部12は、同様にして、2番目の候補「台風」についても、視覚化容易度「0.9」を取得し、視覚化揺らぎ度「0.1」を取得する(ステップS207,S208,S203,S204)。そして、用語抽出部12は、それらを用いて式の値「0.9」を算出して、候補「台風」に対応付けて一時記憶する(ステップS205,S206)。図10の2番目のレコードは、そのようにして一時記憶された情報である。このようにして、他の候補「接近」「電車」「ダイヤ」についても、式の値が算出されて一時記憶される(ステップS203〜S208)。図10は、その一時記憶された結果を示す図である。用語抽出部12は、図10で示される各レコードを、式の値の降順となるようにソートする(ステップS209)。また、用語抽出部12は、文書「本日、台風の接近により、電車のダイヤが乱れています。」の語数「26」を算出し、その語数を用語単位「12」で割ることによって、抽出する用語の数を算出する。すなわち、次式のようにして、抽出する用語の数が2個に決定される(ステップS210)。
抽出する用語の数=int(文書の長さ/用語単位)=int(26/12)
=int(2.166…)=2
したがって、用語抽出部12は、用語「台風」「電車」を抽出して、図示しない記録媒体において一時的に記憶する(ステップS211)。
次に、係り受け情報取得部13は、文書「本日、台風の接近により、電車のダイヤが乱れています。」を、チャンクに分割する。ここでは、次のように分割されたとする。
チャンク「本日、」
チャンク「台風の接近により、」
チャンク「電車のダイヤが」
チャンク「乱れています。」
そして、係り受け情報取得部13は、その分割されたチャンクの係り受けを示す係り受け情報を取得し、図示しない記録媒体において一時的に記憶する(ステップS102)。図11は、その取得した係り受け情報を示す図である。
文書生成部14は、図11で示される係り受け情報を参照し、一のチャンク「乱れています。」に3個のチャンクが係っているため、入れ替え可能であると判断し(ステップS103)、文書の生成を行う(ステップS104)。
具体的には、文書生成部14は、2以上のチャンクの係るチャンク「乱れています。」を特定する(ステップS301)。そして、その特定したチャンクに係る3個のチャンク「本日、」「台風の接近により、」「電車のダイヤが」を入れ替えた文書を生成し、図示しない記録媒体において一時的に記憶する(ステップS302〜S305)。この入れ替えは、図5のフローチャートで説明したように、3個のチャンク「本日、」「台風の接近により、」「電車のダイヤが」の順列の入れ替えを行うことになる。したがって、その入れ替え後の文書(入れ替えていないものも含まれる)は、次のようになる。
本日、台風の接近により、電車のダイヤが乱れています。
本日、電車のダイヤが台風の接近により、乱れています。
台風の接近により、本日、電車のダイヤが乱れています。
台風の接近により、電車のダイヤが本日、乱れています。
電車のダイヤが本日、台風の接近により、乱れています。
電車のダイヤが台風の接近により、本日、乱れています。
次に、文書選択部15は、抽出された用語の間の長さと、抽出された用語あたりの文書の長さ(=26/2=13)との差の2乗の和が最も小さい文書を、抽出された用語が最も均等に出現している文書であると判断して選択するものとする。ここで、抽出された用語の間の長さとしては、隣接する用語の間の長さ、及び、最後の用語と文書の後端との間の長さを用いるものとする。すなわち、文書の先頭と最初の用語との間の長さは用いない。このようにすることで、結果として、短い文書の場合には、文書の先頭に近い位置に抽出される用語の存在する文書が選択されることになり、文書の出力が始まるとすぐに、用語に対応した画像が表示されるようにできるようになる。
具体的には、文書選択部15は、用語抽出部12から、抽出された2個の用語「台風」「電車」を受け取り、上記の6個の文書について、抽出された用語間の長さ(文字数)をカウントする。例えば、文書「本日、台風の接近により、電車のダイヤが乱れています。」の場合には、先頭から用語「台風」までの長さが「4」であり、用語「台風」から用語「電車」までの長さが「9」であり、用語「電車」から後端までの長さが「13」となる。なお、この具体例では、用語の中心の位置で、用語の位置を代表させている。また、前述のように、先頭から1個目の用語までの長さは、後の計算で用いないため、その長さを算出しなくてもよい。次に、文書選択部15は、用語間の長さから抽出された用語あたりの文書の長さ「13」を引いて2乗したものを足しあわせる。具体的には、(9−13)^2+(13−13)^2=16となる。
同様にして、文書選択部15は、他の文書についても、用語間の長さと、抽出された用語あたりの文書の長さとの差の2乗を足しあわせた値を算出する。その結果は、次のようになる。
(生成された文書) (算出した値)
本日、台風の接近により、電車のダイヤが乱れています。 16
本日、電車のダイヤが台風の接近により、乱れています。 40
台風の接近により、本日、電車のダイヤが乱れています。 1
台風の接近により、電車のダイヤが本日、乱れています。 25
電車のダイヤが本日、台風の接近により、乱れています。 13
電車のダイヤが台風の接近により、本日、乱れています。 61
したがって、文書選択部15は、算出した値の最も小さい文書である「台風の接近により、本日、電車のダイヤが乱れています。」を選択する(ステップS105)。
画像取得部17は、図9で示される対応情報を参照し、用語抽出部12が抽出した用語「台風」「電車」に対応する画像「typhoon.jpg」「train.jpg」を取得する(ステップS107)。そして、それらを用語に対応付けて一時的に記憶しておく。
その後、文書出力部18は、選択された文書「台風の接近により、本日、電車のダイヤが乱れています。」を音声合成して、スピーカに出力する。その場合に、用語抽出部12が抽出した用語に対応する音声信号をスピーカに出力するタイミングで、文書出力部18は、画像表示部19に対して、その用語を渡すものとする。すると、画像表示部19は、その用語に対応する画像であって、画像取得部17が取得した画像をディスプレイに表示する(ステップS107)。したがって、スピーカから、「台風の…」と出力されるタイミングで、図12で示される台風の画像がディスプレイに表示され、その後、スピーカから、「電車の…」と出力されるタイミングで、図13で示される電車の画像がディスプレイに表示される。したがって、その出力を視聴するユーザは、スピーカから出力される「台風の接近により、本日、電車のダイヤが乱れています。」との音声を聞くと共に、図12,図13の画像を見ることができ、台風と電車に関する音声が出力されたことを知ることができる。
以上のように、本実施の形態による情報処理装置1によれば、文書を時系列に沿って出力する際に、その文書から抽出した用語に対応する画像を表示することができ、その出力される文書の内容の理解をよりよくすることができる。ユーザは、時系列に沿って出力される文書については、各時点でその文書の一部のみを視聴できるだけであるが、画像が一定期間表示されることによって、出力された文書に含まれる用語を残像のように残すことができ、ユーザの文書に対する理解を深めることができうる。また、時系列に沿って出力される文書は、読み返すことができない、聞き返すことができないという特徴があるため、読み逃したり、聞き逃したりした部分については、他の部分から推測するしかないが、読み逃したり、聞き逃したりした部分が画像表示される場合には、読み逃したり、聞き逃したりした部分についても理解することができるようになる。また、出力する文書全体を表示する場合には、ある程度大きな表示デバイスが必要となるが、用語に対応する画像を表示するだけであれば、小さい表示デバイスでも十分可能となる。したがって、情報処理装置1の文書出力部18、画像表示部19は、携帯電話やPDA等のスピーカや、ディスプレイに文書や画像を出力するものであってもよい。また、絵を理解することができても文字を読めない人、例えば、子供や文盲者等も、この情報処理装置1を用いることによって、出力された文書をよりよく理解することができるようになりうる。
なお、本実施の形態では、文書記憶部11で記憶されている文書が日本語である場合について主に説明したが、その言語は問わない。例えば、英語やフランス語、中国語、スペイン語、ロシア語、韓国語等の文書が文書記憶部11で記憶されており、それらの言語の文書に対して、本実施の形態による処理が行われてもよい。
(実施の形態2)
本発明の実施の形態2による情報処理装置について、図面を参照しながら説明する。本実地の形態による情報処理装置は、音声認識や機械翻訳の処理も行うものである。
図14は、本実施の形態による情報処理装置2の構成を示すブロック図である。本実施の形態による情報処理装置2は、文書記憶部11と、用語抽出部12と、係り受け情報取得部13と、文書生成部14と、文書選択部15と、対応情報記憶部16と、画像取得部17と、文書出力部18と、画像表示部19と、音声情報受付部21と、音声認識部22と、機械翻訳部23とを備える。なお、音声情報受付部21、音声認識部22、機械翻訳部23以外の構成及び動作は、実施の形態1と同様であり、その説明を省略する。
音声情報受付部21は、発生された原言語の音声をマイクによって集音した情報である原言語音声情報を受け付ける。この受け付けられた原言語音声情報は、図示しない記録媒体において記憶されてもよい。
音声情報受付部21は、例えば、マイクから入力された原言語音声情報を直接、受け付けてもよく、有線もしくは無線の通信回線を介して送信された原言語音声情報を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された原言語音声情報を受け付けてもよい。なお、音声情報受付部21は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、あるいは含まなくてもよい。また、音声情報受付部21は、ハードウェアによって実現されてもよく、あるいは所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
音声認識部22は、音声情報受付部21が受け付けた原言語音声情報を音声認識して、その原言語音声情報に対応するテキスト情報である音声認識結果情報を取得する。音声認識の方法は、すでに公知であり、その詳細な説明を省略する。音声認識部22は、例えば、音響モデルや、辞書情報、言語モデル等を用いることによって、音声認識を行ってもよい。また、音声認識の結果であるテキスト情報は、図示しない記録媒体において一時的に記憶されてもよい。
機械翻訳部23は、音声認識部22が取得した音声認識結果情報を機械翻訳して、その音声認識結果情報に対応する目的言語のテキストの文書を取得して、文書記憶部11に蓄積する。機械翻訳の方法は、すでに公知であり、その詳細な説明を省略する。
次に、本実施の形態による情報処理装置2の動作について、図15のフローチャートを用いて説明する。図15のフローチャートは、原言語音声情報を受け付けてから、機械翻訳がなされるまでの処理を示すものである。
(ステップS601)音声情報受付部21は、原言語音声情報を受け付ける。音声情報受付部21が、原言語音声情報をマイクから直接、受け付ける場合には、時系列に沿って原言語音声情報が受け付けられるため、音声情報受付部21は、マイクからの入力が終了するまで、その受け付けた原言語音声情報を図示しない記録媒体に順次、蓄積していってもよい。
(ステップS602)音声認識部22は、音声情報受付部21が受け付けた原言語音声情報を音声認識して、その原言語音声情報に対応するテキスト情報である音声認識結果情報を取得する。その音声認識結果情報は、図示しない記録媒体において一時的に記憶されてもよい。
(ステップS603)機械翻訳部23は、音声認識結果情報を機械翻訳して、その音声認識結果情報に対応する目的言語のテキストの文書を取得する。そして、その目的言語のテキストの文書を、文書記憶部11に蓄積する。
なお、この後、文書記憶部11に蓄積された文書に対して行われる文書の出力と、画像の表示の処理は、実施の形態1と同様の処理であり、その説明を省略する。
以上のように、本実施の形態による情報処理装置2によれば、音声翻訳の結果である文書の出力と、その文書から抽出された用語に対応する画像の表示とを行うことができる。したがって、翻訳結果を視聴するユーザが、翻訳結果をよりよく理解するようにできうる。また、原言語の音声の発話を行う話し手も、出力された目的言語の文書を理解することができなかったとしても、画像表示部19が表示する画像を見ることによって、自分の思っていることが適切に翻訳されたかどうかを簡単にチェックすることができうる。そして、もしも不適切に翻訳されていた場合には、同じ内容を言い換えて再度、発話することによって、聞き手との意思の疎通を適切に行うことができうる。例えば、話し手が、「箸」と言ったにもかかわらず、同音異義語である「橋」の画像が表示された場合には、不適切な翻訳がなされたと判断することができうる。したがって、話し手は、「箸」以外の言葉を使用して文書の言い換えを行い、適切な翻訳がなされるようにすることができうる。
なお、本実施の形態において、原言語と、目的言語とは、言語が異なるのであれば、どのような言語であってもよい。例えば、原言語が日本語であり、目的言語が英語であってもよく、その他の組合せであってもよい。
また、上記各実施の形態では、文書選択部15が一の文書を選択する場合について説明したが、そうでなくてもよい。例えば、2以上の文書を選択して、その選択した文書を交互に出力してもよく、あるいは、その選択した文書から一の文書をユーザに選択させ、ユーザの選択した文書を出力してもよい。後者としては、例えば、音声翻訳の機能を有する装置の場合(例えば、実施の形態2で説明したものの場合)に、文書選択部15が選択した複数の文書に対応する画像をあらかじめ話者に提示し、その話者が適切であると考える画像の順序を選択すると、その選択された画像の順序に対応する文書を、聞き手に対して画像と一緒に提示するようにしてもよい。
また、上記各実施の形態において、画像表示部19は、表示する画像に対応する用語の属性に応じた表示方法で画像を表示してもよい。用語の属性とは、用語の単数と複数との違いであってもよく、用語の性別(例えば、男性名詞、女性名詞、中性名詞の違いなど)であってもよく、その他の属性であってもよい。そして、画像表示部19は、例えば、表示する画像に対応する用語が、単数であるか、複数であるかを判断する。そして、単数の用語については、その用語に対応する画像をそのまま表示し、複数の用語については、その用語に対応する画像を2個ずらして表示することにより、複数に見えるようにしてもよい。具体的には、画像表示部19は、用語「battery」に対応する画像を表示する場合には、図16で示されるように、用語「battery」に対応する画像をそのまま表示する。一方、用語「batteries」に対応する画像を表示する場合には、図16で示される画像を画像取得部17から受け取ると、その画像を複製して2枚にして、両方を少しずらして図17で示されるように表示してもよい。このようにすることで、例えば、実施の形態2の場合に、話し手は、原言語の単語「電池」が、目的言語の「battery」に翻訳されたのか、あるいは、「batteries」に翻訳されたのかを画像を見ることによって確認することができる。そして、もしも、話し手の思っているように翻訳されていない場合には、例えば、「一個の電池」や、「複数の電池」と言い換えることによって、翻訳間違いに起因して、話し手と聞き手との間の意思の疎通がうまくいかないことを解消することができうる。また、用語「battery」に対応する画像と、用語「batteries」に対応する画像を別々に対応情報において保持しておく場合よりも、対応情報の情報量を削減することもできうる。
また、同様にして、画像表示部19は、用語の性別の違いに応じて、表示する画像を変更してもよい。例えば、男性名詞の用語に対応する画像を表示する場合には、青枠で画像を囲み、女性名詞の用語に対応する画像を表示する場合には、赤枠で画像を囲み、中性名詞に対応する画像を表示する場合には、灰色枠で画像を囲むようにしてもよい。このようにすることで、例えば、話し手が、目的言語の学習者である場合に、各名詞の性別を知ることができ、語学学習のために役立てることもできうる。
このように、画像表示部19が、表示する画像に対応する用語の属性に応じた表示方法で画像を表示する場合には、例えば、用語の属性と、その属性に応じた表示方法とを対応付ける情報である表示対応情報が図示しない記録媒体において保持されており、画像表示部19は、その表示対応情報を参照することによって、表示方法を判断してもよい。例えば、表示対応情報において、属性「単数」と、表示方法「通常表示」とが対応付けられており、属性「複数」と、表示方法「二重表示」とが対応付けられていてもよい。
また、上記実施の形態2において、情報処理装置2は、機械翻訳前の原言語の情報である音声認識結果情報から用語を抽出し、その用語に対応する画像を取得して、文書出力部18が翻訳後の文書を出力する際であって、その抽出された用語と対訳関係にある目的言語の用語を文書出力部18が出力する際に、その取得した画像を画像表示部19が表示するようにしてもよい。このようにすることで、機械翻訳部23による翻訳が間違えていたり、不正確であったりする場合でも、出力された画像を見ることによって、翻訳間違いを補うことができうることになる。また、情報処理装置2からの出力を受け取るユーザは、表示された画像と、出力された文書とが異なっている場合に、翻訳間違いを指摘することもできうる。翻訳間違いが指摘された場合には、例えば、原言語の話し手が、同じ内容を別の表現で言い直すことなどによって、正確な翻訳が行われるようにすることもできうる。なお、このような場合には、文書生成部14による文書の生成を行ってもよく、あるいは、行わなくてもよい。文書の生成を行わない場合には、係り受け情報の取得や文書の選択等の処理も行わなくてもよい。
また、前述の具体例では、非常に簡単な係り受けの場合についてのみ説明したが、入れ子になっている係り受け構造を持っている場合にも、図4〜図6のフローチャートの方法によって、適切に文書を生成することができることを簡単に説明しておく。係り受け情報が、図18で示されるように、係り受けが階層的になっているとする。なお、文書記憶部11で記憶されている文書は、ABCDEの順にチャンクの並んだものであるとする。
まず、n=5(=総チャンク数)に設定される(ステップS301)。また、各チャンクに対して次のように固有IDが割り当てられる(ステップS302)。
チャンクA:ID=1
チャンクB:ID=2
チャンクC:ID=3
チャンクD:ID=4
チャンクE:ID=5
また、X[1]〜X[5]が次のように準備される(ステップS303)。
X[1]=A
X[2]=B
X[3]=C
X[4]=D
X[5]=E
また、Cd[1]〜Cd[5]は次のようになる(ステップS304)。
Cd[1]=3
Cd[2]=3
Cd[3]=5
Cd[4]=5
Cd[5]=0
また、Cr[1]〜Cr[5]は次のようになる(ステップS305)。
Cr[1]=0
Cr[2]=0
Cr[3]=2
Cr[4]=0
Cr[5]=2
したがって、V=0!×0!×2!×0!×2!=4となる(ステップS306)。すなわち、この文書のバリエーションは4パターン存在することになる。
また、T[1]〜T[4]が初期化されて準備される(ステップS307)。
次に、再帰関数F(5,1,4)の処理が実行される(ステップS308)。
具体的には、T[i]が次のように更新される(ステップS401〜S404)。
T[1]=E
T[2]=E
T[3]=E
T[4]=E
(再帰関数F(5,1,4)の処理)
また、Cr[5]=2であるため、順列処理、及び再帰関数処理が実行される(ステップS404〜S407)。
具体的には、N=2,k=1,localstart=1,stp=2に設定される(ステップS501〜S503)。また、c[1]、c[2]が次のように準備されたとする(ステップS504)。
c[1]=3
c[2]=4
(再帰関数F(5,1,4)の処理→再帰関数F(4,1,2)の処理)
次に、k=1、すなわち1番目の順列をライブラリ等によって生成させ、c[1]=3,c[2]=4という配列の並びを得たとする(ステップS505)。すると、j=2に設定され、再帰関数F(4,1,2)の処理がなされる(ステップS506,S507)。具体的には、この再帰関数F(4,1,2)の処理によって、T[1]、T[2]が次のように更新されることになる(ステップS401〜S404)。
T[1]=DE
T[2]=DE
(再帰関数F(5,1,4)の処理→再帰関数F(3,1,2)の処理)
その後、j=1に更新され(ステップS508,S509)、再帰関数F(3,1,2)の処理がなされる(ステップS507)。具体的には、この再帰関数F(3,1,2)の処理によって、T[1]、T[2]が次のように更新されることになる。
T[1]=CDE
T[2]=CDE
(再帰関数F(3,1,2)の処理)
この場合には、Cr[3]=2であるため、順列処理、及び再帰関数処理(ステップS407)についても説明する。
(再帰関数F(3,1,2)の処理)
具体的には、N=2,k=1,localstart=1,stp=1に設定される(ステップS501〜S503)。また、c[1],c[2]が次のように準備される(ステップS504)。
c[1]=1
c[2]=2
(再帰関数F(3,1,2)の処理→再帰関数F(2,1,1)の処理)
次に、k=1、すなわち1番目の順列をライブラリ等によって生成させ、c[1]=1,c[2]=2という配列の並びを得たとする(ステップS505)。すると、j=2に設定され、再帰関数F(2,1,1)の処理がなされる(ステップS506,S507)。具体的には、この再帰関数F(2,1,1)の処理によって、T[1]が次のように更新されることになる。
T[1]=BCDE
(再帰関数F(3,1,2)の処理→再帰関数F(1,1,1)の処理)
その後、j=1に更新され(ステップS508,S509)、再帰関数F(1,1,1)の処理がなされる(ステップS507)。具体的には、この再帰関数F(1,1,1)の処理によって、T[1]が次のように更新されることになる。
T[1]=ABCDE
(再帰関数F(3,1,2)の処理→再帰関数F(1,2,2)の処理)
他の順列の組み合わせが残っているのでkはインクリメントされ、localstart=2となり(ステップS508〜S512)、k=2、すなわち2番目の順列をライブラリ等によって生成させ、c[1]=2,c[2]=1という配列の並びを得たとする(ステップS505)。すると、j=2に設定され、再帰関数F(1,2,2)の処理がなされる(ステップS506,S507)。具体的には、この再帰関数F(1,2,2)の処理によって、T[2]が次のように更新されることになる。
T[2]=ACDE
(再帰関数F(3,1,2)の処理→再帰関数F(2,2,2)の処理)
その後、j=1に更新され(ステップS508,S509)、再帰関数F(2,2,2)の処理がなされる(ステップS507)。具体的には、この再帰関数F(2,2,2)の処理によって、T[2]が次のように更新されることになる。
T[2]=BACDE
ここまでが、呼び出された関数(再帰関数F(3,1,2))に関する処理の説明である。この後、処理は呼び出し元に戻る。
(再帰関数F(5,1,4)の処理→再帰関数F(3,3,4)の処理)
呼び出し元の関数(再帰関数F(5,1,4))に戻り、他の順列の組み合わせが残っているのでkはインクリメントされ、localstart=3となり(ステップS508〜S512)、k=2、すなわち2番目の順列をライブラリ等によって生成させ、c[1]=4,c[2]=3という配列の並びを得たとする(ステップS505)。すると、j=2に設定され、再帰関数F(3,3,4)の処理がなされる(ステップS506,S507)。具体的には、この再帰関数F(3,3,4)の処理によって、T[3]、T[4]が次のように更新されることになる。
T[3]=CE
T[4]=CE
(再帰関数F(3,3,4)の処理)
また、この場合にも、Cr[3]=2であるため、さらに順列処理、及び再帰関数処理が実行されることになる。この関数の呼び出し処理は前述と同様であるため、詳細な処理を省略する。この呼び出し処理の結果、T[3]、T[4]は、次のように更新される。
T[3]=ABCE
T[4]=BACE
(再帰関数F(5,1,4)の処理→再帰関数F(4,3,4)の処理)
その後、j=1に更新され(ステップS508,S509)、再帰関数F(4,3,4)の処理がなされる(ステップS507)。具体的には、この再帰関数F(4,3,4)の処理によって、T[3]、T[4]が次のように更新されることになる。
T[3]=DABCE
T[4]=DBACE
この後、再帰関数はリターンを繰り返し、処理は再帰関数F(4,3,4)→再帰関数F(5,1,4)と移り、図4のステップ308が終了する。
このようにして、次の4個の文書が生成される。
ABCDE
BACDE
DABCE
DBACE
したがって、図4〜図6のフローチャートの方法によって、係り受けの構造が階層的になっていた場合であっても、適切にチャンクの並び替えを行うことができ、文書を生成することができることが分かる。
また、上記各実施の形態では、情報処理装置がスタンドアロンである場合について説明したが、情報処理装置は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部や表示部、受付部は、通信回線を介して入力を受け付けたり、文書や画面を出力したりすることになる。
また、上記各実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。
また、上記各実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりした情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。
なお、上記各実施の形態において、文書や用語、画像等は、本来であれば、文書を示す情報や、用語を示す情報、画像を示す情報等と呼ぶべきであるが、単に文書や用語等と呼ぶとして説明した。
また、上記各実施の形態において、情報処理装置に含まれる2以上の構成要素が通信デバイスや入力デバイス等を有する場合に、2以上の構成要素が物理的に単一のデバイスを有してもよく、あるいは、別々のデバイスを有してもよい。
また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、文書が記憶される文書記憶部で記憶されている文書から用語を抽出する用語抽出部と、前記文書記憶部で記憶されている文書をチャンクに分割し、各チャンクの係り受けを示す情報である係り受け情報を取得する係り受け情報取得部と、前記係り受け情報取得部が取得した係り受け情報を用いて、あるチャンクに2以上のチャンクが係っている場合には、当該2以上のチャンクの位置を入れ替え可能であるとして、前記文書記憶部で記憶されている文書から、入れ替え可能なチャンクの位置を入れ替えた文書を生成する文書生成部と、前記用語抽出部が抽出した用語に対応する画像を、用語と画像とを対応付けて有する情報である対応情報が2以上記憶される対応情報記憶部で記憶されている当該2以上の対応情報を用いて取得する画像取得部と、前記用語抽出部が抽出した用語が均等に出現する文書を、前記文書記憶部で記憶されている文書、及び前記文書生成部が生成した文書から選択する文書選択部と、前記文書選択部が選択した文書に含まれるテキストを、時系列に沿って出力する文書出力部と、前記画像取得部が取得した画像を、当該画像に対応する用語が前記文書出力部によって出力されるタイミングで表示する画像表示部として機能させるためのものである。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には少なくとも含まれない。
また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
図19は、上記プログラムを実行して、上記実施の形態による情報処理装置を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現される。
図19において、コンピュータシステム100は、CD−ROM(Compact Disk Read Only Memory)ドライブ105、FD(Flexible Disk)ドライブ106を含むコンピュータ101と、キーボード102と、マウス103と、モニタ104とを備える。
図20は、コンピュータシステムを示す図である。図20において、コンピュータ101は、CD−ROMドライブ105、FDドライブ106に加えて、CPU(Central Processing Unit)111と、ブートアッププログラム等のプログラムを記憶するためのROM(Read Only Memory)112と、CPU111に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)113と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク114と、CPU111、ROM112等を相互に接続するバス115とを備える。なお、コンピュータ101は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。
コンピュータシステム100に、上記実施の形態による情報処理装置の機能を実行させるプログラムは、CD−ROM121、またはFD122に記憶されて、CD−ROMドライブ105、またはFDドライブ106に挿入され、ハードディスク114に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ101に送信され、ハードディスク114に記憶されてもよい。プログラムは実行の際にRAM113にロードされる。なお、プログラムは、CD−ROM121やFD122、またはネットワークから直接、ロードされてもよい。
プログラムは、コンピュータ101に、上記実施の形態による情報処理装置の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム100がどのように動作するのかについては周知であり、詳細な説明は省略する。
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
以上より、本発明による情報処理装置等によれば、文書を時系列に沿って出力する際に、その文書に含まれる用語に対応する画像を表示することによって、文書の内容をよりよく理解できるようにすることができ、例えば、音声翻訳システム等において有用である。
本発明の実施の形態1による情報処理装置の構成を示すブロック図 同実施の形態による情報処理装置の動作を示すフローチャート 同実施の形態による情報処理装置の動作を示すフローチャート 同実施の形態による情報処理装置の動作を示すフローチャート 同実施の形態による情報処理装置の動作を示すフローチャート 同実施の形態による情報処理装置の動作を示すフローチャート 同実施の形態における視覚化容易度対応情報の一例を示す図 同実施の形態における視覚化揺らぎ度対応情報の一例を示す図 同実施の形態における対応情報の一例を示す図 同実施の形態における用語の候補ごとの式の値の一例を示す図 同実施の形態における係り受け情報の一例を示す図 同実施の形態における画像の一例を示す図 同実施の形態における画像の一例を示す図 本発明の実施の形態2による情報処理装置の構成を示すブロック図 同実施の形態による情報処理装置の動作を示すフローチャート 上記各実施の形態における画像の表示方法の一例を説明するための図 上記各実施の形態における画像の表示方法の一例を説明するための図 上記各実施の形態における係り受け情報の一例を示す図 上記各実施の形態におけるコンピュータシステムの外観一例を示す模式図 上記各実施の形態におけるコンピュータシステムの構成の一例を示す図
符号の説明
1、2 情報処理装置
11 文書記憶部
12 用語抽出部
13 情報取得部
14 文書生成部
15 文書選択部
16 対応情報記憶部
17 画像取得部
18 文書出力部
19 画像表示部
21 音声情報受付部
22 音声認識部
23 機械翻訳部

Claims (14)

  1. 文書が記憶される文書記憶部と、
    前記文書記憶部で記憶されている文書から用語を抽出する用語抽出部と、
    前記文書記憶部で記憶されている文書をチャンクに分割し、各チャンクの係り受けを示す情報である係り受け情報を取得する係り受け情報取得部と、
    前記係り受け情報取得部が取得した係り受け情報を用いて、あるチャンクに2以上のチャンクが係っている場合には、当該2以上のチャンクの位置を入れ替え可能であるとして、前記文書記憶部で記憶されている文書から、入れ替え可能なチャンクの位置を入れ替えた文書を生成する文書生成部と、
    前記用語抽出部が抽出した用語に対応する画像を、用語と画像とを対応付けて有する情報である対応情報が2以上記憶される対応情報記憶部で記憶されている当該2以上の対応情報を用いて取得する画像取得部と、
    前記用語抽出部が抽出した用語が均等に出現する文書を、前記文書記憶部で記憶されている文書、及び前記文書生成部が生成した文書から選択する文書選択部と、
    前記文書選択部が選択した文書に含まれるテキストを、時系列に沿って出力する文書出力部と、
    前記画像取得部が取得した画像を、当該画像に対応する用語が前記文書出力部によって出力されるタイミングで表示する画像表示部と、を備えた情報処理装置。
  2. 前記文書出力部は、選択された文書に含まれるテキストに対応する音声情報を生成し、当該生成した音声情報を音声出力する、請求項1記載の情報処理装置。
  3. 前記文書出力部は、選択された文書に含まれるテキストをティッカー表示する、請求項1記載の情報処理装置。
  4. 前記用語抽出部は、前記文書記憶部で記憶されている文書に含まれる内容語と機能語のうち、内容語を抽出する、請求項1から請求項3のいずれか記載の情報処理装置。
  5. 前記用語抽出部は、前記文書記憶部で記憶されている文書の長さが長いほど、より多くの用語を抽出する、請求項1から請求項4のいずれか記載の情報処理装置。
  6. 前記用語抽出部は、用語と、当該用語の視覚化の容易さの指標である視覚化容易度とを対応付ける情報を用いて、前記文書記憶部で記憶されている文書から、視覚化容易度の高い用語を抽出する、請求項1から請求項5のいずれか記載の情報処理装置。
  7. 前記用語抽出部は、用語と、当該用語を視覚化した際における視覚化された画像の種類の多さを示す指標である視覚化揺らぎ度とを対応付ける情報を用いて、前記文書記憶部で記憶されている文書から、視覚化揺らぎ度の低い用語を抽出する、請求項1から請求項6のいずれか記載の情報処理装置。
  8. 前記用語抽出部は、用語と当該用語の視覚化の容易さの指標である視覚化容易度とを対応付ける情報、用語と当該用語を視覚化した際における視覚化された画像の種類の多さを示す指標である視覚化揺らぎ度とを対応付ける情報、及び、視覚化容易度が高いほど大きな値となり、視覚化揺らぎ度が低いほど大きな値となる式を用いて、前記文書記憶部で記憶されている文書から、前記式の値の大きい用語を抽出する、請求項1から請求項5のいずれか記載の情報処理装置。
  9. 前記文書選択部は、前記用語抽出部が抽出した用語のうち、前記式の値の最も大きい用語が他の抽出された用語に対して先頭となる文書を、前記文書記憶部で記憶されている文書、及び前記文書生成部が生成した文書から選択する、請求項8記載の情報処理装置。
  10. 発生された原言語の音声をマイクによって集音した情報である原言語音声情報を受け付ける音声情報受付部と、
    前記音声情報受付部が受け付けた原言語音声情報を音声認識して、当該原言語音声情報に対応するテキスト情報である音声認識結果情報を取得する音声認識部と、
    前記音声認識部が取得した音声認識結果情報を機械翻訳して、当該音声認識結果情報に対応する目的言語のテキストの文書を取得して、前記文書記憶部に蓄積する機械翻訳部と、をさらに備えた、請求項1から請求項9のいずれか記載の情報処理装置。
  11. 前記画像表示部は、表示する画像に対応する用語の属性に応じた表示方法で画像を表示する、請求項1から請求項10のいずれか記載の情報処理装置。
  12. 前記属性は、用語の単数と複数との違いである、請求項11記載の情報処理装置。
  13. 文書が記憶される文書記憶部と、用語抽出部と、係り受け情報取得部と、文書生成部と、用語と画像とを対応付けて有する情報である対応情報が2以上記憶される対応情報記憶部と、画像取得部と、文書選択部と、文書出力部と、画像表示部とを用いて処理される情報処理方法であって、
    前記用語抽出部が、前記文書記憶部で記憶されている文書から用語を抽出する用語抽出ステップと、
    前記係り受け情報取得部が、前記文書記憶部で記憶されている文書をチャンクに分割し、各チャンクの係り受けを示す情報である係り受け情報を取得する係り受け情報取得ステップと、
    前記文書生成部が、前記係り受け情報取得ステップで取得した係り受け情報を用いて、あるチャンクに2以上のチャンクが係っている場合には、当該2以上のチャンクの位置を入れ替え可能であるとして、前記文書記憶部で記憶されている文書から、入れ替え可能なチャンクの位置を入れ替えた文書を生成する文書生成ステップと、
    前記画像取得部が、前記用語抽出ステップで抽出した用語に対応する画像を取得する画像取得ステップと、
    前記文書選択部が、前記用語抽出ステップで抽出した用語が均等に出現する文書を、前記文書記憶部で記憶されている文書、及び前記文書生成ステップで生成した文書から選択する文書選択ステップと、
    前記文書出力部が、前記文書選択ステップで選択した文書に含まれるテキストを、時系列に沿って出力する文書出力ステップと、
    前記画像表示部が、前記画像取得ステップで取得した画像を、当該画像に対応する用語が前記文書出力ステップで出力されるタイミングで表示する画像表示ステップと、を備えた情報処理方法。
  14. コンピュータを、
    文書が記憶される文書記憶部で記憶されている文書から用語を抽出する用語抽出部と、
    前記文書記憶部で記憶されている文書をチャンクに分割し、各チャンクの係り受けを示す情報である係り受け情報を取得する係り受け情報取得部と、
    前記係り受け情報取得部が取得した係り受け情報を用いて、あるチャンクに2以上のチャンクが係っている場合には、当該2以上のチャンクの位置を入れ替え可能であるとして、前記文書記憶部で記憶されている文書から、入れ替え可能なチャンクの位置を入れ替えた文書を生成する文書生成部と、
    前記用語抽出部が抽出した用語に対応する画像を、用語と画像とを対応付けて有する情報である対応情報が2以上記憶される対応情報記憶部で記憶されている当該2以上の対応情報を用いて取得する画像取得部と、
    前記用語抽出部が抽出した用語が均等に出現する文書を、前記文書記憶部で記憶されている文書、及び前記文書生成部が生成した文書から選択する文書選択部と、
    前記文書選択部が選択した文書に含まれるテキストを、時系列に沿って出力する文書出力部と、
    前記画像取得部が取得した画像を、当該画像に対応する用語が前記文書出力部によって出力されるタイミングで表示する画像表示部として機能させるためのプログラム。
JP2007330078A 2007-12-21 2007-12-21 情報処理装置、情報処理方法、及びプログラム Pending JP2009151630A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007330078A JP2009151630A (ja) 2007-12-21 2007-12-21 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007330078A JP2009151630A (ja) 2007-12-21 2007-12-21 情報処理装置、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2009151630A true JP2009151630A (ja) 2009-07-09

Family

ID=40920705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007330078A Pending JP2009151630A (ja) 2007-12-21 2007-12-21 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2009151630A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014002257A (ja) * 2012-06-18 2014-01-09 Nippon Telegr & Teleph Corp <Ntt> 言語モデル生成装置、その方法及びプログラム
JP2016162308A (ja) * 2015-03-03 2016-09-05 日本電信電話株式会社 自然言語解析装置、方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014002257A (ja) * 2012-06-18 2014-01-09 Nippon Telegr & Teleph Corp <Ntt> 言語モデル生成装置、その方法及びプログラム
JP2016162308A (ja) * 2015-03-03 2016-09-05 日本電信電話株式会社 自然言語解析装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7191131B1 (en) Electronic document processing apparatus
Pavel et al. Sceneskim: Searching and browsing movies using synchronized captions, scripts and plot summaries
JP5123591B2 (ja) 発想支援装置、発想支援システム、発想支援プログラム及び発想支援方法
JP2013044770A (ja) 学習支援システム及び学習支援方法
US20070283270A1 (en) Context sensitive text recognition and marking from speech
US10540445B2 (en) Intelligent integration of graphical elements into context for screen reader applications
Wagner et al. The big australian speech corpus (the big asc)
KR101104777B1 (ko) 수화 애니메이션 생성을 위한 시스템 및 방법
Bernardini et al. Corpus linguistics, translation and interpreting
Shahriar et al. A communication platform between bangla and sign language
US20210264812A1 (en) Language learning system and method
US20080243510A1 (en) Overlapping screen reading of non-sequential text
Marujo et al. Porting REAP to European Portuguese.
Akasheh et al. Artificial intelligence-generated Arabic subtitles: insights from Veed. io’s automatic speech recognition system of Jordanian Arabic
JP2009151630A (ja) 情報処理装置、情報処理方法、及びプログラム
KR20090035346A (ko) 어휘 분석을 수행하는 어학학습 방법
KR100505346B1 (ko) 플래쉬 기법을 이용한 언어학습방법
CN111681467B (zh) 一种词汇学习方法及电子设备、存储介质
US20160267811A1 (en) Systems and methods for teaching foreign languages
KR102098377B1 (ko) 퍼즐 게임으로 어순을 학습하는 외국어 학습 서비스 제공 방법
KR101709936B1 (ko) 시사 토픽 기사의 핵심 아이디어를 소정의 단문으로 재구성하여 토픽의 개념화 능력 및 문장 구사력을 증진시키는 영어 학습 장치 및 방법
KR100984043B1 (ko) 발음 학습기능을 갖는 전자사전 서비스 방법 및 그 전자사전 장치
KR102480607B1 (ko) 인토네이션, 스트레스 및 리듬을 표기한 영어 말하기 학습 서비스 제공 시스템
WO2023047623A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Jayalakshmi et al. Augmenting Kannada Educational Video with Indian Sign Language Captions Using Synthetic Animation