JP2017004193A - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2017004193A
JP2017004193A JP2015116343A JP2015116343A JP2017004193A JP 2017004193 A JP2017004193 A JP 2017004193A JP 2015116343 A JP2015116343 A JP 2015116343A JP 2015116343 A JP2015116343 A JP 2015116343A JP 2017004193 A JP2017004193 A JP 2017004193A
Authority
JP
Japan
Prior art keywords
content
component
unit
related information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015116343A
Other languages
English (en)
Other versions
JP6641732B2 (ja
Inventor
祐介 武士
Yusuke Bushi
祐介 武士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP2015116343A priority Critical patent/JP6641732B2/ja
Publication of JP2017004193A publication Critical patent/JP2017004193A/ja
Application granted granted Critical
Publication of JP6641732B2 publication Critical patent/JP6641732B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】コンテンツに含まれるキーワードの認識率の低下を抑えつつ、キーワードに関連する情報を提供すること。【解決手段】情報処理装置は、コンテンツに含まれるコンテンツ構成要素を抽出する抽出部と、前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶部と、前記抽出部が抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索部と、前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力部と、を備える。【選択図】図2

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
従来、発話を音声認識することによって発話の内容に含まれるキーワードを抽出し、抽出したキーワードに関連する情報をユーザに提供する情報提供システムが知られている。
そのような情報提供システムにおいては、一般的に、音声認識する際に検索に使用される辞書に登録された語句が多いほど、キーワードの認識率は低下する。
そこで、例えば、特許文献1に記載された音声認識システムは、自動車のドライバーとオペレータとの間の通話を音声認識して、通話に含まれる特徴的発話を抽出する。特許文献1に記載された音声認識システムは、抽出した特徴的発話に応じて、通話中に、登録された語句の多い辞書から、登録された語句の少ない辞書へ切り替える。
特開2011−203349号公報
しかしながら、例えば、専門家や学芸員による講演、または文化財の展示会等において提供されるコンテンツは、予めシナリオが決まっているコンテンツであるか、または、予めシナリオは決まっていなくてもテーマを予め絞り込むことが可能なコンテンツである場合が多い。したがって、上記のような場面において提供されるコンテンツは、コンテンツに含まれる可能性があるキーワードを予め絞り込んでおくことが可能である。また、上記のような場面において提供されるコンテンツには、専門用語が多く含まれる場合が多い。
そのため、上記のような場面において提供されるコンテンツに対して音声認識や文字認識を行う場合に、広範な分野における汎用的な語句が多数登録された辞書が検索に使用されることは、キーワードの認識率の低下を招く原因になることがある。
本発明は上記の点に鑑みてなされたものであり、コンテンツに含まれるキーワードの認識率の低下を抑えつつ、キーワードに関連する情報を提供することができる、情報処理装置、情報処理方法、及びプログラムを提供する。
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様としては、コンテンツに含まれるコンテンツ構成要素を抽出する抽出部と、前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶部と、前記抽出部が抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索部と、前記抽出部が抽出した前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記抽出部が抽出した前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力部と、を備えることを特徴とする、情報処理装置である。
(2)本発明の一態様としては、前記出力部は、前記抽出部が抽出した前記コンテンツ構成要素を表示する第1表示領域と、前記抽出部が抽出した前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を表示する第2表示領域と、を有する、ことを特徴とする、(1)に記載の情報処理装置である。
(3)本発明の一態様としては、前記抽出部が抽出した複数の前記コンテンツ構成要素を、前記出力部はタイムライン形式で前記第1表示領域に表示する、ことを特徴とする、(2)に記載の情報処理装置である。
(4)本発明の一態様としては、前記検索部が検索する前記構成要素関連情報データベースの分野を指定する辞書指定部、を備え、前記検索部は、前記辞書指定部が指定する前記分野の前記構成要素関連情報データベースを検索する、ことを特徴とする、(1)に記載の情報処理装置である。
(5)本発明の一態様としては、前記辞書指定部は、前記コンテンツに含まれる場面が切り替わった場合に、前記検索部が検索する前記構成要素関連情報データベースの前記分野を再指定する、ことを特徴とする、(4)に記載の情報処理装置である。
(6)本発明の一態様としては、前記出力部が出力した前記コンテンツ構成要素と、前記出力部が出力した前記コンテンツ構成要素に対応付けられた前記構成要素関連情報と、を記憶する履歴記憶部、を備えることを特徴とする、(1)に記載の情報処理装置である。
(7)本発明の一態様としては、前記抽出部は、前記コンテンツに含まれる前記コンテンツ構成要素を、音声認識、または文字認識によって抽出する、ことを特徴とする、(1)に記載の情報処理装置である。
(8)本発明の一態様としては、コンテンツに含まれるコンテンツ構成要素を抽出する抽出ステップと、前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶ステップと、前記抽出ステップにおいて抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索ステップと、前記抽出ステップにおいて抽出した前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記抽出ステップにおいて抽出した前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力ステップと、を有することを特徴とする、情報処理方法である。
(9)本発明の一態様としては、コンピュータに、コンテンツに含まれるコンテンツ構成要素を抽出する抽出ステップと、前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶ステップと、前記抽出ステップにおいて抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索ステップと、前記抽出ステップにおいて抽出した前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記抽出ステップにおいて抽出した前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力ステップと、を実行させるための、プログラムである。
本発明によれば、コンテンツに含まれるキーワードの認識率の低下を抑えつつ、キーワードに関連する情報を提供することができる。
本発明の第1の実施形態に係る自動講演解説表示システム1の構成の一例を示す概略図である。 本発明の第1の実施形態に係る情報処理装置10Aの構成の一例を示すブロック図である。 本発明の第1の実施形態に係る情報処理装置10Aの出力の一例を示す概略図である。 本発明の第1の実施形態に係る構成要素関連情報データベースの構成の一例を示す概略図である。 本発明の第1の実施形態に係る情報処理装置10Aの動作の一例を示すフローチャートである。 本発明の第2の実施形態に係る自動映像解説表示システム2の構成の一例を示す概略図である。 本発明の第2の実施形態に係る情報処理装置10Bの構成の一例を示すブロック図である。 本発明の第2の実施形態に係るコンテンツ再生装置30が送信するデータの一例を示す概略図である。 本発明の第2の実施形態に係る情報処理装置10Bの動作の一例を示すフローチャートである。
(第1の実施形態)
以下、本発明の第1の実施形態について、図面を参照しながら説明する。
図1は、本発明の第1の実施形態に係る自動講演解説表示システム1の構成の一例を示す概略図である。
第1の実施形態に係る自動講演解説表示システム1は、例えば、講演会の会場に設置されるシステムである。図1(A)に図示する自動講演解説表示システム1は、複数の情報処理装置10Aと、マイクロフォン20と、スピーカー21と、を含んで構成される。
情報処理装置10Aは、講演会の聴衆へ、講演者が発言する内容(コンテンツ)に含まれるキーワード(コンテンツ構成要素)の関連情報を提供する装置である。情報処理装置10Aは、例えば、ディスプレイを備えたタブレット端末であり、講演開始前に予めそれぞれの聴衆へ貸与されるか、またはそれぞれの聴衆によって持参される。情報処理装置10Aは、講演会が実施される間、聴衆によって使用される。
但し、情報処理装置10Aは、タブレット端末に限られない。情報処理装置10Aは、例えば、ヘッドフォンを備えた音声再生端末であり、音声によってユーザ(聴衆)へ情報を提供する装置であっても構わない。また、情報処理装置10Aは、例えば、大人数で同時視聴が可能な大画面のモニタ(ディスプレイ)を備える装置であっても構わない。
マイクロフォン20は、講演者が発話した音声を電気信号に変換する。
スピーカー21は、マイクロフォン20によって変換された電気信号に基づく音声を拡声して、講演会の聴衆へ向けて出力する。
情報処理装置10Aは、スピーカー21から出力された音声(コンテンツ)を取得して、取得した音声を音声認識することができる、それにより、情報処理装置10Aは、音声に含まれるキーワード(コンテンツ構成要素)を抽出することができる。情報処理装置10Aは、抽出したキーワードを出力する。例えば、情報処理装置10Aは、自らの情報処理装置10Aが備えるディスプレイに、抽出したキーワードを順次、表示する。
なお、図1(B)に図示するように、例えば、スピーカー21から出力された音声(コンテンツ)をパーソナルコンピュータ22が取得し、パーソナルコンピュータ22が音声認識をする構成であってもよい。その場合、パーソナルコンピュータ22は、音声に含まれるキーワード(コンテンツ構成要素)を抽出し、抽出したキーワードを示すデータを、通信ネットワーク(図示せず)を介して、情報処理装置10Aへ送信する。情報処理装置10Aは、パーソナルコンピュータ22から取得したデータに基づくキーワードを出力する。
情報処理装置10Aが備えるディスプレイに表示されたキーワードは、ユーザによって指定(選択)され得る。例えば、情報処理装置10Aが備えるディスプレイがタッチパネル式のディスプレイである場合には、ユーザによって所望のキーワードが表示された箇所がタッチされ得る。それにより、キーワードが指定される。情報処理装置10Aは、指定されたキーワードに関連する情報を、自らの情報処理装置10Aが備えるディスプレイに表示する。
以上により、ユーザは、例えば、講演の内容に含まれる任意のキーワード(コンテンツ構成要素)について解説する情報(構成要素関連情報)を、情報処理装置10Aによって参照することができる。
(情報処理装置10Aの構成)
次に、情報処理装置10Aの構成について、更に詳しく説明する。
図2は、本発明の第1の実施形態に係る情報処理装置10Aの構成の一例を示すブロック図である。
情報処理装置10Aは、取得部101と、抽出部102と、辞書指定部103と、検索部104と、記憶部105と、出力制御部106と、出力部107と、操作入力部108と、履歴記憶部109と、を含んで構成される。
取得部101は、スピーカー21から出力された音声を取得する。取得部101は、例えば、情報処理装置10Aに内蔵されたマイクロフォンである。取得部101は、取得した音声を電気信号に変換し、抽出部102へ出力する。
抽出部102は、取得部101から取得した電気信号が示す音声を音声認識する。抽出部102は、音声認識により、音声に含まれるキーワードを抽出する。抽出部102は、抽出したキーワードに基づくテキストデータを、辞書指定部103、及び検索部104へ出力する。
辞書指定部103は、抽出部102から取得したテキストデータが示すキーワードに基づいて、講演の内容が属する分野を推定する。なお、推定の方法は、キーワードに基づいて講演の内容が属する分野を推定することができるならば、どんな方法でもかまわない。例えば、情報処理装置10Aが、分野とキーワードとが対応付けられたリストを予め保持しており、辞書指定部103は、そのリストに基づいて、取得したキーワードに対応する分野を推定結果とするような構成にしてもよい。
なお、上記の例においては、辞書指定部103が、講演の内容が属する分野を推定したが、代わりに、ユーザからの操作入力によって分野が予め指定されるような構成にしてもよい。その場合には、辞書指定部103は、後述する操作入力部108から、ユーザによって指定された分野を示す操作信号を取得する。
辞書指定部103は、推定した分野、またはユーザによって指定された分野を示すデータを、検索部104へ出力する。
検索部104は、抽出部102から取得したテキストデータが示すキーワードと同一のキーワードが、後述する記憶部105に記憶された構成要素関連情報データベースの中に存在するか否かを検索する。
記憶部105は、構成要素関連情報データベースを、コンテンツの内容が属する分野毎に、予め記憶している。記憶部105は、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory;読み出し専用メモリ)、RAM(Random Access read/write Memory;読み書き可能なメモリ)、又はそれらの任意の組み合わせを含んで構成される。
構成要素関連情報データベースとは、コンテンツ構成要素と、そのコンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられたデータベースである。構成要素関連情報データベースは、例えば、辞書のデータベースであり、キーワード(コンテンツ構成要素)とそのキーワードについての解説文(構成要素関連情報)とが対応付けられたデータベースである。
また、検索部104は、辞書指定部103から取得した、分野を示すデータに基づいて、検索対象にする構成要素関連情報データベースを特定する。
検索部104は、抽出部102から取得したテキストデータが示すキーワードと同一のキーワードが、記憶部105に記憶された、検索対象とした分野の構成要素関連情報データベース中に存在した場合、そのキーワードとそのキーワードに対応する解説文とを示すテキストデータを、出力制御部106へ出力する。
出力制御部106は、検索部104から取得したテキストデータに基づくキーワード、及び解説文を含む画像を、出力部107に表示させる。また、出力制御部106は、検索部104から取得したテキストデータを、後述する履歴記憶部109へ出力する。
出力部107は、出力制御部106から取得したデータに基づく情報を出力する。例えば、出力部107は、出力制御部106から取得したデータに基づく画像を表示する。出力部107はディスプレイ、例えば、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイ、等を含んで構成される。
操作入力部108は、ユーザ(聴衆)による各種の操作入力を受け付ける。操作入力部108は、受け付けた各種の操作入力に基づく操作信号を出力する。各種の操作入力に基づく操作信号とは、例えば、検索対象とする辞書の分野がユーザにより指定されたことを示す操作信号、出力部107に出力されたキーワードの中の1つがユーザにより指定されたことを示す操作信号、及びタイムライン形式で表示されている画面表示をスクロールさせる操作をユーザが行ったことを示す操作信号、等である。
操作入力部108は、例えば、情報処理装置10Aに備えられた操作ボタンまたはタッチパネル、操作用コントローラー、または、リモートコントローラーや携帯型端末等の他の機器から操作信号を取得することができる入力インターフェース、等を含んで構成される。
出力部107に表示されたキーワードの1つが、操作入力部108を介してユーザにより指定された場合、操作入力部108は、指定されたキーワードを示す操作信号を出力制御部106へ出力する。
出力制御部106は、検索部104を介し、操作入力部108から取得した操作信号が示すキーワードを検索キーとして、記憶部105に記憶されている構成要素関連情報データベースを検索する。なお、検索対象とする構成要素関連情報データベースは、上記において辞書指定部103が推定した分野、またはユーザによって指定された分野の構成要素関連情報データベースである。
出力制御部106は、検索部104を介し、検索したキーワード(コンテンツ構成要素)に対応する解説文(構成要素関連情報)を示すテキストデータを取得する。
出力制御部106は、取得したテキストデータに基づく解説文を、出力部107に表示させる。また、出力制御部106は、取得したテキストデータを履歴記憶部109へ出力する。
履歴記憶部109は、出力制御部106が出力部107に表示させたキーワードを示すテキストデータ及び解説文を示すテキストデータを、出力制御部106から順次、取得する。すなわち、履歴記憶部109は、出力部107に表示されたキーワード及び解説文を、表示履歴として記憶する。
なお、情報処理装置10Aのユーザは、この表示履歴を示すデータを、例えば、ユーザ自身が保有するスマートフォン等に転送(ダウンロード)することができる。それにより、情報処理装置10Aのユーザは、講演会の終了後でも、ユーザ自身が保有するスマートフォンによって、キーワード及び解説文を参照することができる。
履歴記憶部109は、例えば、HDD、フラッシュメモリ、EEPROM、ROM、RAM、又はそれらの任意の組み合わせ、を含んで構成される。
(情報処理装置の出力例)
次に、第1の実施形態に係る情報処理装置10Aの出力例について図を参照しながら説明する。
図3は、本発明の第1の実施形態に係る情報処理装置10Aの出力の一例を示す概略図である。
図3(A)及び図3(B)は、情報処理装置10Aが、自己の情報処理装置10Aの備えるディスプレイに画像を表示させた場合の一例である。
図3(A)に示す画像の1行目(最上段)には、「001」及び「江戸時代・・・1603年−1868...」と表示されている。これは、講演が始まってから最初に、検索部104から出力制御部106へ出力されたキーワードが、「江戸時代」であったことを示している。すなわち、抽出部102がキーワードを抽出する度に、順次、検索部104は抽出したキーワードを検索キーとして、記憶部105に記憶された構成要素関連情報データベースを検索する。そして、検索キーとしたキーワードと同一のキーワードが構成要素関連情報データベースに存在した場合、検索部104は出力制御部106へ、そのキーワードとそのキーワードに対応する解説文とを出力する。
「001」は、キーワードが抽出された順番を示す通し番号である。
また、「1603年−1868...」は、キーワード(コンテンツ構成要素)である「江戸時代」に対応する解説文(構成要素関連情報)である。なお、1行の中に表示可能な文字数には限りがあるため、図3(A)の例に示す画像の1行目(最上段)には、解説文の冒頭の部分である「1603年−1868」だけが表示されている。
図3(A)に示す画像の2行目には、「002」及び「征夷大将軍・・・」と表示されている。1行目と同様に、これは、講演が始まってから2番目に検索部104から出力制御部106へ出力されたキーワードが「征夷大将軍」であったことを示している。
このように、構成要素関連情報データベースに存在するキーワードが抽出される度に、出力部107は、前回抽出したキーワードの行の下側へ、1行ずつ新たな行を追加していくように表示を更新する。そして、画面の最も上の行から最も下の行まで、全ての行にキーワード等が表示された状態になった場合には、以前に追加されたキーワード等は、1行ずつ上に繰り上がっていくように、出力部107は画面の表示を更新する。それまで最も上の行に表示されていたキーワード(表示されているキーワードの中で、最も早くから画面に表示されていたキーワード)等は、画面から消去される。そして、出力部107は、新たに追加されるキーワードを最も下の行に表示する。すわなち、出力部107は、新しい情報が追加されることに応じて最も古い情報が順次消去されていく、いわゆるタイムライン形式の表示方法で、画面の表示を更新していく。
なお、公知の一般的なタイムライン形式での表示方法と同様に、画面から消去されたキーワード等は、画面をスクロールさせることによって、再び画面に表示させることも可能である。
なお、本発明の第1の実施形態に係る情報処理装置10Aの出力部107が表示する画像の表示方法は、上述したタイムライン形式での表示方法に限られない。出力部107は、例えば、表示してから一定の時間が経過したキーワード(行)等を、順次、非表示にしていくようにしてもよい。
また、第1の実施形態に係る情報処理装置10Aは、操作性向上のため、上述したように、各行の先頭には「001」、「002」等の通し番号を付与している。すなわち、タイムライン形式で表示されたキーワードをユーザが後から検索する際には、通し番号を目安にすることによって、既に画面から消去されているキーワードであっても、ユーザは所望のキーワードを検索し易くなる。
但し、操作性向上のためにキーワードに付与して表示する情報は、通し番号に限られない。例えば、情報処理装置10Aは、キーワードに通し番号を付与して表示する代わりに、各キーワード(行)が画面に表示された時間を、各行の先頭に付与して表示するようにしてもよい。
図3(A)に示すタイムライン表示される表示領域(以下、第1表示領域とも言う)において、例えば、2行目の「征夷大将軍」の部分がユーザによって選択され得る。出力部107がタッチパネル式のディスプレイである場合には、2行目の「征夷大将軍」の部分がユーザによってタッチされることによって、選択され得る。
第1表示領域に表示されたキーワードである「征夷大将軍」が選択されると、図3(B)に示すように、キーワードである「征夷大将軍」に対応する解説文を全文表示する表示領域(以下、第2表示領域とも言う)が生成される。
なお上述したように、本実施形態においては、第1表示領域情報処理装置には解説文の冒頭の部分が表示される。但し、10Aの備えるディスプレイが大型である場合など、十分な広さの表示領域を確保できる場合には、第1表示領域に解説文の全文が表示される構成であっても構わない。
図3(B)は、画面の最上部に、通し番号「002」、キーワード「征夷大将軍」、及びその解説文の全文、が表示された第2表示領域が表示されている状態を表す。また、図3(B)は、キーワード「征夷大将軍」を表示する第2表示領域の下側に、通し番号「004」、キーワード「天守」、及びその解説文の全文、が表示された2つめの第2表示領域が表示されている状態を表す。すなわち、図3(B)は、「征夷大将軍」に続けて「天守」がユーザによって選択された場合を例示している。
なお、図3(B)に図示するように、第2表示領域が生成されると、生成された第2表示領域の分だけ、第1表示領域の表示面積は小さくなる。
なお、本実施形態において、第2表示領域に表示されるキーワードが増えた場合でもあっても、第1表示領域は一定の表示面積を保つことができる。すなわち、第2表示領域に表示されるキーワードが増えることに伴って、第2表示領域の表示面積が拡大し、第1表示領域の表示面積が縮小されていくが、第1の表示領域の面積が所定の表示面積まで縮小した場合には、それ以上は縮小されないようにすることができる。これにより、第2表示領域が生成された場合でも、第1表示領域に表示されるキーワード一覧をユーザが参照可能になるため、操作性が向上する。
このように、第1表示領域で選択されたキーワードの解説文の全文を、画面の上段から順にストックして表示する第2表示領域が生成される。なお、第2表示領域についても、第1表示領域と同様に、上下にスクロールさせて表示することが可能である。また、一度解説文がストックして表示されたキーワードについては、第1表示領域に表示されるキーワード一覧における当該キーワードの文字色が変更されるようにしてもよい。これにより、ユーザは、解説文を一度表示させた(既読の)キーワードであるか否かを、文字色の違いによって容易に判別することが可能になる。
第2表示領域に表示される情報は、第1表示領域のようにタイムライン形式で表示されて古い情報から順に消去されていくのではなく、ユーザからの明示的な操作によって消去されるまで表示され続ける。なお、ユーザからの明示的な操作とは、例えば、第2表示領域を消去させることに対応付けられた操作であるスワイプ操作などである。スワイプ操作とは、マルチタッチインターフェースにおける操作のうち、画面に触れた状態で指を滑らせる操作のことである。例えば、ユーザは、第2表示領域の部分を、右から左へ指を滑らせるスワイプ操作によって、所望の第2表示領域の部分を消去させることができる。
第2表示領域が消去されると、消去した第2表示領域の分だけ、第1表示領域の表示面積は再び大きくなる。
なお、図3(B)に図示するように、第2表示領域に表示させる情報は、選択されたキーワードについての解説文だけに限られるものでなく、例えば、選択されたキーワードに関連する画像を表示させるようにしてもよい。
なお、情報処理装置10Aとパーソナルコンピュータ22とが通信可能な状態である場合において、解説文がストックして表示されたキーワードの表示履歴を示す情報を、情報処理装置10Aからパーソナルコンピュータ22へ送信するようにしてもよい。これにより、自動講演解説表示システム1は、ユーザからの関心が高いキーワードを示す統計情報をパーソナルコンピュータ22に蓄積することが可能になる。
また、後述する情報処理装置10Bとコンテンツ再生装置30とが通信可能な状態である場合においても、上記と同様に、後述する自動映像解説表示システム2は、ユーザからの関心が高いキーワードを示す統計情報をコンテンツ再生装置30に蓄積することが可能になる。
なお、情報処理装置10Aとパーソナルコンピュータ22とが通信可能な状態である場合において、第1表示領域に表示されるキーワード一覧の中にユーザが所望するキーワードが存在しない時には、ユーザが当該キーワードを情報処理装置10Aから入力できるようにしてもよい。その場合、入力されたキーワードは、情報処理装置10Aからパーソナルコンピュータ22へ送信される。これにより、自動講演解説表示システム1は、ユーザが所望するキーワードを示す、ユーザからのリクエスト、またはユーザからのフィードバックを収集することが可能になる。
また、後述する情報処理装置10Bとコンテンツ再生装置30とが通信可能な状態である場合においても、上記と同様に、後述する自動映像解説表示システム2は、ユーザが所望するキーワードを示す、ユーザからのリクエスト情報、またはユーザからのフィードバック情報を収集することが可能になる。
なお、情報処理装置10Aとパーソナルコンピュータ22とが通信可能な状態ではない場合(オフライン環境である場合)において、上記リクエスト情報、及びフィードバック情報を情報処理装置10Aに蓄積しておくことができるようにしてもよい。その場合、例えば、上記リクエスト情報、及びフィードバック情報を2次元バーコード化して情報処理装置10Aの出力部107に表示させ、シアター会場の出口等に設置されたバーコードリーダー(図示せず)によって、当該2次元バーコードを読み取るようにしてもよい。これにより、自動講演解説表示システム1は、オフライン環境であっても、ユーザが所望するキーワードを示す、ユーザからのリクエスト、またはユーザからのフィードバックを収集することが可能になる。
また、後述する情報処理装置10Bとコンテンツ再生装置30とが通信可能な状態ではない場合(オフライン環境である場合)においても、上記と同様に、後述する自動映像解説表示システム2は、オフライン環境であっても、ユーザが所望するキーワードを示す、ユーザからのリクエスト、またはユーザからのフィードバックを収集することが可能になる。
上記のように、ユーザからリクエスト情報、及びフィードバック情報を収集する際には、その対価として、例えば、シアター会場にてユーザが閲覧したデータを、ユーザが持ち帰ることができるようにしてもよい(おみやげ機能)。その場合、例えば、情報処理装置10Aから、ユーザが持参したスマートフォン等の電子機器へ、当該データを転送可能にしたり、インターネット等の通信ネットワークを介して、当該データをダウンロード可能にしたりしてもよい。
(構成要素関連情報データベースの構成例)
次に、第1の実施形態に係る情報処理装置10Aの記憶部105が記憶する構成要素関連情報データベースの構成について、図を参照しながら説明する。
図4は、本発明の第1の実施形態に係る構成要素関連情報データベースの構成の一例を示す概略図である。
図4に例示する構成要素関連情報データベースは、キーワードとそのキーワードの解説文とを対応付けて記憶する辞書のデータベースである。図4に例示する構成要素関連情報データベースは、「辞書ID」、「キーワードID」、「キーワード」、及び「解説文」の4つ項目の列からなる2次元の表形式のデータ(テーブル)を含んで構成される。
図4に例示する構成要素関連情報データベースは、分野別、及び言語別に分類された複数の辞書を含む。「辞書ID」は、辞書を一意に特定するための識別子である。例えば、図4に示すテーブルの「辞書ID」の項目に対する値には、「edo01jp」、「edo01en」、及び「kano01jp」という辞書IDが含まれている。
「edo01jp」の文字列に含まれる「edo」は、「江戸時代」に関連する専門用語を集めた辞書であることを表す。また、「edo01jp」の文字列に含まれる「01」は、「江戸時代」に関連する専門用語を集めた辞書に任意で付与される番号であり、例えば、辞書のバージョン番号を表す。また、「edo01jp」の文字列に含まれる「jp」は、「Japanese」を省略したものであり、キーワード及び解説文が「日本語」で記された辞書であることを表す。
同様に、「edo01en」の文字列に含まれる「edo」は、「江戸時代」に関連する専門用語を集めた辞書であることを表す。また、「01」は、辞書に任意で付与される番号である。また、「en」は、「English」を省略したものであり、キーワード及び解説文が「英語」で記された辞書であることを表す。
同様に、「kano01jp」の文字列に含まれる「kano」は、「狩野派」に関連する専門用語を集めた辞書であることを表す。また、「01」は、辞書に任意で付与される番号である。また、「jp」は、キーワード及び解説文が「日本語」で記された辞書であることを表す。
以上、説明したように、「辞書ID」の文字列の前半部のアルファベットで記されている部分(例えば、「edo」)は、辞書の内容が属する分野を表す。また、「辞書ID」の文字列の後半部のアルファベットで記されている部分(例えば、「jp」)は、辞書に内容を記述している言語を表す。
検索部104は、辞書指定部103から取得する、分野及び言語、またはそのいずれか一方を示すデータに基づいて、検索対象とする辞書データの辞書IDを決定する。例えば、検索部104が辞書指定部103から取得した分野及び言語を示すデータが「江戸時代」及び「日本語」であるならば、検索部104は「辞書ID」の前半部が「edo」であり後半部が「jp」である辞書IDを持つ辞書データを検索対象とする。
(情報処理装置10Aの動作)
次に、第1の実施形態に係る情報処理装置10Aの動作について説明する。
図5は、本発明の第1の実施形態に係る情報処理装置10Aの動作の一例を示すフローチャートである。
本フローチャートは、情報処理装置10Aが起動し、講演が開始した際に開始する。
(ステップS101)講演が開始され、取得部101は、音声の取得を開始する。取得部101は、取得した音声を示す音声データを、抽出部102へ出力する。その後、ステップS102へ進む。
(ステップS102)ユーザから、操作入力部108によって、検索対象とする辞書(例えば、辞書の分野及び言語)が指定されている場合には、ステップS107へ進む。そうでない場合は、ステップS103へ進む。
なお、ユーザの操作入力に基づいて検索対象とする辞書を指定可能であるほか、図1(B)に図示するパーソナルコンピュータ22からの入力に基づいて検索対象とする辞書が指定可能であるような構成であっても構わない。その場合、検索対象とする辞書を示す情報が、パーソナルコンピュータ22から通信ネットワーク(図示せず)を介して、情報処理装置10Aへ送信される。
(ステップS103)抽出部102は、取得部101から取得する音声データに基づく音声の音声認識を行う。抽出部102は、音声認識によって、音声に含まれるキーワードの抽出を試みる。その後、ステップS104へ進む。
(ステップS104)抽出部102が、キーワードを抽出した場合、抽出部102は、抽出したキーワードを示すテキストデータを、辞書指定部103へ出力する。その後、ステップS105へ進む。抽出部102が、キーワードを抽出していない場合は、ステップS103へ戻る。
(ステップS105)辞書指定部103は、抽出部102から取得したテキストデータが示すキーワードに基づいて、講演の内容が属する分野及び言語を推定する。その後、ステップS106へ進む。
(ステップS106)辞書指定部103が、講演の内容が属する分野及び言語の推定を完了した場合、ステップS107へ進む。そうでない場合は、ステップS103へ戻る。
(ステップS107)辞書指定部103は、ユーザによって操作入力部108を介して指定された分野及び言語、または抽出部102から取得したキーワードに基づいて推定した分野及び言語、に基づいて、検索対象とする辞書を決定する。辞書指定部103は、決定した辞書に対応する辞書IDを示すデータを検索部104へ出力する。その後、ステップS108へ進む。
(ステップS108)抽出部102は、取得部101から取得する音声データに基づく音声の音声認識を行う。抽出部102は、音声認識によって、音声に含まれるキーワードの抽出を試みる。その後、ステップS109へ進む。
(ステップS109)抽出部102が、キーワードを抽出した場合、抽出部102は、抽出したキーワードを示すテキストデータを、検索部104へ出力する。その後、ステップS110へ進む。抽出部102が、キーワードを抽出していない場合は、ステップS113へ進む。
(ステップS110)検索部104は、抽出部102から取得したテキストデータが示すキーワードを検索キーとして、記憶部105に記憶された構成要素関連情報データベースを検索する。その後、ステップS111へ進む。
(ステップS111)検索キーとしたキーワードと同一のキーワードが構成要素関連情報データベースに存在した場合には、検索部104は、検索キーとしたキーワードに対応付けられた解説文に基づくテキストデータを構成要素関連情報データベースから取得する。検索部104は、取得したテキストデータを、出力制御部106へ出力する。その後、ステップS112へ進む。検索キーとしたキーワードと同一のキーワードが構成要素関連情報データベースに存在しなかった場合には、ステップS113へ進む。
(ステップS112)出力制御部106は、通し番号と、検索部104から取得したテキストデータが示すキーワード及び解説文と、を出力部107のディスプレイの第1表示領域(タイムライン形式で表示する表示領域)に表示させる。その後、ステップS113へ進む。
(ステップS113)ユーザによって、操作入力部108を介して、出力部107のディスプレイの第1表示領域に表示されたキーワードの1つが指定された場合、操作入力部108は、第1表示領域に表示されたキーワードの1つが指定されたことを示す操作信号を、出力制御部106へ出力する。その後、ステップS114へ進む。第1表示領域に表示されたキーワードが指定されていない場合は、ステップS115へ進む。
(ステップS114)出力制御部106は、操作入力部108から取得した操作信号に基づいて、出力部107のディスプレイに第2表示領域を生成させる。また、それに伴って、出力制御部106は、第1表示領域を縮小させる。出力制御部106は、操作入力部108から取得した操作信号が示すキーワードと、そのキーワードに対応する解説文の全文を、生成した第2表示領域に表示させる。その後ステップS115へ進む。
(ステップS115)ユーザによって、操作入力部108を介して、出力部107のディスプレイに表示された第2表示領域の1つを消去させることを示す操作入力がなされた場合、操作入力部108は、第2表示領域の1つを消去することを示す操作信号を、出力制御部106へ出力する。その後、ステップS116へ進む。第2表示領域の1つを消去させることを示す操作入力がなされていない場合は、ステップS115へ進む。
(ステップS116)出力制御部106は、操作入力部108から取得した操作信号に基づいて、出力部107のディスプレイに表示された第2表示領域の1つを消去させる。また、それに伴って、出力制御部106は、第1表示領域を再び拡大させる。その後ステップS117へ進む。
(ステップS117)講演が終了した場合、本フローチャートの処理を終了する。そうでない場合は、ステップS108へ戻り、引き続き抽出部102はキーワードの抽出を継続する。
なお、講演が終了した場合、上述したユーザからのリクエスト情報、またはフィードバック情報を示す2次元バーコードを出力部107に表示するようにしてもよい。
以上、説明したように、本発明の第1の実施形態に係る情報処理装置10Aは、コンテンツの内容の属する分野別の辞書を、音声認識におけるキーワードの検索に使用する。それにより、特に、例えば講演または展示会等のように、コンテンツに専門用語を多く含み、予めコンテンツに含まれるキーワードを絞り込むことが可能である場面において、広範な分野の語句が多数登録された汎用的な辞書を検索に使用する場合に比べて、情報処理装置10Aは、キーワードの認識率の低下を抑えることができる。
以上により、第1の実施形態に係る情報処理装置10Aは、コンテンツに含まれるキーワードの認識率の低下を抑えつつ、キーワードに関連する情報をユーザへ提供することができる。
(第2の実施形態)
以下、本発明の第2の実施形態について、図面を参照しながら説明する。
図6は、本発明の第2の実施形態に係る自動映像解説表示システム2の構成の一例を示す概略図である。
第2の実施形態に係る自動映像解説表示システム2は、例えば、展示会の会場に設置されるシステムである。自動映像解説表示システム2は、映像コンテンツ、及びその映像コンテンツに関連するコンテンツ関連情報を観覧者へ提供する。
映像コンテンツとは、例えば、ビデオ映像のコンテンツ、またはVR(Virtual Reality;仮想現実)技術を用いて製作されたコンテンツであるVRコンテンツ、等である。なお、自動映像解説表示システム2が提供するコンテンツは映像コンテンツに限られるものではなく、音声コンテンツ、または、映像コンテンツと音声コンテンツとを組み合わせたコンテンツであっても構わない。
コンテンツ関連情報とは、例えば、映像コンテンツを構成する各シーン(場面)の解説をするための、テキスト(文字)コンテンツ、映像コンテンツ、音声コンテンツ、またはそれらのコンテンツを任意に組み合わせたコンテンツである。
自動映像解説表示システム2は、複数の情報処理装置10Bと、コンテンツ再生装置30と、を含んで構成される。
情報処理装置10Bは、映像コンテンツの観覧者へ、例えば、映像コンテンツの映像の中に含まれる文字(キーワード)の関連情報を提供する装置である。情報処理装置10Bは、例えば、カメラ、及びディスプレイを備えたタブレット端末であり、講演開始前に予めそれぞれの聴衆へ貸与されるか、またはそれぞれの聴衆によって持参される。情報処理装置10Bは、映像コンテンツが再生される間、観覧者によって使用される。
但し、情報処理装置10Bは、タブレット端末に限られない。情報処理装置10Bは、例えば、ヘッドフォンを備えた音声再生端末であり、音声によってユーザ(観覧者)へ関連情報を提供する装置であっても構わない。また、情報処理装置10Bは、例えば、大人数で同時視聴が可能な大画面のモニタ(ディスプレイ)を備える装置であっても構わない。
コンテンツ再生装置30は、例えば、観覧者の前に設置された大型ディスプレイ等の表示画面を備え、予め記憶された映像コンテンツを再生することができる装置である。コンテンツ再生装置30は、自らのコンテンツ再生装置30が備える表示画面に表示することによって、映像コンテンツを観覧者に提供する。
コンテンツ再生装置30が再生する映像コンテンツの映像へ、観覧者が情報処理装置10Bに備えられたカメラを向けると、情報処理装置10Bは映像に含まれる文字を文字認識する。情報処理装置10Bは、文字認識することによって、映像に含まれるキーワードを抽出することができる。
なお、情報処理装置10Bにカメラが備えられているのではなく、情報処理装置10Bとカメラとが別々の装置である構成であっても構わない。その場合、カメラが撮影した映像を示すデータが、カメラから通信ネットワーク(図示せず)等を介して、情報処理装置10Bへ送信される。
また、情報処理装置10Bが、コンテンツ再生装置30が再生する映像コンテンツの映像に含まれる画像を画像認識することもできる構成であっても構わない。例えば、画像の中に歴史上の人物の写真が含まれている場合に、情報処理装置10Bは、画像認識をすることによって、その歴史上の人物に関連するキーワード(例えば、人物の名前等)を抽出することができる。なお、画像認識をすることができる構成においては、構成要素関連情報データベースは、例えば、画像と、画像に対応するキーワード(コンテンツ構成要素)と、そのキーワードについての解説文(構成要素関連情報)とが対応付けられたデータベースである。
以下の説明においては、情報処理装置10Bが、文字認識によってキーワードを抽出する場合について説明する。
情報処理装置10Bは、抽出したキーワードを出力する。例えば、情報処理装置10Bは、自らの情報処理装置10Bが備えるディスプレイに、抽出したキーワードを順次、表示する。
ここで、表示したキーワードは、ユーザによって指定され得る。例えば、情報処理装置10Bが備えるディスプレイがタッチパネル式のディスプレイである場合においては、ユーザによって所望のキーワードが表示された部分がタッチされることによって、任意のキーワードが指定される。情報処理装置10Bは、指定されたキーワードに関連する情報を、自らの情報処理装置10Bが備えるディスプレイに表示する。
以上により、観覧者は、例えば、映像コンテンツの映像に含まれる文字(キーワード)に関連する情報を、情報処理装置10Bによって参照することができる。
また、コンテンツ再生装置30は、例えば、辞書IDを示すデータを情報処理装置10Bの取得部101へ向けて送信することがある。辞書IDとは、情報処理装置10Bが文字認識をする際に使用する辞書を、一意に特定するための識別子である。辞書IDを示すデータは、例えば、映像コンテンツを構成するシーン(場面)が切り替わったタイミングで出力される。情報処理装置10Bには、映像コンテンツを構成するシーン(場面)毎にそれぞれ異なる辞書が記憶されている。
以上の構成により、コンテンツ再生装置30は、辞書IDを示すデータを情報処理装置10Bへ送信することによって、情報処理装置10Bが文字認識をする際に使用する辞書を、映像コンテンツを構成するシーン(場面)毎に切り替えさせることができる。
(情報処理装置10Bの構成)
次に、本発明の第2の実施形態に係る情報処理装置10Bの構成の一例について、図を用いて説明する。
図7は、本発明の第2の実施形態に係る情報処理装置10Bの構成の一例を示すブロック図である。
情報処理装置10Bは、取得部101と、抽出部102と、辞書指定部103と、検索部104と、記憶部105と、出力制御部106と、出力部107と、操作入力部108と、履歴記憶部109と、通信部110と、を含んで構成される。
取得部101は、コンテンツ再生装置30が備えるディスプレイに表示された映像コンテンツの画像を取得する。取得部101は、例えば、情報処理装置10Bに内蔵されたカメラを含んで構成される。取得部101は、取得した画像を電気信号に変換し、抽出部102へ出力する。
抽出部102は、取得部101から取得した電気信号が示す画像に含まれる文字を文字認識する。抽出部102は、文字認識によって画像に含まれるキーワードを抽出する。
抽出部102は、抽出したキーワードに基づくテキストデータを検索部104へ出力する。
通信部110は、コンテンツ再生装置30から送信された辞書IDを示すデータを受信する。通信部110は、例えば、Wi−Fi(登録商標)接続によって無線LANルーターを介してコンテンツ再生装置30と通信接続するための通信インターフェースである。
辞書IDを示すデータは、例えば、コンテンツ再生装置30が再生する映像コンテンツのシーン(場面)が切り替わったタイミングで、コンテンツ再生装置30から、情報処理装置10Bの通信部110へ送信される。
通信部110は、受信した辞書IDを示すデータを辞書指定部103へ出力する。
なお、コンテンツ再生装置30が、再生する映像コンテンツの映像に関連するキーワードに基づくテキストデータを、情報処理装置10Bへ送信することも可能であるような構成であってもよい。その場合、通信部110は、コンテンツ再生装置30から、キーワードに基づくテキストデータを受信する。そして、通信部110は、受信したテキストデータを、直接、検索部104へ出力する。
辞書指定部103は、通信部110から取得した辞書IDを示すデータを、検索部104へ出力する。
検索部104は、抽出部102、または通信部110から取得したテキストデータが示すキーワードが、後述する記憶部105に記憶された構成要素関連情報データベース中に存在するか否かを検索する。
記憶部105は、構成要素関連情報データベースを、コンテンツの内容が属する分野毎に記憶する。記憶部105は、例えば、HDD、フラッシュメモリ、EEPROM、ROM、RAM、又はそれらの任意の組み合わせを含んで構成される。
構成要素関連情報データベースは、コンテンツ構成要素と、そのコンテンツ構成要素に関連する情報である構成要素関連情報と、を対応付けて記憶するデータベースである。構成要素関連情報データベースは、例えば、辞書であり、キーワードとそのキーワードの意味を解説する解説文とを対応付けて記憶するデータベースである。
また、検索部104は、辞書指定部103から取得した辞書IDを示すデータに基づいて、検索対象にする構成要素関連情報データベースを決定する。
検索部104は、抽出部102、または通信部110から取得したテキストデータが示すキーワードが、記憶部105に記憶された、構成要素関連情報データベース中に存在した場合、そのキーワードを示すテキストデータを出力制御部106へ出力する。
出力制御部106は、検索部104から取得したテキストデータに基づくキーワードを含む画像を、出力部107に表示させる。また、出力制御部106は、検索部104から取得したテキストデータに基づくキーワードを、後述する履歴記憶部109へ出力する。
出力部107は、出力制御部106から取得したデータに基づく情報を出力する。例えば、出力部107は、出力制御部106から取得したデータに基づく画像を表示する。出力部107はディスプレイ、例えば、液晶ディスプレイ、有機ELディスプレイ、等を含んで構成される。
操作入力部108は、ユーザ(観覧者)による各種の操作入力を受け付ける。操作入力部108は、受け付けた各種の操作入力に基づく操作信号を出力する。各種の操作入力に基づく操作信号とは、例えば、出力部107に出力されたキーワードの中の1つがユーザによって指定されたことを示す操作信号、及びタイムライン表示に表示されている画面表示をスクロールさせる操作をユーザが行ったことを示す操作信号、等である。
操作入力部108は、例えば、情報処理装置10Bに備えられた操作ボタンやタッチパネル、操作用コントローラー、または、リモートコントローラーや携帯型端末等の外部の機器から操作信号を取得することができる入力インターフェース、等を含んで構成される。
出力部107に表示したキーワードの1つが、操作入力部108を介してユーザにより指定された場合、操作入力部108は、指定されたキーワードを示す操作信号を出力制御部106へ出力する。
出力制御部106は、検索部104を介して、操作入力部108から取得した操作信号が示すキーワードを検索キーとして、記憶部105に記憶されている構成要素関連情報データベースを検索する。出力制御部106は、検索部104を介して、検索したキーワード(コンテンツ構成要素)に対応する解説文(構成要素関連情報)を示すテキストデータを取得する。
出力制御部106は、取得したテキストデータに基づく解説文を、出力部107に表示させる。また、出力制御部106は、取得したテキストデータを履歴記憶部109へ出力する。
履歴記憶部109は、出力制御部106が出力部107に表示させたキーワードを示すデータ、及び解説文を示すデータを、出力制御部106から取得する。すなわち、履歴記憶部109は、出力部107に表示されたキーワード、及び解説文を、表示履歴として記憶する。履歴記憶部109は、例えば、HDD、フラッシュメモリ、EEPROM、ROM、RAM、又はそれらの任意の組み合わせを含んで構成される。
(辞書IDを示すデータの送信例)
次に、情報処理装置10Bが検索対象とする辞書を指定するために、コンテンツ再生装置30が送信する辞書IDを示すデータの送信の一例について、図を用いて説明する。
図8は、本発明の第2の実施形態に係るコンテンツ再生装置30が送信するデータの一例を示す概略図である。
図8に示す概略図は、コンテンツ再生装置30が再生する映像コンテンツに含まれる映像の場面(シーン)が切り替わる毎に、コンテンツ再生装置30から情報処理装置10へ送信される辞書IDを示すデータの一例を示している。図8の左側の「OPENING」の映像から、図8の右側へ向かって「SCENE1」、「SCENE2」、「SCENE3」、「SCENE4」、「CREDIT」の順番で、映像コンテンツに含まれる映像が流れる(再生される)ことを示す。
図8の「OPENING」の映像の下には矢印が引かれ、その先に「open01jp」と記載されている。これは、映像コンテンツの中の「OPENING」の映像の再生が開始されると、まず「open01jp」という辞書IDを示すデータが、コンテンツ再生装置30から情報処理装置10Bの通信部110へ送信されることを表す。
情報処理装置10Bの辞書指定部103は、通信部110が受信したデータに基づく辞書IDによって、検索部104が検索対象とする辞書を特定する。
次に、「SCENE1」の映像の下には矢印が引かれ、その先に「edo01jp」と記載されている。これは、映像コンテンツの中の場面(シーン)が「OPENING」から「SCENE1」へ切り替わった際に、「edo01jp」という辞書IDを示すデータが、コンテンツ再生装置30から情報処理装置10Bの通信部110へ送信されることを表す。「SCENE2」以降についても同様の処理であるため、説明を省略する。
以上、説明したように、第2の実施形態に係るコンテンツ再生装置30は、例えば、再生する映像コンテンツの場面(シーン)が切り替わったタイミングで、情報処理装置10Bへ、辞書IDを示すデータを送信する。送信される辞書IDは、切り替わった場面(シーン)の内容に対応する辞書に付与された辞書IDである。
それにより、第2の実施形態に係る情報処理装置10Bは、例えば、再生する映像コンテンツの場面(シーン)が切り替わったタイミングで、検索する辞書を再指定することができる。そして、情報処理装置10Bは、コンテンツ再生装置30で再生されている映像コンテンツのそれぞれの場面(シーン)に対応した辞書を検索対象として、情報処理装置10は文字認識を行うことができる。
(情報処理装置10Bの動作)
次に、第2の実施形態に係る情報処理装置10Bの動作について説明する。
図9は、本発明の第1の実施形態に係る情報処理装置10Bの動作の一例を示すフローチャートである。
本フローチャートは、情報処理装置10Bが起動し、映像コンテンツの再生が開始された際に開始する。
(ステップS201)映像コンテンツの再生が開始され、取得部101(カメラ)は、映像コンテンツの映像に含まれる画像の取得を開始する。取得部101は、取得した画像を示す画像データを、抽出部102へ出力する。その後、ステップS202へ進む。
(ステップS202)情報処理装置10Bの辞書指定部103は、まず全ての辞書を検索対象とすることを示すデータを検索部104へ出力する。例えば、辞書指定部103は、全ての辞書に対応する辞書IDを示すデータを検索部104へ出力することによって、検索部104に全ての辞書を検索対象にさせるようにする構成にしてもよい。その後、ステップS203へ進む。
(ステップS203)通信部110が、コンテンツ再生装置30から辞書IDを示すデータを取得した場合、通信部110は、取得したデータを辞書指定部103へ出力する。その後、ステップS204へ進む。通信部110が、コンテンツ再生装置30から辞書IDを示すデータを取得していない場合は、ステップS205へ進む。
(ステップS204)辞書指定部103は、取得したデータに基づいて、検索対象とする辞書を決定する。辞書指定部103は、決定した辞書に対応する辞書IDを示すデータを検索部104へ出力する。その後、ステップS205へ進む。
(ステップS205)抽出部102は、取得部101から取得する画像データに基づく画像に含まれる文字の文字認識を行う。抽出部102は、文字認識によって、画像に含まれるキーワードの抽出を試みる。その後、ステップS206へ進む。
(ステップS206)抽出部102が、キーワードを抽出した場合、抽出部102は、抽出したキーワードを示すテキストデータを、検索部104へ出力する。その後、ステップS207へ進む。抽出部102が、キーワードを抽出していない場合は、ステップS210へ進む。
(ステップS207)検索部104は、抽出部102から取得したテキストデータが示すキーワードを検索キーとして、記憶部105に記憶された構成要素関連情報データベースを検索する。その後、ステップS208へ進む。
(ステップS208)検索キーとしたキーワードと同一のキーワードが構成要素関連情報データベースに存在した場合には、検索部104は、検索キーとしたキーワードに対応付けられた解説文に基づくテキストデータを構成要素関連情報データベースから取得する。検索部104は、取得したテキストデータを、出力制御部106へ出力する。その後、ステップS209へ進む。検索キーとしたキーワードと同一のキーワードが構成要素関連情報データベースに存在しなかった場合には、ステップS210へ進む。
(ステップS209)出力制御部106は、通し番号と、検索部104から取得したテキストデータが示すキーワード及び解説文と、を出力部107のディスプレイの第1表示領域(タイムライン形式で表示する表示領域)に表示させる。その後、ステップS210へ進む。
(ステップS210)ユーザによって、操作入力部108を介して、出力部107のディスプレイの第1表示領域に表示されたキーワードの1つが指定された場合、操作入力部108は、第1表示領域に表示されたキーワードの1つが指定されたことを示す操作信号を、出力制御部106へ出力する。その後、ステップS211へ進む。第1表示領域に表示されたキーワードが指定されていない場合は、ステップS212へ進む。
(ステップS211)出力制御部106は、操作入力部108から取得した操作信号に基づいて、出力部107のディスプレイに第2表示領域を生成させる。また、それに伴って、出力制御部106は、第1表示領域を縮小させる。出力制御部106は、操作入力部108から取得した操作信号が示すキーワードと、そのキーワードに対応する解説文の全文を、生成した第2表示領域に表示させる。その後ステップS212へ進む。
(ステップS212)ユーザによって、操作入力部108を介して、出力部107のディスプレイに表示された第2表示領域の1つを消去させることを示す操作入力がなされた場合、操作入力部108は、第2表示領域の1つを消去することを示す操作信号を、出力制御部106へ出力する。その後、ステップS213へ進む。第2表示領域の1つを消去させることを示す操作入力がなされていない場合は、ステップS214へ進む。
(ステップS213)出力制御部106は、操作入力部108から取得した操作信号に基づいて、出力部107のディスプレイに表示された第2表示領域の1つを消去させる。また、それに伴って、出力制御部106は、第1表示領域を再び拡大させる。その後ステップS214へ進む。
(ステップS214)映像コンテンツの再生が終了した場合、本フローチャートの処理を終了する。そうでない場合は、ステップS203へ戻り、引き続き抽出部102はキーワードの抽出を継続する。
なお、講演が終了した場合、上述したユーザからのリクエスト情報、またはフィードバック情報を示す2次元バーコードを出力部107に表示するようにしてもよい。
以上、説明したように、本発明の第2の実施形態に係る情報処理装置10Bは、再生されている映像コンテンツの場面(シーン)毎の辞書を、文字認識におけるキーワードの検索に使用する。それにより、特に、例えば文化財の展示会等のように、コンテンツに専門用語を多く含み、予めコンテンツに含まれるキーワードを絞り込むことが可能である場面において、広範な分野の語句が多数登録された汎用的な辞書を検索に使用する場合に比べて、情報処理装置10Bは、キーワードの認識率の低下を抑えることができる。
以上により、第2の実施形態に係る情報処理装置10Bは、コンテンツに含まれるキーワードの認識率の低下を抑えつつ、キーワードに関連する情報をユーザへ提供することができる。
以上、この発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
なお、上述した実施形態における情報処理装置10A、または情報処理装置10Bの一部又は全部をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
なお、ここでいう「コンピュータシステム」とは、情報処理装置10A、または情報処理装置10Bに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信回線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した実施形態における情報処理装置10A、または情報処理装置10Bを、LSI(Large Scale Integration)等の集積回路として実現してもよい。情報処理装置10A、または情報処理装置10Bの各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
1・・・自動講演解説表示システム、2・・・自動映像解説表示システム、10・・・情報処理装置、10A・・・情報処理装置、10B・・・情報処理装置、20・・・マイクロフォン、21・・・スピーカー、22・・・パーソナルコンピュータ、30・・・コンテンツ再生装置、101・・・取得部、102・・・抽出部、103・・・辞書指定部、104・・・検索部、105・・・記憶部、106・・・出力制御部、107・・・出力部、108・・・操作入力部、109・・・履歴記憶部、110・・・通信部

Claims (9)

  1. コンテンツに含まれるコンテンツ構成要素を抽出する抽出部と、
    前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶部と、
    前記抽出部が抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索部と、
    前記抽出部が抽出した前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記抽出部が抽出した前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力部と、
    を備えることを特徴とする、情報処理装置。
  2. 前記出力部は、前記抽出部が抽出した前記コンテンツ構成要素を表示する第1表示領域と、前記抽出部が抽出した前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を表示する第2表示領域と、を有する、
    ことを特徴とする、請求項1に記載の情報処理装置。
  3. 前記抽出部が抽出した複数の前記コンテンツ構成要素を、前記出力部はタイムライン形式で前記第1表示領域に表示する、
    ことを特徴とする、請求項2に記載の情報処理装置。
  4. 前記検索部が検索する前記構成要素関連情報データベースの分野を指定する辞書指定部、を備え、
    前記検索部は、前記辞書指定部が指定する前記分野の前記構成要素関連情報データベースを検索する、
    ことを特徴とする、請求項1に記載の情報処理装置。
  5. 前記辞書指定部は、前記コンテンツに含まれる場面が切り替わった場合に、前記検索部が検索する前記構成要素関連情報データベースの前記分野を再指定する、
    ことを特徴とする、請求項4に記載の情報処理装置。
  6. 前記出力部が出力した前記コンテンツ構成要素と、前記出力部が出力した前記コンテンツ構成要素に対応付けられた前記構成要素関連情報と、を記憶する履歴記憶部、
    を備えることを特徴とする、請求項1に記載の情報処理装置。
  7. 前記抽出部は、前記コンテンツに含まれる前記コンテンツ構成要素を、音声認識、または文字認識によって抽出する、
    ことを特徴とする、請求項1に記載の情報処理装置。
  8. コンテンツに含まれるコンテンツ構成要素を抽出する抽出ステップと、
    前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶ステップと、
    前記抽出ステップにおいて抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索ステップと、
    前記抽出ステップにおいて抽出した前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記抽出ステップにおいて抽出した前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力ステップと、
    を有することを特徴とする、情報処理方法。
  9. コンピュータに、
    コンテンツに含まれるコンテンツ構成要素を抽出する抽出ステップと、
    前記コンテンツの内容に基づく分野別に、前記コンテンツ構成要素と、前記コンテンツ構成要素に関連する情報である構成要素関連情報と、が対応付けられた構成要素関連情報データベースを記憶する記憶ステップと、
    前記抽出ステップにおいて抽出した前記コンテンツ構成要素を検索キーとして前記構成要素関連情報データベースを検索する検索ステップと、
    前記抽出ステップにおいて抽出した前記コンテンツ構成要素が前記構成要素関連情報データベースに存在する場合、前記抽出ステップにおいて抽出した前記コンテンツ構成要素を出力し、出力した前記コンテンツ構成要素が指定された場合、指定された前記コンテンツ構成要素に対応付けられた前記構成要素関連情報を出力する出力ステップと、
    を実行させるための、プログラム。
JP2015116343A 2015-06-09 2015-06-09 情報処理装置、情報処理方法、及びプログラム Active JP6641732B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015116343A JP6641732B2 (ja) 2015-06-09 2015-06-09 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015116343A JP6641732B2 (ja) 2015-06-09 2015-06-09 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017004193A true JP2017004193A (ja) 2017-01-05
JP6641732B2 JP6641732B2 (ja) 2020-02-05

Family

ID=57754218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015116343A Active JP6641732B2 (ja) 2015-06-09 2015-06-09 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6641732B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022149398A1 (ja) * 2021-01-05 2022-07-14 株式会社Nttドコモ 情報処理装置
WO2023248677A1 (ja) * 2022-06-22 2023-12-28 株式会社Jvcケンウッド 情報表示制御装置および情報表示方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203294A (ja) * 1998-01-08 1999-07-30 Nec Corp 情報検索システム、装置、方法及び記録媒体
JPH11250068A (ja) * 1998-03-05 1999-09-17 Omron Corp 情報処理装置および方法、並びに記録媒体
JP2006190060A (ja) * 2005-01-06 2006-07-20 Kyocera Mita Corp データベース検索方法、データベース検索プログラムおよび原稿処理機
JP2007148976A (ja) * 2005-11-30 2007-06-14 Toshiba Corp 関連情報検索装置
JP2007264128A (ja) * 2006-03-27 2007-10-11 Toshiba Corp 音声認識装置及びその方法
WO2014006690A1 (ja) * 2012-07-03 2014-01-09 三菱電機株式会社 音声認識装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203294A (ja) * 1998-01-08 1999-07-30 Nec Corp 情報検索システム、装置、方法及び記録媒体
JPH11250068A (ja) * 1998-03-05 1999-09-17 Omron Corp 情報処理装置および方法、並びに記録媒体
JP2006190060A (ja) * 2005-01-06 2006-07-20 Kyocera Mita Corp データベース検索方法、データベース検索プログラムおよび原稿処理機
JP2007148976A (ja) * 2005-11-30 2007-06-14 Toshiba Corp 関連情報検索装置
JP2007264128A (ja) * 2006-03-27 2007-10-11 Toshiba Corp 音声認識装置及びその方法
WO2014006690A1 (ja) * 2012-07-03 2014-01-09 三菱電機株式会社 音声認識装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岡本 健吾: "会話中の名詞の関連情報を用いた対面型異文化間コミュニケーション支援システムの構築と評価", 情報処理学会論文誌, vol. 52, no. 3, JPN7019001866, 15 March 2011 (2011-03-15), JP, pages 1213 - 1223, ISSN: 0004052841 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022149398A1 (ja) * 2021-01-05 2022-07-14 株式会社Nttドコモ 情報処理装置
WO2023248677A1 (ja) * 2022-06-22 2023-12-28 株式会社Jvcケンウッド 情報表示制御装置および情報表示方法

Also Published As

Publication number Publication date
JP6641732B2 (ja) 2020-02-05

Similar Documents

Publication Publication Date Title
US20080079693A1 (en) Apparatus for displaying presentation information
CN112752121B (zh) 一种视频封面生成方法及装置
CN109274999A (zh) 一种视频播放控制方法、装置、设备及介质
US11496806B2 (en) Content providing server, content providing terminal, and content providing method
CN113010698B (zh) 多媒体的交互方法、信息交互方法、装置、设备及介质
WO2019011295A1 (zh) 负一屏内容推送及请求方法、装置、服务器及终端
CN112653902A (zh) 说话人识别方法、装置及电子设备
CN113411516B (zh) 视频处理方法、装置、电子设备及存储介质
CN104461348A (zh) 信息选取方法及装置
CN105808231B (zh) 录制与播放脚本的系统及方法
JP2008048204A (ja) 情報処理装置、情報処理システム及び情報処理プログラム
WO2019146466A1 (ja) 情報処理装置、動画検索方法、生成方法及びプログラム
JP6641732B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2018005011A (ja) プレゼンテーション支援装置、プレゼンテーション支援システム、プレゼンテーション支援方法及びプレゼンテーション支援プログラム
CN106936830B (zh) 一种多媒体数据的播放方法和装置
CN105162839A (zh) 数据处理方法、装置及系统
CN110110144A (zh) 视频的处理方法和设备
JP2016063477A (ja) 会議システム、情報処理方法、及びプログラム
JP7196393B2 (ja) 情報提示装置、情報提示システム、情報提示方法およびプログラム
CN111225250B (zh) 视频的扩展信息处理方法及装置
JP5342509B2 (ja) コンテンツ再生装置、コンテンツ再生装置の制御方法、制御プログラム、及び記録媒体
CN113259754B (zh) 视频生成方法、装置、电子设备及存储介质
CN111726659B (zh) 一种视频的轮播方法、装置、电子设备及存储介质
CN110786019B (zh) 服务器及其控制方法
JP6638281B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150610

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180518

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191216

R150 Certificate of patent or registration of utility model

Ref document number: 6641732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250