JP5691654B2 - 表示制御装置、表示制御方法、および表示制御プログラム - Google Patents

表示制御装置、表示制御方法、および表示制御プログラム Download PDF

Info

Publication number
JP5691654B2
JP5691654B2 JP2011046823A JP2011046823A JP5691654B2 JP 5691654 B2 JP5691654 B2 JP 5691654B2 JP 2011046823 A JP2011046823 A JP 2011046823A JP 2011046823 A JP2011046823 A JP 2011046823A JP 5691654 B2 JP5691654 B2 JP 5691654B2
Authority
JP
Japan
Prior art keywords
text area
text
unit
document
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011046823A
Other languages
English (en)
Other versions
JP2012185567A (ja
Inventor
英樹 小島
英樹 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011046823A priority Critical patent/JP5691654B2/ja
Publication of JP2012185567A publication Critical patent/JP2012185567A/ja
Application granted granted Critical
Publication of JP5691654B2 publication Critical patent/JP5691654B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、表示装置への情報の表示を制御する表示制御装置、表示制御方法、および表示制御プログラムに係わる。
E−ラーニング、プレゼンテーション等のために、情報の表示と連動して、その表示内容を説明する合成音声を提供する技術が実用化されてきている。このとき、ユーザにとっては、合成音声が表示内容のどの部分について説明しているのかが分かると便利である。例えば、合成音声による文書読上げの進行に連動して、読み上げられている文書の内容に対応する領域が強調表示されると、利便性が向上する。
関連する技術として、下記の文書読上げ装置が提案されている。文書読上げ装置は、単語を登録した単語辞書記憶部と、単語辞書記憶部を用いて文書データを日本語解析する日本語解析部と、日本語解析部の解析結果を基に音声データを生成する音声データ生成部と、生成された音声データ及び少なくとも読上げ速度の制御情報を受けて音声合成を行なう音声合成部と、音声合成部で得た音声信号を拡声して文書データを読上げるスピーカと、読上げ速度の制御情報に基づき、スピーカでの拡声に同期して文書データの該当部分を表示部で表示させる表示処理部と、音声合成部における残る音声データ量及び読上げ速度の制御情報により読上げに要する残り時間を算出し、表示処理部による文書データと共に表示部で表示させる読上げ残量処理部、を備える。(例えば、特許文献1)
また、他の関連する技術として、下記の文書読上げ装置が提案されている。文書読上げ装置においては、文書データの日本語解析および音声合成を通して文書の読み上げを行うメインルーチンに、読み上げを行う文書中の任意の単語をオペレータが指定してこの単語の読みを変更するためのサブルーチンを付加し、このサブルーチンはメインルーチンの実行中に割り込み処理として実行される。(例えば、特許文献2)
特開平7−181992号公報 特開平6−202843号公報
合成音声で読み上げられる文書の内容に応じて、表示装置上の画像内で対応する領域を強調表示するためには、読み上げられている文書と表示されている領域との対応関係を予め設定しておく必要がある。しかしながら、従来技術においては、上述の対応関係は、人間が手作業で作成していた。このため、音声内容に連動して表示が変化するコンテンツを作成するためには、多大なコストが発生し、また、その作成に要する時間も長くなっていた。
本発明の課題は、音声出力に連動して対応する領域が強調される表示を容易に実現する表示制御装置、表示制御方法、表示制御プログラムを提供することである。
本発明の1つの態様の表示制御装置は、表示データからテキストを含むテキスト領域を抽出するテキスト領域抽出部と、前記テキスト領域抽出部により抽出された各テキスト領域内の文字列、および読上げ原稿データに含まれる各原稿要素の文字列を形態素に分割し、各形態素に品詞を付与する形態素解析部と、前記形態素解析部により得られる形態素から、予め決められた特定の品詞を有する特定単語を抽出する特定単語抽出部と、前記特定単語抽出部により抽出された特定単語を利用して、各テキスト領域と各原稿要素との間の相関をそれぞれ計算する相関計算部と、前記相関計算部により計算される相関に基づいて、テキスト領域と原稿要素との間の対応関係を表す対応関係情報を生成する対応関係決定部と、前記読上げ原稿データから各原稿要素の音声データを生成する音声合成部と、前記対応関係情報に基づいて、前記音声データが出力される原稿要素に対応するテキスト領域を強調して表示する同期制御部、を有する。
本発明の1つの態様の表示制御方法は、コンピュータを利用して、表示データからテキストを含むテキスト領域を抽出し、前記抽出された各テキスト領域内の文字列、および読上げ原稿データに含まれる各原稿要素の文字列を形態素に分割し、各形態素に品詞を付与し、前記形態素から、予め決められた特定の品詞を有する特定単語を抽出し、前記抽出された特定単語を利用して、各テキスト領域と各原稿要素との間の相関をそれぞれ計算し、前記相関に基づいて、テキスト領域と原稿要素との間の対応関係を表す対応関係情報を生成し、前記読上げ原稿データから各原稿要素の音声データを生成し、前記対応関係情報に基づいて、前記音声データが出力される原稿要素に対応するテキスト領域を強調して表示する。
上述の態様によれば、音声出力に連動して対応する領域が強調される表示を容易に実現できる。
実施形態の表示制御装置が使用されるシステムの一例を示す図である。 表示装置に表示される画像の一例を示す図である。 読上げ原稿データの一例を示す図である。 強調表示の一例を示す図である。 第1の実施形態の表示制御装置の構成を示す図である。 テキスト領域抽出部の処理を説明する図である。 各テキスト領域から得られる形態素解析の結果を示す図である。 各原稿要素から得られる形態素解析の結果を示す図である。 各テキスト領域から得られる自立語を示す図である。 各原稿要素から得られる自立語を示す図である。 相関計算部の処理を示すフローチャートである。 対応関係決定部の処理を示すフローチャートである。 第1の実施形態における処理結果を示す図である。 同期制御部の処理を示すフローチャートである。 第2の実施形態の表示制御装置の構成を示す図である。 係り受け解析の一例を示す図である。 文脈否定語辞書の一例を示す図である。 第2の実施形態における処理結果を示す図である。 第3の実施形態の表示制御装置の構成を示す図である。 位置情報スコア付加部の処理を示すフローチャートである。 (a)は位置情報スコアの実施例、(b)は第3の実施形態における処理結果を示す図である。 第4の実施形態の表示制御装置の構成を示す図である。 類似語辞書の一例を示す図である。 一致または類似する自律語をカウントする処理を示すフローチャートである。 第4の実施形態における処理結果を示す図である。 表示制御装置を実現するためのコンピュータシステムのハードウェア構成を示す図である。
図1は、実施形態の表示制御装置が使用されるシステムの一例を示す。表示制御装置1は、例えば、パーソナルコンピュータ等のコンピュータにより実現される。また、表示制御装置1には、表示装置2およびスピーカ3が接続されている。表示装置2は、例えば液晶表示装置であり、表示制御装置1から与えられる画像データを表示する。また、スピーカ3は、表示制御装置1から与えられる音声データを出力する。表示制御装置1は、図示しないが、ネットワークに接続されるようにしてもよい。
表示制御装置1には、表示データ4および読上げ原稿データ5が入力される。表示データ4および読上げ原稿データ5は、例えば、着脱可能な記録媒体を利用して表示制御装置1に与えられる。或いは、表示データ4および読上げ原稿データ5は、例えば、他のコンピュータからネットワークを介して表示制御装置1に入力されるようにしてもよい。
表示制御装置1は、表示データ4により表わされる画像を表示装置2に表示する。図2は、表示データ4に従って表示装置2に表示される画像の一例を示す。この例では、表示データ4は、下記の5つのテキスト要素を含む。
0:40代をとりまく経済的不安要因
1:増税が心配です
2:家のローンは大丈夫か?
3:自動車ローンもある
4:子供の養育費も結構かかる
なお、表示データ4は、画像フレーム内での各テキスト要素の位置、各テキスト要素のフォント、文字サイズ、色などを指定する情報を含むようにしてもよい。また、表示データ4は、他の画像要素を表す情報を含むようにしてもよい。
読上げ原稿データ5は、表示データ4に対応して作成されるテキストデータである。すなわち、読上げ原稿データ5の文書は、表示データ4により表わされる画像の内容を説明する。図3は、読上げ原稿データ5の文書の一例を示す。この例では、読上げ原稿データ5は、6つの原稿要素(文0〜文5)を含んでいる。また、この例では、1つの原稿要素が1つの文に対応しているが、1つの原稿要素が2以上の文を含んでもよい。
表示制御装置1は、表示データ4および読上げ原稿データ5が入力されると、図2に示す画像を表示装置2に表示すると共に、図3に示す文0〜文5の合成音声を生成してスピーカ3を利用して出力する。このとき、表示制御装置1は、読上げ原稿データ5の合成音声の進行に応じて(すなわち、読上げ原稿データ5の再生位置に応じて)、表示装置2に表示される画像を変化させる。例えば、図4に示すように、文3「更に、住宅のローンの返済が滞っていて、まだ終了していない人もいるでしょう。」の合成音声が出力されているときは、表示制御装置1は、表示装置2の画面上で、「家のローンは大丈夫か?」を含む領域を強調表示する。なお、強調表示は、特定の領域が他の領域から識別可能に表示されることを意味し、様々な方法により実現され得る。例えば、強調表示は、特に限定されるものではないが、対象テキストに下線を引く処理、対象テキストの文字サイズまたは字体を変更する処理、対象領域の色を変更する処理、対象領域を点滅させる処理、対象領域を拡大する処理などにより実現される。
このように、表示制御装置1は、音声データに連動して表示装置2の画面上の画像を変化させる。一例としては、表示制御装置1は、合成音声が説明している内容に対応する画像領域を強調表示する。
<第1の実施形態>
図5は、第1の実施形態の表示制御装置の構成を示す。第1の実施形態の表示制御装置1は、図5に示すように、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、相関計算部14、対応関係決定部15、音声合成部16、同期制御部17を備える。そして、表示制御装置1には、表示資料および読上げ原稿が与えられる。表示資料は、上述した表示データ4に相当し、読上げ原稿は、上述した読上げ原稿データ5に相当する。
テキスト領域抽出部11は、表示資料の中から文字列を含む領域を抽出する。以下の記載では、表示資料中の文字列を含む各領域を「テキスト領域」と呼ぶことにする。たとえば、表示制御装置1に図2に示す画像を表す表示資料が入力されると、テキスト領域抽出部11は、図6に示すように、5つのテキスト領域を抽出する。そして、テキスト領域抽出部11は、抽出した各テキスト領域に対して識別番号を付与する。この例では、文字列「40代をとりまく経済的不安要因」を含む領域に対して「0」が付与され、文字列「増税が心配です」を含む領域に対して「1」が付与され、文字列「家のローンは大丈夫か?」を含む領域に対して「2」が付与され、文字列「自動車ローンもある」を含む領域に対して「3」が付与され、文字列「子供の養育費も結構かかる」を含む領域に対して「4」が付与されている。
形態素解析部12は、テキスト領域抽出部11により抽出された各テキスト領域内の文字列をそれぞれ形態素に分割する。また、形態素解析部12は、読上げ原稿に含まれる各原稿要素の文字列もそれぞれ形態素に分割する。そして、形態素解析部12は、上述のようにして得られる各形態素にそれぞれ品詞を付与する。なお、図5においては、形態素解析部12は、表示資料中の各文字列を形態素に分解する形態素解析部12a、および読上げ原稿中の各文字列を形態素に分解する形態素解析部12bを備えているが、形態素解析部12の構成(或いは、処理手順)は特に限定されるものではない。
図7および図8は、形態素解析部12により得られる解析結果を示す。図7は、テキスト領域抽出部11により表示資料から抽出された各テキスト領域内の文字列から得られる形態素解析の結果を示す。また、図8は、読上げ原稿に含まれる各原稿要素の文字列から得られる形態素解析の結果を示す。
例えば、表示資料のテキスト領域1は、文字列「増税が心配です」を含んでいる。この場合、形態素解析部12は、形態素解析により、この文字列を4つの形態素「増税」「が」「心配」「です」に分解する。そして、形態素解析部12は、下記の通り、各形態素の品詞を判定する。
増税:名詞
が:助詞
心配:形容動詞
です:助動詞
なお、文字列を形態素に分解する方法、および各形態素の品詞を判定する方法は、様々な手順が知られている。形態素解析部12は、任意の方法で形態素解析を実行することができる。
自立語抽出部13は、形態素解析部12により得られる形態素から自立語を抽出する。ここで、「自立語」は、それ単体で意味を有する単語である。すなわち、名詞、動詞、形容詞、形容動詞、副詞、代名詞、接続詞は、自立語に含まれる。したがって、自立語抽出部13は、形態素解析部12により得られる形態素から、助詞、助動詞などを除去する。ただし、本明細書においては、「自立語」は、日本語文法において定義される自立語ではなく、予め決められた特定の品詞を有する単語(特定単語または特定品詞単語)を意味するものとする。この例では、自立語抽出部13は、「自立語」として、形態素解析部12により得られる形態素から、名詞、動詞、形容詞、形容動詞、副詞を抽出するものとする。すなわち、自立語抽出部13は、形態素解析部12により得られる形態素から、代名詞、接続詞も除去する。
なお、図5においては、自立語抽出部13は、表示資料内の各文字列から自立語を抽出する自立語抽出部13a、および読上げ原稿中の各文字列から自立語を抽出する自立語抽出部13bを備えているが、自立語抽出部13の構成(或いは、処理手順)は特に限定されるものではない。
図9および図10は、自立語抽出部13により得られる抽出結果を示す。図9は、表示資料内の各文字列から抽出される自立語を示す。また、図10は、読上げ原稿に含まれる各原稿要素の文字列から抽出される自立語を示す。
例えば、表示資料のテキスト領域1からは、形態素解析部12により4つの形態素「増税(名詞)」「が(助詞)」「心配(形容動詞)」「です(助動詞)」が得られている。この場合、自立語抽出部13は、上記4つの形態素から「が(助詞)」および「です(助動詞)」を除去し、「増税(名詞)」および「心配(形容動詞)」を抽出する。
相関計算部14は、自立語抽出部13により抽出された自立語を利用して、各テキスト領域と各原稿要素との間の相関をそれぞれ計算する。相関計算部14の処理のフローチャートを図11に示す。なお、この例では、テキスト領域と原稿要素との間の相関は、テキスト領域および原稿要素が共通して有する自立語の個数で表わされる。
図11に示すフローチャートでは、読上げ原稿中の各原稿要素は変数Mで識別され、表示資料内の各テキスト領域は変数Nで識別される。また、変数Kは、N番目のテキスト領域から抽出された各自立語を識別し、変数Lは、M番目の原稿要素から抽出された各自立語を識別する。
ステップS1、S11は、読上げ原稿中の各原稿要素に対してステップS2〜S10の処理を実行するために設けられている。すなわち、相関計算部14は、すべての原稿要素に対してステップS2〜S10の処理を実行するまで、変数Mを1ずつインクリメントしながら、各原稿要素に対してステップS2〜S10の処理を実行する。変数Mの初期値はゼロである。したがって、図3に示す読上げ原稿が表示制御装置1に入力されると、相関計算部14は、文0〜文5に対してそれぞれステップS2〜S10の処理を実行する。
ステップS2、S10は、表示資料内の各テキスト領域に対してステップS3〜S9の処理を実行するために設けられている。すなわち、相関計算部14は、すべてのテキスト領域に対してステップS3〜S9の処理を実行するまで、変数Nを1ずつインクリメントしながら、各テキスト領域に対してステップS3〜S9の処理を実行する。変数Nの初期値はゼロである。したがって、図2に示す画像を表す表示資料が表示制御装置1に入力されると、相関計算部14は、テキスト領域0〜4に対してそれぞれステップS3〜S9の処理を実行する。
ステップS3において、相関計算部14は、一致個数[M][N]を格納するための配列をゼロに初期化する。なお、一致個数[M][N]は、M番目の原稿要素とN番目のテキスト領域との間で一致する自立語の個数を表す。また、一致個数[M][N]を格納するための配列は、表示制御装置1が備えるメモリ上に形成することができる。
ステップS4〜S9において、相関計算部14は、M番目の原稿要素とN番目のテキスト領域との間で一致する自立語の個数をカウントする。ここで、ステップS4、S9は、上述の変数Kを利用して、N番目のテキスト領域から抽出される各自立語に対してステップS5〜S8の処理を実行する。また、ステップS5、S8は、上述の変数Lを利用して、M番目の原稿要素から抽出される各自立語に対してステップS6〜S7の処理を実行する。ステップS6において、相関計算部14は、M番目の原稿要素から抽出されたK番目の自立語と、N番目のテキスト領域から抽出されたL番目の自立語とを互いに比較する。そして、これらの自立語が互いに一致していれば、相関計算部14は、ステップS7において、一致個数[M][N]を1だけインクリメントする。一方、これらの自立語が互いに一致していなければ、相関計算部14は、ステップS7の処理をスキップする。
一例を示す。ここでは、自立語抽出部13による抽出結果が図8および図10に示す通りであるものとする。また、読上げ原稿中の各原稿要素を文0〜文5を表記する。
例えば、M=1、N=1であるものとする。この場合、読上げ原稿の文1と表示資料のテキスト領域1との間で一致する自立語の個数がカウントされる。ここで、文1から抽出される自立語は以下の通りである。
文1:消費税、所得税、増税、税負担、増加、事、考え
また、テキスト領域1から抽出される自立語は以下の通りである。
領域1:増税、心配
このケースでは、文1とテキスト領域1との間で「増税」が一致している。したがって、相関計算部14は、一致個数[1][1]として「1」を出力する。
M=1、N=2であるときは、読上げ原稿の文1と表示資料のテキスト領域2との間で一致する自立語の個数がカウントされる。ここで、文1から抽出される自立語は以下の通りである。
文1:消費税、所得税、増税、税負担、増加、事、考え
また、テキスト領域2から抽出される自立語は以下の通りである。
領域2:家、ローン、大丈夫
このケースでは、文1とテキスト領域2との間で一致する自立語は存在しない。したがって、相関計算部14は、一致個数[1][2]として「0」を出力する。
M=4、N=2であるときは、読上げ原稿の文4と表示資料のテキスト領域2との間で一致する自立語の個数がカウントされる。ここで、文4から抽出される自立語は以下の通りである。
文4:家、ローン、以外、車、ローン、各種、ローン、ある
また、テキスト領域2から抽出される自立語は以下の通りである。
領域2:家、ローン、大丈夫
このケースでは、文4とテキスト領域2との間で「家」が一致する。また、領域2から抽出される「ローン」は、文4の2番目、5番目、7番目の自立語と一致する。よって、相関計算部14は、一致個数[4][2]として「4」を出力する。
相関計算部14は、表示資料内のテキスト領域0〜4と読上げ原稿中の文0〜5との間のすべての組合せについて、それぞれ、一致する自立語の個数をカウントする。相関計算部14により得られる一致個数[M][N]の計算結果を図13に示す。
対応関係決定部15は、相関計算部14により計算される相関の値(すなわち、一致する自立語の個数)に基づいて、テキスト領域と原稿要素との間の対応関係を表す対応関係情報を生成する。対応関係決定部15の処理のフローチャートを図12に示す。この例では、対応関係決定部15は、各原稿要素について、一致する自立語を最も多く有するテキスト領域を「対応するテキスト領域」として特定する。
ステップS21、S29は、読上げ原稿中の各原稿要素に対してステップS22〜S28の処理を実行するために設けられている。すなわち、対応関係決定部15は、すべての原稿要素に対してステップS22〜S28の処理を実行するまで、変数Mを1ずつインクリメントしながら、各原稿要素に対してステップS22〜S28の処理を実行する。変数Mの初期値はゼロである。したがって、図3に示す読上げ原稿が表示制御装置1に入力されると、対応関係決定部15は、文0〜5に対してそれぞれステップS22〜S28の処理を実行する。
ステップS22において、対応関係決定部15は、変数MAXをゼロに初期化すると共に、変数INDEXを−1に初期化する。変数MAXは、M番目の原稿要素と各テキスト領域との間で一致する自立語の個数の最大値を表す。また、変数INDEXは、変数MAXを与えるテキスト領域を識別する。すなわち、変数INDEXは、M番目の原稿要素との間で一致する自立語の個数が最大値となるテキスト領域を識別する。
ステップS23、S26は、表示資料内の各テキスト領域に対してステップS24〜S25の処理を実行するために設けられている。すなわち、対応関係決定部15は、すべてのテキスト領域に対してステップS24〜S25の処理を実行するまで、変数Nを1ずつインクリメントしながら、各テキスト領域に対してステップS24〜S25の処理を実行する。変数Nの初期値はゼロである。したがって、図2に示す画像を表す表示資料が表示制御装置1に入力されると、対応関係決定部15は、テキスト領域0〜4に対してそれぞれステップS24〜S25の処理を実行する。
ステップS24において、対応関係決定部15は、一致個数[M][N]と変数MAXとを比較する。一致個数[M][N]は、上述したように、M番目の原稿要素とN番目のテキスト領域との間で一致する自立語の個数を表す。そして、一致個数[M][N]が変数MAXよりも大きいときは、対応関係決定部15は、ステップS25において、変数MAXとして一致個数[M][N]の値を保持する。また、対応関係決定部15は、変数INDEXとして、N番目のテキスト領域を識別する「N」を保持する。したがって、すべてのテキスト領域についてステップS23〜S26を順番に実行することにより、M番目の原稿要素と各テキスト領域との間で一致する自立語の個数の最大値、およびその最大値が得られるテキスト領域が特定される。
ステップS27において、対応関係決定部15は、ステップS23〜S26において得られる変数MAXが予め決められた閾値以上であるか判定する。そして、変数MAXが閾値以上であれば、対応関係決定部15は、ステップS28において、読上げ原稿中のM番目の原稿要素に対して、変数INDEXにより識別される表示資料内のテキスト領域を対応付ける。一方、変数MAXが閾値よりも小さければ、対応関係決定部15は、ステップS28の処理をスキップする。この場合、M番目の原稿要素に対応するテキスト領域が存在しないと判定される。
なお、ステップS27の閾値判定処理は、対応関係の誤判定を減らすために設けられている。すなわち、この閾値判定処理を設けることにより、一致する自立語の個数が少ない原稿要素とテキスト領域とを対応付けないようにすることができる。ただし、この閾値を大きくし過ぎると、実際に対応している原稿要素とテキスト領域とのペアが検出されなくなる。したがって、この閾値は、適切に設定する必要がある。以下では、説明を簡単にするために、閾値=1とする。なお、実施形態の表示制御装置は、必ずしもステップS27の閾値判定処理を実行しなくてもよい。
図13を参照しながら一例を示す。ここでは、原稿要素「文1」について対応するテキスト領域を特定するものとする。この場合、文1と各テキスト領域0〜4との間で、一致する自立語の個数の最大となるテキスト領域が特定される。図13に示す例では、文1とテキスト領域0、2、3、4との間で一致する自立語の個数は、それぞれゼロであり、文1とテキスト領域1との間で一致する自立語の個数は、1である。そうすると、文1に対しては、テキスト領域1が最大一致個数を与え、且つ、この最大値が閾値以上である。したがって、この場合、対応関係決定部15は、対応関係情報において、文1に対してテキスト領域1を対応付ける。同様に、対応関係決定部15は、文2に対してテキスト領域4を対応付ける。
なお、図13に示す例では、例えば、文3とテキスト領域2、3との間で、一致する自立語の個数が同じである。この場合、図12に示すフローチャートにおいては、ステップS24〜S25の処理が先に実行されるテキスト領域が、対象となっている原稿要素に対応するテキスト領域として特定される。したがって、対応関係決定部15は、文3に対してテキスト領域2を対応付ける。同様に、対応関係決定部15は、文4に対してもテキスト領域2を対応付ける。
このように、対応関係決定部15は、各原稿要素に対して相関の高いテキスト領域を特定することにより、対応関係情報を生成する。生成された対応関係情報は、表示制御装置1が備えるメモリに格納される。
音声合成部16は、表示制御装置1に入力される読上げ原稿から音声データ(即ち、合成音声)を生成する。なお、テキストデータまたは文字列から音声データを生成する方法は、様々な手順が知られている。音声合成部16は、任意の方法で読上げ原稿から音声データを生成することができる。
同期制御部17は、対応関係決定部15により生成される対応関係情報に基づいて、音声合成部16により得られる音声データが出力される原稿要素に対応するテキスト領域を強調して表示する。すなわち、同期制御部17は、表示資料をユーザに提示する際に、読上げ原稿の各原稿要素の合成音声の出力に同期して、表示資料内の対応するテキスト領域を強調表示する。
図14は、同期制御部17の処理を示すフローチャートである。図14において、ステップS31、S38は、読上げ原稿中の各原稿要素に対してステップS32〜S37の処理を実行するために設けられている。すなわち、同期制御部17は、すべての原稿要素に対してステップS32〜S37の処理を実行するまで、変数Mを1ずつインクリメントしながら、各原稿要素に対してステップS32〜S37の処理を実行する。変数Mの初期値はゼロである。したがって、図3に示す読上げ原稿が表示制御装置1に入力されると、同期制御部17は、文0〜5に対してそれぞれステップS32〜S37の処理を実行する。
ステップS32〜S33において、同期制御部17は、対応関係決定部15により生成される対応関係情報を参照し、M番目の原稿要素に対応するテキスト領域を探す。M番目の原稿要素に対応するテキスト領域が特定されているときは、同期制御部17は、ステップS34〜S36を実行する。
ステップS34において、同期制御部17は、M番目の原稿要素に対応するテキスト領域を強調表示する。強調表示は、上述したように、たとえば、対象テキスト領域内の文字列に下線を引く処理、対象テキスト領域内の文字列の文字サイズまたは字体を変更する処理、対象テキスト領域の色を変更する処理、対象テキスト領域を点滅させる処理、対象テキスト領域を拡大する処理などにより実現される。これらの強調表示は、表示資料を表す表示データを補正することによって実現可能である。
ステップS35において、同期制御部17は、M番目の原稿要素の音声データを再生して出力する。なお、音声データは、音声合成部16によって生成されているものとする。そして、M番目の原稿要素の音声データの再生が終了すると、同期制御部17は、ステップS36において、M番目の原稿要素に対応するテキスト領域の強調表示を解除する。
なお、M番目の原稿要素に対応するテキスト領域が特定されていないときは(ステップS33:No)、同期制御部17は、ステップS37において、M番目の原稿要素の音声データを再生して出力する。この場合、テキスト領域の強調表示は行われない。
同期制御部17は、読上げ原稿中のすべての原稿要素について図14に示すフローチャートの処理を実行する。これにより、例えば、図13に示す対応関係情報が得られているときは、下記のようにして音声および表示が連携される。
読上げ原稿の文0に対しては、テキスト領域が対応付けられていない。このため、同期制御部17は、ステップS34〜S36ではなくステップS37を実行する。すなわち、文0の音声データが再生されるとき、表示装置2の画面上で表示資料に対する強調表示は行われない。
読上げ原稿の文1に対しては、テキスト領域1が対応付けられている。この場合、同期制御部17は、ステップS34〜S36を実行する。この結果、文1の音声データが再生されるとき、表示装置2の画面上で表示資料内のテキスト領域1が強調して表示される。同様に、文2、文3、文4の音声データが再生されるときは、それぞれテキスト領域4、テキスト領域2、テキスト領域2が強調表示される。最後に、文5の音声データが再生されるときは、強調表示は行われない。
このように、第1の実施形態の表示制御装置は、各原稿要素および各テキスト領域内の特定の品詞を有する特定単語(実施例では、自立語)を利用して、原稿要素とテキスト領域との対応関係を決定する。すなわち、第1の実施形態の表示制御装置においては、原稿要素とテキスト領域との対応関係を決定する際に、付属語(助詞、助動詞、接続詞、代名詞など)が除去される。
ここで、付属語を除去することなく、形態素解析部12によって得られるすべての形態素を利用して原稿要素とテキスト領域との対応関係を決定する構成を想定する。この構成では、各テキスト領域または各原稿要素の意味内容と直接的に関係のない語も考慮して対応関係が決定されてしまう。例えば、助詞「の」は、テキスト領域2に含まれると共に、文1、文2、文3、文4、文5に、それぞれ、1つ、2つ、2つ、3つ、2つ含まれている。この場合、テキスト領域2と文0〜文5との対応関係の決定は、テキスト領域または原稿要素の意味内容と直接的に関係のない助詞「の」に依存してしまう。すなわち、この構成では、不適切な対応関係が得られるおそれがある。
そこで、第1の実施形態の表示制御装置は、各テキスト領域または各原稿要素の意味内容と関連性が強い特定単語を抽出し、それらの特定単語を利用して原稿要素とテキスト領域との対応関係を決定する。このため、第1の実施形態の構成または方法によれば、原稿要素とテキスト領域の対応付けの精度が高くなる。
なお、上述の実施例では、図2、図3、図13に示すように、文1〜文3についての対応付けは適切であるが、文4についての対応付けが適切とはいえない。文4には、テキスト領域3が対応付けられるべきである。以下、第2〜第4の実施形態において、対応付けの精度を向上させる構成および方法を記載する。
<第2の実施形態>
図15は、第2の実施形態の表示制御装置の構成を示す。第2の実施形態の表示制御装置1は、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、相関計算部14、対応関係決定部15、音声合成部16、同期制御部17、係り受け解析部21、文脈否定語辞書22、文脈否定自立語除去部23を備える。なお、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、相関計算部14、対応関係決定部15、音声合成部16、同期制御部17は、第1の実施形態と実質的に同じである。
係り受け解析部21は、形態素解析部12から出力される形態素列において、形態素列中の自立語間の係り受け関係を求める。この例では、係り受け解析部21は、形態素解析部12bから出力される、読上げ原稿中の各原稿要素についての形態素列において、各形態素列中の自立語間の係り受け関係を求める。なお、係り受け解析方法としては、公知の技術として様々なアルゴリズムが提案されている。そして、係り受け解析部21は、任意の係り受け解析アルゴリズムを利用して、各形態素列中の自立語間の係り受け関係を求めることができる。
図16は、係り受け解析の一例を示す。ここでは、読上げ原稿中の原稿要素「文4」を例に説明する。以下の説明では、文4に対して、形態素解析部12bにより図8に示す形態素列が生成され、自立語抽出部13bにより図10に示すように自立語が抽出されているものとする。
図16において、自立語間をリンク付けている矢印は、自立語間の係り受け関係を表している。例えば、「家」から「ローン」に向かう矢印は、「家」と「ローン」が係り受け関係を有し、「家」が係り受け元であり、「ローン」が係り受け先であることを表している。
文脈否定語辞書22には、否定的な文脈を生成する語(すなわち、文脈否定語)が登録されている。この例では、文脈否定語辞書22には、文脈否定語として、図17に示すように、「以外」「限らず」「ない」などが登録されている。なお、文脈否定語辞書22にどのような文脈否定語を登録するのかについては、例えば、経験的にまたはシミュレーション等に基づいて決定される。
文脈否定自立語除去部23は、各原稿要素について、自立語抽出部13により抽出された自立語から、原稿要素の文脈に対して否定的な働きをする自立語を除去する。ここで、読上げ原稿中の文4を例に、文脈否定自立語除去部23の処理を説明する。なお、文4に対して、自立語抽出部13bにより図10に示すように自立語が抽出されており、係り受け解析部21により図16に示す解析結果が得られているものとする。
この場合、文脈否定自立語除去部23は、文脈否定語辞書22を参照し、自立語抽出部13bにより抽出されている自立語の中に文脈否定語が含まれているか否かをチェックする。この例では、「以外」が検出される。そうすると、文脈否定自立語除去部23は、係り受け解析部21による解析結果を参照し、「以外」に直接的あるいは間接的に係る自立語を探索する。この例では、「以外」に対して係り受け元である「ローン(図16において、先頭から2番目の自立後)」が抽出される。また、抽出された「ローン」の係り受け元である「家」も抽出される。ここで、「家」は、「以外」に対して、「ローン」を介して間接的に係っている。そして、文脈否定自立語除去部23は、自立語抽出部13bにより抽出されている自立語から、「家」「ローン(図16において、先頭から2番目の自立後)」「以外」を除去する。したがって、文脈否定自立語除去部23は、文4に対応する自立語として、「車」「ローン」「各種」「ローン」「ある」を相関計算部14に送る。
ここで、文脈否定語を除去する理由について説明する。例えば、文4「家のローン以外にも車のローンなどの各種ローンがあるかもしれません。」の主たる文脈は、「車のローンなどの各種ローンがある」である。そうすると、文4から「家のローン以外にも(実際には、「家」「ローン」「以外」)」を除去する処理は、文4からその文脈の要部を抽出する処理に相当する。このため、文脈否定語が除去された後に、原稿要素とテキスト領域との間で一致する自立語の個数をカウントすれば、各原稿要素の主たる文脈の範囲内で、対応関係を調べることが可能となる。すなわち、原稿要素とテキスト領域との間の対応関係を判定する処理において、雑音(すなわち、文脈否定語による影響)が抑圧される。この結果、原稿要素とテキスト領域との間の対応付けの精度が向上する。
次に、第2の実施形態における相関計算部14および対応関係決定部15の処理の一例を示す。ここでは、読上げ原稿中の文4と各テキスト領域0〜4の対応関係を特定する。なお、相関計算部14には、文脈否定自立語除去部23により、文4から抽出される自立語として「車」「ローン」「各種」「ローン」「ある」が入力されるものとする。また、各テキスト領域0〜4から抽出される自立語は、図9に示す通りである。
この場合、文4とテキスト領域2との間で「ローン(2つ)」が一致している。すなわち、文4とテキスト領域2との間で一致する自立語の個数は「2」である。一方、文4とテキスト領域3との間では「ローン(2つ)」及び「ある」が一致している。すなわち、文4とテキスト領域3との間で一致する自立語の個数は「3」である。なお、文4とテキスト領域0、1、4との間には、いずれも一致する自立語は存在しない。
図18は、第2の実施形態における相関計算部14および対応関係決定部15の処理結果を示す。第2の実施形態によれば、図18に示すように、文4に対して、一致する自律語の個数が最大となる領域は、テキスト領域3である。したがって、対応関係決定部15は、文4に対してテキスト領域3を対応付ける。他の原稿要素(文0〜文3、文5)についての対応関係は、第1の実施形態と同じである。
したがって、同期制御部17が図18に示す対応関係情報に従って図14に示すフローチャートを実行すると、読上げ原稿中の文1、文2、文3、文4の音声データの再生と同期して、それぞれ、テキスト領域1、テキスト領域4、テキスト領域2、テキスト領域3が順番に強調表示される。このように、図16〜図18に示す例では、読上げ原稿中の文4に対しても、適切なテキスト領域が対応付けられている。すなわち、第2の実施形態によれば、第1の実施形態と比較して、原稿要素とテキスト領域との対応付けの精度が向上する。
なお、図15に示す表示制御装置においては、読上げ原稿中の各原稿要素から文脈否定語を除去しているが、本発明はこの構成に限定されるものではない。すなわち、第2の実施形態の表示制御装置は、各テキスト領域から文脈否定語を除去してもよいし、各原稿要素および各テキスト領域の双方から文脈否定語を除去してもよい。
<第3の実施形態>
図19は、第3の実施形態の表示制御装置の構成を示す。第3の実施形態の表示制御装置1は、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、相関計算部14、対応関係決定部15、音声合成部16、同期制御部17、位置情報スコア付加部31を備える。なお、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、相関計算部14、対応関係決定部15、音声合成部16、同期制御部17は、第1の実施形態と実質的に同じである。
位置情報スコア付加部31は、表示資料内での各テキスト領域の位置を表す位置情報、および各原稿要素について音声データが出力される順序を表す順序情報に基づいて、各テキスト領域と各原稿要素との組合せについて、それぞれ、相関計算部14により得られる相関の値(上述の例では、一致する自律語の個数)を補正する。以下、位置情報スコア付加部31の処理について説明する。
各テキスト領域の位置情報は、下式で表わされる。
位置情報[N] =N/(テキスト領域の数−1) ・・・(1)
Nは、各テキスト領域を識別する識別番号である。例えば、図6に示す例では、N=0〜4であり、「テキスト領域の数」は「5」である。また、「位置情報[N]」は、識別番号としてNが割り当てられているテキスト領域の位置情報を意味する。
ここで、表示資料の内容の説明は、多くのケースにおいて、上方に配置されている要素から下方に配置されている要素に向かって行われる。また、同じ高さに複数の要素が配置されているときは、多くのケースにおいて、左方に配置されている要素から右方に配置されている要素に向かって説明が行われる。このため、この実施例では、表示資料内の各テキスト領域に対して、下記の規則で識別番号が割り当てられる。
(1)ゼロから割当てを開始する
(2)上方から下方に向かって順番に割り当てる
(3)同じ高さ位置に配置されているテキスト領域に対しては、左方から右方に向かって順番に割り当てる
したがって、表示資料内で最も上方に配置されているテキスト領域「40代をとりまく経済的不安要因」に対して、識別番号=0が割り当てられる。また、同じ高さ位置に配置されている2つのテキスト領域「増税が心配です」「家のローンは大丈夫か?」のうち、「増税が心配です」が左方に配置されている。よって、テキスト領域「増税が心配です」に対して識別番号=1が割り当てられ、テキスト領域「家のローンは大丈夫か?」に対して識別番号=2が割り当てられている。同様に、テキスト領域「自動車ローンもある」に対して識別番号=3が割り当てられ、テキスト領域「子供の養育費も結構かかる」に対して識別番号=4が割り当てられている。
よって、上述の式(1)によれば、図6に示すテキスト領域0、1、2、3、4の位置情報は、それぞれ、「ゼロ」「0.25」「0.5」「0.75」「1」である。すなわち、位置情報は、最小値=ゼロ、最大値=1となるように、正規化されている。ここで、各テキスト領域の識別番号は、上述のように、表示資料の内容が説明されるときに、各テキスト領域が登場する順序を表すように割り当てられる。したがって、テキスト領域の位置情報は、概ね、表示資料の説明においてそのテキスト領域が参照される順番を表すこととなる。
各原稿要素の順序情報は、下式で表わされる。
順序情報[M] =M/(原稿要素の数−1) ・・・(2)
Mは、各原稿要素を識別する識別番号である。例えば、図3に示す例では、M=0〜5であり、「原稿要素の数」は「6」である。また、「順序情報[M]」は、識別番号としてMが割り当てられている原稿要素の順序情報を意味する。
この例では、図3に示す文0〜文5が順番に読み上げられる(文0〜文5の音声データが順番に出力される)ものとする。すなわち、原稿要素「文0」〜「文5」に対して順番に識別番号「0」〜「5」が割り当てられる。したがって、文0、文1、文2、文3、文4、文5の順序情報は、それぞれ、「ゼロ」「0.2」「0.4」「0.6」「0.8」「1」である。すなわち、順序情報も正規化されている。
続いて、位置情報スコア付加部31は、上述の位置情報および順序情報に基づいて、各テキスト領域と各原稿要素との組合せのそれぞれについて、位置情報スコアを計算する。図20は、位置情報スコア付加部31の処理を示すフローチャートである。
図20において、ステップS41、S45は、読上げ原稿中の各原稿要素に対してステップS42〜S44の処理を実行するために設けられている。すなわち、位置情報スコア付加部31は、すべての原稿要素に対してステップS42〜S44の処理を実行するまで、変数Mを1ずつインクリメントしながら、各原稿要素に対してステップS42〜S44の処理を実行する。よって、図3に示す読上げ原稿が表示制御装置1に入力されると、位置情報スコア付加部31は、文0〜文5に対してステップS42〜S44の処理をそれぞれ実行する。
ステップS42、S44は、表示資料内の各テキスト領域に対してステップS43の処理を実行するために設けられている。すなわち、位置情報スコア付加部31は、すべてのテキスト領域に対してステップS43の処理を実行するまで、変数Nを1ずつインクリメントしながら、各テキスト領域に対してステップS43の処理を実行する。よって、図3に示す読上げ原稿が表示制御装置1に入力されると、位置情報スコア付加部31は、各原稿要素と各テキスト領域とのすべての組合せに対してステップS43の処理をそれぞれ実行する。
ステップS43において、位置情報スコア付加部31は、まず、原稿要素とテキスト領域との各組合せに対して、順序情報と位置情報の差分の絶対値を計算することで「差分」を算出する。以下、M番目の原稿要素の順序情報とN番目のテキスト領域の位置情報との差分の絶対値を、差分[M][N]と表記することがある。たとえば、テキスト領域0の位置情報は「0」であり、原稿要素「文0」の順序情報は「0」なので、これらの組合せについては、差分[0][0]=0が得られる。また、テキスト領域1の位置情報は「0.25」であり、原稿要素「文1」の順序情報は「0.2」なので、これらの組合せについては、差分[1][1]=0.05が得られる。テキスト領域1の位置情報は「0.25」であり、原稿要素「文5」の順序情報は「1」なので、これらの組合せについては、差分[5][1]=0.75が得られる。
差分[M][N]は、上述のように、順序情報と位置情報の差分の絶対値である。順序情報は、各原稿要素が読み上げられる順序に対応する値を表し、各原稿要素が読み上げられる順序を表す識別番号を正規化することにより得られる。また、位置情報は、各テキスト領域が参照されると見込まれる順序に対応する値を表し、各テキスト領域が参照されると見込まれる順序を表す識別番号を正規化することにより得られる。ここで、正規化は、順序情報および位置情報の最大値をそれぞれ1にする処理であって、原稿要素の数とテキスト領域の数との差異を補償する。したがって、ある原稿要素の順序情報の値と、あるテキスト領域の位置情報の値が近似している状態は、表示資料の画像および読上げ原稿の合成音声がユーザに提供されるときに、それらの原稿要素およびテキスト領域が互いに同一または近接するタイミングで登場する可能性が高いことを表している。換言すれば、ある原稿要素の順序情報の値とあるテキスト領域の位置情報の値が近似している状態(すなわち、対応する「差分[M][N]」が小さい状態)は、それらの原稿要素およびテキスト領域が互いに関連している可能性が高いと考えられる。そこで、第3の実施形態では、各テキスト領域と各原稿要素との間の対応関係を決定する際に、上述の差分[M][N]も考慮される。
ただし、第3の実施形態では、計算の便宜上、関連性の高い組合せに対して大きな値を与える。よって、位置情報スコア付加部31は、各テキスト領域と各原稿要素との組合せのそれぞれについて、下式に従って位置情報スコアを計算する。
位置情報スコア[M][N]=(1−差分[M][N])*重み
「位置情報スコア[M][N]」は、M番目の原稿要素とN番目のテキスト領域との間の位置情報スコアを表す。「差分[M][N]」は、上述したように、M番目の原稿要素の順序情報とN番目のテキスト領域の位置情報との差分の絶対値を表す。「重み」は、シミュレーション等に応じて決定される定数である。位置情報スコア付加部31により得られる位置情報スコアの計算結果を図21(a)に示す。ここでは、重み=0.8である。
さらに、位置情報スコア付加部31は、相関計算部14により得られる各相関の値を、それぞれ対応する位置情報スコアで補正する。このとき、位置情報スコア付加部31は、相関計算部14により得られる一致個数[M][N]に、対応する位置情報スコア[M][N]を加算することにより、各テキスト領域と各原稿要素との組合せのそれぞれについて、補正された一致個数の値を得る。各一致個数[M][N]を対応する位置情報スコア[M][N]で補正した結果を図21(b)に示す。
対応関係決定部15は、位置情報スコア付加部31により得られる、補正された一致個数に基づいて、各テキスト領域と各原稿要素との間の対応関係を決定する。すなわち、対応関係決定部15は、各原稿要素について、補正された一致個数が最大となるテキスト領域を特定する。例えば、図21(b)に示す実施例では、文3に対してテキスト領域2が対応付けられる。同様に、文4に対してテキスト領域3が対応付けられる。このように、各原稿要素「文1」〜「文4」に対してそれぞれ適切にテキスト領域が対応付けられている。すなわち、第3の実施形態によれば、各テキスト領域と各原稿要素との間の対応付けの精度が向上する。
なお、第3の実施形態は、第2の実施形態と組み合わせて実施してもよい。すなわち、表示制御装置は、各原稿要素および/または各テキスト領域において文脈を否定する語を除去した後に、位置情報スコアを利用して一致個数を補正してもよい。
<第4の実施形態>
図22は、第4の実施形態の表示制御装置の構成を示す。第4の実施形態の表示制御装置1は、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、対応関係決定部15、音声合成部16、同期制御部17、類似語辞書41、類似語対応相関計算部42を備える。なお、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、対応関係決定部15、音声合成部16、同期制御部17は、第1の実施形態と実質的に同じである。
類似語辞書41は、図23に示すように、対象語に対応づけてその対象語に類似する概念を有する類似語を格納する。図23に示す例では、対象語「お子さん」に対して、類似語「子供」が格納されている。なお、類似語辞書41において、1つの対象語に対して複数の類似語を登録するようにしてもよい。
類似語対応相関計算部42は、各テキスト領域と各原稿要素との間で互いに一致または類似する特定単語の個数をカウントする。このとき、類似語対応相関計算部42は、類似語辞書41を参照する。
第4の実施形態の類似語対応相関計算部42は、第1の実施形態による図11に示すフローチャートと類似の手順を実行する。ただし、類似語対応相関計算部42は、図11に示すフローチャートにおいて、ステップS6〜S7の処理の代わりに、図24に示すステップS51〜S53を実行する。
ステップS51の処理は、第1の実施形態のステップS6と実質的に同じである。すなわち、類似語対応相関計算部42は、ステップS51において、M番目の原稿要素から抽出されたK番目の自立語と、N番目のテキスト領域から抽出されたL番目の自立語とを互いに比較する。そして、これらの自立語が互いに一致していれば、類似語対応相関計算部42は、ステップS53において一致/類似個数[M][N]を1だけインクリメントする。一方、これらの自立語が互いに一致していなければ、類似語対応相関計算部42の処理はステップS52へ移行する。
ステップS52において、類似語対応相関計算部42は、類似語辞書41を参照し、M番目の原稿要素から抽出されたK番目の自立語がN番目のテキスト領域から抽出されたL番目の自立語の類似語であるか判定する。そして、一方の自立語が他方の自立語の類似語であれば、ステップS53において、一致/類似個数[M][N]がインクリメントされる。一方、上記2つの自立語が類似関係にないときは、ステップS53の処理はスキップされる。
一例を示す。以下では、読上げ原稿中の原稿要素「文3」について説明する。文3は、図10に示すように、8個の自立語「住宅」「ローン」「返済」「滞っ」「まだ」「終了し」「人」「いる」を有する。そうすると、文3は、テキスト領域2との間に、一致する自律語「ローン」を有すると共に、類似する自律語「家(「住宅」に類似する)」を有する。したがって、原稿要素「文3」とテキスト領域2との組合せについて、一致/類似個数[3][2]=2が得られる。また、文3は、テキスト領域3との間に、一致する自律語「ローン」を有するが、類似する自律語は有していない。したがって、原稿要素「文3」とテキスト領域3との組合せについて、一致/類似個数[3][3]=1が得られる。なお、原稿要素「文3」と各テキスト領域0、1、4との間には、いずれも、一致する自律語も類似する自律語も存在しない。上述の例における類似語対応相関計算部42の出力を図25に示す。
第4の実施形態において、対応関係決定部15は、類似語対応相関計算部42の計算結果に基づいて、各テキスト領域と各原稿要素との間の対応関係を決定する。よって、図25に示す例では、読上げ原稿の各原稿要素「文1」〜「文4」に対して、それぞれテキスト領域1、4、2、3が対応付けられる。このように、各原稿要素「文1」〜「文4」に対してそれぞれ適切にテキスト領域が対応付けられる。すなわち、第4の実施形態によれば、各テキスト領域と各原稿要素との間の対応付けの精度が向上する。
なお、第4の実施形態は、第2の実施形態と組み合わせて実施してもよいし、第3の実施形態と組み合わせて実施してもよい。さらに、第2〜第4の実施形態を組み合わせて実施してもよい。
<表示制御装置のハードウェア構成>
図26は、第1〜第4の実施形態の表示制御装置を実現するためのコンピュータシステムのハードウェア構成を示す図である。コンピュータシステム100は、図26に示すように、CPU101、メモリ102、記憶装置103、読み取り装置104、通信インタフェース106、および入出力装置107を備える。なお、CPU101、メモリ102、記憶装置103、読み取り装置104、通信インタフェース106、入出力装置107は、例えば、バス108を介して互いに接続されている。
CPU101は、メモリ102を利用して上述のフローチャートの手順を記述したプログラムを実行することにより、テキスト領域抽出部11、形態素解析部12、自立語抽出部13、相関計算部14、対応関係決定部15、音声合成部16、同期制御部17、係り受け解析部21、文脈否定自立語除去部23、位置情報スコア付加部31、類似語対応相関計算部41の一部または全部の機能を提供する。
メモリ102は、例えば半導体メモリであり、RAM領域およびROM領域を含んで構成される。記憶装置103は、例えばハードディスクであり、実施形態の表示制御に係わる表示制御プログラムを格納する。なお、記憶装置103は、フラッシュメモリ等の半導体メモリであってもよい。また、記憶装置103は、外部記録装置であってもよい。文脈否定語辞書22および類似語辞書41は、例えば、記憶装置103に格納されるようにしてもよい。
読み取り装置104は、CPU101の指示に従って着脱可能記録媒体105にアクセスする。着脱可能記録媒体105は、たとえば、半導体デバイス(USBメモリ等)、磁気的作用により情報が入出力される媒体(磁気ディスク等)、光学的作用により情報が入出力される媒体(CD−ROM、DVD等)などにより実現される。通信インタフェース106は、CPU101の指示に従ってネットワークを介してデータを送受信する。入出力装置107は、例えば、ユーザからの指示を受け付けるデバイス、表示装置2との間のインタフェース、スピーカ3との間のインタフェースに相当する。
実施形態の表示制御プログラムは、例えば、下記の形態でコンピュータシステム100に提供される。
(1)記憶装置103に予めインストールされている。
(2)着脱可能記録媒体105により提供される。
(3)プログラムサーバ110から提供される。
なお、実施形態の表示制御方法は、複数のコンピュータを利用して上述のフローチャートの処理を提供してもよい。この場合、あるコンピュータが、上述のフローチャートの処理の一部を、ネットワークを介して他のコンピュータに依頼し、その処理結果を受け取るようにしてもよい。
さらに、実施形態の表示制御装置の一部は、ハードウェアで実現してもよい。或いは、実施形態の表示制御装置は、ソフトウェアおよびハードウェアの組み合わせで実現してもよい。
<他の実施形態>
上述した第1〜第4の実施形態においては、表示制御装置1は、読上げ原稿の音声データを出力しながら表示装置2に表示資料を表示する際に、その音声データの内容に応じて表示資料の画像内の対応する領域を強調する。しかしながら、本発明は、このような動作を行う装置、方法、プログラムに限定されるものではない。例えば、本発明の範囲は、音声データの内容に応じて表示資料の画像内の対応する領域を強調するように表示データが加工されたコンテンツを作成する装置、方法、プログラムも含むものとする。この場合、本発明に係る装置は、例えば、音声合成部16を備えなくてもよい。また、同期制御部17は、例えば、各テキスト領域と各原稿要素との間の対応関係に基づいて、表示データに強調表示を指示する情報を付加する。
読上げ原稿データは、例えば、キーボード等を利用して入力されるテキストデータにより実現される。ただし、本発明はこのような実施形態に限定されるものではない。たとえば、読上げ原稿データとして、人の音声を解析することで得られる文字列データが表示制御装置に入力されてもよい。
1 表示制御装置
2 表示装置
3 スピーカ
4 表示データ
5 読上げ原稿データ
11 テキスト領域抽出部
12 形態素解析部
13 自立語抽出部
14 相関計算部
15 対応関係決定部
16 音声合成部
17 同期制御部
21 係り受け解析部
22 文脈否定語辞書
23 文脈否定自立語除去部
31 位置情報スコア付加部
41 類似語辞書
42 類似語対応相関計算部

Claims (6)

  1. 表示データからテキストを含むテキスト領域を抽出するテキスト領域抽出部と、
    前記テキスト領域抽出部により抽出された各テキスト領域内の文字列、および読上げ原稿データに含まれる各原稿要素の文字列を形態素に分割し、各形態素に品詞を付与する形態素解析部と、
    前記形態素解析部により得られる形態素から、予め決められた特定の品詞を有する特定単語を抽出する特定単語抽出部と、
    各原稿要素の文字列または各テキスト領域内の文字列の少なくとも一部について、前記特定単語抽出部により抽出された特定単語間の係り受けを解析する係り受け解析部と、
    前記係り受け解析部による解析結果に基づいて、前記係り受け解析部による解析が行われた文字列において、文字列の文脈に対して否定的な働きをする否定語および前記否定語に係る特定単語を除去する文脈否定語除去部と、
    前記特定単語抽出部により抽出された特定単語の中で前記文脈否定語除去部により除去されなかった特定単語を利用して、各テキスト領域と各原稿要素との間の相関をそれぞれ計算する相関計算部と、
    前記相関計算部により計算される相関に基づいて、テキスト領域と原稿要素との間の対応関係を表す対応関係情報を生成する対応関係決定部と、
    前記読上げ原稿データから各原稿要素の音声データを生成する音声合成部と、
    前記対応関係情報に基づいて、前記音声データが出力される原稿要素に対応するテキスト領域を強調して表示する同期制御部と、
    を有する表示制御装置。
  2. 前記相関計算部は、各テキスト領域と各原稿要素との間で互いに一致する特定単語の個数をカウントすることで、前記相関を計算し、
    前記対応関係決定部は、前記対応関係情報において、各原稿要素に対して一致する特定単語の個数が最大であるテキスト領域を対応付ける
    ことを特徴とする請求項1に記載の表示制御装置。
  3. 前記表示データにより表わされる画像内での各テキスト領域の位置を表す位置情報、および各原稿要素について音声データが出力される順序を表す順序情報に基づいて、各テキスト領域と各原稿要素との組合せのそれぞれについて補正値を生成し、各テキスト領域と各原稿要素との組合せについて、それぞれ、前記相関計算部により得られる相関の値を対応する補正値で補正する補正部をさらに備える
    ことを特徴とする請求項1に記載の表示制御装置。
  4. 前記相関計算部は、各テキスト領域と各原稿要素との間で互いに一致または類似する特定単語の個数をカウントすることで、前記相関を計算する
    ことを特徴とする請求項2に記載の表示制御装置。
  5. コンピュータを利用して、
    表示データからテキストを含むテキスト領域を抽出し、
    前記抽出された各テキスト領域内の文字列、および読上げ原稿データに含まれる各原稿要素の文字列を形態素に分割し、各形態素に品詞を付与し、
    前記形態素から、予め決められた特定の品詞を有する特定単語を抽出し、
    各原稿要素の文字列または各テキスト領域内の文字列の少なくとも一部について、前記抽出された特定単語間の係り受けを解析し、
    前記係り受けについての解析結果に基づいて、前記係り受けについての解析が行われた文字列において、文字列の文脈に対して否定的な働きをする否定語および前記否定語に係る特定単語を除去し、
    前記抽出された特定単語の中で前記除去する処理により除去されなかった特定単語を利用して、各テキスト領域と各原稿要素との間の相関をそれぞれ計算し、
    前記相関に基づいて、テキスト領域と原稿要素との間の対応関係を表す対応関係情報を生成し、
    前記読上げ原稿データから各原稿要素の音声データを生成し、
    前記対応関係情報に基づいて、前記音声データが出力される原稿要素に対応するテキスト領域を強調して表示する
    ことを特徴とする表示制御方法。
  6. 表示データからテキストを含むテキスト領域を抽出し、
    前記抽出された各テキスト領域内の文字列、および読上げ原稿データに含まれる各原稿要素の文字列を形態素に分割し、各形態素に品詞を付与し、
    前記形態素から、予め決められた特定の品詞を有する特定単語を抽出し、
    各原稿要素の文字列または各テキスト領域内の文字列の少なくとも一部について、前記抽出された特定単語間の係り受けを解析し、
    前記係り受けについての解析結果に基づいて、前記係り受けについての解析が行われた文字列において、文字列の文脈に対して否定的な働きをする否定語および前記否定語に係る特定単語を除去し、
    前記抽出された特定単語の中で前記除去する処理により除去されなかった特定単語を利用して、各テキスト領域と各原稿要素との間の相関をそれぞれ計算し、
    前記相関に基づいて、テキスト領域と原稿要素との間の対応関係を表す対応関係情報を生成し、
    前記読上げ原稿データから各原稿要素の音声データを生成し、
    前記対応関係情報に基づいて、前記音声データが出力される原稿要素に対応するテキスト領域を強調して表示する
    処理をコンピュータに実行させる表示制御プログラム。
JP2011046823A 2011-03-03 2011-03-03 表示制御装置、表示制御方法、および表示制御プログラム Expired - Fee Related JP5691654B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011046823A JP5691654B2 (ja) 2011-03-03 2011-03-03 表示制御装置、表示制御方法、および表示制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011046823A JP5691654B2 (ja) 2011-03-03 2011-03-03 表示制御装置、表示制御方法、および表示制御プログラム

Publications (2)

Publication Number Publication Date
JP2012185567A JP2012185567A (ja) 2012-09-27
JP5691654B2 true JP5691654B2 (ja) 2015-04-01

Family

ID=47015623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011046823A Expired - Fee Related JP5691654B2 (ja) 2011-03-03 2011-03-03 表示制御装置、表示制御方法、および表示制御プログラム

Country Status (1)

Country Link
JP (1) JP5691654B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016067348A1 (ja) * 2014-10-27 2016-05-06 富士通株式会社 プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置
JP6432405B2 (ja) * 2015-03-18 2018-12-05 富士通株式会社 プレゼンテーション支援装置、プレゼンテーション支援方法及びプレゼンテーション支援プログラム
JP6526349B2 (ja) 2016-11-04 2019-06-05 三菱電機株式会社 情報処理装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520354A (ja) * 1991-07-12 1993-01-29 Nippon Telegr & Teleph Corp <Ntt> 日本語文章解析装置
JPH07175909A (ja) * 1993-12-20 1995-07-14 Canon Inc データ処理装置
GB9821969D0 (en) * 1998-10-08 1998-12-02 Canon Kk Apparatus and method for processing natural language
JP2002108601A (ja) * 2000-10-02 2002-04-12 Canon Inc 情報処理システム及び装置及び方法
JP4239850B2 (ja) * 2004-02-18 2009-03-18 日本電信電話株式会社 映像キーワード抽出方法及び装置及びプログラム
JP4218758B2 (ja) * 2004-12-21 2009-02-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 字幕生成装置、字幕生成方法、及びプログラム
JP2008217064A (ja) * 2007-02-28 2008-09-18 Toshiba Corp 要望抽出装置、方法およびプログラム
JP5180712B2 (ja) * 2008-07-16 2013-04-10 日本放送協会 音声制御装置、音声制御方法及び音声制御プログラム

Also Published As

Publication number Publication date
JP2012185567A (ja) 2012-09-27

Similar Documents

Publication Publication Date Title
US20130196292A1 (en) Method and system for multimedia-based language-learning, and computer program therefor
KR102101044B1 (ko) 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법
US20150170648A1 (en) Ebook interaction using speech recognition
JP2944346B2 (ja) 文書要約装置
JP5691654B2 (ja) 表示制御装置、表示制御方法、および表示制御プログラム
US11176943B2 (en) Voice recognition device, voice recognition method, and computer program product
JP2008276543A (ja) 対話処理装置、応答文生成方法、及び応答文生成処理プログラム
JP5642037B2 (ja) 検索装置、検索方法およびプログラム
CN107886938B (zh) 虚拟现实引导催眠语音处理方法及装置
Do et al. Improving translation of emphasis with pause prediction in speech-to-speech translation systems.
JP6879521B1 (ja) 多言語音声認識およびテーマ−意義素解析方法および装置
WO2018058425A1 (zh) 虚拟现实引导催眠语音处理方法及装置
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
JP5150277B2 (ja) 言語処理装置、言語処理方法および言語処理プログラム並びに言語処理プログラムを記録した記録媒体
KR102053076B1 (ko) 감성 분석 기반의 스타일 적용이 가능한 문서 편집 장치 및 그 동작 방법
KR102667466B1 (ko) 이미지 연상 기법을 이용한 영어 독해 강의 콘텐츠 제공 방법 및 장치
JP2010117832A (ja) 関係情報抽出装置、その方法、プログラム及び記録媒体
JP6323828B2 (ja) 支援装置、情報処理方法、及び、プログラム
JP2004233691A (ja) カウンセリングプログラム、およびカウンセリング方法
US20200387806A1 (en) Idea generation support device, idea generation support system, and recording medium
JP7131518B2 (ja) 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム
JP2009150990A (ja) 発話応答生成装置、及びプログラム
JP7258627B2 (ja) 採点支援装置、その方法、およびプログラム
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
JPH06149800A (ja) 文書処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150119

R150 Certificate of patent or registration of utility model

Ref document number: 5691654

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees