JPWO2016067348A1 - プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 - Google Patents

プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 Download PDF

Info

Publication number
JPWO2016067348A1
JPWO2016067348A1 JP2016556070A JP2016556070A JPWO2016067348A1 JP WO2016067348 A1 JPWO2016067348 A1 JP WO2016067348A1 JP 2016556070 A JP2016556070 A JP 2016556070A JP 2016556070 A JP2016556070 A JP 2016556070A JP WO2016067348 A1 JPWO2016067348 A1 JP WO2016067348A1
Authority
JP
Japan
Prior art keywords
area
word
display
region
presentation support
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016556070A
Other languages
English (en)
Other versions
JP6304396B2 (ja
Inventor
田中 正清
正清 田中
村瀬 健太郎
健太郎 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2016067348A1 publication Critical patent/JPWO2016067348A1/ja
Application granted granted Critical
Publication of JP6304396B2 publication Critical patent/JP6304396B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

プレゼンテーション支援装置(10)は、表示時に画面単位で表示されるページを含む文書ファイルのページが分割された領域ごとに領域が含む文字列から第1の単語を抽出する。プレゼンテーション支援装置(10)は、音声認識を実行し、表示装置5に表示中であるページ内の領域ごとに領域から抽出された第1の単語と音声認識の結果として得られる第2の単語とから関連度を算出する。プレゼンテーション支援装置(10)は、領域ごとに算出された関連度が高い領域ほど領域のハイライト表示を進行させる速度を高く設定し、あるいは関連度が低い領域ほど領域のハイライト表示を進行させる速度を低く設定する。プレゼンテーション支援装置(10)は、領域ごとに設定された速度にしたがってページ内のハイライト表示を制御する。

Description

本発明は、プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置に関する。
プレゼンテーションを支援する技術の一例として、プレゼンタが説明中である箇所をプレゼンタや聴講者に提示するものがある。例えば、原稿の読み飛ばしを抑制することを目的とする表示装置が提案されている。この表示装置では、話者が発声した語句を認識し、認識した語句をもとに、表示パネルに表示中の原稿のうち読み上げられた部分を特定し、この特定した部分の表示状態を、第1の表示状態とは異なる第2の表示状態、例えば点滅等のハイライト表示に変化させる。
特開2009−271814号公報 特開2005−208292号公報 特開2002−268667号公報 特開昭61−036853号公報
しかしながら、上記の技術では、次に説明するように、プレゼンタの説明箇所がハイライト表示されない場合がある。
すなわち、上記の表示装置では、話者が発声する語句を得るために音声認識が用いられる。ところが、音声認識で誤認識が発生する場合、誤認識に伴って話者が説明中でない箇所がハイライト表示される結果、話者の説明箇所がハイライト表示されない場合がある。この場合、表示装置は、話者や聴講者に説明箇所を提示できず、プレゼンテーションを妨げてしまうことがある。
1つの側面では、プレゼンタの説明箇所がハイライト表示されない事態を抑制できるプレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置を提供することを目的とする。
一態様のプレゼンテーション支援方法は、コンピュータが、表示時に画面単位で表示されるページを含む文書ファイルのページが分割された領域ごとに当該領域が含む文字列から第1の単語を抽出する処理を実行する。さらに、前記コンピュータが、音声認識を実行し、所定の表示部に表示中であるページ内の領域ごとに当該領域から抽出された第1の単語と前記音声認識の結果として得られる第2の単語とから関連度を算出する処理を実行する。さらに、前記コンピュータが、前記領域ごとに算出された関連度が高い領域ほど前記領域のハイライト表示を進行させる速度を高く設定し、あるいは関連度が低い領域ほど前記領域のハイライト表示を進行させる速度を低く設定する処理を実行する。さらに、前記コンピュータが、前記領域ごとに設定された速度にしたがって前記ページ内のハイライト表示を制御する処理を実行する。
プレゼンタの説明箇所がハイライト表示されない事態を抑制できる。
図1は、実施例1に係るプレゼンテーション支援システムの構成を示す図である。 図2は、実施例1に係るプレゼンテーション支援装置の機能的構成を示すブロック図である。 図3は、抽出単語データの一例を示す図である。 図4は、ハイライト表示の進行度に関する時間変化の一例を示す図である。 図5は、スライド画面の遷移例を示す図である。 図6は、スライド画面の遷移例を示す図である。 図7は、実施例1に係る重み付与処理の手順を示すフローチャートである。 図8は、実施例1に係る音声認識処理の手順を示すフローチャートである。 図9は、実施例1に係る表示制御処理の手順を示すフローチャートである。 図10は、実施例1及び実施例2に係るプレゼンテーション支援プログラムを実行するコンピュータのハードウェア構成例を示す図である。
以下に添付図面を参照して本願に係るプレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置について説明する。なお、この実施例は開示の技術を限定するものではない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
[システム構成]
図1は、実施例1に係るプレゼンテーション支援システムの構成を示す図である。図1に示すプレゼンテーション支援システム1は、文書ファイルが表示装置5に表示されたプレゼンテーション画面のうちマイク3から入力される音声の認識結果として得られた単語を含む領域をハイライト表示させるプレゼンテーション支援サービスを提供する。
かかるプレゼンテーション支援サービスの一環として、プレゼンテーション支援システム1は、単語との関連度が高い領域の表示ほどハイライトの速度を上げ、関連度が低い領域の表示ほどハイライトの速度を下げる表示制御を実現する。これをもって、プレゼンタの説明箇所がハイライト表示されない事態を抑制する。
ここで、以下では、一例として、上記の表示制御に関する機能がプレゼンテーションソフトにアドオンされる場合を想定し、当該プレゼンテーションソフトを用いて作成された文書ファイルが含む1または複数のスライドを表示装置5に表示させることによってプレゼンテーションが進行される場合を想定する。かかるスライドには、テキストや図形を始め、他のアプリケーションプログラムによって作成されたコンテンツをインポートすることができる。例えば、ワープロソフトで作成された文書、表計算ソフトで作成された表やグラフをインポートしたり、撮像デバイスで撮像された画像や動画、さらには、画像編集ソフトで編集された画像や動画などをインポートしたりすることができる。
図1に示すように、プレゼンテーション支援システム1には、マイク3と、表示装置5と、入力装置7と、プレゼンテーション支援装置10とが収容される。これらマイク3、表示装置5及び入力装置7などの周辺機器と、プレゼンテーション支援装置10との間は、有線または無線により接続される。
マイク3は、音声を電気信号に変換する装置であり、マイクロフォンと呼ばれることもある。例えば、マイク3は、プレゼンテーションを実施するプレゼンタに装着させることができる。この場合、ヘッドセット型やタイピン型のマイクをプレゼンタの身体や衣服の所定位置に装着させたり、ハンド型のマイクをプレゼンタに携帯させたりすることができる。また、マイク3は、プレゼンタの発話が集音できる範囲の所定位置に設置することもできる。この場合、マイク3には、取付け型や据置き型のマイクを採用することもできる。これらいずれの場合においても、マイク3には、任意のタイプの指向性を持つマイクを採用できるが、プレゼンタの発話以外の音声、例えば聴講者等の発話や騒音などの雑音が集音されるのを抑制するために、マイクの感度をプレゼンタの発声方向に限定することもできる。なお、マイク3には、ダイナミック型、エレクトレットコンデンサ型、コンデンサ型などの任意の変換方式を採用することができる。
このマイク3に音声を採取することにより得られたアナログ信号は、デジタル信号へ変換された上でプレゼンテーション支援装置10へ入力される。
表示装置5は、各種の情報を表示する装置である。例えば、表示装置5には、発光により表示を実現する液晶ディスプレイや有機EL(electroluminescence)ディスプレイなどを採用することもできるし、投影により表示を実現するプロジェクタを採用することもできる。また、表示装置5の設置台数は、必ずしも1台に限定されずともよく、複数の台数であってかまわない。例えば、プレゼンタもしくはその関係者用の表示装置として液晶ディスプレイを実装すると共に、プレゼンタ及び聴講者の共用の表示装置としてプロジェクタ及びプロジェクタが投影する画像を映すスクリーンを実装することもできる。また、各聴講者に専用の液晶ディスプレイを実装することとしてもかまわない。
この表示装置5は、一例として、プレゼンテーション支援装置10からの指示にしたがってプレゼンテーション画面を表示する。例えば、表示装置5は、プレゼンテーション支援装置10上で動作するプレゼンテーションソフトが開く文書ファイルのスライドを表示する。この場合、表示装置5は、文書ファイルが含むスライドのうちプレゼンタが入力装置7を介して指定する任意のスライドを表示させることもできるし、プレゼンテーションソフトが有するスライドショーの機能がON状態に設定された場合、各スライドが作成されたページ順に文書ファイルが含むスライドを切り替えて表示させることもできる。
入力装置7は、各種の情報に対する指示入力を受け付ける装置である。例えば、表示装置5が液晶ディスプレイとして実装される場合、入力装置7には、マウスやキーボードを採用したり、液晶ディスプレイ上に貼り合わせられたタッチセンサを採用したりすることもできる。また、表示装置5がプロジェクタとして実装される場合、スクリーンに映し出された画面上の位置を指し示すレーザポインタを入力装置7として実装することもできる。すなわち、レーザポインタの中には、スライドのページを進めたり、戻したりする各種のボタンなどの操作部が設けられたリモコン機能付きのレーザポインタも存在する。このリモコン機能付きのレーザポインタが有する操作部を入力装置7として援用することもできる。さらには、レーザポインタによって指し示された光点の位置をセンシングする画像センサを入力装置7として実装することもできる。
この入力装置7は、一例として、プレゼンテーション支援装置10上でプレゼンテーションソフトに実行させる文書ファイルの指定、スライドのページを進める操作やスライドのページを戻す操作などを受け付ける。このように入力装置7を介して受け付けられた操作は、プレゼンテーション支援装置10へ出力されることになる。
プレゼンテーション支援装置10は、プレゼンテーションソフトが実行されるコンピュータである。
一実施形態として、プレゼンテーション支援装置10には、デスクトップ型またはノート型のパーソナルコンピュータなどの情報処理装置を採用することができる。この他、プレゼンテーション支援装置10には、上記のパーソナルコンピュータなどの据置き型の端末のみならず、各種の携帯端末装置を採用することもできる。例えば、携帯端末装置の一例として、スマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistants)などのスレート端末などがその範疇に含まれる。
なお、本実施例では、あくまで一例として、プレゼンテーション支援装置10が上記のプレゼンテーションソフトを外部のリソースに依存せずに単独で実行するスタンドアローンで上記のプレゼンテーション支援サービスを提供する場合を想定する。詳細は後述するが、上記のプレゼンテーション支援サービスは、スタンドアローンで提供される実装に限定されない。例えば、プレゼンテーションソフトを実行するクライアントに対し、上記のプレゼンテーション支援サービスを提供するサーバを設けることによってクライアントサーバシステムとして構築することもできる。
[プレゼンテーション支援装置10の構成]
続いて、本実施例に係るプレゼンテーション支援装置10の機能的構成について説明する。図2は、実施例1に係るプレゼンテーション支援装置10の機能的構成を示すブロック図である。図2に示すように、プレゼンテーション支援装置10は、入出力I/F(InterFace)部11と、記憶部13と、制御部15とを有する。
入出力I/F部11は、マイク3、表示装置5及び入力装置7などの周辺機器との間で入出力を行うインタフェースである。
一実施形態として、入出力I/F部11は、マイク3から入力された音声データを制御部15へ出力する。また、入出力I/F部11は、制御部15から出力されたスライドの画像データを表示装置5へ出力したり、制御部15から出力されたスライドに含まれる領域に対するハイライト指示またはそのキャンセル指示を表示装置5へ出力したりする。また、入出力I/F部11は、入力装置7から入力された各種の操作を制御部15へ出力する。
記憶部13は、制御部15で実行されるOS(Operating System)やプレゼンテーションソフトを始め、アプリケーションプログラムなどの各種プログラムに用いられるデータを記憶するデバイスである。
一実施形態として、記憶部13は、プレゼンテーション支援装置10における主記憶装置として実装される。例えば、記憶部13には、各種の半導体メモリ素子、例えばRAM(Random Access Memory)やフラッシュメモリを採用できる。また、記憶部13は、補助記憶装置として実装することもできる。この場合、HDD(Hard Disk Drive)、光ディスクやSSD(Solid State Drive)などを採用できる。
記憶部13は、制御部15で実行されるプログラムに用いられるデータの一例として、文書データ13a、抽出単語データ13b及び認識単語データ13cを記憶する。なお、上記の文書データ13a以外の抽出単語データ13b及び認識単語データ13cは、制御部15による処理を経て生成される中間データであるので、制御部15の説明で併せて説明することとする。また、記憶部13には、上記のデータ以外にも、他の電子データ、例えばプレゼンテーションの時間割なども併せて記憶することもできるのは言うまでもない。
文書データ13aは、文書に関するデータである。
一実施形態として、文書データ13aには、プレゼンテーションソフトを用いて1または複数のスライドが作成された文書ファイルを採用できる。かかるスライドには、テキストや図形を始め、他のアプリケーションプログラムによって作成されたコンテンツをインポートすることができる。例えば、ワープロソフトで作成された文書、表計算ソフトで作成された表やグラフをインポートしたり、撮像デバイスで撮像された画像や動画、さらには、画像編集ソフトで編集された画像や動画などをインポートしたりすることができる。このように、テキスト以外のコンテンツには、音声認識によるキーワード検索を実現するために、プレゼンテーションの開始前までに当該コンテンツの説明語句や説明文などの文字列を含むメタ情報を付与しておくことができる。
制御部15は、各種のプログラムや制御データを格納する内部メモリを有し、これらによって種々の処理を実行するものである。
一実施形態として、制御部15は、中央処理装置、いわゆるCPU(Central Processing Unit)として実装される。なお、制御部15は、必ずしも中央処理装置として実装されずともよく、MPU(Micro Processing Unit)として実装されることとしてもよい。また、制御部15は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによっても実現できる。
制御部15は、各種のプログラムを実行することによって下記の処理部を仮想的に実現する。例えば、制御部15は、図2に示すように、分割部15aと、抽出部15bと、付与部15cと、認識部15dと、算出部15eと、設定部15fと、表示制御部15gとを有する。
分割部15aは、スライドを複数の領域に分割する処理部である。
一実施形態として、分割部15aは、記憶部13に記憶された文書データ13aが含む文書ファイルのうち先に指定を受け付けた文書ファイルを読み出す。ここでは、一例として、分割部15aが記憶部13から文書ファイルを読み出す場合を例示したが、文書ファイルの入手経路はこれに限定されない。例えば、分割部15aは、ハードディスクや光ディスクなどの補助記憶装置またはメモリカードやUSB(Universal Serial Bus)メモリなどのリムーバブルメディアから画像を取得することもできる。また、取得部15aは、外部装置からネットワークを介して受信することによって画像を取得することもできる。
続いて、分割部15aは、先に読み出した文書ファイルに含まれるスライドを複数の領域へ分割する。例えば、分割部15aは、一文、行、段落などの単位でスライドを分割する。この場合、分割部15aは、スライドが含む文字列を走査して、スペース、句点または改行に対応する区切り文字を検出し、当該区切り文字を領域の境界に設定する。かかる境界を前後に、分割部15aは、スライドが含む文字列を区切る。これによって、スライドが複数の領域へ区切り文字ごとに分割される。その上で、分割部15aは、スライドの分割によって得られた領域に当該領域を識別するインデックスを割り当てる。なお、ここでは、スライドを自動的に分割する場合を例示したが、入力装置7等を介して領域の境界を指定させることによってスライドを手動設定で分割することとしてもよい。
抽出部15bは、領域が含む文字列から単語を抽出する処理部である。
一実施形態として、抽出部15bは、スライドの分割後に、複数の領域のうち領域を1つ選択する。続いて、抽出部15bは、先に選択された領域が含む文字列に対し、自然言語処理を実行することによって単語を抽出する。例えば、抽出部15bは、領域内の文字列に形態素解析等を実行することにより得られた形態素のうち品詞が名詞である単語を抽出する。そして、抽出部15bは、先に抽出された各単語に当該単語が含まれる領域に割り当てられたインデックスを付与する。その後、抽出部15bは、スライドが含む領域が全て選択されるまで上記の単語の抽出及び上記のインデックスの付与を繰返し実行する。なお、ここでは、スライドが含む領域を1つずつ順番に処理する場合を例示したが、各領域を並列して処理することができるのは言うまでもない。
付与部15cは、各単語に重みを付与する処理部である。
一実施形態として、付与部15cは、抽出部15bにより全ての領域から単語が抽出された後に、スライドに含まれる単語ごとに当該単語kの出現頻度fを算出する。かかる出現頻度の一例として、付与部15cは、単語kが同一のスライドに出現する回数を集計することによって単語別の総出現回数を算出する。そして、付与部15cは、先に単語別に算出された出現頻度fに対応する単語の重みwを付与する。この場合、付与部15cは、出現頻度fが高くなるにしたがって重みwが小さい値となる重みの算出式を用いる。例えば、付与部15cは、重みの算出式「w=1/f 」に出現頻度fを代入することによって計算された重みwを単語kに付与する。その上で、付与部15cは、単語k、インデックスidx及び重みwが対応付けられた抽出単語データ13bを記憶部13へ登録する。
図3は、抽出単語データ13bの一例を示す図である。図3には、複数のスライドのうち1つのスライドに関する抽出単語データが抜粋して示されている。図3に示す抽出単語データ13bの例で言えば、単語“a”が領域「idx1」及び領域「idx2」の2つの領域に出現することを意味する。さらに、単語“a”は、出現頻度が「2」であるので、1/2の計算により0.25が重みとして付与されている。また、単語“b”が領域「idx1」及び領域「idx3」の2つの領域に出現することを意味する。さらに、単語“b”も出現頻度が「2」であるので、0.25が重みとして付与されている。また、単語“c”が領域「idx1」及び領域「idx2」の2つの領域に出現することを意味する。さらに、単語“c”も出現頻度が「2」であるので、0.25が重みとして付与されている。また、単語“d”が領域「idx2」及び領域「idx3」の2つの領域に出現することを意味する。さらに、単語“d”も出現頻度が「2」であるので、0.25が重みとして付与されている。最後に、単語“e”が領域「idx3」の1つの領域に出現することを意味する。そして、単語“e”は、出現頻度が「1」であるので、1/1の計算により1が重みとして付与されている。なお、図3には、1つのスライドに関する抽出単語データを例示したが、他のスライドについても各項目の値は異なれども図3の例と同様にコンピュータが単語の領域や重みを識別できる状態で抽出単語データが記憶される。
なお、単語の重みfの算出方法に関する応用例の詳細については後述するが、単語の重みfは上記の例に限定されない。すなわち、付与部15cは、上記の総出現回数以外の他の因子を用いて単語の重みfを算出することもできるし、あるいは上記の総出現回数に他の因子を加えて単語の重みfを算出することができる。
認識部15dは、音声認識を実行する処理部である。
一実施形態として、認識部15dは、プレゼンテーションソフトが文書ファイルを開いた状態でプレゼンテーションの開始指示を受け付けた場合に起動し、マイク3から所定時間長の音声信号が入力されるまで待機する。例えば、少なくとも1フレーム分の時間長、例えば10msecの音声信号が入力されるのを待機する。そして、認識部15dは、マイク3から所定時間長の音声信号が入力される度に、当該音声信号にワードスポッティングなどの音声認識を実行する。このとき、認識部15dは、記憶部13に記憶された抽出単語データ13bのうちプレゼンテーションソフトが実行中である文書ファイルが含むスライドであり、かつ表示装置5に表示中であるスライドに関する抽出単語データをワードスポッティングに適用する。これによって、認識部15dは、プレゼンタの発話の中に表示中のスライドに含まれる各領域から抽出された単語が存在するか否かを認識する。そして、認識部15dは、音声信号から単語が認識された場合、当該単語及びその単語が認識された時間が対応付けられた認識単語データ13cを記憶部13へ登録する。なお、同一の単語が時間経過に伴って複数回にわたって認識される場合には、最後、すなわち最新に認識された時刻が記憶部13へ登録される。
その後、認識部15dは、記憶部13に記憶された認識単語データ13cのうち記憶部13へ登録されてから所定の期間が経過した単語が存在するか否かを判定する。例えば、認識部15dは、認識単語データ13cに含まれる単語ごとに、当該単語に対応付けて登録された時間と、認識部15dが認識単語データ13cを参照する時間、すなわち現時間との差が所定の閾値を超過するか否かを判定する。このとき、認識部15dは、分割部15aによってスライドが分割された単位、例えば一文、行や段落などによって上記の判定に用いる閾値を変えることができる。例えば、スライドが行単位で分割される場合、1つの領域で読み上げられる文字数はおよそ20〜30文字であると想定できる。この場合、上記の閾値の一例として、5〜10秒を用いることができる。また、スライドが段落単位で分割される場合、行単位よりも長い時間が読み上げに割かれると想定できる。この場合、上記の閾値の一例として、20〜30秒を用いることができる。
ここで、記憶部13へ登録されてから所定の期間が経過した単語が存在する場合、当該単語を含むスライドの領域に関する説明が終了している可能性が高まる。このような単語を残しておくと、説明が終了している領域がハイライトで表示される可能性も高まる。よって、認識部15dは、記憶部13に記憶された認識単語データ13cから当該単語に関するレコードを削除する。一方、記憶部13へ登録されてから所定の期間が経過した単語が存在しない場合、認識単語データ13cに含まれる単語が出現するスライドの領域に関する説明が終了していない可能性が高まる。この場合、説明が終了している領域がハイライトで表示される可能性は低い。よって、認識部15dは、記憶部13に記憶された認識単語データ13cに含まれる単語を削除せずにそのまま残す。
また、認識部15dは、表示装置5に表示されるスライドのページが変更されたか否かを判定する。例えば、認識部15dは、スライドショーによりスライドが切り替えられたり、入力装置7を介してスライドのページを進める操作またはスライドのページを戻す操作を受け付けたりしたかを判定する。このとき、表示装置5に表示されるスライドのページが変更された場合、プレゼンタの説明も変更前のページのスライドから変更後のページのスライドへ切り替わった可能性が高い。この場合、認識部15dは、記憶部13に記憶された認識単語データ13cを削除する。一方、表示装置5に表示されるスライドのページが変更されていない場合、プレゼンタが説明するページにも変りがない可能性が高い。この場合、認識部15dは、記憶部13に記憶された認識単語データ13cに含まれる単語を削除せずにそのまま残す。
これら一連の動作により、認識部15dは、表示中であるスライドの中でプレゼンタが説明中である可能性が高い単語を認識する。以下では、抽出単語データ13bに含まれる単語のことを「抽出単語」と記載すると共に、認識単語データ13cに含まれる単語のことを「認識単語」と記載し、互いのラベルを区別する場合がある。
算出部15eは、表示中であるスライド内の領域と、音声認識結果として得られた単語との関連度を算出する処理部である。
一実施形態として、算出部15eは、表示装置5に表示中であるスライドが含む領域のインデックスのうちインデックスを1つ選択する。続いて、算出部15eは、先に選択されたインデックスの領域に対応付けられた抽出単語データ13bの抽出単語のうち認識単語データ13cの認識単語と一致する抽出単語に付与された重みから当該領域の関連度を算出する。例えば、上記の単語の重みwを用いて領域xの関連度rを算出する場合、算出部15eは、認識単語と一致する抽出単語に付与された重みwを合計することによって関連度rを算出できる。このとき、インデックスの領域に対応付けられた抽出単語の中に認識単語と一致する単語が存在しない場合、当該領域の関連度はゼロと算出されることになる。このような算出ロジックによって、スライド内の各領域の記述内容がプレゼンタの発話内容との間で関連している度合いを上記の「関連度」として求める。
設定部15fは、スライド内の領域のハイライト表示を進行させる速度を設定する処理部である。以下では、ハイライト表示を進行させる速度のことを「ハイライト速度」と記載する場合がある。
一実施形態として、設定部15fは、算出部15eにより関連度が算出される度に、関連度が高い領域ほどハイライト速度を高く設定し、あるいは関連度が低い領域ほどハイライト速度を低く設定する。例えば、上記の関連度rを用いて領域xのハイライト速度vを設定する場合、設定部15fは、ハイライト速度vの算出式「v=V×r」に上記の関連度rを代入することによって算出することができる。この算出式に含まれる「V」は、予め定められた固定値である。つまり、上記のハイライト速度vの算出式を用いれば、関連度rの値と比例するハイライト速度vを算出することが可能となる。
表示制御部15gは、表示装置5に対する表示制御を実行する処理部である。
一実施形態として、表示制御部15gは、プレゼンテーションソフトにより文書ファイルが開かれた場合、当該文書ファイルが含むスライドを表示装置5に表示させる。このとき、表示制御部15gは、文書ファイルが含むスライドのうち最初のページのスライドを表示させることとしてもよいし、最後に編集が行われたページのスライドを表示させることとしてもよい。
その後、表示制御部15gは、プレゼンテーションの開始指示を受け付けた場合、設定部15fにより各領域のハイライト速度が設定される度に、次のような処理を実行する。すなわち、表示制御部15gは、表示中のスライドが含む領域ごとに当該領域に設定されたハイライト速度にしたがってハイライト表示を進行させる。すなわち、表示制御部15gは、領域のハイライト速度にゼロよりも大きな値が設定されたからといってハイライト表示を直ちに完了させるとは限らない。つまり、表示制御部15gは、設定部15fにより設定されたハイライト速度でハイライト表示を完了へ向けて進行させる。これによって、ゼロよりも大きいハイライト速度が設定された領域に対し、スライドの作成時に設定された表示形態とは異なる表示形態へ向けてハイライト表示が進行される。以下では、領域のハイライト表示が完了へ向けて進行している度合いのことを「進行度」と記載する場合がある。
ここで、表示制御部15gは、任意のハイライト表示を実行することができる。例えば、表示制御部15gは、スライドの作成時に領域へ設定された輝度よりも領域が含む文字列または文字列の背景の輝度を上昇させることによって強調表示を実現することができる。また、表示制御部15gは、文字列のフォントを変えたり、背景の表示色や塗りつぶしを変えることとしてもかまわない。この他、表示制御部15gは、領域を反転表示させることによって強調表示を実現することもできる。
また、表示制御部15gは、ハイライト表示の進行度が所定の閾値以上である領域の有無を監視する。そして、ハイライト表示の進行度が所定の閾値以上である領域が存在する場合、当該領域は、ハイライト表示の進行度が閾値未満である領域よりもハイライト速度、言い換えれば関連度の総和の平均が高い状態で維持されたと判断できる。この場合、表示制御部15gは、ハイライト表示の進行度が閾値以上である領域のハイライト速度の設定は維持し、ハイライト表示の進行度が閾値未満である領域のハイライト表示を元の状態に戻すと共にハイライト表示の進行度が閾値未満である領域のハイライト速度をゼロにリセットする。これによって、時間経過もしくは認識単語と一致する抽出単語の時間経過による積み重なりから、プレゼンタの説明箇所であると判断できる領域に絞ってハイライト表示を実行させる。
その後、表示制御部15gは、ハイライト表示の進行度が閾値以上である領域で算出部15eにより算出される関連度が低下するか否かを判定する。例えば、今回に算出されるカレントの関連度が前回に算出されたパストの関連度よりも低い場合、時間経過によって認識単語と一致する抽出単語の数が減ったり、あるいは重みの低い抽出単語しか認識単語と一致しなかったりという状況変化があると判断できる。この場合、表示制御部15gは、関連度が低下した領域のハイライト表示を元の状態に戻すと共にハイライト速度をゼロにリセットする。なお、ここでは、カレントの関連度がパストの関連度よりも低い場合にハイライト表示を取り消す場合を例示したが、カレントの関連度がパストの関連度よりも一定値にわたって低い場合にハイライト表示を取り消すこととしてもかまわない。
また、表示制御部15gは、入力装置7を介してページの切替え指示を受け付けた場合、表示装置5に表示させるスライドを変更する。例えば、ページを進める操作を受け付けた場合、表示制御部15gは、表示中のスライドの次ページのスライドを表示装置5に表示させる。また、ページを戻る操作を受け付けた場合、表示制御部15gは、表示中のスライドの前ページのスライドを表示装置5に表示させる。
[具体例]
次に、図4〜図6を用いて、プレゼンテーション支援方法の具体例について説明する。図4は、ハイライト表示の進行度に関する時間変化の一例を示す図である。図5及び図6は、スライド画面の遷移例を示す図である。これら図4には、図3に示した抽出単語データ13bを用いて、表示装置5に表示中であるスライドが含む各領域の関連度が算出される場合が例示されている。また、図5及び図6には、図3に示した抽出単語データ13bの例にしたがって表示装置5に表示中であるスライドがインデックスidx1〜idx3の3つの領域を含む場合が例示されている。なお、ここでは、ハイライト表示の一例として、領域に設定されたハイライト速度にしたがって各領域の反転表示が実行される場合を例示する。
図4に示すように、時刻t1の時点までは、いずれの単語も認識されていないので、インデックスidx1〜idx3のいずれの領域でもハイライト表示が実行されていない。すなわち、図5の最上段に示すように、スライドの作成時に設定された表示形態のままでインデックスidx1〜idx3の領域が表示される。
ここで、時刻t1の時点で単語“a”が認識されたとしたとき、各領域の関連度は、次のように算出される。すなわち、図3に示したように、インデックスidx1及びインデックスidx2の2つの領域には、抽出単語に重み「0.25」が設定された認識単語“a”が含まれるので、関連度が「0.25」と算出される。一方、インデックスidx3の領域には、いずれの認識単語も含まれないので、関連度が「0」と算出される。この結果、インデックスidx1及びインデックスidx2の2つの領域には、関連度「0.25」に比例するハイライト速度が設定されると共に、インデックスidx3の領域には、ハイライト速度がゼロに設定される。
そして、時刻t2の時点では、図5の上から2番目に示すスライド画面となる。すなわち、インデックスidx1及びインデックスidx2の2つの領域は、ハイライト表示が同程度に進行する一方で、インデックスidx3の領域は、ハイライト表示が進行していない状態に遷移する。
この時刻t2の時点で単語“b”が認識されたとする。この場合、インデックスidx1の領域には、抽出単語に重み「0.25」が設定された認識単語“a”と重み「0.25」が設定された認識単語“b”との2つの認識単語が含まれるので、関連度が「0.5」と算出される。また、インデックスidx2の領域には、時刻t1の時点と同様に、抽出単語に重み「0.25」が設定された認識単語“a”が含まれるので、関連度が「0.25」と算出される。一方、インデックスidx3の領域には、抽出単語に重み「0.25」が設定された認識単語“b”が含まれるので、関連度が「0.25」と算出される。この結果、インデックスidx1には、関連度「0.5」に比例するハイライト速度が設定され、インデックスidx2の領域には、関連度「0.25」に比例するハイライト速度が設定され、インデックスidx3の領域には、関連度「0.25」に比例するハイライト速度が設定される。つまり、時刻t2の時点で、各領域のハイライト速度は、「idx1>idx2=idx3」となる。
その後、時刻t3の時点では、図5の上から3番目に示すスライド画面へ遷移する。すなわち、インデックスidx1及びインデックスidx2の2つの領域の間で、ハイライト表示の進行度に差が生じ始める。つまり、インデックスidx1の領域は、インデックスidx2の領域に比べて大きくハイライト表示が進行する。さらに、インデックスidx3の領域は、インデックスidx2よりも遅れてハイライト速度が設定された分、インデックスidx2のハイライト表示の進行度との間に遅れがある。
この時刻t3の時点で単語“c”が認識されたとする。この場合、インデックスidx1の領域には、重み「0.25」が設定された認識単語“a”、重み「0.25」が設定された認識単語“b”、及び、重み「0.25」が設定された認識単語“c”の3つが抽出単語に含まれる。このため、関連度は、「0.25+0.25+0.25」の計算により、「0.75」と算出される。また、インデックスidx2の領域には、抽出単語に重み「0.25」が設定された認識単語“a”と抽出単語に重み「0.25」が設定された認識単語“c”とが含まれるので、関連度が「0.5」と算出される。一方、インデックスidx3の領域には、時刻t2の場合と同様に、抽出単語に重み「0.25」が設定された認識単語“b”が含まれるので、関連度が「0.25」と算出される。この結果、インデックスidx1には、関連度「0.75」に比例するハイライト速度が設定され、インデックスidx2の領域には、関連度「0.5」に比例するハイライト速度が設定され、インデックスidx3の領域には、関連度「0.25」に比例するハイライト速度が設定される。つまり、時刻t3の時点で、各領域のハイライト速度は、「idx1>idx2>idx3」となる。
その後、時刻t4の時点では、図5の上から4番目に示すスライド画面へ遷移する。すなわち、インデックスidx1の領域のハイライト表示が閾値に達する段階まで進行する。一方で、インデックスidx2及びインデックスidx3の2つの領域は、互いの進行度に差はあるものの、進行度は閾値までは達していない。
このようにインデックスidx1の領域のハイライト表示が閾値まで進行した場合、図6の上から1番目に示すスライド画面へ遷移する。つまり、ハイライト表示が閾値まで進行したインデックスidx1の領域は、そのままハイライト表示が維持される一方で、ハイライト表示が閾値まで進行していないインデックスidx2及びインデックスidx3の領域は、ハイライト表示がキャンセルされる。
その後、時刻t5の時点になるまで図6の上から1番目に示すスライド画面のまま遷移し、時刻t5になって認識単語データ13cから認識単語“a”、“b”及び“c”が削除されると、図6の上から2番目に示すスライド画面へ遷移する。すなわち、インデックスidx1〜インデックスidx3の3つの領域には、いずれも認識単語が含まれなくなるので、関連度が「0」と算出される。この結果、ハイライト表示が閾値まで進行したインデックスidx1の領域の関連度が低下するので、インデックスidx1の領域のハイライト表示がキャンセルされる。このため、インデックスidx1〜インデックスidx3の3つの領域は、いずれもスライドの作成時に設定されたデフォルトの表示形態に戻る。そして、図6の上から2番目に示すスライド画面は、時刻t6の時点になって単語“e”が認識されるまで維持される。
その後、時刻t6の時点になって単語“e”が認識されると、各領域の関連度は、次のように算出される。すなわち、3つの領域のうち抽出単語に認識単語“e”が含まれる領域は、インデックスidx3だけである。このため、インデックスidx3の領域には、認識単語“e”に設定された重み「1」が関連度として算出される。一方、インデックスidx1及びインデックスidx2の領域は、いずれの認識単語も含まれないので、関連度が「0」と算出される。この結果、インデックスidx1及びインデックスidx2の2つの領域には、ハイライト速度がゼロに設定されると共に、インデックスidx3の領域には、関連度「1」に比例するハイライト速度が設定される。
この結果、時刻t7の時点では、インデックスidx3の領域のハイライト表示が閾値まで進行する。この場合、図6の上から3番目に示すスライド画面へ遷移する。つまり、ハイライト表示が閾値まで進行したインデックスidx3の領域は、そのままハイライト表示が維持される一方で、インデックスidx2及びインデックスidx3の領域は、いずれもスライドの作成時に設定されたデフォルトの表示形態が維持される。
このとき、インデックスidx3の領域のハイライト表示の進行度が閾値に達するまでの期間は、インデックスidx1の領域のハイライト表示の進行度が閾値に達するまでの期間よりも短い。これは、インデックスidx3の領域には、関連度「1」に比例するハイライト速度が設定されるので、時刻t1、時刻t2及び時刻t3の各時点のうち最高でも、関連度「0.75」に比例するハイライト速度が設定されたインデックスidx1の領域のハイライト表示よりも、進行度が閾値に達するまでの期間は短くなるからである。
これら図5及び図6に示すハイライト表示によって、時刻t1〜時刻t5にかけてプレゼンタがインデックスidx1の領域に関する説明を行う場合に、インデックスidx1の領域を含めてハイライト表示できる。すなわち、時刻t1及び時刻t2の段階で、インデックスidx2やインデックスidx3の領域の抽出単語に認識単語が含まれるからといってインデックスidx2やインデックスidx3の領域のハイライト表示だけが進行される訳ではなく、インデックスidx1の領域もハイライト表示が進行される。したがって、プレゼンタの説明箇所がハイライト表示されない事態を抑制できる。
さらに、プレゼンタが時刻t6からインデックスidx3の領域に関する説明を行う場合には、インデックスidx3の領域の抽出単語にしか含まれない単語が認識される。このようにプレゼンタがインデックスidx3の領域に関する説明を確度が高い場合、インデックスidx3の領域のハイライト表示の進行度を高めることもできる。したがって、プレゼンタの発話からハイライト表示までのレスポンスの低下を抑制しつつ、誤りのおそれがあるハイライト表示に注意が集まる事態を抑制できる。
[処理の流れ]
次に、本実施例に係るプレゼンテーション支援装置10の処理の流れについて説明する。なお、ここでは、プレゼンテーション支援装置10によって実行される(1)重み付与処理、(2)音声認識処理、(3)表示制御処理の順に説明することとする。
(1)重み付与処理
図7は、実施例1に係る重み付与処理の手順を示すフローチャートである。この処理は、自動的に開始することもできるし、手動設定で開始することもできる。例えば、自動的に開始する場合、プレゼンテーションソフトが文書ファイルを記憶部13に保存した上で閉じる場合、あるいはプレゼンテーションを介する文書ファイルの編集中に文書ファイルが記憶部13に保存された場合に、処理を起動させることができる。また、手動設定で開始する場合、入力装置7を介してプレゼンテーションの前処理の実行指示を受け付けた場合に、処理を起動させることができる。いずれの場合においても、記憶部13に記憶された文書データ13aが含む文書ファイルのうち、保存または実行指示に対応する文書ファイルを読み出すことによって処理が開始される。
図7に示すように、分割部15aは、文書ファイルに含まれるスライドを一文、行または段落などの単位で複数の領域へ分割する(ステップS101)。続いて、分割部15aは、ステップS101で得られた領域に各領域を識別するインデックスを割り当てる(ステップS102)。
そして、抽出部15bは、ステップS102で割り当てられたインデックスのうちインデックスを1つ選択する(ステップS103)。続いて、抽出部15bは、ステップS103で選択されたインデックスの領域内の文字列に形態素解析等を実行することにより得られた形態素のうち品詞が名詞である単語を抽出する(ステップS104)。その後、抽出部15bは、ステップS104で抽出された各単語に当該単語が含まれる領域に割り当てられたインデックスを付与する(ステップS105)。
そして、抽出部15bは、ステップS102で割り当てられたインデックスが全て選択されるまで(ステップS106No)、上記のステップS103〜ステップS105までの処理を繰返し実行する。
その後、ステップS101で割り当てられたインデックスが全て選択された場合(ステップS106Yes)、付与部15cは、スライドに含まれる単語ごとに当該単語kの出現頻度fを算出する(ステップS107)。そして、付与部15cは、ステップS107で単語別に算出された出現頻度fに対応する単語の重みwを付与する(ステップS108)。その上で、付与部15cは、単語k、インデックスidx及び重みwが対応付けられた抽出単語データ13bを記憶部13へ登録し(ステップS109)、処理を終了する。
(2)音声認識処理
図8は、実施例1に係る音声認識処理の手順を示すフローチャートである。この処理は、プレゼンテーションソフトが文書ファイルを開いた状態でプレゼンテーションの開始指示を受け付けた場合に起動し、プレゼンテーションの終了指示を受け付けるまで繰返し実行される。
図8に示すように、認識部15dは、マイク3から所定時間長の音声信号が入力されるまで、例えば少なくとも1フレーム分の時間長、例えば10msecの音声信号が入力されるまで待機する(ステップS301)。
そして、マイク3から所定時間長の音声信号が入力されると(ステップS301Yes)、認識部15dは、当該音声信号にワードスポッティングなどの音声認識を実行する(ステップS302)。かかるステップS302でワードスポッティングが実行される場合には、記憶部13に記憶された抽出単語データ13bのうちプレゼンテーションソフトが実行中である文書ファイルが含むスライドであり、かつ表示装置5に表示中であるスライドに関する抽出単語データが辞書データとして適用される。
このとき、音声信号から単語が認識された場合(ステップS303Yes)、認識部15dは、ステップS302で認識された単語及びその単語が認識された時間が対応付けられた認識単語データ13cを記憶部13へ登録し(ステップS304)、ステップS305の処理へ移行する。
一方、マイク3から所定時間長の音声信号が入力されていない場合、あるいは音声信号から単語が認識されなかった場合(ステップS301NoまたはステップS303No)、以降の処理を飛ばしてステップS305の処理へ移行する。
ここで、認識部15dは、記憶部13に記憶された認識単語データ13cのうち記憶部13へ登録されてから所定の期間が経過した単語が存在するか否かを判定する(ステップS305)。そして、記憶部13へ登録されてから所定の期間が経過した単語が存在する場合(ステップS305Yes)、認識部15dは、記憶部13に記憶された認識単語データ13cから当該単語に関するレコードを削除する(ステップS306)。なお、記憶部13へ登録されてから所定の期間が経過した単語が存在しない場合(ステップS305No)には、ステップS306の処理を飛ばしてステップS307の処理へ移行する。
その後、認識部15dは、表示装置5に表示されるスライドのページが変更されたか否かを判定する(ステップS307)。このとき、表示装置5に表示されるスライドのページが変更された場合(ステップS307Yes)、認識部15dは、記憶部13に記憶された認識単語データ13cを削除し(ステップS308)、ステップS301の処理へ戻る。なお、表示装置5に表示されるスライドのページが変更されていない場合(ステップS307No)、ステップS308の処理を実行せずにステップS301の処理へ戻る。
(3)表示制御処理
図9は、実施例1に係る表示制御処理の手順を示すフローチャートである。この処理は、図8に示した音声認識処理と並行して実行される処理であり、プレゼンテーションソフトが文書ファイルを開いた状態でプレゼンテーションの開始指示を受け付けた場合に起動し、プレゼンテーションの終了指示を受け付けるまで繰返し実行される。なお、処理の実行が繰り返される周期は、図8に示した音声認識処理と同様であってもよいし、異なってもよく、図8に示した音声認識処理と同期して実行されることとしてもよいし、非同期で実行されることとしてもかまわない。
図9に示すように、算出部15eは、表示装置5に表示中であるスライドが含む領域のインデックスのうちインデックスを1つ選択する(ステップS501)。続いて、算出部15eは、ステップS501で選択されたインデックスの領域に対応付けられた抽出単語データ13bの抽出単語のうち認識単語と一致する抽出単語に付与された重みから当該領域の関連度を算出する(ステップS502)。
そして、設定部15fは、ステップS501で選択されたインデックスの領域に対し、ステップS502で算出された関連度が高いほどハイライト速度を高く設定し、あるいは関連度が低いほどハイライト速度を低く設定する(ステップS503)。
その後、全てのインデックスが選択されるまで(ステップS504No)、上記のステップS501〜ステップS503までの処理を繰返し実行する。これによって、全ての領域にハイライト速度が設定されるまで上記のステップS501〜ステップS503までの処理が繰返し実行されることになる。
その後、全てのインデックスが選択された場合(ステップS504Yes)、ハイライト表示の進行度が所定の閾値以上である領域の有無を監視する(ステップS505)。このとき、ハイライト表示の進行度が所定の閾値以上である領域が存在しない場合(ステップS505No)、表示制御部15gは、次のような処理を実行する。すなわち、表示制御部15gは、ステップS503で各領域に設定されたハイライト速度にしたがって各領域のハイライト表示を進行させ(ステップS506)、処理を終了する。
一方、ハイライト表示の進行度が所定の閾値以上である領域が存在する場合(ステップS505Yes)、表示制御部15gは、次のような処理を実行する。すなわち、表示制御部15gは、ハイライト表示の進行度が閾値以上である領域のハイライト速度の設定は維持し、ハイライト表示の進行度が閾値未満である領域のハイライト表示を元の状態に戻すことによりハイライト表示をキャンセルし(ステップS507)、ハイライト表示の進行度が閾値未満である領域のハイライト速度をゼロにリセットする(ステップS508)。
続いて、表示制御部15gは、ハイライト表示の進行度が閾値以上である領域でカレントの関連度がパストの関連度未満であるか否かを判定する(ステップS509)。このとき、カレントの関連度がパストの関連度以上である場合(ステップS509No)、表示制御部15gは、ステップS508で各領域に設定されたハイライト速度にしたがって各領域のハイライト表示を進行させ(ステップS506)、処理を終了する。
一方、カレントの関連度がパストの関連度未満である場合(ステップS509Yes)、表示制御部15gは、関連度が低下した領域のハイライト表示を元の状態に戻すことによりハイライト表示をキャンセルし(ステップS510)、ハイライト速度をゼロにリセットし(ステップS511)、処理を終了する。
[効果の一側面]
上述してきたように、本実施例に係るプレゼンテーション支援装置10は、プレゼンテーション画面のうち音声の認識結果として得られた単語を含む領域をハイライト表示させる場合に、単語との関連度が高い領域の表示ほどハイライトの速度を上げ、関連度が低い領域の表示ほどハイライトの速度を下げる。
このように、本実施例に係るプレゼンテーション支援装置10では、ハイライト表示が実行される領域が必ずしも択一に限定されない。このため、音声認識で単語が複数の領域にまたがって検出された場合、各領域でハイライト表示が実行される。それ故、ハイライト表示が実行される領域の中にプレゼンタの説明箇所が含まれる可能性を高めることができる。したがって、本実施例に係るプレゼンテーション支援装置10によれば、プレゼンタの説明箇所がハイライト表示されない事態を抑制できる。
さらに、本実施例に係るプレゼンテーション支援装置10では、音声認識の結果として得た単語及び領域の関連度の高低によって領域をハイライトさせる速度が変化する。例えば、複数の領域がハイライト表示される場合でも、プレゼンタの説明箇所である可能性が高い領域に関するハイライト表示のレスポンスを上げる。これによって、プレゼンタの説明箇所である可能性が高い領域を注目させやすくできる。これと共に、プレゼンタの説明箇所である可能性が低い領域に関するハイライト表示のレスポンスを下げる。これによって、プレゼンタの説明箇所でない可能性が他の領域よりも高い領域が知覚されるのを遅らせることができる。このように、プレゼンタの発話からハイライト表示までのレスポンスの低下を抑制しつつ、誤りのおそれがあるハイライト表示に注意が集まる事態を抑制できる。
さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
[テキスト以外のハイライト表示]
上記の実施例1では、スライドのうち文字列を含む領域をハイライト表示させる場合を例示したが、スライドには、文字列以外にも、グラフ、表、画像や動画などが含まれていてもかまわない。この場合、例えば、プレゼンテーション支援装置10は、グラフ、表、画像や動画に設定されたメタ情報に含まれる文字列から単語を抽出することによって上記の実施例1と同様に抽出単語データを生成することができる。
[ハイライト表示の対象]
上記の実施例1では、ハイライト表示の進行度が閾値以上であるか否かによってハイライトの表示及び非表示を切り替える場合を例示したが、他の因子によってハイライトの表示及び非表示を切り替えることもできる。例えば、表示制御部15gは、領域の関連度または領域のハイライト速度が所定の閾値以上であるか否かによってハイライトの表示及び非表示を切り替えることもできる。この場合、時間経過によってハイライト表示が進行するよりも前にハイライトの表示及び非表示を制御できる。
[出現頻度の応用例]
上記の実施例1では、単語kが同一のスライドに出現する回数が集計された総出現回数を出現頻度として用いる場合を例示したが、必ずしも出現頻度は総出現回数に限定されない。例えば、単語kが各領域間で出現する回数が集計された領域間の出現回数を出現頻度として用いることもできる。一例を挙げれば、インデックスidx1〜idx3の3つの領域のうち単語kが1つの領域に出現される場合には、領域間の出現頻度が1/3であるので、単語kの重みとして1/(1/3)を付与する。このとき、単語kが1つの領域に出現する回数はのべ回数では集計されず、複数回にわたって出現しても同様の重みが付与される。
[重み付与方法の応用例1]
また、上記の実施例1では、単語kの出現頻度に応じて単語kに重みを付与する場合を例示したが、出現頻度以外の因子によって単語kに重みを付与することもできる。例えば、付与部15cは、単語kのモーラ数によって単語kに重みを付与することもできる。具体的には、付与部15cは、単語kのモーラ数が多いほど大きい重みを付与することができる。例えば、重みの算出式の一例として、次の2式を用いることができる。すなわち、単語kのモーラ数mの重みをwとしたとき、モーラ数mが固定値M、例えば「6」よりも大きい場合には、「w=1(m>M)」を用いる一方で、モーラ数mが固定値M以下である場合には、「w=m/M(m≦M)」を用いる。なお、ここでは、モーラ音素を用いる場合を例示したが、他の音素を用いることができるのは言うまでもない。
一般に、モーラ音素が少ないほど音声認識の精度は低下する傾向にある。それ故、上記の重み付与方法により、単語kのモーラ音素が少ない場合よりも単語kのモーラ音素が多い場合の方が大きい重みを付与することで、音声認識の精度が高くなるにつれて大きな重みを付与できる結果、関連度の算出精度も高めることができる。なお、本項で説明した重み付与方法は、上記の実施例1で説明した重み付与方法の代わりに単独で用いて実施することもできるし、また、上記の実施例1で説明した重み付与方法や実施例2で説明する他の重み付与方法と組み合わせて実施することもできる。
[重み付与方法の応用例2]
また、上記の実施例1では、音声認識が実行される前に抽出単語に重みを付与する場合を例示したが、重み付与方法はこれに限定されない。例えば、プレゼンテーション支援装置10は、音声認識が実行された後に認識単語に重みを付与することもできる。すなわち、音声認識が実行される場合には認識単語と共に認識単語が学習データ等の正解である尤もらしさ、いわゆるスコアが算出されることが多い。このため、プレゼンテーション支援装置10は、認識単語にスコアの多寡に応じて重みを付与することもできる。なお、本項で説明した重み付与方法は、上記の実施例1で説明した重み付与方法の代わりに単独で用いて実施することもできるし、また、上記の実施例1で説明した重み付与方法や実施例2で説明する他の重み付与方法と組み合わせて実施することもできる。
[関連度の算出方法の応用例1]
上記の実施例1では、認識単語と一致する抽出単語の数により関連度を領域ごとに算出する場合を例示したが、関連度の算出方法はこれに限定されない。すなわち、上記の実施例1では、認識単語と一致する抽出単語の重みを足し合わせる場合を例示したが、抽出単語の総数に対する、認識単語と一致する抽出単語の数の割合により、関連度を領域ごとに算出することもできる。このような関連度の算出方法を用いる理由は、各領域から抽出される抽出単語の総数が必ずしも同一または略同一であるとは限らないからである。このため、認識単語と一致する抽出単語の重みを足し合わせる場合、抽出単語の総数の少ない領域の方が抽出単語の総数の多い領域よりも関連度が不当に低く算出されることもある。このことから、上記の割合をそのまま関連度として用いたり、上記の割合を用いて認識単語と一致する抽出単語の重みが足し合わされた合計値を正規化することにより、関連度の算出精度を高めることができる。なお、本項で説明した重み付与方法は、上記の実施例1で説明した重み付与方法の代わりに単独で用いて実施することもできるし、また、上記の実施例1で説明した重み付与方法や実施例2で説明する他の重み付与方法と組み合わせて実施することもできる。
[プレゼンタの指示操作]
例えば、プレゼンテーション支援装置10は、入力装置7等を介してハイライト表示の加速指示またはキャンセル指示を受け付けることもできる。例えば、キーボードに含まれる所定のキー、マウスが有する所定のボタン、あるいはリモコン機能付きのレーザポインタが有する所定のボタンに、ハイライト表示を加速する指示を受け付けたり、ハイライト表示をキャンセルする指示を受け付けたりするキーやボタンを割り当てる。そして、プレゼンテーション支援装置10は、ハイライト表示を加速する指示を受け付けた場合に、当該指示を受け付けた段階でハイライト表示の進行度が最も大きい領域のハイライト速度を加速させる。このとき、プレゼンテーション支援装置10は、ハイライト表示の進行度が最も大きい領域のハイライト表示の進行度を一度に閾値まで引き上げることも上記の加速の範疇に含まれる。一方、プレゼンテーション支援装置10は、ハイライト表示を取り消す指示を受け付けた場合に、当該指示を受け付けた段階でハイライト表示の進行度が最も大きい領域のハイライト表示をキャンセルすると共に当該領域のハイライト速度をリセットすることもできる。
ここで、プレゼンタは、プレゼンタ自身がプレゼンテーションに用いるスライドを作成している点、さらには、プレゼンタ自身がプレゼンテーションの前準備としてスライドの説明順序や論理構成を組み立てている点などから、聴講者よりもスライドでハイライト表示された領域を気付くことができる可能性が高い。このため、聴講者がハイライト表示に気付く前にハイライト表示を加速する指示を受け付けたり、ハイライト表示をキャンセルする指示を受け付けたりできる可能性が高まる。したがって、聴講者に対するハイライト表示のレスポンスを高めたり、聴講者が誤ったハイライト表示に気付く事態を抑制したりすることができる。
[関連度の算出範囲]
上記の実施例1では、表示中のスライド内の領域に絞って各領域の関連度を算出する場合を例示したが、必ずしも関連度の算出範囲はこれに限定されない。例えば、表示中のスライド以外の領域についても関連度の算出範囲に含めることもできる。このとき、表示中のスライド以外の領域の関連度が表示中のスライド内の領域の関連度よりも高い場合、プレゼンテーション支援装置10は、表示装置5に表示されるスライドを関連度が最高である領域を持つスライドに切り替えた上で当該領域に関するハイライト表示を進行させることもできる。
[文書ファイルの応用例]
上記の実施例1では、プレゼンテーションソフトによって作成された文書ファイルを用いる場合を例示したが、他のアプリケーションプログラムによって作成された文書ファイルを用いることができる。すなわち、表示時に画面単位で表示されるページを含む文書ファイルであれば、ワープロソフトの文書ファイルが有するページをスライドに読み替えたり、表計算ソフトの文書ファイルが有するシートをスライドに読み替えることによって図7〜図9に示した処理を同様に適用できる。
[他の実装例]
上記の実施例1では、プレゼンテーション支援装置10が上記のプレゼンテーションソフトを外部のリソースに依存せずに単独で実行するスタンドアローンで上記のプレゼンテーション支援サービスを提供する場合を例示したが、他の実装形態を採用することもできる。例えば、プレゼンテーションソフトを実行するクライアントに対し、上記のプレゼンテーション支援サービスを提供するサーバを設けることによってクライアントサーバシステムとして構築することもできる。この場合、パッケージソフトウェアやオンラインソフトウェアとして上記のプレゼンテーション支援サービスを実現するプレゼンテーション支援プログラムをインストールさせることによってサーバ装置を実装できる。例えば、サーバ装置10は、上記のプレゼンテーション支援サービスを提供するWebサーバとして実装することとしてもよいし、アウトソーシングによって上記のプレゼンテーション支援サービスを提供するクラウドとして実装することとしてもかまわない。なお、上記の実施例1では、プレゼンテーション支援プログラムがプレゼンテーションソフトにアドオンされる場合を想定したが、ライセンス権限を有するクライアントからプレゼンテーション支援プログラムをライブラリとして参照する要求を受け付けた場合に、プレゼンテーション支援プログラムをプラグインさせることもできる。
[プレゼンテーション支援プログラム]
また、上記の実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図10を用いて、上記の実施例と同様の機能を有するプレゼンテーション支援プログラムを実行するコンピュータの一例について説明する。
図10は、実施例1及び実施例2に係るプレゼンテーション支援プログラムを実行するコンピュータのハードウェア構成例を示す図である。図10に示すように、コンピュータ100は、操作部110aと、スピーカ110bと、カメラ110cと、ディスプレイ120と、通信部130とを有する。さらに、このコンピュータ100は、CPU150と、ROM160と、HDD170と、RAM180とを有する。これら110〜180の各部はバス140を介して接続される。
HDD170には、図10に示すように、上記の実施例1で示した分割部15a、抽出部15b、付与部15c、認識部15d、算出部15e、設定部15f及び表示制御部15gと同様の機能を発揮するプレゼンテーション支援プログラム170aが記憶される。このプレゼンテーション支援プログラム170aは、図2に示した分割部15a、抽出部15b、付与部15c、認識部15d、算出部15e、設定部15f及び表示制御部15gの各構成要素と同様、統合又は分離してもかまわない。すなわち、HDD170には、必ずしも上記の実施例1で示した全てのデータが格納されずともよく、処理に用いるデータがHDD170に格納されればよい。
このような環境の下、CPU150は、HDD170からプレゼンテーション支援プログラム170aを読み出した上でRAM180へ展開する。この結果、プレゼンテーション支援プログラム170aは、図10に示すように、プレゼンテーション支援プロセス180aとして機能する。このプレゼンテーション支援プロセス180aは、RAM180が有する記憶領域のうちプレゼンテーション支援プロセス180aに割り当てられた領域にHDD170から読み出した各種データを展開し、この展開した各種データを用いて各種の処理を実行する。例えば、プレゼンテーション支援プロセス180aが実行する処理の一例として、図7〜図9に示す処理などが含まれる。なお、CPU150では、必ずしも上記の実施例1で示した全ての処理部が動作せずともよく、実行対象とする処理に対応する処理部が仮想的に実現されればよい。
なお、上記のプレゼンテーション支援プログラム170aは、必ずしも最初からHDD170やROM160に記憶されておらずともかまわない。例えば、コンピュータ100に挿入されるフレキシブルディスク、いわゆるFD、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させる。そして、コンピュータ100がこれらの可搬用の物理媒体から各プログラムを取得して実行するようにしてもよい。また、公衆回線、インターネット、LAN、WANなどを介してコンピュータ100に接続される他のコンピュータまたはサーバ装置などに各プログラムを記憶させておき、コンピュータ100がこれらから各プログラムを取得して実行するようにしてもよい。
1 プレゼンテーション支援システム
3 マイク
5 表示装置
7 入力装置
10 プレゼンテーション支援装置
11 入出力I/F部
13 記憶部
15 制御部
15a 分割部
15b 抽出部
15c 付与部
15d 認識部
15e 算出部
15f 設定部
15g 表示制御部

Claims (13)

  1. コンピュータが、
    表示時に画面単位で表示されるページを含む文書ファイルのページが分割された領域ごとに当該領域が含む文字列から第1の単語を抽出し、
    音声認識を実行し、
    所定の表示部に表示中であるページ内の領域ごとに当該領域から抽出された第1の単語と前記音声認識の結果として得られる第2の単語とから関連度を算出し、
    前記領域ごとに算出された関連度が高い領域ほど前記領域のハイライト表示を進行させる速度を高く設定し、あるいは関連度が低い領域ほど前記領域のハイライト表示を進行させる速度を低く設定し、
    前記領域ごとに設定された速度にしたがって前記ページ内のハイライト表示を制御する
    処理を実行することを特徴とするプレゼンテーション支援方法。
  2. 前記コンピュータが、
    前記音声認識の結果として得られる第2の単語を記憶部に登録してから所定の期間にわたって保存する処理をさらに実行し、
    前記算出する処理は、前記記憶部に記憶された第2の単語を用いて前記関連度を前記領域ごとに算出し、
    前記設定する処理は、前記領域ごとに前記関連度が算出される度に、各領域のハイライト表示の速度を設定することを特徴とする請求項1に記載のプレゼンテーション支援方法。
  3. 前記制御する処理は、前記関連度または前記ハイライト表示の進行度が所定の閾値以上である領域に関するハイライト表示を実行することを特徴とする請求項1または2に記載のプレゼンテーション支援方法。
  4. 前記制御する処理は、前記関連度または前記ハイライト表示の進行度が所定の閾値未満である領域に関するハイライト表示をキャンセルすることを特徴とする請求項3に記載のプレゼンテーション支援方法。
  5. 前記コンピュータが
    前記領域ごとに抽出される第1の単語に重みを付与する処理をさらに実行することを特徴とする請求項1に記載のプレゼンテーション支援方法。
  6. 前記付与する処理は、前記ページ内における第1の単語の出現頻度を用いて、前記第1の単語に重みを付与することを特徴とする請求項5に記載のプレゼンテーション支援方法。
  7. 前記付与する処理は、前記第1の単語のモーラ数を用いて、前記第1の単語に重みを付与することを特徴とする請求項5に記載のプレゼンテーション支援方法。
  8. 前記算出する処理は、前記第2の単語と一致する第1の単語の数により、前記関連度を前記領域ごとに算出することを特徴とする請求項1に記載のプレゼンテーション支援方法。
  9. 前記算出する処理は、前記領域から抽出された第1の単語の数に対する、前記第2の単語と一致する第1の単語の数の割合により、前記関連度を前記領域ごとに算出することを特徴とする請求項1に記載のプレゼンテーション支援方法。
  10. 前記コンピュータが、
    前記ハイライト表示を加速する指示を受け付け、
    前記制御する処理は、前記指示を受け付けた場合に、前記ハイライト表示の進行度が最も高い領域のハイライト表示を加速させることを特徴とする請求項1に記載のプレゼンテーション支援方法。
  11. 前記コンピュータが、
    前記ハイライト表示をキャンセルする指示を受け付け、
    前記制御する処理は、前記指示を受け付けた場合に、前記ハイライト表示の進行度が最も高い領域以外の領域のハイライト表示をキャンセルすることを特徴とする請求項1に記載のプレゼンテーション支援方法。
  12. コンピュータに、
    表示時に画面単位で表示されるページを含む文書ファイルのページが分割された領域ごとに当該領域が含む文字列から第1の単語を抽出し、
    音声認識を実行し、
    所定の表示部に表示中であるページ内の領域ごとに当該領域から抽出された第1の単語と前記音声認識の結果として得られる第2の単語とから関連度を算出し、
    前記領域ごとに算出された関連度が高い領域ほど前記領域のハイライト表示を進行させる速度を高く設定し、あるいは関連度が低い領域ほど前記領域のハイライト表示を進行させる速度を低く設定し、
    前記領域ごとに設定された速度にしたがって前記ページ内のハイライト表示を制御する
    処理を実行させることを特徴とするプレゼンテーション支援プログラム。
  13. 表示時に画面単位で表示されるページを含む文書ファイルのページが分割された領域ごとに当該領域が含む文字列から第1の単語を抽出する抽出部と、
    音声認識を実行する認識部と、
    所定の表示部に表示中であるページ内の領域ごとに当該領域から抽出された第1の単語と前記音声認識の結果として得られる第2の単語とから関連度を算出する算出部と、
    前記領域ごとに算出された関連度が高い領域ほど前記領域のハイライト表示を進行させる速度を高く設定し、あるいは関連度が低い領域ほど前記領域のハイライト表示を進行させる速度を低く設定する設定部と、
    前記領域ごとに設定された速度にしたがって前記ページ内のハイライト表示を制御する表示制御部と
    を有することを特徴とするプレゼンテーション支援装置。
JP2016556070A 2014-10-27 2014-10-27 プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 Active JP6304396B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/078533 WO2016067348A1 (ja) 2014-10-27 2014-10-27 プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置

Publications (2)

Publication Number Publication Date
JPWO2016067348A1 true JPWO2016067348A1 (ja) 2017-05-25
JP6304396B2 JP6304396B2 (ja) 2018-04-04

Family

ID=55856743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016556070A Active JP6304396B2 (ja) 2014-10-27 2014-10-27 プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置

Country Status (2)

Country Link
JP (1) JP6304396B2 (ja)
WO (1) WO2016067348A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6651985B2 (ja) * 2016-05-26 2020-02-19 富士通株式会社 雑談検出装置、画像表示システム、雑談検出方法及び雑談検出プログラム
JP2019124750A (ja) * 2018-01-12 2019-07-25 株式会社日立ソリューションズ プレゼンテーション資料を表示する方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002023716A (ja) * 2000-07-05 2002-01-25 Pfu Ltd プレゼンテーションシステムおよび記録媒体
JP2011065467A (ja) * 2009-09-17 2011-03-31 Sharp Corp 会議中継装置及びコンピュータプログラム
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002023716A (ja) * 2000-07-05 2002-01-25 Pfu Ltd プレゼンテーションシステムおよび記録媒体
JP2011065467A (ja) * 2009-09-17 2011-03-31 Sharp Corp 会議中継装置及びコンピュータプログラム
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム

Also Published As

Publication number Publication date
JP6304396B2 (ja) 2018-04-04
WO2016067348A1 (ja) 2016-05-06

Similar Documents

Publication Publication Date Title
US10403267B2 (en) Method and device for performing voice recognition using grammar model
JP6432405B2 (ja) プレゼンテーション支援装置、プレゼンテーション支援方法及びプレゼンテーション支援プログラム
US9548052B2 (en) Ebook interaction using speech recognition
WO2015169134A1 (en) Method and apparatus for phonetically annotating text
CN107430851B (zh) 发言提示装置及发言提示方法
US9196253B2 (en) Information processing apparatus for associating speaker identification information to speech data
US20150073801A1 (en) Apparatus and method for selecting a control object by voice recognition
US9583105B2 (en) Modification of visual content to facilitate improved speech recognition
JP2020003926A (ja) 対話システムの制御方法、対話システム及びプログラム
JP2009042968A (ja) 情報選別システム、情報選別方法及び情報選別用プログラム
US20220121712A1 (en) Interactive representation of content for relevance detection and review
JP6304396B2 (ja) プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置
JP2018005011A (ja) プレゼンテーション支援装置、プレゼンテーション支援システム、プレゼンテーション支援方法及びプレゼンテーション支援プログラム
TW201506685A (zh) 以語音辨識來選擇控制客體的裝置及方法
US20210165540A1 (en) Information processing device, information processing method, and program
US20130179165A1 (en) Dynamic presentation aid
JP6372577B2 (ja) プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置
JP2018045193A (ja) 通信端末、音声変換方法、及びプログラム
JP6399221B2 (ja) プレゼンテーション支援装置、プレゼンテーション支援方法及びプレゼンテーション支援プログラム
JPWO2020116001A1 (ja) 情報処理装置および情報処理方法
WO2023273702A1 (zh) 一种语音信息与演示信息同步的方法及装置
JP6350682B2 (ja) プレゼンテーション支援装置、プレゼンテーション支援方法及びプレゼンテーション支援プログラム
JP6651985B2 (ja) 雑談検出装置、画像表示システム、雑談検出方法及び雑談検出プログラム
JP5244460B2 (ja) 情報自動編成提示装置および情報自動編成提示処理プログラム
JP2008243079A (ja) 情報管理装置、情報管理方法及び情報管理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161228

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180219

R150 Certificate of patent or registration of utility model

Ref document number: 6304396

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150