WO2008069187A1

WO2008069187A1 - プレゼンテーション支援装置および方法並びにプログラム

Info

Publication number: WO2008069187A1
Application number: PCT/JP2007/073356
Authority: WO
Inventors: Takeo Igarashi; Kazutaka Kurihara; Masataka Goto; Jun Ogata; Yosuke Matsusaka
Original assignee: The University Of Tokyo; National Institute Of Advanced Industrial Science And Technology
Priority date: 2006-12-05
Filing date: 2007-12-04
Publication date: 2008-06-12
Also published as: JP2008139762A

Abstract

　プレゼンテーション支援装置２０は、話し手の音声に基づく音響情報を取得する音響情報処理部３１と、話し手の身体的動作に関する画像情報を取得する画像情報処理部３４と、音響情報処理部３１からの音響情報に基づいて話し手による発話に関連した所定の音響的評価指標を算出すると共に、音響情報処理部３１からの音響情報と画像情報処理部３４からの画像情報との少なくとも何れか一方に基づいて話し手による所作に関連した所定の所作的評価指標を算出する指標演算部３５と、話し手に対して指標演算部３５により算出された音響的評価指標および所作的評価指標に基づくフィードバックを提供可能な統合処理部３６とを有する。

Description

明細書

プレゼンテーション支援装置および方法並びにプログラム

技術分野

[0001] 本発明は、プレゼンテーションを実行する話し手を支援するためのプレゼンテーシヨン支援装置および方法並びにプログラムに関する。

背景技術

[0002] プレゼンテーションは、話し手が自らの知識や考え等を聞き手に伝達 ·発表する行為であり、研究発表の場のみならずビジネスシーンを始めとした様々な分野において重要な役割を果たすものである。このため、従来から、プレゼンテーション用の資料を作成するためのツールだけではなぐより良いプレゼンテーションの実行が可能となるように、実際のプレゼンテーション中に話し手にアドバイスすることゃプレゼンテーションの練習を可能とするプレゼンテーション支援装置が提案されて!/、る。このようなプレゼンテーシヨン支援装置としては、プレゼンテーション資料に対して話し手により発声された音声を解析して話し手による説明の適切度を算出し、算出した適切度に基づいて話し手にアドバイスを行うもの（例えば、特許文献 1参照）や、話し手の発話速度を検出すると共に検出した発話速度に基づいて話し手にアドバイスを行うもの（例えば、特許文献 2参照）等が知られている。また、このようなプレゼンテーション支援装置として、話し手の音声に基づいて当該話し手の心理状態を認識し、認識結果に応じた反応（例えば「声が上擦って!/、ますよ」とレ、つたようなメッセージ)を発表内容と共に表示手段に表示するもの（例えば、特許文献 3参照）も知られている。

特許文献 1：特開平 02— 223983号公報

特許文献 2 :特開 2005— 208163号公報

特許文献 3 :特開平 10— 254484号公報

発明の開示

[0003] ところで、いわゆる対人コミュニケーションに関し、自己の感情等を聞き手に伝達する際、話し手は専ら音声の状態や表情、身振り等の身体的所作といった非言語情報に依存しており、コミュニケーションにおける言語情報の寄与分はごく僅かである、という研究報告もなされている。このような点に鑑みれば、より良いプレゼンテーションを実行可能とするためには、上記従来のプレゼンテーション支援装置のように話し手の音声のみを解析処理するだけでは不充分であり、プレゼンテーションの実行中や練習中に話し手による非言語情報をより適正に把握できるようにする必要がある。一方、プレゼンテーションを実行する話し手の心理状態を計数処理により正確に捉えることは困難であり、話し手の心理状態をフィードバックするプレゼンテーション支援装置には、実現性や実用性の面で問題があるとレ、わざるを得なレ、。

[0004] そこで、本発明は、話し手の音声の状態や身体的所作等の非言語情報をより適正に把握可能であり、より良いプレゼンテーションの実行やプレゼンテーションスキルの向上に寄与し得るプレゼンテーション支援装置および方法並びにプログラムの提供を目的の一つとする。また、本発明は、より実用的なプレゼンテーション支援装置および方法並びにプログラムの提供を目的の一つとする。

[0005] 本発明によるプレゼンテーション支援装置および方法並びにプログラムは、上述の目的の少なくとも一部を達成するために以下の手段を採っている。

[0006] 本発明によるプレゼンテーション支援装置は、

プレゼンテーションを実行する話し手を支援するためのプレゼンテーション支援装置であって、

前記話し手の音声に基づく音響情報を取得する音響情報取得手段と、前記話し手の身体的動作に関する画像情報を取得する画像情報取得手段と、前記音響情報取得手段により取得された音響情報に基づいて前記プレゼンテーシヨン中の前記話し手による発話に関連した所定の音響的評価指標を算出すると共に前記音響情報取得手段により取得された音響情報と前記画像情報取得手段により取得された画像情報との少なくと何れか一方に基づいて前記プレゼンテーション中の前記話し手による所作に関連した所定の所作的評価指標を算出する評価指標算出手段と、

前記話し手に対して前記評価指標算出手段により算出された前記音響的評価指標および前記所作的評価指標に基づくフィードバックを提供可能なフィードバック手段と、

を備えるものである。

[0007] このプレゼンテーション支援装置は、実際のプレゼンテーションゃプレゼンテーションの練習に際し、話し手の音声に基づく音響情報と話し手の身体的動作に関する画像情報とを取得し、取得した音響情報に基づいてプレゼンテーション (以下、練習時のものを含む）中の話し手による発話に関連した所定の音響的評価指標を算出すると共に、取得した音響情報と画像情報との少なくとも何れか一方に基づ!/、てプレゼンテーシヨン中の話し手による所作に関連した所定の所作的評価指標を算出する。そして、このプレゼンテーション支援装置は、話し手に対してこれらの音響的評価指標と所作的評価指標とに基づくフィードバックをほぼリアルタイムあるいは事後的に提供可能である。このように、実際のプレゼンテーションやプレゼンテーションの練習に際して、話し手の音声に基づく音響情報のみならず話し手の身体的動作に関する画像情報を取得し、音響情報と画像情報との少なくとも何れか一方に基づいて所作的評価指標をも算出するようにすれば、プレゼンテーションの実行中あるいは練習中に話し手の音声の状態や身体的所作等の非言語情報をより適正に把握することが可能となるので、より良いプレゼンテーションの実行やプレゼンテーションスキルの向上に寄与し得るより実用的なプレゼンテーション支援装置の実現が可能となる。

[0008] また、前記画像情報は、前記話し手の少なくとも顔の向きに関する顔情報を含んでもよぐ前記評価指標算出手段は、前記画像情報取得手段により取得された前記顔情報に基づいて前記話し手による聞き手とのアイコンタクトの度合を示す指標を前記所作的評価指標として算出するものであってもよい。すなわち、プレゼンテーションに際して話し手がより適切に聞き手に目を向けるようになれば、そのプレゼンテーションは説得力に満ちた印象のよいものとなる。従って、このようにアイコンタクトの度合を示す指標を所作的評価指標の一つとすれば、プレゼンテーション支援装置をより良いプレゼンテーションの実行やプレゼンテーションスキルの向上に寄与し得るより実用的なあのとすること力でさる。

[0009] 更に、前記音響情報は、前記話し手による連続した発話区間の時間を示す発話時間情報を含むと共に、前記画像情報は、前記話し手の少なくとも顔の向きに関する顔情報を含んでもよぐ前記評価指標算出手段は、前記音響情報取得手段により取得された前記発話時間情報と前記画像情報取得手段により取得された前記顔情報との少なくとも何れか一方に基づいて前記プレゼンテーション中の前記話し手による間の取り方に関する指標を前記所作的評価指標として算出するものであってもよい。すなわち、プレゼンテーションに際して、話し手が例えば聞き手に目を向けた状態での意図的な沈黙すなわち効果的な間をより適切につくり出せれば、そのプレゼンテーシヨンは聞き手を引きつける印象のよいものとなる。従って、音響情報と画像情報との少なくとも何れか一方に基づく間の取り方に関する指標を所作的評価指標の一つとすれば、プレゼンテーション支援装置をより良いプレゼンテーションの実行ゃプレゼンテーシヨンスキルの向上に寄与し得るより実用的なものとすることができる。

[0010] また、前記音響情報は、前記話し手による連続した発話区間の時間を示す発話時間情報と該発話区間における音節数を示す音節情報とを含んでもよぐ前記評価指標算出手段は、前記音響情報取得手段により取得された前記発話時間情報および前記音節情報に基づいて前記話し手による話速度を示す指標を前記音響的評価指標として算出するものであってもよい。すなわち、プレゼンテーション中の話し手による話速度がより適切なものであれば、そのプレゼンテーションは聞き取りやす!/、印象のよいものとなる。従って、話し手による話速度を示す指標を音響的評価指標の一つとすれば、プレゼンテーション支援装置をより良いプレゼンテーションの実行ゃプレゼンテーシヨンスキルの向上に寄与し得るより実用的なものとすることができる。

[0011] 更に、前記音響情報は、前記話し手の音声の基本周波数を示す基本周波数情報を含んでもよぐ前記評価指標算出手段は、前記音響情報取得手段により取得された前記基本周波数情報に基づいて前記話し手による発話の抑揚を示す指標を前記音響的評価指標として算出するものであってもよい。すなわち、プレゼンテーション中の話し手による発話の抑揚がより適切なものであれば、そのプレゼンテーションはメリノ、リのきいた印象のよいものとなる。従って、話し手による発話の抑揚を示す指標を音響的評価指標の一つとすれば、プレゼンテーション支援装置をより良いプレゼンテーシヨンの実行やプレゼンテーションスキルの向上に寄与し得るより実用的なものとすること力 Sでさる。 [0012] また、前記音響情報は、前記話し手の音声の基本周波数を示す基本周波数情報と該基本周波数に基づくスペクトル包絡を示すスペクトル包絡情報とを含んでもよぐ前記評価指標算出手段は、前記音響情報取得手段により取得された前記基本周波数情報および前記スペクトル包絡情報に基づいて前記プレゼンテーション中の前記話し手による言い淀みに関する指標を前記音響的評価指標として算出するものであつてもよい。すなわち、話し手によるプレゼンテーション中の言い淀みがより少なくなれば、そのプレゼンテーションは自信に満ちた印象のよいものとなる。従って、話し手によるプレゼンテーション中の言い淀みに関する指標を音響的評価指標の一つとすれば、プレゼンテーション支援装置をより良いプレゼンテーションの実行ゃプレゼンテーシヨンスキルの向上に寄与し得るより実用的なものとすることができる。

[0013] 更に、前記フィードバック手段は、前記評価指標算出手段により算出された前記音響的評価指標および前記所作的評価指標の少なくとも何れか一つをそれに対応した閾値と比較すると共に、比較結果に応じて前記プレゼンテーションを実行してレ、る前記話し手に所定の警告を付与可能なものであってもよい。これにより、実際のプレゼンテーシヨンやプレゼンテーションの練習に際し、そのプレゼンテーションがより良いものとなるように、話し手にほぼリアルタイムで現状を把握させることが可能となる。

[0014] 本発明によるプレゼンテーション支援方法は、プレゼンテーションを実行する話し手を支援するためのプレゼンテーション支援方法であって、

(a)前記話し手の音声に基づく音響情報と前記話し手の身体的動作に関する画像情報とを取得するステップと、

(b)ステップ (a)で取得された前記音響情報に基づいて前記プレゼンテーション中の前記話し手による発話に関連した所定の音響的評価指標を算出すると共に、ステツプ ωで取得された前記音響情報および前記画像情報の少なくと何れか一方に基づいて前記プレゼンテーション中の前記話し手による所作に関連した所定の所作的評価指標を算出するステップと、

(C)前記話し手に対してステップ (b)で算出された前記音響的評価指標および前記所作的評価指標に基づくフィードバックを提供するステップと、

を含むものである。 [0015] このプレゼンテーション支援方法は、プレゼンテーションの実行中あるいは練習中に話し手の音声の状態や身体的所作等の非言語情報をより適正に把握することを可能とするものであり、より良いプレゼンテーションの実行やプレゼンテーションスキルの向上に寄与し得る。

[0016] また、ステップ (a)は、前記画像情報として、前記話し手の少なくとも顔の向きに関する顔情報を取得するものであってもよぐステップ (b)は、ステップ（a)にて取得された前記顔情報に基づいて前記話し手による聞き手とのアイコンタクトの度合を示す指標を前記所作的評価指標として算出するものであってもよい。

[0017] 更に、ステップ (a)は、前記音響情報として、前記話し手による連続した発話区間の時間を示す発話時間情報を取得すると共に、前記画像情報として、前記話し手の少なくとも顔の向きに関する顔情報を取得するものであってもよぐステップ (b)は、ステツプ (a)にて取得された前記発話時間情報と前記顔情報との少なくとも何れか一方に基づいて前記プレゼンテーション中の前記話し手による間の取り方に関する指標を前記所作的評価指標として算出するものであってもよい。

[0018] また、ステップ ωは、前記音響情報として、前記話し手による連続した発話区間の時間を示す発話時間情報と該発話区間における音節数を示す音節情報とを取得するものであってもよく、ステップ (b)は、ステップ (a)にて取得された前記発話時間情報および前記音節情報に基づいて前記話し手による話速度を示す指標を前記音響的評価指標として算出するものであってもよい。

[0019] 更に、ステップ (a)は、前記音響情報として、前記話し手の音声の基本周波数を示す基本周波数情報を取得するものであってもよぐステップ (b)は、ステップ（a)にて取得された前記基本周波数情報に基づいて前記話し手による発話の抑揚を示す指標を前記音響的評価指標として算出するものであってもよい。

[0020] また、ステップ (a)は、前記音響情報として、前記話し手の音声の基本周波数を示す基本周波数情報と該基本周波数に基づくスペクトル包絡を示すスペクトル包絡情報とを取得するものであってもよぐステップ (b)は、ステップ (a)にて取得された前記基本周波数情報および前記スペクトル包絡情報に基づいて前記プレゼンテーション中の前記話し手による言い淀みに関する指標を前記音響的評価指標として算出するものであってもよい。

[0021] 本発明によるプレゼンテーション支援プログラムは、プレゼンテーションを実行する話し手を支援するためのプレゼンテーション支援装置としてコンピュータを機能させるプレゼンテーション支援プログラムであって、

前記話し手の音声に基づく音響情報を取得する音響情報取得モジュールと、前記話し手の身体的動作に関する画像情報を取得する画像情報取得モジュールと、

前記音響情報取得モジュールにより取得された音響情報に基づいて前記プレゼンテーシヨン中の前記話し手による発話に関連した所定の音響的評価指標を算出すると共に、前記音響情報取得モジュールにより取得された音響情報と前記画像情報取得モジュールにより取得された画像情報との少なくとも何れか一方に基づいて前記プレゼンテーション中の前記話し手による所作に関連した所定の所作的評価指標を算出する評価指標算出モジュールと、

前記話し手に対して前記評価指標算出モジュールにより算出された前記音響的評価指標および前記所作的評価指標に基づくフィードバックを提供可能なフィードバックモシユーノレと、

を備えるものである。

[0022] このプレゼンテーション支援プログラムがインストールされたコンピュータは、プレゼンテーシヨンの実行中あるいは練習中に話し手の音声の状態や身体的所作等の非言語情報をより適正に把握することを可能とするものであり、より良いプレゼンテーシヨンの実行やプレゼンテーションスキルの向上に寄与し得る。

図面の簡単な説明

[0023] [図 1]本発明の一実施例に係るプレゼンテーション支援装置 20を用いてプレゼンテーシヨンを実行している様子を示す説明図である。

[図 2]本発明の一実施例に係るプレゼンテーション支援装置 20の概略構成図である

〇

[図 3]話し手 10が聞き手 100の方を向いているか否か判定する手順を示す説明図である。 [図 4]話し手 10がプレゼンテーションを実行している際に主にメインコンピュータ 30の指標演算部 35と統合処理部 36とにより実行される処理の一例を示すフローチャートである。

[図 5]話し手 10がプレゼンテーションを実行している際にサブコンピュータ 40の表示画面 41に表示されるリアルタイムモニタ 44の一例を示す説明図である。

発明を実施するための最良の形態

[0024] 次に、実施例を参照しながら本発明を実施するための最良の形態について説明す

[0025] 図 1は、本発明の一実施例に係るプレゼンテーション支援装置 20を用いてプレゼンテーシヨンを実行して!/、る力、、あるいはプレゼンテーションのリハーサルを行って!/ヽる様子を示す説明図であり、図 2は、本発明の一実施例に係るプレゼンテーション支援装置 20の概略構成図である。図 1および図 2に示すように、実施例のプレゼンテーシヨン支援装置 20は、話し手 10によるプレゼンテーションを支援するための主たる処理を実行するメインコンピュータ 30と、プレゼンテーションの実行に際して話し手 10 により使用されるサブコンピュータ 40と、プレゼンテーションを実行する話し手 10を撮影して当該話し手 10の画像を取り込み可能な画像取り込み手段（撮像手段）としてのカメラ 50と、プレゼンテーションを実行する話し手 10の音声を取り込む集音手段としてのマイクロフォン 60と、所定の警告機器 70 (図 2参照)等とを含む。

[0026] メインコンピュータ 30とサブコンピュータ 40とは、何れも図示しない CPU, ROM, R AM、グラフィックプロセッサ（GPU)、システムバス、各種インターフェース、記憶装置 (ハードディスクドライブ）、外部記憶装置、一体化または別体化された液晶ディスプレイ等の表示ユニット等を含む汎用のコンピュータであり、両者は相互に通信可能とされる。メインコンピュータ 30には、本発明によるプレゼンテーション支援プログラムがインストールされ、実施例では、サブコンピュータ 40に所定のプレゼンテーションソフトがインストールされる。そして、プレゼンテーション用の資料は、サブコンピュータ 4 0に接続されるプロジェクタ 80によりスクリーン 90に投影される。また、カメラ 50としては、例えば一般的なウェブカメラを使用可能であり、カメラ 50は、プレゼンテーションを実行する話し手 10の特に顔を撮影できるように例えばサブコンピュータ 40の適所に装着される。実施例では、カメラ 50はサブコンピュータ 40に接続されており、カメラ 50からの画像データは、連続的な動画あるいは静止画としてサブコンピュータ 40に一旦取り込まれる。更に、マイクロフォン 60としては、ピンマイク、ヘッドセットマイク、卓上据え置き型マイク等を使用可能であり、実施例では、マイクロフォン 60からの音声データはメインコンピュータ 30に取り込まれる。そして、警告機器 70は、メインコンピュータ 30に接続され、プレゼンテーション支援に際してメインコンピュータ 30からプレゼンテーシヨンを実行する話し手 10に対して所定の警告を付与する際に利用される。警告機器 70は、プレゼンテーションの実行に際して話し手 10の目が届きやすい位置に配置される例えばメインコンピュータ 30に接続されたモニタ等とされる力このような話し手 10に警告を視覚的に付与する装置に限られず、話し手 10に対して音や振動により警告を付与する装置等を警告機器 70とすることもできる。例えば、マナーモード状態にある携帯電話を話し手 10に所持させ、話し手 10に警告を付与する際にメインコンピュータ 30から当該携帯電話にメールを送信してもよい。この場合、警告の種類ごとに着信パターン (振動パターン)を異ならせれば、複数の警告を話し手 10 に付与することが可能となる。なお、実施例では、プレゼンテーション支援装置 20の上記構成要素間における通信に、例えば RVCPプロトコル (後藤真孝他："音声補完：音声入力インタフェースへの新しいモダリティの導入， "コンピュータソフトウェア， V ol. 19, No. 4, pp. 10- 21 , 2002.参照、）カ用いられる。

[0027] そして、メインコンピュータ 30には、図 2に示すように、図示しない CPUや ROM, R AM, GPU、各種インターフェース、記憶装置といったハードウェアと、インストールされたプレゼンテーション支援プログラムを始めとする各種プログラムとの一方または双方の協働により、音響情報処理部 31と、画像情報処理部 34と、指標演算部 35、統合処理部 36と、データ記憶部 37等とが機能ブロックとして構築されている。

[0028] 音響情報処理部 31は、マイクロフォン 60により集音された話し手 10の音声データを当該マイクロフォン 60から受け取って話し手 10の音声に基づく各種音響情報を算出（取得)するものであり、音響分析部 32と音声認識部 33とを有する。音響分析部 3 2は、所定時間（例えば 10msec)おきに、マイクロフォン 60から受け取った音声データに基づいて、話し手 10による連続した発話区間の時間を示す発話時間 t (発話時間情報)と、話し手 10の音声の基本周波数を示す基本周波数 fO (基本周波数情報）と、当該基本周波数 fOに基づくスペクトル包絡 Se (スペクトル包絡情報）とを算出して指標演算部 35に出力する。この場合、音響分析部 32は、例えば入力した音声データの音声パワーに基づいて一連の発話区間の時間を算出する。また、音響分析部 3 2は、入力した音声データについての瞬時周波数を計算すると共に瞬時周波数に関連した所定の尺度に基づいて周波数成分を抽出した上で、最も優勢な高調波構造に基づいて基本周波数 fOを推定し、更に、当該基本周波数 fOに基づいてスぺクトノレ包絡 Seを推定する。なお、基本周波数 fOおよびスペクトル包絡 Seの推定には、特開 2001— 125584号公報に記載された手法を用いることができる。音声認識部 33は、マイクロフォン 60から受け取った音声データに基づいて、例えば音節（日本語における「かな」に対応した音韻体系）を単位とした音声認識処理を実行し、認識結果として音節列ごとの音節数 (音節情報）にタイムスタンプ情報 (話し手により発せられた音声と認識された音節との時間的な対応）情報を付与したものを指標演算部 35に出力する。かかる音声認識部 33は、例えば" julian" (http://julius.sourceforge.jp)という音声認識エンジンを認識結果が指標演算部 35に逐次送信されるように拡張したもの（北山他："音声スタータ：" SWITCH"on"Sp_eech" ,情報処理学会音声言語情報処理研究会研究報告 2003 - SLP -46 - 12, Vol. 2003, No. 58 , pp. 67— 72 , May2003. )等を用いることにより容易に構成可能である。

画像情報処理部 34は、カメラ 50を介してサブコンピュータ 40に取り込まれた画像データを当該サブコンピュータ 40から受け取って話し手 10の身体的動作に関する各種画像情報を算出（取得)する。実施例の画像情報処理部 34は、所定時間（例えば 10msec)おきに、カメラ 50 (サブコンピュータ 40)からの画像データに基づいて話し手 10の顔の位置および向き (顔情報）を算出して指標演算部 35に出力する。このようにカメラ 50からの画像データに基づいて話し手 10の顔の位置および向きを算出する手法としては、部分空間法と SVM (Support Vector Machine)とを用いた画像処理方法があげられる（特開 2005— 250863号公報、および松坂要佐， "部分空間法と SVMを用いた 2次元画像からの 360度顔 ·顔部品追跡手法， "信学技報 PRMU V ol. 106, No. 72, pp. 19— 24, 2006.参照、）。咅分空間法と SVMとを用いた画像処理方法を採用する場合には、話し手 10の様々な姿勢における頭部領域画像を事前データとして予め収集しておく。そして、事前データに対して主成分分析を適用して固有ベクトルのセットを得た上で、それらの固有ベクトルのセットをモデルとして使用し、入力画像に対して最もフィットするモデルを判別することで話し手 10の顔の位置を求める。更に、求めた顔の位置に対して SVMを用いた顔角度推定を適用することにより話し手 10の顔の向きを得ること力 Sできる。また、話し手 10の顔の位置および向きを算出する際に、 "AR Tool KIT" (http://www.hitl.washington.edu/artoolkit/参照）を用いてもよい。この場合、話し手 10は、各面に所定の 2次元コードが貼着された立方体であるマーカを頭部に装着した状態でプレゼンテーションを実行することになり、カメラ 50によりマーカの 2次元コードを撮影して、当該マーカの三次元位置と向きとから話し手 10の顔の位置および向きを得ることができる。このような手法は、プレゼンテーシヨンに際してマーカの装着を要求するが、部分空間法と SVMとを用いた画像処理方法のように話し手ごとに事前データを要求するものではないことから、特にプレゼンテーションの練習に際して手軽に利用可能なものである。

指標演算部 35は、音響情報処理部 31からの音響情報に基づいてプレゼンテーシヨン中の話し手 10による発話に関連した所定の音響的評価指標を算出すると共に、音響情報処理部 31からの音響情報と画像情報処理部 34からの画像情報との少なくとも何れか一方に基づいてプレゼンテーション中の話し手 10による所作に関連した所定の所作的評価指標を算出し、算出した評価指標を統合処理部 36に出力する。実施例において、指標演算部 35により算出される音響的評価指標には、話し手 10 による話速度 Vsと、話し手 10による発話の抑揚 (声の高さ）に関する指標 Acと、プレゼンテーシヨン中の話し手 10による言い淀みに関する指標 Dfとが含まれる。この場合、指標演算部 35は、話し手 10が音声を発していない無音区間を除いて、音声認識部 33からのある音節列における音節数を音響分析部 32からの当該音節列に対応した発話時間 tで除して単位時間当たりの音節数を求めた上で、過去 n秒間における単位時間当たりの音節数の平均値を話し手 10の話速度 Vsとして算出する。また、指標演算部 35は、音響分析部 32からの基本周波数 f0に基づいて所定時間おきに当該基本周波数 f0の標準偏差を算出し、力、かる標準偏差が話し手 10による発話の抑揚を示す指標 Acとして用いられる。更に、指標演算部 35は、いわゆる有声休止や音節（母音）の引き延ばしといった言い淀みには基本周波数 fOの変動が少なぐかつスベクトル包絡 Seの変形が小さいという特徴があることを利用して（上記特開 2001— 1 25584号公報参照）、音響分析部 32からの基本周波数 fOとスペクトル包絡 Seとに基づいて言い淀み（有声休止および音節の引き延ばし）の有無を判定し、言い淀みを検出しなければ言い淀みの指標 Dfを値 0に設定すると共に、言い淀みを検出した際には言!/、淀みの指標 Dfを値 1に設定する。

[0031] 一方、実施例において、指標演算部 35により算出される所作的評価指標には、話し手 10による聞き手 100 (図 1参照）とのアイコンタクトの度合を示す指標 EIと、プレゼンテーシヨン中の話し手 10による間の取り方に関する指標 SIとが含まれる。この場合、指標演算部 35は、画像情報処理部 34から話し手 10の顔の位置および向きを示す顔情報を受け取ると、当該顔情報に基づいて話し手 10が聞き手 100の方を向いているか否かを示す 2値情報を求めた上で、当該 2値情報からプレゼンテーション中に話し手 10が聞き手 100の方を向いている時間的割合をアイコンタクトの度合を示す指標 EIとして算出する。実施例では、図 3に示すようなプレゼンテーション環境を想定し、カメラ 50と話し手 10とを結ぶ面 s0と聞き手 100側に角度 α (例えば 20° 、ただしプレゼンテーション環境ごとに変更され得る）をなす面 siから、当該面 siと聞き手 1 00側に所定角度 /3 (例えば 90° 、ただしプレゼンテーション環境ごとに変更され得る）をなす面 s2とにより規定される範囲内（図 3におけるハッチング部）に話し手 10の顔の向きの水平方向角度が含まれていれば、話し手 10が聞き手 100側を向いているとみなしている。

[0032] また、指標演算部 35は、音響分析部 32からの発話時間情報や画像情報処理部 3 4からの顔情報に基づいて、話し手 10による間の取り方に関する指標 SIを次のようにして算出（設定)する。ここで、プレゼンテーションにおいて効果的な「間」とは、その後の発言を強調したり、聞き手 100を話に引き付けたりするように話し手 10が意図的につくり出す「沈黙」をいう。そして、この沈黙は、単に発話していないだけでは何ら意味をもたず、聞き手 100の方を向いた状態でなされる必要がある。その一方で、逆にプレゼンテーション中に間がなぐ一つ一つの発話区間が冗長になることは聞き手 10 0の理解を妨げ、聞き取りやすさを損なう。これらを踏まえて、実施例の指標演算部 3 5は、音響分析部 32からの発話時間情報と画像情報処理部 34からの顔情報との少なくとも何れか一方に基づいて話し手 10による間の取り方に関する指標 SIを以下のように定義する。すなわち、指標演算部 35は、発話時間情報と顔情報を用いて求められる上記 2値情報とから話し手 10が音声を発することなく連続して聞き手 100側を見ている無音区間の時間 ts (秒）を求めた上で、 ts< l (秒）であるときには、 SI = 50 とし、 ts≥l (秒）であるときには、次式（1)を用いて指標 SIを算出する。ただし、 SI > 100となったときには、 SI= 100とされる。また、話し手 10が連続して発話している場合、指標演算部 35は、発話時間情報から連続した発話時間 tc (秒)を求めた上で、次式（2)を用いて指標 SIを算出する。ただし、 SI< 0となったときには、 SI = 0とされる。このようにして算出される指標 SIは、値 50を基準とし、間が長くなるとその値も大きくなり、無音区間の時間 tsが 5秒以上になると最大値 100となる。なお、この 5秒という値は、いわゆる「びっくり間」（竹内一郎， "人は見た目が 9割， "新潮新書， 2005. 参照）を考慮したものである。また、話し手 10が発話を続けていると、式（2)より指標 S Iは基準値 50から徐々に低下していき、発話時間 tcが 13秒以上になると最小値 0となる。なお、この 13秒という値は、深い一呼吸の時間に基づいて定められている。

[0033] SI = 50 + 12.5 -(ts - 1)

SI = 50 - 50/13 -tc · ' · (2)

[0034] 統合処理部 36は、プレゼンテーションの実行中に話し手 10に対して上述のようにして指標演算部 35により算出された音響的評価指標および所作的評価指標に基づくフィードバックを提供する。また、統合処理部 36は、 1回のプレゼンテーション中に算出された音響的評価指標および所作的評価指標のそれぞれについて、当該評価指標をプレゼンテーション資料 (スライド）と関連付けした時系列のグラフを作成すること等により、話し手 10に音響的評価指標および所作的評価指標に基づく事後的なフイードバックをも提供可能である。また、データ記憶部 37は、プレゼンテーション支援に際して必要とされる閾値等の各種データや画像データ等を記憶する。

[0035] 次に、図 4および図 5を参照しながら、実施例のプレゼンテーション支援装置 20の動作について説明する。 [0036] 図 4は、話し手 10がプレゼンテーションを実行している際に主にメインコンピュータ 3 0の指標演算部 35と統合処理部 36とにより実行される処理の一例を示すフローチヤートである。図 4のルーチンの開始に際して、メインコンピュータ 30の指標演算部 35 は、サブコンピュータ 40からのプレゼンテーション関連情報、音響情報処理部 31からの発話時間 t (発話時間情報）、基本周波数 f0およびスペクトル包絡 Se、画像情報処理部 34からの顔情報（話し手 10の顔の位置および向き）、音節情報といった処理に必要な情報の入力処理を実行する（ステップ S100)。ここで、プレゼンテーション関連情報は、サブコンピュータ 40にインストールされたプレゼンテーションソフトからのプレゼンテーションの開始および終了信号、予定発表時間、プレゼンテーション資料であるスライドの切替信号、スライドのサムネイル画像といった情報を含む。ステツプ S100の入力処理の後、指標演算部 35は、サブコンピュータ 40からのプレゼンテーシヨン関連情報に基づいて、話し手 10によりプレゼンテーションが実行されているか否かを判定し（ステップ S110)、プレゼンテーションが実行中であれば、上述のようにして各種音響情報や顔情報に基づいて、話し手 10による話速度 Vs、話し手 10による発話の抑揚を示す指標 Ac、言い淀みに関する指標 Df、アイコンタクトの度合を示す指標 EIおよび間の取り方に関する指標 SIといった評価指標を算出すると共に、入力したプレゼンテーション関連情報に基づいてプレゼンテーションの予定残り時間を算出し、これらの評価指標および予定残り時間を統合処理部 36に出力する（ステップ S 120)。

[0037] 指標演算部 35から音響的評価指標と所作的評価指標と予定残り時間とを受け取つた統合処理部 36は、各評価指標をそれに対応した閾値と比較してプレゼンテーシヨンを実行する話し手 10に警告を付与すべきか否か判定する判定処理を実行する（ステップ S 130)。実施例では、一般にプレゼンテーションを実行する話し手 10が普段よりも早口になる傾向にあることを踏まえて、話速度 Vsが所定の上限値 (例えば 7. 6音節/秒）を超えた場合に話し手 10に話速度についての警告を付与することとした。また、実施例では、抑揚の少ないモノトーンな発話を抑制させるベぐ発話の抑揚を示す指標 Ac (基本周波数 f0の標準偏差)が所定の下限値 (例えば男性の場合、 10 Hz)を下回った場合に抑揚についての警告を付与することとした。更に、実施例では、言い淀みの存在はプレゼンテーションのパフォーマンスに悪影響を与えてしまう要因であることから、指標 Dfが値 1である場合には、話し手 10に言い淀みが合った旨の警告を付与することとした。加えて、実施例では、聞き手 100とのアイコンタクトが少ないと聞き手 100の受ける印象が悪化することを踏まえて、アイコンタクトの指標 EIが所定の下限値 (例えば 15%)を下回った場合に話し手 10にアイコンタクトについての警告を付与することとした。また、実施例では、予定発表時間は当然に遵守されるべきであることを踏まえて、予定残り時間が予定発表時間の 20%となった時点で話し手 10にその旨を通知することとした。なお、実施例において、間の取り方の指標 SIにつ V、ては閾値との比較による警告の必要性を判定しな!/、ものとした力間の取り方の指標 SIについても適切な閾値を定めて話し手 10に閾値との比較結果に応じた警告を付与してもよレ、ことは!/、うまでもな!/、。

[0038] こうしてステップ S130の処理を実行したならば、警告の対象となった評価指標が存在するか否かを判定し (ステップ S 140)、警告の対象となった評価指標が存在していれば、当該評価指標に対応した警告表示指令を設定する（ステップ S150)。実施例では、警告の対象となった評価指標が存在している場合、話し手 10が用いるサブコンピュータ 40の表示画面 41 (図 2参照）に所定のマークと警告内容とを示す警告表示 43を資料画像 42と共に表示すると共に警告機器 70 (モニタ）にも同様の警告表示を表示することとしている。従って、例えば話速度 Vsが上限値を超えている場合、警告表示指令は、所定のマークと共に「話速度おとせ」と!/、つた文字列を表示画面 4 1等に表示させるための指令となる。また、抑揚、言い淀み、アイコンタクト、予定残り時間についての警告表示指令は、それぞれ所定のマークと共に「抑揚つけろ」、「よどむな」、「原稿みるな」、「時間 80%経過」といった文字列を表示画面 41等に表示させるための指令となる。なお、警告の対象となった評価指標が存在していなければ、ステップ S 150の処理はスキップされる。

[0039] ステップ S140また S150の処理の後、プレゼンテーション管理情報を設定し、当該プレゼンテーション管理情報をサブコンピュータ 40や所定の警告機器 70に送信する (ステップ S 160)。プレゼンテーション管理情報は、上述の警告表示指令の他に、図 5に示すリアルタイムモニタ 44をサブコンピュータ 40の表示画面 41に表示させるための指令等を含む。実施例において、リアルタイムモニタ 44は、図 5に示すように、現状の予定残り時間、話速度 Vs、抑揚に関する指標 Ac、アイコンタクトに関する指標 E Iおよび間の取り方に関する指標 SIを話し手 10がほぼリアルタイムで把握できるようにするものとされる。これにより、プレゼンテーションを実行する話し手 10に対して音響的評価指標および所作的評価指標に基づくフィードバックを良好に提供可能となる。なお、実施例のプレゼンテーション支援装置 20では、上述のように各評価指標をプレゼンテーション資料 (スライド）と関連付けした時系列のグラフを事後的に提供すベぐステップ S 160では、各評価指標をプレゼンテーション資料と関連付けしたデータの保存処理も実行される。そして、ステップ S160の処理を実行したならば、再度ステツプ S 100以降の処理を実行し、ステップ S 110にてプレゼンテーションが終了したと判断した時点で本ルーチンを終了させる。

以上説明したように、実施例のプレゼンテーション支援装置 20では、実際のプレゼンテーシヨンやプレゼンテーションの練習に際し、メインコンピュータ 30の音響情報処理部 31によりマイクロフォン 60を介して集音された話し手 10の音声に基づく音響情報が取得されると共に、画像情報処理部 34によりカメラ 50を介して取り込まれた話し手 10の身体的動作に関する画像情報とが取得される。更に、メインコンピュータ 30 の指標演算部 35により、音響情報に基づいてプレゼンテーション中の話し手 10による発話に関連した音響的評価指標が算出されると共に、音響情報と画像情報との少なくとも何れか一方に基づいてプレゼンテーション中の話し手 10による所作に関連した所作的評価指標が算出される（図 4のステップ S 130)。そして、こうして算出された音響的評価指標と所作的評価指標とは、それ自体あるいは閾値との比較結果に基づく警告という形式で話し手 10にほぼリアルタイムでフィードバックされる（図 4のステップ S 130〜S160)。また、実施例のプレゼンテーション支援装置は、話し手 10に音響的評価指標および所作的評価指標に基づく事後的なフィードバックをも提供可能である。このように、実際のプレゼンテーションやプレゼンテーションの練習に際して、話し手 10の音声に基づく音響情報のみならず話し手 10の身体的動作に関する画像情報を取得し、音響情報と画像情報との少なくとも何れか一方に基づいて所作的評価指標をも算出するようにすれば、プレゼンテーションの実行中あるいは練習中に話し手 10の音声の状態や身体的所作等の非言語情報をより適正に把握可能となるので、実施例のプレゼンテーション支援装置 20は、より良いプレゼンテーションの実行やプレゼンテーションスキルの向上に寄与し得るより実用的なものといえる。また、音響的評価指標や所作的評価指標の少なくとも何れか一つをそれに対応した閾値と比較すると共に比較結果に応じた警告を話し手 10に付与すれば、実際のプレゼンテーシヨンやプレゼンテーションの練習に際し、そのプレゼンテーションがより良いものとなるように、話し手 10にほぼリアルタイムで現状を把握させることが可能となる。

[0041] 更に、実施例のように、アイコンタクトの度合を示す指標 EIや間の取り方に関する指標 SIを所作的評価指標とすると共に、話速度 Vsや、抑揚を示す指標 Ac、言い淀みに関する指標 Dfを音響的評価指標とすれば、プレゼンテーション支援装置 20をより良いプレゼンテーションの実行やプレゼンテーションスキルの向上に寄与し得るより実用的なものとすることができる。すなわち、アイコンタ外の度合を示す指標を所作的評価指標の一つとすれば、プレゼンテーションに際して話し手 10をより適切に聞き手 100に目を向けるように仕向けて、そのプレゼンテーションを説得力に満ちた印象のよいものとすること力 S可能となる。また、音響情報と画像情報との少なくとも何れか一方に基づく間の取り方に関する指標 SIを所作的評価指標の一つとすれば、話し手 10が聞き手 100に目を向けた状態で意図的な沈黙すなわち効果的な間をより適切につくり出せるようになり、そのプレゼンテーションを聞き手 100を引きつける印象のよいものとすること力 Sできる。更に、話し手 10による話速度 Vsを示す指標を音響的評価指標の一つとすれば、プレゼンテーション中の話し手 10による話速度がより適切なものとなり、そのプレゼンテーションを聞き取りやすい印象のよいものとすることができる

。また、話し手 10による発話の抑揚を示す指標 Acを音響的評価指標の一つとすれば、プレゼンテーション中の話し手 10による発話の抑揚をより適切なものとして、そのプレゼンテーションをメリノ、リのきいた印象のよいものとすることができる。更に、プレゼンテーシヨン中の話し手 10による言い淀みに関する指標 Dfを音響的評価指標の一つとすれば、プレゼンテーション中の話し手 10による言い淀みがより少なくなり、そのプレゼンテーションを自信に満ちた印象のよいものとすることができる。

[0042] なお、音響的評価指標や所作的評価指標は、上述のものに限られるものではなぐ他の様々な指標を用いることが可能である。例えば、所作的評価指標としては、話し手 10の視線や立ち位置の安定度に関する指標や、身振り手振りといったボディジェスチヤに関する指標、表情に関する指標、スクリーン 90に映し出される資料に対する視線に関する指標等をとりいれてもよい。また、上記実施例をメインコンピュータ 30に本発明によるコンピュータ支援プログラムがインストールされるものとして説明した力これに限られるものではなぐコンピュータ支援プログラムは、プレゼンテーションの実行に際して話し手 10により使用されるサブコンピュータ 40にインストールされてもよい

[0043] 以上、実施例を用いて本発明の実施の形態について説明した力本発明は上記各実施例に何ら限定されるものではなく、本発明の要旨を逸脱しなレゝ範囲内にお!/ヽて、様々な変更をなし得ることはレ、うまでもな!/、。

産業上の利用可能性

[0044] 本発明は、プレゼンテーション支援ツールの製造業、プレゼンテーションの講習業等において利用可能である。

Claims

請求の範囲

[1] プレゼンテーションを実行する話し手を支援するためのプレゼンテーション支援装置であって、

前記話し手の音声に基づく音響情報を取得する音響情報取得手段と、前記話し手の身体的動作に関する画像情報を取得する画像情報取得手段と、前記音響情報取得手段により取得された音響情報に基づいて前記プレゼンテーシヨン中の前記話し手による発話に関連した所定の音響的評価指標を算出すると共に、前記音響情報取得手段により取得された音響情報と前記画像情報取得手段により取得された画像情報との少なくと何れか一方に基づいて前記プレゼンテーション中の前記話し手による所作に関連した所定の所作的評価指標を算出する評価指標算出手段と、

を備えるプレゼンテーション支援装置。

[2] 請求項 1に記載のプレゼンテーション支援装置にお!/、て、

前記画像情報は、前記話し手の少なくとも顔の向きに関する顔情報を含み、前記評価指標算出手段は、前記画像情報取得手段により取得された前記顔情報に基づいて前記話し手による聞き手とのアイコンタクトの度合を示す指標を前記所作的評価指標として算出するプレゼンテーション支援装置。

[3] 請求項 1に記載のプレゼンテーション支援装置にお!/、て、

前記音響情報は、前記話し手による連続した発話区間の時間を示す発話時間情報を含むと共に、前記画像情報は、前記話し手の少なくとも顔の向きに関する顔情報を含み、

前記評価指標算出手段は、前記音響情報取得手段により取得された前記発話時間情報と前記画像情報取得手段により取得された前記顔情報との少なくとも何れか一方に基づいて前記プレゼンテーション中の前記話し手による間の取り方に関する指標を前記所作的評価指標として算出するプレゼンテーション支援装置。 [[44]] 請請求求項項 11にに記記載載ののププレレゼゼンンテテーーシショョンン支支援援装装置置ににおお!!//、、てて、、

前前記記音音響響情情報報はは、、前前記記話話しし手手にによよるる連連続続ししたた発発話話区区間間のの時時間間をを示示すす発発話話時時間間情情報報とと該該発発話話区区間間ににおおけけるる音音節節数数をを示示すす音音節節情情報報ととをを含含みみ、、

前前記記評評価価指指標標算算出出手手段段はは、、前前記記音音響響情情報報取取得得手手段段にによよりり取取得得さされれたた前前記記発発話話時時間間情情報報おおよよびび前前記記音音節節情情報報にに基基づづいいてて前前記記話話しし手手にによよるる話話速速度度をを示示すす指指標標をを前前記記音音響響的的評評価価指指標標ととししてて算算出出すするるププレレゼゼンンテテーーシショョンン支支援援装装置置。。

[[55]] 請請求求項項 11にに記記載載ののププレレゼゼンンテテーーシショョンン支支援援装装置置ににおお!!//、、てて、、

前前記記音音響響情情報報はは、、前前記記話話しし手手のの音音声声のの基基本本周周波波数数をを示示すす基基本本周周波波数数情情報報をを含含みみ前前記記評評価価指指標標算算出出手手段段はは、、前前記記音音響響情情報報取取得得手手段段にによよりり取取得得さされれたた前前記記基基本本周周波波数数情情報報にに基基づづいいてて前前記記話話しし手手にによよるる発発話話のの抑抑揚揚をを示示すす指指標標をを前前記記音音響響的的評評価価指指標標ととししてて算算出出すするるププレレゼゼンンテテーーシショョンン支支援援装装置置。。

[[66]] 請請求求項項 11にに記記載載ののププレレゼゼンンテテーーシショョンン支支援援装装置置ににおお!!//、、てて、、

前前記記音音響響情情報報はは、、前前記記話話しし手手のの音音声声のの基基本本周周波波数数をを示示すす基基本本周周波波数数情情報報とと該該基基本本周周波波数数にに基基づづくくススペペククトトルル包包絡絡をを示示すすススペペククトトルル包包絡絡情情報報ととをを含含みみ、、

前前記記評評価価指指標標算算出出手手段段はは、、前前記記音音響響情情報報取取得得手手段段にによよりり取取得得さされれたた前前記記基基本本周周波波数数情情報報おおよよびび前前記記ススペペククトトルル包包絡絡情情報報にに基基づづいいてて前前記記ププレレゼゼンンテテーーシショョンン中中のの前前記記話話しし手手にによよるる言言いい淀淀みみにに関関すするる指指標標をを前前記記音音響響的的評評価価指指標標ととししてて算算出出すするるププレレゼゼンンテテーーシシヨヨンン支支援援装装置置。。

[[77]] 請請求求項項 11にに記記載載ののププレレゼゼンンテテーーシショョンン支支援援装装置置ににおお!!//、、てて、、

前前記記フフィィーードドババッックク手手段段はは、、前前記記評評価価指指標標算算出出手手段段にによよりり算算出出さされれたた前前記記音音響響的的評評価価指指標標おおよよびび前前記記所所作作的的評評価価指指標標のの少少ななくくとともも何何れれかか一一つつををそそれれにに対対応応ししたた閾閾値値とと比比較較すするるとと共共にに、、比比較較結結果果にに応応じじてて前前記記ププレレゼゼンンテテーーシショョンンをを実実行行ししてて!!//、、るる前前記記話話しし手手にに所所定定のの警警告告をを付付与与可可能能ででああるるププレレゼゼンンテテーーシショョンン支支援援装装置置。。

[[88]] ププレレゼゼンンテテーーシショョンンをを実実行行すするる話話しし手手をを支支援援すするるたためめののププレレゼゼンンテテーーシショョンン支支援援方方法法ででああっってて、、

((aa))前前記記話話しし手手のの音音声声にに基基づづくく音音響響情情報報とと前前記記話話しし手手のの身身体体的的動動作作にに関関すするる画画像像 * (b)ステップ (a)で取得された前記音響情報に基づいて前記プレゼンテーション中の前記話し手による発話に関連した所定の音響的評価指標を算出すると共に、ステツプ ωで取得された前記音響情報および前記画像情報の少なくと何れか一方に基づいて前記プレゼンテーション中の前記話し手による所作に関連した所定の所作的評

を含むプレゼンテーション支援方法。

[9] 請求項 8に記載のプレゼンテーション支援装置方法において、

ステップ（a)は、前記画像情報として、前記話し手の少なくとも顔の向きに関する顔情報を取得し、

ステップ (b)は、ステップ (a)にて取得された前記顔情報に基づいて前記話し手による聞き手とのアイコンタ外の度合を示す指標を前記所作的評価指標として算出するプレゼンテーション支援装置。

[10] 請求項 8に記載のプレゼンテーション支援装置において、

ステップ (a)は、前記音響情報として、前記話し手による連続した発話区間の時間を示す発話時間情報を取得すると共に、前記画像情報として、前記話し手の少なくとも顔の向きに関する顔情報を取得し、

ステップ (b)は、ステップ (a)にて取得された前記発話時間情報と前記顔情報との少なくとも何れか一方に基づいて前記プレゼンテーション中の前記話し手による間の取り方に関する指標を前記所作的評価指標として算出するプレゼンテーション支援装置。

[11] 請求項 8に記載のプレゼンテーション支援装置において、

ステップ ωは、前記音響情報として、前記話し手による連続した発話区間の時間を示す発話時間情報と該発話区間における音節数を示す音節情報とを取得し、ステップ (b)は、ステップ (a)にて取得された前記発話時間情報および前記音節情報に基づいて前記話し手による話速度を示す指標を前記音響的評価指標として算出するプレゼンテーション支援装置。 [12] 請求項 8に記載のプレゼンテーション支援装置において、

ステップ（a)は、前記音響情報として、前記話し手の音声の基本周波数を示す基本周波数情報を取得し、

ステップ (b)は、ステップ (a)にて取得された前記基本周波数情報に基づいて前記話し手による発話の抑揚を示す指標を前記音響的評価指標として算出するプレゼンテーシヨン支援装置。

[13] 請求項 8に記載のプレゼンテーション支援装置において、

ステップ（a)は、前記音響情報として、前記話し手の音声の基本周波数を示す基本周波数情報と該基本周波数に基づくスペクトル包絡を示すスペクトル包絡情報とを取得し、ステップ (b)は、ステップ (a)にて取得された前記基本周波数情報および前記スペクトル包絡情報に基づいて前記プレゼンテーション中の前記話し手による言い淀みに関する指標を前記音響的評価指標として算出するプレゼンテーション支援装置。

[14] プレゼンテーションを実行する話し手を支援するためのプレゼンテーション支援装置としてコンピュータを機能させるプレゼンテーション支援プログラムであって、前記話し手の音声に基づく音響情報を取得する音響情報取得モジュールと、前記話し手の身体的動作に関する画像情報を取得する画像情報取得モジュールと、

を備えるプレゼンテーション支援プログラム。