JPWO2011013605A1

JPWO2011013605A1 - プレゼンテーションシステム

Info

Publication number: JPWO2011013605A1
Application number: JP2011524762A
Authority: JP
Inventors: 渡辺　透; 透渡辺; 隆平天野; 昇吉野部; 田中　真文; 真文田中; 企世子辻; 一男石本; 俊朗中莖; 鍬田　海平; 海平鍬田; 吉田　昌弘; 昌弘吉田
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 2009-07-27
Filing date: 2010-07-26
Publication date: 2013-01-07
Also published as: WO2011013605A1; US20120077172A1

Abstract

デジタルカメラ１は、教室内の各生徒を被写体に含めた撮影を行い、オプティカルフローを用いて、発言者となるべき生徒が椅子から立ち上がる動作や口を動かす動作を検出することで撮影画像上における発言者（何れかの生徒）の位置を特定し、発言者の顔部分の画像データを抽出する。ＰＣ２は、プロジェクタ３を用いてスクリーン４上に教材を表示させ、デジタルカメラ１から抽出画像データが伝送された際、その抽出画像データに基づきスクリーン４上に発言者の顔の映像を重畳表示させる。

Description

本発明は、映像表示を用いて学習や討論等を進めるためのプレゼンテーションシステムに関する。

近年、教育現場では、ＰＣ（パーソナルコンピュータ）等の情報端末やプロジェクタが用いられることも多く、このような教育現場では、情報端末から送信される教材の内容がプロジェクタのスクリーン上に表示される（例えば下記特許文献１参照）。教室内の各生徒は、スクリーンの表示内容を見ながら先生の話を聞くことで学習を進め、その過程において、随時、自身の考え等を発言する。

一方、少人数（数人程度）で行われる授業も少なくはないものの、多人数の生徒が並んだ状態（例えば、数十人の生徒が二次元配列状に並んだ状態）で授業が行われることも多く、後者の場合は、全員が発言者（何れかの生徒）の顔を見ながら発言者の発言を聞くことは難しく、結果、発言者以外の各生徒はスクリーンや自身のノート等を見ながら発言を聞くことも多い。

しかし、発言内容を聞く時は発言を行う者の顔を見るのが本来の姿であるし、発言者の顔を見ながら発言内容を聞いた方が言葉だけでは表現しきれない発言者の意図を汲み取れることも多い。また、先生と多人数の生徒がコミュニケーションを取りながら協働することで授業は成り立つものであるため、生徒間のコミュニケーションは必要なものであるし、発言者の顔を見るというコミュニケーションがあった方が、各生徒の授業への参加意欲や授業の臨場感が増し、集団学習の利点（競争心による勉強意欲向上効果など）が活かされる、と思われる。

他方、ペンタブレット等のポインティングデバイスを用いて生徒に問題の解答を行わせるという教育スタイルが教育現場に採用されることもある。この教育スタイルは、鉛筆で紙に答えを書くという従来のスタイルの延長線上にある教育スタイルであり、解答するという動作が視覚だけに頼って成される。人間の多様な感覚を刺激して学習を行えば、生徒の学習意欲や記憶力の向上を期待できる。

教育現場における問題点について説明したが、学会発表や会議等においても同様のことが言える。

特開２００４−７７７３９号公報

そこで本発明は、複数人が学習や討論等を行う際において、それらの効率等の向上に寄与するプレゼンテーションシステムを提供することを目的とする。

本発明に係る第１プレゼンテーションシステムは、複数の人物を被写体に含めた撮影を行って撮影結果を表す信号を出力する撮像部と、前記撮像部の出力に基づき、画像上において前記複数の人物の中から発言者を検出する発言者検出部と、前記発言者検出部の検出結果に基づき、前記撮像部の出力から前記発言者の画像部分の画像データを発言者画像データとして抽出する抽出部と、を備え、前記発言者画像データに基づく映像を、前記複数の人物が視認可能な表示画面上に表示することを特徴とする。

これにより、複数の人物の全員が発言者の顔を見ながら発言内容を聞くことができるようになる。結果、例えば、当該プレゼンテーションシステムを教育現場に適用した場合であれば、発言者の顔を見るという生徒間のコミュニケーションによって各生徒の授業への参加意欲（勉強意欲）や授業の臨場感が増し、集団学習の利点（競争心による勉強意欲向上効果など）がより良く活かされるようになる。加えて、発言者以外の各生徒は、発言者の顔を見ながら発言内容を聞くことによって、言葉だけでは表現しきれない発言者の意図を汲み取ることができるようになる。即ち、言葉以外の情報（例えば、表情から読み取れる発言の自信度）をも得ることができるようになり、発言を聞くことで得られる学習の効率が向上する。

また例えば、前記撮像部の周辺音に応じた音響信号を生成する音響信号生成部を第１プレゼンテーションシステムに更に設け、前記音響信号生成部は、前記発言者検出部の検出結果に基づき、前記音響信号において前記発言者が位置する方向より到来する音の成分が強調されるように前記音響信号の指向性を制御するようにしても良い。

より具体的には例えば、前記撮像部の周辺音に応じた音響信号を個別に出力する複数のマイクロホンから成るマイク部を第１プレゼンテーションシステムに更に設け、前記音響信号生成部は、前記複数のマイクロホンの出力音響信号を用いて、前記発言者からの音の成分が強調された発言者音響信号を生成する。

そして例えば、第１プレゼンテーションシステムにおいて、前記発言者画像データ及び前記発言者音響信号に応じたデータを、互いに関連付けて記録するようにしても良い。

或いは例えば、第１プレゼンテーションシステムにおいて、前記発言者画像データ、前記発言者音響信号に応じたデータ、及び、前記発言者の発言時間に応じたデータを、互いに関連付けて記録するようにしても良い。

具体的には例えば、第１プレゼンテーションシステムは、所定の映像を前記表示画面上に表示しているときにおいて、前記抽出部より前記発言者画像データが抽出された際、前記表示画面において前記発明者画像データに基づく映像を前記所定の映像上に重畳して表示する。

本発明に係る第２プレゼンテーションシステムは、複数の人物の夫々に対応して設けられ、対応する人物が発した音声に応じた音響信号を出力する複数のマイクロホンと、各マイクロホンの出力音響信号に基づく音声認識処理により、各マイクロホンの出力音響信号を文字データに変換する音声認識部と、前記複数の人物が視認可能な１又は複数の表示装置と、前記文字データが予め設定された条件を満たすか否かに応じて前記表示装置の表示内容を制御する表示制御部と、を備えたことを特徴とする。

これにより、発声動作、音声による聴覚の刺激、音声に応じた表示内容制御による視覚の刺激を、教育システム等に組み入れることができる。例えば、当該プレゼンテーションシステムを教育現場に適用した場合においては、従来方式と比べて、より生徒の五感が刺激され、生徒の学習意欲の向上、記憶力の向上が期待される。

本発明に係る第３プレゼンテーションシステムは、被写体の撮影を行って撮影結果を表す信号を出力する撮像部と、前記撮像部の周辺音に応じた音響信号を出力するマイク部と、前記マイク部の出力音響信号に基づいて複数の人物の中から発言者を検出する発言者検出部と、を備え、前記発言者を前記被写体に含めた状態における前記撮像部の出力を、前記複数の人物が視認可能な表示画面上に表示することを特徴とする。

これによっても、複数の人物の全員が発言者の顔を見ながら発言内容を聞くことができるようになる。結果、例えば、当該プレゼンテーションシステムを教育現場に適用した場合であれば、発言者の顔を見るという生徒間のコミュニケーションによって各生徒の授業への参加意欲（勉強意欲）や授業の臨場感が増し、集団学習の利点（競争心による勉強意欲向上効果など）がより良く活かされるようになる。加えて、発言者以外の各生徒は、発言者の顔を見ながら発言内容を聞くことによって、言葉だけでは表現しきれない発言者の意図を汲み取ることができるようになる。即ち、言葉以外の情報（例えば、表情から読み取れる発言の自信度）をも得ることができるようになり、発言を聞くことで得られる学習の効率が向上する。

具体的には例えば、第３プレゼンテーションシステムにおいて、前記マイク部は、前記撮像部の周辺音に応じた音響信号を個別に出力する複数のマイクロホンを有し、前記発言者検出部は、前記複数のマイクロホンの出力音響信号に基づき、前記マイク部の設置位置との関係において前記発言者からの音の到来方向である音声到来方向を判定し、その判定結果を用いて前記発言者を検出する。

より具体的には例えば、第３プレゼンテーションシステムにおいて、前記音声到来方向の判定結果に基づいて前記複数のマイクロホンの出力音響信号から前記発言者より到来する音響信号成分を抽出することにより、前記発言者からの音の成分が強調された発言者音響信号を生成する。

或いは例えば、第３プレゼンテーションシステムにおいて、前記マイク部は、各々が前記複数の人物の何れかに対応付けられた複数のマイクロホンを有し、前記発言者検出部は、各マイクロホンの出力音響信号の大きさに基づいて前記発言者を検出する。

より具体的には例えば、第３プレゼンテーションシステムにおいて、前記複数のマイクロホンの内、前記発言者としての人物に対応付けられたマイクロホンの出力音響信号を用いて、前記発言者からの音の成分を含む発言者音響信号を生成する。

そして例えば、第３プレゼンテーションシステムにおいて、前記発言者を前記被写体に含めた状態における前記撮像部の出力に基づく画像データ、及び、前記発言者音響信号に応じたデータを、互いに関連付けて記録するようにしても良い。

或いは例えば、第３プレゼンテーションシステムにおいて、前記発言者を前記被写体に含めた状態における前記撮像部の出力に基づく画像データ、前記発言者音響信号に応じたデータ、及び、前記発言者の発言時間に応じたデータを、互いに関連付けて記録するようにしても良い。

また例えば、第３プレゼンテーションシステムにおいて、前記複数の人物の中に音を発している人物が複数存在する場合、前記発言者検出部は、前記マイク部の出力音響信号に基づいて、音を発している複数の人物を複数の発言者として検出し、当該プレゼンテーションシステムは、前記複数のマイクロホンの出力音響信号から、前記複数の発言者からの音響信号を個別に生成する。

また例えば、第３プレゼンテーションシステムにおいて、前記マイク部の出力音響信号に基づく音響信号が複数のスピーカの内の全部又は一部にて再生され、当該プレゼンテーションシステムは、前記発言者音響信号を再生させる際、前記複数のスピーカの内、前記発言者に対応付けられたスピーカにて前記発言者音響信号を再生させる。

本発明に係る第４プレゼンテーションシステムは、複数の人物の撮影を行って撮影結果を表す信号を出力する撮像部と、前記撮像部の出力に基づき前記人物ごとに前記人物の画像である個人画像を生成し、これによって前記複数の人物に対応する複数の個人画像を生成する個人画像生成部と、前記複数の人物が視認可能な表示画面上に、前記複数の個人画像を複数回に分けて順次表示させる表示制御部と、を備え、所定のトリガ信号を受けたときに前記表示画面に表示されている個人画像に対応する人物が発言者に成るべきことを提示することを特徴とする。

映像表示された人物が発言者になるというルールを教育現場に持ち込むことにより、授業等の緊張感が高まり、学習効率の向上効果等が期待される。

本発明によれば、複数人が学習や討論等を行う際において、それらの効率等の向上に寄与するプレゼンテーションシステムを提供することが可能となる。

本発明の意義ないし効果は、以下に示す実施の形態の説明により更に明らかとなろう。ただし、以下の実施の形態は、あくまでも本発明の一つの実施形態であって、本発明ないし各構成要件の用語の意義は、以下の実施の形態に記載されたものに制限されるものではない。

本発明の第１実施形態に係る教育システムの全体構成図である。教育システムを利用する複数の人物（生徒）を示した図である。本発明の第１実施形態に係るデジタルカメラの概略的な内部ブロック図である。図３のマイク部の内部構成図である。図３のデジタルカメラに内包される部位のブロック図である。図２に示される複数の人物の内、一人の人物が発言のために立っている様子を示した図である。（ａ）及び（ｂ）は、夫々、本発明の第１実施形態に係り、発言者、マイクロホン原点及び音声到来方向の関係を示した図と、音声到来方向の検出方法を説明するための図である。本発明の第１実施形態に係り、１枚のフレーム画像から抽出された４つの顔領域を示す図である。（ａ）及び（ｂ）は、図１のスクリーンに表示されるべき画像の例を示した図である。図１のスクリーンに表示されるべき画像の例を示した図である。本発明の第２実施形態に係る教育システムの全体構成を教育システムの利用者と共に示した図である。図１１に示される１つの情報端末の概略的な内部ブロック図である。本発明の第３実施形態に係る教育システムの全体構成を教育システムの利用者と共に示した図である。本発明の第３実施形態に係る教育システムの全体構成を教育システムの利用者と共に示した図であって、図１３との比較においてスクリーンの表示内容が変化する様子を示した図である。本発明の第４実施形態に係る教育システムの全体構成を、教育システムの利用者と共に示した図である。本発明の第４実施形態に係り、スクリーンの表示内容の例を示す図である。本発明の第４実施形態に係り、スクリーンの表示内容の他の例を示す図である。本発明の第５実施形態に係り、デジタルカメラの概略的な構成図である。（ａ）及び（ｂ）は、本発明の第５実施形態に係る教育現場を説明するための図である。本発明の第５実施形態に係り、教育システムの一部のブロック図である。本発明の第５実施形態に係り、デジタルカメラで取得されるフレーム画像の例を示す図である。本発明の第５実施形態に係り、教室内に４つのスピーカが配置される様子を示す図である。（ａ）及び（ｂ）は、本発明の第６実施形態に係る教育現場を説明するための図である。本発明の第６実施形態に係り、教育システムの一部のブロック図である。本発明の第７実施形態に係る教育現場を説明するための図である。本発明の第８実施形態に係り、教育システムの一部のブロック図である。本発明の第９実施形態に係る２つの教室を示した図である。本発明の第９実施形態に係り、各教室に生徒が収容される様子を示した図である。本発明の第９実施形態に係り、教育システムの一部のブロック図である。本発明の第１０実施形態に係るプロジェクタの外観構成を示す図である。本発明の第１０実施形態に係るプロジェクタの内部構成を示す斜視図である。本発明の第１０実施形態に係るプロジェクタの内部構成を示す平面図である。本発明の第１０実施形態に係るプロジェクタの構成を示すブロック図である。

以下、本発明の実施の形態につき、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。

＜＜第１実施形態＞＞
本発明の第１実施形態を説明する。図１は、第１実施形態に係る教育システム（プレゼンテーションシステム）の全体構成図である。図１の教育システムは、撮像装置であるデジタルカメラ１、パーソナルコンピュータ（以下、ＰＣと略記する）２、プロジェクタ３及びスクリーン４を含んで構成される。図２には、教育システムを利用する複数の人物が示されている。教育システムが教育現場で利用されることを想定して以下の説明を行うが、教育システムを、学会発表、会議など、様々な状況下で利用することが可能である（後述の他の実施形態においても同様）。第１実施形態に係る教育システムを、任意の年齢層の生徒に対する教育現場に採用することができる。図２に示される各人物は教育現場における生徒である。生徒の人数が４人であることを想定し、４人の人物としての４人の生徒を符号６１〜６４によって参照する。但し、生徒の数は、２以上であれば何人でも構わない。各生徒６１〜６４の前方には机が設置されており、図２に示す状況では、各生徒６１〜６４が個々に割り当てられた椅子に座っている。

図３は、デジタルカメラ１の概略的な内部ブロック図である。デジタルカメラ１は、静止画像及び動画像を撮影可能なデジタルビデオカメラであり、符号１１〜１６によって参照される各部位を備える。尚、後述の任意の実施形態にて述べられるデジタルカメラを、デジタルカメラ１と同等のデジタルカメラとすることができる。

撮像部１１は、光学系と、絞りと、ＣＣＤ（Charge Coupled Device）やＣＭＯＳ（Complementary Metal Oxide Semiconductor）イメージセンサなどから成る撮像素子と、を有する。撮像部１１における撮像素子は、光学系及び絞りを介して入射した被写体を表す光学像を光電変換することによって、該光学像を表す電気信号を映像信号処理部１２に出力する。映像信号処理部１２は、撮像部１１からの電気信号に基づいて、撮像部１１によって撮影された画像（以下、「撮影画像」ともいう）を表す映像信号を生成する。撮像部１１では、所定のフレームレートで順次撮影が行われ、次々と撮影画像が得られる。フレームレートの逆数である、１つのフレーム周期（例えば、１／６０秒）分の映像信号によって表される撮影画像をフレーム又はフレーム画像とも言う。

マイク部１３は、デジタルカメラ１の筐体上の異なる位置に配置された複数のマイクロホンから形成される。本実施形態では、図４に示す如く、マイク部１３が、無指向性のマイクロホン１３Ａ及び１３Ｂから形成されるものとする。マイクロホン１３Ａ及び１３Ｂは、個別にデジタルカメラ１の周辺音（厳密にはマイクロホン自身の周辺音）をアナログの音響信号に変換する。音響信号処理部１４は、マイクロホン１３Ａ及び１３Ｂからの各音響信号をデジタル信号に変換する変換処理を含む音響信号処理を実行し、音響信号処理後の音響信号を出力する。尚、マイクロホン１３Ａ及び１３Ｂの中心（厳密には例えば、マイクロホン１３Ａの振動板の中心とマイクロホン１３Ｂの振動板の中心との中間地点）を、便宜上、マイクロホン原点と呼ぶ。

主制御部１５は、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）等を備え、デジタルカメラ１の各部位の動作を統括的に制御する。通信部１６は、主制御部１５の制御の下、外部機器との間で必要な情報を無線にて送受信する。

図１の教育システムでは、通信部１６の通信対象はＰＣ２である。ＰＣ２には無線通信機能が備えられており、通信部１６が送信する任意の情報はＰＣ２に伝達される。尚、デジタルカメラ１とＰＣ２との間の通信を有線通信にて実現しても構わない。

ＰＣ２は、スクリーン４に表示されるべき映像の内容を決定し、その映像の内容を表す映像情報を無線又は有線でプロジェクタ３に伝達する。これにより、ＰＣ２にて決定されたスクリーン４にて表示されるべき映像が、実際にプロジェクタ３からスクリーン４に投影されてスクリーン４上に表示される。図１において、破線直線はプロジェクタ３からの投影光をイメージ化したものである（後述の図１１及び図１３〜図１５においても同様）。生徒６１〜６４がスクリーン４の表示内容を視認できるように、プロジェクタ３及びスクリーン４は設置されている。プロジェクタ３は表示装置として機能する。該表示装置の構成要素に、スクリーン４が含まれていると考えても構わないし、スクリーン４が含まれていないと考えても構わない（後述の他の実施形態においても同様）。

デジタルカメラ１の撮影範囲内に、生徒６１〜６４が全て収まるようにデジタルカメラ１の設置場所及び設置方向は調整される。従って、デジタルカメラ１は、生徒６１〜６４を被写体に含めた状態でフレーム画像列の撮影を行う。例えば、撮像部１１の光軸を生徒６１〜６４の方向に向けつつ、図１に示す如くスクリーン４の上部にデジタルカメラ１を設置する。フレーム画像列とは、時系列に並ぶフレーム画像の集まりを指す。

デジタルカメラ１は、生徒６１〜６４の中から発言者を検出し、発言者の顔部分の画像データを抽出する機能を備える。図５は、この機能を担う部位のブロック図である。発言者検出部２１及び抽出部２２を、図３の主制御部１５に設けることができる。

発言者検出部２１及び抽出部２２には、撮像部１１の撮影によって得られたフレーム画像の画像データが次々と入力される。画像データとは、デジタル値で表現された映像信号の一種である。発言者検出部２１は、フレーム画像の画像データに基づき、フレーム画像の全画像領域から人物の顔の画像データが存在する画像領域（全画像領域の一部）を顔領域として抽出する顔検出処理を実行可能である。顔検出処理によって、フレーム画像上及び画像空間上における顔の位置及び大きさが顔ごとに検出される。画像空間とは、フレーム画像等の任意の二次元画像が配置される、二次元座標空間を指す。実際には例えば、顔領域が矩形領域である場合、フレーム画像上及び画像空間上における顔領域の中心位置と顔領域の水平及び垂直方向の大きさが、顔の位置及び大きさとして検出される。以下の説明では、顔領域の中心位置を、単に顔の位置という。

発言者検出部２１は、フレーム画像の画像データに基づき、生徒６１〜６４の中から、現に音声を発している生徒又はこれから発言を行おうとしている生徒を発言者として検出し、画像空間上における発言者の顔領域の位置及び大きさを特定する発言者情報を生成する。発言者の検出方法として様々な検出方法を利用できる。以下、複数の検出方法を例示する。

例えば、図６に示す如く、発言者が椅子から立ち上がって発言するという発言スタイルが教育現場で採用されている場合には、画像空間上における各顔の位置又は位置変化から、発言者を検出することができる。より具体的は、各フレーム画像に対して顔検出処理を実行することで各フレーム画像上における生徒６１〜６４の顔の位置を監視しておく。そして、或る注目した顔の位置が、対応する机から離れる方向に所定距離以上移動した場合に、その注目した顔を有する生徒が発言者であると判断すると共に、その注目した顔についての顔領域の位置及び大きさを発言者情報に含める。

また例えば、フレーム画像列の画像データに基づいて時間的に隣接するフレーム画像間のオプティカルフローを導出し、該オプティカルフローに基づいて発言者に対応する特定動作を検出することで発言者を検出するようにしても良い。

特定動作とは、例えば、椅子から立ち上がる動作や、発言するために口を動かす動作である。
即ち例えば、生徒６１の顔領域が生徒６１の机から遠ざかる方向に移動していることを示すオプティカルフローが得られた場合、生徒６１を発言者として検出することができる（生徒６２等が発言者である場合も同様）。
或いは例えば、生徒６１の顔領域内における口周辺部の動き量を算出し、該動き量が基準動き量よりも大きい場合に生徒６１を発言者として検出することもできる（生徒６２等についても同様）。生徒６１の顔領域内における口周辺部のオプティカルフローは、その口周辺部を形成する各部分における動きの向き及び大きさを表す動きベクトルの束である。これらの動きベクトルの大きさの平均値を、口周辺部の動き量として算出することができる。生徒６１が発言者として検出された場合、生徒６１の顔領域の位置及び大きさが発言者情報に含められる（生徒６２等が発言者である場合も同様）。

また例えば、マイク部１３を用いて得た音響信号を利用して発言者を検出するようにしても良い。具体的には例えば、マイクロホン１３Ａ及び１３Ｂの出力音響信号の位相差に基づいて、マイクロホン１３Ａ及び１３Ｂの出力音響信号の主成分が何れの方向からマイクロホン原点（図４参照）に向かって到来したものであるのかを判定する。判定した方向を、音声到来方向と呼ぶ。図７（ａ）に示す如く、音声到来方向は、マイクロホン原点と発言者を結ぶ方向を表す。マイクロホン１３Ａ及び１３Ｂの出力音響信号の主成分を発言者の音声であるとみなすことができる。

複数のマイクロホンの出力音響信号の位相差に基づく、音声到来方向の判定方法として公知の任意の方法を利用することができる。図７（ｂ）を参照して、この判定方法を簡単に説明する。図７（ｂ）に示す如く、無指向性マイクロホンとしてのマイクロホン１３Ａ及び１３Ｂは、距離Ｌ_kを隔てて配置されている。マイクロホン１３Ａとマイクロホン１３Ｂとを結ぶ平面であって、且つ、デジタルカメラ１の前方及び後方の境界となる平面１３Ｐを想定する（平面１３Ｐに直交する二次元図面である図７（ｂ）では、平面１３Ｐが線分として現れている）。前方側には、教育システムが導入される教室内の各生徒が存在している。平面１３Ｐの前方に音源が存在し、音源とマイクロホン１３Ａ及びマイクロホン１３Ｂとを結ぶ各直線と平面１３Ｐとの成す角度がθであるとする（但し、０°＜θ＜９０°）。また、その音源はマイクロホン１３Ａよりもマイクロホン１３Ｂに近い位置に存在するものとする。この場合、音源からマイクロホン１３Ａまでの距離は、音源からマイクロホン１３Ｂまでの距離よりも、距離Ｌ_kｃｏｓθだけ長くなる。従って、音の速さをＶ_kとすると、音源から発せられた音は、その音がマイクロホン１３Ｂに到達してから“Ｌ_kｃｏｓθ／Ｖ_k”に相当する時間だけ遅れてマイクロホン１３Ａに到達することになる。この時間差“Ｌ_kｃｏｓθ／Ｖ_k”は、マイクロホン１３Ａ及び１３Ｂの出力音響信号の位相差となって現れるため、マイクロホン１３Ａ及び１３Ｂの出力音響信号の位相差（即ち、Ｌ_kｃｏｓθ／Ｖ_k）を求めることで、発言者としての音源の音声到来方向（即ちθの値）を求めることができる。上述の説明から明らかなように、角度θは、マイクロホン１３Ａ及び１３Ｂの設置位置を基準とした、発言者からの音の到来方向を表している。

一方で、生徒６１〜６４の位置とデジタルカメラ１（マイクロホン原点）の位置との間の実空間上における距離や、撮像部１１の焦点距離等に基づき、発言者（生徒６１、６２、６３又は６４）の画像空間上における位置と音声到来方向の対応付けを予め行っておく。即ち、音声到来方向が求まれば、フレーム画像上の全画像領域中のどの当たりの画像領域に、発言者の顔の画像データが存在するのかが特定されるように、上記の対応付けを予め行っておく。これにより、音声到来方向の判定結果と顔検出処理の結果から、フレーム画像上における発言者の顔の位置を検出することができる。発言者の顔領域がフレーム画像上の特定画像領域内に存在していることが音声到来方向の判定結果から判明し、仮に、その特定画像領域内に生徒６１の顔領域が存在していたとしたならば、生徒６１が発言者として検出されて生徒６１の顔領域の位置及び大きさが発言者情報に含められる（生徒６２等が発言者である場合も同様）。

更に例えば、生徒６１〜６４の先生が発した、何れかの生徒を指名する音声の音響信号に基づいて発言者を検出するようにしても良い。この場合、生徒６１〜６４の呼び名（氏名やニックネーム）を呼び名データとして予め発言者検出部２１に登録しておくと共に、音響信号に基づいて音響信号に含まれる音声を文字データに変換する音声認識処理を発言者検出部２１にて実行できるように発言者検出部２１を形成しておく。そして、マイクロホン１３Ａ又は１３Ｂの出力音響信号に音声認識処理を施して得られた文字データが生徒６１の呼び名データと一致する時、或いは、該文字データに生徒６１の呼び名データが含まれる時、生徒６１を発言者として検出することができる（生徒６２等が発言者である場合も同様）。この際、フレーム画像上の全画像領域中のどの当たりの画像領域に生徒６１の顔領域が存在するのかを予め決めておくようにすれば、音声認識処理により生徒６１が発言者として検出された時点で、顔検出処理の結果から、発言者情報に含められるべき顔の位置及び大きさを決定することができる（生徒６２等が発言者である場合も同様）。尚、生徒６１〜６４の顔画像を予め登録顔画像として発言者検出部２１に記憶させておき、音声認識処理により生徒６１が発言者として検出された場合、フレーム画像から抽出された各顔領域内の画像と生徒６１の登録顔画像とを照合することで、フレーム画像から抽出された顔領域の何れが生徒６１の顔領域であるのかを判断するようにしても良い（生徒６２等が発言者である場合も同様）。

上述の如く、画像データ及び／又は音響信号に基づく多様な方法によって発言者の検出を行うことができるが、発言者が発言するスタイル（例えば、座ったまま発言するのか、起立して発言するのか）や先生が生徒を指名するスタイルは教育現場によって様々であるため、どのような状況においても正確な発言者検出ができるように、上述の検出方法の内の複数を併用して、発言者検出を行うようにすることが望ましい。

図５の、抽出部２２は、発言者の顔領域の位置及び大きさを規定する発言者情報に基づき、各フレーム画像の画像データから発言者の顔領域内の画像データを抽出し、抽出した画像データを発言者画像データとして出力する。図８の画像６０は、発言者の検出後に撮影されたフレーム画像の例を表している。尚、図８では、図示の簡略化上、生徒６１〜６４の顔のみが示されている（胴体等の図示を省略）。図８において、破線矩形領域６１_F〜６４_Fは、夫々、フレーム画像６０上における生徒６１〜６４の顔領域である。仮に発言者が生徒６１であった場合、抽出部２２は、フレーム画像６０の画像データが入力された際に、フレーム画像６０の画像データから顔領域６１_Fの画像データを発言者画像データとして抽出及び出力する。尚、発言者の顔領域の画像データだけでなく、発言者の肩部分や上半身部分の画像データをも発言者画像データに含めるようにしても構わない。

主制御部１５は、抽出部２２から発言者画像データが出力された場合、その発言者画像データを通信部１６を介してＰＣ２に伝達する。ＰＣ２には、図９（ａ）に示すような、原画像７０の画像データが予め格納されている。原画像７０には、勉強用の情報（数式や英文等）が記されている。抽出部２２から発言者画像データが出力されていない場合には、原画像７０そのものの映像がスクリーン４上に表示されるように、ＰＣ２はプロジェクタ３に映像情報を送出する。一方、抽出部２２から発言者画像データが出力されている場合、ＰＣ２は、原画像７０と発言者画像データから図９（ｂ）に示すような加工画像７１を生成し、加工画像７１の映像がスクリーン４上に表示されるように、ＰＣ２はプロジェクタ３に映像情報を送出する。加工画像７１は、原画像７０上の所定位置に発言者画像データに基づく顔領域内の画像７２を重畳して得られる画像である。画像７２が配置される上記の所定位置は、予め定められた固定位置であっても良いし、該所定位置を原画像７０の内容に応じて変化させても良い。例えば、原画像７０の内、濃淡変化の少ない平坦部（勉強用の情報が記載されていない部分）を検出し、該平坦部に画像７２を配置するようにしても良い。

図５の抽出部２２は、発言者が特定された後、フレーム画像列の画像データに基づいて発言者の顔領域の位置をフレーム画像列上で追尾し、最新のフレーム画像上における発言者の顔領域内の画像データを発言者画像データとして次々と抽出する。この次々と抽出される発言者画像データに基づいて加工画像７１上の画像７２を更新することにより、スクリーン４上において、発言者の顔画像は動画像となる。

また、音響信号処理部１４にて、発言者の音声の音響信号のみを抽出する音源抽出処理を行うようにしても良い。音源抽出処理では、上述の方法によって音声到来方向を検出した後、音声到来方向の指向性を高める指向性制御によって、マイクロホン１３Ａ及び１３Ｂの出力音響信号から発言者の音声の音響信号のみを抽出し、抽出した音響信号を発言者音響信号として生成する。実際には、マイクロホン１３Ａ及び１３Ｂの出力音響信号の位相差を調整することにより、マイクロホン１３Ａ及び１３Ｂの出力音響信号の内、音声到来方向より到来した音の信号成分を強調し、この強調後の音響信号であるモノラルの音響信号を発言者音響信号として生成する。結果、発言者音響信号においては、音声到来方向の指向性が他の方向のそれよりも高くなる。指向性制御の方法として様々な方法が既に提案されており、音響信号処理部１４は、公知の方法を含む任意の指向性制御方法（例えば、特開２０００−８１９００号公報、特開平１０−３１３４９７号公報に記載の方法）を用いて発言者音響信号を生成することができる。

デジタルカメラ１は、得られた発言者音響信号をＰＣ２に伝送することができる。発言者音響信号を、生徒６１〜６４がいる教室内に配置されたスピーカ（不図示）から出力することもできるし、デジタルカメラ１又はＰＣ２に設けられた記録媒体（不図示）に記録することもできる。また、ＰＣ２において発言者音響信号の信号強度を測定し、測定された信号強度に応じた指標を、図９（ｂ）の加工画像７１上に重畳するようにしても良い。該信号強度の測定をデジタルカメラ１側で行うことも可能である。図１０に、その指標を加工画像７１上に重畳することで得た画像７４を示す。画像７４上におけるインジケータ７５の状態は、発言者音響信号の信号強度に応じて変化し、その変化の様子がスクリーン４の表示内容にも反映される。発言者は、このインジケータ７５の状態を見ることで自身の声の大きさを認識することができ、結果、はきはきとした発言を心がける動機付けを得ることができる。

本実施形態に如く、スクリーン４上に発言者の顔画像を表示するようにすれば、生徒全員が発言者の顔を見ながら発言内容を聞くことができるようになる。発言者の顔を見るという生徒間のコミュニケーションによって各生徒の授業への参加意欲（勉強意欲）や授業の臨場感が増し、集団学習の利点（競争心による勉強意欲向上効果など）がより良く活かされるようになる。加えて、発言者以外の各生徒は、発言者の顔を見ながら発言内容を聞くことによって、言葉だけでは表現しきれない発言者の意図を汲み取ることができるようになる。即ち、言葉以外の情報（例えば、表情から読み取れる発言の自信度）をも得ることができるようになり、発言を聞くことで得られる学習の効率が向上する。

本実施形態に係る教育システムの基本的な動作及び構成を説明したが、以下のような応用例も教育システムに適用可能である。

例えば、生徒６１〜６４が発言者となって発言した回数を発言者検出部２１の検出結果に基づいて生徒ごとに計数し、計数した回数をＰＣ２上のメモリ等に記録するようにしても良い。また、この際、生徒ごとに、発言を行っている時間の長さもＰＣ２上のメモリ等に記録するようにしても良い。先生は、これらの記録データを、生徒の学習意欲評価等のための支援データとして利用することができる。

また、生徒６１〜６４の内、複数の生徒が発言者となるべく挙手した場合、通常は、その挙手した複数の生徒の内の１人が先生により発言者として指名されるが、挙手した複数の生徒を上記オプティカルフロー等に基づいてデジタルカメラ１側で自動検出し、乱数等を利用してデジタルカメラ１が挙手した複数の生徒の中から発言者となるべき一人の生徒を指名するようにしても良い。この場合も、デジタルカメラ１が発言者として指名した生徒の顔領域の画像データが発言者画像データとして抽出されて、スクリーン４上に発言者の顔画像が表示される。先生が発言者を指名する方法では、どうしても主観的な要素が介在し、発言者として指名される生徒に偏りが生じる、或いは、実際には偏りが生じていなくても偏りが生じているのではないかという不公平感が生じる。このような偏りや不公平感は、生徒の学習意欲向上にとっての阻害要因であり、排除されたほうが望ましい。上述ようなデジタルカメラ１による発言者指名方法は、該阻害要因の排除に寄与する。

また、ＰＣ２からプロジェクタ３に伝達される映像情報及びマイク部１３にて得られた音響信号に基づく音声情報（発言者音響信号を含む）を、生徒６１〜６４以外の生徒が授業を受けるサテライト教室に配信するようにしても良い。即ち例えば、ＰＣ２からプロジェクタ３に伝達される映像情報及びマイク部１３にて得られた音響信号に基づく音声情報を、無線又は有線にてＰＣ２からＰＣ２以外の情報端末に伝達する。該情報端末は、サテライト教室に配置されたプロジェクタに該映像情報を送出することでサテライト教室に配置されたスクリーン上にスクリーン４と同じ映像を表示させる。それと共に、該情報端末は、サテライト教室に配置されたスピーカに該音声情報を送出する。これにより、サテライト教室で授業を受ける各生徒は、スクリーン４と同じ映像を見ることができると共に、スクリーン４が配置された教室内の音声と同様の音声を聞くことができる。

また、上述の例では、抽出部２２にて抽出された発言者画像データが一旦ＰＣ２に送出されているが、該発言者画像データをデジタルカメラ１内の抽出部２２から直接プロジェクタ３に供給するようにし、ＰＣ２からの原画像７０（図９（ａ）参照）と抽出部２２からの発言者画像データに基づいて加工画像７１（図９（ｂ）参照）を生成する処理をプロジェクタ３内において実行するようにしても良い。

図１に示す例では、デジタルカメラ１とプロジェクタ３が別の筐体に収められているが、デジタルカメラ１とプロジェクタ３を共通の筐体内に収めることも可能である（即ち、デジタルカメラ１とプロジェクタ３を一体化することも可能である）。この場合、デジタルカメラ１及びプロジェクタ３を一体化した装置を、スクリーン４の上部に設置するようにしても良い。デジタルカメラ１及びプロジェクタ３を一体化すれば、発言者画像データをプロジェクタ３に供給する際に無線通信等を行う必要が無くなる。スクリーン４から数センチメートル程度離すだけで数１０インチの映像を投影することのできる超短焦点プロジェクタをプロジェクタ３として用いれば、上述のような一体化の実現が容易となる。

また、発言者検出部２１及び抽出部２２がデジタルカメラ１に設けられている例を上述したが、発言者検出部２１及び抽出部２２は、教育システム（プレゼンテーションシステム）を形成する、デジタルカメラ１以外の任意の構成要素に含まれていても良い。

即ち例えば、発言者検出部２１及び抽出部２２の何れか又は双方をＰＣ２に設けるようにしても良い。発言者検出部２１及び抽出部２２がＰＣ２に設けられる場合には、撮像部１１の撮影によって得られたフレーム画像の画像データを、そのまま通信部１６を介してＰＣ２に供給すればよい。抽出部２２をＰＣ２に設けるようにすれば、抽出に関してより自由度の高い設定が可能となる。例えば、生徒の顔画像の登録処理等を、ＰＣ２にて動作するアプリケーション上にて行う、といったことが可能になる。また、発言者検出部２１及び抽出部２２の何れか又は双方をプロジェクタ３に設けることも可能である。

また、マイク部１３及び音響信号処理部１４から成る部位は、発言者音響信号を生成する音響信号生成部として機能するが、この音響信号生成部の機能の全部又は一部を、デジタルカメラ１ではなく、ＰＣ２又はプロジェクタ３に担わせるようにしても良い。

尚、本実施形態では、教室内の風景を撮影するデジタルカメラの台数が１台であることを想定したが、デジタルカメラの台数は複数台であっても構わない。複数台のデジタルカメラを連係させることにより、多方面からみた映像をスクリーン上に表示させることができる。

＜＜第２実施形態＞＞
本発明の第２実施形態を説明する。図１１は、第２実施形態に係る教育システム（プレゼンテーションシステム）の全体構成を、教育システムの利用者と共に示した図である。第２実施形態に係る教育システムを、任意の年齢層の生徒に対する教育現場に採用することができるが、特に例えば、小、中及び高校生に対する教育現場への採用が適している。図１１に示される人物１６０_A〜１６０_Cは教育現場における生徒である。本実施形態では、生徒の人数が３人であることが想定されるが、生徒の数は２以上であれば何人でも構わない。各生徒１６０_A〜１６０_Cの前方には机が設置されていると共に、生徒１６０_A〜１６０_Cには夫々情報端末１０１_A〜１０１_Cが割り当てられている。図１１の教育システムは、先生用情報端末としてのＰＣ１０２、プロジェクタ１０３、スクリーン１０４及び生徒用情報端末としての情報端末１０１_A〜１０１_Cを含んで構成される。

図１２は、情報端末１０１_Aの概略的な内部ブロック図である。情報端末１０１_Aは、情報端末１０１_Aに対応する生徒１６０_Aが発した音声を収音して音響信号に変換するマイクロホン１１１と、マイクロホン１１１からの音響信号に必要な信号処理を施す音響信号処理部１１２と、無線通信又は有線通信にてＰＣ１０２間との通信を行う通信部１１３と、液晶ディスプレイパネル等から成る表示部１１４と、を備える。

音響信号処理部１１２は、マイクロホン１１１からの音響信号の波形に基づき、その音響信号に含まれる音声を文字データに変換する音声認識処理を実行することができる。通信部１１３は、音響信号処理部１１２にて得られた文字データを含む、任意の情報をＰＣ１０２に伝達することができる。任意の映像を表示部１１４に表示させることができ、ＰＣ１０２から通信部１１３に対して送られた映像信号に基づく映像を表示部１１４に表示させることもできる。

情報端末１０１_B及び１０１_Cの構成は、情報端末１０１_Aのそれと同じである。但し、当然、情報端末１０１_B及び１０１_Cにおけるマイクロホン１１１は、夫々、生徒１６０_B及び１６０_Cが発した音声を収音して音響信号に変換する。生徒１６０_A〜１６０_Cは、夫々、情報端末１０１_A〜１０１_Cの表示部１１４の表示内容を視認することができる。情報端末１０１_A〜１０１_Cは、通信部１１３を用いてＰＣ１０２と通信を行う際、各情報端末に個別に割り当てられた固有のＩＤ番号をＰＣ１０２に伝える。これにより、ＰＣ１０２は、受信情報が何れの情報端末から送信されたものであるかを認識することができる。尚、情報端末１０１_A〜１０１_Cの夫々から表示部１１４を割愛することも可能である。

ＰＣ１０２は、スクリーン１０４に表示されるべき映像の内容を決定し、その映像の内容を表す映像情報を無線又は有線でプロジェクタ１０３に伝達する。これにより、ＰＣ１０２にて決定されたスクリーン１０４にて表示されるべき映像が、実際にプロジェクタ１０３からスクリーン１０４に投影されてスクリーン１０４上に表示される。生徒１６０_A〜１６０_Cがスクリーン１０４の表示内容を視認できるように、プロジェクタ１０３及びスクリーン１０４は設置されている。ＰＣ１０２は、表示部１１４及びスクリーン１０４に対する表示制御部としても機能し、通信部１１３を介して表示部１１４の表示内容を自由に変更することができると共に、プロジェクタ１０３を介してスクリーン１０４の表示内容を自由に変更することができる。

ＰＣ１０２には、情報端末１０１_A〜１０１_Cから特定の文字データが伝達された時に特定の動作をするように形成された特定のプログラムがインストールされている。教育システムの管理者（例えば先生）は、授業内容に合わせて特定のプログラムの動作を自由にカスタマイズすることができる。以下に、特定のプログラムの動作例を幾つか列記する。

第１の動作例では、特定のプログラムが社会学習用プログラムであるとし、この社会学習用プログラムの実行時には、まず都道府県名が併記されていない日本地図の映像がスクリーン１０４及び／又は各表示部１１４上に表示される。例えば、日本地図上における「北海道」の位置を答えさせる問題を生徒に対して出題したい時、先生はＰＣ１０２を操作することで日本地図上における北海道を指定する。この指定が成されると、ＰＣ１０２は、スクリーン１０４及び／又は各表示部１１４の日本地図上における北海道の映像部分を明滅させる。各生徒は、明滅している部分の都道府県名を、自身に対応する情報端末のマイクロホン１１１に向かって発声する。この際、生徒１６０_Aが発声した都道府県名が「北海道」であることを示す文字データが情報端末１０１_AよりＰＣ１０２に伝達された場合、社会学習用プログラムは、情報端末１０１_Aの表示部１１４及び／又はスクリーン１０４上における日本地図の北海道の表示部分に「北海道」という文字が表示されるように、情報端末１０１_Aの表示部１１４及び／又はスクリーン１０４の表示内容を制御する。このような表示内容の制御は、生徒１６０_Aの発声した都道府県名が「北海道」と異なる場合には実行されず、その場合には別の表示が成される。生徒１６０_B又は１６０_Cの発声内容に応じた表示制御も、生徒１６０_Aのそれと同様である。

第２の動作例では、特定のプログラムが算数学習用プログラムであるとし、この算数学習用プログラムの実行時には、まず各欄が空白となっている九九の表の映像がスクリーン１０４及び／又は各表示部１１４上に表示される。例えば、４と５の積を答えさせる問題を生徒に対して出題したい時、先生はＰＣ１０２を操作することで九九の表上における「４×５」の欄を指定する。この指定が成されると、ＰＣ１０２は、スクリーン１０４及び／又は各表示部１１４の九九の表上における「４×５」の欄の映像部分を明滅させる。各生徒は、明滅している部分の答え（即ち、４と５の積の値）を、自身に対応する情報端末のマイクロホン１１１に向かって発声する。この際、生徒１６０_Aが発声した数値が「２０」であることを示す文字データが情報端末１０１_AよりＰＣ１０２に伝達された場合、算数学習用プログラムは、情報端末１０１_Aの表示部１１４及び／又はスクリーン１０４上における「４×５」の欄の表示部分に数値「２０」が表示されるように、情報端末１０１_Aの表示部１１４及び／又はスクリーン１０４の表示内容を制御する。このような表示内容の制御は、生徒１６０_Aの発声した数値が「２０」と異なる場合には実行されず、その場合には別の表示が成される。生徒１６０_B又は１６０_Cの発声内容に応じた表示制御も、生徒１６０_Aのそれと同様である。

第３の動作例では、特定のプログラムが英語学習用プログラムであるとし、この英語学習用プログラムの実行時には、まず、英語の動詞の文言（“take”、“eat”など）がスクリーン１０４及び／又は各表示部１１４上に表示される。例えば、英語の動詞の文言“take”の過去形を答えさせる問題を生徒に対して出題したい時、先生はＰＣ１０２を操作することで文言 “take”を指定する。この指定が成されると、ＰＣ１０２は、スクリーン１０４及び／又は各表示部１１４に表示されている文言“take”の映像部分を明滅させる。各生徒は、明滅している文言“take”の過去形（即ち、“took”）を、自身に対応する情報端末のマイクロホン１１１に向かって発声する。この際、生徒１６０_Aが発声した文言が“took”であることを示す文字データが情報端末１０１_AよりＰＣ１０２に伝達された場合、英語学習用プログラムは、情報端末１０１_Aの表示部１１４及び／又はスクリーン１０４上に表示されている文言“take”が文言“took”に変化するように、情報端末１０１_Aの表示部１１４及び／又はスクリーン１０４の表示内容を制御する。このような表示内容の制御は、生徒１６０_Aの発声した文言が“took”と異なる場合には実行されず、その場合には別の表示が成される。生徒１６０_B又は１６０_Cの発声内容に応じた表示制御も、生徒１６０_Aのそれと同様である。

ペンタブレット等のポインティングデバイスを用いて生徒に解答を行わせるという方法も考えられるが、本実施形態の如く、発声によって解答を行わせて該解答結果を表示画面に反映することにより、より生徒の五感が刺激される。結果、生徒の学習意欲の向上、記憶力の向上を期待できる。

上述の構成例では、生徒用の情報端末側で音声認識処理を実行しているが、生徒用の情報端末以外の任意の装置にて音声認識処理を行うようにしても良く、ＰＣ１０２又はプロジェクタ１０３にて音声認識処理を行うようにしても構わない。ＰＣ１０２又はプロジェクタ１０３にて音声認識処理を行う場合には、各情報端末のマイクロホン１１１から得られた音響信号を通信部１１３を介してＰＣ１０２又はプロジェクタ１０３に伝達し、ＰＣ１０２又はプロジェクタ１０３において、情報端末ごとに、伝達された音響信号の波形に基づき該音響信号に含まれる音声を文字データに変換すればよい。

尚、プロジェクタ１０３に、各生徒の様子又はスクリーン１０４の表示映像を撮影するデジタルカメラを設けておき、該デジタルカメラの撮影結果を何らかの形で教育現場に利用するようにしても良い。例えば、プロジェクタ１０３に設けられたデジタルカメラの撮影範囲に各生徒を収めておき、第１実施形態で述べた方法を採用することで、スクリーン１０４上に発言者の画像を表示するようにしても良い（後述の他の実施形態においても同様）。

＜＜第３実施形態＞＞
本発明の第３実施形態を説明する。図１３は、第３実施形態に係る教育システムの全体構成を、教育システムの利用者と共に示した図である。第３実施形態に係る教育システムを、任意の年齢層の生徒に対する教育現場に採用することができるが、特に例えば、小、中及び高校生に対する教育現場への採用が適している。図１３に示される人物２６０_A〜２６０_Cは教育現場における生徒である。本実施形態では、生徒の人数が３人であることが想定されるが、生徒の数は２以上であれば何人でも構わない。各生徒２６０_A〜２６０_Cの前方には机が設置されていると共に、生徒２６０_A〜２６０_Cには夫々情報端末２０１_A〜２０１_Cが割り当てられている。図１３の教育システムは、プロジェクタ２０３、スクリーン２０４及び情報端末２０１_A〜２０１_Cを含んで構成される。

プロジェクタ２０３は、所望の映像をスクリーン２０４に投影する。生徒２６０_A〜２６０_Cがスクリーン２０４の表示内容を視認できるように、プロジェクタ２０３及びスクリーン２０４は設置されている。

情報端末２０１_A〜２０１_Cの夫々とプロジェクタ２０３との間で無線通信が可能となるように、各情報端末とプロジェクタ２０３に通信部が内蔵されている。情報端末２０１_A〜２０１_Cは、プロジェクタ２０３と通信を行う際、各情報端末に個別に割り当てられた固有のＩＤ番号をプロジェクタ２０３に伝える。これにより、プロジェクタ２０３は、受信情報が何れの情報端末から送信されたものであるかを認識することができる。

情報端末２０１_A〜２０１_Cの夫々には、キーボート、ペンタブレット、タッチパネル等のポインティングデバイスが備えられており、各生徒２６０_A〜２６０_Cは、夫々、情報端末２０１_A〜２０１_Cのポインティングデバイスを操作することで任意の情報（問題に対する答えなど）をプロジェクタ２０３に送信することができる。

図１３に示す例では、英語の学習が行われており、生徒２６０_A〜２６０_Cは、先生が出した問いかけに対する解答を、情報端末２０１_A〜２０１_Cのポインティングデバイスを用いて入力する。生徒２６０_A〜２６０_Cの解答は、情報端末２０１_A〜２０１_Cからプロジェクタ２０３に送信され、プロジェクタ２０３は、生徒２６０_A〜２６０_Cの解答を表す文字等をスクリーン２０４に投影する。この際、スクリーン２０４上のどの解答が何れの生徒の解答であるのかが分かるように、スクリーン２０４の表示内容が制御される。例えば、スクリーン２０４上において、生徒２６０_Aの解答の付近に生徒２６０_Aの呼び名（氏名、ニックネーム、識別番号等）を表示するようにする（生徒２６０_B及び生徒２６０_Cについても同様）。

先生は、レーザーポインタを用いて、スクリーン２０４上の任意の解答を指定することができる。レーザーポインタによる光を受光しているか否かを検出する複数の検出体をマトリクス状にスクリーン２０４の表示面に配置しておくことにより、レーザーポインタによる光がスクリーン２０４のどの部分に照射されているかをスクリーン２０４にて検出することができる。プロジェクタ２０３は、この検出結果に基づいてスクリーン２０４の表示内容を変更することができる。尚、レーザーポインタ以外のマンマシンインターフェイス（例えば、プロジェクタ２０３に接続されたスイッチ）を用いて、スクリーン２０４上の解答の指定が行われても良い。

例えば、スクリーン２０４上の、生徒２６０_Aの解答が記載された表示部分がレーザーポインタにより指定された時、図１４に示す如く、その指定が成される前と比べて、スクリーン２０４上の、生徒２６０_Aの解答の表示サイズを拡大する（或いは、生徒２６０_Aの解答の表示部分を明滅等させるようにしてもよい）。以後、教育現場では、先生と生徒２６０_Aとの間の質疑応答等が行われることが想定される。

また、本実施形態に係る教育システムでは、以下のような使用形態も想定される。先生の出題に対し、生徒２６０_A〜２６０_Cは、それぞれ情報端末２０１_A〜２０１_Cのポインティングデバイスを用いて解答する。例えば、情報端末２０１_A〜２０１_Cのポインティングデバイスを、表示機能をも備えたペンタブレット（液晶ペンタブレット）で構成し、生徒２６０_A〜２６０_Cは、専用ペンを用いて対応するペンタブレットに自身の解答を書き込む。

先生は、任意のマンマシンインターフェイス（ＰＣ、ポインティングデバイス、スイッチ等）を用いて情報端末２０１_A〜２０１_Cの何れかを指定することができ、その指定結果はプロジェクタ２０３に伝送される。仮に、情報端末２０１_Aが指定された場合、プロジェクタ２０３は情報端末２０１_Aに対して送信要求を行い、この送信要求に応じて、情報端末２０１_Aは情報端末２０１_Aのペンタブレットへの書き込み内容に応じた情報をプロジェクタ２０３に伝達する。プロジェクタ２０３は、伝達された情報に応じた映像をスクリーン２０４上に表示する。単純には例えば、情報端末２０１_Aのペンタブレットに書き込まれた内容を、そのままスクリーン２０４上に表示することができる。情報端末２０１_B又は２０１_Cが指定された場合も同様である。

尚、図１３に示す構成ではＰＣ（パーソナルコンピュータ）が教育システムに組み込まれていないが、第２実施形態のように、本実施形態に係る教育システムに先生用情報端末としてのＰＣを組み込むようにしても良い。ＰＣを組み込んだ場合、ＰＣは情報端末２０１_A〜２０１_Cと通信を行って各生徒の解答に応じた映像情報を作成し、該映像情報を無線又は有線でプロジェクタ２０３に伝達することで該映像情報に応じた映像をスクリーン２０４上に表示させることができる。

＜＜第４実施形態＞＞
本発明の第４実施形態を説明する。図１５は、第４実施形態に係る教育システムの全体構成を、教育システムの利用者と共に示した図である。第４実施形態に係る教育システムを、任意の年齢層の生徒に対する教育現場に採用することができるが、特に例えば、小及び中学生に対する教育現場への採用が適している。図１５に示される人物３６０_A〜３６０_Cは教育現場における生徒である。本実施形態では、生徒の人数が３人であることが想定されるが、生徒の数は２以上であれば何人でも構わない。各生徒３６０_A〜３６０_Cの前方には机が設置されていると共に、生徒３６０_A〜３６０_Cには夫々情報端末３０１_A〜３０１_Cが割り当てられている。また、教育現場における先生には先生用の情報端末３０２が割り当てられる。

図１５の教育システムは、情報端末３０１_A〜３０１_C、情報端末３０２、プロジェクタ３０３及びスクリーン３０４を含んで構成される。プロジェクタ３０３には、デジタルカメラ３３１が搭載されており、デジタルカメラ３３１はスクリーン３０４の表示内容を必要に応じて撮影する。情報端末３０１_A〜３０１_Cと情報端末３０２との間で無線通信が可能であると共に、プロジェクタ３０３と情報端末３０２との間で無線通信が可能である。情報端末３０１_A〜３０１_Cは、情報端末３０２と通信を行う際、各情報端末３０１_A〜３０１_Cに個別に割り当てられた固有のＩＤ番号を情報端末３０２に伝える。これにより、情報端末３０２は、受信情報が何れの情報端末（３０１_A、３０１_B又は３０１_C）から送信されたものであるのかを認識することができる。

先生用の情報端末３０２は、スクリーン３０４に表示されるべき映像の内容を決定し、その映像の内容を表す映像情報を無線通信によってプロジェクタ３０３に伝達する。これにより、情報端末３０２にて決定されたスクリーン３０４にて表示されるべき映像が、実際にプロジェクタ３０３からスクリーン３０４に投影されてスクリーン３０４上に表示される。生徒３６０_A〜３６０_Cがスクリーン３０４の表示内容を視認できるように、プロジェクタ３０３及びスクリーン３０４は設置されている。

情報端末３０２には、例えば薄型ＰＣであり、二次電池を駆動源として動作する。情報端末３０２には、タッチパネル及びタッチペンから成るポインティングデバイスと、情報端末３０２の筐体に対して着脱可能に構成されたデジタルカメラである着脱可能カメラと、が備えられており、更にレーザーポインタ等も備えられうる。情報端末３０２において、タッチパネルは表示部として機能する。

生徒用の情報端末３０１_Aは、タッチパネル及びタッチペンから成るポインティングデバイスと、情報端末３０１_Aの筐体に対して着脱可能に構成されたデジタルカメラである着脱可能カメラと、を備え、二次電池を駆動源として動作する。情報端末３０１_Aにおいて、タッチパネルは表示部として機能する。情報端末３０１_B及び３０１_Cは、情報端末３０１_Aと同じものである。

情報端末３０２は、インターネット等の通信網を介して或いは記録媒体を介して、学習内容が記載された教材コンテンツを入手することができる。先生は情報端末３０２のポインティングデバイスを操作することによって、入手された１又は複数の教材コンテンツの中から表示したい教材コンテンツを選択する。この選択が成されると、選択された教材コンテンツの映像が情報端末３０２のタッチパネルに表示される。一方で、情報端末３０２は、選択された教材コンテンツの映像情報をプロジェクタ３０３又は情報端末３０１_A〜３０１_Cに伝送することで、選択された教材コンテンツの映像をスクリーン３０４上又は情報端末３０１_A〜３０１_Cの各タッチパネル上に表示することができる。尚、情報端末３０２の着脱可能カメラにて任意の教材、テキスト、生徒の作品などを撮影し、撮影画像の画像データを情報端末３０２からプロジェクタ３０３又は情報端末３０１_A〜３０１_Cに送ることで該撮影画像をスクリーン３０４上又は情報端末３０１_A〜３０１_Cの各タッチパネル上に表示させることも可能である。

スクリーン３０４上又は情報端末３０１_A〜３０１_Cの各タッチパネル上に、学習用の問題（例えば算数の問題）が表示されたとき、生徒３６０_A〜３６０_Cは情報端末３０１_A〜３０１_Cのポインティングデバイスを用いて該問題に対して解答する。即ち、情報端末３０１_A〜３０１_Cのタッチパネル上に解答を書き込む、或いは、選択式の問題である場合には正解と思われる選択肢をタッチペンで選択する。生徒３６０_A〜３６０_Cが情報端末３０１_A〜３０１_Cに入力した解答は、夫々、解答Ａ、Ｂ及びＣとして、先生用の情報端末３０２に伝送される。

先生が情報端末３０２のポインティングデバイスを用いて、情報端末３０２の動作モードの１つである解答チェックモードを選択すると、情報端末３０２において解答チェックモード用プログラムを動作する。

解答チェックモード用プログラムは、まず、教室内における生徒用情報端末の配列状態に適合するようなテンプレート画像を作成し、該テンプレート画像をスクリーン３０４に表示させるための映像情報をプロジェクタ３０３に送信する。これにより例えば、スクリーン３０４の表示内容は、図１６のようになる。今、解答チェックモード用プログラム上における生徒３６０_A〜３６０_Cの呼び名が、夫々、生徒Ａ、Ｂ及びＣであるとする。そうすると、教室内の生徒３６０_A〜３６０_Cの並び方と同様の並び方にて、テンプレート画像には、生徒Ａと記載された四角枠、生徒Ｂと記載された四角枠及び生徒Ｃと記載された四角枠が並んで描画される。本実施形態の想定とは異なるが、仮に（５×４）人の生徒が二次元配列状に並んでいるとしたならば、対応する呼び名が各々に記載された（５×４）個の四角枠を含むテンプレート画像が生成され、スクリーン３０４の表示内容は、図１７のようになる。

解答チェックモード用プログラムの動作中において、情報端末３０２のポインティングデバイスを用いて先生が生徒Ａ（即ち、生徒３６０_A）を選択した場合、解答チェックモード用プログラムは、解答Ａをスクリーン３０４に表示させるための映像情報を作成して該映像情報をプロジェクタ３０３に送信する。これにより、情報端末３０１_Aのタッチパネルに書き込まれた内容と同じ内容、又は、情報端末３０１_Aのタッチパネルの表示内容と同じ内容が、スクリーン３０４に表示される。

尚、情報端末３０２のポインティングデバイスを用いて先生が生徒Ａ（即ち、生徒３６０_A）を選択した場合、情報端末３０１_Aから直接プロジェクタ３０３に映像情報を無線伝送することで、情報端末３０１_Aのタッチパネルに書き込まれた内容と同じ内容、又は、情報端末３０１_Aのタッチパネルの表示内容と同じ内容を、スクリーン３０４に表示させるようにしても良い。また、ポインティングデバイスを用いるのではなく、情報端末３０２に備えられたレーザーポインタを用いて先生は生徒Ａを選択することも可能である。レーザーポインタはスクリーン３０４上の任意の位置を指定することができ、スクリーン３０４は、第３実施形態で述べた方法にて指定位置を検出する。解答チェックモード用プログラムは、スクリーン３０４からプロジェクタ３０３を通じて伝送されてきた指定位置に基づき、何れの生徒が選択されたのかを認識することができる。生徒Ａ（即ち、生徒３６０_A）が選択された場合の動作を説明したが、生徒Ｂ又はＣ（即ち、生徒３６０_B又は３６０_C）が選択された場合も同様である。

教材コンテンツによっては、生徒が、スクリーン専用ペンを用いて直接スクリーン３０４に解答等の記入或いは描画を行う。スクリーン３０４上を移動するスクリーン専用ペンの軌跡は、スクリーン３０４上に表示される。この軌跡の表示がなされている時において、先生が情報端末３０２に対して所定の記録操作を行うと、その操作内容がプロジェクタ３０３に伝送されてデジタルカメラ３３１がスクリーン３０４の表示画面を撮影する。情報端末３０２の制御の下、この撮影によって得られた画像を、情報端末３０２及び情報端末３０１_A〜３０１_Cに転送して情報端末３０２及び情報端末３０１_A〜３０１_Cの各タッチパネル上に表示することも可能であるし、情報端末３０２における記録媒体に記録することも可能である。

また、生徒用の情報端末３０１_A〜３０１_Cに搭載された着脱可能カメラは、対応する生徒３６０_A〜３６０_Cの顔を撮影することができる。情報端末３０１_A〜３０１_Cは、生徒３６０_A〜３６０_Cの顔の撮影画像の画像データを情報端末３０２に送ることにより或いはプロジェクタ３０３に直接送ることで、スクリーン３０４の表示画面の周辺部分に各顔の撮影画像を表示させることができる。これにより、先生がスクリーン３０４の方を向いていても、先生は各生徒の様子を確認することが可能である（例えば、生徒が寝ていないかを確認することができる）。

＜＜第５実施形態＞＞
本発明の第５実施形態を説明する。第５実施形態及び後述の各実施形態において、特に記述しない事項に関しては、矛盾なき限り、上述の第１、第２、第３又は第４実施形態にて述べた事項を、第５実施形態及び後述の各実施形態に適用することができる。第５実施形態に係る教育システム（プレゼンテーションシステム）の全体構成図は、第１実施形態のそれと同じである（図１参照）。即ち、第５実施形態に係る教育システムは、デジタルカメラ１、ＰＣ２、プロジェクタ３及びスクリーン４を含んで構成される。

但し、第５実施形態では、図１８に示す如く、撮像部１１の光軸方向を変化させるためのカメラ駆動機構１７がデジタルカメラ１に設けられていることを想定する。カメラ駆動機構１７は、撮像部１１を固定する雲台及び該雲台を回転駆動させるためのモータ等から成る。デジタルカメラ１の主制御部１５又はＰＣ２は、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させることができる。図４のマイクロホン１３Ａ及び１３Ｂは上記雲台には固定されていない。従って、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させたとしても、マイクロホン１３Ａ及び１３Ｂの位置や収音方向に影響は生じないものとする。尚、マイクロホン１３Ａ及び１３Ｂから成るマイク部１３は、デジタルカメラ１の外部に設けられたマイク部であると解釈するようにしても良い。

第５実施形態では、以下の教室環境ＥＥ_Aを想定する（図１９（ａ）及び（ｂ）参照）。この教育環境ＥＥ_Aでは、教育システムが導入される教室５００内に人物である１６人の生徒ＳＴ［１］〜ＳＴ［１６］が存在しており、生徒ＳＴ［１］〜ＳＴ［１６］の夫々には机が割り当てられており、計１６個の机は縦横に４個ずつ並んで配置され（図１９（ｂ）参照）、生徒ＳＴ［１］〜ＳＴ［１６］は各机に対応付けられた椅子に座っており（図１９（ａ）において、机及び椅子の図示を省略）、生徒ＳＴ［１］〜ＳＴ［１６］がスクリーン４の表示内容を視認できるようにプロジェクタ３及びスクリーン４が教室５００内に設置されている。

図１に示す如く、例えば、デジタルカメラ１をスクリーン４上部に設置することができる。マイクロホン１３Ａ及び１３Ｂは、個別にデジタルカメラ１の周辺音（厳密にはマイクロホン自身の周辺音）を音響信号に変換し、得られた音響信号を出力する。マイクロホン１３Ａ及び１３Ｂの出力音響信号は、アナログ信号及びデジタル信号のどちらでも良く、第１実施形態で述べたように図３の音響信号処理部１４においてデジタルの音響信号に変換されるものであっても良い。生徒ＳＴ［ｉ］が音声を発している場合、デジタルカメラ１の周辺音には、発言者としての生徒ＳＴ［ｉ］の音声が含まれる（ｉは整数）。

今、生徒ＳＴ［１］〜ＳＴ［１６］の内の一部のみが同時に撮像部１１の撮影範囲内に収まるように、デジタルカメラ１の設置場所及び設置方向並びに撮像部１１の撮影画角が設定されているものとする。第１及び第２タイミング間においてカメラ駆動機構１７を用いて撮像部１１の光軸方向変化が生じたことを想定すると、例えば、第１タイミングにおいては生徒ＳＴ［１］、ＳＴ［２］及びＳＴ［５］のみが撮像部１１の撮影範囲内に収まり、第２タイミングにおいては生徒ＳＴ［３］、ＳＴ［４］及びＳＴ［８］のみが撮像部１１の撮影範囲内に収まる。

図２０は、第５実施形態に係る教育システムの一部のブロック図であり、教育システムは、符号１７及び符号３１〜３６によって参照される各部位を備える。図２０に示される各部位は、教育システムを形成する何れか任意の装置内に設けられ、それらの全部又は一部を、デジタルカメラ１又はＰＣ２に設けておくこともできる。例えば、音声到来方向判定部３２を内包する発言者検出部３１、発言者画像データ生成部３３及び発言者音響信号生成部３４をデジタルカメラ１内に設ける一方、記録制御部としての機能を有する制御部３５及び記録媒体３６をＰＣ２内に設けるようにしても良い。教育システムにおいて、任意の異なる部位間の情報伝達を、無線通信又は有線通信により実現することができる（他の全ての実施形態においても同様）。

音声到来方向判定部３２は、マイクロホン１３Ａ及び１３Ｂの出力音響信号に基づいて、マイクロホン１３Ａ及び１３Ｂの設置位置を基準とした発言者からの音の到来方向、即ち音声到来方向を判定する(図７（ａ）参照)。出力音響信号の位相差に基づく音声到来方向の判定方法は、第１実施形態で述べたものと同様であり、この判定によって、音声到来方向の角度θが求まる（図７（ｂ）参照）。

発言者検出部３１は、音声到来方向判定部３２にて求められた角度θに基づき、発言者を検出する。生徒ＳＴ［ｉ］と図７（ｂ）に示される平面１３Ｐとの成す角度をθ_ST[i]にて表し、θ_ST[1]〜θ_ST[16]は互いに異なるものとする。そうすると、角度θが求められた時点で、発言者が何れの生徒であるかを検出することができる。隣接する生徒間の角度差（例えば、θ_ST[6]とθ_ST[7]の差）が互いに十分に離れている場合、音声到来方向判定部３２の判定結果のみに基づいて発言者を正確に検出することができるが、その角度差が小さい場合には画像データを更に併用することで発言者の検出を高精度化することができる（詳細は後述）。

発言者検出部３１は、角度θに対応する音源が撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させる。

例えば、生徒ＳＴ［３］、ＳＴ［４］及びＳＴ［８］のみが撮像部１１の撮影範囲内に収まっている状態において、生徒ＳＴ［２］が発言者として声を発したとする。この場合、音声到来方向判定部３２では、生徒ＳＴ［２］と平面１３Ｐとの成す角度θ_ST[2]が角度θとして求められ、発言者検出部３１は、角度θ（＝θ_ST[2]）に対応する音源、即ち生徒ＳＴ［２］が撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させる。“生徒ＳＴ［ｉ］が撮像部１１の撮影範囲内に収まる”とは、少なくとも生徒ＳＴ［ｉ］の顔が撮像部１１の撮影範囲内に収まる状態を意味する。

音声到来方向判定部３２にて求められた角度θに基づき発言者が生徒ＳＴ［１］、ＳＴ［２］及びＳＴ［５］の何れかであることが判断できるものの、角度θだけでは発言者が生徒ＳＴ［１］、ＳＴ［２］及びＳＴ［５］の何れであるのかを判別し難い場合、発言者検出部３１は、画像データを併用して発言者を特定することができる。即ち例えば、この場合、角度θに基づき生徒ＳＴ［１］、ＳＴ［２］及びＳＴ［５］が撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させ、この状態で撮像部１１から得られるフレーム画像の画像データを用いて、発言者が生徒ＳＴ［１］、ＳＴ［２］及びＳＴ［５］の何れであるのかを検出することができる。フレーム画像の画像データに基づき複数の生徒の中から発言者を検出する方法として第１実施形態で述べたそれを利用することができる。

発言者検出部３１は、発言者の検出後又は検出過程において、発言者に注目した撮影制御を成すことができる。角度θに対応する音源が撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させる制御も、この撮影制御に含まれる。この他、例えば、生徒ＳＴ［１］〜ＳＴ［１６］の顔の内、発言者としての生徒の顔のみが撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させても良く、この際、必要に応じて撮像部１１の撮影画角も制御するようにしても良い。

発言者を撮像部１１の撮影範囲内に収めた状態での撮影によって得られたフレーム画像を、フレーム画像５３０と呼ぶ。図２１にフレーム画像５３０の例が示されている。図２１のフレーム画像５３０では、発言者としての一人の生徒のみが写し出されているが、フレーム画像５３０には、発言者だけでなく発言者以外の生徒の画像データも存在することがある。ＰＣ２は、フレーム画像５３０の画像データを通信を介してデジタルカメラ１から受け取り、フレーム画像５３０そのもの又はフレーム画像５３０に基づく画像を、映像としてスクリーン４に表示させることができる。

図２０の発言者検出部３１に第１実施形態で述べた発言者情報を生成させ、図５に示す抽出部２２を図２０の発言者画像データ生成部３３に設けておくことができる。そうすると、発言者画像データ生成部３３は、発言者情報に基づきフレーム画像５３０の画像データから発言者画像データを抽出することができる。発言者画像データにて表される画像を、映像としてスクリーン４に表示させることもできる。

発言者音響信号生成部３４は、第１実施形態と同様の方法を用いて、音声到来方向の判定結果に基づき、マイクロホン１３Ａ及び１３Ｂの出力音響信号から発言者より到来する音響信号成分を抽出し、これによって発言者からの音の成分が強調された音響信号である発言者音響信号を生成する。発言者音響信号生成部３４にて、上述の何れかの実施形態で述べた音声認識処理を実行し、発言者音響信号に含まれる音声を文字データ（以下、発言者文字データと呼ぶ）に変換するようにしても良い。

撮像部１１の出力に基づく画像データ（例えば発言者画像データ）及びマイク部１３の出力に基づく音響信号データ（例えば、発言者音響信号を表すデータ）等、任意のデータを、記録媒体３６に記録させることができ且つ教育システムを形成する任意の装置に対して送信することができ且つ任意の再生装置上で再生することできる。制御部３５において、これらの記録、送信及び再生の制御を成すことができる。

本実施形態によっても、生徒全員が発言者の顔を見ながら発言内容を聞くことができるようになるため、第１実施形態と同様の効果が得られる。

以下、本実施形態に適用することのできる幾つかの応用技術又は変形技術を、技術α１〜α５として説明する。矛盾なき限り、技術α１〜α５の内の複数の技術を組み合わせて実施することもできる。

［技術α１］
技術α１を説明する。技術α１において、制御部３５は、発言者画像データ及び発言者音響信号に応じた発言者音響データを互いに関連付けて記録媒体３６に記録させる。発言者音響データは、例えば、発言者音響信号そのもの若しくはそれの圧縮信号又は発言者文字データである。複数のデータの関連付け記録方法は任意である。例えば、関連付けられるべき複数のデータを１つのファイル内に格納した上で、該ファイルを記録媒体３６に記録すればよい。動画像形式の発言者画像データと発言者音響信号を記録媒体３６から読み出せば、発言者の動画像を音声付きで再生することもできる。

制御部３５は、発言者が発言を行っている時間の長さ（以下、発言時間と言う）を計測することもできる。発言時間は、発言者の検出が成された時点から、所定の発言終了条件が成立までの時間の長さである。発言終了条件は、例えば、発言者による発声の後、一定時間当該発言者からの発声が検知されない場合、或いは、席から立った状態で発言していた発言者が着席した場合に成立する。制御部３５は、発言者画像データ、発言者音響データ及び発言時間データを互いに関連付けて記録媒体３６に記録させることができる。発言時間データは、上記発言時間を表すデータである。

発言者画像データ及び発言者音響データの関連付け記録、又は、発言者画像データ、発言者音響データ及び発言時間データの関連付け記録を、発言者ごとに（即ち生徒ごとに）個別に実施することができる。関連付け記録された発言者画像データ及び発言者音響データを総称して、又は、関連付け記録された発言者画像データ、発言者音響データ及び発言時間データを総称して、関連付け記録データと呼ぶ。尚、他の付加データが関連付け記録データに付与されていても良い。

教育システムにおける管理者（例えば先生）は、記録媒体３６の記録データの中から、発言者ごとに関連付け記録データを自由に読み出すことができる。例えば、生徒ＳＴ［２］の発言内容を聴きたい場合、生徒ＳＴ［２］の固有番号等をＰＣ２に入力することにより、生徒ＳＴ［２］が発言者になっている状態における映像及び音声を、任意の再生機器（例えばＰＣ２）上で再生させることができる。また、関連付け記録データを、映像及び音声付きの授業内容議事録として活用することもできる。

［技術α２］
技術α２を説明する。本実施形態では、カメラ駆動機構１７を用いることを想定したが、技術α２では、カメラ駆動機構１７を用いずに生徒ＳＴ［１］〜ＳＴ［１６］の全てが撮像部１１の撮影範囲内に収まるようにデジタルカメラ１を設置しておき、発言者の検出後、第１実施形態の抽出部２２と同様のトリミングにより、フレーム画像の画像データから発言者画像データの画像データを得るようにする。

［技術α３］
技術α３を説明する。討論においては、複数の生徒が同時に発声することもある。技術α３では、複数の生徒が同時に発声している状況を想定し、複数の発言者の音響信号を個別に生成する。例えば、生徒ＳＴ［１］及びＳＴ［４］が同時に発言者となって同時に発声する状態を考える。発言者音響信号生成部３４は、マイクロホン１３Ａ及び１３Ｂの出力音響信号に基づき生徒ＳＴ［１］から到来した音の信号成分を指向性制御によって強調することにより、マイクロホン１３Ａ及び１３Ｂの出力音響信号から生徒ＳＴ［１］についての発言者音響信号を抽出する一方で、マイクロホン１３Ａ及び１３Ｂの出力音響信号に基づき生徒ＳＴ［４］から到来した音の信号成分を指向性制御によって強調することにより、マイクロホン１３Ａ及び１３Ｂの出力音響信号から生徒ＳＴ［４］についての発言者音響信号を抽出する。生徒ＳＴ［１］及びＳＴ［４］の発言者音響信号の分離抽出に、公知の方法を含む任意の指向性制御方法（例えば、特開２０００−８１９００号公報、特開平１０−３１３４９７号公報に記載の方法）を用いることができる。

音声到来方向判定部３２は、生徒ＳＴ［１］及びＳＴ［４］についての発言者音響信号から、夫々、生徒ＳＴ［１］及びＳＴ［４］に対応する音声到来方向を判定することができる、即ち角度θ_ST[1]及びθ_ST[4]を検出することができる。検出された角度θ_ST[1]及びθ_ST[4]に基づき、発言者検出部３１は、生徒ＳＴ［１］及びＳＴ［４］が共に発言者であると判断する。

制御部３５は、複数の発言者が同時に発声している場合、複数の発言者の発言者音響信号を個別に記録媒体３６に記録しておくことができる。例えば、第１発言者としての生徒ＳＴ［１］の発言者音響信号をＬチャンネル用音響信号として、且つ、第２発言者としての生徒ＳＴ［４］の発言者音響信号をＲチャンネル用音響信号として取り扱い、それらの音響信号をステレオ記録させることができる。また、Ｑ人の発言者が同時に発声している場合には（Ｑは３以上の整数）、Ｑ人の発言者の発言者音響信号を別個のチャンネル信号として取り扱い、Ｑ個のチャンネル信号から形成されるマルチチャンネル信号（例えば、５．１チャンネル信号）を記録媒体３６に記録しておくようにしても良い。

発言者検出部３１によって、生徒ＳＴ［１］及びＳＴ［４］が共に発言者であると判断された場合、生徒ＳＴ［１］及びＳＴ［４］の双方が同時に撮像部１１の撮影範囲内に収まるように、必要に応じて、撮像部１１の撮影画角を調整すると共にカメラ駆動機構１７を用いて撮像部１１の撮影方向を調整するようにしても良い。そして、第１実施形態で述べた方法を用いて図２０の発言者検出部３１に生徒ＳＴ［１］及びＳＴ［４］の発言者情報を個別に生成させ（図５も参照）、各発言者情報に基づくトリミングをフレーム画像に対して実行することで、発言者画像データ生成部３３にて生徒ＳＴ［１］及びＳＴ［４］の発言者画像データを個別に生成するようにしても良い。更に、技術α１で述べた、発言者ごとの関連付け記録を実施するようにしても良い。

［技術α４］
技術α４を説明する。教室５００内に複数のスピーカを設置しておき、複数のスピーカの全部又は一部を用いて、発言者音響信号をリアルタイムで再生するようにしても良い。例えば、図２２に示す如く、矩形状の教室５００の四隅にスピーカＳＰ１〜ＳＰ４を１つずつ設置しておく。生徒ＳＴ［１］〜ＳＴ［１６］の何れもが発言者となっていない場合には、マイク部１３の出力音響信号に基づく音響信号、又は、任意の音響信号を、スピーカＳＰ１〜ＳＰ４の全部又は一部にて再生することができる。

また、生徒ＳＴ［１］〜ＳＴ［１６］の夫々に１つずつヘッドホンを割り当てておき、各ヘッドホンにて、マイク部１３の出力音響信号に基づく音響信号（例えば発言者音響信号）又は任意の音響信号を、再生するようにしても良い。例えば、ＰＣ２が、スピーカＳＰ１〜ＳＰ４における再生及び各ヘッドホンにおける再生を制御する。

［技術α５］
技術α５を説明する。本実施形態では、マイク部１３が２つのマイクロホン１３Ａ及び１３Ｂから成る場合を想定したが、マイク部１３に含まれるマイクロホンの個数は３以上であっても良く、発言者音響信号の形成に利用されるマイクロホンの個数は３以上であっっても良い。

尚、上述の技術α１〜α５を、上述の第１、第２、第３又は第４実施形態に適用することもできる（但し、技術α２を除く）。上述の技術α１を、第１、第２、第３又は第４実施形態において実施する場合、第１、第２、第３又は第４実施形態の教育システムを形成する何れか任意の装置（例えばデジタルカメラ１又はＰＣ２）内に、制御部３５及び記録媒体３６を設けておけばよい。上述の技術α３を、第１、第２、第３又は第４実施形態において実施する場合、第１、第２、第３又は第４実施形態の教育システムを形成する何れか任意の装置（例えばデジタルカメラ１又はＰＣ２）内に、発言者検出部３１、発言者画像データ生成部３３、発言者音響信号生成部３４、制御部３５及び記録媒体３６を設けておけばよい。

＜＜第６実施形態＞＞
本発明の第６実施形態を説明する。第６実施形態に係る教育システム（プレゼンテーションシステム）の全体構成図は、第１実施形態のそれと同じである（図１参照）。また、第５実施形態において述べた事項を、矛盾なき限り、第６実施形態において実施しても良い。以下では、第５実施形態と同様、カメラ駆動機構１７がデジタルカメラ１に設けられることを想定する。

第６実施形態でも、図１９（ａ）及び（ｂ）に示す教育環境ＥＥ_Aを想定する。但し、第６実施形態では、図２３（ａ）に示す如く、教育環境ＥＥ_Aにおける教室５００内に、図４のマイク部１３と異なる、４つのマイクロホンＭＣ１〜ＭＣ４が設けられている。図２４に示す如く、マイクロホンＭＣ１〜ＭＣ４はマイク部５５０を形成する。発言者検出部５５２及び発言者音響信号生成部５５３を内包する音響信号処理部５５１は、図１のデジタルカメラ１又はＰＣ２内に設けられる。図２４に示されるマイク部５５０も、教育システムの構成要素であると考えても良い。マイクロホンＭＣ１〜ＭＣ４は、教室５００内の互いに異なる位置である、教室５００の四隅に配置される。教育環境ＥＥ_AにマイクロホンＭＣ１〜ＭＣ４を設置した教育環境を、便宜上、教育環境ＥＥ_Bと呼ぶ。尚、マイク部５５０を形成するマイクロホンの個数は４に限定されず、２以上であれば良い。

図２３（ｂ）に示す如く、教室５００内のエリアを、４つの分割エリア５４１〜５４４に細分化することができる。マイクロホンＭＣ１〜ＭＣ４の内、分割エリア５４１内の各位置はマイクロホンＭＣ１に対して最も近く、分割エリア５４２内の各位置はマイクロホンＭＣ２に対して最も近く、分割エリア５４３内の各位置はマイクロホンＭＣ３に対して最も近く、分割エリア５４４内の各位置はマイクロホンＭＣ４に対して最も近い。分割エリア５４１内には、生徒ＳＴ［１］、ＳＴ［２］、ＳＴ［５］及びＳＴ［６］が位置し、分割エリア５４２内には、生徒ＳＴ［３］、ＳＴ［４］、ＳＴ［７］及びＳＴ［８］が位置し、分割エリア５４３内には、生徒ＳＴ［９］、ＳＴ［１０］、ＳＴ［１３］及びＳＴ［１４］が位置し、分割エリア５４４内には、生徒ＳＴ［１１］、ＳＴ［１２］、ＳＴ［１５］及びＳＴ［１６］が位置する。従って、マイクロホンＭＣ１〜ＭＣ４の内、生徒ＳＴ［１］、ＳＴ［２］、ＳＴ［５］及びＳＴ［６］に最も近いマイクロホンはマイクロホンＭＣ１であり、生徒ＳＴ［３］、ＳＴ［４］、ＳＴ［７］及びＳＴ［８］に最も近いマイクロホンはマイクロホンＭＣ２であり、生徒ＳＴ［９］、ＳＴ［１０］、ＳＴ［１３］及びＳＴ［１４］に最も近いマイクロホンはマイクロホンＭＣ３であり、生徒ＳＴ［１１］、ＳＴ［１２］、ＳＴ［１５］及びＳＴ［１６］に最も近いマイクロホンはマイクロホンＭＣ４である。

マイクロホンＭＣ１〜ＭＣ４の夫々は、自身の周辺音を音響信号に変換し、得られた音響信号を音響信号処理部５５１に出力する。

発言者検出部５５２は、マイクロホンＭＣ１〜ＭＣ４の出力音響信号に基づいて発言者を検出する。上述したように、教室５００内における各位置はマイクロホンＭＣ１〜ＭＣ４の何れかと対応付けられており、結果、教室５００内の各生徒はマイクロホンＭＣ１〜ＭＣ４の何れかと対応付けられている。発言者検出部５５２を含む音響信号処理部５５１に、このような生徒ＳＴ［１］〜ＳＴ［１６］とマイクロホンＭＣ１〜ＭＣ４との対応関係を予め認識させておくこともできる。

発言者検出部５５２は、マイクロホンＭＣ１〜ＭＣ４の出力音響信号の大きさを比較し、最大の大きさに対応する分割エリア内に発言者が存在すると判断する。出力音響信号の大きさとは、出力音響信号のレベル又はパワーである。マイクロホンＭＣ１〜ＭＣ４の内、出力音響信号の大きさが最大となっているマイクロホンを、発言者近傍マイクロホンと呼ぶ。例えば、マイクロホンＭＣ１が発言者近傍マイクロホンであるならば、マイクロホンＭＣ１に対応する分割エリア５４１内の生徒ＳＴ［１］、ＳＴ［２］、ＳＴ［５］及びＳＴ［６］の何れかが発言者であると判断し、マイクロホンＭＣ２が発言者近傍マイクロホンであるならば、マイクロホンＭＣ２に対応する分割エリア５４２内の生徒ＳＴ［３］、ＳＴ［４］、ＳＴ［７］及びＳＴ［８］の何れかが発言者であると判断する。マイクロホンＭＣ３又はＭＣ４が発言者近傍マイクロホンである場合も同様である。

発言者近傍マイクロホンがマイクロホンＭＣ１であるとき、カメラ駆動機構１７を用いて生徒ＳＴ［１］、ＳＴ［２］、ＳＴ［５］及びＳＴ［６］を撮像部１１の撮影範囲内に収め、この状態で得られたフレーム画像の画像データに基づき、発言者が生徒ＳＴ［１］、ＳＴ［２］、ＳＴ［５］及びＳＴ［６］の何れであるかを特定するようにしても良い。同様に、発言者近傍マイクロホンがマイクロホンＭＣ２であるとき、カメラ駆動機構１７を用いて生徒ＳＴ［３］、ＳＴ［４］、ＳＴ［７］及びＳＴ［８］を撮像部１１の撮影範囲内に収め、この状態で得られたフレーム画像の画像データに基づき、発言者が生徒ＳＴ［３］、ＳＴ［４］、ＳＴ［７］及びＳＴ［８］の何れであるかを特定するようにしても良い。マイクロホンＭＣ３又はＭＣ４が発言者近傍マイクロホンである場合も同様である。フレーム画像の画像データに基づき複数の生徒の中から発言者を検出する方法として第１実施形態で述べたそれを利用することができる。

尚、教育環境ＥＥ_Bとは異なるが、仮に分割エリアごとに１人の生徒しか存在しない場合には、即ち例えば、分割エリア５４１、５４２、５４３及び５４４に夫々生徒ＳＴ［１］、ＳＴ［４］、ＳＴ［１３］及びＳＴ［１６］しか存在しない場合（図１９（ａ）及び図２３（ｂ）参照）には、発言者近傍マイクロホンの検出のみによって発言者を特定することができる。つまり、この場合、発言者近傍マイクロホンがマイクロホンＭＣ１であるならば、生徒ＳＴ［１］が発言者として特定され、発言者近傍マイクロホンがマイクロホンＭＣ２であるならば、生徒ＳＴ［４］が発言者として特定される（マイクロホンＭＣ３又はＭＣ４が発言者近傍マイクロホンである場合も同様）。

発言者音響信号生成部５５３（以下、生成部５５３と略記する）は、発言者検出部５５２にて検出された発言者からの音の成分を含む発言者音響信号を生成する。マイクロホンＭＣ１〜ＭＣ４の内、発言者に対応するマイクロホン（即ち発言者近傍マイクロホン）の出力音響信号をＭＣ_Aとし、それら以外の３つのマイクロホンの出力音響信号をＭＣ_B、ＭＣ_C及びＭＣ_Dとした場合、“ＭＩＸ＝ｋ_A・ＭＣ_A＋ｋ_B・ＭＣ_B＋ｋ_C・ＭＣ_C＋ｋ_D・ＭＣ_D”に従った信号混合により得られる音響信号ＭＩＸを、発言者音響信号として生成することができる。ここで、ｋ_B、ｋ_C及びｋ_Dはゼロまたは正の値を持ち、ｋ_Aはｋ_B、ｋ_C及びｋ_Dよりも大きな値を持つ。

発言者検出部５５２は、発言者の検出後又は検出過程において、発言者に注目した撮影制御を成すことができる。発言者が撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させる制御も、この撮影制御に含まれる。この他、例えば、生徒ＳＴ［１］〜ＳＴ［１６］の顔の内、発言者としての生徒の顔のみが撮像部１１の撮影範囲内に収まるように、カメラ駆動機構１７を用いて撮像部１１の光軸方向を変化させても良く、この際、必要に応じて撮像部１１の撮影画角も制御するようにしても良い。

発言者を撮像部１１の撮影範囲内に収めた状態での撮影によって得られたフレーム画像が、図２１のフレーム画像５３０である場合、第５実施形態と同様、ＰＣ２は、フレーム画像５３０の画像データを通信を介してデジタルカメラ１から受け取り、フレーム画像５３０そのもの又はフレーム画像５３０に基づく画像を、映像としてスクリーン４に表示させることもできる。

第６実施形態に係る教育システムに発言者画像データ生成部３３を設けておき、発言者検出部５５２による発言者の検出結果に基づき、第１又は第５実施形態で述べた方法に従って、発言者画像データを発言者画像データ生成部３３に生成させても良い。図２４の発言者検出部５５２に第１実施形態で述べた発言者情報を生成させてもよく、この場合、発言者画像データ生成部３３は、発言者情報に基づきフレーム画像５３０の画像データから発言者画像データを抽出することができる。発言者画像データにて表される画像を、映像としてスクリーン４に表示させることもできる。

更に、第６実施形態に係る教育システムに図２０の制御部３５及び記録媒体３６を設けておき、それらに第５実施形態で述べた記録動作を実行させると良い。撮像部１１の出力に基づく画像データ（例えば発言者画像データ）及びマイク部５５０の出力に基づく音響信号データ（例えば、発言者音響信号を表すデータ）等、任意のデータを、記録媒体３６に記録させることができ且つ教育システムを形成する任意の装置に対して送信することができ且つ任意の再生装置上で再生することできる。尚、発言者が特定されていない期間においては、マイクロホンＭＣ１〜ＭＣ４の出力音響信号を等比率で混合して得た音響信号を記録媒体３６に記録しておくことができる。

尚、マイクロホン１３Ａ及び１３Ｂの出力音響信号を用い、第５実施形態で述べた方法に従って発言者を検出した後、発言者の検出結果に基づいてマイクロホンＭＣ１〜ＭＣ４の出力音響信号から発言者音響信号を生成するようにしても良い。或いは、マイクロホンＭＣ１〜ＭＣ４の出力音響信号を用いて発言者を検出した後、第５実施形態と同様にして、マイクロホン１３Ａ及び１３Ｂの出力音響信号から発言者音響信号を生成するようにしても良い。

第６実施形態においても、上記の技術α１、α２及びα５を実施することができる。

第６実施形態においても、上記の技術α３を実施することができる。第６実施形態において技術α３を実施する場合、発言者検出部５５２は、技術α３で述べた方法に従い複数の生徒が発言者であると判断することができる。これにより例えば、生徒ＳＴ［１］及びＳＴ［４］が発言者であると判断された場合、発言者音響信号生成部５５３は、生徒ＳＴ［１］に対応するマイクロホンＭＣ１を発言者近傍マイクロホンと捉えた状態でマイクロホンＭＣ１〜ＭＣ４の出力音響信号（或いはマイクロホンＭＣ１の出力音響信号のみ）から生徒ＳＴ［１］に対応する発言者音響信号を生成する一方で、生徒ＳＴ［４］に対応するマイクロホンＭＣ２を発言者近傍マイクロホンと捉えた状態でマイクロホンＭＣ１〜ＭＣ４の出力音響信号（或いはマイクロホンＭＣ２の出力音響信号のみ）から生徒ＳＴ［４］に対応する発言者音響信号を生成する。生成された複数の発言者の発言者音響信号を、技術α３で述べた方法に従って記録することができる。

第６実施形態においても、上記の技術α４を実施することができる。この際、ハウリングを考慮して発言者音響信号の再生用スピーカを選択するようにしても良い。即ち、以下のように技術α４を実施すると良い。図２２に示されるスピーカＳＰ１〜ＳＰ４は、それぞれのマイクロホンＭＣ１〜ＭＣ４に近接して配置され、それぞれ分割エリア５４１〜５４４内に位置しているものとする（図２３（ａ）及び（ｂ）も参照）。ＰＣ２は、発言者の検出結果に基づき、スピーカＳＰ１〜ＳＰ４の中から発言者音響信号の再生用スピーカを選択し、選択された再生用スピーカのみから発言者音響信号を再生させる。再生用スピーカは、スピーカＳＰ１〜ＳＰ４の内の１、２又は３つのスピーカであり、発言者に最も近いスピーカは再生用スピーカから除外される。これにより、ハウリングの発生を抑制することができる。即ち例えば、発言者が生徒ＳＴ［１］である場合には、スピーカＭＣ１は再生用スピーカとして選択されず、スピーカＭＣ２、ＭＣ３及びＭＣ４の全部又は一部が再生用スピーカとして選択される。発言者と再生用スピーカとして選択されるべきスピーカとの対応関係をテーブルデータとしてＰＣ２に持たせておき、該テーブルデータを用いて再生用スピーカを選択するようにしても良い。例えば、生徒ＳＴ［１］に対応付けられた再生用スピーカがスピーカＭＣ２、ＭＣ３及びＭＣ４であること、及び、生徒ＳＴ［４］に対応付けられた再生用スピーカがスピーカＭＣ１、ＭＣ３及びＭＣ４であること等が該テーブルデータに記されている。

＜＜第７実施形態＞＞
本発明の第７実施形態を説明する。第７実施形態は、第６実施形態の一部を変形した実施形態であり、本実施形態において特に述べない事項に関しては、第６実施形態の記載が本実施形態に適用される。

第７実施形態では、生徒ＳＴ［１］〜ＳＴ［１６］の夫々に対して１つずつ生徒用マイクロホンが割り当てられている。生徒ＳＴ［ｉ］に割り当てられた生徒用マイクロホンをＭＴ［ｉ］にて表す（図２５参照）。生徒用マイクロホンＭＴ［１］〜ＭＴ［１６］は、夫々、生徒ＳＴ［１］〜ＳＴ［１６］の近傍に設置されて生徒ＳＴ［１］〜ＳＴ［１６］の声を収音する。生徒用マイクロホンＭＴ［ｉ］は、生徒ＳＴ［ｉ］の声を音響信号に変換し、得られた音響信号を音響信号処理部５５１（図２４参照）に出力することができる。第６実施形態で想定した教室環境ＥＥ_Bに生徒用マイクロホンＭＴ［１］〜ＭＴ［１６］を付加した教室環境を、教室環境ＥＥ_Cと呼ぶ。

図２４の発言者検出部５５２は、第６実施形態で述べた方法によって発言者を検出することもできるし、生徒用マイクロホンＭＴ［１］〜ＭＴ［１６］の出力音響信号に基づいて発言者を検出することもできる。
後者の検出は、例えば、以下のようにして実現できる。発言者検出部５５２は、生徒用マイクロホンＭＴ［１］〜ＭＴ［１６］の出力音響信号の内、出力音響信号の大きさが最大となっている生徒用マイクロホンが発言生徒マイクロホンであると判定する、或いは、出力音響信号の大きさが所定レベル以上となっている生徒用マイクロホンが発言生徒マイクロホンであると判定する。そして、発言生徒マイクロホンに対応する生徒を発言者として検出することができる。従って、生徒用マイクロホンＭＴ［ｉ］が発言生徒マイクロホンであると判定されたならば、生徒ＳＴ［ｉ］は発言者であると検出することができる。

図２４の生成部５５３は、第６実施形態で述べた方法によって発言者音響信号を生成することもできるし、生徒用マイクロホンＭＴ［１］〜ＭＴ［１６］の出力音響信号に基づいて発言者音響信号を生成することもできる。
後者の生成は、例えば、以下のようにして実現できる。上述の方法によって発言生徒マイクロホンが特定された後、生成部５５３は、発言生徒マイクロホンの出力音響信号そのものを発言者音響信号として生成することができる、或いは、発言生徒マイクロホンの出力音響信号に所定の信号処理を施すことで発言者音響信号を生成することができる。生成部５５３で生成された発言者音響信号は、当然に発言者からの音の成分を含む。

撮像部１１の出力に基づく画像データ（例えば発言者画像データ）及び生徒用マイクロホンＭＴ［１］〜ＭＴ［１６］の出力に基づく音響信号データ（例えば、発言者音響信号を表すデータ）等、任意のデータを、記録媒体３６に記録させることができ且つ教育システムを形成する任意の装置に対して送信することができ且つ任意の再生装置上で再生することできる。

＜＜第８実施形態＞＞
本発明の第８実施形態を説明する。第８実施形態に係る教育システム（プレゼンテーションシステム）の全体構成図は、第１実施形態のそれと同じである（図１参照）。第８実施形態における教室環境は、第５、第６又は第７実施形態における教室環境ＥＥ_A、ＥＥ_B又はＥＥ_Cと同じである。第８実施形態のデジタルカメラ１にカメラ駆動機構１７を設けておいても良い（図１８参照）。但し、ここでは、第１実施形態と同様、デジタルカメラ１の撮影範囲内に、常に生徒ＳＴ［１］〜ＳＴ［１６］が全て収まるようにデジタルカメラ１の設置場所及び撮影方向が固定されていることを想定する。

図２６は、第８実施形態に係る教育システムの一部のブロック図であり、教育システムは、個人画像生成部６０１及び表示制御部６０２を備える。図２６に示される各部位は、教育システムを形成する何れか任意の装置内に設けられ、それらの全部又は一部を、デジタルカメラ１又はＰＣ２に設けておくこともできる。例えば、個人画像生成部６０１をデジタルカメラ１内に設ける一方、表示制御部６０２をＰＣ２内に設けるようにしても良い。

個人画像生成部６０１には、撮像部１１よりフレーム画像の画像データが供給される。個人画像生成部６０１は、フレーム画像の画像データに基づく第１実施形態で述べた顔検出処理により、フレーム画像の全画像領域から生徒ＳＴ［１］〜ＳＴ［１６］の顔領域を個別に抽出し、生徒ＳＴ［１］〜ＳＴ［１６］の顔領域内の画像を個別に個人画像として生成する。生徒ＳＴ［ｉ］の顔領域内の画像である、生徒ＳＴ［ｉ］の個人画像をＩＳ［ｉ］にて表す。個人画像ＩＳ［１］〜ＩＳ［１６］の画像データは表示制御部６０２に送られる。尚、複数のデジタルカメラを用いて個人画像ＩＳ［１］〜ＩＳ［１６］を生成するようにしても構わない。

ＰＣ２の操作者である先生は、ＰＣ２に所定操作を成すことで発言者指定プログラムをＰＣ２上で起動させることができる。発言者指定プログラムが起動すると、表示制御部６０２は、個人画像ＩＳ［１］〜ＩＳ［１６］の中から１又は複数の個人画像を選択し、選択した個人画像をスクリーン４上で表示させる。選択される個人画像は、所定の周期（例えば、０．５秒）で変更され、この変更はＰＣ２上で発生させた乱数等に従って成される。従って、発言者指定プログラムを起動させると、スクリーン４上に表示される個人画像が個人画像ＩＳ［１］〜ＩＳ［１６］の中でランダムに切り替わりながら、個人画像ＩＳ［１］〜ＩＳ［１６］が複数回に分けてスクリーン４上に順次表示される。

発言者指定プログラムの動作中において、ＰＣ２の操作者である先生が特定操作をＰＣ２等に成すと、ＰＣ２内でトリガ信号が発生する。特定操作に関係なく、乱数等に従ってトリガ信号をＰＣ２内で自動生成するようにしても良い。発生したトリガ信号は表示制御部６０２に与えられる。表示制御部６０２は、トリガ信号を受けると、スクリーン４上に表示される個人画像の変更を停止し、その個人画像に対応する生徒が発言者となるべきことをスクリーン４上の映像等によって提示する。

即ち例えば、トリガ信号の発生時点において表示されていた個人画像が個人画像ＩＳ［２］であった場合、表示制御部６０２は、トリガ信号の発生後、スクリーン４上に表示される個人画像を個人画像ＩＳ［２］で固定すると共に、「発言を行ってください」等のメッセージをスクリーン４上に表示させることで、個人画像ＩＳ［２］に対応する生徒ＳＴ［２］が発言者となるべきことを各生徒に提示する。この提示を受けて、生徒ＳＴ［２］が実際に発言者となって発言を行うことになる。

発言者の特定後の動作は上述の何れかの実施形態で述べたものと同様であり、発言者画像データ及び発言者音響信号などの生成、記録、送信及び再生等が教育システム内で成される。即ち例えば、トリガ信号の発生後、生徒ＳＴ［２］が実際に発言者となって発言を行っている期間においては、上述の各実施形態と同様、発言者としての生徒ＳＴ［２］の個人画像ＩＳ［２］がスクリーン４上に表示される。発言者としての生徒ＳＴ［２］の個人画像ＩＳ［２］の画像データは、上述してきた発言者画像データに相当する。

発言者の映像を表示することで、生徒全員が発言者の顔を見ながら発言内容を聞くことができるようになるため、第１実施形態と同様の効果が得られる。また、映像表示された生徒が発言者になるというルールを教育現場に持ち込むことにより、授業の緊張感が高まり、生徒の学習効率の向上効果等も期待される。

尚、上述の方法ではなく、以下の方法によって発言者の指名を行うようにしても良い。生徒ＳＴ［１］〜ＳＴ［１６］に対応する１６個の机の位置と、撮像部１１の撮影範囲上の位置との対応関係情報を予め教育システムに与えておく。即ち、机ごとに（換言すれば生徒ごとに）生徒ＳＴ［ｉ］の机がフレーム画像上のどの部分に存在するのかを示す対応関係情報を、予め教育システムに与えておく。ＰＣ２の操作者である先生は、ＰＣ２に所定操作を成すことで第２発言者指定プログラムをＰＣ２上で起動させることができる。第２発言者指定プログラムが起動すると、教室５００内の１６個の机（換言すれば席）を模した映像がＰＣ２の表示画面上に表示され、先生は、所定操作によってＰＣ２の表示画面上における何れかの机を選択する。ＰＣ２は、選択された机に対応する生徒が発言者となるべきであると判断し、上記の対応関係情報を用いて、選択された机に対応する生徒の個人画像を個人画像生成部６０１から取得する。取得された個人画像は、発言者となるべき生徒の映像としてスクリーン４上に表示される。

例えば、第２発言者指定プログラムの起動後、生徒ＳＴ［２］に対応する机がＰＣ２上で選択された場合、選択された机に対応する生徒の個人画像が個人画像ＩＳ［２］であることが上記対応関係情報から分かる。このため、個人画像ＩＳ［２］が、発言者となるべき生徒の映像としてスクリーン４上に表示される。

＜＜第９実施形態＞＞
本発明の第９実施形態を説明する。第９実施形態では、特にサテライト教室に注目した、上述の各実施形態に対する変形技術又は補足的技術を説明する。図２７には、２つの教室Ｒ_A及びＲ_Bが示されている。教室Ｒ_Aには、デジタルカメラ１_A、ＰＣ２_A、プロジェクタ３_A及びスクリーン４_Aが設置されており、教室Ｒ_Bには、デジタルカメラ１_B、ＰＣ２_B、プロジェクタ３_B及びスクリーン４_Bが設置されている。デジタルカメラ１_A及び１_Bとしてデジタルカメラ１を用いることができ、ＰＣ２_A及び２_BとしてＰＣ２を用いることができ、プロジェクタ３_A及び３_Bとしてプロジェクタ３を用いることができ、スクリーン４_A及び４_Bとしてスクリーン４を用いることができる。

プロジェクタ３_Aからスクリーン４_Aに映像情報を供給することによりスクリーン４_A上で該映像情報に応じた映像が表示される。同様に、プロジェクタ３_Bからスクリーン４_Bに映像情報を供給することによりスクリーン４_B上で該映像情報に応じた映像が表示される。一方で、プロジェクタ３_Aからスクリーン４_Aに供給される映像情報と同じ映像情報を無線又は有線通信を介してプロジェクタ３_Bに伝達することで、スクリーン４_A上の映像と同じ映像をスクリーン４_B上に表示させることができる。逆に、プロジェクタ３_Bからスクリーン４_Bに供給される映像情報と同じ映像情報を無線又は有線通信を介してプロジェクタ３_Aに伝達することで、スクリーン４_B上の映像と同じ映像をスクリーン４_A上に表示させることができる。

また、図２７には示されていないが、上述の任意の実施形態で述べた任意のスピーカを教室Ｒ_A及びＲ_Bの夫々に設置することができ、上述の任意の実施形態で述べた任意のマイクロホンを教室Ｒ_A及びＲ_Bの夫々に設置することができる。教室Ｒ_A内のマイクロホンの出力音響信号に基づく任意の音響信号（例えば発言者音響信号）を教室Ｒ_A内の任意のスピーカにて再生することができる。同様に、教室Ｒ_B内のマイクロホンの出力音響信号に基づく任意の音響信号（例えば発言者音響信号）を教室Ｒ_B内の任意のスピーカにて再生することができる。一方で、教室Ｒ_A内のスピーカに供給される音響信号と同じ音響信号を無線又は有線通信を介して教室Ｒ_B内のスピーカに伝達することで、教室Ｒ_A内のスピーカにて再生される音響信号と同じ音響信号を教室Ｒ_B内のスピーカにて再生させることができる。逆に、教室Ｒ_B内のスピーカに供給される音響信号と同じ音響信号を無線又は有線通信を介して教室Ｒ_A内のスピーカに伝達することで、教室Ｒ_B内のスピーカにて再生される音響信号と同じ音響信号を教室Ｒ_A内のスピーカにて再生させることができる。

教室Ｒ_A及びＲ_Bの夫々には、１以上の生徒が存在している。教室Ｒ_A内の各生徒がデジタルカメラ１_Aの撮影範囲に収められ、教室Ｒ_A内の各生徒がデジタルカメラ１_Bの撮影範囲に収められる。

教室Ｒ_A及びＲ_Bの内、サテライト教室ではない方の教室を本教室と呼ぶ。サテライト教室以外の、上述の各実施形態で述べた教室は本教室に相当する。教室Ｒ_A及びＲ_Bの内、どちらも本教室になりうるし、どちらもサテライト教室となりうる。ここでは、教室Ｒ_Aが本教室であって、教室Ｒ_Bがサテライト教室であるとする。尚、サテライト教室は２以上存在しても良い。

第１実施形態において、サテライト教室に映像情報等を配信する技術を説明したが、これについて更に説明を加える。

例えば、図２８に示す如く、教室Ｒ_Aに４人の生徒８１１〜８１４が存在し、教室Ｒ_Bに４人の生徒８１５〜８１８が存在している状況を想定する。この場合、デジタルカメラ１_Aの撮像部１１及びデジタルカメラ１_Bの撮像部１１は、８人の生徒８１１〜８１８を撮影する複眼撮像部８５１を形成する、と考えることもできる（図２９参照）。

デジタルカメラ１_Aの発言者検出部２１（図５参照）は、デジタルカメラ１_Aの撮像部１１の出力に基づき生徒８１１〜８１４の中から発言者を検出することができるし、デジタルカメラ１_Bの発言者検出部２１は、デジタルカメラ１_Bの撮像部１１の出力に基づき、生徒８１５〜８１８の中から発言者を検出することができる。そうすると、デジタルカメラ１_Aの発言者検出部２１及びデジタルカメラ１_Bの発言者検出部２１は、複眼撮像部８５１の出力に基づき、画像上において生徒８１１〜８１８の中から発言者を検出する総合発言者検出部８５２を形成する、と考えることもできる（図２９参照）。

デジタルカメラ１_Aの抽出部２２（図５参照）は、デジタルカメラ１_Aの発言者検出部２１からの発言者情報とデジタルカメラ１_Aの撮像部１１からの画像データに基づき発言者画像データを生成することができるし、デジタルカメラ１_Bの抽出部２２は、デジタルカメラ１_Bの発言者検出部２１からの発言者情報とデジタルカメラ１_Bの撮像部１１からの画像データに基づき発言者画像データを生成することができる。そうすると、デジタルカメラ１_Aの抽出部２２及びデジタルカメラ１_Bの抽出部２２は、総合発言者検出部８５２の検出結果に基づき、複眼撮像部８５１の出力から発言者の画像部分の画像データを発言者画像データとして抽出する総合抽出部８５３を形成する、と考えることもできる（図２９参照）。

生徒８１１〜８１８の内、生徒８１１が発言者である場合には、複眼撮像部８５１の出力から総合発言者検出部８５２によって生徒８１１が発言者であることが検出され、総合抽出部８５３により複眼撮像部８５１の出力から生徒８１１の画像部分の画像データが発言者画像データとして抽出される。結果、発言者画像データに基づく映像（生徒８１１の顔の映像）が、生徒８１１〜８１４が視認可能なスクリーン４_A及び生徒８１５〜８１８が視認可能なスクリーン４_Bに表示される。スクリーン４_A及びスクリーン４_Bは、生徒８１１〜８１８が視認可能な表示画面８５４を形成する、と考えることもできる（図２９参照）。

教室Ｒ_A及びＲ_Bの夫々に４人の生徒が存在していることを想定したが、各教室に存在すべき生徒の一部が授業を欠席することもあり、結果例えば、教室Ｒ_A内に生徒が一人しかいない、教室Ｒ_B内に生徒が一人しかいない、或いは、教室Ｒ_A及びＲ_Bの夫々に生徒が１人ずつしかいないといった状況も発生しうるが、それらの状況においても上述と同様の動作が行われる。

第１実施形態に注目して、複数の教室に対する教育システムの適用方法を詳細に説明したが、第１実施形態以外の他の実施形態においても同様に考えることができる。考え方としては、教育システムにおける全生徒が１つの教室内に収容されているならば必要装置群を当該１つの教室に配置すれば足るが、教育システムにおける全生徒が複数の教室内にわかれて収容されているならば必要装置群を教室ごとに配置すればよいだけのことである。必要装置群には、デジタルカメラ１、ＰＣ２、プロジェクタ３及びスクリーン４が含まれ、必要に応じて、上述の任意の実施形態で述べた任意のスピーカ及びマイクロホンが含まれる。

例えば、第５〜第７実施形態において、教育システムにおけるＹ人の生徒がＺ個の教室内にわかれて収容される場合（Ｙ及びＺは２以上の整数）、Ｚ個の教室に配置されたデジタルカメラ１の撮像部１１（計Ｚ個の撮像部）はＹ人の生徒を撮影する複眼撮像部を形成すると考えることができ、Ｚ個の教室に配置されたマイクロホンは複眼撮像部の周辺音に応じた音響信号を出力する総合マイク部を形成すると考えることができ、教育システムには、総合マイク部の出力音響信号に基づいてＹ人の生徒の中から発言者を検出する総合発言者検出部が備えられていると考えることができる。

Ｙ人の生徒が第５実施形態等で述べた生徒ＳＴ［１］〜ＳＴ［１６］である場合において（図１９（ａ）等参照）、生徒ＳＴ［９］〜ＳＴ［１６］を教室５００内に収容できない場合、生徒ＳＴ［９］〜ＳＴ［１６］は教室５００と異なるサテライト教室に収容される。この際、サテライト教室に収容された生徒ＳＴ［９］〜ＳＴ［１６］は、教室５００のデジタルカメラ１の撮影範囲に収まらないため、生徒ＳＴ［１］〜ＳＴ［１６］を撮影する撮像部を、生徒ＳＴ［１］〜ＳＴ［８］を撮影するための撮像部と、生徒ＳＴ［９］〜ＳＴ［１６］を撮影するための撮像部に分ければよいだけのことである。マイクロホンやスピーカについても同様である。

このように、教育システムの構成要素（例えば、撮像部、表示画面、複数のマイクロホンから成るマイク部及び複数のスピーカから成るスピーカ部）の夫々は、複数の教室に分かれて配置されていても良い。

＜＜第１０実施形態＞＞
本発明の第１０実施形態を説明する。第１０実施形態では、上述の各実施形態におけるプロジェクタとして利用可能なプロジェクタの一例を説明する。本実施形態におけるスクリーンとは、上述の各実施形態におけるスクリーンに相当する。

図３０は、本実施形態に係るプロジェクタ３００１の外観構成を示す図である。本実施形態では、便宜上、プロジェクタ３００１から見てスクリーンのある方向を前方向と定義し、前方向の反対方向を後方向と定義し、スクリーン側からプロジェクタ３００１を見たときの右方向及び左方向を夫々右方向及び左方向と定義する。前後左右方向に垂直な方向は上方向及び下方向である。上方向及び下方向の内、プロジェクタ３００１からスクリーンに向かう方向により近い方向を上方向と定義する。下方向は、上方向の反対方向である。

本実施形態に係るプロジェクタ３００１は、いわゆる短焦点投写型のプロジェクタである。短焦点投写型のプロジェクタの設置に必要なスペースは小さいため、短焦点投写型のプロジェクタは教育現場等に好適である。プロジェクタ３００１は、略方形状の本体キャビネット３０１０を備える。本体キャビネット３０１０の上面には、後方に向けて下る第１傾斜面３１０１と、この第１傾斜面３１０１に続いて後方に向けて上る第２傾斜面３１０２が形成される。第２傾斜面３１０２は上斜め前方を向いており、この第２傾斜面３１０２に投写口３１０３が形成される。投写口３１０３から上斜め前方へ出射された映像光が、プロジェクタ３００１の前方に配されたスクリーンに拡大投写される。

図３１及び図３２は、プロジェクタ３００１の内部構成を示す図である。図３１は、プロジェクタ３００１の斜視図であり、図３２は、プロジェクタ３００１の平面図である。なお、図３１及び図３２では、便宜上、本体キャビネット３０１０を一点鎖線にて表す。

図３２に示すように、上方から見て、キャビネット３０１０内は、２つの二点鎖線Ｌ１及びＬ２によって４つの領域に区画され得る。以下、説明の便宜上、その４つの領域の内、右前に形成される領域を第１領域と定義し、第１領域から対角の位置にある領域を第２領域と定義し、左前に形成される領域を第３領域と定義し、第３領域から対角の位置にある領域を第４領域と定義する。

図３１及び図３２を参照して、本体キャビネット３０１０の内部には、光源装置３０２０と、導光光学系３０３０と、ＤＭＤ（DigitalMicro-mirror Device）３０４０と、投写光学ユニット３０５０と、制御回路３０６０と、ＬＥＤ駆動回路３０７０とが配置される。

光源装置３０２０は、３つの光源ユニット３０２０Ｒ、３０２０Ｇ及び３０２０Ｂを有する。赤色光源ユニット３０２０Ｒは、赤色波長帯の光（以下「Ｒ光」という）を出射する赤色光源３２０１Ｒと、赤色光源３２０１Ｒで発生した熱を放出するためのヒートシンク３２０２Ｒとにより構成される。緑色光源ユニット３０２０Ｇは、緑色波長帯の光（以下「Ｇ光」という）を出射する緑色光源３２０１Ｇと、緑色光源３２０１Ｇで発生した熱を放出するためのヒートシンク３２０２Ｇとにより構成される。青色光源ユニット３０２０Ｂは、青色波長帯の光（以下「Ｂ光」という）を出射する青色光源３２０１Ｂと、青色光源３２０１Ｂで発生した熱を放出するためのヒートシンク３２０２Ｂとにより構成される。

各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂは、高出力タイプのＬＥＤ光源であり、基板上に配されたＬＥＤ（赤色ＬＥＤ、緑色ＬＥＤ及び青色ＬＥＤ）によって構成される。赤色ＬＥＤは、たとえば、ＡｌＧａＩｎＰ（アルミニウムインジウムガリウムリン）から構成され、緑色ＬＥＤ及び青色ＬＥＤは、たとえば、ＧａＮ（窒化ガリウム）から構成される。

導光光学系３０３０は、各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂに対応して設けられた第１レンズ３３０１Ｒ、３３０１Ｇ及び３３０１Ｂ並びに第２レンズ３３０２Ｒ、３３０２Ｇ及び３３０２Ｂと、ダイクロイックプリズム３３０３と、中空のロッドインテグレータ（以下、中空ロッドと略記する）３３０４と、２つのミラー３３０５及び３３０７と、２つのリレーレンズ３３０６及び３３０８と、により構成される。

光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂから出射されたＲ光、Ｇ光及びＢ光は、第１レンズ３３０１Ｒ、３３０１Ｇ及び３３０１Ｂ並びに第２レンズ３３０２Ｒ、３３０２Ｇ及び３３０２Ｂによって平行光化され、ダイクロイックプリズム３３０４によって、それらの光路が合成される。

ダイクロイックプリズム３３０４から出射された光（Ｒ光、Ｂ光及びＧ光）は、中空ロッド３３０４に入射する。中空ロッド３３０４は、内部が中空であり、内側面がミラー面となっている。中空ロッド３３０４は、入射端面側から出射端面側に向かって断面積が大きくなるテーパ形状を有する。中空ロッド３３０４において、光は、ミラー面によって反射が繰り返され、出射端面における照度分布が均一化される。

なお、中空ロッド３３０４を用いることによって、中実のロッドインテグレータよりも屈折率が小さい（空気の屈折率＜ガラスの屈折率）ので、ロッド長を短くすることが可能になる。

中空ロッド３３０４から出射された光は、ミラー３３０５及び３３０７による反射とリレーレンズ３３０６及び３３０８によるレンズ作用によってＤＭＤ３０４０に照射される。

ＤＭＤ３０４０は、マトリクス状に配された複数のマイクロミラーを備える。１つのマイクロミラーは、１つの画素を構成する。マイクロミラーは、入射するＲ光、Ｇ光及びＢ光に対応するＤＭＤ駆動信号に基づいて、高速でオン・オフ駆動される。

マイクロミラーの傾斜角度が切り替えられることによって、各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂからの光（Ｒ光、Ｇ光及びＢ光）が変調される。具体的には、ある画素のマイクロミラーがオフ状態の場合には、このマイクロミラーによる反射光はレンズユニット５０１には入射しない。一方、マイクロミラーがオン状態の場合には、このマイクロミラーによる反射光はレンズユニット３５０１に入射する。マイクロミラーがオン状態にある時間の比率を調整することにより、画素ごとに画像の階調が調整される。

投写光学ユニット３０５０は、レンズユニット３５０１及び曲面ミラー３５０２と、これらを収容するハウジング３５０３とにより構成される。

ＤＭＤ３０４０によって変調された光（映像光）は、レンズユニット３５０１を通り、曲面ミラー３５０２へ出射される。映像光は、曲面ミラー３５０２によって反射され、ハウジング３５０３に形成された投写口３１０３から外部へ出射される。

図３３は、本実施形態に係るプロジェクタの構成を示すブロック図である。

図３３を参照して、制御回路３０６０は、信号入力回路３６０１と、信号処理回路３６０２と、ＤＭＤ駆動回路３６０３とを含む。

信号入力回路３６０１は、コンポジット信号、ＲＧＢ信号などの各種映像信号に対応する各種入力端子を介して入力された映像信号を信号処理回路３６０２へ出力する。

信号処理回路３６０２は、ＲＧＢ信号以外の映像信号をＲＧＢ信号に変換する処理や、入力した映像信号の解像度をＤＭＤ３０４０の解像度に変換するスケーリング処理、あるいは、ガンマ補正等の各種の補正処理を行う。そして、これら処理を施したＲＧＢ信号を、ＤＭＤ駆動回路３６０３及びＬＥＤ駆動回路３０７０へ出力する。

信号処理回路３６０２は、同期信号生成回路３６０２ａを含む。同期信号生成回路３６０２ａは、光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂの駆動と、ＤＭＤ３０４０の駆動とを同期させるための同期信号を生成する。生成された同期信号は、ＤＭＤ駆動回路３６０３及びＬＥＤ駆動回路３０７０へ出力される。

ＤＭＤ駆動回路３６０３は、信号処理回路３６０２からのＲＧＢ信号に基づいて、Ｒ光、Ｇ光及びＢ光に対応するＤＭＤ駆動信号（オン、オフ信号）を生成する。そして、生成した各光に対応するＤＭＤ駆動信号を、同期信号に従って、１フレームの画像ごとに時分割にて順次ＤＭＤ３０４０へ出力する。

ＬＥＤ駆動回路３０７０は、信号処理回路３６０２からのＲＧＢ信号に基づいて、光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂを駆動する。具体的には、ＬＥＤ駆動回路３０７０は、パルス幅変調方式（ＰＷＭ）によりＬＥＤ駆動信号を生成し、ＬＥＤ駆動信号（駆動電流）を各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂに出力する。

即ち、ＬＥＤ駆動回路３０７０は、ＲＧＢ信号に基づいて、パルス波のデューティ比を調整することにより、各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂから出力される光量を調整する。これにより、各光源３２０１Ｒ、３２０１Ｇ、３２０１Ｂから出力される光量が、画像の色情報に応じて、１フレームの画像ごとに調整される。

また、ＬＥＤ駆動回路３０７０は、同期信号に従って、各光源にＬＥＤ駆動信号を出力する。これにより、各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂから出射される光（Ｒ光、Ｇ光、Ｂ光）の発光タイミングと、それぞれの光に対応するＤＭＤ駆動信号がＤＭＤ３０４０へ出力されるタイミングとの同期を取ることができる。

即ち、Ｒ光に対応するＤＭＤ駆動信号が出力されている期間に、そのときの画像の色情報に適する光量のＲ光が、赤色光源３２０１Ｒから出射される。同様に、Ｇ光に対応するＤＭＤ駆動信号の出力されている期間に、そのときの画像の色情報に適する光量のＧ光が、緑色光源３２０１Ｇから出射される。さらに、Ｂ光に対応するＤＭＤ駆動信号の出力されている期間に、そのときの画像の色情報に適する光量のＢ光が、青色光源３２０１Ｂから出射される。

画像の色情報に応じて各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂから出射される光の光量を変えることにより、消費電力を抑えながら投写画像の高輝度化を図ることができる。

スクリーンには、Ｒ光、Ｇ光及びＢ光による画像が、順次、投写されることになる。しかしながら、これら画像の切り替わりが非常に高速で行われるため、ユーザの目にはちらつきのないカラー画像として映る。

図３１及び図３２を再び参照する。光源ユニット３２０Ｒ、３２０Ｇ及び３２０Ｂ、導光光学系３０３０、ＤＭＤ３０４０、投写光学ユニット３０５０、制御回路３０６０並びにＬＥＤ駆動回路３０７０は、本体キャビネット３０１０の底面を取付面として、取付面上に配置される。

投写光学ユニット３０５０は、本体キャビネット３０１０の中央よりも右側面寄りであって、前後方向におけるほぼ中央から後部（第４領域）にかけて配置される。ここで、レンズユニット３５０１はほぼ中央に位置し、曲面ミラー３５０２は後部に位置する。

ＤＭＤ３０４０は、レンズユニット３５０１の前方に配置される。即ち、ＤＭＤ３０４０は、本体キャビネット３０１０の中央よりも右側面寄りであって、前面の近く（第１領域）に配置される。

光源装置３０２０は、レンズユニット３５０１及びＤＭＤ３０４０の左側方（第３領域）に配置される。赤色光源３２０１Ｒと青色光源３２０１Ｂは、緑色光源３２０１Ｇの上方側に配置されると共に、緑色光源３２０１Ｇを挟んで互いに対向する位置に配置される。

ここで、投写光学ユニット３０５０において、曲面ミラー３５０２は、本体キャビネット３０１０の底面から低い位置（第４領域下部）に配置されており、レンズユニット３５０１は、曲面ミラーよりもやや高い位置（第４領域の中間高さ位置）に配置されている。また、ＤＭＤ３０４０は、本体キャビネット３０１０の底面から高い位置（第１領域上部）に配置されており、３つの光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂは、本体キャビネット３０１０の底面に対して低い位置（第３領域下部）に配置される。このため、３つの光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂの配置位置からＤＭＤ３０４０の前方位置に亘って導光光学系３０３０の各構成部品が配列されており、導光光学系３０３０は、プロジェクタの前方から見て、直角に２つ折りされた構成を有する。

即ち、第１レンズ３３０１Ｒ、３３０１Ｇ及び３３０１Ｂと、第２レンズ３３０２Ｒ、３３０２Ｇ及び３３０２Ｂと、ダイクロイックプリズム３３０３は、３つの光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂで囲まれた領域内に配置される。中空ロッド３３０４は、ダイクロイックプリズム３３０３の上方に、上下方向に沿って配置される。そして、中空ロッド３３０４の上方からレンズユニット３５０１側に向かって、順にミラー３３０５、リレーレンズ３３０６及びミラー３３０７が配置され、ミラー３３０７とＤＭＤ３０４０の間に、リレーレンズ３３０８が配置される。

このように、各光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂから中空ロッド３３０４により上方に導光された後、レンズユニット３５０２へ屈曲する光路が、導光光学系３０３０に形成される。これにより、導光光学系３０３０の左右方向の長さが短くできるので、本体キャビネット３０１０の底面の面積を小さくすることが可能となる。よって、プロジェクタのコンパクト化を図ることが可能となる。

制御回路３０６０は、本体キャビネット３０１０の右側面近傍であって、前後方向におけるほぼ中央から前端にかけて配置される。制御回路３０６０は、所定のパターン配線が形成された基板上に各種の電装部品を実装されており、基板面が本体キャビネット３０１０の右側面に沿うように配置される。

制御回路３０６０の前端部であって、本体キャビネット３０１０の右前角部の位置（第１領域最端部）には、ＤＭＤ駆動回路３６０３により生成されたＤＭＤ駆動信号が出力される出力端子部３６０４が設けられる。この出力端子部３６０４は、たとえば、コネクタで構成される。出力端子部３６０４には、ＤＭＤ３０４０から延びるケーブル３４０１が接続されており、ケーブル３４０１を介してＤＭＤ３０４０へＤＭＤ駆動信号が送られる。

ＬＥＤ駆動回路３０７０は、本体キャビネット１０の左後角部（第２領域）に配置される。ＬＥＤ駆動回路３０７０は、所定のパターン配線が形成された基板上に各種の電装部品を実装することにより構成される。

ＬＥＤ駆動回路３０７０の前方（前端部）には、３つの出力端子部３７０１Ｒ、３７０１Ｇ及び３７０１Ｂが設けられる。出力端子部３７０１Ｒ、３７０１Ｇ及び３７０１Ｂには、それぞれ、対応する光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂから延びるケーブル３２０３Ｒ、３２０３Ｇ及び３２０３Ｂが接続されており、これらケーブル３２０３Ｒ、３２０３Ｇ及び３２０３Ｂを介して光源３２０１Ｒ、３２０１Ｇ及び３２０１ＢへＬＥＤ駆動信号（駆動電流）が送られる。

ここで、３つの光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂのうち、赤色光源３２０１ＲがＬＥＤ駆動回路３０７０の最も近くに配置される。これにより、３つのケーブル３２０３Ｒ、３２０３Ｇ及び３２０３Ｂの中で、赤色光源３２０１Ｒに対するケーブル３２０３Ｒが最も短くなる。

なお、制御回路３０６０の出力端子部３６０４は、ＤＭＤ３０４０と同様、第１領域上部に配置される。一方、ＬＥＤ駆動回路３０７０は、光源３２０１Ｒ、３２０１Ｇ及び３２０１Ｂと同様、第２領域下部に配置される。

＜＜変形等＞＞
上述の実施形態の内、複数の実施形態を組み合わせることも可能である。上述した説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。上述の実施形態の変形例または注釈事項として、以下に、注釈１及び注釈２を記す。各注釈に記載した内容は、矛盾なき限り、任意に組み合わせることが可能である。

［注釈１］
各実施形態における教育システムを、ハードウェア、或いは、ハードウェアとソフトウェアの組み合わせによって構成することができる。ソフトウェアを用いて教育システムを構成する場合、ソフトウェアにて実現される部位についてのブロック図は、その部位の機能ブロック図を表すことになる。ソフトウェアを用いて実現される機能をプログラムとして記述し、該プログラムをプログラム実行装置（例えばコンピュータ）上で実行することによって、その機能を実現するようにしてもよい。

［注釈２］
各実施形態における教育システムでは、先生及び教室内の複数の生徒に参照される表示装置をプロジェクタ及びスクリーンによって構成しているが、該表示装置を任意の種類の表示装置（液晶ディスプレイパネルを用いた表示装置など）に変更することができる。

１デジタルカメラ
２ＰＣ
３プロジェクタ
４スクリーン
１０１_A〜１０１_C 生徒用の情報端末
１０２ＰＣ
１０３プロジェクタ
１０４スクリーン
２０１_A〜２０１_C 生徒用の情報端末
２０３プロジェクタ
２０４スクリーン
３０１_A〜３０１_C 生徒用の情報端末
３０２先生用の情報端末
３０３プロジェクタ
３０４スクリーン
３１発言者検出部
３２音声到来方向判定部
３３発言者画像データ生成部
３４発言者音響信号生成部
３５制御部
３６記録媒体
ＭＣ１〜ＭＣ４マイクロホン
５５１音響信号処理部
５５２発言者検出部
５５３発言者音響信号生成部
６０１個人画像生成部
６０２表示制御部

Claims

複数の人物を被写体に含めた撮影を行って撮影結果を表す信号を出力する撮像部と、
前記撮像部の出力に基づき、画像上において前記複数の人物の中から発言者を検出する発言者検出部と、
前記発言者検出部の検出結果に基づき、前記撮像部の出力から前記発言者の画像部分の画像データを発言者画像データとして抽出する抽出部と、を備え、
前記発言者画像データに基づく映像を、前記複数の人物が視認可能な表示画面上に表示する
ことを特徴とするプレゼンテーションシステム。
前記撮像部の周辺音に応じた音響信号を生成する音響信号生成部を更に備え、
前記音響信号生成部は、前記発言者検出部の検出結果に基づき、前記音響信号において前記発言者が位置する方向より到来する音の成分が強調されるように前記音響信号の指向性を制御する
ことを特徴とする請求項１に記載のプレゼンテーションシステム。
前記撮像部の周辺音に応じた音響信号を個別に出力する複数のマイクロホンから成るマイク部を更に備え、
前記音響信号生成部は、前記複数のマイクロホンの出力音響信号を用いて、前記発言者からの音の成分が強調された発言者音響信号を生成する
ことを特徴とする請求項２に記載のプレゼンテーションシステム。
前記発言者画像データ及び前記発言者音響信号に応じたデータを、互いに関連付けて記録する
ことを特徴とする請求項３に記載のプレゼンテーションシステム。
前記発言者画像データ、前記発言者音響信号に応じたデータ、及び、前記発言者の発言時間に応じたデータを、互いに関連付けて記録する
ことを特徴とする請求項３に記載のプレゼンテーションシステム。
所定の映像を前記表示画面上に表示しているときにおいて、前記抽出部より前記発言者画像データが抽出された際、前記表示画面において前記発明者画像データに基づく映像を前記所定の映像上に重畳して表示する
ことを特徴とする請求項１〜請求項５の何れかに記載のプレゼンテーションシステム。
複数の人物の夫々に対応して設けられ、対応する人物が発した音声に応じた音響信号を出力する複数のマイクロホンと、
各マイクロホンの出力音響信号に基づく音声認識処理により、各マイクロホンの出力音響信号を文字データに変換する音声認識部と、
前記複数の人物が視認可能な１又は複数の表示装置と、
前記文字データが予め設定された条件を満たすか否かに応じて前記表示装置の表示内容を制御する表示制御部と、を備えた
ことを特徴とするプレゼンテーションシステム。
被写体の撮影を行って撮影結果を表す信号を出力する撮像部と、
前記撮像部の周辺音に応じた音響信号を出力するマイク部と、
前記マイク部の出力音響信号に基づいて複数の人物の中から発言者を検出する発言者検出部と、を備え、
前記発言者を前記被写体に含めた状態における前記撮像部の出力を、前記複数の人物が視認可能な表示画面上に表示する
ことを特徴とするプレゼンテーションシステム。
前記マイク部は、前記撮像部の周辺音に応じた音響信号を個別に出力する複数のマイクロホンを有し、
前記発言者検出部は、前記複数のマイクロホンの出力音響信号に基づき、前記マイク部の設置位置との関係において前記発言者からの音の到来方向である音声到来方向を判定し、その判定結果を用いて前記発言者を検出する
ことを特徴とする請求項８に記載のプレゼンテーションシステム。
前記音声到来方向の判定結果に基づいて前記複数のマイクロホンの出力音響信号から前記発言者より到来する音響信号成分を抽出することにより、前記発言者からの音の成分が強調された発言者音響信号を生成する
ことを特徴とする請求項９に記載のプレゼンテーションシステム。
前記マイク部は、各々が前記複数の人物の何れかに対応付けられた複数のマイクロホンを有し、
前記発言者検出部は、各マイクロホンの出力音響信号の大きさに基づいて前記発言者を検出する
ことを特徴とする請求項８に記載のプレゼンテーションシステム。
前記複数のマイクロホンの内、前記発言者としての人物に対応付けられたマイクロホンの出力音響信号を用いて、前記発言者からの音の成分を含む発言者音響信号を生成する
ことを特徴とする請求項１１に記載のプレゼンテーションシステム。
前記発言者を前記被写体に含めた状態における前記撮像部の出力に基づく画像データ、及び、前記発言者音響信号に応じたデータを、互いに関連付けて記録する
ことを特徴とする請求項１０又は請求項１２に記載のプレゼンテーションシステム。
前記発言者を前記被写体に含めた状態における前記撮像部の出力に基づく画像データ、前記発言者音響信号に応じたデータ、及び、前記発言者の発言時間に応じたデータを、互いに関連付けて記録する
ことを特徴とする請求項１０又は請求項１２に記載のプレゼンテーションシステム。
前記複数の人物の中に音を発している人物が複数存在する場合、前記発言者検出部は、前記マイク部の出力音響信号に基づいて、音を発している複数の人物を複数の発言者として検出し、
当該プレゼンテーションシステムは、前記複数のマイクロホンの出力音響信号から、前記複数の発言者からの音響信号を個別に生成する
ことを特徴とする請求項９〜請求項１２の何れかに記載のプレゼンテーションシステム。
前記マイク部の出力音響信号に基づく音響信号が複数のスピーカの内の全部又は一部にて再生され、
当該プレゼンテーションシステムは、前記発言者音響信号を再生させる際、前記複数のスピーカの内、前記発言者に対応付けられたスピーカにて前記発言者音響信号を再生させる
ことを特徴とする請求項１２に記載のプレゼンテーションシステム。
複数の人物の撮影を行って撮影結果を表す信号を出力する撮像部と、
前記撮像部の出力に基づき前記人物ごとに前記人物の画像である個人画像を生成し、これによって前記複数の人物に対応する複数の個人画像を生成する個人画像生成部と、
前記複数の人物が視認可能な表示画面上に、前記複数の個人画像を複数回に分けて順次表示させる表示制御部と、を備え、
所定のトリガ信号を受けたときに前記表示画面に表示されている個人画像に対応する人物が発言者に成るべきことを提示する
ことを特徴とするプレゼンテーションシステム。