JP2011004080A - 情報処理装置、生成方法及びプログラム - Google Patents
情報処理装置、生成方法及びプログラム Download PDFInfo
- Publication number
- JP2011004080A JP2011004080A JP2009144552A JP2009144552A JP2011004080A JP 2011004080 A JP2011004080 A JP 2011004080A JP 2009144552 A JP2009144552 A JP 2009144552A JP 2009144552 A JP2009144552 A JP 2009144552A JP 2011004080 A JP2011004080 A JP 2011004080A
- Authority
- JP
- Japan
- Prior art keywords
- video
- speaker
- opinion information
- opinion
- acquisition means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】話者の意見・立場を表現した撮影映像を自動的に作成することを目的とする。
【解決手段】話者の映像を取得する映像取得手段と、話者の意見情報を取得する意見情報取得手段と、映像取得手段で取得された複数の映像から意見情報取得手段で取得された意見情報に対応する映像を選択する映像選択手段と、映像選択手段で選択された映像を組み合わせて会議映像を生成する生成手段と、を有することによって課題を解決する。
【選択図】図7
【解決手段】話者の映像を取得する映像取得手段と、話者の意見情報を取得する意見情報取得手段と、映像取得手段で取得された複数の映像から意見情報取得手段で取得された意見情報に対応する映像を選択する映像選択手段と、映像選択手段で選択された映像を組み合わせて会議映像を生成する生成手段と、を有することによって課題を解決する。
【選択図】図7
Description
本発明は、情報処理装置、生成方法及びプログラムに関する。
TVで放映される映像には、その内容を視聴者が把握しやすくするための映像・音響的工夫が施されている。例えば、複数の話者が会話する場面の映像では、各話者の画面に対する向きを固定し、違うカットであっても同一の話者は同一の向きを向いているようにする。また、その向きは話者の立場の区別がつくように決められる。話者Aと話者Bとが対立関係にある場合、話者Aは右向き、話者Bは左向き、というように異なる向きの映像とする。話者Cが話者Aと同調関係にある場合は、話者Cの向きは話者Aと同様の向きにして、同調関係を映像で表現する。このような工夫は、事前に判明している各話者の立場・意見をもとに、話者の立ち位置、カメラの撮影方向を人手で決定することで実現している。
撮影映像に適用できる技術ではないが、PCでのチャット用のユーザインターフェイスで、話者に対応するアイコンを意見に合わせて区別するという技術が存在する(特許文献1参照。)。
撮影映像に適用できる技術ではないが、PCでのチャット用のユーザインターフェイスで、話者に対応するアイコンを意見に合わせて区別するという技術が存在する(特許文献1参照。)。
しかしながら従来、話者の意見・立場を表現した撮影映像の作成には、映像の作成にある程度の知識・技術がある者の作業が必要である。
そのような人物が存在しない状況で作成する映像には、映像・音響的工夫を取り入れることができなかった。
そのような人物が存在しない状況で作成する映像には、映像・音響的工夫を取り入れることができなかった。
本発明はこのような問題点に鑑みなされたもので、話者の意見・立場を表現した撮影映像を自動的に作成することを目的とする。
そこで、本発明の情報処理装置は、撮像装置より話者の映像を取得する映像取得手段と、意見表明装置より話者の意見情報を取得する意見情報取得手段と、前記意見情報取得手段で取得された意見情報に基づいて、前記映像取得手段で取得された複数の映像から会議映像に用いる映像を選択する映像選択手段と、前記映像選択手段で選択された映像を組み合わせて会議映像を生成する生成手段と、を有する。
本発明によれば、話者の意見・立場を表現した撮影映像を自動的に作成することができる。
以下、本発明の実施形態について図面に基づいて説明する。
<実施形態1>
本実施形態は、会議の映像を作成して情報提示する会議映像システムに関するものである。
図1は、会議映像システムのシステム構成の一例を示す図である。101は、会議での複数人物(各話者)の映像を撮影するためのカメラである。カメラ101は、複数台存在する。なお、カメラ101は、撮像装置の一例である。102は、各話者が自身の意見・立場を表明するための意見表明装置である。意見表明装置102は、複数台存在する。103は、会議映像を作成する会議映像作成装置である。会議映像作成装置103は、情報処理装置(コンピュータ)の一例である。カメラ101と会議映像作成装置103とは有線接続されており、カメラ101で撮影された映像は、会議映像作成装置103に送られる。また、意見表明装置102と会議映像作成装置103とは有線接続されており、意見表明装置102からの意見情報は、会議映像作成装置103に送られる。
本実施形態は、会議の映像を作成して情報提示する会議映像システムに関するものである。
図1は、会議映像システムのシステム構成の一例を示す図である。101は、会議での複数人物(各話者)の映像を撮影するためのカメラである。カメラ101は、複数台存在する。なお、カメラ101は、撮像装置の一例である。102は、各話者が自身の意見・立場を表明するための意見表明装置である。意見表明装置102は、複数台存在する。103は、会議映像を作成する会議映像作成装置である。会議映像作成装置103は、情報処理装置(コンピュータ)の一例である。カメラ101と会議映像作成装置103とは有線接続されており、カメラ101で撮影された映像は、会議映像作成装置103に送られる。また、意見表明装置102と会議映像作成装置103とは有線接続されており、意見表明装置102からの意見情報は、会議映像作成装置103に送られる。
図2は、会議映像システムを設置した会議室の一例を示す図である。各座席には意見表明装置102が設置されている。また、カメラ101は何れの座席(話者)も正面及び左右から撮影できる位置に設置されている。会議映像作成装置103には配置上の制約はない。
図3は、会議映像作成装置のハードウェア構成の一例を示す図である。301は、会議映像作成装置103全体を制御するCentral Processing Unit(CPU)である。302は、変更を必要としないプログラムやパラメータを格納するRead Only Memory(ROM)である。303は、外部装置等から供給されるプログラムやデータを一時記憶するRandom Access Memory(RAM)である。304は、会議映像作成装置103に固定して設置されたハードディスクやメモリカード、或いはフレキシブルディスクや光ディスク、磁気や光カード、ICカード、メモリカード等を含む外部記憶装置である。305は、会議映像作成装置103へ送られた情報を受け取るための入力デバイスインターフェイスである。306は、会議映像作成装置103から他の機器へ情報を送り出すための出力デバイスインターフェイスである。307は、301〜306の各ユニットを通信可能に接続するシステムバスである。
CPU301が、ROM302又は外部記憶装置304に格納されている会議映像作成プログラムを実行することによって会議映像作成装置103の機能及び後述するフローチャートに係る処理が実現される。
カメラ101からの映像及び意見表明装置102からの意見情報は、入力デバイスインターフェイス305を通じて会議映像作成装置103に取り込まれる。会議映像作成装置103で作成された会議映像は、外部記憶装置304に保持されるか、出力デバイスインターフェイス306を通して他の機器に送信される。他の機器とは、例えば映像を表示する機器である。外部記憶装置304に保持した場合は会議映像を議事録として保持する行為となる。映像表示機器へ送信した場合はライブ映像配信となる。
図3は、会議映像作成装置のハードウェア構成の一例を示す図である。301は、会議映像作成装置103全体を制御するCentral Processing Unit(CPU)である。302は、変更を必要としないプログラムやパラメータを格納するRead Only Memory(ROM)である。303は、外部装置等から供給されるプログラムやデータを一時記憶するRandom Access Memory(RAM)である。304は、会議映像作成装置103に固定して設置されたハードディスクやメモリカード、或いはフレキシブルディスクや光ディスク、磁気や光カード、ICカード、メモリカード等を含む外部記憶装置である。305は、会議映像作成装置103へ送られた情報を受け取るための入力デバイスインターフェイスである。306は、会議映像作成装置103から他の機器へ情報を送り出すための出力デバイスインターフェイスである。307は、301〜306の各ユニットを通信可能に接続するシステムバスである。
CPU301が、ROM302又は外部記憶装置304に格納されている会議映像作成プログラムを実行することによって会議映像作成装置103の機能及び後述するフローチャートに係る処理が実現される。
カメラ101からの映像及び意見表明装置102からの意見情報は、入力デバイスインターフェイス305を通じて会議映像作成装置103に取り込まれる。会議映像作成装置103で作成された会議映像は、外部記憶装置304に保持されるか、出力デバイスインターフェイス306を通して他の機器に送信される。他の機器とは、例えば映像を表示する機器である。外部記憶装置304に保持した場合は会議映像を議事録として保持する行為となる。映像表示機器へ送信した場合はライブ映像配信となる。
図4は、意見表明装置の外観の一例を説明するための図である。賛成、反対、中立という3つのボタン401があり、話者は発言の際何れかのボタンを押して、発言が議題に対して賛成意見なのか、反対意見なのか、中立なのかを示す。ボタンに対応するボード402が立つので、他の話者への意思表示にもなる。また、意見表明装置102には、話者が発言に用いるマイク403がついている。何れのボタンが押下されているのかという情報は、意見表明装置102から意見情報として会議映像作成装置103に送信される。また、マイク403からの音声情報も意見表明装置102から会議映像作成装置103に送信される。意見表明装置102は、タッチパネルによる仮想ボタンインターフェイスであってもよい。その場合は、先の3つのボタンだけではなく、議題にあわせて詳細に意見を分類する仮想ボタンを表示することができるようになる。
図5は、会議映像システムが会議映像を作成する処理を説明するための図である。素材情報取得工程501とは、カメラ101で話者の映像を取得し、会議映像作成装置103に送信する工程を指す。意見情報取得工程502とは、意見表明装置102で話者の意見情報を取得し、会議映像作成装置103に送信する工程を指す。素材情報選択工程503とは、素材情報取得工程501で得られた複数のカメラ映像のうち、会議映像に用いる映像を選択する工程である。会議映像作成装置103は、選択する際の判断には、意見情報取得工程502で得られた意見情報を用いる。映像情報生成工程504とは、素材情報選択工程503で選択した素材情報を組み合わせることによって、会議映像を生成する工程である。
図6は、ある時刻にカメラから会議映像作成装置に送られた映像を並べた一例を示す図である。カメラ101は、パン・チルト・ズーム機構を利用して、その時点で発言している話者が中心になる映像を撮影する。発言している話者はマイク403からの音声情報によって判別される。カメラ101と意見表明装置102とは会議室に固定されており、それらの位置情報は会議映像作成装置103に保持されている。マイク403からの音声情報を受け取った会議映像作成装置103は、そのマイク403の位置情報と各カメラ101の位置情報とからパン・チルト・ズーム量を計算して各カメラ101に送信し、撮影させる。カメラ101は、会議室の四方に配置されているので、4方向からの話者の映像が得られる。内1方向は話者後方からの映像となるので、実質利用できるのは右向き、左向き、正面向きの3方向の映像である。
図7は、素材情報選択工程での処理の流れ図である。最初に、会議映像作成装置103は、カメラ101からの4映像を取得(映像取得)する(701)。次に、会議映像作成装置103は、意見表明装置102から意見情報を取得(意見情報取得)する(702)。次に、会議映像作成装置103は、701で得た映像中での話者の顔の向きを判別する(703)。会議映像作成装置103は、判別に、話者中心の映像を撮影した際の位置情報を再度利用する。会議映像作成装置103は、カメラ101の位置情報と意見表明装置102の位置情報とを外部記憶装置304等に保持しており、更に各意見表明装置102に対応する座席の向き情報も外部記憶装置304等に保持している。会議映像作成装置103は、これらの情報から、各カメラで話者の顔の向きが右向きなのか、左向きなのか、正面向きなのかを判別する。なお、会議映像作成装置103は、位置情報を用いずに、顔画像判別技術を用いて判別してもよい。
次に、会議映像作成装置103は、702で得た意見情報に対応する顔の向きの映像を選択(映像選択)する(704)。意見情報と顔の向きとの対応情報は予め会議映像作成装置103が外部記憶装置304等に保持している。例えば、賛成意見は右向き、反対意見は左向き、中立意見は正面向きという情報である。賛成意見であった場合には、会議映像作成装置103は、703で判別した話者が右向きの映像を会議映像の素材として選択する。本工程は会議の間中、繰り返し実行され、素材映像を選択し続ける。
次に、会議映像作成装置103は、702で得た意見情報に対応する顔の向きの映像を選択(映像選択)する(704)。意見情報と顔の向きとの対応情報は予め会議映像作成装置103が外部記憶装置304等に保持している。例えば、賛成意見は右向き、反対意見は左向き、中立意見は正面向きという情報である。賛成意見であった場合には、会議映像作成装置103は、703で判別した話者が右向きの映像を会議映像の素材として選択する。本工程は会議の間中、繰り返し実行され、素材映像を選択し続ける。
図8は、映像情報生成工程での処理の流れ図である。最初に、会議映像作成装置103は、素材情報選択工程で選択された素材を取得する(801)。次に、会議映像作成装置103は、会議映像末尾に選択された素材を追加する。以上の処理を会議の間中繰り返すことで、会議映像は作成される。つまり会議映像は、カメラ101からの映像のうち、意見情報に対応する顔の向きの映像を選択して時系列順につなぎ合わせた映像となる。
図9は、会議映像の一例を示す図である。映像中の3場面を抜き出してみると、話者X、話者Yは賛成意見だったので右向き、話者Zは反対意見だったので左向きの映像となっている。このように作成された会議映像は、話者の意見が反映された画面構成となっているため、視聴する者は内容把握がしやすい。
なお、本実施例ではカメラを4台、意見の種類を3種類としたが、本提案の適用はこの数に限定されるものではない。カメラ、意見の種類を増やすことはできる。ただし、あまり多くすると意見に対応する顔の向きの種類が増えてしまうため、区別がつきにくくなることに注意が必要である。
なお、本実施例ではカメラを4台、意見の種類を3種類としたが、本提案の適用はこの数に限定されるものではない。カメラ、意見の種類を増やすことはできる。ただし、あまり多くすると意見に対応する顔の向きの種類が増えてしまうため、区別がつきにくくなることに注意が必要である。
<実施形態2>
本実施形態は、実施形態1と同じく会議の映像を作成する会議映像システムに関するものである。実施形態1では話者が意見表明装置102を用いて自身の意見を分類していた。本実施形態では、話者は自身の意見を分類しない。会議映像作成装置103を操作する会議映像編集者(編集者)が話者の意見を分類する。
本実施形態における会議映像システムのシステム構成は図1に等しい。ただし、本実施形態における意見表明装置102には、意見を表明するためのボタンは存在せず、マイクのみが存在する。したがって、意見表明装置102から意見情報が会議映像作成装置103に送信されることはない。
本実施形態における会議映像システムを設置した会議室の一例は図2に等しい。
本実施形態における会議映像作成装置のハードウェア構成は図3に等しい。ただし、会議映像編集者が編集操作を行うために、入力デバイスインターフェイス305にはマウスやキーボードが接続される。また、出力デバイスインターフェイスには、ディスプレイが接続される。
本実施形態における意見表明装置102の外観は図4とは異なり、先に述べたようにマイク403のみが存在する。
本実施形態における会議映像システムが会議映像を作成する処理は図5に等しい。ただし、各工程を行うタイミング及び装置が異なる。素材情報取得工程は実施形態1と同じくカメラ101が会議中に行う。素材情報取得工程501からの映像情報は、全て会議映像作成装置103内の外部記憶装置304に保持される。意見情報取得工程502及び素材情報選択工程503及び映像情報生成工程504は、会議終了後、会議映像編集者が会議映像を作成する旨の操作を契機として、会議映像作成装置103が行う。
本実施形態においてカメラ101から会議映像作成装置103に送られる映像は、実施形態1と同じく図6のようになる。
本実施形態は、実施形態1と同じく会議の映像を作成する会議映像システムに関するものである。実施形態1では話者が意見表明装置102を用いて自身の意見を分類していた。本実施形態では、話者は自身の意見を分類しない。会議映像作成装置103を操作する会議映像編集者(編集者)が話者の意見を分類する。
本実施形態における会議映像システムのシステム構成は図1に等しい。ただし、本実施形態における意見表明装置102には、意見を表明するためのボタンは存在せず、マイクのみが存在する。したがって、意見表明装置102から意見情報が会議映像作成装置103に送信されることはない。
本実施形態における会議映像システムを設置した会議室の一例は図2に等しい。
本実施形態における会議映像作成装置のハードウェア構成は図3に等しい。ただし、会議映像編集者が編集操作を行うために、入力デバイスインターフェイス305にはマウスやキーボードが接続される。また、出力デバイスインターフェイスには、ディスプレイが接続される。
本実施形態における意見表明装置102の外観は図4とは異なり、先に述べたようにマイク403のみが存在する。
本実施形態における会議映像システムが会議映像を作成する処理は図5に等しい。ただし、各工程を行うタイミング及び装置が異なる。素材情報取得工程は実施形態1と同じくカメラ101が会議中に行う。素材情報取得工程501からの映像情報は、全て会議映像作成装置103内の外部記憶装置304に保持される。意見情報取得工程502及び素材情報選択工程503及び映像情報生成工程504は、会議終了後、会議映像編集者が会議映像を作成する旨の操作を契機として、会議映像作成装置103が行う。
本実施形態においてカメラ101から会議映像作成装置103に送られる映像は、実施形態1と同じく図6のようになる。
図10は、会議映像作成装置で会議映像編集者が会議映像を作成する旨の操作をした際に表示される編集画面の一例を示す図である。1001は、各話者が発言していた時間を表示するための意見タイムチャートである。話者が発言していた時間が意見バーで示されている。意見バー上の文字は、意見の分類結果を示している。会議映像編集者は、意見の分類に、意見分類ボタン1002を用いる。意見タイムチャート1001のある時刻は編集ポイントとなっており、編集ポイント上に意見バーがあるとき、意見分類ボタン1002が押下されると、意見バーの意見が押下したボタンの意見の種類に分類される。1003は、編集ポイント上の意見バーの意見をテキストとして表示している。テキスト化には音声認識技術が用いられる。1004は、編集ポイントでの各カメラ101からの映像である。1005は、編集によって出来上がる会議映像のプレビュー画面である。図10の場合、会議映像編集者が意見分類ボタン1002の反対ボタンを押下することによって、反対意見に対応する左向きの顔映像であるカメラCの映像が選択され、字幕に意見のテキストを加えた画面が編集結果として表示されている。
本実施形態における素材情報選択工程503での処理の流れはおおむね図7と等しいが、細部が異なる。カメラ101からの映像所得工程701は、外部記憶装置304に予め蓄えられた映像の取得となる。意見情報の取得工程702は、意見分類ボタン1002の押下情報の取得となる。また、素材情報選択工程は、会議映像編集操作によって実行される。
本実施形態における映像情報生成工程504の処理の流れはおおむね図8と等しいが、細部が異なる。本工程は、素材情報選択工程503の処理結果を受けて、会議映像編集操作によって実行される。
本実施形態における素材情報選択工程503での処理の流れはおおむね図7と等しいが、細部が異なる。カメラ101からの映像所得工程701は、外部記憶装置304に予め蓄えられた映像の取得となる。意見情報の取得工程702は、意見分類ボタン1002の押下情報の取得となる。また、素材情報選択工程は、会議映像編集操作によって実行される。
本実施形態における映像情報生成工程504の処理の流れはおおむね図8と等しいが、細部が異なる。本工程は、素材情報選択工程503の処理結果を受けて、会議映像編集操作によって実行される。
<実施形態3>
本実施形態は、実施形態1と同じく会議の映像を作成する会議映像システムに関するものである。実施形態1では、話者が意見表明装置102を用いて自身の意見を分類していた。本実施形態では、話者は自身の意見を分類しない。本実施形態では、会議映像作成装置103が、予め話者に設定されている属性情報を基に分類する。属性情報とは、例えば話者が議題に対して事前に示している賛否の意見情報や、話者の属するグループの情報等である。会議映像作成装置103は、これらの情報を基に話者を分類し、会議映像として用いる素材情報を選択する。各話者の属性情報は会議映像作成装置103に予め蓄えられている。カメラ映像での話者と、属性情報の話者とのマッチングには、予め話者の座る座席がわかっている場合、会議映像作成装置103が、カメラでの撮影対象位置情報を用いてマッチングする。話者の座る座席がわかっていない場合、会議映像作成装置103は、顔画像認識技術を用いて話者を特定して、分類する。
上記以外の部分は、実施形態1に等しい。
本実施形態は、実施形態1と同じく会議の映像を作成する会議映像システムに関するものである。実施形態1では、話者が意見表明装置102を用いて自身の意見を分類していた。本実施形態では、話者は自身の意見を分類しない。本実施形態では、会議映像作成装置103が、予め話者に設定されている属性情報を基に分類する。属性情報とは、例えば話者が議題に対して事前に示している賛否の意見情報や、話者の属するグループの情報等である。会議映像作成装置103は、これらの情報を基に話者を分類し、会議映像として用いる素材情報を選択する。各話者の属性情報は会議映像作成装置103に予め蓄えられている。カメラ映像での話者と、属性情報の話者とのマッチングには、予め話者の座る座席がわかっている場合、会議映像作成装置103が、カメラでの撮影対象位置情報を用いてマッチングする。話者の座る座席がわかっていない場合、会議映像作成装置103は、顔画像認識技術を用いて話者を特定して、分類する。
上記以外の部分は、実施形態1に等しい。
<実施形態4>
本実施形態は、実施形態2と同じく会議の映像を作成する会議映像システムに関するものである。実施形態2では、会議映像編集者が意見分類ボタン1002によって話者の意見を分類していた。本実施形態では、会議映像作成装置103が意見の内容を自動判別することによって分類する。会議映像作成装置103は、自動判別には、話者の音声データから音声認識(音声認識技術)によって得られた発言内容のテキストデータを用いる。話者が資料をもとに発言しており、その資料がカメラ映像中に捉えられている場合には、会議映像作成装置103が、画像解析技術、文字認識技術によってその資料を読み取り、意見の分類に用いる。なお、話者が資料をもとに発言しているか否かは、例えば、操作者が判断し、操作画面等を介して、話者が資料をもとに発言している旨を話者ごとに会議映像作成装置103に設定する。なお、会議映像作成装置103が、話者及び資料が含まれる映像(画像)を解析し、話者の目線等の情報に基づき、話者が資料をもとに発言しているか否か判断するようにしてもよい。
上記以外の部分は、実施形態2に等しい。
本実施形態は、実施形態2と同じく会議の映像を作成する会議映像システムに関するものである。実施形態2では、会議映像編集者が意見分類ボタン1002によって話者の意見を分類していた。本実施形態では、会議映像作成装置103が意見の内容を自動判別することによって分類する。会議映像作成装置103は、自動判別には、話者の音声データから音声認識(音声認識技術)によって得られた発言内容のテキストデータを用いる。話者が資料をもとに発言しており、その資料がカメラ映像中に捉えられている場合には、会議映像作成装置103が、画像解析技術、文字認識技術によってその資料を読み取り、意見の分類に用いる。なお、話者が資料をもとに発言しているか否かは、例えば、操作者が判断し、操作画面等を介して、話者が資料をもとに発言している旨を話者ごとに会議映像作成装置103に設定する。なお、会議映像作成装置103が、話者及び資料が含まれる映像(画像)を解析し、話者の目線等の情報に基づき、話者が資料をもとに発言しているか否か判断するようにしてもよい。
上記以外の部分は、実施形態2に等しい。
<実施形態5>
本実施形態は、実施形態1と同じく会議の映像を作成する会議映像システムに関するものである。実施形態1では、カメラ101は複数台が会議室に固定で設置されていた。本実施形態では、カメラ101は自走能力を持ち、撮影したいポイントに移動できる。実施形態1では、意見の分類結果に対応する素材映像を選択していたが、本実施形態では、意見の分類結果に応じた映像を、会議映像作成装置103がカメラ101に指示することで取得する。
つまり、本実施形態の会議映像作成装置103は、取得した意見情報に対応する映像を撮像する様、ネットワークを介して通信可能なカメラ101(又は複数のカメラ101)を制御し、カメラ101より意見情報に対応する映像を取得する。
上記以外の部分は、実施形態1に等しい。
本実施形態は、実施形態1と同じく会議の映像を作成する会議映像システムに関するものである。実施形態1では、カメラ101は複数台が会議室に固定で設置されていた。本実施形態では、カメラ101は自走能力を持ち、撮影したいポイントに移動できる。実施形態1では、意見の分類結果に対応する素材映像を選択していたが、本実施形態では、意見の分類結果に応じた映像を、会議映像作成装置103がカメラ101に指示することで取得する。
つまり、本実施形態の会議映像作成装置103は、取得した意見情報に対応する映像を撮像する様、ネットワークを介して通信可能なカメラ101(又は複数のカメラ101)を制御し、カメラ101より意見情報に対応する映像を取得する。
上記以外の部分は、実施形態1に等しい。
<実施形態6>
本実施形態は、クイズのTV番組映像を作成するクイズ映像システムに関するものである。実施形態1で各話者の意見情報となっていたものが、本実施形態では、問題に対する各回答者の回答になる。実施形態1では、話者の映像をつなぎ合わせることで会議映像を作成していたが、本実施形態では各回答者の映像を合成してひとつの画面に収める。図11がその画面例(生成されたクイズ映像)である。各回答者の顔の向き及び画面上での配置は、回答に対応した位置となる。また、回答者が発言した場合の音声は、画面中での配置と同じく音場上でも区別して配置される。例えば、問いに対して1番の回答を行った人は、画面左側に配置され、その声は左スピーカーから再生される。
上記以外の部分は、実施形態1に等しい。
本実施形態は、クイズのTV番組映像を作成するクイズ映像システムに関するものである。実施形態1で各話者の意見情報となっていたものが、本実施形態では、問題に対する各回答者の回答になる。実施形態1では、話者の映像をつなぎ合わせることで会議映像を作成していたが、本実施形態では各回答者の映像を合成してひとつの画面に収める。図11がその画面例(生成されたクイズ映像)である。各回答者の顔の向き及び画面上での配置は、回答に対応した位置となる。また、回答者が発言した場合の音声は、画面中での配置と同じく音場上でも区別して配置される。例えば、問いに対して1番の回答を行った人は、画面左側に配置され、その声は左スピーカーから再生される。
上記以外の部分は、実施形態1に等しい。
<その他の実施形態>
上述した機能又はフローチャートに係る工程は、ネットワーク又は各種記憶媒体を介して記憶装置等に記憶したソフトウェア(プログラム)をパソコン(コンピュータ)等の処理装置(CPU、プロセッサ)にて実行することでも実現できる。
上述した機能又はフローチャートに係る工程は、ネットワーク又は各種記憶媒体を介して記憶装置等に記憶したソフトウェア(プログラム)をパソコン(コンピュータ)等の処理装置(CPU、プロセッサ)にて実行することでも実現できる。
以上、上述した実施形態によれば、話者の意見・立場を表現した撮影映像を自動的に作成することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
101 カメラ、102 意見表明装置、103 会議映像作成装置
Claims (12)
- 話者の映像を取得する映像取得手段と、
話者の意見情報を取得する意見情報取得手段と、
前記映像取得手段で取得された複数の映像から前記意見情報取得手段で取得された意見情報に対応する映像を選択する映像選択手段と、
前記映像選択手段で選択された映像を組み合わせて会議映像を生成する生成手段と、
を有する、情報処理装置。 - 前記映像取得手段は、ネットワークを介して通信可能な複数の撮像装置より話者の映像を取得し、
前記意見情報取得手段は、ネットワークを介して通信可能な複数の意見表明装置より話者の意見情報を取得する、請求項1記載の情報処理装置。 - 前記映像取得手段は、ネットワークを介して通信可能な複数の撮像装置より送信され、記憶装置に記憶されている話者の映像を取得し、
前記意見情報取得手段は、編集画面を介した編集者の操作に基づき話者の意見情報を取得する、請求項1記載の情報処理装置。 - 前記映像取得手段は、ネットワークを介して通信可能な複数の撮像装置より話者の映像を取得し、
前記意見情報取得手段は、予め設定されている話者の属性情報に基づき話者の意見情報を取得する、請求項1記載の情報処理装置。 - 前記映像取得手段は、ネットワークを介して通信可能な複数の撮像装置より送信され、記憶装置に記憶されている話者の映像を取得し、
前記意見情報取得手段は、話者の発言内容に係る音声データから音声認識技術を用いて意見情報を取得する、請求項1記載の情報処理装置。 - 前記映像取得手段は、ネットワークを介して通信可能な複数の撮像装置より送信され、記憶装置に記憶されている話者の映像を取得し、
前記意見情報取得手段は、話者が資料をもとに発言している場合、話者の映像に含まれる資料から画像解析技術又は文字認識技術を用いて意見情報を取得する、請求項1記載の情報処理装置。 - 前記映像選択手段は、前記映像取得手段で取得された複数の映像における映像に含まれる話者の顔の向きを判別し、意見情報と顔の向きとの対応情報に基づき、前記意見情報取得手段で取得された意見情報に対応する顔の向きの映像を選択する、請求項1乃至6何れか1項記載の情報処理装置。
- ネットワークを介して通信可能な複数の意見表明装置より話者の意見情報を取得する意見情報取得手段と、
前記意見情報取得手段で取得された意見情報に対応する映像を撮像する様、ネットワークを介して通信可能な撮像装置を制御し、前記撮像装置より前記意見情報取得手段で取得された意見情報に対応する映像を取得する映像取得手段と、
前記映像取得手段で取得された映像を組み合わせて会議映像を生成する生成手段と、
を有する、情報処理装置。 - 情報処理装置が実行する会議映像の生成方法であって、
話者の映像を取得する映像取得ステップと、
話者の意見情報を取得する意見情報取得ステップと、
前記映像取得ステップで取得された複数の映像から前記意見情報取得ステップで取得された意見情報に対応する映像を選択する映像選択ステップと、
前記映像選択ステップで選択された映像を組み合わせて会議映像を生成する生成ステップと、
を含む、生成方法。 - 情報処理装置が実行する会議映像の生成方法であって、
ネットワークを介して通信可能な複数の意見表明装置より話者の意見情報を取得する意見情報取得ステップと、
前記意見情報取得ステップで取得された意見情報に対応する映像を撮像する様、ネットワークを介して通信可能な撮像装置を制御し、前記撮像装置より前記意見情報取得ステップで取得された意見情報に対応する映像を取得する映像取得ステップと、
前記映像取得ステップで取得された映像を組み合わせて会議映像を生成する生成ステップと、
を含む、生成方法。 - コンピュータを、
話者の映像を取得する映像取得手段と、
話者の意見情報を取得する意見情報取得手段と、
前記映像取得手段で取得された複数の映像から前記意見情報取得手段で取得された意見情報に対応する映像を選択する映像選択手段と、
前記映像選択手段で選択された映像を組み合わせて会議映像を生成する生成手段と、
して機能させる、プログラム。 - コンピュータを、
ネットワークを介して通信可能な複数の意見表明装置より話者の意見情報を取得する意見情報取得手段と、
前記意見情報取得手段で取得された意見情報に対応する映像を撮像する様、ネットワークを介して通信可能な撮像装置を制御し、前記撮像装置より前記意見情報取得手段で取得された意見情報に対応する映像を取得する映像取得手段と、
前記映像取得手段で取得された映像を組み合わせて会議映像を生成する生成手段と、
して機能させる、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009144552A JP2011004080A (ja) | 2009-06-17 | 2009-06-17 | 情報処理装置、生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009144552A JP2011004080A (ja) | 2009-06-17 | 2009-06-17 | 情報処理装置、生成方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011004080A true JP2011004080A (ja) | 2011-01-06 |
Family
ID=43561688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009144552A Pending JP2011004080A (ja) | 2009-06-17 | 2009-06-17 | 情報処理装置、生成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011004080A (ja) |
-
2009
- 2009-06-17 JP JP2009144552A patent/JP2011004080A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7225631B2 (ja) | 画像処理装置、カメラ装置、および画像処理方法 | |
JP7347597B2 (ja) | 動画編集装置、動画編集方法及びプログラム | |
CN113064684B (zh) | 一种虚拟现实设备及vr场景截屏方法 | |
JP7427408B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN110958537A (zh) | 一种智能音箱及智能音箱使用的方法 | |
CN112653902A (zh) | 说话人识别方法、装置及电子设备 | |
JP4638183B2 (ja) | 複数のカメラ出力の編集装置及びその編集方法 | |
CN117321984A (zh) | 基于内容类型或参与者角色的视频会议电话中的空间音频 | |
CN114531564A (zh) | 处理方法及电子设备 | |
KR20210022579A (ko) | 정보 처리 장치 및 정보 처리 방법, 그리고 정보 처리 시스템 | |
JP2017219573A (ja) | 情報処理装置、情報処理方法、並びにプログラム | |
JP2009239348A (ja) | 撮影装置 | |
KR20090044105A (ko) | 삼차원 가상 공간 콘텐츠를 이용한 영상제공시스템 | |
JP2016063477A (ja) | 会議システム、情報処理方法、及びプログラム | |
JP5272820B2 (ja) | テレビ会議装置、テレビ会議システム、テレビ会議方法、及びテレビ会議プログラム | |
CN111093028A (zh) | 一种信息处理方法和电子设备 | |
JP2007251355A (ja) | 対話システム用中継装置、対話システム、対話方法 | |
JP2011004080A (ja) | 情報処理装置、生成方法及びプログラム | |
JP2004248125A (ja) | 映像切り替え装置、映像切り替え方法、この方法のプログラムおよびこのプログラムを記録した記録媒体 | |
JP2009239349A (ja) | 撮影装置 | |
WO2021245759A1 (ja) | 音声会議装置、音声会議システム及び音声会議方法 | |
CN113676693A (zh) | 画面呈现方法、视频会议系统及可读存储介质 | |
JP2022054192A (ja) | リモート会議システム、サーバ、写真撮影装置、音声出力方法、及びプログラム | |
JP2007072054A (ja) | 語学学習システム | |
JP2020071519A (ja) | 案内装置及びガイドシステム |