JP2011164695A - 情報処理装置、入力装置、情報処理方法及び会議システム - Google Patents

情報処理装置、入力装置、情報処理方法及び会議システム Download PDF

Info

Publication number
JP2011164695A
JP2011164695A JP2010023350A JP2010023350A JP2011164695A JP 2011164695 A JP2011164695 A JP 2011164695A JP 2010023350 A JP2010023350 A JP 2010023350A JP 2010023350 A JP2010023350 A JP 2010023350A JP 2011164695 A JP2011164695 A JP 2011164695A
Authority
JP
Japan
Prior art keywords
image
sound
information processing
conference
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010023350A
Other languages
English (en)
Inventor
Daisuke Igarashi
大輔 五十嵐
Masaaki Toyoda
将哲 豊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010023350A priority Critical patent/JP2011164695A/ja
Publication of JP2011164695A publication Critical patent/JP2011164695A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Position Input By Displaying (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】会議システムにて文化モデルデータを用いることなく、また、画像に基づく動作解析のみに限らずに簡易な構成で画像データ及び音声データの送受信を制御し、他の会議参加者への不快感、違和感を抑制することができる情報処理装置、該情報処理装置で用いられる入力装置、情報処理方法、及び前記情報処理装置を含む会議システムを提供する。
【解決手段】入力手段である端末用ペンから受信した状態に基づき、不適切な操作状態を検出した場合(S4:YES)、操作者を撮像した画像データ及び操作者が発した音声を集音した音声のデータの送信を停止する(S10)など、操作状態に応じて送受信を制御する。
【選択図】図11

Description

本発明は、複数の情報処理装置間でカメラによって撮像された画像又はマイクロフォンにて集音された音声を送信しあい、遠隔にあっても会議参加者間での会議を実現できる会議システムに関する。特に、情報処理装置夫々にて会議参加者の操作状態を検出し、操作状態に応じて画像又は音声の送受信を制御し、他の会議参加者への不快感、違和感を抑制することができる情報処理装置、該情報処理装置で用いられる入力装置、情報処理方法、及び前記情報処理装置を含む会議システムに関する。
通信技術、画像処理技術等の発展に伴い、遠隔の二拠点又は三拠点以上の複数拠点に夫々設置された複数の情報処理装置間でネットワークを介して会議ができるテレビ会議システムが実現されている。大容量データの送受信が可能であることから、端末装置にて集音される音声のデータを他の端末装置へ送信して複数の端末装置にて発言者の発言を共有するのみならず、各端末装置にて会議参加者を撮影し、撮影した映像データを他の端末装置へ送信することによって、表情、身振りなどを交えた会議が実現できる会議システム(所謂Web会議システム)が実用化されている。
従来の会議システムでは、各情報処理装置が電話番号又はIP(Internet Protocol)アドレスを指定して他の情報処理装置と直接的に接続を確立し、2つの情報処理装置が1対1で音声データ及び画像データを交換することで実現されてきた。3つ以上の情報処理装置間での会議システムを実現する場合には、1台の情報処理装置を親機とし、他の複数の情報処理装置を子機として、複数の子機が夫々親機との接続を確立し、親機が子機間のデータ交換を中継する。
より多くの拠点間での会議システムを実現するためには、複数の情報処理装置をMCU(Multipoint Control Unit:多地点接続装置)へ、スター型に接続し、情報処理装置間のデータ交換をMCUが中継する構成がある。MCUを用いた会議システムでは、会議システムに参加することが可能な情報処理装置(拠点)の数は、MCUの性能、即ち接続できる情報処理装置の数(例えば通信ポートの数)に依存する。
また、多くの拠点間での会議システムを実現するためには、LAN(Local Area Network)又はインターネット等の通信網を介し、会議参加者が使用する情報処理装置がクライアント装置としてサーバ装置と接続する構成にて、サーバ装置にてデータ交換を中継する構成もある。このようなサーバ・クライアントシステムの構成では、サーバ装置の処理能力及びネットワークの通信速度(使用可能帯域幅)の制限があるものの、MCUを用いた構成と比較して、会議システムに参加する拠点数(情報処理装置の数)を容易に増減させることができるなどの利点がある。
このように、MCUを利用する構成でも、サーバ・クライアントシステムの構成でも、各情報処理装置を会議参加者が一人一人(又は少数人で)利用して会議を実現することができる。このとき、各情報処理装置には、共有画面を表示する液晶パネル、有機ELパネルなどを利用したディスプレイ、装置を使用する会議参加者を撮影するカメラ、装置を使用する会議参加者の発言を集音するマイクロフォン及び音声を出力するスピーカ等が備えられる。そして情報処理装置は、撮影した映像(画像)のデータ及び集音した音声のデータをMCU又はサーバ装置を介して送受信する。これにより、会議参加者同士の発言、表情、身振りなどを共有して会議を行なうことができる。
特許文献1には、音声及び画像を交換する会議システムを利用し、異なる文化圏の会議参加者間で会議を実施する場合に、各会議参加者の身振りを、三次元アバター等を用いた動画像にて表現する構成とし、ある文化圏における会議参加者の身振りが、他の文化圏でも社会的に適切と捉えられるように一部変更する発明が開示されている。
特開2009−77380号公報
遠隔地にいながら、複数拠点間で相手の画像を確認しつつ会議を実現できる会議システム及びその周辺技術により、文化及び言語が異なる人々の間でのコミュニケーション向上に大きな役割を果たしている。逆に、会議参加者の画像を送受信する会議システムでは、会議参加者の動作がリアルタイムで他の会議参加者へ伝わる。これにより、他の媒体を介したコミュニケーションでは存在しなかった様々な問題及び懸念が発生する場合がある。
例えば、複数の拠点間で会議参加者の映像を送受信する会議システムでは、会議参加者の映像信号をリアルタイムに他の拠点へ送信する。この場合、会議参加者の非言語的な動作、表情が重要となる。特に、会議参加者が多様な文化及び言語を背景にする場合には問題となるときがある。その場に適切な動作、言語であるか否かの適切性は当然、文化が異なれば大きく異なる。ある文化では適切とされ、許容される動作であっても、別の文化では不適切とされ、許容されない動作と受け取られる場合が多く、誤解を招く原因となる。
国際的なやり取りが行なわれるビジネスの場では、会議システムを利用する場合ときの会議参加者の動作の適切性が重要となる。動作によっては、言語のみのコミュニケーションよりも信頼を築くことが可能である。適切なタイミングでの適度な凝視(gaze)、適切な身振り及び表情によって信頼を表すことができ、取引の成否を左右する。逆に、不適切なタイミングでの不適切な身振りは、無意識で行なっていたとしても大きく信頼を損ねる場合がある。
会議参加者は、異文化における適切な動作を予備知識として学ぶことは可能であるが、パターン化されない動作でも適切性を維持することは非常に困難である。また、会議参加者が、参加する可能性がある全ての会議の他の会議参加者の文化における習慣及び伝統の違いを全て予備知識として持つことは非現実的である。
更に、会議参加者が無意識に行なってしまう癖であって他の会議参加者を不快にさせる可能性のある動作を事前に矯正することも非現実的である。
特許文献1に開示されている技術を用いることにより、会議システムにて他の会議参加者に、文化的又は社会的に不適切な動作と受け取られる身振りが一の会議参加者が行なった場合であっても、アバターを利用して他の身振りに代替されるか、又は会議参加者の画像以外の画像、例えば会議資料などの共有画面へ切り替えられる。これにより、他の会議参加者を不快にさせることを回避することができる。
しかしながら、特許文献1に開示されている技術では、不適切な動作か否かを判断するために、会議参加者を撮影した画像データを取得し、文化モデルデータに従って動作解析を行なう必要がある。特許文献1には、動作解析にはモーションセンサ若しくは加速度センサから得られるデータ、又は音声からの情報を利用することも可能とされているが、実際の解析対象、それらの情報を利用した解析についての例は記載されていない。また、特許文献1に開示されている技術では、文化モデルデータに従った動作解析が行なわれるが、多様な文化に対応させるためには各文化の膨大な量の文化モデルデータを予めデータベース化しておく必要があり、解析処理の負荷もその分膨大となり、現実的でない。
本発明は斯かる事情に鑑みてなされたものであり、会議システムにて文化モデルデータを用いることなく、また、画像に基づく動作解析のみに限らずに簡易な構成で画像データ及び音声データの送受信を制御し、他の会議参加者への不快感、違和感を抑制することができる情報処理装置、該情報処理装置で用いられる入力装置、情報処理方法、及び前記情報処理装置を含む会議システムを提供することを目的とする。
本発明に係る情報処理装置は、文字情報又は図形情報を入力するための一又は複数の入力手段と、画像又は音声を取得する手段と、取得した画像又は音声を送出する手段とを備える情報処理装置において、前記入力手段に対する不適切な操作状態を、前記入力手段にて発生する変化に基づき検出する検出手段と、該検出手段の検出結果に応じて前記送出手段による画像若しくは音声の送出の可否、又は送出レートの増減を制御する制御手段とを備えることを特徴とする。
本発明に係る情報処理装置は、前記入力手段は、ペン型の入力装置を含み、前記検出手段は、前記ペン型の入力装置を用いて入力動作がされている状態、入力動作間の待機状態及び使用されていない状態の別を検出する第1手段と、前記ペン型の入力装置を振動、回転若しくは衝突させる動作の内の一又は複数がされている状態、及び、前記動作の反復がされている状態を検出する第2手段とを有し、第1手段又は第2手段が検出した各状態に基づき不適切な操作状態を検出するようにしてあることを特徴とする。
本発明に係る情報処理装置は、前記ペン型の入力装置を振動、回転若しくは衝突させる動作、又は該動作の反復がされている状態を、不適切な操作状態として検出するようにしてあることを特徴とする。
本発明に係る情報処理装置は、前記入力手段は、入力される文字情報又は図形情報を表示する画面を出力するタッチパネル型の表示部を含み、前記検出手段は、前記画面以外への接触/離反が繰り返される反復動作を検出する手段を有し、前記反復動作がされている状態を不適切な操作状態として検出するようにしてあることを特徴とする。
本発明に係る情報処理装置は、前記検出手段は、前記入力手段に対する操作時に与えられる衝撃又は接触点における圧力を検出する手段と、該手段が検出した衝撃又は圧力の値を、予め記憶してある閾値と比較する手段とを備え、比較結果に基づいて不適切な操作状態を検出するようにしてあることを特徴とする。
本発明に係る情報処理装置は、前記検出手段が不適切な操作状態を検出した場合、前記制御手段は、画像又は音声の送出を禁止するようにしてあることを特徴とする。
本発明に係る情報処理装置は、前記画像は操作者を撮像した撮像画像であり、前記音声は操作者により発せられる音声を集音した集音音声であり、前記検出手段が不適切な操作状態を検出した場合、撮像方向又は集音方向の変更を指示する信号を出力する手段を備えることを特徴とする。
本発明に係る入力装置は、文字情報又は図形情報を入力するためのペン型の入力装置において、加速度検出手段、傾斜角検出手段及び衝撃検出手段の内の一又は複数を有し、各手段による検出結果に基づき、不適切な操作状態を検出する手段と、検出結果を出力する手段とを備えることを特徴とする。
本発明に係る情報処理方法は、文字情報又は図形情報を入力するための一又は複数の入力手段と、画像又は音声を取得する手段と、取得した画像又は音声を送出する送出手段とを備える情報処理装置を制御する方法において、前記入力手段に対する不適切な操作状態を、前記入力手段にて発生する変化に基づき検出し、検出結果に応じて前記送出手段による画像若しくは音声の送出の可否、又は送出レートの増減を制御することを特徴とする。
本発明に係る会議システムは、操作者を撮像する撮像装置又は操作者が発する音声を集音する集音装置と、文字情報又は図形情報を入力するための一又は複数の入力手段、前記撮像装置からの画像又は前記集音装置からの音声を取得する手段、取得した画像又は音声を送受信する送受信手段を備える第1情報処理装置を複数と、複数の第1情報処理装置に接続し、各第1情報処理装置で送受信される画像又は音声を中継する第2情報処理装置とを含み、複数の第1情報処理装置間で共通の画像又は音声を表示又は出力させるようにして情報を共有させ、会議を実現させる会議システムにおいて、複数の第1情報処理装置は夫々、前記入力手段に対する不適切な操作状態を、前記入力手段にて発生する変化に基づき検出する検出手段と、該検出手段の検出結果に応じて前記送受信手段による画像若しくは音声の送信の可否、又は送信レートの増減を制御する送信制御手段とを備えることを特徴とする。
本発明では、文字情報又は図形情報を入力するための入力手段にて発生する振動、回転、又は衝撃などの物理的な変化に基づき、ユーザによる入力手段への不適切な操作状態が検出され、検出結果に応じて、取得された画像又音声の送出の可否、又は送出レートの増減が制御される。
本発明では、入力手段の内の一はペン型の入力装置であり、ペン型の入力装置を用いて文字情報又は図形情報などを用いて入力動作中の状態であるか、入力装置は把持されているものの入力動作間の待機中の状態であるか、又は入力装置は把持されておらず使用されていない状態であるかの別が検出され、更に、ペン型の入力装置に対する回転、振動若しくは落下させる動作が行なわれている状態か、又はそれらの反復動作が行なわれている状態かが検出される。これらの状態に基づき、ユーザによる入力手段への不適切な操作を検出することが可能となる。
本発明では、ペン型の入力装置を振り回す行為、入力装置を落とす行為若しくは所謂ペン回しが行なわれている状態、又はペン型の入力装置で物を突き続けるなどの反復動作が行なわれている状態を不適切な操作状態として検出し、これらの場合は、取得した画像又は音声の送出を制限させる制御が可能である。
本発明では、タッチパネル型の表示部を含む場合に、本来文字情報又は図形情報の入力を受け付ける画面ではない場所への接触/離反を繰り返す反復動作が行なわれている場合、これを検出し、不適切な操作状態として画像又は音声の送出を制限させる制御が可能である。
本発明では、操作時に与えられる衝撃、又は操作時の入力手段の接触点における圧力などの操作時の力加減に対応する値と予め記憶されてある閾値との比較結果に基づき、入力手段に対して不要に大きな力が加わった操作がされているなどの場合に、会議に関係のない動作が行なわれているとして扱い、画像又は音声の送出を回避すべく制御される。状態の継続期間等をも加味して会議に関係のない動作が行なわれていると判断して送信を制御してもよい。
本発明では、検出結果に応じて、画像又は音声の送信が停止される。例えば、操作状態が、不適切とされるペンで物体を突く動作がされている状態、ペン回し、又は画面を突く動作が行なわれている状態である場合、送出が禁止される。これにより、他の会議参加者を不快と感じさせる画像又は音声の他の装置への送出の開始、又は送出の停止が可能となる。
本発明では、画像は操作者を撮像した画像であり、音声は操作者から発せられる音声であり、検出結果に応じて、撮像方向又は集音方向の変更を指示する信号が出力される。例えば、検出操作状態が、不適切とされるペンで物体を突く動作が行なわれている状態、ペン回し又は画面を突く動作が行なわれている状態である場合、ユーザ(会議参加者)を撮像しないように、又はユーザの音声を集音しないように制御することによって、他の会議参加者を不快と感じさせる画像又は音声の他の装置への送出を回避できる。
本発明による場合、情報処理装置を操作する会議参加者の操作状態が、マウス、キーボード、スタイラスペン、タッチパネル、又はタブレットなどの入力手段で発生する状態に基づき検出され、操作状態に応じて、会議システムを実現するための会議参加者を撮像した撮像画像又は会議参加者の発声を集音した集音音声の送出が制御される。
これにより、操作状態が例えばスタイラスの不要な回転、又はタブレットへの不要な衝撃などの不適切な操作状態にある場合に、画像若しくは音声、又は両方の送信を停止するか他のものを映した画像に切り替えるなどの制御が行なわれ、他の会議参加者へ与える可能性がある不快感、違和感を抑制し、快適な会議システムを実現できる。
また、他の会議参加者へ不快感、違和感を与える可能性がある撮像画像又は集音音声の送信を停止するなどの制御によって、画像又は音声による通信負荷の増大及び会議システムにて画像又は音声の送受信を中継するサーバ装置(第2情報処理装置)の処理負荷を抑制することが可能である。
実施の形態1の会議システムの構成を示す構成図である。 実施の形態1の会議システムを構成する会議サーバ装置の内部構成を示すうロック図である。 実施の形態1の会議システムを構成する端末装置の内部構成を示すブロック図である。 実施の形態1の会議システムを構成する端末装置にて用いられる端末用ペンの内部構成を示すブロック図である。 実施の形態1の会議システムにて実現される画像及び音声の送受信を模式的に示す模式図である。 実施の形態1における端末装置及び端末用ペンによる検出対象の操作状態の例を模式的に示す模式図である。 実施の形態1における端末装置及び端末用ペンによる検出対象の操作状態の例を模式的に示す模式図である。 実施の形態1における端末装置及び端末用ペンによる検出対象の操作状態の例を模式的に示す模式図である。 実施の形態1における端末装置及び端末用ペンによる検出対象の操作状態の例を模式的に示す模式図である。 実施の形態1における端末装置及び端末用ペンによる検出対象の操作状態の例を模式的に示す模式図である。 実施の形態1の端末装置の画像及び音声のデータ送信時における処理手順の一例を示すフローチャートである。 実施の形態1の端末装置の画像及び音声のデータの受信時における処理手順の一例を示すフローチャートである。 実施の形態2の会議システムを構成する端末装置の内部構成を示すブロック図である。 実施の形態2の端末装置の画像及び音声のデータ送信時における処理手順の一例を示すフローチャートである。
以下本発明をその実施の形態を示す図面に基づき具体的に説明する。
なお、以下の実施の形態では、本発明に係る情報処理装置を端末装置に用い、複数の端末装置を用いて音声、映像及び画像の共有を実現する会議システムについて説明する。
(実施の形態1)
図1は、実施の形態1の会議システムの構成を示す構成図である。会議システムは、会議参加者が夫々用いる端末装置1,1,…と、端末装置1,1,…が接続されるネットワーク2と、端末装置1,1,…間での画像(映像)及び音声の送受信及び共有を実現する会議サーバ装置3とを含んで構成される。
端末装置1,1,…及び会議サーバ装置3が接続されるネットワーク2は、会議が行なわれる組織の組織内LANでもよいし、インターネットなどの公衆通信網でもよい。端末装置1,1,…が会議サーバ装置3との接続の認証を受け、認証された端末装置1,1,…が会議サーバ装置3から共有の画像(映像)及び音声の情報を送受信し、受信した画像(映像)及び音声を出力することにより、他の端末装置1,…と画像(映像)及び音声を共有し、ネットワークを介した会議を実現する。
なお、会議サーバ装置3は、複数の異なる会議1及び会議2を並列的に実現させることができる。会議サーバ装置3は、端末装置1,1,…を夫々グループ会議1及び会議2に対応付けて認識し、各グループ内で端末装置1,1,…間の画像(映像)及び音声の中継を夫々で独立に行なうことが可能である。
図2は、実施の形態1の会議システムを構成する会議サーバ装置3の内部構成を示すうロック図である。
会議サーバ装置3は、サーバコンピュータを用い、制御部30と、一時記憶部31と、記憶部32と、符号化・復号処理部34と、画像処理部35と、音声処理部36と、通信処理部37と、ネットワークI/F部38とを備える。
制御部30にはCPU(Central Processing Unit)又はMPU(Micro Processing Unit)等の演算処理装置を用い、記憶部32に記憶されている会議サーバ用プログラム3Pを一時記憶部31に読み出して実行することにより、サーバコンピュータを、本実施の形態1における会議サーバ装置3として動作させる。
一時記憶部31にはSRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)などのRAMを用いて、上述のように読み出される会議サーバ用プログラム3Pが一時的に読み出されると共に、制御部30の処理によって発生する情報が一時的に記憶される。
記憶部32には、ハードディスク又はSSD(Solid State Drive)等の外部記憶装置を用いる。記憶部32には、上述の会議サーバ用プログラム3Pが記憶されている。また記憶部32には、会議参加者が用いる端末装置1,1,…の認証を行なうための認証データが記憶されている。更に、会議サーバ装置3の記憶部32には、複数のドキュメントデータが共有ドキュメントデータ33として記憶されている。ドキュメントデータは、テキストデータ、写真データ、図データなどであり、フォーマットは問わない。
符号化・復号処理部34は、エンコーダ・デコーダチップを用い、H.261、H.263、H.264又はMPEG(Moving Picture Experts Group)等の規格に基づく画像(映像)の符号化を行なう画像符号化部、及び符号化された画像を復号する符号処理部を含む。また符号化・復号処理部34は、G.711、G.722、G.728、G.729又はMPEGAudioなどの規格に基づく音声の符号化を行なう音声符号化部、及び符号化された音声を復号する音声復号処理部を含む。
画像処理部35は、制御部30からの指示により、複数の端末装置1,1,…から夫々送信された複数の画像データに基づき画像を合成する処理を実現する。画像処理部35は他に、記憶部32に記憶してある共有ドキュメントデータ33の内、各端末装置1,1,…にて表示対象となるドキュメントデータを受け付け、該ドキュメントデータを画像に変換して出力する機能を有する。また、画像処理部35は、画像の拡大縮小、エッジ強調又は色調整などの各種画像処理を行なうことが可能である。
音声処理部36は、制御部30からの指示により、複数の端末装置1,1,…から夫々送信された複数の音声データに基づき音声を合成する処理を実現する。音声処理部36は他に、ノイズ除去又は音量調整等の各種音声処理を行なうことが可能である。
通信処理部37は、会議サーバ装置3のネットワーク2を介した通信を実現させる。通信処理部37は、ネットワーク2に接続されたネットワークカードを用いたネットワークI/F部38と接続されており、ネットワーク2を介して端末装置1,1,…との間の画像又は音声を送受信するときのパケット化、パケットからの情報の読み取りを行なう。制御部30は、通信処理部37により画像(映像)及び音声の送受信を行なうことができる。実施の形態1の会議システムを実現するために、通信処理部37による画像、音声を送受信するための通信プロトコルは、H.323、SIP(Session Initiation Protocol)、又はHTTP(Hypertext Transfer Protocol )などのプロトコルを用いればよい。通信プロトコルはこれらに限られない。なお、ネットワークI/F部38はアンテナを含み、通信処理37は無線通信を行なうように構成されてもよい。
端末装置1には、タブレット内蔵ディスプレイを搭載した会議システム専用端末を用いる。端末装置1は、扁平な略直方体形状の筐体13を有し、正面131とする1つの広面に設けられた矩形の開口部にディスプレイ114(タブレット113)が露出している(図6参照)。また、正面131には、カメラ115及びスピーカ117が露出するように設けられている。なお端末装置1の広面の面積は例えばA4サイズ程度であり、端末装置1はユーザが把持して使用することが可能な程度に軽量に構成されている。
図3は、実施の形態1の会議システムを構成する端末装置1の内部構成を示すブロック図である。
端末装置1は、制御部100と、一時記憶部101と、記憶部102と、入力処理部103と、表示処理部104と、映像処理部105と、入力音声処理部106と、出力音声処理部107と、通信処理部108と、無線通信処理部109と、読取部110と、符号化・復号処理部120とを備える。端末装置1は更に、内蔵又は外部接続により、タブレット113と、ディスプレイ114と、カメラ115と、マイクロフォン(図中及び以下、マイクという)116と、スピーカ117と、ネットワークI/F部118と、無線通信部119とを備える。
制御部100は、CPU又はMPU等の演算処理装置を用い、記憶部102に記憶されている会議端末用プログラム1Pを一時記憶部101に読み出して実行することにより、会議システム専用端末を本発明に係る情報処理装置として動作させる。
一時記憶部101にはSRAM又はDRAMなどのRAMを用いる。一時記憶部101には、上述のように読み出される会議端末用プログラム1Pが記憶されると共に、制御部100の処理によって発生する情報が記憶される。
記憶部102には、EEPROM(Electrically Erasable Programmable ROM)又はフラッシュメモリ等の不揮発性メモリを用いる。記憶部102には、会議端末用プログラム1P及び制御部100が制御時に参照する条件例えば後述の検出された値に対する閾値等の条件など、端末装置1の機能を実現するためのプログラム及びデータが予め記憶されている。他に、端末装置1における他のアプリケーションソフトウェアプログラムが記憶されていてもよい。記憶部102にはハードディスク又はSSDなどの外部装置を用いてもよい。
入力処理部103には、ディスプレイ114上に内蔵され、端末用ペン4による文字入力又は図形入力のための操作を受け付けるタブレット113が接続されている。入力処理部103は、端末装置1の会議参加者の操作により入力されるボタン(クリックボタン)の押下情報、ディスプレイに表示中の画面内における位置を示す座標情報などの情報を受け付け、入力操作の有無及び入力操作の内容を判断して制御部100へ通知する。なお、入力処理部103には図示しないマウス、又はキーボードなどのポインティングデバイス(入力装置)が接続されており、それらのポインティングデバイスにて受け付けた操作に応じた信号を入力してもよい。
表示処理部104には、液晶パネル、又は有機ELなどを用いるタッチパネル型のディスプレイ114が接続されている。制御部100は、表示処理部104を介し、ディスプレイ114に会議端末用のアプリケーション画面を出力し、アプリケーション画面内に共有させる画像(映像)を表示させる。共有させる画像には、後述するように会議サーバ装置3から受信した他の端末装置1,1,…から送信された画像も含まれる。会議サーバ装置3から送信される画像が、H.261、H.263、H.264、MPEGなどの規格にて符号化されている場合、制御部100は画像を符号化・復号処理部120へ与えて、復号してから表示処理部104に出力する。
映像処理部105には、ビデオカードを用いる。映像処理部105は、端末装置1が備えるカメラ115に接続され、カメラ115の動作の制御を行なうと共に、カメラ115にて撮像された映像データを取得する。カメラ115は、端末装置1の筐体に設けられたディスプレイ114の上方に、ユーザの顔又は上半身を撮像する方向へ向けて搭載されている。カメラ115は、1秒間に数十回又は数百回等の頻度で撮像し、それらの画像信号を連続して映像データとして映像処理部105へ出力する。映像処理部105は、カメラ115から取得した映像データを符号化・復号処理部120へ出力し、H.261、H.263、H.264、MPEGなどの映像規格のデータへ変換(符号化)する処理を行なってもよい。
入力音声処理部106は、端末装置1が備えるマイク116に接続され、マイク116によって集音された音声をサンプリングしてデジタル音声データへ変換し、制御部100へ出力するA/D変換機能を有する。入力音声処理部106は、集音された音声の信号レベルの調整及び帯域制限等の処理を行なうミキサ、及び、エコー部分を除去するエコーキャンセラを内蔵していてもよい。なお、入力音声処理部106は、集音音声を符号化・復号処理部120へ出力し、G.711、G.722、G.728、G.729又はMPEGAudioなどの規格の音声データへ符号化する処理を行なってもよい。
出力音声処理部107は、端末装置1が備えるスピーカ117に接続される。出力音声処理部107は、制御部100から音声データが与えられた場合に、音声としてスピーカ117から出力させるようにD/A変換機能を有する。なお、会議サーバ装置3から送信される音声データがG.711、G.722、G.728、G.729又はMPEGAudioなどの規格により符号化されている場合は、制御部100は音声データを符号化・復号処理部120へ与えて復号してからスピーカ117へ出力する。
通信処理部108は、端末装置1のネットワーク2を介した通信を実現させる。詳細には、通信処理部108は、ネットワーク2に接続されたネットワークカードを用いたネットワークI/F部118と接続されており、ネットワーク2を介して送受信される情報のパケット化、パケットからの情報の読み取りなどを行なう。制御部100は、通信処理部108により画像(映像)及び音声のデータの送受信を行なうことができる。
なお、通信プロトコルは、会議サーバ装置3の通信処理部37における通信プロトコルに対応する。
無線通信処理部109は、端末装置1に備えられる無線通信部119と接続されており、端末用ペン4との無線通信を実現させる。無線通信処理部109は、端末用ペン4から発せられる無線信号を受信し、受信した信号から情報を取得して制御部100へ通知する。無線通信処理部109は、制御部100から与えられた情報を示す信号を生成し、無線通信部119から出力させてもよい。なお、無線通信処理部109及び無線通信部119は、赤外線通信にて信号を送受信するようにしてもよい。
符号化・復号処理部120は、エンコーダ・デコーダチップを用い、H.261、H.263、H.264又はMPEG等の規格に基づく映像(画像)の符号化・復号処理、及び、G.711、G.722、G.728、G.729又はMPEGAudioなどの規格に基づく音声の符号化・復号処理を実現する。制御部100は、会議サーバ装置3から符号化された映像、音声、又は多重化された映像のデータを受信した場合、符号化・復号処理部120へ与えて復号する。なお映像(画像)及び音声の規格は上述の例以外のものであってもよい。
読取部110は、CD−ROM、DVD、ブルーレイディスク又はフレキシブルディスクなどである記録媒体10から情報を読み取ることが可能である。制御部100は、読取部110により記録媒体10に記録されているデータを一時記憶部101に記憶するか、又は記憶部102に記録する。記録媒体10には、コンピュータを本発明に係る情報処理装置として動作させる会議端末用プログラム10Pが記録されている。記憶部102に記録されている会議端末用プログラム1Pは、記録媒体10から制御部100が読み出した会議端末用プログラム10Pの複製であってもよい。
なお実施の形態1では、端末装置1はタッチパネル型のディスプレイ114を搭載した専用端末を用いる構成とした。しかしながら、これに限らず汎用的なパーソナルコンピュータに、カメラ及びスピーカを接続し、キーボードのほかにペンタブレットを接続する構成でもよい。更には、ディスプレイにカメラ、スピーカ及びネットワークカードを接続し、後述するような制御部100の機能を実現する装置を接続する構成でも実現できる。会議システムは、構成が上述したように異なる端末装置1を含んでもよい。
図4は、実施の形態1の会議システムを構成する端末装置1にて用いられる端末用ペン4の内部構成を示すブロック図である。端末用ペン4は、ペン型の入力装置である。端末用ペン4は、制御部40と、一時記憶部41と、記憶部42と、通信処理部43と、無線通信部44と、操作状態検出部45とを備える。
制御部40には、CPU又はMPUを用い、記憶部42に記憶されている制御プログラムを一時記憶部41に読み出して実行する。一時記憶部41には、SRAM又はDRAM等のRAMを用いる。一時記憶部41には、上述の制御プログラムが読み出されて一時的に記憶されると共に、制御部40の処理によって発生する情報が一時的に記憶される。
記憶部42には、フラッシュメモリ、マスクROM、EROM又はEEPROMなどの不揮発性メモリを用いる。記憶部42には上述の制御プログラムの他、制御部40の制御処理時に参照される条件などの情報が予め記憶されている。
通信処理部43は、無線通信部44と接続され、端末装置1との無線通信を実現させる。通信処理部43は、制御部40から与えられる情報を無線通信のプロトコルに応じた信号に変換し、無線通信部44から出力させる。また、通信処理部43は、無線通信部44にて受信した端末装置1から発せられた無線信号を受信し、受信した信号から情報を取得して制御部40へ通知してもよい。なお無線に限定するものではなく、有線によって端末装置1と接続される構成としてもよい。
操作状態検出部45は、衝撃検出部46、速度検出部47及び傾斜角検出部48を含む。具体的には、例えば振子部材及び該振子の変位を検知するスイッチにて、端末用ペン4自体の回転、振動、衝撃及び静止の状態、並びに傾斜角度の変化の有無、並びにそれらの大きさを検出する。他に、モーションセンサ、加速度センサを用いて衝撃、速度、又は傾斜角度を検出するようにしてもよい。操作状態検出部45は、変化が検知されたタイミングにて制御部40へ通知し、制御部40は操作状態検出部45にて検出された情報即ち衝撃の有無、衝撃の大きさ、速度、振動の有無、振動速度、傾斜角度等の各種状態情報を通信処理部43及び無線通信部44を介して端末装置1へ送信する。
操作状態検出部45は、検出された衝撃、振動若しくは回転の有無又は物理量を送信するのみならず、検出された変化の有無及びその大きさに基づき「入力中」、「待機中」、「静止状態」、「振動状態」、「回転状態」、及び「落下状態」等の状態を判定し、判定結果を夫々示す状態情報を端末装置1へ送信する。
なお、端末用ペン4は、マウスにおけるクリックボタンに対応するボタンを有し、制御部40又は操作状態検出部45にて当該ボタンのクリックを検出し、クリックされたことを示す信号を、通信処理部43を介して端末装置1へ送信する構成でもよい。
ユーザは、端末用ペン4を把持して端末装置1のディスプレイ114上のタブレット113に接触させて文字若しくは図形、またはそれらの選択をすることにより、ディスプレイ114に表示されている画面上に手書きにて文字又は図形を入力することが可能である。
図5は、実施の形態1の会議システムにて実現される画像及び音声の送受信を模式的に示す模式図である。会議システムでは基本的に、図5に示すように、端末装置1,1,…にて夫々、制御部100の制御により、カメラ115にて撮像される会議参加者の顔又は上半身の映像(又は静止画像)データを通信処理部108及びネットワークI/F部118を介して会議サーバ装置3へ送信し続ける。
会議サーバ装置3では、各端末装置1,1,…にて撮像及び集音されて送信される画像データ及び音声データを受信した場合、画像データと音声データとに分離して夫々符号化・復号処理部34へ与え、夫々復号する。そして制御部30は、図5に示すように、復号後の複数の端末装置1,1,…からの画像(映像)が、並べて表示されるように画像処理部35にて合成すべく画像処理部35へ指示する。制御部30は、復号後の複数の端末装置1,1,…からの音声が重ね合わされるように音声処理部36へ指示する。制御部30は、合成後の画像及び音声を符号化・復号処理部34へ与え、符号化又は多重化し、通信処理部37を介して各端末装置1,1,…へ送信する。
各端末装置1,1,…では、会議サーバ装置3から送信される合成された画像及び音声を符号化・復号処理部120にて復号して表示処理部104及び出力音声処理部107へ夫々与え、各端末装置1,1,1…を使用する会議参加者の顔又は上半身を映した画像が並べて表示される。これにより、各端末装置1,1,…を用いる会議参加者は、他の会議参加者の表情、身振りを確認しながら自身を含む会議参加者の発言を聴くことが可能となる。
ただし、実施の形態1における端末装置1では、検出された会議参加者による端末用ペン4に対する操作状態が特定の状態である場合、会議参加者の顔又は上半身の映像を撮像した画像及び会議参加者から発せられる音声の会議サーバ装置3への送信を禁止する。つまり、端末装置1は、画像及び音声を送信中である場合は停止し、送信開始前である場合には送信を開始しない。
会議参加者による端末用ペン4に対する操作状態は、端末用ペン4から送信される状態情報、及び端末装置1,1,…の制御部100における処理に基づき検出される。以下、操作状態の検出について説明する。
図6から図10は、実施の形態1における端末装置1及び端末用ペン4による検出対象の操作状態の例を模式的に示す模式図である。図6は、端末用ペン4が操作されて図形情報が入力されている状態を示し、図7は、端末用ペン4が使用されていない状態、及び端末用ペン4が把持されているが入力動作の間の待機状態を示す。図8は、端末用ペン4を回転する動作が行なわれている状態を示し、図9は、端末用ペン4を振動させ、ディスプレイ114以外の箇所(机等も含む)を突く反復動作が行なわれている状態を示し、図10は、端末用ペン4を落下させる動作が行なわれた状態を示す。
図1及び図6等に示したように、端末装置1は、扁平な略直方体形状の筐体13を有し、正面131に設けられた矩形の開口部にディスプレイ114(タブレット113)が露出している。正面131のディスプレイ114のための開口部の上方には、端末装置1が備えるカメラ115のための開口部が設けられている。カメラ115は正面113に対し略垂直な方向を撮像方向とする。
会議参加者は、筐体13に設けられたスタンド132を用いて、正面131即ちディスプレイ114が鉛直方向に略平行となるように、机上に立てた直立状態で端末装置1を使用することができる。直立状態には、正面131が水平面に対し45°から110°程度の角度をなす状態をも含む。なお、会議参加者は端末装置1を把持し、正面131即ちディスプレイ114が鉛直方向と平行となるように使用することもできる。このとき、カメラ115は、端末装置1を使用する会議参加者の顔又は上半身を撮像範囲とすることができる。
また会議参加者は、端末装置1を机上に載置し、正面131が水平面に略平行となる平置き状態で端末装置1を使用することもできる。なお、平置き状態は、正面131が水平面に対し0°〜45°程度の角度をなす状態をいう。
会議参加者は、端末装置1を平置き状態にて使用することにより、容易且つ快適に端末用ペン4を用いた入力操作を行なうことができる。ただし会議参加者は、入力操作の容易性及び快適性は平置き状態よりも損なわれる可能性があるものの、端末装置1を直立状態にて使用し、端末用ペン4を操作して文字情報又は図形情報を入力することができる。会議参加者が会議参加中、メモをとるために文字情報又は図形情報を入力している間は、図6に示すように、端末用ペン4は会議参加者に把持され、動かされて操作される。したがってこのとき、端末用ペン4では衝撃検出部46、速度検出部47及び傾斜角検出部48のいずれでも変化が検知され、操作状態が「入力中」であると判断することが可能である。実施の形態1では、「入力中」の状態であるか否かの状態検出は、端末用ペン4からの衝撃、速度、傾斜角度等の状態情報に基づき、端末装置1の制御部100が行なう。なお、端末用ペン4の操作状態検出部45にて検出してもよい。
会議参加者は会議参加中、常に端末用ペン4を用いてメモをとるわけではない。会議参加者は、他の会議参加者の発言を聞いたり、会議テーマに関して考えたりする場合、端末用ペン4を全く使用しないか又は把持したまま集中する。このとき端末用ペン4は、図7に示すように、机上に置かれて静止しているか、又は会議参加者により把持されているが激しく動かされない状態にある。したがって、端末用ペン4では変化が検知されず、各種状態情報は端末装置1へ送信されない。傾斜角検出部48にて傾斜角度の変化が検知される場合、傾斜角度の情報が端末装置1へ送信され、端末装置1の制御部100は、端末用ペン4から受信した傾斜角度が例えば45°の閾値以上であるか否か及び他の物理量に基づき操作状態を検出する。また、例えば制御部100は、いずれの検出部でも一定時間以上変化が検知されないか、又は検知されて受信した傾斜角度が45°の閾値以下である場合に、操作状態が「待機中」又は「静止状態」であると検出することが可能である。
一方、会議参加者が会議に興味を失って集中していない場合には、端末用ペン4は図6及び図7に示したような状態にはなく、図8から図10に示す状態にあるときがある。
図8は、所謂ペン回しが行なわれている状態を示している。このとき端末用ペン4では、速度検出部47及び傾斜角検出部48にて変化が検知され、操作状態検出部45にて「回転状態」と検出され、端末装置1へ送信される。例えば操作状態検出部45は、速度検出部47にて検知された速度を端末装置1へ送信し、端末装置1は受信した速度が予め記憶部102に記憶している回転動作に対応する速度及び向きであることに基づき「回転状態」であることを検出する。
図9は、ディスプレイ114に表示されている画面中の端末用ペン4を用いた入力が可能な領域以外の場所へ、端末用ペン4が接触及び離反を繰り返す反復動作が行なわれている状態を示している。つまり、会議参加者が端末用ペン4を机に突き続けるなどの動作が行なわれている。このとき端末用ペン4では、衝撃検出部46、速度検出部47及び傾斜角検出部48の全て又は一部にて変化が検知され、各検出部からの状態の変化に対応する状態情報が端末装置1へ送信される。これにより、端末装置1では、受信した状態情報の内、例えば加速度の大きさが記憶部102に記憶してある閾値よりも大きいこと、及び振動の方向の変化に基づき「振動状態」であることを検出する。
なお、端末用ペン4を机又は端末装置1のディスプレイ114以外の場所へ衝突させる動作のみならず、不要に端末用ペン4を振り続ける反復動作が行なわれている場合も同様に衝撃検出部46、速度検出部47及び傾斜角検出部48にて変化が検知される(図9)。変化の検知がったときに操作状態検出部45から制御部40へ通知された状態情報が端末装置1へ送信され、端末装置1の制御部100は振動の大きさ、又は加速度の大きさと記憶部102に記憶してある閾値との比較に基づき「振動状態」であることを検出する。
また、会議参加者は会議に関心を持って集中している場合であっても、無意識にペン回しを行なったり、端末用ペン4で机をコツコツと突く動作をしたり、図10に示すように誤って端末用ペン4を落下させる場合が有る。このとき端末用ペン4では、衝撃検出部46、速度検出部47及び傾斜角検出部48のいずれでも変化が検知され、状態情報として端末装置1へ送信される。これにより、端末装置1の制御部100は、受信した状態情報に基づき、特に衝撃検出部46からの状態情報が示す衝撃の大きさが記憶部102に記憶してある閾値よりも大きいことに基づき「落下状態」であることを検出する。
図8から図10に示した状態に対応するペン回しなどの動作は、会議参加者が会議に集中している場合であったとしても、少なくとも日本人的な感覚に従ったときには、非文化的又は非社会的な動作であって、ビジネス又は会議の場面では不適切で不作法な振舞いであるとして不快感を与えるときがある。端末用ペン4にて検出される各種状態変化は、端末装置1へ送信され、端末装置1では制御部100にて状態情報に基づき、端末用ペン4が通常に使用されているか又は不適切な操作状態であるかが検出される。不適切な操作状態であることが検出された場合は画像及び音声の会議サーバ装置3への送信が禁止される制御が行なわれることによって、不快感を与えることを回避することが可能となる。
端末装置1の制御部100が図6乃至図10に示したような状態から不適切な操作状態を検出しつつ、操作者を撮像した映像(画像)及び音声の送受信制御を行なう処理について、以下、フローチャートを参照して説明する。
図11は、実施の形態1の端末装置1の画像及び音声のデータ送信時における処理手順の一例を示すフローチャートである。端末装置1の制御部100は、会議サーバ装置3から認証を受けて会議が開始されると、映像処理部105によりカメラ115による撮像及び入力音声処理部106によりマイク116による集音を開始し、以下に示す処理を実行する。
制御部100は、端末用ペン4の無線通信部44を介して送信される状態情報(速度、衝撃の有無並びに大きさ、及び傾斜角度等)を、無線通信部119及び無線通信処理部109により受信する(ステップS1)。状態情報は、端末用ペン4にて変化が検知されたときに送信されてもよいし、定期的に送信されてもよい。
制御部100は、ステップS1にて受信した状態情報に基づき、端末用ペン4に対する操作状態を記憶部102に記憶してある閾値等に基づき判定する(ステップS2)。制御部100は、ステップS2にて判定された操作状態に変化が有ったか否かを判断する(ステップS3)。例えば、通常の入力中は、端末用ペン4にて傾斜角度、加速度等に変化が検知されて状態情報として送信された場合でも「入力中」の操作状態から変化せず、ここで変化無しと判断される。
制御部100は、ステップS3にて変化無しと判断した場合(S3:NO)、処理をステップS1に戻し、次に端末用ペン4から状態情報を受信するまで待機する。
制御部100は、ステップS3にて変化有りと判断した場合(S3:YES)、不適切な操作状態か否かを判断する(ステップS4)。これにより、不適切な操作状態が検出される。実施の形態1における制御部100は、「振動状態」、「回転状態」、及び「落下状態」の操作状態(図8,図9及び図10に示したような状態)を検出した場合に、不適切な操作状態であると判断する。なおこのとき、「回転状態」が記憶部102に記憶してある所定の上限時間以上継続した場合に不適切な操作状態と判断するなど、各操作状態の継続時間を考慮に入れて判断してもよい。
制御部100は、ステップS4にて不適切でないと判断した場合(S4:NO)、カメラ115による撮像を停止しているときには撮像を開始し、撮像中であるときには継続するように映像処理部105を制御する(ステップS5)。音声に関しても制御部100は、マイク116による集音を停止している場合には集音を開始し、集音中であるときには継続するように入力音声処理部106を制御する(ステップS6)。更に制御部100は、撮像した画像及び集音した音声の送信を停止しているときには、カメラ115により撮像された画像(映像)及びマイク116にて集音された音声を符号化・復号処理部120にて多重化して通信処理部108の処理により多重化後の画像及び音声のデータの送信を開始し、送信中では継続し(ステップS7)、処理を次のステップS11へ進める。
制御部100は、ステップS4にて不適切と判断した場合(S4:YES)、映像処理部105によりカメラ115による撮像を停止し(ステップS8)、入力音声処理部106によりマイク116による集音を停止する(ステップS9)。更に制御部100は、カメラ115により撮像した画像(映像)及びマイク116により集音された音声の多重化及び通信処理部108の処理による多重化後の画像及び音声のデータの送信を停止し(ステップS10)、処理を次のステップS11へ進める。なお、他の会議参加者を不快にさせないためには、少なくともデータの送信を停止する(S10)。
制御部100は、送信を開始した後(S7)及び停止した後(S10)のいずれでも、会議が終了したか否かを判断する(ステップS11)。制御部100は、会議が終了していないと判断した場合(S11:NO)、処理をステップS1へ戻して次に端末用ペン4から状態情報を受信するまで待機する。
制御部100は、会議が終了したと判断した場合(S11:YES)、送信時の処理を終了する。
一方、端末装置1の制御部100は、会議サーバ装置3から送信される画像及び音声のデータを受信した場合、以下のようにディスプレイ114及びスピーカ117から出力させる処理を実行する。図12は、実施の形態1の端末装置1の画像及び音声のデータの受信時における処理手順の一例を示すフローチャートである。なお、以下に示す処理は、制御部100により、図11に示した処理と並行して行なわれる。
制御部100は、会議サーバ装置3から、ネットワークI/F部118を介して画像及び音声のデータを受信したか否かを判断する(ステップS21)。制御部100は、データを受信したと判断した場合(S21:YES)、受信した画像及び音声の多重化されたデータを符号化・復号処理部120へ与えて分離し、夫々復号して得られる画像を表示処理部104に与え、ディスプレイ114に表示させる(ステップS22)。制御部100は、同様にして符号化・復号処理部120にて復号して得られる音声を出力音声処理部107に与えてスピーカ117から出力させる(ステップS23)。このとき制御部100は処理を次のステップS26へ進める。
一方制御部100は、ステップS21にてデータを受信していないと判断した場合(S21:NO)、表示処理部104へ指示してディスプレイ114に所定の画像(例えばブルーバック)を表示させ(ステップS24)、出力音声処理部107によりスピーカ117からの音声の出力を停止させ(ステップS25)、ステップをステップS26へ進める。
制御部100は、音声を出力させた場合及び音声の出力を停止させた場合のいずれでも、会議が終了したか否かを判断する(ステップS26)。制御部100は、会議が終了していないと判断した場合(S26:NO)、処理をステップS21へ戻してデータを受信する。
制御部100は、ステップS26にて会議が終了したと判断した場合(S26:YES)、受信時の処理を終了する。
このような構成により、端末用ペン4における状態に基づき、会議参加者による端末用ペン4に対する不適切な操作状態が検出でき、他の会議参加者を不快にさせるような操作状態がなされている場合にはその会議参加者を撮像した画像、及び会議参加者から発せられる音声の会議サーバ装置3への送信が禁止される。これにより、不快にさせる可能性が有る画像及び音声が他の会議参加者の端末装置1へ届かないようにすることができ、快適な会議システムを実現することができる。また、不適切な操作行為を撮像した画像、及び集音した音声のデータの送信を禁止することにより、不要なデータが送受信されることを回避することができ、ネットワーク2の通信負荷増大及び会議サーバ装置3の中継処理の負荷増大を抑制することができる。
なお実施の形態1では、端末装置1は会議参加者を撮像した画像及び集音した音声をいずれも送信し、不適切な操作状態が検出された場合には画像及び音声の両方の送信を禁止する構成とした。しかしながら本発明はこれに限らず、端末装置1は画像又は音声の一方のみを会議サーバ装置3へ送信し、不適切な操作状態が検出された場合には、送信する画像又は音声の内のいずれかの送信を禁止してもよい。また、端末装置1は通常は画像又は音声のいずれも会議サーバ装置3へ送信するとしても、不適切な操作状態が検出された場合には、画像又は音声の一方のみの送信を禁止するようにしてもよい。
また、実施の形態1では端末装置1は、不適切な操作状態が検出された場合に、画像及び音声のデータの送信を禁止する構成とした。しかしながら、本発明はこれに限らず、送信を禁止するのではなく、送信する画像のデータのデータ量を低減する構成としてもよい。具体的には、制御部100は映像処理部105により取得される画像の内の一部を送信するようにする。つまり、制御部100は、送信する画像のデータをコマ落ちに、即ちレートを低減する。又は、制御部100は映像処理部105からカメラ115による撮像レートを低減させるようにしてもよいし、入力音声処理部106におけるサンプリングレートを低減させて音声のデータのデータ量を低減するようにしてもよい。
更に、端末装置1は、図11のフローチャートに示した処理手順にて、撮像の停止、集音の停止及び送信の停止(S8、S9、及びS10)を行なう場合、送信(撮像及び集音)を停止する旨のメッセージを会議サーバ装置3へ送信してもよい。会議サーバ装置3は、当該メッセージを他の端末装置1,1,…へ送信してもよい。これにより、会議サーバ装置3にて、端末装置1から画像及び音声のデータを受信できない場合でも、エラーとして検出することなく会議システムの進行を継続させることができる。
(実施の形態2)
実施の形態2では、操作者による不適切な操作状態が検出された場合、カメラの撮像方向又はマイクの集音方向を変更する制御により、他の会議参加者に不快感を覚えさせる画像又は音声の送信を回避する。
実施の形態2における会議システムは、会議参加者が夫々用いる端末装置5,5,…と、端末装置5,5,…が接続されるネットワーク2と、端末装置5,5,…間での画像(映像)及び音声の送受信及び共有を実現する会議サーバ装置3とを含んで構成される。つまり、端末装置5を含むことが実施の形態1と異なり、ネットワーク2、会議サーバ装置3及び端末用ペン4を含むことは実施の形態1の構成と同様である。したがって、以下の説明では実施の形態1の構成と共通する装置及び内部構成については同一の符号を付して詳細な説明を省略する。
端末装置5は、実施の形態1における端末装置1同様、タブレット内蔵ディスプレイを搭載した会議システム専用端末を用い、外観も同様である。
図13は、実施の形態2の会議システムを構成する端末装置5の内部構成を示すブロック図である。
端末装置5は、制御部500と、一時記憶部501と、記憶部502と、入力処理部503と、表示処理部504と、映像処理部505と、入力音声処理部506と、出力音声処理部507と、通信処理部508と、無線通信処理部509と、読取部510と、符号化・復号処理部520とを備える。端末装置5は更に、内蔵又は外部接続により、タブレット513と、ディスプレイ514と、カメラ515と、マイク516と、スピーカ517と、ネットワークI/F部518と、無線通信部519とに加え、駆動部530及び角度調整部531とを備える。
端末装置5が備える各構成部の内、駆動部530及び角度調整部531の構成、並びに制御部500による処理の詳細以外は、実施の形態1の端末装置1の各構成部と同様である。したがって、それらの詳細な説明は省略する。
駆動部530は、制御部500からの指示に基づき、角度調整部531へ制御信号を出力する。また、角度調整部531の現状を示す信号を取得して制御部500へ通知する機能を有していてもよい。
実施の形態2におけるカメラ515は、端末装置1の筐体13内部にて動かされること可能に支持されている。角度調整部531は、筐体13の内部におけるカメラ515の支持部に、接するように配置され、ステッピングモータなどの機構を含み、駆動部530からの制御信号に従ってカメラ515の支持部の向きを変更してカメラ515の撮像方向を変更する。
制御部500は、記憶部502に記憶してある会議端末用プログラム5Pを読み出して実行することにより、会議開始時には、カメラ115の撮像方向を、端末装置5を使用する会議参加者へ向くようにする。そして、制御部500は、会議参加者による端末用ペン4に対する操作が不適切であると検出できた場合には、会議参加者が映らないようにカメラ515の撮像方向を変更させる。
図14は、実施の形態2の端末装置5の画像及び音声のデータ送信時における処理手順の一例を示すフローチャートである。なお、以下に示す処理手順の内、実施の形態1の図11に示した処理手順と共通する手順には同一のステップ番号を付して詳細な説明を省略する。
制御部500は、ステップS4にて不適切でないと判断した場合(S4:NO)、カメラ515の撮像方向を、端末装置5を使用する会議参加者を撮像するように、駆動部530及び角度調整部531によって調整する(ステップS12)。なお、会議参加者へ向ける撮像方向は、初期的に設定してある筐体13の正面131に鉛直な方向である。駆動部530は会議参加者の顔を検知する機構を内蔵し、顔を捉える方向へ自動的に変更すべく制御信号を角度調整部531へ出力するようにしてもよい。
制御部500は、撮像方向を調整した後、カメラ515による撮像を停止しているときには撮像を開始し、撮像中であるときには継続するように映像処理部505を制御する(S5)。制御部500は、その後、集音の開始又は集音の継続を行なうべく入力音声処理部506を制御し(S6)、データの送信を開始又は継続させる(S7)。
制御部500は、ステップS4にて不適切であると判断した場合(S4:YES)、カメラ515の撮像方向を、端末装置5を使用する会議参加者を撮像することで会議の場に相応しくない映像を映さないように、駆動部530及び角度調整部531によって調整する(ステップS13)。
制御部500は、撮像方向を調整した後、更に、映像処理部505によりカメラ515による撮像を停止し(S8)、入力音声処理部506によりマイク516による集音を停止する(S9)。また、制御部500は、多重化後の画像及び音声のデータの送信を停止する(S10)。
このような構成により、会議参加者による端末用ペン4に対する不適切な操作状態を検出した場合、つまり他の会議参加者を不快にさせるような操作状態がなされる場合には、その会議参加者を撮像した画像、及び会議参加者から発せられる音声の会議サーバ装置3への送信が禁止される。これにより、不快にさせる可能性が有る画像及び音声が他の会議参加者の端末装置5へ届かないようにすることができ、快適な会議システムを実現することができる。また、不適切な操作行為を撮像した画像、及び集音した音声のデータの送信を禁止することにより、不要なデータが送受信されることを回避することができ、ネットワーク2の通信負荷増大及び会議サーバ装置3の中継処理の負荷増大を抑制することができる。
図14のフローチャートに示した処理手順では、制御部500は不適切な操作状態を検出した場合には(S4:YES)、撮像方向を変更するのみならず、撮像及び集音の停止並びに多重化後のデータの送信の禁止をも行なう構成とした。しかしながら、本発明はこれに限らず、撮像及び集音は継続したまま、撮像方向のみを変更するようにしてもよい。ただし、ネットワーク2における通信負荷を考慮した場合、送信するデータの量を削減するために多重化後のデータの送信を禁止して不快感、違和感を抑制することができる。これにより、画像又は音声による通信負荷の増大及び会議システムにて画像又は音声の送受信を中継する会議サーバ装置3の処理負荷を抑制することが可能である。
実施の形態2では、端末装置5の制御部500は、会議参加者の不適切な操作状態を検出した場合、カメラ515の撮像方向を変更させる制御を行なう構成とした。しかしながら本発明はこれに限らず、指向性の高いマイク516を用い、入力音声処理部506にてマイク516の集音方向を変えるか、又は、特定の方向からの音声を事後的に除去するかの処理を行なってもよい。これにより、他の会議参加者を不快にするような音声が会議サーバ装置3を介して他の端末装置1,1,…へ送信されることを回避することができる。
実施の形態1及び実施の形態2では、端末装置1又は5は、端末用ペン4に対する操作が不適切な操作状態であると検出された場合に、画像及び音声のデータの送信又は撮像方向若しくは集音方向を変更する構成とした。このとき、制御部100(制御部500)は、不適切な操作状態か否かのみならず、端末装置1が直立状態であるときには映像処理部105(505)により、1秒間における撮像頻度を高くし、平置き状態のときには1秒間における撮像頻度を低減するなどの制御を行なってもよい。
なお、開示された実施の形態は、全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上述の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
1 端末装置(情報処理装置、第1情報処理装置)
100 制御部(検出手段、送信制御手段)
101 一時記憶部
102 記憶部
103 入力処理部
105 映像処理部(取得する手段)
106 入力音声処理部(取得する手段)
108 通信処理部(送信手段、送受信手段)
113 タブレット(入力手段)
114 ディスプレイ(表示部)
115 カメラ
116 マイク
2 ネットワーク
3 会議サーバ装置(第2情報処理装置)
30 制御部
31 一時記憶部
32 記憶部
37 通信処理部
4 端末用ペン(入力手段)
45 操作状態検出部
46 衝撃検出部
47 速度検出部
48 傾斜角検出部

Claims (10)

  1. 文字情報又は図形情報を入力するための一又は複数の入力手段と、画像又は音声を取得する手段と、取得した画像又は音声を送出する手段とを備える情報処理装置において、
    前記入力手段に対する不適切な操作状態を、前記入力手段にて発生する変化に基づき検出する検出手段と、
    該検出手段の検出結果に応じて前記送出手段による画像若しくは音声の送出の可否、又は送出レートの増減を制御する制御手段と
    を備えることを特徴とする情報処理装置。
  2. 前記入力手段は、ペン型の入力装置を含み、
    前記検出手段は、
    前記ペン型の入力装置を用いて入力動作がされている状態、入力動作間の待機状態及び使用されていない状態の別を検出する第1手段と、
    前記ペン型の入力装置を振動、回転若しくは衝突させる動作の内の一又は複数がされている状態、及び、前記動作の反復がされている状態を検出する第2手段と
    を有し、
    第1手段又は第2手段が検出した各状態に基づき不適切な操作状態を検出するようにしてあること
    を特徴とする請求項1に記載の情報処理装置。
  3. 前記ペン型の入力装置を振動、回転若しくは衝突させる動作、又は該動作の反復がされている状態を、不適切な操作状態として検出するようにしてあること
    を特徴とする請求項2に記載の情報処理装置。
  4. 前記入力手段は、入力される文字情報又は図形情報を表示する画面を出力するタッチパネル型の表示部を含み、
    前記検出手段は、前記画面以外への接触/離反が繰り返される反復動作を検出する手段を有し、
    前記反復動作がされている状態を不適切な操作状態として検出するようにしてあること
    を特徴とする請求項1から3のいずれか1つに記載の情報処理装置。
  5. 前記検出手段は、
    前記入力手段に対する操作時に与えられる衝撃又は接触点における圧力を検出する手段と、
    該手段が検出した衝撃又は圧力の値を、予め記憶してある閾値と比較する手段と
    を備え、
    比較結果に基づいて不適切な操作状態を検出するようにしてあること
    を特徴とする請求項1から4のいずれか1つに記載の情報処理装置。
  6. 前記検出手段が不適切な操作状態を検出した場合、前記制御手段は、画像又は音声の送出を禁止するようにしてあること
    を特徴とする請求項1から5のいずれか1つに記載の情報処理装置。
  7. 前記画像は操作者を撮像した撮像画像であり、前記音声は操作者により発せられる音声を集音した集音音声であり、
    前記検出手段が不適切な操作状態を検出した場合、撮像方向又は集音方向の変更を指示する信号を出力する手段を備えること
    を特徴とする請求項1から6のいずれか1つに記載の情報処理装置。
  8. 文字情報又は図形情報を入力するためのペン型の入力装置において、
    加速度検出手段、傾斜角検出手段及び衝撃検出手段の内の一又は複数を有し、
    各手段による検出結果に基づき、不適切な操作状態を検出する手段と、
    検出結果を出力する手段と
    を備えることを特徴とする入力装置。
  9. 文字情報又は図形情報を入力するための一又は複数の入力手段と、画像又は音声を取得する手段と、取得した画像又は音声を送出する送出手段とを備える情報処理装置を制御する方法において、
    前記入力手段に対する不適切な操作状態を、前記入力手段にて発生する変化に基づき検出し、
    検出結果に応じて前記送出手段による画像若しくは音声の送出の可否、又は送出レートの増減を制御する
    ことを特徴とする情報処理方法。
  10. 操作者を撮像する撮像装置又は操作者が発する音声を集音する集音装置と、文字情報又は図形情報を入力するための一又は複数の入力手段、前記撮像装置からの画像又は前記集音装置からの音声を取得する手段、取得した画像又は音声を送受信する送受信手段を備える第1情報処理装置を複数と、複数の第1情報処理装置に接続し、各第1情報処理装置で送受信される画像又は音声を中継する第2情報処理装置とを含み、複数の第1情報処理装置間で共通の画像又は音声を表示又は出力させるようにして情報を共有させ、会議を実現させる会議システムにおいて、
    複数の第1情報処理装置は夫々、
    前記入力手段に対する不適切な操作状態を、前記入力手段にて発生する変化に基づき検出する検出手段と、
    該検出手段の検出結果に応じて前記送受信手段による画像若しくは音声の送信の可否、又は送信レートの増減を制御する送信制御手段と
    を備えることを特徴とする会議システム。
JP2010023350A 2010-02-04 2010-02-04 情報処理装置、入力装置、情報処理方法及び会議システム Pending JP2011164695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010023350A JP2011164695A (ja) 2010-02-04 2010-02-04 情報処理装置、入力装置、情報処理方法及び会議システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010023350A JP2011164695A (ja) 2010-02-04 2010-02-04 情報処理装置、入力装置、情報処理方法及び会議システム

Publications (1)

Publication Number Publication Date
JP2011164695A true JP2011164695A (ja) 2011-08-25

Family

ID=44595349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010023350A Pending JP2011164695A (ja) 2010-02-04 2010-02-04 情報処理装置、入力装置、情報処理方法及び会議システム

Country Status (1)

Country Link
JP (1) JP2011164695A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015515672A (ja) * 2012-03-12 2015-05-28 イシキリ インターフェイス テクノロジーズ ゲーエムベーハーISIQIRI INTERFACE TECHNOLOGIES GmbH コンピュータシステムとその制御方法
WO2019235009A1 (ja) * 2018-06-04 2019-12-12 コクヨ株式会社 筆記具側装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015515672A (ja) * 2012-03-12 2015-05-28 イシキリ インターフェイス テクノロジーズ ゲーエムベーハーISIQIRI INTERFACE TECHNOLOGIES GmbH コンピュータシステムとその制御方法
WO2019235009A1 (ja) * 2018-06-04 2019-12-12 コクヨ株式会社 筆記具側装置
JP2019211948A (ja) * 2018-06-04 2019-12-12 コクヨ株式会社 筆記具側装置
CN112074799A (zh) * 2018-06-04 2020-12-11 国誉株式会社 书写工具侧装置
JP7234512B2 (ja) 2018-06-04 2023-03-08 コクヨ株式会社 筆記具側装置
CN112074799B (zh) * 2018-06-04 2024-05-03 国誉株式会社 书写工具侧装置

Similar Documents

Publication Publication Date Title
JP6229314B2 (ja) 情報処理装置、表示制御方法及びプログラム
JP2012054897A (ja) 会議システム、情報処理装置、及び情報処理方法
US8264518B2 (en) Gesture-based actions in a video communication session
JP2010206307A (ja) 情報処理装置、情報処理方法、情報処理プログラム、およびネットワーク会議システム
JP2011205243A (ja) 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム
CN110971925B (zh) 直播界面的显示方法、装置及系统
JP2012023595A (ja) 会議システム
WO2022135005A1 (zh) 一种基于通话的屏幕共享方法、装置、设备及存储介质
CN114205633B (zh) 直播互动方法、装置、存储介质和电子设备
WO2019107274A1 (ja) 情報処理装置およびゲーム画像配信方法
WO2022228068A1 (zh) 电子设备的图像获取方法、装置、系统及电子设备
JP2011082694A (ja) 通信会議システム及び通信装置
CN111163280B (zh) 非对称性视频会议系统及其方法
JP2011055444A (ja) 通信装置
JP2023130837A (ja) 機器システム、音量の調整方法、第二の機器、第一の機器
JP2011164695A (ja) 情報処理装置、入力装置、情報処理方法及び会議システム
WO2019107275A1 (ja) 情報処理装置およびゲーム画像配信方法
US11368611B2 (en) Control method for camera device, camera device, camera system, and storage medium
JP4632132B2 (ja) 語学学習システム
JP2023130822A (ja) 機器システム、撮像装置、表示方法
JP2007221437A (ja) 遠隔会議システム
JP6500366B2 (ja) 管理装置、端末装置、伝送システム、伝送方法およびプログラム
JP6680031B2 (ja) 会議用装置、送信方法、およびコンピュータプログラム
JP2020086667A (ja) 絵本の読み聞かせシステム、スケジュール調整システムおよびプログラム
CN104866208A (zh) 信息处理方法和电子设备