JP6933163B2 - 通信装置、通信システム、通信方法およびプログラム - Google Patents

通信装置、通信システム、通信方法およびプログラム Download PDF

Info

Publication number
JP6933163B2
JP6933163B2 JP2018040798A JP2018040798A JP6933163B2 JP 6933163 B2 JP6933163 B2 JP 6933163B2 JP 2018040798 A JP2018040798 A JP 2018040798A JP 2018040798 A JP2018040798 A JP 2018040798A JP 6933163 B2 JP6933163 B2 JP 6933163B2
Authority
JP
Japan
Prior art keywords
bird
connection destination
connection
eye view
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018040798A
Other languages
English (en)
Other versions
JP2019161258A (ja
Inventor
鳥越 真
真 鳥越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2018040798A priority Critical patent/JP6933163B2/ja
Publication of JP2019161258A publication Critical patent/JP2019161258A/ja
Application granted granted Critical
Publication of JP6933163B2 publication Critical patent/JP6933163B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、通信装置、通信システム、通信方法およびプログラムに関する。
近年、ネットワーク及びマルチメディア伝送技術の発達により、遠隔地のサテライトオフィス同士、または地方のサテライトオフィスと本社を結ぶテレワークの導入が容易となっている。このため、経営改革の一環として、テレワークの導入を推進している企業が増加している。
同一空間で一緒に作業を行っているメンバー間の会話は、あるメンバーが他のメンバーに声をかけ、他のメンバーも自分への声かけを認知することにより開始される。テレワークにおいては、遠隔地のメンバー間の会話が電話で行われる。この電話での会話も、各メンバーが同一空間に存在する感覚で行われることが望ましい。しかし、電話での会話は、一般的に、あるメンバーが電話番号を指定して架電し、他のメンバーの電話機の呼出音が鳴り、他のメンバーが呼出音に気付いて電話を取ることにより開始される。このように開始される会話では、各メンバーが同一空間に存在する感覚を得ることは難しい。
この点に関し、特許文献1には、発呼元ユーザが相手ユーザの名前を声に出すと、音声認識により相手ユーザを特定し、相手ユーザに発呼する電話機が開示されている。
特開2002−33820号公報 特許第5692204号公報
しかし、特許文献1に記載の電話機では、呼び名が同一である複数のユーザが存在する場合に、複数のユーザから発呼先を選択するためのユーザ操作が必要になり得る。各ユーザの呼び名として異なる呼び名を登録しておくことも考えられるが、普段と異なる呼び名の利用は面倒および不自然である。また、各ユーザの呼び名として、相手に対して失礼な呼び名が利用されることも懸念される。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、呼び名が同一である複数のユーザが存在する場合にも、各ユーザが同一空間に存在するかのような感覚でユーザ間の会話が開始されることを支援する、新規かつ改良された通信装置、通信システム、通信方法およびプログラムを提供することにある。
上記課題を解決するために、本発明のある観点によれば、入力音声から、呼び名を含む接続コマンドを検出する音声認識部と、俯瞰映像を受信する受信部と、前記俯瞰映像を出力する映像出力部と、前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択する接続先選択部と、前記接続先選択部により選択された通信装置との接続を処理する接続処理部と、を備え、前記接続先選択部は、前記映像出力部に出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択する、通信装置が提供される。
前記接続先選択部は、前記接続コマンドに含まれる呼び名に関連付けられている2以上の通信装置が前記俯瞰映像の画角内の位置に関連付けられている場合、前記2以上の通信装置の各々に関連付けられている位置に基づき前記接続先を選択してもよい。
前記接続先選択部は、前記2以上の通信装置のうちで、前記俯瞰映像の視点に最も近い位置に関連付けられている通信装置を前記接続先として選択してもよい。
前記通信装置は、各通信装置に関連付けられた位置の第1の物理座標および前記俯瞰映像を取得する俯瞰撮像装置の第2の物理座標を記憶する情報記憶部をさらに備え、前記接続先選択部は、前記2以上の通信装置の各々に関連付けられた位置と前記俯瞰撮像装置との距離を前記第1の物理座標および前記第2の物理座標に基づいて算出し、前記俯瞰撮像装置との距離が最も小さい位置に関連付けられた通信装置を前記接続先として選択してもよい。
前記接続先選択部は、前記俯瞰映像の画角内の位置に関連付けられている2以上の通信装置のうちで、前記俯瞰映像において最も下側の位置に関連付けられている通信装置を前記接続先として選択してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、入力音声から、呼び名を含む接続コマンドを検出する音声認識部と、俯瞰映像を受信する受信部と、前記俯瞰映像を出力する映像出力部と、前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択する接続先選択部と、前記接続先選択部により選択された通信装置との接続を処理する接続処理部と、を備え、前記接続先選択部は、前記映像出力部に出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択する、通信システムが提供される。
また、上記課題を解決するために、本発明の別の観点によれば、入力音声から、呼び名を含む接続コマンドを検出することと、俯瞰映像を受信することと、前記俯瞰映像を出力することと、前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択することと、選択された通信装置との接続を処理することと、を備え、前記接続先を選択することは、出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択することを含む、通信方法が提供される。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、入力音声から、呼び名を含む接続コマンドを検出する音声認識部と、俯瞰映像を受信する受信部と、前記俯瞰映像を出力する映像出力部と、前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択する接続先選択部と、前記接続先選択部により選択された通信装置との接続を処理する接続処理部と、を備え、前記接続先選択部は、前記映像出力部に出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択する、通信装置、として機能させるための、プログラムが提供される。
以上説明した本発明によれば、呼び名が同一である複数のユーザが存在する場合にも、各ユーザが同一空間に存在するかのような感覚でユーザ間の会話が開始されることを支援することが可能である。
本発明の実施形態による遠隔コミュニケーションシステムの構成の一例を示す説明図である。 撮像装置10の構成の一例を示す説明図である。 端末管理サーバ11の構成の一例を示す説明図である。 コミュニケーション端末20の外観構成を示す説明図である。 本発明の実施形態によるコミュニケーション端末20の構成を示す説明図である。 映像出力部240により出力される俯瞰映像の具体例を示す説明図である。 接続コマンドの構成および接続コマンドの検出に用いられる辞書の一例を示す説明図である。 拠点Bの物理空間および俯瞰映像を示す説明図である。 拠点Bの物理空間の平面図である。 拠点Bの物理空間の平面図である。 本発明の実施形態によるコミュニケーション端末20の動作を示すフローチャートである。 コミュニケーション端末20のハードウェア構成を示したブロック図である。 変形例による接続先の選択方法を示す説明図である。
以下に添付図面を参照しながら、本発明の実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成または論理的意義を有する複数の構成を、必要に応じてコミュニケーション端末20A及び20Bのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、複数の構成要素の各々に同一符号のみを付する。例えば、コミュニケーション端末20A及び20Bを特に区別する必要が無い場合には、各コミュニケーション端末を単にコミュニケーション端末20と称する。
<1.遠隔コミュニケーションシステムの概要>
本発明の実施形態は、遠隔する拠点間でのコミュニケーションを実現する遠隔コミュニケーションシステムに関する。以下、図1を参照し、遠隔コミュニケーションシステムの概要を説明する。
図1は、本発明の実施形態による遠隔コミュニケーションシステムの構成の一例を示す説明図である。本発明の実施形態による遠隔コミュニケーションシステムは、図1に示したように、撮像装置10と、コミュニケーション端末20と、端末管理サーバ11と、を有する。
図1は、2か所の拠点間でのコミュニケーションを例示しており、ネットワーク12は、拠点Aに設けられる撮像装置10A及びコミュニケーション端末20Aと、拠点Bに設けられる撮像装置10B及びコミュニケーション端末20Bと、コミュニケーション端末20に関する端末情報を管理する端末管理サーバ11とを接続している。
なお、ネットワーク12は、電話回線網、インターネット、衛星通信網などの公衆回線網や、LAN(Local Aera Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク12は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。
(撮像装置)
撮像装置10は、拠点の俯瞰映像を撮像する機能と、拠点の環境音を収音する機能と、かかる俯瞰映像と環境音とを送信する機能を有する、俯瞰映像撮像装置である。図2は、撮像装置10の構成の一例を示す説明図である。図2に示したように、撮像装置10は、撮像部102と、集音部103と、通信部104を有することができる。
撮像部102は、拠点の映像を撮像する機能を有する。集音部103は、拠点の音声を収音する機能を有する。通信部104は、撮像部102により撮像された俯瞰映像と、集音部103で集音された環境音とを、ネットワーク12を介して他の拠点に送信する機能を有する。
かかる撮像装置10により、拠点Aに設けられる撮像装置10Aは、拠点Aの俯瞰映像及び環境音を、ネットワーク12を介して拠点Bに送信し、同様に、拠点Bに設けられる撮像装置10Bは、拠点Bの俯瞰映像及び環境音を、ネットワーク12を介して拠点Aに送信することができる。ここで、撮像装置10は、撮像部102と集音部103の双方を必ずしも備えなくてもよく、集音部103を備えなくてもよい。また、一方の拠点で撮像した俯瞰映像と、集音した環境音とは、他方の拠点に必ずしも送信されなくてもよい。さらに、集音部103は、オフィスの中央等に設置して必要な音声を収音できるように、撮像部102と分離されてもよい。
なお、図1においては各拠点に2つの撮像装置10が配置される例を示しているが、各拠点に配置される撮像装置10の数は、2つに限定されず、1つであってもよいし、3つ以上であってもよい。
(端末管理サーバ)
端末管理サーバ11は、コミュニケーション端末20に関する端末情報を管理する機能を有する。端末情報は、コミュニケーション端末20のID、コミュニケーション端末20を利用するメンバーの呼び名などの情報、実空間における位置を示す座標データを含む。このような端末管理サーバ11は、図3に示したように、端末情報記憶部112と、端末情報管理部113と、通信部114とを備える。
端末情報記憶部112は、上述した端末情報を記憶する機能を有する。端末情報管理部113は、端末情報記憶部112へ端末情報を記憶させる機能、および端末情報記憶部112から端末情報を検索する機能を有する。通信部114は、ネットワーク12を介した通信を行う機能を有し、例えば、通信部114は、各コミュニケーション端末20に、全てのコミュニケーション端末20についての端末情報を送信する。
このような端末管理サーバ11の機能は、例えば、XMPP(eXtensible Messaging and Presence Protocol)を用いて独立した管理サーバに実装されてもよいし、複数備えられるコミュニケーション端末20のいずれか1つへ実装されてもよいし、複数のコミュニケーション端末20へ分散して実装されてもよい。
(コミュニケーション端末)
コミュニケーション端末20は、複数の拠点間でのコミュニケーションを支援するための通信装置である。例えば、コミュニケーション端末20は、拠点Aにいるコミュニケーション端末20のユーザである対話要求送信側のメンバーが発する音声から、拠点Bに居る対話要求受信側のメンバーに関する名称等を含む接続コマンドを認識すると、対話要求送信側のメンバーと、対話要求受信側のメンバーとが対話できるような状態を確立する。
図4は、コミュニケーション端末20の外観構成を示す説明図である。図4に示したように、コミュニケーション端末20は、映像を取得する撮像部220と、音声を取得する集音部230と、映像出力部240と、音声出力部250とを備える。映像出力部240は、他の拠点の撮像装置10から送信された他の拠点の俯瞰映像を表示し、音声出力部250は、他の拠点の撮像装置10から送信された他の拠点の環境音を出力する。
<2.コミュニケーション端末の構成>
以上、本発明の実施形態による遠隔コミュニケーションシステムの概要を説明した。続いて、図5を参照し、本発明の実施形態によるコミュニケーション端末20の構成をより具体的に説明する。
図5は、本発明の実施形態によるコミュニケーション端末20の構成を示す説明図である。図5に示したように、本発明の実施形態によるコミュニケーション端末20は、撮像部220、通信部224、集音部230、映像出力部240、操作部242、音声出力部250、情報記憶部260、センシング部262、音声認識部264、接続先選択部266および接続処理部268を有する。これらの機能のうちの一部の機能は、図示しないサーバに実装されてもよい。
(撮像部)
撮像部220は、被写体を撮像し、被写体の映像を取得する。撮像部220の撮像方向がコミュニケーション端末20を利用するメンバーに向けられる場合、撮像部220はコミュニケーション端末20を利用するメンバーの映像を取得する。コミュニケーション端末20が他の拠点のコミュニケーション端末20と接続された場合、当該撮像部220により取得されたメンバーの映像が他の拠点のコミュニケーション端末20に通信部224から送信される。
(通信部)
通信部224は、他の装置のインタフェースである。例えば、通信部224は、他の拠点の撮像装置10から他の拠点の俯瞰映像および環境音を受信する受信部としての機能、および通信部224により取得されたメンバーの映像および集音部230により取得されたメンバーの音声を他の拠点のコミュニケーション端末20に送信する送信部としての機能を有する。また、通信部224は、端末管理サーバ11から他の拠点の全てのコミュニケーション端末20の座標データを受信する。
(集音部)
集音部230は、空気振動を電気信号に変換することにより、音声信号を取得する。例えば、集音部230は、コミュニケーション端末20を利用するメンバーが発した音声の音声信号を取得する。なお、本明細書では、説明の便宜上、集音部230により取得される音声信号を単に音声または入力音声と称する場合もある。コミュニケーション端末20が他の拠点のコミュニケーション端末20と接続された場合、当該集音部230により取得されたメンバーの音声が他の拠点のコミュニケーション端末20に通信部224から送信される。
(映像出力部)
映像出力部240は、通信部224により他の拠点の撮像装置10から受信された他の拠点の俯瞰映像を出力する表示部である。コミュニケーション端末20が他の拠点のコミュニケーション端末20と接続された場合には、通信部224により他の拠点のコミュニケーション端末20を利用するメンバーの映像が受信され、当該メンバーの映像が映像出力部240により出力される。
(操作部)
操作部242は、コミュニケーション端末20を利用するメンバーがコミュニケーション端末20に指示や情報を入力するための構成である。操作部242は、例えば、タッチパネルであってもよいし、メンバーのジェスチャーを認識する機能であってもよい。コミュニケーション端末20を利用するメンバーは、操作部242を操作することにより、映像出力部240に出力される俯瞰映像の画角変更、および俯瞰映像の送信元の撮像装置10の切り替え、などを行うことが可能である。ここで、図6を参照して、映像出力部240により出力される俯瞰映像、および操作部242への操作による画角変更の具体例を説明する。
図6は、映像出力部240により出力される俯瞰映像の具体例を示す説明図である。図6の上段には、メンバーM1〜M3を含む俯瞰映像が示されている。当該俯瞰映像の画角には、メンバーM1が利用するコミュニケーション端末20#1、メンバーM2が利用するコミュニケーション端末20#2およびメンバーM3が利用するコミュニケーション端末20#3も含まれている。
図6の下段には、操作部242への操作により、図6の上段において2点鎖線で示した範囲に画角が変更された俯瞰映像を示している。当該俯瞰映像では、メンバーM2およびM3が拡大され、メンバーM1、およびメンバーM1が利用するコミュニケーション端末20#1が含まれなくなっている。
(音声出力部)
音声出力部250は、通信部224により他の拠点の撮像装置10から受信された他の拠点の環境音を出力する。コミュニケーション端末20が他の拠点のコミュニケーション端末20と接続された場合には、通信部224により他の拠点のコミュニケーション端末20を利用するメンバーの音声が受信され、当該メンバーの音声が音声出力部250により出力される。当該音声出力部250は例えばスピーカーで構成され得る。
(情報記憶部)
情報記憶部260は、コミュニケーション端末20のID、およびコミュニケーション端末20を利用するメンバーの情報などの端末情報を記憶する。また、情報記憶部260は、通信部224により端末管理サーバ11から受信される、他の拠点の全てのコミュニケーション端末20の座標データ(第1の物理座標)を含む端末情報、および他の拠点の撮像装置10の座標データ(第2の物理座標)を記憶する。
(センシング部)
センシング部262は、コミュニケーション端末20を利用するメンバーが他の拠点のメンバーへの呼びかけを行い得る状況、すなわち、コミュニケーション端末20を利用するメンバーの対話意思を検出する。例えば、センシング部262は、撮像部220により取得された映像に基づきコミュニケーション端末20を利用するメンバーがコミュニケーション端末20を見ていることを上記対話意思として検出する機能であってもよいし、コミュニケーション端末20を利用するメンバーのジェスチャーまたはタッチ操作から上記対話意思を検出する機能であってもよい。
(音声認識部)
音声認識部264は、センシング部262により対話意思が検出されたことに基づき、集音部230により取得される入力音声の認識処理を開始する。ここで、音声認識部264は、入力音声から、呼び名を含む接続コマンドを検出する。以下、接続コマンドの検出について具体的に説明する。
図7は、接続コマンドの構成および接続コマンドの検出に用いられる辞書の一例を示す説明図である。図7に示したように、名称C12および敬称C14からなる呼び名と、呼出確認C16とを含む。呼び名は、単なる氏名だけでなく、あだ名及び通称等の対話希望先の相手を特定するために通常用いることができるようなものを含む。音声認識部264は、これらの呼び名および呼出確認C16の各々を、接続コマンド辞書J1を参照して検出する。
接続コマンド辞書J1は、名称検出用辞書J12と、敬称検出用辞書J14と、呼出検出用辞書J16とを有する。名称検出用辞書J12に含まれる名称としては、「佐藤」、「鈴木」、「高橋」等が例示され、敬称検出用辞書J14に登録されるフレーズとしては、「さん」、「くん」、「ちゃん」、「部長」等が例示され、呼出確認検出用辞書J16に登録されるフレーズとしては、「ちょっといい?」、「ちょっといいですか?」、「いま時間ある?」等が例示される。
音声認識部264は、入力音声と、上述した接続コマンド辞書J1に予め登録されたコマンド候補とを比較して接続コマンドC1を検出する。そして、検出した接続コマンドに含まれる呼び名を接続先選択部266に出力する。
(接続先選択部)
接続先選択部266は、音声認識部264から出力される呼び名に基づき、他のコミュニケーション端末20から接続先のコミュニケーション端末20を選択する。例えば、接続先選択部266は、情報記憶部260に記憶される他の拠点のコミュニケーション端末20の端末情報を参照し、音声認識部264から出力される呼び名に1つコミュニケーション端末20のみが関連付けられている場合、当該コミュニケーション端末20を接続先として選択する。
一方、音声認識部264から出力される呼び名に複数のコミュニケーション端末20が関連付けられている場合、接続先選択部266は、当該複数のコミュニケーション端末20のうちのいずれかのコミュニケーション端末20を接続先として選択する。ここで、コミュニケーション端末20を利用するメンバーは、対話希望先のメンバーの状況を俯瞰映像で確認した後に当該メンバーへの呼びかけを行うことが想定されるので、当該メンバーは映像出力部240に出力される俯瞰映像に含まれると考えられる。このため、接続先選択部266は、情報記憶部260に各コミュニケーション端末20と関連付けて記憶されている位置に基づき、映像出力部240に出力される俯瞰映像の画角内の位置に関連付けられているコミュニケーション端末20を特定し、当該コミュニケーション端末20を接続先として選択する。かかる構成により、コミュニケーション端末20を利用するメンバーによる明示的な操作無しに、コミュニケーション端末20を利用するメンバーが希望する接続先を適切に選択することが可能となる。
ただし、映像出力部240に出力される俯瞰映像の画角内の位置に2以上のコミュニケーション端末20が関連付けられている場合も起こり得る。この場合、音声認識部264は、2以上のコミュニケーション端末20のうちで、映像出力部240に出力される俯瞰映像の視点(撮像位置)に最も近い位置に関連付けられているコミュニケーション端末20を接続先として選択する。以下、図8〜図10を参照し、このような接続先選択部266による接続先の選択についてより具体的に説明する。
図8は、拠点Bの物理空間および俯瞰映像を示す説明図である。図8の上段は拠点Bの物理空間を示し、図8の上段には拠点Bにおいて業務を行っている6人のメンバーが示されている。6人のメンバーにはメンバーM1〜M3が含まれ、メンバーM1〜M3が利用するコミュニケーション端末20#1〜#3も示されている。
拠点Bの物理空間中の位置は、x、yおよびzの軸で表される3次元の座標データを用いて表現される。各メンバーが利用するコミュニケーション端末20には当該3次元の座標データを用いて表現される位置が関連付けられている。例えば、メンバーM2が利用するコミュニケーション端末20#2の位置は(x1、y1、z1)と表現される。コミュニケーション端末20に関連付けられる位置は、コミュニケーション端末20の位置であってもよいし、コミュニケーション端末20を利用するメンバーの座席付近の位置であってもよい。
図8の下段は、拠点Bの俯瞰映像を示す、俯瞰映像中の位置は、X、Yの軸で表される2次元の座標データを用いて表現される。例えば、メンバーM2が利用するコミュニケーション端末20#2の俯瞰映像における位置は(X1、Y1)と表現される。
図9は、図8を参照して説明した拠点Bの物理空間の平面図である。すなわち、図9は、拠点Bの、図8を参照して説明したxおよびy軸で表現される平面を示す。図9に示した撮像装置10#1および撮像装置10#2から伸びる1点鎖線は、撮像装置10#1および撮像装置10#2の画角を示す。
拠点Aのコミュニケーション端末20において図9に示した撮像装置10#1から送信される俯瞰映像が出力されており、メンバーM1〜M3の呼び名が同一であり、メンバーM1〜M3の呼び名を含む接続コマンドが検出された場合、コミュニケーション端末20の接続先選択部266は、メンバーM1〜M3が利用するコミュニケーション端末20#1〜#3のいずれかのコミュニケーション端末20を接続先として選択する。この時、コミュニケーション端末20#1〜#3の各々に関連付けられている位置P1〜P3はいずれも撮像装置10#1の画角に含まれている。このため、接続先選択部266は、位置P1〜P3の各々と撮像装置10#1の距離d1〜d3を算出し、撮像装置10#1との距離が最も短い位置P1に関連付けられているコミュニケーション端末20#1を接続先として選択する。
同様に、拠点Aのコミュニケーション端末20において図9に示した撮像装置10#2から送信される俯瞰映像が出力されており、メンバーM1〜M3の呼び名が同一であり、メンバーM1〜M3の呼び名を含む接続コマンドが検出された場合、コミュニケーション端末20の接続先選択部266は、メンバーM1〜M3が利用するコミュニケーション端末20#1〜#3のいずれかのコミュニケーション端末20を接続先として選択する。具体的には、位置P1〜P3の各々と撮像装置10#2の距離を算出し、撮像装置10#2との距離が最も短い位置P3に関連付けられているコミュニケーション端末20#3を接続先として選択する。
一方、撮像装置10#1の画角が図10に示すように変更され、メンバーM1〜M3の呼び名が同一であり、メンバーM1〜M3の呼び名を含む接続コマンドが検出された場合、位置P1が撮像装置10#1の画角から外れるので、接続先選択部266は、メンバーM2またはM3が利用するコミュニケーション端末20#2または#3のいずれかのコミュニケーション端末20を接続先として選択する。ここで、接続先選択部266は、位置P2およびP3の各々と撮像装置10#1の距離を算出し、撮像装置10#1との距離が最も短い位置P2に関連付けられているコミュニケーション端末20#2を接続先として選択する。
かかる構成により、コミュニケーション端末20を利用するメンバーは、呼び名が同一である複数のメンバーが存在する場合に、俯瞰映像の画角に対話希望先のメンバーが利用するコミュニケーション端末20が含まれ、当該コミュニケーション端末20が他のメンバーが利用するコミュニケーション端末20よりも俯瞰映像において手前側に位置するように調整することにより、対話希望先のメンバーが利用するコミュニケーション端末20を接続先とすることが可能である。
(接続処理部)
接続処理部268は、コミュニケーション端末20と、音声認識部264により選択された他の拠点のコミュニケーション端末20との接続処理を実行する。その後、コミュニケーション端末20と他の拠点のコミュニケーション端末20との間で映像および音声が送受信され、メンバー間での対話が可能となる。
<3.コミュニケーション端末の動作>
以上、本発明の実施形態によるコミュニケーション端末20の構成を説明した。続いて、図11を参照し、本発明の実施形態によるコミュニケーション端末20の動作を整理する。
図11は、本発明の実施形態によるコミュニケーション端末20の動作を示すフローチャートである。ここでは、動作の特徴を明確にするため、コミュニケーション端末20の動作を中心に説明し、異常系およびエラー系に関する処理フローは省略する。
図11に示したように、まず、メンバーがコミュニケーション端末20を起動すると、コミュニケーション端末20は端末管理サーバ11にコミュニケーション端末20の端末情報を送信し、端末管理サーバ11においてコミュニケーション端末20の端末情報が登録される(S304)。そして、コミュニケーション端末20の通信部224は、端末管理サーバ11から全てのコミュニケーション端末20の端末情報を受信し、情報記憶部260が当該全てのコミュニケーション端末20の端末情報を記憶する(S308)。
続いて、通信部224は、撮像装置10から送信される他の拠点の俯瞰映像を受信し、映像出力部240が当該俯瞰映像を出力する(S312)。その後、例えばコミュニケーション端末20を利用するメンバーの顔が撮像部220により取得された映像に含まれるなど、コミュニケーション端末20を利用するメンバーの対話意思がセンシング部262により検出されると(S316/Yes)、音声認識部264が音声認識を開始する(S320)。当該音声認識は、音声認識部264により接続コマンドが検出されるまで(S324/Yes)、または、タイムアウトが発生するまで(S328/No)、継続される。
接続コマンドが検出され(S324/Yes)、接続コマンドに含まれる呼び名に関連付けられているメンバーが1人である場合(S332/No)、接続先選択部266が当該メンバーに関連付けられているコミュニケーション端末20を接続先として選択し、接続処理部268が当該コミュニケーション端末20との接続処理を実行する(S340)。ただし、接続先のコミュニケーション端末20を利用するメンバーが不在の場合には、コミュニケーション端末20の映像出力部240が相手不在の旨を表示してもよい。
一方、接続コマンドに含まれる呼び名に関連付けられている複数のメンバーが存在する場合(S332/Yes)、音声認識部264は、複数のメンバーの各々が利用するコミュニケーション端末20のうちで、映像出力部240に出力される俯瞰映像の視点(撮像位置)に最も近い位置に関連付けられているコミュニケーション端末20を接続先として選択する(S336)。そして、接続処理部268が当該コミュニケーション端末20との接続処理を実行する(S340)。
コミュニケーション端末20が他のコミュニケーション端末20と接続されると、双方のコミュニケーション端末20の間で映像および音声の送受信が行われ(S344)、メンバー間の対話が実現される。その後、対話終了が検出されれば(S348/Yes)、コミュニケーション端末20は他のコミュニケーション端末20との接続を切断し(S352)、S312からの処理を繰り返す。
<4.作用効果>
以上説明した本発明の実施形態によれば、多様な作用効果が得られる。
例えば、コミュニケーション端末20を利用するメンバーは、呼び名が同一である複数のメンバーが存在する場合に、俯瞰映像の画角に対話希望先のメンバーが利用するコミュニケーション端末20が含まれ、当該コミュニケーション端末20が他のメンバーが利用するコミュニケーション端末20よりも俯瞰映像において手前側に位置するように調整することにより、対話希望先のメンバーが利用するコミュニケーション端末20を接続先とすることが可能である。このため、呼び名が同一である複数のメンバーに普段と異なる呼び名を適用することなく、コミュニケーション端末20を利用するメンバーが意図しないメンバーが利用するコミュニケーション端末20との誤接続の発生を低減することが可能である。普段と異なる呼び名の利用は面倒および不自然であり、相手に対して失礼な呼び名が利用されることも懸念されるところ、本発明の実施形態によればこのような問題を解決することが可能である。
結果、呼び名が同一である複数のメンバーのうちの一人のメンバーに話しかける際に、当該メンバーが異なる拠点にいても、あたかも当該メンバーが隣にいるかのように呼びかけて対話を開始できる。従って、互いに離れたオフィスにいる各メンバーが同一空間に存在するかのような感覚を一層強めることが可能である。
<5.ハードウェア構成>
以上、本発明の実施形態を説明した。上述した音声認識および接続先の選択などの情報処理は、ソフトウェアと、以下に説明するコミュニケーション端末20のハードウェアとの協働により実現される。
図12は、コミュニケーション端末20のハードウェア構成を示したブロック図である。コミュニケーション端末20は、CPU(Central Processing Unit)271と、ROM(Read Only Memory)272と、RAM(Random Access Memory)273と、ホストバス274と、を備える。また、コミュニケーション端末20は、ブリッジ275と、外部バス276と、インタフェース277と、入力装置278と、表示装置279と、音声出力装置280と、ストレージ装置(HDD)281と、ドライブ282と、ネットワークインタフェース283とを備えることができる。
CPU271は、演算処理装置及び制御装置として機能し、各種プログラムに従ってコミュニケーション端末20内の動作全般を制御する。また、CPU271は、マイクロプロセッサであってもよい。ROM272は、CPU271が使用するプログラムや演算パラメータ等を記憶する。RAM273は、CPU271の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバス274により相互に接続されている。CPU271、ROM272及びRAM273とソフトウェアとの協働により、センシング部262、音声認識部264、接続先選択部266、および接続処理部268などの機能が実現され得る。
ホストバス274は、ブリッジ275を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス276に接続されている。なお、必ずしもホストバス274、ブリッジ275及び外部バス276を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
入力装置278は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、センサー、スイッチ及びレバーなどメンバーが情報を入力するための入力手段と、メンバーによる入力に基づいて入力信号を生成し、CPU271に出力する入力制御回路などから構成され得る。コミュニケーション端末20の操作は、通常は、音声による操作を行うが、該入力装置278を操作することにより、コミュニケーション端末20に対して各種のデータを入力したり処理動作を指示することもできる。
表示装置279は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、プロジェクター装置、OLED(Organic Light Emitting Diode)装置及びランプなどの表示装置を含む。表示装置279は、例えば映像出力部240に対応する。また、音声出力装置280は、スピーカー及びヘッドホンなどの音声出力装置を含む。音声出力装置280は、例えば、音声出力部250に対応する。
ストレージ装置281は、本実施形態にかかるコミュニケーション端末20の記憶部の一例として構成されたデータ記憶用の装置である。ストレージ装置281は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置及び記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置281は、例えば、HDD(Hard Disk Drive)やSSD(Solid Strage Drive)、あるいは同等の機能を有するメモリ等で構成される。このストレージ装置281は、ストレージを駆動し、CPU271が実行するプログラムや各種データを記憶する。
ドライブ282は、記憶媒体用リーダライタであり、コミュニケーション端末20に内蔵、あるいは外付けされる。ドライブ282は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体24に記録されている情報を読み出して、RAM273またはストレージ装置281に出力する。また、ドライブ282は、リムーバブル記憶媒体24に情報を書き込むこともできる。
ネットワークインタフェース283は、例えば、ネットワーク12に接続するための通信デバイス等で構成された通信インタフェースである。また、ネットワークインタフェース283は、無線LAN(Local Area Network)対応端末であっても、有線による通信を行うワイヤー端末であってもよい。
<6.変形例>
続いて、本発明の実施形態の幾つかの変形例を説明する。なお、以下に説明する各変形例は、単独で本発明の実施形態に適用されてもよいし、組み合わせで本発明の実施形態に適用されてもよい。また、各変形例は、本発明の実施形態で説明した構成に代えて適用されてもよいし、本発明の実施形態で説明した構成に対して追加的に適用されてもよい。
(第1の変形例)
上記では、映像出力部240に出力される俯瞰映像の視点(撮像位置)に最も近い位置に関連付けられているコミュニケーション端末20を接続先として選択するために、俯瞰映像の視点と各コミュニケーション端末20に関連付けられている位置との2次元での距離を計算する例を説明した。しかし、接続先の選択のための演算はかかる例に限られず、例えば、接続先選択部266は、俯瞰映像の視点と各コミュニケーション端末20に関連付けられている位置との3次元での距離を計算してもよい。
(第2の変形例)
また、接続先の選択のための演算に関し、接続先選択部266は、物理空間における各コミュニケーション端末20に関連付けられている位置でなく、各コミュニケーション端末20に関連付けられている位置の俯瞰映像における投影先の位置を用いてもよい。図8を参照して説明したように、例えば、物理空間において(x1、y1、z1)と表現される位置は、俯瞰映像において(X1、Y1)と表現される。物理空間の座標系における位置から俯瞰映像の座標系における位置への変換は、俯瞰映像を取得する撮像装置10の座標、向きおよびレンズ特性に基づく演算によって実現可能である。当該変換を開示する文献としては、例えば特許第5692204号が挙げられる。
接続先選択部266は、俯瞰映像の座標系に変換された位置に基づき、俯瞰映像において最も下側の位置に関連付けられているコミュニケーション端末20を接続先として選択してもよい。これは、俯瞰映像において下側の位置ほど目視による確認し易さが高いと考えられることに基づく。例えば、図13に示したように、接続先選択部266は、俯瞰映像への投影後の各コミュニケーション端末20に関連付けられた位置P1’〜P3’と俯瞰映像の下端との距離L1〜L3を算出する。そして、接続先選択部266は、俯瞰映像の下端との距離が最も小さい位置P1’に関連付けられているコミュニケーション端末20#1を接続先として選択する。
俯瞰映像の画角が図6に示したように変更された場合、接続先選択部266は、P1’が画角から外れることからP1’に関連付けられている20#1を接続先の候補から除外し、俯瞰映像の下端に最も近い位置P’2に関連付けられている20#2を接続先として選択する。なお、俯瞰映像の座標系における位置を物理空間の座標系における位置から得る例を説明したが、各コミュニケーション端末20に関連付けられた位置として俯瞰映像の座標系における位置のみを管理、運用することで、当該変形例を実現することも可能である。
(第3の変形例)
上記では、本発明の実施形態が2つの拠点に適用される例を説明したが、拠点の数は2つに限定されず、3つ以上の拠点に本発明の実施形態を適用することも可能である。また、各拠点に設けられる撮像装置10の数も2つに限定されず、各拠点には3つ以上の撮像装置10が設けられてもよい。より多くの撮像装置10が設けられることにより、出力する俯瞰映像の切り替えの自由度が高まるので、コミュニケーション端末20を利用するメンバーは他の拠点の様子をより良く伺うことが可能となる。なお、俯瞰映像の切り替えは、音声操作によって実現されてもよい。例えば、拠点Bにおける異なる部門間での俯瞰映像の変更は、コミュニケーション端末20を利用するメンバーが部門名を発することで実現されてもよい。
(その他)
なお、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、本発明の実施形態は、オフィス間におけるテレワークシステムのコミュニケーション端末20として利用でき、さらに、オフィスとオフィス外の業務空間との間、及びオフィス外の業務空間同士を結ぶシステムにおいても利用可能である。オフィス外の業務空間とは、例えば、在宅勤務者が業務を行う自宅の業務スペース等が挙げられる。
また、本明細書のコミュニケーション端末20の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、コミュニケーション端末20の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、コミュニケーション端末20に内蔵されるCPU、ROMおよびRAMなどのハードウェアに、上述したコミュニケーション端末20の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。また、図5で示した機能ブロックの一部をハードウェアで構成することもできる。
10 撮像装置
102 撮像部
103 集音部
104 通信部
11 端末管理サーバ
112 端末情報記憶部
113 端末情報管理部
114 通信部
12 ネットワーク
20 コミュニケーション端末
220 撮像部
224 通信部
230 集音部
240 映像出力部
242 操作部
250 音声出力部
260 情報記憶部
262 センシング部
264 音声認識部
266 接続先選択部
268 接続処理部

Claims (8)

  1. 入力音声から、呼び名を含む接続コマンドを検出する音声認識部と、
    俯瞰映像を受信する受信部と、
    前記俯瞰映像を出力する映像出力部と、
    前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択する接続先選択部と、
    前記接続先選択部により選択された通信装置との接続を処理する接続処理部と、
    を備え、
    前記接続先選択部は、前記映像出力部に出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択する、通信装置。
  2. 前記接続先選択部は、前記接続コマンドに含まれる呼び名に関連付けられている2以上の通信装置が前記俯瞰映像の画角内の位置に関連付けられている場合、前記2以上の通信装置の各々に関連付けられている位置に基づき前記接続先を選択する、請求項1に記載の通信装置。
  3. 前記接続先選択部は、前記2以上の通信装置のうちで、前記俯瞰映像の視点に最も近い位置に関連付けられている通信装置を前記接続先として選択する、請求項2に記載の通信装置。
  4. 前記通信装置は、各通信装置に関連付けられた位置の第1の物理座標および前記俯瞰映像を取得する俯瞰撮像装置の第2の物理座標を記憶する情報記憶部をさらに備え、
    前記接続先選択部は、前記2以上の通信装置の各々に関連付けられた位置と前記俯瞰撮像装置との距離を前記第1の物理座標および前記第2の物理座標に基づいて算出し、前記俯瞰撮像装置との距離が最も小さい位置に関連付けられた通信装置を前記接続先として選択する、請求項3に記載の通信装置。
  5. 前記接続先選択部は、前記俯瞰映像の画角内の位置に関連付けられている2以上の通信装置のうちで、前記俯瞰映像において最も下側の位置に関連付けられている通信装置を前記接続先として選択する、請求項3に記載の通信装置。
  6. 入力音声から、呼び名を含む接続コマンドを検出する音声認識部と、
    俯瞰映像を受信する受信部と、
    前記俯瞰映像を出力する映像出力部と、
    前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択する接続先選択部と、
    前記接続先選択部により選択された通信装置との接続を処理する接続処理部と、
    を備え、
    前記接続先選択部は、前記映像出力部に出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択する、通信システム。
  7. 入力音声から、呼び名を含む接続コマンドを検出することと、
    俯瞰映像を受信することと、
    前記俯瞰映像を出力することと、
    前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択することと、
    選択された通信装置との接続を処理することと、
    を備え、
    前記接続先を選択することは、出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択することを含む、通信方法。
  8. コンピュータを、
    入力音声から、呼び名を含む接続コマンドを検出する音声認識部と、
    俯瞰映像を受信する受信部と、
    前記俯瞰映像を出力する映像出力部と、
    前記接続コマンドに含まれる呼び名に複数の通信装置が関連付けられている場合、前記複数の通信装置のうちのいずれかの通信装置を接続先として選択する接続先選択部と、
    前記接続先選択部により選択された通信装置との接続を処理する接続処理部と、
    を備え、
    前記接続先選択部は、前記映像出力部に出力される前記俯瞰映像の画角内の位置に関連付けられている通信装置を前記接続先として選択する、通信装置、として機能させるための、プログラム。




JP2018040798A 2018-03-07 2018-03-07 通信装置、通信システム、通信方法およびプログラム Active JP6933163B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018040798A JP6933163B2 (ja) 2018-03-07 2018-03-07 通信装置、通信システム、通信方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018040798A JP6933163B2 (ja) 2018-03-07 2018-03-07 通信装置、通信システム、通信方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2019161258A JP2019161258A (ja) 2019-09-19
JP6933163B2 true JP6933163B2 (ja) 2021-09-08

Family

ID=67993694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018040798A Active JP6933163B2 (ja) 2018-03-07 2018-03-07 通信装置、通信システム、通信方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6933163B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09331385A (ja) * 1996-06-12 1997-12-22 Hitachi Ltd 音声画像通信システムおよび画像情報検索システム
JPH1127363A (ja) * 1997-07-02 1999-01-29 Fujitsu Ten Ltd 電話機
JP2010183205A (ja) * 2009-02-03 2010-08-19 Panasonic Electric Works Co Ltd 通話システム
JP5471615B2 (ja) * 2010-03-05 2014-04-16 沖電気工業株式会社 遠隔対話装置、遠隔対話システム、遠隔対話方法およびプログラム

Also Published As

Publication number Publication date
JP2019161258A (ja) 2019-09-19

Similar Documents

Publication Publication Date Title
KR101521363B1 (ko) 엔터테인먼트 디바이스들 및 시스템들의 음향 관리를 위한 기술들
WO2016185809A1 (ja) 情報処理装置、情報処理方法およびプログラム
WO2014192552A1 (ja) 表示制御装置、表示制御方法及びコンピュータプログラム
JP2012040655A (ja) ロボット制御方法、プログラム、及びロボット
JP6417787B2 (ja) 表示装置、伝送システムおよび伝送方法
KR20220104772A (ko) 인터랙션 방법 및 전자기기
JP2015070543A (ja) 伝送端末、伝送方法、及びプログラム
JP2017144521A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2015225400A (ja) 通信システム、転送制御装置、通信方法およびプログラム
JP6260201B2 (ja) 伝送端末、伝送方法、及びプログラム
JP5929698B2 (ja) 通信システムおよびプログラム
US20200162617A1 (en) Communication system, non-transitory computer-readable medium, and terminal apparatus
JP6933163B2 (ja) 通信装置、通信システム、通信方法およびプログラム
JP7361460B2 (ja) コミュニケーション装置、コミュニケーションプログラム、及びコミュニケーション方法
JP7047520B2 (ja) 管理装置、方法、プログラムおよび管理システム
JP6787078B2 (ja) 通信装置、方法およびプログラム
US20230280961A1 (en) Device management system, information processing system, information processing device, device management method, and non-transitory recording medium
US20120300126A1 (en) Electronic apparatus and tv phone method
US20240098183A1 (en) Marking method on image combined with sound signal, terminal apparatus, and server
JP7400301B2 (ja) 通信管理サーバ、通信システム、送信装置、通信方法、及びプログラム
JP6897451B2 (ja) 端末、プログラム、通信方法及び通信システム
JP2018060297A (ja) 会議端末、マイク選択方法、及び、プログラム
JP2017143588A (ja) 情報処理装置、情報処理方法、プログラムおよびネットワークシステム
JP7035686B2 (ja) 遠隔通話装置、遠隔通話プログラム、及び遠隔通話方法
JP2024025003A (ja) 記録情報作成システム、情報処理システム、プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210720

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210802

R150 Certificate of patent or registration of utility model

Ref document number: 6933163

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150