JP2017102516A - 表示装置、通信システム、表示装置の制御方法、及び、プログラム - Google Patents

表示装置、通信システム、表示装置の制御方法、及び、プログラム Download PDF

Info

Publication number
JP2017102516A
JP2017102516A JP2015232821A JP2015232821A JP2017102516A JP 2017102516 A JP2017102516 A JP 2017102516A JP 2015232821 A JP2015232821 A JP 2015232821A JP 2015232821 A JP2015232821 A JP 2015232821A JP 2017102516 A JP2017102516 A JP 2017102516A
Authority
JP
Japan
Prior art keywords
data
unit
utterance
display
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015232821A
Other languages
English (en)
Inventor
和夫 西沢
Kazuo Nishizawa
和夫 西沢
小林 伸一
Shinichi Kobayashi
伸一 小林
高野 正秀
Masahide Takano
正秀 高野
勇一 毛利
Yuichi Mori
勇一 毛利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2015232821A priority Critical patent/JP2017102516A/ja
Publication of JP2017102516A publication Critical patent/JP2017102516A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】使用者が装着する表示装置と、外部の装置との間で、音声に基づく情報提供等を行うための伝送処理を効率化する。【解決手段】HMD100は、使用者の頭部に装着され、画像を表示する画像表示部20と、データを送受信する通信部117とを備える。音声を検出して、検出した音声から発話データを生成する音声処理部187を備える。音声処理部187により生成した発話データ、または、発話データを解析して得られる発話解析データを通信部117により送信させ、通信部117により発話データまたは発話解析データを受信する通信制御部170を備える。通信部117により受信した発話データまたは発話解析データに基づく画像を画像表示部20に表示させる表示制御部190を備える。【選択図】図4

Description

本発明は、表示装置、通信システム、表示装置の制御方法、及び、プログラムに関する。
従来、ヘッドマウントディスプレイ(Head Mounted Display:HMD)等の表示装置を利用して、音声や映像を提供する例が知られている(例えば、特許文献1参照)。特許文献1は、作業者が装着するHMDがカメラ、マイク、イヤホンを備え、カメラで撮像した画像を遠隔地のホストPCに送信する。また、遠隔地のホストPCを操作する指示者が、作業者に対して映像や音声で作業指示を行う。
特開2008−113317号公報
特許文献1記載のシステムでは、HMDから映像を送信し、HMDに対して音声を提供する。映像や音声を送受信する場合、送受信するデジタルデータのデータ量が比較的大きくなることから、通信路の伝送帯域を確保する必要が生じる。また、映像や音声の送信時に遅延が生じると、映像や音声の出力タイミングがずれることによって、使用者に違和感を与える可能性があり、意思伝達が滞る可能性がある。
本発明は上記事情に鑑みてなされたものであり、使用者が装着する表示装置と、外部の装置との間で、音声に基づく情報提供等を行うための伝送処理を効率化することを目的とする。
上記目的を達成するために、本発明の表示装置は、使用者の頭部に装着され、画像を表示する表示部と、データを送受信する通信部と、音声を検出して、検出した音声から発話データを生成する音声処理部と、前記音声処理部により生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを前記通信部により送信させ、前記通信部により前記発話データまたは前記発話解析データを受信する通信制御部と、前記通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記表示部に表示させる表示制御部と、を備えることを特徴とする。
本発明によれば、使用者の頭部に装着される表示装置が、音声を検出して発話データ、または発話データを解析した発話解析データを送信する。また、発話データ、または発話データを受信して、発話データまたは発話データに基づく表示を行える。これにより、表示装置を装着する使用者の音声を発話データまたは発話解析データとして、他の表示装置や、コンピューター等の外部の装置に送信できる。また、発話データまたは発話解析データを受信して、例えば文字や画像等を表示できる。従って、表示装置と外部の装置との間で、音声に基づくデータを効率よく送受信し、表示装置を装着する使用者に対する音声による情報の提供、及び、使用者の音声に基づく情報の発信を効率化できる。
また、本発明は、上記表示装置において、前記音声処理部は、検出した音声から発話データを生成し、生成した発話データに対し認識処理を実行し、認識結果を前記発話解析データとして出力すること、を特徴とする。
本発明によれば、検出した音声認識処理の結果を含む発話解析データを出力するので、表示装置を装着する使用者の音声を、例えばテキストを含む発話解析データとして、他の表示装置や、コンピューター等の外部の装置に送信できる。従って、表示装置から外部の装置に対し、表示装置を装着する使用者の音声に関する情報の発信を効率化できる。
また、本発明は、上記表示装置において、前記表示制御部は、音声コマンドによる操作を行うための音声操作用インターフェイスを表示し、前記音声処理部は、前記表示制御部により前記音声操作用インターフェイスを表示する間に検出した音声が音声コマンドに該当するか否かを判定し、音声コマンドに該当する場合に前記音声操作用インターフェイスで表示された項目に対する操作を検出すること、を特徴とする。
本発明によれば、音声コマンドにより表示装置を操作することができ、操作性の向上を図ることができる。
また、本発明は、上記表示装置において、音声を出力する音声出力部を備え、前記音声処理部は、前記通信部により受信した前記発話データまたは前記発話解析データに基づく音声を前記音声出力部によって出力すること、を特徴とする。
本発明によれば、使用者が装着する表示装置が、発話データまたは発話解析データを受信して音声を出力するので、使用者に対して音声による情報提供や指示を行うことができる。
また、本発明は、上記表示装置において、前記通信部により受信した前記発話データまたは前記発話解析データを、他の言語の前記発話データまたは前記発話解析データに変換する言語処理部を備えること、を特徴とする。
本発明によれば、発話データまたは発話解析データを受信して他の言語のデータに変換できる。このため、受信した発話データまたは発話解析データの言語と使用者が使用する言語とが異なる場合であっても、使用者に対し音声による情報提供や指示を行うことができる。
また、本発明は、上記表示装置において、前記音声処理部が音声を検出するか否か、前記音声出力部の音声出力をするか否か、前記通信部により前記発話データまたは前記発話解析データを送信する送信先、及び、前記通信部により前記発話データまたは前記発話解析データを受信する受信元の少なくともいずれかが異なる複数の動作モードを、切り替えて実行する動作モード制御部を備え、前記音声処理部、及び、前記通信制御部のうち少なくともいずれかは、前記動作モード制御部が実行する動作モードに対応する設定に従って動作すること、を特徴とする。
本発明によれば、動作モードを切り替えることにより、音声を検出するか否か、音声出力をするか否か、発話データまたは発話解析データを送信する送信先、及び、発話データまたは発話解析データを受信する受信元等を切り替えることができる。
また、本発明は、上記表示装置において、前記使用者に割り当てられる権限と、前記動作モード制御部が実行可能な動作モードとを対応付ける設定情報を記憶する記憶部を備え、前記動作モード制御部は、前記表示部を装着する使用者の権限を判定し、前記設定情報において、判定した権限に対応付けられた動作モードを実行すること、を特徴とする。
本発明によれば、使用者の権限に対応して、例えば一部の機能の実行を制限することができる。これにより、表示装置が多機能化した場合であっても、機能の利用範囲を適切に制限できる。
また、本発明は、上記表示装置において、操作を検出する操作検出部を備え、前記動作モード制御部は、前記操作検出部で検出する操作に応じて動作モードを切り替えること、を特徴とする。
本発明によれば、使用者の操作に応じて、速やかに動作モードを切り替えることができる。
また、本発明は、上記表示装置において、前記表示部に取り付けられて音声を集音する集音部を備え、前記音声処理部は前記集音部により集音された音声を検出すること、を特徴とする。
本発明によれば、表示部に取り付けられた集音部により音声を集音し、発話データまたは発話解析データを送信できる。
また、本発明は、上記表示装置において、前記集音部は前記表示部に対する相対位置を変位可能に構成され、前記動作モード制御部は、前記表示部に対する前記集音部の相対位置に対応して、動作モードを切り替えること、を特徴とする。
本発明によれば、表示部に取り付けられた集音部の位置の変化により、動作モードを切り替えることができる。
また、本発明は、上記表示装置において、前記音声処理部は、前記集音部の種類を判定し、判定した前記集音部の種類に応じて、前記集音部により集音された音声から前記発話データまたは前記発話解析データを生成する処理の設定を切り替えること、を特徴とする。
本発明によれば、集音部の種類に対応する設定を行うことで、発話データまたは発話解析データを生成する処理を効率よく適切に実行できる。
また、本発明は、上記表示装置において、撮像部を備え、前記通信制御部は、前記撮像部で撮像した撮像画像データを含む会議データ、または、前記撮像画像データと前記発話データとを含む会議データを前記通信部により送信すること、を特徴とする。
本発明によれば、撮像した画像データを外部の装置に送信できる。
また、本発明は、上記表示装置において、前記表示制御部は、前記通信部により受信された前記会議データに含まれる前記撮像画像データに基づく画像を前記表示部により表示すること、を特徴とする。
本発明によれば、画像データを受信して表示を行うことができるので、使用者に対し、音声と映像による情報提供や指示を行うことができる。
上記目的を達成するために、本発明の通信システムは、第1表示装置、及び、第2表示装置を通信可能に接続し前記第1表示装置は、使用者の頭部に装着され、画像を表示する第1表示部と、第1通信部と、音声を検出して、検出した音声から発話データを生成する第1音声処理部と、前記第1音声処理部により生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを前記第1通信部により送信させ、前記第1通信部により前記発話データまたは前記発話解析データを受信する第1通信制御部と、前記第1通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記第1表示部に表示させる第1表示制御部と、を備え、前記第2表示装置は、使用者の頭部に装着され、画像を表示する第2表示部と、第2通信部と、音声を検出して、検出した音声から発話データを生成する第2音声処理部と、前記第2音声処理部により生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを前記第1通信部により送信させ、前記第2通信部により前記発話データまたは前記発話解析データを受信する第2通信制御部と、前記第2通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記第2表示部に表示させる第2表示制御部と、を備えること、を特徴とする。
本発明によれば、使用者の頭部に装着される表示装置が、音声を検出して発話データ、または発話データを解析した発話解析データを送信する。また、発話データ、または発話データを受信して、発話データまたは発話データに基づく表示を行える。これにより、表示装置を装着する使用者の音声を、例えばテキストを含む発話データまたは発話解析データとして、他の表示装置や、コンピューター等の外部の装置に送信できる。また、発話データまたは発話解析データを受信して、例えば文字や画像等を表示できる。従って、表示装置と外部の装置との間で、音声に基づくデータを効率よく送受信し、表示装置を装着する使用者に対する音声による情報の提供、及び、使用者の音声に基づく情報の発信を効率化できる。
上記目的を達成するために、本発明は、使用者の頭部に装着され、画像を表示する表示部を備えた表示装置の制御方法であって、音声を検出して、検出した音声から発話データを生成し、生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを通信部により送信し、前記通信部により前記発話データまたは前記発話解析データを受信し、前記通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記表示部に表示すること、を特徴とする。
本発明によれば、使用者の頭部に装着される表示装置が、音声を検出して発話データ、または発話データを解析した発話解析データを送信する。また、発話データ、または発話データを受信して、発話データまたは発話データに基づく表示を行える。これにより、表示装置を装着する使用者の音声を、例えばテキストを含む発話データまたは発話解析データとして、他の表示装置や、コンピューター等の外部の装置に送信できる。また、発話データまたは発話解析データを受信して、例えば文字や画像等を表示できる。従って、表示装置と外部の装置との間で、音声に基づくデータを効率よく送受信し、表示装置を装着する使用者に対する音声による情報の提供、及び、使用者の音声に基づく情報の発信を効率化できる。
上記目的を達成するために、本発明は、使用者の頭部に装着され、画像を表示する表示部を備えた表示装置を制御するコンピューターが実行可能なプログラムであって、前記コンピューターにより、音声を検出して、検出した音声から発話データを生成し、生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを通信部により送信し、前記通信部により前記発話データまたは前記発話解析データを受信し、前記通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記表示部に表示すること、を特徴とする。
本発明によれば、使用者の頭部に装着される表示装置が、音声を検出して発話データ、または発話データを解析した発話解析データを送信する。また、発話データ、または発話データを受信して、発話データまたは発話データに基づく表示を行える。これにより、表示装置を装着する使用者の音声を、例えばテキストを含む発話データまたは発話解析データとして、他の表示装置や、コンピューター等の外部の装置に送信できる。また、発話データまたは発話解析データを受信して、例えば文字や画像等を表示できる。従って、表示装置と外部の装置との間で、音声に基づくデータを効率よく送受信し、表示装置を装着する使用者に対する音声による情報の提供、及び、使用者の音声に基づく情報の発信を効率化できる。
また、本発明は、このプログラムを記憶した記憶媒体として構成してもよい。
実施形態の表示システムの概略構成図。 頭部装着型表示装置の外観構成を示す図。 画像表示部の光学系の構成を示す図。 頭部装着型表示装置の機能ブロック図。 管理サーバーの機能ブロック図。 頭部装着型表示装置の動作を示すフローチャート。 頭部装着型表示装置の動作を示すフローチャート。 頭部装着型表示装置の表示例を示す図。 頭部装着型表示装置の動作を示すフローチャート。 頭部装着型表示装置の動作を示すフローチャート。 通信システムの動作を示すフローチャート。 頭部装着型表示装置の動作を示すフローチャート。 第2実施形態の頭部装着型表示装置の外観構成を示す図。
[第1実施形態]
図1は、本発明を適用した実施形態に係る表示システム1の概略構成図である。
表示システム1は、複数の拠点に配置されたHMD100を、通信ネットワーク4を介して相互に通信可能に接続したシステムである。通信システム1を構成するHMD100の数や配置に制限はない。本実施形態では、一例として、図1に示すように拠点Aに2つのHMD100があり、拠点Bに2つのHMD100があり、拠点Aと拠点Bとの間に通信ネットワーク4が敷設された構成を例示する。拠点AのHMD100を、それぞれHMD100−1、HMD100−2とし、拠点BのHMD100を、それぞれHMD100−3、HMD100−4とする。HMD100−1〜HMD100−4は、後述するように共通の構成を有するので、HMD100−1〜HMD100−4を区別する必要のない場合はHMD100と表記する。拠点中継装置5Aと拠点中継装置5Bについても同様である。
拠点A及び拠点Bのそれぞれには拠点中継装置5が配置される。拠点Aに配置される拠点中継装置5Aは、拠点AにおいてHMD100−1及びHMD100−2に対し無線通信を実行する。拠点中継装置5Aは、HMD100−1とHMD100−2との間の通信を中継する機能を有する。また、拠点中継装置5Aは、HMD100−1及びHMD100−2と、通信ネットワーク4との間の通信を中継する機能を有する。
拠点Bに配置される拠点中継装置5Bは、拠点BにおいてHMD100−3及びHMD100−4に対し無線通信を実行する。拠点中継装置5Bは、HMD100−3とHMD100−4との間の通信を中継する機能を有する。また、拠点中継装置5Bは、HMD100−3及びHMD100−4と、通信ネットワーク4との間の通信を中継する機能を有する。HMD100−1とHMD100−2、及び、HMD100−3とHMD100−4とが、例えば無線LAN(Wi−Fi(登録商標))のアドホックモードで直接通信を行うことが可能な構成としてもよいが、本実施形態では拠点中継装置5A、5Bが通信を中継する構成を例示する。
通信ネットワーク4には管理サーバー3が接続される。管理サーバー3は、通信システム1を構成する拠点中継装置5A、5B及びHMD100−1〜HMD100−4について、データの送受信に係る設定情報を記憶する。管理サーバー3は、HMD100−1〜HMD100−4のいずれかから情報の送信を要求された場合に、要求された情報を送信する。
通信ネットワーク4は、公衆回線網、専用線、携帯電話回線を含む無線通信回線、及び、これらの回線のバックボーン通信回線など、各種の通信回線またはその組合せで実現され、その具体的構成は限定されない。通信ネットワーク4は、遠隔地を接続できる広域通信回線網であってもよいし、特定の施設や建物内に敷設されたLAN(Local Area Network)であってもよい。また、通信ネットワーク4、上記各種通信回線を接続するサーバー装置、ゲートウェイ装置、ルーター装置等のネットワーク機器を含んでもよい。また、通信ネットワーク4が複数の通信回線で構成されてもよい。
通信システム1では、拠点AにおいてHMD100−1、HMD100−2を装着する各々の使用者と、拠点BにおいてHMD100−3、HMD100−4を装着する各々の使用者との間で、音声や映像を含むデータを送受信することが可能である。これにより、通信システム1は、拠点Aと拠点Bとの間を結び、例えば遠隔会議を行うことが可能である。また、拠点Aにおいては、HMD100−1とHMD100−2との間で音声野営像を含むデータを送受信して、使用者間で情報を共有できる。拠点Bにおいても、HMD100−3とHMD100−4との間で音声や映像を含むデータを送受信して、情報を共有できる。
通信システム1の用途は、例えば、拠点Aから拠点Bへ、或いはその逆方向に情報を提供する用途であれば、制限はない。以下では一例として、通信システム1により、拠点Aと拠点Bとを結ぶ遠隔会議を行う場合について説明する。なお、拠点Aと拠点Bとは異なる場所であればよく、遠隔地に限らない。
図2は、HMD100の外観構成を示す図である。HMD100は、図1に示すように使用者が頭部に装着する表示装置であり、頭部装着型表示装置(ヘッドマウントディスプレイ、Head Mounted Display)とも呼ばれる。HMD100は、使用者が、虚像を視認すると同時に外景も直接視認可能な光学透過型のHMDである。なお、以下の説明では、HMD100によって使用者が視認する虚像を便宜的に「表示画像」とも呼ぶ。また、画像データに基づいて生成された画像光を射出することを「画像を表示する」ともいう。
HMD100は、使用者の頭部に装着された状態で使用者に虚像を視認させる画像表示部20と、画像表示部20を制御する制御装置10と、を備える表示装置である。制御装置10は、使用者がHMD100を操作するコントローラーとしても機能する。
画像表示部20は、使用者の頭部に装着される装着体であり、本実施形態では眼鏡形状を有する。画像表示部20は、右保持部21と、右表示駆動部22と、左保持部23と、左表示駆動部24と、右光学像表示部26と、左光学像表示部28と、カメラ61(撮像部)と、マイク63(集音部)とを備える。右光学像表示部26及び左光学像表示部28は、それぞれ、使用者が画像表示部20を装着した際に使用者の右及び左の眼前に位置するように配置されている。右光学像表示部26の一端と左光学像表示部28の一端とは、使用者が画像表示部20を装着した際の使用者の眉間に対応する位置で、互いに連結される。
右保持部21は、右光学像表示部26の他端である端部ERから、使用者が画像表示部20を装着した際の使用者の側頭部に対応する位置にかけて、延伸して設けられた部材である。同様に、左保持部23は、左光学像表示部28の他端である端部ELから、使用者が画像表示部20を装着した際の使用者の側頭部に対応する位置にかけて、延伸して設けられた部材である。右保持部21及び左保持部23は、眼鏡のテンプル(つる)のようにして、使用者の頭部に画像表示部20を保持する。
右表示駆動部22と左表示駆動部24とは、使用者が画像表示部20を装着した際の使用者の頭部に対向する側に配置されている。なお、右表示駆動部22及び左表示駆動部24を総称して単に「表示駆動部」とも呼び、右光学像表示部26及び左光学像表示部28を総称して単に「光学像表示部」とも呼ぶ。
表示駆動部22,24は、液晶ディスプレイ241,242(Liquid Crystal Display、以下「LCD241,242」と呼ぶ)、図3〜図4を参照して後述する投写光学系251,252等を含む。
右光学像表示部26及び左光学像表示部28は、導光板261,262(図3)と、調光板20Aとを備える。導光板261,262は、光透過性の樹脂等によって形成され、表示駆動部22,24が出力する画像光を、使用者の眼に導く。調光板20Aは、薄板状の光学素子であり、使用者の眼の側とは反対の側である画像表示部20の表側を覆うように配置される。調光板20Aは、光透過性がほぼ無いもの、透明に近いもの、光量を減衰させて光を透過するもの、特定の波長の光を減衰又は反射するもの等、種々のものを用いることができる。調光板20Aの光学特性(光透過率など)を適宜選択することにより、外部から右光学像表示部26及び左光学像表示部28に入射する外光量を調整して、虚像の視認のしやすさを調整できる。本実施形態では、少なくとも、HMD100を装着した使用者が外の景色を視認できる程度の光透過性を有する調光板20Aを用いる場合について説明する。調光板20Aは、右導光板261及び左導光板262を保護し、右導光板261及び左導光板262の損傷や汚れの付着等を抑制する。
調光板20Aは、右光学像表示部26及び左光学像表示部28に対し着脱可能としてもよく、複数種類の調光板20Aを交換して装着可能としてもよいし、省略してもよい。
カメラ61は、画像表示部20の前面の中央位置に配置される。カメラ61は、CCDやCMOS等の撮像素子及び撮像レンズ等を備えるデジタルカメラである。カメラ61をステレオカメラで構成してもよい。カメラ61は、HMD100の表側方向、換言すれば、HMD100を装着した状態における使用者の視界方向の少なくとも一部の外景(実空間)を撮像する。別の表現では、カメラ61は、使用者の視界と重なる範囲または方向を撮像し、使用者が注視する方向を撮像するということもできる。カメラ61の画角の広さは適宜設定可能であるが、本実施形態では、後述するように、使用者が右光学像表示部26、左光学像表示部28を通して視認する外界を含む。さらに、調光板20Aを通した使用者の視界の全体を撮像できるようにカメラ61の撮像範囲が設定されているとより好ましい。
カメラ61は、制御部140が備える撮像制御部161(図4)の制御に従って撮像を実行し、撮像画像データを撮像制御部161に出力する。
マイク63は、例えば図1に示すように、マイク63の集音部が使用者の視線方向を向くように配置され、音声を集音して、音声信号を音声処理部187(図4)に出力する。マイク63は、例えばモノラルマイクであってもステレオマイクであってもよく、指向性を有するマイクであってもよいし、無指向性のマイクであってもよい。また、マイク63を、使用者の頸部に接触する骨伝導マイクで構成してもよい。本実施形態では、マイク63が指向性マイクで構成される例を示す。
また、画像表示部20は、使用者が手で操作可能なミュートスイッチ65を備える。ミュートスイッチ65は、押圧操作を検出するプッシュボタンスイッチや、タッチ操作を検出するタッチセンサーなどで構成される。図2の例では右保持部21の外側の側面に配置され、使用者が右手で容易に操作できる。左保持部23の外側の面や、画像表示部20の前面などに設けてもよい。
右表示駆動部22において使用者の頭部側の面、すなわち内側の面には、スピーカー68が配置される。また、左表示駆動部24において使用者の頭部側の面、すなわち内側の面には、スピーカー69が配置される。一対のスピーカー68、69(音声出力部)は、後述する音声処理部187から入力される音声信号に基づいて音声を出力する。ここで、スピーカー68、69は、イヤホンやヘッドホンで構成してもよいし、オープン型のスピーカーであってもよいが、画像表示部20の装着状態において使用者の頭部に接触する骨伝導スピーカーであることが好ましい。
ここで、HMD100は、予め設定された測定方向に位置する測定対象物までの距離を検出する距離センサー(図示略)を備えてもよい。距離センサーは、例えば、右光学像表示部26と左光学像表示部28との境目部分に配置される。この場合、使用者が画像表示部20を装着した状態で、距離センサー64の位置は、水平方向においては使用者の両眼のほぼ中間であり、鉛直方向においては使用者の両眼より上である。距離センサー64の測定方向は、例えば、HMD100の表側方向で、カメラ61の撮像方向と重複する方向とすることができる。
距離センサーは、例えば、LEDやレーザーダイオード等の光源と、光源が発する光が測定対象物に反射する反射光を受光する受光部とを有する構成とすることができる。距離センサーは、制御部140の制御に従い、三角測距処理や時間差に基づく測距処理を実行すればよい。また、距離センサーは、超音波を発する音源と、測定対象物で反射する超音波を受信する検出部とを備える構成としてもよい。この場合、距離センサーは、制御部140の制御に従い、超音波の反射までの時間差に基づき測距処理を実行すればよい。
図3は、画像表示部20が備える光学系の構成を示す要部平面図である。図2には説明のため使用者の左眼LE及び右眼REを図示する。
左表示駆動部24は、左バックライト222、左LCD242、及び、左投写光学系252を備える。左バックライト222は、LED等の光源と拡散板とを有する。左LCD242は、左バックライト222の拡散板から発せられる光の光路上に配置される透過型のLCDである。左投写光学系252は、左LCD242を透過した画像光Lを導くレンズ群等を備える。左LCD242は、複数の画素をマトリクス状に配置した透過型液晶パネルである。
左投写光学系252は、左LCD242から射出された画像光Lを並行状態の光束にするコリメートレンズを有する。コリメートレンズにより並行状態の光束にされた画像光Lは、左導光板262に入射される。左導光板262は、画像光Lを反射する複数の反射面が形成されたプリズムであり、画像光Lは、左導光板262の内部において複数回の反射を経て左眼LE側に導かれる。左導光板262には、左眼LEの眼前に位置するハーフミラー262A(反射面)が形成される。
ハーフミラー262Aで反射した画像光Lは左眼LEに向けて左光学像表示部28から射出され、この画像光Lが左眼LEの網膜に像を結び、使用者に画像を視認させる。
右表示駆動部22は、左表示駆動部24と左右対称に構成される。右表示駆動部22は、右バックライト221、右LCD241、及び、右投写光学系251を備える。右バックライト221は、LED等の光源と拡散板とを有する。右LCD241は、右バックライト221の拡散板から発せられる光の光路上に配置される透過型のLCDである。右投写光学系251は、右LCD241を透過した画像光Lを導くレンズ群等を備える。右LCD241は、複数の画素をマトリクス状に配置した透過型液晶パネルである。
右投写光学系251は、右LCD241から射出された画像光Lを並行状態の光束にするコリメートレンズを有する。コリメートレンズにより並行状態の光束にされた画像光Lは、右導光板261に入射される。右導光板261は、画像光Lを反射する複数の反射面が形成されたプリズムであり、画像光Lは、右導光板261の内部において複数回の反射を経て右眼RE側に導かれる。右導光板261には、右眼REの眼前に位置するハーフミラー261A(反射面)が形成される。
ハーフミラー261Aで反射した画像光Lは右眼REに向けて右光学像表示部26から射出され、この画像光Lが右眼REの網膜に像を結び、使用者に画像を視認させる。
使用者の右眼REには、ハーフミラー261Aで反射した画像光Lと、調光板20Aを透過した外光OLとが入射する。左眼LEには、ハーフミラー262Aで反射した画像光Lと、調光板20Aを透過した外光OLとが入射する。このように、HMD100は、内部で処理した画像の画像光Lと外光OLとを重ねて使用者の眼に入射させ、使用者にとっては、調光板20Aを透かして外景が見え、この外景に重ねて、画像光Lによる画像が視認される。このように、HMD100は、シースルー型の表示装置として機能する。
なお、左投写光学系252と左導光板262とを総称して「左導光部」とも呼び、右投写光学系251と右導光板261とを総称して「右導光部」と呼ぶ。右導光部及び左導光部の構成は上記の例に限定されず、画像光を用いて使用者の眼前に虚像を形成する限りにおいて任意の方式を用いることができ、例えば、回折格子を用いても良いし、半透過反射膜を用いても良い。
画像表示部20は、制御装置10に接続ケーブル40を介して接続する。
接続ケーブル40は画像表示部20に対し固定的に接続され、制御装置10に対してはコネクター(図示略)に接離可能に接続される。制御装置10と画像表示部20とは、接続ケーブル40を介して各種信号、及び/又は各種データを送受信する。
制御装置10は、HMD100を制御する。制御装置10は、操作部111(図4)として、キー操作部11、LEDインジケーター12、トラックパッド14、上下キー15、切替スイッチ16、及び電源スイッチ18を備える。
キー操作部11は、制御装置10が実行するオペレーティングシステム150(図4)の操作等を行うためのメニューキー、ホームキー、戻るキー等を備える。
LEDインジケーター12は、HMD100の動作状態に対応して点灯し、或いは点滅する。上下キー15は、右イヤホン32及び左イヤホン34から出力する音量の増減の指示入力や、画像表示部20の表示の明るさの増減の指示入力に利用される。切替スイッチ16は、上下キー15の操作に対応する入力を切り替えるスイッチである。電源スイッチ18は、HMD100の電源のオン/オフを切り替えるスイッチであり、例えばスライドスイッチで構成される。
トラックパッド14は、接触操作を検出する操作面を有し、操作面に対する操作に応じて操作信号を出力する。操作面における検出方式は限定されず、静電式、圧力検出式、光学式等を採用できる。
図4は、HMD100を構成する各部の機能ブロック図である。
HMD100は、コンテンツの供給元となる種々の外部機器OAを接続するインターフェイス114を備える。インターフェイス114は、例えば、USBインターフェイス、マイクロUSBインターフェイス、メモリーカード用インターフェイス等の有線接続に対応したインターフェイスを用いることができ、無線通信インターフェイスで構成してもよい。外部機器OAは、HMD100に画像を供給する画像供給装置であり、パーソナルコンピューター(PC)、携帯電話端末、携帯型ゲーム機等が用いられる。
制御装置10は、制御部140、入力情報取得部110、及び、記憶部120を有する。
入力情報取得部110は、操作部111に接続される。操作部111は、上述したようにキー操作部11、トラックパッド14、上下キー15及び切替スイッチ16を含む。入力情報取得部110は、操作部111から入力される信号に基づき、使用者の操作を受け付ける。入力情報取得部110は、操作部111における操作内容を示すデータを制御部140に出力する。また、入力情報取得部110は、制御部140の制御に従って、LEDインジケーター12(図1)の点灯、点滅、消灯を制御してもよい。
制御装置10は、電源部130を備え、制御装置10及び画像表示部20の各部に電源部130から電源を供給する。電源部130からの電源供給状態は、電源スイッチ18(図1)の操作、及び、制御部140が実行するプログラムの実行状況に応じて、制御部140が制御する。
記憶部120は、不揮発性の記憶装置であって、種々のコンピュータープログラム、及び、これらのプログラムに係るデータを記憶する。このプログラムには、本発明の制御方法を実現するためのプログラムを含む。
記憶部120は、画像表示部20に表示する静止画像や動画像のデータを記憶しても良い。また、記憶部120は、設定データ121を記憶する。設定データ121は、制御部140が使用する各種の設定値を含む。設定データ121が含む設定値は、予め操作部111の操作で入力された値であってもよいし、通信部117またはインターフェイス114を介して外部機器OAまたは他の装置(図示略)から設定値を受信して記憶してもよい。
また、記憶部120は、音声認識データベース(以下、DBと表記する)122、表示設定データ123、及び、モード設定データ124を記憶する。音声認識DB122、表示設定データ123及びモード設定データ124の具体的内容については後述する。
制御部140には、GPS115、及び通信部117が接続される。
GPS115は、アンテナ(図示略)を備え、GPS(Global Positioning System)信号を受信し、制御装置10の現在位置を算出する。GPS115は、GPS信号に基づいて求めた現在位置や現在時刻を制御部140に出力する。また、GPS115はGPS信号に含まれる情報に基づいて現在時刻を取得し、制御部140が計時する時刻を修正させる機能を備えてもよい。
通信部117は、無線LAN(WiFi(登録商標))、Miracast(登録商標)、Bluetooth(登録商標)等の規格に準じた無線データ通信を実行する。
本実施形態で、HMD100は、通信部117により拠点中継装置5A、5Bと無線通信を実行する。HMD100は、拠点中継装置5A、5Bを介して、通信ネットワーク4を経由したデータ通信を実行することができ、拠点中継装置5A、5Bを介して他のHMD100とデータ通信を行ってもよい。
また、通信部117は、外部機器OA等の機器と無線通信を実行してもよい。例えば、制御部140は、通信部117により接続された機器から、映像や音声を含むコンテンツデータを取得して、画像表示部20に画像を表示させてもよい。
制御部140は、プログラムを実行するCPU(図示略)、CPUが実行するプログラムやデータを一時的に格納するRAM(図示略)、及び、CPUが実行する基本制御プログラムやデータを不揮発的に記憶するROM(図示略)を備える。制御部140は、記憶部120が記憶するコンピュータープログラムを読み出して実行し、オペレーティングシステム(OS)150を実行する。制御部140は、画像処理部160、撮像制御部161、操作検出部162、動作モード制御部163、言語処理部164、通信制御部170、音声処理部187、及び、表示制御部190として機能する。
画像処理部160は、画像データに基づいて、右表示駆動部22及び左表示駆動部24に送信する信号を生成する。画像処理部160が生成する信号は、垂直同期信号、水平同期信号、クロック信号、アナログ画像信号等であってもよい。
画像処理部160は、必要に応じて、画像データの解像度を右表示駆動部22及び左表示駆動部24に適した解像度に変換する解像度変換処理を行ってもよい。画像処理部160は、画像データの輝度や彩度を調整する画像調整処理、3D画像データから2D画像データを作成し、或いは2D画像データから3D画像データを生成する2D/3D変換処理等を実行してもよい。画像処理部160は、これらの画像処理を実行した場合、処理後の画像データに基づき画像を表示するための信号を生成して、接続ケーブル40を介して画像表示部20に送信する。
表示制御部190は、右表示駆動部22及び左表示駆動部24を制御する制御信号を生成し、この制御信号により、右表示駆動部22及び左表示駆動部24のそれぞれによる画像光の生成及び射出を制御する。具体的には、右LCD制御部211による右LCD241の駆動ON/OFF、右バックライト制御部201による右バックライト221の駆動ON/OFFを制御する。また、表示制御部190は、左LCD制御部212による左LCD242の駆動ON/OFF、左バックライト制御部202による左バックライト222の駆動ON/OFFを制御する。
撮像制御部161は、カメラ61を制御して撮像を実行させ、撮像画像データを生成し、記憶部120に一時的に記憶する。また、カメラ61が撮像画像データを生成する回路を含むカメラユニットとして構成される場合、撮像制御部161は撮像画像データをカメラ61から取得して、記憶部120に一時的に記憶する。
操作検出部162は、入力情報取得部110から入力されるデータに基づき、操作部111における操作を検出する。また、操作検出部162は、インターフェイス25を介して入力される検出値やデータに基づき、画像表示部20に対する使用者の操作を検出する。例えば、操作検出部162は、後述するノックセンサー62の検出値に基づきノック操作を検出し、後述するミュートスイッチ65の検出値に基づきミュートスイッチ65への操作を検出する。
動作モード制御部163は、HMD100の動作モードを切り替える。動作モード制御部163が切り替え可能な動作モード、すなわち、HMD100が実行可能な動作モードについては後述する。
動作モード制御部163が動作モードを切り替えるトリガーは、ノックセンサー62が検出するノック操作、ミュートスイッチ65の操作、操作部111の操作によるモード切り替えの指示、音声コマンドによるモード切り替えの指示が挙げられる。
言語処理部164は、通信部117により受信した発話データまたは発話解析データについて、言語を判定する。例えば、通信システム1が、日本語、英語、中国語、スペイン語のデータを処理する構成では、言語処理部164は、通信部117により受信した発話データまたは発話解析データが、日本語、英語、中国語、スペイン語のいずれのデータであるかを判定する。判定の方法は、後述する発話解析データが言語属性を示すデータを含む場合、この言語属性を示すデータを参照して言語を判定できる。
また、言語処理部164は、通信部117により受信された発話データまたは発話解析データに含まれる音声認識の結果のデータを、他の言語のデータに翻訳する処理を行う。翻訳処理では、例えば、テキストデータを、他の言語のテキストデータに変換する。
通信制御部170は、通信部117による通信を制御して、他の装置からデータを受信する処理、及び通信部117によりデータを送信する処理を実行する。より具体的には、通信制御部170は、HMD100の動作モード、及び、記憶部120が記憶するモード設定データ124に基づき、送受信するデータの種類、データを送信する送信先、データを受信する場合の受信元等を判定する。ここで、受信元は、通信部117が受信するデータを送信する装置であり、送信元ということもできる。
通信制御部170は、後述するように音声処理部187が生成する発話データ、発話解析データ、カメラ61の撮像画像データ、操作検出部162が検出した操作に対応する制御データ等を、通信部117により送信する。ここで、通信制御部170は、発話データまたは発話解析データと、撮像画像データとを含む会議データを生成して、送信してもよい。会議データは音声データと映像データまたは画像データとを含む。
また、通信制御部170は、これらのデータを通信部117により受信した場合に、受信元(送信元)の機器が適切か否かを判定する。適切な受信元から送信されたデータを通信部117により受信した場合、受信したデータを、動作モード制御部163、音声処理部187、表示制御部190のうち少なくともいずれかにより処理させる。
また、通信制御部170は、記憶部120が記憶する画像データ、テキストデータ、プレゼンテーション用のデータ等の資料用のデータを通信部117により送信してもよい。また、通信制御部170は、通信部117により画像データ、テキストデータ、プレゼンテーション用のデータ等の資料用のデータを受信した場合、受信元の機器が適切か否かを判定する。適切な受信元から送信されたデータを通信部117により受信した場合、受信したデータを、動作モード制御部163、音声処理部187、表示制御部190のうち少なくともいずれかにより処理させる。
音声処理部187は、コンテンツに含まれる音声信号を取得し、取得した音声信号を増幅して、右イヤホン32及び左イヤホン34に出力する。
また、音声処理部187は、マイク63により集音される音声を取得してデジタル音声データに変換する。音声処理部187は、デジタル音声データに対して予め設定された処理を行ってもよい。音声処理部187は、マイク63で集音した音声のデジタル音声データに対し、音声認識処理を実行する。音声認識処理では、ノイズキャンセリング、音素解析、文字列変換、文節推定・解析、文章変換等を含むテキスト解析を実行し、テキストデータ変換等の処理を行う。また、音声処理部187は、音素解析の結果に基づく音声コマンドとの合致判定を行い、音声コマンドを認識する。これにより、音声処理部187は、マイク63が集音した音声が人間の声である場合に、音声コマンドを認識し、或いは、音声の内容のテキストデータを生成する。
音声認識処理は、本発明の認識処理に含まれる。認識処理は、マイク63で検出した音声から生成される発話データを認識する処理を含み、上記音声認識処理の音素解析、文字列変換、文節推定・解析、文章変換等を含むテキスト解析等を含む。また、認識処理は、発話者が発話した音声がどの言語であるかを推定・解析する処理を含んでもよいし、発話者を特定する処理を含んでもよく、音声を解析するその他の処理を含んでもよい。
記憶部120が記憶する音声認識DB122は、音声処理部187が音素解析、音声コマンドの認識、及びテキストデータ変換を行うためのデータを格納する。例えば、音声認識DB122は、デジタル音声データを音素解析するための音素の波形データ、音声コマンドの波形データや音素データ、テキストデータ変換用の辞書データ等、処理用のデータを含む。また、音声認識DB122は、上記の処理用のデータを、言語毎に格納してもよい。例えば、音声認識DB122は、日本語、英語、中国語、スペイン語等の各々の言語ごとに、上記処理用のデータを格納してもよい。
音声処理部187がテキストデータ変換した結果であるテキストデータは、本発明の発話データに相当する。
また、音声処理部187は、発話データに、テキストデータに変換した日時を示す日時データ、テキストデータの言語を示す言語属性データ、使用者の氏名やHMD100に固有の識別情報等を合わせて含む、発話解析データを生成してもよい。音声処理部187は、マイク63が集音した音声から音声コマンドを認識した場合に、音声コマンドを示すデータを含む発話解析データを生成してもよく、この場合、発話解析データがテキストデータ及び言語属性データを含まなくてもよい。
また、音声処理部187は、マイク63が集音した音声について声紋解析など話者判定処理を行い、HMD100を装着する使用者を認識する処理を実行可能な構成としてもよい。この場合、音声認識DB122が、使用者毎の声紋判定用のデータを予め含んでいれば、音声処理部187が音声認識DB122内の声紋判定用のデータを参照して判定を行うことができる。
また、音声処理部187は、通信制御部170の制御により、通信部117が他のHMD100から発話データや発話解析データを受信した場合、受信された発話データや発話解析データに基づく音声を、スピーカー68、69から出力させる。音声処理部187は、発話データや発話解析データに含まれるテキストデータから音声合成処理を行って、テキストデータを読み上げる音声の音声データを生成する。音声処理部187は、生成した音声データ、または、この音声データから生成されるアナログ音声信号を、スピーカー68及びスピーカー69に出力する。ここで、音声処理部187は、通信部117が会議データを受信した場合に、受信した会議データから発話データや発話解析データを抽出してもよい。
音声処理部187は、音声認識DB122に含まれる音声データを用いて、音声合成処理を行ってもよい。この場合、音声認識DB122は、テキストデータから音声データを生成するためのパターンデータ等を含んでもよく、このパターンデータを、言語ごとに含んでいてもよい。音声処理部187は、通信部117が受信した発話データや発話解析データの言語属性を判定し、判定した言語属性に対応するデータを音声認識DB122から抽出して、音声合成処理を行ってもよい。
また、音声処理部187は、通信制御部170の制御により、通信部117が音声データ、或いは、映像データに付加された音声データを受信した場合、この音声データに基づき音声を出力する。この場合、音声処理部187は、通信部117が受信した音声データ、または、この音声データから生成されるアナログ音声信号を、スピーカー68及びスピーカー69に出力する。
表示制御部190は、通信制御部170の制御により、通信部117が他のHMD100から画像データや映像データを受信した場合、受信された画像データや映像データに基づく画像を画像表示部20により表示する。
記憶部120は、表示制御部190が画像表示部20により画像を表示する場合の表示態様等を指定するデータを含む、表示設定データ123を記憶する。表示制御部190は、表示設定データ123を参照して、表示設定データ123により設定される態様で画像を表示する。
画像表示部20は、カメラ61を備える。また、画像表示部20は、インターフェイス25、右表示駆動部22、左表示駆動部24、右光学像表示部26としての右導光板261、及び、左光学像表示部28としての左導光板262を備える。
また、画像表示部20は、上述したカメラ61、マイク63、ミュートスイッチ65、スピーカー68、69に加え、ノックセンサー62、及び、9軸センサー66を備える。
ノックセンサー62は、画像表示部20に対するノック操作を検出するセンサーである。ノックセンサー62は、例えば、右保持部21、左保持部23、または画像表示部20の前面側に内蔵される。ノックセンサー62は、使用者が画像表示部20を叩く操作を検出する。使用者が右手で叩く操作を検出しやすいように、ノックセンサー62を右保持部21に配置してもよく、左手による操作を検出しやすいように、ノックセンサー62を左保持部23に内蔵してもよい。ノックセンサー62は、振動または加速度を検出するセンサーを用いることができ、例えば、9軸センサー66にノックセンサー62の機能を持たせることも可能である。
ノックセンサー62の検出値は、後述するようにインターフェイス25を介して制御装置10に送信される。ノックセンサー62の検出値は、例えば、ノックの有無に応じた値であってもよく、ノックの強さに応じて変化する値であってもよく、ノックの方向(X軸方向、Y軸方向、及びZ軸方向)に応じた値であってもよい。
9軸センサー66は、加速度(3軸)、角速度(3軸)、地磁気(3軸)を検出するモーションセンサー(慣性センサー)であり、IMU(Inertial Measurement Unit:慣性計測ユニット)として構成してもよい。9軸センサー66は、複数のセンサーを統合したセンサーユニットであってもよい。制御部140は、画像表示部20が使用者の頭部に装着された状態で、9軸センサー66の検出値に基づいて使用者の頭部の動きを検出できる。
インターフェイス25は、接続ケーブル40により制御装置10に接続され、制御装置10が送信する各種データ及び信号を、右表示駆動部22及び左表示駆動部24に出力する。また、インターフェイス25は、表示制御部190から送信される制御信号を、対応する右バックライト制御部201又は左バックライト制御部202に出力する。
インターフェイス25は、カメラ61、ノックセンサー62、マイク63、ミュートスイッチ65、9軸センサー66、及び、スピーカー68、69を、制御装置10に接続する。カメラ61の撮像画像データ、ノックセンサー62の検出データまたは検出値、及び、マイク63が集音した音声のアナログ音声信号またはデジタル音声データは、インターフェイス25により制御部140に出力される。また、ミュートスイッチ65の操作状態を示すデータまたは電圧値、及び、9軸センサー66による加速度(3軸)、角速度(3軸)、及び、地磁気(3軸)の検出結果を示すデータまたは検出値は、インターフェイス25を介して制御部140に送られる。
また、スピーカー68、69には、インターフェイス25を介して、制御部140からアナログ音声信号またはデジタル音声データが入力される。スピーカー68、69は、入力される音声信号または音声データに基づき、可聴周波数帯域の音声を出力する。スピーカー68、69が骨伝導スピーカーである場合、制御部140から入力される音声信号または音声データに基づき、音声に対応する振動を生成して出力する。
右表示駆動部22は、上述した右バックライト221、右LCD241、及び右投写光学系251を備える。また、右表示駆動部22は、右バックライト(BL)221を制御する右バックライト(BL)制御部201、及び、右LCD241を駆動する右LCD制御部211を備える。
右バックライト制御部201は、表示制御部190が送信する制御信号に従って、右バックライト221を駆動する。右LCD制御部211は、画像処理部160が送信する信号及び表示制御部190が送信する信号に基づいて、右LCD241を駆動する。
左表示駆動部24は、右表示駆動部22と同様の構成を有する。左表示駆動部24は、上述した左バックライト222、左LCD242、及び左投写光学系252を備える。また、左表示駆動部24は、左バックライト222を駆動する左バックライト制御部202、及び、左LCD242を駆動する左LCD制御部212を備える。
左バックライト制御部202は、表示制御部190が送信する制御信号に従って、左バックライト222を駆動する。左LCD制御部212は、画像処理部160が送信する信号及び表示制御部190が送信する信号に基づいて、左LCD242を駆動する。
なお、右バックライト制御部201と、右LCD制御部211と、右バックライト221と、右LCD241とを総称して、右の「画像光生成部」とも呼ぶ。同様に、左バックライト制御部202と、左LCD制御部212と、左バックライト222と、左LCD242とを総称して、左の「画像光生成部」とも呼ぶ。
本実施形態では、通信システム1の動作例として、拠点Aと拠点Bとの間で遠隔会議を行う場合を説明する。この動作例では、拠点A、拠点Bのそれぞれに一人の司会者がいる。司会者は他のHMD100を使用する使用者に比べ権限が大きい。司会者以外のHMD100の使用者は、会議の参加者となる。
拠点AではHMD100−1が司会者のHMDとして機能し、HMD100−2が参加者のHMDとして動作する。拠点BではHMD100−3が司会者のHMDとして機能し、HMD100−4が参加者のHMDとして機能する。
また、管理サーバー3は、拠点AのHMD100−1及びHMD100−2と、拠点BのHMD100−3及びHMD100−4との間で各種データを送受信する機能を管理する。
図5は、管理サーバー3の機能ブロック図である。
管理サーバー3は、制御部301、記憶部302、及び通信部306を有する。また、管理サーバー3は、オペレーターの入力操作を検出する入力部(図示略)や表示部(図示略)を備えていてもよい。
通信部306は、通信ネットワーク4に接続され、通信ネットワーク4を介したデータ通信を実行する。
制御部301は、通信部306により通信ネットワーク4を経由して、拠点中継装置5A、及び拠点中継装置5Bとの間でデータ通信を実行する。
記憶部302は、拠点管理データベース(以下、DB)303、及び参加者管理データベース(以下、DB)304を有する。拠点管理DB303は、通信システム1を構成するHMD100及び拠点中継装置5が配置される拠点毎に、拠点中継装置5及びHMD100の数や構成に関する情報を格納する。例えば、拠点Aについて、拠点中継装置5A、HMD100−1、及びHMD100−2について、装置の種類、台数、各装置を特定する識別情報、各装置と通信するための情報(ネットワークアドレス、コンピューター名、プロトコル、ポート番号等)を格納する。同様に、拠点Bについて、拠点中継装置5B、HMD100−3、及びHMD100−4に関する情報を格納する。
参加者管理DB304は、通信システム1において遠隔会議を実行する場合に、当該会議に参加するHMD100、及び拠点中継装置5に関する情報を格納する。
例えば、通信システム1の一部または全部の装置を含む遠隔会議が行われる場合に、この遠隔会議に参加する装置を指定する情報が、参加者管理DB304に格納される。ここで、拠点管理DB303に情報が記憶された各装置のそれぞれについて、会議に参加するか否かを示す情報を含んでもよい。
HMD100−1及びHMD100−2は、会議データを拠点Aの内部において送受信する。また、HMD100−1が送信する会議データは、通信ネットワーク4を介して拠点中継装置5Bに送信される。拠点中継装置5Bは、HMD100−1またはHMD100−2から受信した会議データを、HMD100−3及びHMD100−4に送信する。
HMD100−3及びHMD100−4は、カメラ61の撮像画像データ、及び、マイク63で集音した音声に対応する発話データや発話解析データを、拠点Bの内部において送受信する。また、HMD100−3が送信する会議データは、通信ネットワーク4を介して拠点中継装置5Aに送信される。拠点中継装置5Aは、HMD100−3またはHMD100−4から受信した会議データを、HMD100−1及びHMD100−2に送信する。これにより、会議に参加するHMD100−1〜HMD100−4は、カメラ61の撮像画像やマイク63で集音した音声を共有できる。
通信システム1において会議に参加するHMD100−1〜HMD100−4は、資料用のデータを共有できる。資料用のデータは、画像データ、映像データ、音声データ、プレゼンテーション用のデータ、文書データ等である。これらのデータは、いずれかのHMD100が他のHMD100に対し送信する。送信されたデータは、拠点Aまたは拠点Bの内部、及び、拠点Aと拠点Bとの間で送受信され、このデータを受信したHMD100により、表示及び/または音声の再生が行われる。
ここで、HMD100−1〜HMD100−4が実行する動作モードについて説明する。
通信システム1におけるHMD100の動作モードは、例えば、次に示すP1〜P4、P0、PX、PYの6通りが挙げられる。
P1モードは、司会者モードと言い換えることができる。なお、通信システム1を利用して作業の指示を伝達する場合は作業指示者モードということもできる。
P1モードのHMD100は、他の全てのHMDに対し情報送信、情報受信が可能である。つまり、通信制御部170は、マイク63で集音した音声に係る発話データや発話解析データ、或いは、制御装置10の操作により入力された指示や音声コマンドの指示に対応する制御データ等の送信先、受信元として、全てのHMD100を指定できる。
また、P1モードのHMD100は、会議用の資料のデータを他のHMD100に送信できる。会議用の資料は、カメラ61の撮像画像のデータおよびマイク63で集音した音声に係るデータを含まない、画像、映像、音声データ等の各種データである。例えば、HMD100は、記憶部120に予め記憶している資料のデータや外部機器OAから取得した資料のデータを、他のHMD100に送信できる。
また、P1モードのHMD100は、P1モードを実行していない他のHMD100に対し、制御データを送信して、会議データの送信の許可及び禁止を制御できる。例えば、拠点AのHMD100−1は、司会者のHMDとしてP1モードを実行し、拠点Aで参加者のHMDとして機能する他のHMDを制御できる。具体的には、HMD100−2に対し、会議データの送信の許可と禁止を制御できる。
また、P1モードのHMD100は、P1モードを実行していない他のHMD100に対し、制御データを送信して、HMD100の動作モードを、後述するP4モードやP0モードに移行させることができる。例えば、HMD100−1はHMD100−2に対し、動作モードをP4モードやP0モードに切り替えるよう指示する制御データを送信する。この制御データを受信した場合、HMD100−2は、使用者の操作を経ることなく、制御データで指定された動作モードに切り替わる。
P1モードを実行するHMD100の数は、拠点ごとに上限が設けられてもよい。例えば、P1モードを実行するHMD100を、拠点Aと拠点Bのそれぞれで1台のみとしてもよい。また、それぞれの地点に1台ずつP1モードのHMD100がある場合には、当該HMD100の権限は、同じ地点内のHMDに対してのみ有効としてもよい。例えば、HMD100−1が拠点Aにおける司会者のHMDとして機能し、HMD100−3が拠点Bにおける司会者のHMDとして機能する場合を想定する。この場合、HMD100−1は、拠点BのHMD100−3やHMD100−4に対し、制御データによって動作を制御する機能を持たない。具体的には、HMD100−3やHMD100−4に対し、撮像画像のデータ、発話データ及び発話解析データの送信の許可と禁止の制御や、動作モードをP4モードやP0モードに切り替えるよう指示する制御を行わない。HMD100−3についても同様に、HMD100−1、HMD100−2に対する制御を行わない。
P1モードを実行するHMD100は、他のHMD100に対し会議データの送信の許可と禁止を制御する機能、会議用の資料のデータを他のHMD100に送信する機能を実行する場合、管理サーバー3にアクセスする。
P1モードは、HMD100を使用することが可能な使用者のうち、権限を有する一部の使用者のみ実行可能なように、制限を行ってもよい。例えば、予め管理者権限が与えられた使用者がHMD100を使用している場合に、このHMD100がP1モードに移行可能な構成としてもよい。この場合、HMD100では、使用者の権限に関する設定動作を行い、使用者を示す識別情報(ID等)、及び認証情報(パスワード、指紋、虹彩等)が入力される。管理者権限が与えられた使用者の識別情報と認証情報とは、例えば、予めモード設定データ124に格納される。動作モード制御部163は、例えば制限解除の処理を実行し、この処理で使用者の識別情報と認証情報とが入力された場合に、モード設定データ124と照合し、認証に成功した場合に、HMD100を、P1モードに移行可能な状態とすることができる。また、認証に失敗した場合は、P1モードへの移行のトリガーとなる指示や操作が行われても、P1モードに移行しない。
HMD100は、P2モードを実行できる。P2モードは、音声モード(翻訳)ということができ、会議の参加者のHMDとして機能するHMD100が実行する。P2モードでは、通信制御部170により、会議データを送信できる。また、P2モードでは、会議データを受信して、会議データに含まれる発話データや発話解析データに基づき、音声の出力、テキストや画像の表示を行える。また、P2モードでは、発話データや発話解析データに含まれるテキストデータを他の言語のデータに変換する翻訳処理を、言語処理部164が実行でき、変換後のデータに基づく音声出力またはテキストや画像の表示を行える。
また、P2モードで、HMD100は、会議資料のデータを受信し、画像の表示、及び、音声出力を行う。
HMD100を使用することが可能な使用者のうち、権限を有する一部の使用者のみ、P2モードで使用可能なように、制限を行ってもよい。例えば、予め管理者権限が与えられた使用者、または、会議参加権限が与えられた使用者がHMD100を使用している場合に、このHMD100がP2モードに移行可能な構成としてもよい。
HMD100では、P1モードについて説明した場合と同様に、使用者の権限に関する設定動作を行う。この動作では、使用者を示す識別情報(ID等)、及び認証情報(パスワード、指紋、虹彩等)が入力される。管理者権限または会議参加権限が与えられた使用者の識別情報と認証情報は、例えば、予めモード設定データ124に格納される。動作モード制御部163は、例えば制限解除の処理を実行し、この処理で使用者の識別情報と認証情報とが入力された場合に、モード設定データ124と照合し、認証に成功した場合に、HMD100を、P2モードに移行可能な状態とすることができる。また、認証に失敗した場合は、P2モードへの移行のトリガーとなる指示や操作が行われても、P2モードに移行しない。
HMD100は、P3モードを実行できる。P3モードは、ホームモード、標準モードということができ、HMD100がスタンドアローンで通常動作を実行する場合の動作モードである。例えば、HMD100は、電源がオンされた場合に、最初にP3モードで起動する構成としてもよい。P3モードでは会議データ、発話データ或いは発話解析データの送受信を行わない。
P3モードは、HMD100の設定を行うために利用できる。例えば、HMD100において制御部140が実行するアプリケーションプログラムの動作開始、終了、メニュー操作等を行うことができる。また、例えば、使用者に関する設定、アプリケーションプログラムの動作の制限、通信に係る設定等を行える。なお、表示輝度、音量、サラウンド、2D/3Dの切り替え等の設定については、他の動作モードにおいても実行可能である。例えば会議データに基づく画像を表示中に、表示輝度を調整できる。
P3モードで設定する項目あるいは設定内容の一部または全部について、設定する使用者の権限に応じて、制限を行っても良い。例えば、P3モードで、管理者権限が与えられた使用者がHMD100を操作する場合に設定可能であり、かつ、管理者権限が与えられていない使用者が操作しても設定できない項目があってもよい。一方、P3モードの実行自体が制限されない構成としてもよく、権限が与えられていない使用者であってもP3モードへの移行および一部の項目の設定を行うことが可能な構成であってもよい。
HMD100は、P4モードを実行できる。P4モードは、視聴、傍聴モードということができ、会議データ、発話データ、発話解析データ、或いは資料データの受信と、受信したデータに基づく画像、テキストの表示及び音声出力が可能である。一方、会議データ、発話データ、発話解析データ及び資料データを送信することはない。
P4モードは、通信システム1を使用する会議が行われる場合に、傍聴者となる使用者が使用する動作モードとして、利用できる。
P4モードを実行する場合の使用者の権限による制限は、例えば、行わないことが好ましい。つまり、使用者に与えられた権限を問わず、全ての使用者がP4モードでHMD100を使用可能としてもよい。
また、HMD100は、P0モードを実行できる。P0モードで、HMD100は、ミュート機能(撮像、画像、音声、音声認識)を実行する。HMD100のミュート機能は3種類あり、出力ミュート、撮像・集音ミュート、及び、送信ミュートと呼ぶ。
出力ミュートを行う場合、HMD100は、会議データ、発話データ、発話解析データ、資料データ等に基づく音声出力と表示を停止する。音声出力のみ停止してもよい。
撮像・集音ミュートでは、カメラ61の撮像画像データの出力、及び、発話データ及び発話解析データの出力を停止する。より詳細には、撮像制御部161がカメラ61の撮像画像データの取得も保存も行わず、音声処理部187がマイク63で集音した音声のデータの取得及び保存を行わない例が挙げられる。また、撮像制御部161がカメラ61の撮像画像データを取得して記憶部120に保存し、この撮像画像データの出力を停止する動作であってもよい。同様に、音声処理部187がマイク63で集音した音声のデータの取得及び保存を行い、音声データに基づく発話データや発話解析データの出力を行わない動作であってもよい。また、音声処理部187が発話データや発話解析データを生成するが、出力しない動作であってもよい。
送信ミュートでは、会議データ、発話データ、及び発話解析データの送信先を制限する。送信ミュートの実行時の送信先の制限内容は、予め設定できる。この設定は、例えばP3モードで設定すれば良い。
送信ミュートの実行時の送信先を、ゼロ(Null)と設定してもよく、この場合、他の全てのHMD100及び拠点中継装置5に対し、会議データ、発話データ、及び発話解析データを送信しない。つまり、会議データ、発話データ、及び発話解析データの送信を行わない。また、送信先を、同じ拠点のHMD100に限定することも可能である。例えば、拠点AのHMD100−2が送信ミュートを行い、拠点Aに位置するHMD100(すなわち、HMD100−1)のみを送信先としてもよい。この場合、HMD100−2が送信する会議データ、発話データ、及び発話解析データは、拠点BのHMD100−3、HMD100−4には送信されない。また、拠点Aと拠点Bを問わず、限られたHMD100に会議データ、発話データ、及び発話解析データを送信してもよい。例えば、P1モードを実行するHMD100−1とHMD100−3に対してのみ、会議データ、発話データ、及び発話解析データを送信してもよい。
さらに、P1モードを実行するHMD100が、他のHMD100が送信ミュートで会議データ、発話データ、及び発話解析データを送信する送信先を設定してもよい。
また、P1モードを実行するHMD100が、他のHMD100をP0モードに移行させてもよい。
また、HMD100が備えるミュートスイッチ65の操作により、P1〜P4の動作モードからP0モードに直接、遷移してもよい。
また、ミュートスイッチ65が操作された場合に、P0モードに移行して、出力ミュートを実行してもよい。さらに、ミュートスイッチ65の操作回数に応じて、出力ミュートと、撮像・集音ミュートと、送信ミュートとを、切り替えて実行してもよい。また、操作部111の操作により、出力ミュートと、撮像・集音ミュートと、送信ミュートとを選択して実行してもよい。また、P0モードに移行した場合に出力ミュートと、撮像・集音ミュートと、送信ミュートとのいずれを実行するかを、予め設定してもよい。
また、HMD100が、ミュートスイッチ65の内側、すなわち使用者の頭部に接する側の操作を検出することが可能な構成であってもよい。この場合、ミュートスイッチ65の内側の操作に応じて、HMD100の電源のオン/オフを切り替える構成であってもよい。このように、ミュートスイッチ65の内側に対する操作を検出する動作モードを、PXモードとすることができる。PXモードは、他の動作モード(P0、P1、P2、P3、P4)と同時に実行でき、他の動作モードの実行中にPXモードをオフにすることもできる。PXモードをオン/オフすることで、HMD100の電源のオンオフが容易になり、かつ、誤操作を防止できる。
また、HMD100は、使用者の権限の設定や認証を行うためのPYモードを実行してもよい。PYモードでは、現在設定されている使用者の権限の表示、会議に参加する場合に必要なパス(認証情報)の表示、生体認証の実行等を行うことができる。生体認証の方法としては、HMD100に虹彩撮像用のカメラ(図示略)を設けて、虹彩認証を行ってもよい。また、カメラ61により使用者の手や指を撮像して、指紋認証や掌紋認証を行ってもよく、カメラ61が赤外光により使用者の掌を撮像して静脈認証を行う構成としてもよい。
このように、通信システム1を構成する複数のHMD100のそれぞれが、P0〜P4モードのいずれかを実行することにより、遠隔会議を行うことができる。また、PXモード、PYモードは、P0〜P4モードと併用して、実行/不実行することができる。
会議を行う場合のそれぞれのHMD100の動作について、詳細に説明する。
図6は、HMD100の動作を示すフローチャートであり、通信システム1の会議に参加する際の動作を示す。
図6の動作は、通信システム1を構成する複数のHMD100が会議を開始する場合、或いは、既に開始されている会議に、新たにHMD100が参加する場合、会議に参加するHMD100が実行する。
図6の動作は、HMD100−1〜HMD100−4の全てが実行可能であるが、ここでは、HMD100−1が図6の動作を実行する例を説明する。
図6の動作の実行時、HMD100−1は電源がオンであり、P3モードを実行する。操作検出部162が会議に参加する指示入力を検出すると(ステップS11)、制御部140は、使用者の権限を設定するか否かを判定する(ステップS12)。使用者の権限の設定を行うか否かは、例えば、権限の設定の指示が操作部111により入力されたか否かに基づき判定できる。
使用者の権限の設定を行う場合(ステップS12;Yes)、使用者を識別する識別情報と認証情報が入力され、権限の入力または指定が行われる(ステップS13)。動作モード制御部163は、入力された識別情報と認証情報とを、記憶部120が記憶するモード設定データ124、または、管理サーバー3が記憶する参加者管理DB304と照合して、認証を実行する(ステップS14)。認証に成功した場合(ステップS14;Yes)、動作モード制御部163は、使用者に対し、入力された権限を指定する(ステップS15)。具体的には、管理者権限、または、会議の参加者権限を指定する。
一方、権限の設定を行わない場合(ステップS12;No)、動作モード制御部163は、使用者の権限として、最も権限の低い通常ユーザー権限を設定する(ステップS16)。認証に失敗した場合も(ステップS14;No)、動作モード制御部163は、通常ユーザー権限を設定する(ステップS16)。
ステップS15またはステップS16で権限を設定した後、言語処理部164は、言語の設定および翻訳の要否を設定する(ステップS17)。ステップS17では、使用者が使用する言語を指定する入力、及び、翻訳の要否を指定する入力を操作検出部162が検出した場合、入力に従って、設定を行う。また、入力が行われない場合、言語処理部164は、デフォルトの設定に従って、使用する言語と翻訳の要否を設定する。
続いて、使用者の入力操作によりHMD100−1の動作モードが選択、指定される(ステップS18)。動作モード制御部163は、指定された動作モードが、ステップS15、S16で設定した使用者の権限に適合するか否かを判定する(ステップS19)。権限に適合しない場合、すなわち設定された使用者の権限で実行できない動作モードであると判定した場合(ステップS19;No)、動作モード制御部163は画像表示部20によりエラーメッセージを表示させる(ステップS20)。エラーメッセージを表示した後、ステップS18に戻る。
選択、指定された動作モードが使用者の権限に適合すると判定した場合(ステップS19;Yes)、動作モード制御部163は、指定された動作モードを設定し、設定した動作モードに遷移する(ステップS21)。
続いて、音声処理部187は、マイク63の種類を検出して、検出したマイク63の種類に適合するチューニングを実行する(ステップS22)。
次に、通信制御部170は、会議データ、発話データ、発話解析データ等を送信する送信先を設定する(ステップS23)。また、通信制御部170は、データを受信する受信元(送信元)の装置を設定する(ステップS24)。ステップS23、S24において、通信制御部170は、管理サーバー3が有する参加者管理DB304を参照して、設定を行ってもよい。また、通信制御部170は、会議の司会者としてP1モードを実行する他のHMD100がある場合に、このP1モードのHMD100から受信する制御データに従って、ステップS23、S24の設定を行ってもよい。
制御部140は会議に参加し(ステップS25)、例えば会議に参加したことを示す音声メッセージやテキストのメッセージを出力する。その後、撮像制御部161はカメラ61の撮像画像データの取得を開始し、音声処理部187はマイク63で集音する音声に基づくデータの生成を開始する(ステップS26)。
図6の動作における指示入力は、操作部111の操作に限らず、例えば、後述する音声コマンドを利用することができる。また、ステップS11でHMD100−1を会議に参加させる指示は、HMD100−1による入力操作に限らない。既に会議が実行されている場合、会議の司会者としてP1モードで動作中のHMD100が、HMD100−1に制御データを送信して、HMD100−1を会議に参加させる指示を行ってもよい。
図7は、HMD100の動作を示すフローチャートであり、マイク63で集音する音声に対する動作を示す。ここではHMD100−1が図7の動作を実行する場合を例として説明する。
HMD100−1のマイク63が音声を検出して音声信号または音声データを制御部140に出力すると(ステップS42)、音声処理部187はデジタル音声データを生成して取得する(ステップS42)。
音声処理部187は、音声認識DB122を利用して音声認識処理を実行する(ステップS43)。ステップS43では、音声処理部187が、取得した音声データに基づき音声波形のパターン化と、予め記憶された音声コマンドの音声波形との照合、音素解析によるテキスト化、テキストデータの生成などを行う。
ここで、音声処理部187は、ステップS41で検出した音声が音声コマンドに該当するか否かを判定する(ステップS44)。音声コマンドに該当する場合(ステップS44;Yes)、音声処理部187は、音声コマンドの指示に従って処理を実行する(ステップS45)。
検出した音声が音声コマンドに該当しないと判定した場合(ステップS44;No)、音声処理部187は、音声データの処理に関する設定を参照し、発話解析データを生成するか否かを判定する(ステップS46)。
発話解析データを生成する場合(ステップS46;Yes)、音声処理部187は、属性データを生成し、ステップS43で音声認識を行った認識結果に付加し(ステップS47)、発話解析データを生成する(ステップS48)。発話解析データが含む属性データは、例えば、HMD100−1で使用言語として設定された言語、発話を検出した時刻、使用者に関する情報等を含む。
また、発話解析データを生成しない場合(ステップS46;No)、音声処理部187は、ステップS43で音声認識を行った認識結果を含む発話データを生成する(ステップS49)。
その後、通信制御部170は、ステップS48で生成する発話解析データまたはステップS49で生成する解析データの送信先に関する設定内容を取得する(ステップS50)。通信制御部170は、発話データまたは発話解析データの送信先を設定して、通信部117により送信する(ステップS51)。
図7の動作により、HMD100は、マイク63で音声を集音して、他のHMD100や拠点中継装置5に対し、発話データまたは発話解析データを送信できる。
また、HMD100では、マイク63で集音し検出した音声が音声コマンドである場合、音声コマンドに対応する指示に従って、処理を実行する。このため、使用者は、音声を発することで、HMD100を操作できる。
HMD100における音声コマンドと、音声コマンドに対応するユーザーインターフェースの例を説明する。
図8は、HMD100における表示例を示す図であり、(A)、(B)、(C)は、いずれも音声コマンドを使用可能なユーザーインターフェースの表示例を示す。これら図8()〜(C)は、音声操作用インターフェイスの一例に相当する。
図8(A)〜(C)、使用者が画像表示部20により視認する視野Vを示す。視野Vでは、画像表示部20を透過する外光により、外景を視認できる。また、使用者は、視野Vにおいて画像表示領域400に表示される画像を視認する。画像表示領域400は、右導光板261(図3)、左導光板262(図3)のハーフミラー261A、262A(図3)により、画像が形成される領域である。本実施形態では、ハーフミラー261A、262Aによって、矩形の画像表示領域400に画像を表示できる。
画像表示領域400は、6つの表示エリア401、402、403、404、405、406に分割される。6つの表示エリアのそれぞれには、図8(B)に示すように、メニュー項目が一覧表示されるメニューリスト421、422、423、424、42、426が表示される。
表示エリア401は、P3モードに対応するメニューリスト421が表示される。メニューリスト421は、「Home」、「戻る」、「メニュー」、「アプリ」、「アプリ終了」の項目を含む。「Home」は初期状態への移行の指示に相当する。「戻る」は、一つ前の処理状態への遷移の指示に相当する。「メニュー」は、全体のメニュー表示の指示に相当する。「アプリ」は実行するアプリケーションプログラムの選択および実行の指示に相当する。「アプリ終了」はアプリケーションプログラムの実行終了の指示に相当する。
メニューリスト421における項目の選択は、例えば音声コマンドで行うことができる。例えば、メニューリスト421に表示される各項目が異なる色で表示された状態で、使用者が色の名前を発声すると、音声処理部187が発声された色の名前を音声コマンドとして認識し、発声された色に対応する項目を選択する操作として検出する。
表示エリア402は、PYモードに対応するメニューリスト422が表示される。メニューリスト422は、「権限表示」、「会議に入るためのパス表示」、「生体認証」の項目を含む。「権限表示」はHMD100で設定されている使用者の権限の表示の指示に相当する。「会議に入るためのパス表示」は、認証情報の表示の指示に相当する。「生体認証」は、生体認証の実行の指示に相当する。メニューリスト422における項目の選択も、メニューリスト421と同様、音声コマンドで行うことができる。
表示エリア403は、P0モード、PXモードに対応するメニューリスト423が表示される。メニューリスト423は、「音声認識」、「画像ミュート」、「マイクミュート」、「撮像ミュート」の項目を含む。これらの各項目は、それぞれのミュート動作の実行の指示に相当する。メニューリスト423における項目の選択も、メニューリスト421と同様、音声コマンドで行うことができる。
表示エリア404は、P4モードに対応するメニューリスト424が表示される。メニューリスト424は、「音量+/−」、「明るさ」、「2D/3D」、「サラウンド」の項目を含む。「音量+/−」はスピーカー68、69の出力音量の増減の指示に相当する。「明るさ」は画像表示部20における表示輝度の増減の指示に相当する。「2D/3D」は2D表示と3D表示の切り替えの指示に相当する。「サラウンド」はスピーカー68、69の出力音声についてサラウンド効果のオンオフの切り替えの指示に相当する。メニューリスト424における項目の選択も、メニューリスト421と同様、音声コマンドで行うことができる。
表示エリア405は、P2モードに対応するメニューリスト425が表示される。メニューリスト425は、「音声」、「翻訳」、「ボイスチェンジ」、「音声ミュート」の項目を含む。
「音声」は音声出力に関する設定の指示に相当する。「翻訳」は翻訳の実行の要否や翻訳処理に関する設定の指示に相当する。「ボイスチェンジ」はボイスチェンジ機能のオンオフやボイスチェンジ機能に関する設定の指示に相当する。「音声ミュート」は音声ミュートのオンオフの指示に相当する。メニューリスト425における項目の選択も、メニューリスト421と同様、音声コマンドで行うことができる。
表示エリア406は、P1モードに対応するメニューリスト426が表示される。メニューリスト426は、「スピーカー音量+/−」、「ノイズキャンセル」、「接続制限」、「発言制限」の項目を含む。「スピーカー音量+/−」はスピーカー68、69の出力音量の増減の指示に相当する。「ノイズキャンセル」はノイズキャンセル処理のオンオフを切り替える指示に相当する。「接続制限」は、P3モードを実行中のHMD100に対する接続制限のオンオフ、或いは接続制限に関する設定の指示に相当する。「発言制限」は、P3モードを実行中のHMD100をP0モードに移行させる機能の指示に相当する。メニューリスト426における項目の選択も、メニューリスト421と同様、音声コマンドで行うことができる。
図8(A)には、メニューリスト426が表示された状態を例示する。このように、HMD100が実行中の動作モードに対応するメニューリストが、対応する表示エリアに常時表示される構成としてもよい。
また、メニューリストの表示を一時的に消す態様も可能である。例えば、図8(A)にはドロワータグ411、412が表示される。ドロワータグ411、412は、それぞれ、メニュー操作の項目があることを示すマーカーである。ドロワータグ411を指定する指示入力がなされると、ドロワータグ411に対応するメニューリスト422が表示される。また、ドロワータグ412を指定する指示入力がなされると、ドロワータグ412に対応するメニューリスト422が表示される。ドロワータグ411、412は、メニュー項目のリストそのものに比べて小さいため、視野Vで外景を視認する際の邪魔になりにくいという利点がある。ドロワータグ411、412は、異なる色あるいは形状で表示される。図8(A)の例では、ドロワータグ411、412は同一形状であるが、その表示色を異なる色にすることができる。例えば、ドロワータグ411をピンク色、ドロワータグ412をオレンジ色で表示できる。ドロワータグ411、412の色を指定する音声コマンドにより、ドロワータグ411、またはドロワータグ412を選択して、対応するメニューリストを開かせることができる。
図8(A)、(B)の表示状態において、特定の機能の実行を開始した場合に、画像表示領域400の表示を切り替えることができる。例えば、図8(C)には、音声認識機能の実行を開始した場合の表示例を示す。
図8(C)の例では、音声認識動作の実行中であることを示す動作表示431が表示される。また、メニュー432、及び、メニュー433が表示され、これらメニューリスト422、433に含まれる項目について、音声コマンドによる操作が可能である。
このように、制御部140は、表示制御部190の機能により音声コマンドの操作に対応するユーザーインターフェースを表示することができる。このため、使用者は、会議の実行中に、ハンズフリーでHMD100を操作できる。音声コマンドにより操作可能な項目等は画像表示部20により表示されるため、使用者は、操作する項目を予め覚えておく必要はない。また、音声コマンドで操作可能な項目を表示することで外景の視認性が影響されないように、ドロワータグ411、412等を利用することもできる。
図9は、HMD100の動作を示すフローチャートであり、発話データまたは発話解析データを受信した場合の動作を示す。一例として、HMD100−1が図9の動作を実行する例を説明する。
制御部140は、通信部117により、HMD100−2、或いは拠点BのHMD100−3、HMD100−4から会議データ、発話データ、または発話解析データを受信する(ステップS61)。制御部140は、受信したデータに属性のデータが付加されているか否かを判定する(ステップS62)。例えば、音声認識の結果のテキストデータのみを含む発話データを受信した場合、属性のデータが付加されていない場合がある。
発話データの属性に関するデータが付加されている場合(ステップS62;Yes)、言語処理部164は、言語属性を判定する(ステップS63)。例えば、ステップS61で受信したデータの言語が何語であるか、発話データを送信したHMD100の使用者が使用する言語等を判定する。
言語処理部164は、HMD100−1における翻訳の可否に関する設定を取得する(ステップS64)。そして、言語処理部164は、ステップS63で判定した言語の属性と、HMD100−1において設定されている使用言語の設定と、ステップS64で取得した翻訳可否の設定とに基づき、翻訳を行うか否かを判定する(ステップS65)。
例えば、HMD100−1において翻訳の可否が「不可」に設定されている場合、言語の種類を問わず翻訳を行わない。また、HMD100−1において翻訳の可否が「可能」に設定されている場合は、翻訳を行うことができる。この場合において、ステップS62で受信したデータの言語と、HMD100−1で使用者が使用する言語として設定された言語とが同じ種類の場合は、翻訳が不要であるから、翻訳を行わない。また、翻訳の可否が「可能」に設定され、ステップS62で受信したデータの言語が、HMD100−1の使用者が使用する言語と異なる種類の言語である場合は、翻訳を行う。
言語処理部164は、翻訳を行うと判定した場合(ステップS65;Yes)、ステップS61で受信したデータを翻訳し(ステップS66)、ステップS67に移行する。また、翻訳を行わないと判定した場合(ステップS65;No)、翻訳を行わずにステップS67に移行する。
言語処理部164は、表示用のテキストデータを生成して表示制御部190に渡し、表示制御部190がテキストを表示する(ステップS67)。また、言語処理部164は、読み上げ処理用のテキストデータを生成して音声処理部187に渡し、音声処理部187が読み上げ処理を行って、テキストデータに基づく音声を出力する(ステップS68)。
図10は、HMD100の動作を示すフローチャートであり、カメラ61の撮像画像データを送信する処理を示す。一例として、HMD100−1が図10の動作を実行する例を説明する。
撮像画像データを送信する場合、撮像制御部161が通信システム1の撮像画像データを取得し(ステップS61)、通信制御部170が、送信先に関する設定内容を取得する(ステップS82)。
さらに、通信制御部170は、通信システム1におけるHMD100−1の名称やHMD100−1の使用者の識別情報等、送信元(受信元)となるHMD100−1の属性を示すデータを、撮像画像データに付加する(ステップS83)。通信制御部170は、ステップS83で処理したデータと、音声処理部187が生成する発話データ、または発話解析データと撮像画像データとを含む会議データを生成する(ステップS84)。通信制御部170は、ステップS82で取得した設定に対応する送信先に、ステップS84で生成した会議データを送信する(ステップS85)。
図11は、通信システム1の動作を示すフローチャートであり、映像データを含む会議データを受信する動作を示す。図11において、(A)は管理サーバー3の動作を示し、(B)は会議データを受信するHMD100の動作を示す。一例として、HMD100−3が会議データを送信し、HMD100−2が会議データを受信する例を説明する。
HMD100−3が、例えば図10に示す動作を行って会議データを通信システム1の全てのHMD100に送信すると、この会議データは拠点中継装置5Bを経由して管理サーバー3に送信される。
管理サーバー3は、拠点中継装置5Bから会議データを受信し(ステップS101)、受信した会議データに含まれる撮像画像データに対し、顔認識処理を実行する(ステップS102)。顔認識処理では、制御部301は、撮像画像データから人間の顔の画像を抽出し、抽出した画像に対し、予め設定されたポイントの特徴量を算出する。記憶部302が記憶する参加者管理DB304には、会議の参加者の権限を有する使用者について、顔画像の特徴量のデータが含まれる。制御部301は、撮像画像データから抽出した画像の特徴量を、参加者管理DB304に含まれる画像の特徴量のデータと比較することで、撮像画像に写る参加者を特定する。制御部301は、特定した参加者の氏名や識別情報を参加者管理DB304から取得する。また、特定した参加者がHMD100を使用している場合には、使用されているHMD100を特定する情報を、例えば拠点管理DB303から取得する。
制御部301は、ステップS102で拠点管理DB303及び参加者管理DB304から取得した情報を、顔認識処理の結果として、ステップS101で受信した会議データに付加して、拠点中継装置5Aに送信する(ステップS103)。
HMD100−2の通信制御部170は、拠点中継装置5Aから会議データを受信し(ステップS111)、受信した会議データに、顔認識の認識結果が含まれるか否かを判定する(ステップS112)。認識結果が含まれない場合(ステップS112;No)、通信制御部170は、受信した会議データに含まれるテキストデータを表示制御部190に渡し、表示制御部190がテキストを表示する(ステップS113)。また、通信制御部170は、テキストデータを音声処理部187に渡し、音声処理部187が読み上げ処理を行って、テキストデータに基づく音声を出力する(ステップS113)。また、通信制御部170は、会議データから映像データを抽出して表示制御部190に渡し、表示制御部190が映像を表示する(ステップS113)。
また、認識結果が含まれると判定した場合(ステップS112;Yes)、通信制御部170は、受信した会議データから認識結果のデータを抽出して表示制御部190に渡し、表示用のデータを生成する(ステップS114)。これにより、ステップS113において、表示制御部190は、会議データに含まれる映像データを表示する際に、映像データに対する顔認識の結果を表示する。HMD100−2を装着する使用者は、HMD100−3のカメラ61が撮像した撮像画像を見ることができ、この撮像画像に写る参加者に関する情報を合わせて見ることができる。
図12は、HMD100の動作を示すフローチャートであり、ミュート動作を示す。
HMD100では、上述したように、P0モードに移行することでミュート動作を実行し、出力ミュート、撮像・集音ミュート、送信ミュートの状態となる。図12では、動作モード制御部163の制御により、HMD100の動作モードがP0モードに切り替えられ、出力ミュート、撮像・集音ミュート、送信ミュートの状態となる過程をフローチャートとして示す。
操作検出部162によって、ミュートを指示する操作を検出した場合(ステップS131)、動作モード制御部163は、操作に対応するミュートの種類、内容に関する設定を取得する(ステップS132)。
動作モード制御部163は、設定されたミュートの内容が出力ミュートであるか否かを判定する(ステップS133)。出力ミュートを行う場合(ステップS133;Yes)、動作モード制御部163は、表示制御部190による表示の動作、及び、音声処理部187による音声出力を停止させる(ステップS134)。
ステップS134で出力を停止した場合、及び、出力ミュートを行わないと判定した場合(ステップS133;No)、動作モード制御部163は、撮像・集音ミュートを行うか否かを判定する(ステップS135)。
ここで、撮像・集音ミュートを行うと判定した場合(ステップS135;Yes)、動作モード制御部163は、撮像画像データ及び発話データ(または発話解析データ)の出力を停止する(ステップS136)。
一方、撮像・集音ミュートを行わないと判定した場合(ステップS135;No)、動作モード制御部163は、送信ミュートを行うか否かを判定する(ステップS137)。送信ミュートを行うと判定した場合(ステップS137;Yes)、動作モード制御部163は、制限された送信先に関する設定内容を取得する(ステップS138)。送信ミュートでは、会議データ、発話データ、発話解析データを一切、送信しないよう制限されることがあるが、限られた送信先にのみ送信する制限が課される場合がある。具体的には、HMD100−2が、送信ミュートを実行する際に、拠点BのHMD100−3、HMD100−4にデータを送信しないが、拠点AにあるHMD100−1にデータを送信することがある。このため、ステップS138では、送信を制限された場合の送信先に関する設定を取得する。この設定は、記憶部120の設定データ121に含まれてもよいが、管理サーバー3が有する拠点管理DB303に設定されていてもよい。通信制御部170は、ステップS138で取得した設定に従って、データの送信を行う(ステップS139)。
また、送信ミュートを行わないと判定した場合(ステップS137;No)、動作モード制御部163は、ミュート動作の実体がないため、本処理を終了する。
以上説明したように、実施形態に係る表示システム1は、複数のHMD100を備えて構成される。通信システム1が備えるHMD100−1、HMD100−2、HMD100−3、HMD100−4は、それぞれ、第1表示装置、及び、第2表示装置に相当する。
上記構成において、第1表示装置として機能するHMD100の画像表示部20は第1表示部に相当し、通信部117は第1通信部に相当する。音声処理部187は第1音声処理部に相当し、通信制御部170は第1通信制御部に相当し、表示制御部190は第1表示制御部に相当する。また、第2表示装置として機能するHMD100の画像表示部20は、第2表示部に相当し、通信部117は第2通信部に相当する。音声処理部187は第2音声処理部に相当し、通信制御部170は第2通信制御部に相当し、表示制御部190は第2表示制御部に相当する。
表示装置としてのHMD100は、使用者の頭部に装着され、画像を表示する画像表示部20と、データを送受信する通信部117と、音声を検出して、検出した音声から発話データを生成する音声処理部187とを備える。また、音声処理部187により生成した発話データ、または、発話データを解析して得られる発話解析データを通信部117により送信させ、通信部117により発話データまたは発話解析データを受信する通信制御部170を備える。また、通信部117により受信した発話データまたは発話解析データに基づく画像を画像表示部20に表示させる表示制御部190を備える。
この表示装置としてのHMD100、及び、HMD100が実行する表示装置の制御方法によれば、使用者の頭部に装着されるHMD100が、音声を検出して発話データ、または発話データを解析した発話解析データを送信する。また、HMD100は、発話データ、または発話データを受信して、発話データまたは発話データに基づく表示を行える。これにより、HMD100を装着する使用者の音声を発話データまたは発話解析データとして、他のHMD100や、コンピューター等の外部の装置に送信できる。また、発話データまたは発話解析データを受信して、例えば文字や画像等を表示できる。従って、HMD100と、他のHMD100等の外部の装置との間で、音声に基づくデータを効率よく送受信し、HMD100を装着する使用者に対する音声による情報の提供、及び、使用者の音声に基づく情報の発信を効率化できる。
音声処理部187は、検出した音声から発話データを生成し、生成した発話データに対し認識処理を実行し、認識結果を発話解析データとして出力する。これにより、HMD100を装着する使用者の音声を、例えばテキストを含む発話解析データとして、他の表示装置や、コンピューター等の外部の装置に送信できる。従って、HMD100から外部の装置に対し、HMD100を装着する使用者の音声に関する情報の発信を効率化できる。
表示制御部190は、例えば図8(A)〜(C)に示したように、音声コマンドによる操作を行うための音声操作用インターフェイスを表示する。音声処理部187は、表示制御部190により音声操作用インターフェイスを表示する間に検出した音声が音声コマンドに該当するか否かを判定し、音声コマンドに該当する場合に音声操作用インターフェイスで表示された項目に対する操作を検出する。これにより、音声コマンドにより表示装置を操作することができ、操作性の向上を図ることができる。
また、HMD100は、音声を出力する音声出力部として、スピーカー68、69を備える。音声処理部187は、通信部117により受信した発話データまたは発話解析データに基づく音声を、スピーカー68、69によって出力する。これにより、HMD100が発話データまたは発話解析データを受信して音声を出力し、使用者に対して音声による情報提供や指示を行うことができる。
また、HMD100は、通信部117により受信した発話データまたは発話解析データを、他の言語の発話データまたは発話解析データに変換する言語処理部164を備える。これにより、発話データまたは発話解析データを受信して他の言語のデータに変換できる。このため、受信した発話データまたは発話解析データの言語と使用者が使用する言語とが異なる場合であっても、使用者に対し音声による情報提供や指示を行うことができる。
また、HMD100は、HMD100の動作モードを切り替えて実行する動作モード制御部163を備える。動作モード制御部163は、音声処理部187が音声を検出するか否か、音声出力部の音声出力をするか否か等に応じたミュートを行うP0モードへの切り替えを制御できる。動作モード制御部163は、通信部117により発話データまたは発話解析データを送信する送信先、及び、通信部117により発話データまたは発話解析データを受信する受信元の少なくともいずれかが異なる動作モードを切り替えることもできる。HMD100を構成する機能部のうち、例えば、音声処理部187、及び、通信制御部170のうち少なくともいずれかは、動作モード制御部163が実行する動作モードに対応する設定に従って動作する。これにより、動作モード制御部163が動作モードを切り替えて、音声を検出するか否か、音声出力をするか否か、発話データまたは発話解析データを送信する送信先、及び、発話データまたは発話解析データを受信する受信元等を切り替えることができる。
さらに、HMD100は、使用者に割り当てられる権限と、動作モード制御部が実行可能な動作モードとを対応付ける設定情報を記憶する記憶部120を備える。この設定情報は、管理サーバー3が記憶してもよい。動作モード制御部163は、画像表示部20を装着する使用者の権限を判定し、設定情報において、判定した権限に対応付けられた動作モードを実行する。これにより、使用者の権限に対応して、例えば一部の機能の実行を制限することができる。従って、HMD100が多機能化した場合であっても、機能の利用範囲を適切に制限できる。
また、HMD100は、操作を検出する操作検出部162を備え、動作モード制御部163は、操作検出部162で検出する操作に応じて動作モードを切り替えることができる。これにより、使用者の操作に応じて、速やかに動作モードを切り替えることができる。操作検出部162が検出する操作は、操作部111に対する操作であってもよいし、画像表示部20が備えるノックセンサー62、ミュートスイッチ65、9軸センサー66で検出する操作であってもよい。また、カメラ61の撮像画像に基づき、使用者のジェスチャーを検出してもよい。さらに、マイク63が集音する音声に基づき、音声コマンドを操作として検出してもよい。
操作検出部162は、ノックセンサー62の検出値に基づき、画像表示部20に対するノック操作を検出する。ノック操作は、使用者が手や道具を用いて、HMD100を叩く操作を指し、1回叩く操作を一つのノック操作とする。本実施形態では画像表示部20がノックセンサー62を内蔵するので、画像表示部20に対するノック操作に基づく検出値が、制御部140に入力される。操作検出部162は、ノックセンサー62の検出値から、画像表示部20に対するノック操作を検出してもよいし、ノック操作が1回行われた場合と、連続して複数回のノック操作が行われた場合とを区別してもよい。この場合、操作検出部162は、1回のノック操作に対応して制御部140の他の機能部に出力するコマンドと、複数回の連続ノック操作に対応して制御部140の他の機能部に出力するコマンドとを、異なるコマンドとすることができる。また、操作検出部は、ノックセンサー62により検出されたノックの方向に応じたコマンドを生成して出力してもよい。例えば、ノックセンサー62が検出したノック操作が、画像表示部20に対するX軸方向のノックであるか、Y軸方向のノックであるか、Z軸方向のノックであるかを判定して、判定した方向に応じたコマンドを出力してもよい。この場合、例えば右表示駆動部22を側方から叩く操作と、画像表示部20を前方から叩く操作とを区別して、制御部140が処理を実行できる。
また、HMD100は、画像表示部20に取り付けられて音声を集音する集音部としてのマイク63を備える。音声処理部187は、マイク63により集音された音声を検出する。これにより、画像表示部20に取り付けられたマイク63により音声を集音し、発話データまたは発話解析データを送信できる。
音声処理部187は、マイク63の種類を判定し、判定したマイク63の種類に応じて、集音された音声から発話データまたは発話解析データを生成する処理の設定を切り替えてもよい。この場合、マイク63の種類に対応する設定を行うことで、発話データまたは発話解析データを生成する処理を効率よく適切に実行できる。
また、HMD100は、カメラ61を備え、通信制御部170は、カメラ61で撮像した撮像画像データを含む会議データ、または、撮像画像データと発話データとを含む会議データを通信部117により送信してもよい。この場合、撮像した画像データを、管理サーバー3や他のHMD100など、外部の装置に送信できる。
また、表示制御部190は、通信部117により受信された会議データに含まれる撮像画像データに基づく画像を画像表示部20により表示できるので、使用者に対し、音声と映像による情報提供や指示を行うことができる。
[第2実施形態]
図13は、本発明を適用した第2実施形態に係るHMD100Bの外観構成を示す図である。
この図13に示すHMD100Bは、HMD100(図2)において、マイク63に代えて、マイクユニット70を設けた構成である。マイクユニット70は、画像表示部20を構成するフレームに取り付けられるアーム部71と、アーム部71の先端に配置されるマイク73(集音部)とを有する。アーム部71は、図13の例では右保持部21に固定される。アーム部71は、軸方向に伸縮可能に構成され、アーム部71の長さは、図示しないセンサーにより制御部140が検出可能である。
また、マイク63とマイクユニット70の相違を除き、HMD100Bは、HMD100と同様に構成される。
この構成において、操作検出部162は、アーム部71を伸縮させる操作、または、アーム部71の長さを検出する。操作検出部162は、アーム部71を伸縮させる操作を検出した場合、或いは、アーム部71の長さが設定された長さになった場合に、ミュートを指示する操作を検出する。動作モード制御部163は、操作検出部162が、ミュートを指示する操作を検出した場合に、HMD100Bの動作モードを、P0モードに切り替える。このように、動作モード制御部163が、画像表示部20に対する集音部であるマイク73の相対位置に対応して、動作モードを切り替える。これにより、アーム部71を伸縮させてマイク73を動かす操作により、HMD100Bを、ミュートを行うP0モードに移行させることができる。
例えば、撮像・集音ミュートを行う場合、マイク73が音声を集音しなくなるか、集音した音声のデータが出力されなくなる。そこで、マイク73を、使用者の口元から離れる方向に移動させる操作に対応して、P0モードに切り替えると、使用者は、直感的にマイク73を口元の近くから移動させることで、ミュートを指示できる。この構成では、直感的で簡単な操作により、使用者が意図する動作モードへの切り替えを行うことができ、操作性の向上を図ることができる。
このように、動作モード制御部163は、HMD100の特定の部位に対する操作や、特定の部位の状態に応じて、実行する動作モードを判定し、動作モードを切り替えてもよい。第2実施形態で説明したアーム部71の長さの調整は、この一例である。このほか、例えば、マイク63やマイクユニット70に代えて、Bluetoothヘッドセットを使用することもできる。このヘッドセットは、例えば通信部117と、Bluetoothの通信を実行するので、制御装置10、及び画像表示部20とは別体として構成される。この場合、ヘッドセットにおいてマイクの角度やマイクの位置を検出し、検出した角度や位置を示すデータを制御装置10に送信することができれば、操作検出部162は、マイクの角度や位置の変化を、モード切り替えを指示する操作として検出できる。
なお、本発明は上記各実施形態の構成に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能である。
例えば、通信システム1は、通信ネットワーク4を介して接続される拠点中継装置5A、5Bと、拠点中継装置5A、5Bとそれぞれ通信するHMD100−1〜4を備えて構成される例に限定されない。例えば、HMD100以外の表示装置を、拠点中継装置5A、5Bに接続してもよい。また、管理サーバー3以外の装置を、通信ネットワーク4を介して拠点中継装置5A、5Bと通信可能に接続してもよい。
この種の表示装置は、HMD100に限定されない。例えば、液晶表示パネルに画像を表示する液晶モニター又は液晶テレビ、或いは、PDP(プラズマディスプレイパネル)に画像を表示するモニター装置又はテレビ受像機であってもよい。また、OLED(Organic light-emitting diode)、OEL(Organic Electro-Luminescence)等と呼ばれる有機EL表示パネルに画像を表示するモニター装置又はテレビ受像機等の自発光型の表示装置など、各種の表示装置も本発明の表示装置に含まれる。
また、HMD100は、上記各実施形態の構成に限定されない。例えば、画像表示部20に代えて、例えば帽子のように装着する画像表示部等の他の方式の画像表示部を採用してもよく、使用者の左眼に対応して画像を表示する表示部と、使用者の右眼に対応して画像を表示する表示部とを備えていればよい。また、本発明の表示装置は、例えば、自動車や飛行機等の車両に搭載されるヘッドマウントディスプレイや、ヘッドアップディスプレイとして構成されてもよい。また、例えば、ヘルメット等の身体防護具に内蔵されたヘッドマウントディスプレイとして構成されてもよい。この場合、使用者の身体に対する位置を位置決めする部分、及び、当該部分に対し位置決めされる部分を装着部とすることができる。
さらに、上記各実施形態では、HMD100、100Bは、画像表示部20と制御装置10とが分離され、接続ケーブル40を介して接続された構成として説明した。本発明はこれに限定されず、制御装置10と画像表示部20とが一体に構成され、使用者の頭部に装着される構成とすることも可能である。
また、HMD100、100Bは、少なくとも、表示を行う画像表示部20が、使用者(被援助者、指令者)の頭部に装着される装置であればよく、制御装置210の装着状態は限定されない。このため、制御装置10として、ノート型コンピューター、タブレット型コンピューター又はデスクトップ型コンピューターを用いてもよい。また、制御装置10として、ゲーム機や携帯型電話機やスマートフォンや携帯型メディアプレーヤーを含む携帯型電子機器、その他の専用機器等を用いてもよい。また、制御装置10が画像表示部20と分離して構成され、制御装置10と画像表示部20との間で無線通信により各種信号を送受信する構成としてもよい。
また、上記第1実施形態では、表示システム1が備えるHMD100−1〜HMD100−4が、いずれも共通の構成を有するものとして説明した。本発明はこれに限定されず、表示システム1を構成するHMD100の一部または全部が、異なる構成を有していてもよい。具体的には、一部のHMD100において、他のHMD100、100Bが有する機能部を省略する構成としてもよい。例えば、カメラ61で撮像して撮像画像を送信する動作モードを実行しないHMD100がある場合、このHMD100は、カメラ61を備えない構成であってもよい。また、音声や映像のデータを受信する動作を実行し、音声の検出を行わないHMD100が、マイク63を備えない構成とすることも可能である。このほか、各種センサーや、記憶部120が記憶するデータなどについて、表示システム1が備えるHMD100−1〜HMD100−4の一部が異なる構成であってもよい。表示システム1のHMD100−1〜HMD100−4を、HMD100Bに置き換えた場合も同様である。
また、上記実施形態では、HMD100が送信する会議データについて、管理サーバー3が、会議データに含まれる撮像画像データに対する顔認識処理を実行する例を説明した。この例では、制御部301が、撮像画像データから人間の顔を検出することにより、撮像画像に写る参加者の氏名や識別情報を参加者管理DB304から取得する。これによって、会議に参加している参加者に関する情報を、管理サーバー3が、提供するものとした。この動作において、管理サーバー3が、当該会議データに含まれる撮像画像を撮像したHMD100の使用者に関する情報を、他のHMD100に提供してもよい。会議データに含まれる撮像画像を撮像したHMD100の使用者は、その撮像画像に写らないが、この使用者に関する情報を、例えば管理サーバー3が提供することで、会議の参加者について漏れなく情報を提供できる。具体的には、HMD100が、会議データを構成する撮像画像データを送信する際に、送信元であるHMD100を特定可能な情報を付加して送信する。この情報が、HMD100の使用者を特定する情報や、使用者の顔の画像、使用者の氏名等に関する情報等を含んでもよい。管理サーバー3は、HMD100が送信する会議データを中継する処理において、送信元のHMD100を特定する情報、或いは、このHMD100の使用者を特定可能な情報に基づき、参加者管理DB304を参照する。そして、このHMD100を使用する参加者の氏名や識別情報を参加者管理DB304から取得する。
さらに、表示システム1において、会議データに含まれる撮像画像に写っている人物が装着し使用するHMD100の位置情報と、撮像画像を撮像したHMD100の位置情報とに基づき、撮像画像に写る参加者と位置情報とを対応付けることができる。この対応付けを行う処理は、管理サーバー3、或いはHMD100が実行でき、位置の対応付けは拠点A、Bのそれぞれにおいて行うことができる。また、位置情報は、GPSを利用して取得できる位置情報であってもよいし、HMD100が備える9軸センサー66を利用した位置トラッキングで得られる位置情報であってもよい。或いは、HMD100が通信部117により無線通信を実行することにより得られる位置情報であってもよい。この場合、HMD100の位置情報と、他のHMD100の撮像画像とをもとに、当該HMD100を使用する使用者の顔の画像を取得できる。このため、予め各参加者の顔画像を参加者管理DB304に格納していなくても、それぞれのHMD100に対し、参加者に関する情報を提供できる。また、HMD100の撮像画像データと、それぞれのHMD100の使用者との関連づけを複数回行うことで、それぞれのHMD100の使用者の顔画像のデータの抽出が可能となり、このようにして抽出した顔画像を、参加者管理DB304に格納してもよい。
また、例えば、画像表示部20において画像光を生成する構成として、有機EL(有機エレクトロルミネッセンス、Organic Electro-Luminescence)のディスプレイと、有機EL制御部とを備える構成としてもよい。また、画像光を生成する構成として、LCOS(Liquid crystal on silicon, LCoSは登録商標)や、デジタル・マイクロミラー・デバイス等を用いることもできる。
また、画像光を使用者の眼に導く光学系としては、外部から装置に向けて入射する外光を透過する光学部材を備え、画像光とともに使用者の眼に入射させる構成を採用できる。また、使用者の眼の前方に位置して使用者の視界の一部または全部に重なる光学部材を用いてもよい。さらに、レーザー光等を走査させて画像光とする走査方式の光学系を採用してもよい。また、光学部材の内部で画像光を導光させるものに限らず、使用者の眼に向けて画像光を屈折及び/または反射させて導く機能のみを有する構成としてもよい。
例えば、レーザー網膜投影型のヘッドマウントディスプレイに対して本発明を適用することも可能である。すなわち、光射出部が、レーザー光源と、レーザー光源を使用者の眼に導く光学系とを備え、レーザー光を使用者の眼に入射させて網膜上を走査し、網膜に結像させることにより、使用者に画像を視認させる構成を採用してもよい。
また、本発明を、MEMSミラーを用いた走査光学系を採用し、MEMSディスプレイ技術を利用した表示装置に適用することも可能である。すなわち、信号光形成部と、信号光形成部が射出する光を走査するMEMSミラーを有する走査光学系と、走査光学系により走査される光によって虚像が形成される光学部材とを光射出部として備えてもよい。この構成では、信号光形成部が射出した光がMEMSミラーにより反射され、光学部材に入射し、光学部材の中を導かれて、虚像形成面に達する。MEMSミラーが光を走査することにより、虚像形成面に虚像が形成され、この虚像を使用者が眼で捉えることで、画像が認識される。この場合の光学部品は、例えば上記実施形態の右導光板261及び左導光板262のように、複数回の反射を経て光を導く部品であってもよく、ハーフミラー面を利用してもよい。
さらに、本発明の光学素子は、ハーフミラー261A、262Aを有する右導光板261、左導光板262に限定されず、画像光を使用者の眼に入射させる光学部品であればよく、具体的には、回折格子、プリズム、ホログラフィー表示部を用いてもよい。
なお、図4、及び図5に示した各機能ブロックのうち少なくとも一部は、ハードウェアで実現してもよいし、ハードウェアとソフトウェアの協働により実現される構成としてもよい。その構成は、図4及び図5に示した通りに独立したハードウェア資源を配置する構成に限定されない。また、上記実施形態で説明した制御部140、301の動作をプログラムとして実現することも可能である。上記のプログラムは、その一部または全部をハードウェアとして実現してもよい。例えば、制御部140、301が備える上記の各処理部は、ASIC(Application Specific Integrated Circuit:特定用途向け集積回路)を用いて構成されてもよい。また、FPGA(Field-Programmable Gate Array)等のPLD(Programmable Logic Device)をプログラミングして構成してもよい。また、複数の半導体デバイスを含む回路として実現してもよい。
また、ハードウェアがプログラムを実行して上記機能を実現する場合、このプログラムは、制御部140のROM、或いは、記憶部120または別の記憶装置に記憶されてもよい。或いは、HMD100、100Bに外部接続される記憶装置や記憶媒体に上記プログラムを格納してもよい。この場合、これらの記憶装置や記憶媒体から、プログラムを記憶部120等に取り込んで実行することも可能である。また、外部の装置に記憶されたプログラムを通信部やインターフェイス部を介して取得して実行する構成としてもよい。
1…通信システム、3…管理サーバー、4…通信ネットワーク、5、5A、5B…拠点中継装置、10…制御装置、20…画像表示部(表示部)、20A…調光板、21…右保持部、23…左保持部、25…インターフェイス、32…右イヤホン、34…左イヤホン、40…接続ケーブル、61…カメラ(撮像部)、62…ノックセンサー、63…マイク(集音部)、64…距離センサー、65…ミュートスイッチ、66…9軸センサー、68、69…スピーカー(音声出力部)、70…マイクユニット、71…アーム部、73…マイク(集音部)、100、100B…HMD(表示装置)、110…入力情報取得部、111…操作部、114…インターフェイス、115…GPS、117…通信部、120…記憶部、121…設定データ、122…音声認識データベース、123…表示設定データ、124…モード設定データ、130…電源部、140…制御部、150…オペレーティングシステム、160…画像処理部、161…撮像制御部、162…操作検出部、163…動作モード制御部、164…言語処理部、170…通信制御部、187…音声処理部、201…右バックライト制御部、202…左バックライト制御部、210…制御装置、211…右LCD制御部、212…左LCD制御部、221…右バックライト、222…左バックライト、241…液晶ディスプレイ、242…液晶ディスプレイ、251…右投写光学系、252…左投写光学系、261…右導光板、261A…ハーフミラー、262…左導光板、262A…ハーフミラー、301…制御部、302…記憶部、303…拠点管理データベース、304…参加者管理データベース、306…通信部、400…画像表示領域、411、412…ドロワータグ、421〜426…メニューリスト、431…動作表示、432…メニュー、433…メニュー、A、B…拠点、EL…端部、ER…端部、OA…外部機器、RE…右眼、V…視野。

Claims (16)

  1. 使用者の頭部に装着され、画像を表示する表示部と、
    データを送受信する通信部と、
    音声を検出して、検出した音声から発話データを生成する音声処理部と、
    前記音声処理部により生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを前記通信部により送信させ、前記通信部により前記発話データまたは前記発話解析データを受信する通信制御部と、
    前記通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記表示部に表示させる表示制御部と、
    を備えることを特徴とする表示装置。
  2. 前記音声処理部は、検出した音声から発話データを生成し、生成した発話データに対し認識処理を実行し、認識結果を前記発話解析データとして出力すること、
    を特徴とする請求項1記載の表示装置。
  3. 前記表示制御部は、音声コマンドによる操作を行うための音声操作用インターフェイスを表示し、
    前記音声処理部は、前記表示制御部により前記音声操作用インターフェイスを表示する間に検出した音声が音声コマンドに該当するか否かを判定し、音声コマンドに該当する場合に前記音声操作用インターフェイスで表示された項目に対する操作を検出すること、
    を特徴とする請求項1または2記載の表示装置。
  4. 音声を出力する音声出力部を備え、
    前記音声処理部は、前記通信部により受信した前記発話データまたは前記発話解析データに基づく音声を前記音声出力部によって出力すること、
    を特徴とする請求項1から3のいずれかに記載の表示装置。
  5. 前記通信部により受信した前記発話データまたは前記発話解析データを、他の言語の前記発話データまたは前記発話解析データに変換する言語処理部を備えること、
    を特徴とする請求項1から4のいずれかに記載の表示装置。
  6. 前記音声処理部が音声を検出するか否か、前記音声出力部の音声出力をするか否か、前記通信部により前記発話データまたは前記発話解析データを送信する送信先、及び、前記通信部により前記発話データまたは前記発話解析データを受信する受信元の少なくともいずれかが異なる複数の動作モードを、切り替えて実行する動作モード制御部を備え、
    前記音声処理部、及び、前記通信制御部のうち少なくともいずれかは、前記動作モード制御部が実行する動作モードに対応する設定に従って動作すること、
    を特徴とする請求項1から5のいずれかに記載の表示装置。
  7. 前記使用者に割り当てられる権限と、前記動作モード制御部が実行可能な動作モードとを対応付ける設定情報を記憶する記憶部を備え、
    前記動作モード制御部は、前記表示部を装着する使用者の権限を判定し、前記設定情報において、判定した権限に対応付けられた動作モードを実行すること、
    を特徴とする請求項6記載の表示装置。
  8. 操作を検出する操作検出部を備え、
    前記動作モード制御部は、前記操作検出部で検出する操作に応じて動作モードを切り替えること、
    を特徴とする請求項6または7記載の表示装置。
  9. 前記表示部に取り付けられて音声を集音する集音部を備え、
    前記音声処理部は前記集音部により集音された音声を検出すること、
    を特徴とする請求項1から8のいずれかに記載の表示装置。
  10. 前記集音部は前記表示部に対する相対位置を変位可能に構成され、
    前記動作モード制御部は、前記表示部に対する前記集音部の相対位置に対応して、動作モードを切り替えること、
    を特徴とする請求項9記載の表示装置。
  11. 前記音声処理部は、前記集音部の種類を判定し、判定した前記集音部の種類に応じて、前記集音部により集音された音声から前記発話データまたは前記発話解析データを生成する処理の設定を切り替えること、
    を特徴とする請求項9または10記載の表示装置。
  12. 撮像部を備え、
    前記通信制御部は、前記撮像部で撮像した撮像画像データを含む会議データ、または、前記撮像画像データと前記発話データとを含む会議データを前記通信部により送信すること、
    を特徴とする1から11のいずれかに記載の表示装置。
  13. 前記表示制御部は、前記通信部により受信された前記会議データに含まれる前記撮像画像データに基づく画像を前記表示部により表示すること、
    を特徴とする請求項12記載の表示装置。
  14. 第1表示装置、及び、第2表示装置を通信可能に接続し
    前記第1表示装置は、
    使用者の頭部に装着され、画像を表示する第1表示部と、
    第1通信部と、
    音声を検出して、検出した音声から発話データを生成する第1音声処理部と、
    前記第1音声処理部により生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを前記第1通信部により送信させ、前記第1通信部により前記発話データまたは前記発話解析データを受信する第1通信制御部と、
    前記第1通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記第1表示部に表示させる第1表示制御部と、を備え、
    前記第2表示装置は、
    使用者の頭部に装着され、画像を表示する第2表示部と、
    第2通信部と、
    音声を検出して、検出した音声から発話データを生成する第2音声処理部と、
    前記第2音声処理部により生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを前記第1通信部により送信させ、前記第2通信部により前記発話データまたは前記発話解析データを受信する第2通信制御部と、
    前記第2通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記第2表示部に表示させる第2表示制御部と、を備えること、
    を特徴とする通信システム。
  15. 使用者の頭部に装着され、画像を表示する表示部を備えた表示装置の制御方法であって、
    音声を検出して、検出した音声から発話データを生成し、
    生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを通信部により送信し、
    前記通信部により前記発話データまたは前記発話解析データを受信し、
    前記通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記表示部に表示すること、
    を特徴とする表示装置の制御方法。
  16. 使用者の頭部に装着され、画像を表示する表示部を備えた表示装置を制御するコンピューターが実行可能なプログラムであって、
    前記コンピューターにより、
    音声を検出して、検出した音声から発話データを生成し、
    生成した前記発話データ、または、前記発話データを解析して得られる発話解析データを通信部により送信し、
    前記通信部により前記発話データまたは前記発話解析データを受信し、
    前記通信部により受信した前記発話データまたは前記発話解析データに基づく画像を前記表示部に表示すること、
    を特徴とするプログラム。
JP2015232821A 2015-11-30 2015-11-30 表示装置、通信システム、表示装置の制御方法、及び、プログラム Pending JP2017102516A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015232821A JP2017102516A (ja) 2015-11-30 2015-11-30 表示装置、通信システム、表示装置の制御方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015232821A JP2017102516A (ja) 2015-11-30 2015-11-30 表示装置、通信システム、表示装置の制御方法、及び、プログラム

Publications (1)

Publication Number Publication Date
JP2017102516A true JP2017102516A (ja) 2017-06-08

Family

ID=59015390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015232821A Pending JP2017102516A (ja) 2015-11-30 2015-11-30 表示装置、通信システム、表示装置の制御方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP2017102516A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019197251A (ja) * 2018-05-07 2019-11-14 セイコーエプソン株式会社 接続装置、表示装置、接続装置の制御方法、及び、表示装置の制御方法
JP2020047062A (ja) * 2018-09-20 2020-03-26 Dynabook株式会社 電子機器および制御方法
WO2020095784A1 (ja) * 2018-11-06 2020-05-14 日本電気株式会社 表示制御装置、表示制御方法、及びプログラムが格納された非一時的なコンピュータ可読媒体
KR20200060451A (ko) * 2017-09-26 2020-05-29 아우디 아게 적어도 제1 사람과 제2 사람 사이의 가상 미팅을 수행하기 위한 방법 및 시스템
WO2020218095A1 (ja) * 2019-04-26 2020-10-29 株式会社ソニー・インタラクティブエンタテインメント 情報処理システム、コントローラ、情報処理装置、情報処理装置の制御方法、及びプログラム
JP2020182988A (ja) * 2019-04-26 2020-11-12 ファナック株式会社 ロボット教示装置
JP2021077142A (ja) * 2019-11-11 2021-05-20 株式会社ブイキューブ 情報処理装置、情報処理方法及びプログラム
CN113763192A (zh) * 2020-06-04 2021-12-07 富士胶片商业创新有限公司 信息处理装置、信息处理方法和计算机可读介质
KR20220161094A (ko) * 2021-05-28 2022-12-06 주식회사 피앤씨솔루션 오프라인 환경에서 음성 명령어 번역 기능을 갖는 증강현실 글라스 장치
JP7503021B2 (ja) 2021-04-19 2024-06-19 本田技研工業株式会社 情報管理システム

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7038217B2 (ja) 2017-09-26 2022-03-17 アウディ アクチェンゲゼルシャフト 少なくとも第1の人物と第2の人物との間でバーチャル会議を行う方法およびシステム
KR20200060451A (ko) * 2017-09-26 2020-05-29 아우디 아게 적어도 제1 사람과 제2 사람 사이의 가상 미팅을 수행하기 위한 방법 및 시스템
JP2020535489A (ja) * 2017-09-26 2020-12-03 アウディ アクチェンゲゼルシャフトAudi Ag 少なくとも第1の人物と第2の人物との間でバーチャル会議を行う方法およびシステム
KR102445595B1 (ko) 2017-09-26 2022-09-20 아우디 아게 적어도 제1 사람과 제2 사람 사이의 가상 미팅을 수행하기 위한 방법 및 시스템
US11277584B2 (en) 2017-09-26 2022-03-15 Audi Ag Method and system for carrying out a virtual meeting between at least a first person and a second person
JP2019197251A (ja) * 2018-05-07 2019-11-14 セイコーエプソン株式会社 接続装置、表示装置、接続装置の制御方法、及び、表示装置の制御方法
JP7135413B2 (ja) 2018-05-07 2022-09-13 セイコーエプソン株式会社 接続装置、表示装置、接続装置の制御方法、及び、表示装置の制御方法
JP2020047062A (ja) * 2018-09-20 2020-03-26 Dynabook株式会社 電子機器および制御方法
WO2020095784A1 (ja) * 2018-11-06 2020-05-14 日本電気株式会社 表示制御装置、表示制御方法、及びプログラムが格納された非一時的なコンピュータ可読媒体
US11906741B2 (en) 2018-11-06 2024-02-20 Nec Corporation Display control device, display control method, and non-transitory computer-readable medium storing program
JP7226836B2 (ja) 2018-11-06 2023-02-21 日本電気株式会社 表示制御装置、プレゼンテーションシステム、表示制御方法、及びプログラム
JPWO2020095784A1 (ja) * 2018-11-06 2021-10-07 日本電気株式会社 表示制御装置、プレゼンテーションシステム、表示制御方法、及びプログラム
JP2020182988A (ja) * 2019-04-26 2020-11-12 ファナック株式会社 ロボット教示装置
JP7063844B2 (ja) 2019-04-26 2022-05-09 ファナック株式会社 ロボット教示装置
JPWO2020218095A1 (ja) * 2019-04-26 2021-10-21 株式会社ソニー・インタラクティブエンタテインメント 情報処理システム、コントローラ、情報処理装置、情報処理装置の制御方法、及びプログラム
JP7220780B2 (ja) 2019-04-26 2023-02-10 株式会社ソニー・インタラクティブエンタテインメント 情報処理システム、コントローラ、情報処理装置、情報処理装置の制御方法、及びプログラム
WO2020218095A1 (ja) * 2019-04-26 2020-10-29 株式会社ソニー・インタラクティブエンタテインメント 情報処理システム、コントローラ、情報処理装置、情報処理装置の制御方法、及びプログラム
JP2021077142A (ja) * 2019-11-11 2021-05-20 株式会社ブイキューブ 情報処理装置、情報処理方法及びプログラム
CN113763192A (zh) * 2020-06-04 2021-12-07 富士胶片商业创新有限公司 信息处理装置、信息处理方法和计算机可读介质
JP7503021B2 (ja) 2021-04-19 2024-06-19 本田技研工業株式会社 情報管理システム
KR20220161094A (ko) * 2021-05-28 2022-12-06 주식회사 피앤씨솔루션 오프라인 환경에서 음성 명령어 번역 기능을 갖는 증강현실 글라스 장치
KR102602513B1 (ko) * 2021-05-28 2023-11-16 주식회사 피앤씨솔루션 오프라인 환경에서 음성 명령어 번역 기능을 갖는 증강현실 글라스 장치

Similar Documents

Publication Publication Date Title
JP2017102516A (ja) 表示装置、通信システム、表示装置の制御方法、及び、プログラム
CN108957761B (zh) 显示装置及其控制方法、头戴式显示装置及其控制方法
US9959591B2 (en) Display apparatus, method for controlling display apparatus, and program
JP6155622B2 (ja) 表示装置、頭部装着型表示装置、表示装置の制御方法、および、頭部装着型表示装置の制御方法
US20160313973A1 (en) Display device, control method for display device, and computer program
JP6344125B2 (ja) 表示装置、表示装置の制御方法、および、プログラム
US20160133051A1 (en) Display device, method of controlling the same, and program
US9794684B2 (en) Head-mounted display device, control method for the same, and computer program
US9972319B2 (en) Display device, method of controlling display device, and program having display of voice and other data
JP2017016056A (ja) 表示システム、表示装置、表示装置の制御方法、及び、プログラム
JP6432197B2 (ja) 表示装置、表示装置の制御方法、および、プログラム
JP6459380B2 (ja) 頭部装着型表示装置、頭部装着型表示装置の制御方法、および、コンピュータープログラム
JP2016004340A (ja) 情報配信システム、頭部装着型表示装置、頭部装着型表示装置の制御方法、および、コンピュータープログラム
JP2016126381A (ja) 頭部装着型表示装置、頭部装着型表示装置の制御方法、および、コンピュータープログラム
US20160035137A1 (en) Display device, method of controlling display device, and program
JP6364735B2 (ja) 表示装置、頭部装着型表示装置、表示装置の制御方法、および、頭部装着型表示装置の制御方法
JP2016024208A (ja) 表示装置、表示装置の制御方法、および、プログラム
JP2014187574A (ja) 頭部装着型表示装置および頭部装着型表示装置の制御方法
JP2016033611A (ja) 情報提供システム、表示装置、および、表示装置の制御方法
JP2017120488A (ja) 表示装置、表示システム、表示装置の制御方法、及び、プログラム
JP6569320B2 (ja) 電子機器、及び、電子機器の制御方法
JP6539981B2 (ja) 表示装置、表示装置の制御方法、表示システム、及び、プログラム
JP2017120302A (ja) 表示装置、表示システム、表示装置の制御方法、及び、プログラム
JP2016033763A (ja) 表示装置、表示装置の制御方法、および、プログラム
JP6467922B2 (ja) 頭部装着型表示装置、頭部装着型表示装置の制御方法、情報システム、および、コンピュータープログラム