JP2022092765A

JP2022092765A - 音声チャット端末、及びその制御方法

Info

Publication number: JP2022092765A
Application number: JP2020205655A
Authority: JP
Inventors: 健二吉田; Kenji Yoshida
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2022-06-23

Abstract

【課題】チャット相手に出力される音声を適切にミュートすることができる音声チャット端末、及びその制御方法を提供する。【解決手段】本実施の形態にかかる音声チャット端末１００は、ユーザＡの音声を検出するマイク１１３と、マイク１１３で検出されたユーザＡの音声の音声データを、ネットワークを介してチャット相手の端末に送信する音声データ送信部１１４と、マイク１１３がユーザＡ以外の発話者Ｃの音声を検出した場合に、チャット相手の端末に送信される音声データの音声をミュートする音声ミュート部１１２と、を備えている。【選択図】図１

Description

本発明は、音声チャット端末、及びその制御方法に関する。

特許文献１には、音声を用いるチャットシステムが開示されている。特許文献１では、チャットシステムが、他の端末のユーザの通話可能度合いを示す情報を取得している。そして、通話可能度合いを示す情報に応じて、接続先候補毎の接続ボタンの表示を変化させている。

特開２０１８－０９２５２８号公報

このような音声チャット端末では、意図しない発話内容が相手方に送信されてしまうという問題点がある。例えば、ユーザＡと通話相手Ｂとの音声チャット中に、発話者ＣがユーザＡに発話すると、通話相手Ｂが発話者Ｃの発話内容を聞いてしまう。発話者の発話内容に機密情報が含まれている場合、通話相手Ｂに機密情報が漏洩してしまうおそれがある。ユーザが、マウスなどを手動により操作することで、ミュートにした場合であっても、操作が間に合わないおそれがある。よって、情報漏洩のリスクが高くなってしまうという問題点がある。

本開示は上記の点に鑑みなされたものであり、チャット相手に出力される音声を適切にミュートすることができる音声チャット端末、及びその制御方法を提供することを目的とする。

本実施形態にかかる音声チャット端末は、ユーザの音声を検出するマイクと、前記マイクで検出された前記ユーザの音声の音声データを、ネットワークを介してチャット相手の端末に送信する音声データ送信部と、前記マイクが前記ユーザ以外の発話者の音声を検出した場合に、前記チャット相手の端末に送信される前記音声データの音声をミュートする音声ミュート部と、を備えている。

本実施形態にかかる音声チャット端末の制御方法は、マイクを用いてユーザの音声を検出するステップと、前記マイクで検出された前記ユーザの音声の音声データを、ネットワークを介してチャット相手の端末に送信するステップと、前記マイクが前記ユーザ以外の発話者の音声を検出した場合に、前記チャット相手の端末に送信される前記音声データの音声をミュートするステップと、を備えている。

本開示によれば、チャット相手に出力される音声を適切にミュートすることができる音声チャット端末、及びその制御方法を提供することを目的とする。

音声チャット端末の構成を示す制御ブロック図である。音声チャット端末の制御方法を示すフローチャートである。変形例に係るシステムの構成を示す模式図である。

以下、本発明を適用した具体的な実施形態について、図面を参照しながら詳細に説明する。ただし、本開示が以下の実施形態に限定される訳ではない。また、説明を明確にするため、以下の記載および図面は、適宜、簡略化されている。

実施の形態１．
本実施の形態にかかる音声チャット端末を用いたシステムについて、図１を用いて説明する。図１は、音声会議システム１の構成を示す制御ブロック図である。以下、音声会議システム１が音声チャットで遠隔会議を行うものであるとして説明するが、音声及び映像を用いてビデオ会議などを行うものであってもよい。

音声会議システム１は、音声チャット端末１００と音声チャット端末２００とを備えている。音声チャット端末１００と音声チャット端末２００とは遠隔地に配置されており、ネットワーク５００を介して接続されている。ここで遠隔地とは、同じビル内等の同じ場所であってもよい。例えば、音声チャット端末１００と音声チャット端末２００とは、同じビルの異なる部屋や異なるフロア等に配置されていても良い。つまり、音声チャット端末１００と音声チャット端末２００とは、直接会話ができない程度に離れていれば良い。ネットワーク５００は、インターネットや携帯電話通信網などの公衆ネットワークなどである。あるいは、ネットワーク５００は、イントラネットであってもよい。

音声チャット端末１００、２００は、例えば、パーソナルコンピュータ、スマートフォン、タブレットパソコンなどの通信端末である。音声チャット端末１００，２００は、無線又は有線により通信可能になっている。例えば、音声チャット端末１００、２００は、ＷｉＦｉ（登録商標）等の無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）機器でネットワーク５００に接続されている。音声チャット端末１００、２００はネットワーク５００からのデータを受信可能であり、かつネットワーク５００へデータを送信可能である。ネットワーク５００の通信プロトコルについては、公知のものを用いることができるため説明を省略する。

ユーザＡと通話相手Ｂとは、オンラインで音声チャットすることができる。つまり、ユーザＡと通話相手Ｂとが互いにチャット相手となっている。例えば、ユーザＡと通話相手Ｂとがオンラインでリモート会議に参加する会議参加者となっている。具体的には、ユーザＡは音声チャット端末１００のユーザで有り、音声チャット端末１００を用いてリモート会議に参加している。通話相手Ｂは、音声チャット端末２００を用いて、リモート会議に参加している。また、１つの拠点において、複数の人が遠隔会議に参加していてもよい。例えば、音声チャット端末２００の周りにいる複数の人が音声チャットを行ってもよい。

ユーザＡは、音声チャット端末１００を用いて、通話相手Ｂの発話を聞くことができる。ユーザＡは、音声チャット端末１００を用いて、通話相手Ｂに対して発話することができる。通話相手Ｂは、音声チャット端末２００を用いて、ユーザＡの発話を聞くことができる。通話相手Ｂは、音声チャット端末２００を用いて、ユーザＡに対して発話することができる。

音声チャット端末１００は、スピーカ１１１、音声ミュート部１１２、マイク１１３、音声データ送信部１１４、音声比較部１１５、音声データ受信部１１６、オンライン接続部１２０を有している。音声チャット端末２００は、スピーカ２１１、音声ミュート部２１２、マイク２１３、音声データ送信部２１４、音声比較部２１５、音声データ受信部２１６、オンライン接続部２２０を有している。

音声チャット端末２００は、音声チャット端末１００と同様の構成を有している。音声チャット端末２００のスピーカ２１１と、音声ミュート部２１２と、マイク２１３と、音声データ送信部２１４とは、スピーカ１１１、音声ミュート部１１２、マイク１１３、音声データ送信部１１４に対応している。音声チャット端末２００の音声比較部２１５、音声データ受信部２１６、オンライン接続部２２０とは、音声チャット端末１００の音声比較部１１５、音声データ受信部１１６、オンライン接続部１２０にそれぞれ対応している。音声チャット端末２００の制御は、音声チャット端末１００の制御と同様であるため、適宜説明を省略する。

マイク１１３は、ユーザＡの音声を検出する。マイク１１３は、１又は複数のマイク素子を有している。マイク１１３は音声チャット端末１００に内蔵されている内蔵マイクであってもよく、音声チャット端末１００と別個に設けられた外付けマイクであってもよい。

音声データ送信部１１４は、マイク１１３で検出されたユーザＡの音声の音声データを送信する。例えば、音声データ送信部１１４は、マイク１１３が検出した音声に対して符号化や圧縮等の処理を行うことで、音声データを生成する。音声データ送信部１１４は、マイク１１３が収音した音声の音声データを送信する。

具体的には、音声データ送信部１１４で生成された音声データは、オンライン接続部１２０を介して、ネットワーク５００に送信される。オンライン接続部１２０は、ネットワーク５００と接続するためのネットワークインターフェースを有している。オンライン接続部１２０は、ネットワークプロトコルに従って、音声データをパケットデータとして、送受信する。例えば、ネットワーク５００がインターネットである場合、オンライン接続部１２０は、音声データをＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）パケットにして送信する。

同様に、オンライン接続部１２０は、ネットワークプロトコルに従って、音声データを含むパケットデータを受信する。オンライン接続部１２０とオンライン接続部２２０とは、音声データを含むパケットデータを送受信する。音声チャット端末１００は、音声チャット端末２００から送信された通話相手Ｂの音声データを受信することができる。もちろん、音声チャット端末１００と音声チャット端末２００との間の通信方式は特に限定されるものではない。

音声データ受信部１１６は、オンライン接続部１２０を介して、音声チャット端末２００からの音声データを受信する。音声データ受信部１１６は、音声データに対して復号化等の処理を施す。そして、音声データ受信部１１６は、復元したアナログの音声データをスピーカ１１１に出力する。

スピーカ１１１は、音声データに基づいて、ユーザＡに対して音声を出力する。スピーカ１１１は、音声チャット端末１００に内蔵されたスピーカを有している。あるいは。スピーカ１１１は、音声チャット端末１００とは別個に設けられたヘッドフォンやイヤフォンなどであってもよい。

このように、音声チャット端末１００と音声チャット端末２００とは、ネットワーク５００を介して、音声データを送受信する。ユーザＡと通話相手Ｂとが音声チャット（通話）することができる。つまり、ユーザＡが発話すると、マイク１１３がユーザＡの音声を収音する。そして、音声チャット端末２００のスピーカ２１１がユーザＡの音声を通話相手Ｂに対して出力する。通話相手Ｂが発話すると、マイク２１３が通話相手Ｂの音声を収音する。音声チャット端末１００のマイク１１３が通話相手Ｂの音声をユーザＡに対して出力する。したがって、遠隔地にいるユーザＡと通話相手Ｂとが音声通信によって会話することができる。

ここで、発話者Ｃは、ユーザＡの近くにいる人であって、リモート会議への参加を予定していない非参加者である。発話者Ｃが通話相手Ｂに知られたくない情報（以下、機密情報とする）を発話した場合において、音声チャット端末１００が機密情報を含む音声をミュートすることができる。以下、音声チャット端末１００と音声チャット端末２００での音声ミュート制御について説明する。

音声ミュート部１１２は、音声データ送信部１１４から送信される音声データをミュートにする機能を有している。なお、図１では、音声ミュート部１１２、２１２が音声チャット端末１００及び音声チャット端末２００の両方に設けられているが、一方のみ設けられていてもよい。つまり、音声ミュート部２１２は省略可能である。

音声ミュート部１１２は、マイク１１３がユーザＡ以外の発話者Ｃの音声を検出した場合に、送信される音声データの音声をミュートする。例えば、マイク１１３に対する音声の到来方向に応じて、音声ミュート部１１２は、ユーザＡと発話者Ｃとの音声を判別することができる。マイク１１３を基準とした音声の発生源の方向が音声の到来方向となる。マイク１１３は、ステレオマイクなどであり、複数のマイク素子を有している。そして、各マイク素子への到達時間差に応じて、音声の到来方向を求めることができる。あるいは、マイク１１３は、複数の指向性マイクを有していてもよい。例えば、複数の指向性マイクを３６０°等間隔に放射状に配置する。そして、複数の指向性マイクの音量差や到達時間差に基づいて、音の発生源の方向を特定することができる。

ユーザＡと異なる方向から音声が到来した場合に、音声ミュート部１１２は、ユーザＡ以外の発話者Ｃの音声であることを検知する。音声ミュート部１１２は、ユーザＡ以外の発話者Ｃの音声を検出した場合に、音声データ送信部１１４をオフにする。よって、発話者Ｃの発話中は、音声チャット端末２００のスピーカ２１１が無音になる。

例えば、ユーザＡは、マイク１１３（音声チャット端末１００）の正面にいる場合、ユーザＡの音声がマイク１１３の正面からマイク１１３に到来する。一方、発話者ＣがユーザＡの左方向からユーザＡに向かって発話する場合、発話者Ｃの音声は、左方向からマイク１１３に到来する。ユーザＡと発話者Ｃの位置関係によって、音声の発生源の方向が異なる。音声の到来方向に応じて、マイク１１３により収音された音声がユーザＡの音声であるか否かを判別することができる。

マイク１１３によって発話者Ｃの音声が検出された場合、音声ミュート部１１２が速やかに音声をミュートにする。例えば、ユーザＡと発話者Ｃとが同じ会社の従業員であり、通話相手Ｂが他社の従業員であるとする。発話者Ｃの発話には、通話相手Ｂに対して秘匿したい機密情報が含まれているとする。発話者Ｃは、ユーザＡが他社の通話相手Ｂとリモート会議を行っていることを知らずに、発話者ＣがユーザＡに機密情報を話してしまうことがある。このような場合であって、音声ミュート部１１２が音声データをミュートすることで、通話相手Ｂが機密情報を聞くことを防ぐことができる。

また、発話者Ｃの発話が終了して、ユーザＡが発話した場合、音声ミュート部１１２がミュート機能をオフする。これにより、ユーザＡの音声の音声データが音声チャット端末２００に送信される。よって、通話相手Ｂが、ユーザＡの音声のみをスピーカ２１１から聞くことができる。

例えば、ユーザＡがマウスなどを手動で操作することで、音声ミュートにする場合、ユーザＡが手動で操作することを忘れてしまうことがある。発話者Ｃがとっさに発話した場合、ユーザＡの操作が間に合わないことがある。したがって、通話相手Ｂに機密情報が漏洩してしまうおそれがある。手動操作によりミュートする場合、セキュリティリスクが高くなってしまう。特に、リモート会議に参加していない発話者Ｃは、ユーザＡがリモート会議中であることを知らずに、突然ユーザＡに話しかけることがある。本実施の形態では、ユーザＡの操作無しでミュートすることができるため、情報漏洩のリスクを低減することができる。

なお、上記の説明では音声の到来方向に応じて、ユーザＡの音声か否かを判別したが、判別方法はこれに限られるものではない。例えば、音声解析等により、話者を特定しても良い。例えば、声紋などによって、音声がユーザＡによる発話か、発話者Ｃによる発話かを識別することができる。また、話者識別のために音声チャットの開始時にユーザＡの音声パターンを登録しても良い。

音声チャット端末１００側に複数の人がリモート会議に参加している場合であっても、音声ミュート部１１２のミュート機能は適用可能である。例えば、１拠点に複数の会議参加者がいる場合、音声ミュート部１１２が複数の会議参加者とそれら以外の非参加者とを識別しても良い。例えば、リモート会議の冒頭において、ユーザＡを含めた複数の会議参加者を予め登録しておけば良い。このようにすることで、複数の会議参加者と、非参加者とを識別することが可能となる。

さらに、本実施の形態では、音声比較部１１５が、マイク１１３で検出された音声と、音声チャット端末２００から送信された音声データの音声とを比較している。そして、音声比較部１１５は、音声の比較結果に応じて、音声ミュート部１１２を制御している。

例えば、発話者ＣがユーザＡと通話相手Ｂとの会話に参加している場合、発話者Ｃの音声をミュートしないように、音声比較部１１５が音声ミュート部１１２を制御する。一方、発話者ＣがユーザＡと通話相手Ｂとの会話と関係ない話題を発話した場合は、発話者Ｃの音声をミュートするように、音声比較部１１５が音声ミュート部１１２を制御する。

ここでは、音声比較部１１５が、発話タイミングに基づいて、音声ミュート部１１２を制御している。音声比較部１１５は、発話者Ｃの発話タイミングと、ユーザＡや通話相手Ｂの発話タイミングとを比較する。そして、発話者Ｃの発話タイミングがユーザＡと通話相手Ｂとの会話に対して、適切である場合、音声比較部１１５は、発話者ＣがユーザＡと通話相手Ｂとの会話に参加していると判定する。この場合、音声ミュート部１１２が発話者Ｃの音声をミュートにしない。一方、発話者Ｃの発話タイミングがユーザＡと通話相手Ｂとの会話に対して、適切でない場合、音声比較部１１５は、発話者ＣがユーザＡと通話相手Ｂとの会話に参加していないと判定する。この場合、音声ミュート部１１２が発話者Ｃの音声をミュートにする。

あるいは、音声比較部１１５が、発話内容を解析することで、発話者ＣがユーザＡと通話相手Ｂとの会話に参加したか否かを判別しても良い。例えば、発話者Ｃの音声が、ユーザＡと通話相手Ｂとの会話に頻出する単語を含む場合、発話者ＣがユーザＡと通話相手Ｂとの会話に参加したと判定することが可能となる。音声認識機能により、単語の出現頻度等を求めることで、音声比較部１１５が音声比較を適切に行うことができる。

このように、音声比較部１１５が、発話タイミング、又は発話内容に基づいて、ユーザＡと通話相手Ｂとの会話に発話者Ｃが参加したかを判定する。音声比較部１１５は、その判定結果に基づいて、音声ミュート部１１２を制御する。また、音声比較部１１５及び音声ミュート部１１２が、音声の到来方向と、発話内容とを組み合わせて、話者識別を行うようにして良い。このようにすることで、音声チャット中にユーザＡが移動した場合であっても、適切に音声ミュートを制御することが可能となる。音声比較部１１５及び音声ミュート部１１２において、ユーザＡと発話者Ｃの会話をより高精度に判別することが可能となる。

このように、音声比較部１１５は、音声の比較結果に応じて、音声ミュート部１１２のミュート機能のオンオフを制御している。このようにすることで、より適切に音声をミュートすることが可能になる。ユーザＡがいる拠点において、発話者Ｃが機密情報を発話した場合であっても、機密情報を含む音声が音声チャット端末２００に送信されることを防ぐことができる。したがって、機密情報が通話相手Ｂに漏洩することを防ぐことができる。また、発話者ＣがユーザＡと通話相手Ｂとの会話に急遽参加した場合、発話者Ｃの音声データが音声チャット端末２００に送信される。よって、通話相手Ｂが発話者Ｃの音声を聞くことができるため、リモート会議をより円滑に行うことができる。

なお、音声チャット端末１００と音声チャット端末２００は同じ構成を有しているが、音声チャット端末１００と音声チャット端末２００とは同種のデバイスとなっていなくてもよい。例えば、音声チャット端末１００がパーソナルコンピュータで音声チャット端末２００がスマートフォンであってもよい。

図１では、２拠点の音声チャット端末１００，２００で音声チャットを行う例が示されているが、３拠点以上の音声チャット端末間で音声チャットを行うことも可能である。３拠点以上で音声チャットを行う場合、音声ミュートをする端末を選択しても良い。例えば、音声チャット端末１００との接続された複数の通信先端末のうち、１つ以上の通信先端末に対して音声をミュートとして、残りの通信先端末では音声をミュートとしないようにしてもよい。

なお、音声チャット端末１００は物理的に単一な装置に限られるものではない。例えば、マイクやスピーカ等は、通信端末と別個の装置として、音声入出力端子、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の外部接続インターフェースなどで通信端末に接続されていてもよい。

また、スピーカ１１１は、マイク１１３で検出した音声を出力してもよい。この場合、ユーザＡは、発話者Ｃの発話内容を直接聞くととともに、スピーカ１１１からも聞くことになる。したがって、ユーザＡは、発話者Ｃの発話を二重で聞くことになる。また、この場合、音声比較機能で話者を識別するために、マイク１１３で収音した音声に可聴範囲外のマーク音声を付与してもよい。この場合、マイク１１３で収音したオフラインの音声は、可聴範囲外のマーク音声有りとなり、マイク２１３で収音したオンラインの音声は、可聴範囲外のマーク音声無しとなる。このようにすることで、音声比較部１１５の音声比較機能において、発話者Ｃの会話をより高精度に判別することが可能となる。

本実施の形態にかかる音声チャット端末１００の制御方法について、図２を用いて説明する。図２は、音声チャット端末１００の制御方法を示すフローチャートである。

まず、マイク１１３が音声を検出する（Ｓ１０１）。音声ミュート部１１２は、マイク１１３で検出された音声が、ユーザＡの音声か否かを判定する（Ｓ１０２）。上記のように、音声ミュート部１１２は、マイク１１３の収音方向等によって、ユーザＡの音声か、発話者Ｃの音声かを判別することができる。

ユーザＡの音声である場合（Ｓ１０２のＹＥＳ）、音声データ送信部１１４が音声データを送信する（Ｓ１０４）。つまり、ユーザＡの音声の音声データが、ネットワーク５００を介して、音声チャット端末２００に送信される。よって、通話相手ＢがユーザＡの音声を聞くことができる。

ユーザＡの音声でない場合（Ｓ１０２のＮＯ）、音声比較部１１５が音声を比較することで、音声の発話者Ｃが会話に参加しているか否かを判定する（Ｓ１０３）。例えば、音声比較部１１５が、発話タイミング、又は発話内容に基づいて、ユーザＡと通話相手Ｂとの会話に発話者Ｃが参加したか否かを判定する。音声の発話者Ｃが会話に参加した場合、（Ｓ１０３のＹＥＳ）、音声データ送信部１１４が音声データを送信する（Ｓ１０４）。

音声の発話者Ｃが会話に参加していない場合（Ｓ１０３のＮＯ），音声ミュート部１１２が音声をミュートにする（Ｓ１０５）。例えば、音声データ送信部１１４が音声データを送信しない。あるいは、音声データ送信部１１４が無音の音声データを送信する。音声データ送信部１１４が雑音の音声データを送信してもよい。したがって、通話相手Ｂが発話者Ｃの音声を聞くことができない。

ステップＳ１０４，又はステップＳ１０５の後、音声チャット端末１００は、音声チャットが終了したか否かを判定する（Ｓ１０６）。音声チャットが終了した場合（Ｓ１０６のＹＥＳ）、処理を終了する。例えば、音声チャット端末１００又は音声チャット端末２００の会議終了ボタンや退出ボタンがクリックされた場合、音声チャットが終了する。音声チャットが終了していない場合（Ｓ１０６のＮＯ）、ステップＳ１０１に戻り、処理を繰り返す。

このようにすることで、音声を適切にミュートすることができるため、通話相手Ｂに機密情報に漏洩することを防ぐことができる。もちろん、音声チャット端末１００の制御方法は、上記の処理に限られるものではない。例えば、ステップＳ１０３の判定処理を省略することができる。

変形例１
変形例１では、ユーザＡが、音声チャット端末と、ヘッドマウンドディスプレイとを組み合わせて使用している。変形例１のシステム構成について、図３を用いて説明する。図３は、ユーザＡがヘッドマウントディスプレイ３００を装着した状態を示す図である。なお、音声チャット端末１００は、図１と同様であるため、説明を省略する。ここでは、音声チャット端末１００がパーソナルコンピュータとなっている。

ヘッドマウントディスプレイ３００は、虚像として前方に表示される表示画像を生成する。ヘッドマウントディスプレイ３００は、シースルータイプである。ユーザＡは、ヘッドマウントディスプレイ３００を装着した状態で、正面前方にある音声チャット端末１００を視認することができる。つまり、ヘッドマウントディスプレイ３００の表示画像とともに、音声チャット端末１００のモニタなどを視認することができる。

変形例１では、ヘッドマウントディスプレイ３００に搭載されたセンサ３０１の出力が、音声ミュート機能を制御するためのトリガとなっている。例えば、センサ３０１は、ユーザＡの頭部の動きを検出するモーションセンサである。モーションセンサとしては、加速度センサ、磁気センサ、ジャイロスコープなどを用いることができる。センサ３０１の出力に基づいて、ユーザＡの頭部の向きが検出される。

音声チャット端末１００は、頭部の向きに応じて、音声ミュートを制御している。ユーザＡが音声チャット端末１００の方向を向いている場合（図３の上側）、音声ミュート部１１２が音声ミュートをオフにする。ユーザＡが音声チャット端末１００の方向を向いていない場合（図３の下側）、音声ミュート部１１２が音声ミュートをオンにする。

ユーザＡが音声チャット端末１００の方向を向いて音声チャットしているとする（図３の上側）。このとき、音声ミュート部１１２が音声ミュートをオフにしているため、通話相手Ｂ（図３では不図示）が音声を聞くことができる。

発話者Ｃが左方向からユーザＡに話しかけると、ユーザＡが発話者Ｃを向く（図３の下側）。例えば、ユーザＡが発話者Ｃの方向、つまり左方向を向いて、ユーザＡが発話者Ｃと会話する。ここで、センサ３０１がユーザＡの頭部の動きを検出している。したがって、センサ３０１の出力から、ユーザＡが音声チャット端末１００の方向を向いていないことを検知することができる。

ユーザＡが音声チャット端末１００の方向を向いていないことを検知すると、音声ミュート部１１２が音声ミュートをオンにする。ユーザＡと発話者Ｃとの会話が終了して、ユーザＡが音声チャットに戻る。このとき、ユーザＡが音声チャット端末１００の方向、つまり正面前方を向く。センサ３０１が、頭部の動きに応じて、ユーザＡが正面方向に向けたことを検知する。従って、音声ミュート機能をオフにする。

このようにセンサ３０１の出力に応じて、ユーザＡと発話者Ｃとの会話をミュートすることができる。つまり、通話相手Ｂとの音声チャットを中断している間は音声がミュートとなる。そして、ユーザＡと発話者Ｃとの会話が終了して、ユーザＡが通話相手Ｂとの音声チャットを再開すると、音声ミュートがオフとなる。これにより、自動で音声ミュートを切替えることができるため、利便性を向上することができる。

また、スピーカ１１１又はマイク１１３については、ヘッドマウントディスプレイ３００に搭載されたものを用いることができる。例えば、マイク１１３として、ヘッドマウントディスプレイ３００に３６０°等間隔に配置した３次元マイクを有していてもよい。ヘッドマウントディスプレイ３００の３次元マイクを用いて、音声の拾い方の時差で音声の発生源を認識することができる。ユーザＡの頭部の向きが変わっても、音声の到来方向を適切に検知することが可能となる。

なお、変形例１では、音声チャット端末１００をヘッドマウントディスプレイ３００と組み合わせているが、ヘッドマウントディスプレイ３００の代わりに、ヘッドセット、ヘッドフォン、イヤフォンとの組み合わせて良い。頭部の動きを検出するモーションセンサは、ヘッドセット等と別体のものであってもよい。

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。上記の実施の形態の２つ以上を適宜組み合わせることも可能である。

１音声会議システム
１００音声チャット端末
１１１スピーカ
１１２音声ミュート部
１１３マイク
１１４音声データ送信部
１１５音声比較部
１１６音声データ受信部
１２０オンライン接続部
２００音声チャット端末
２１１スピーカ
２１２音声ミュート部
２１３マイク
２１４音声データ送信部
２１５音声比較部
２１６音声データ受信部
２２０オンライン接続部
３００ヘッドマウントディスプレイ
３０１センサ
５００ネットワーク
Ａユーザ
Ｂ通話相手
Ｃ発話者

Claims

ユーザの音声を検出するマイクと、
前記マイクで検出された前記ユーザの音声の音声データを、ネットワークを介してチャット相手の端末に送信する音声データ送信部と、
前記マイクが前記ユーザ以外の発話者の音声を検出した場合に、前記チャット相手の端末に送信される前記音声データの音声をミュートする音声ミュート部と、を備えた音声チャット端末。
前記マイクに対する音声の到来方向に応じて、前記ユーザと、前記発話者との音声を判別している請求項１に記載の音声チャット端末。
前記マイクで検出した音声と、前記チャット相手の端末から受信した音声データの音声とを比較する音声比較部をさらに備え、
前記音声比較部での比較結果に応じて、前記音声ミュート部がミュートを制御している請求項１、又は２に記載の音声チャット端末。
前記音声比較部が、
発話タイミング、又は発話内容に基づいて、前記ユーザと前記チャット相手との会話に前記発話者が参加したかを判定し、
判定結果に基づいて、前記音声ミュート部を制御している請求項３に記載の音声チャット端末。
マイクを用いてユーザの音声を検出するステップと、
前記マイクで検出された前記ユーザの音声の音声データを、ネットワークを介してチャット相手の端末に送信するステップと、
前記マイクが前記ユーザ以外の発話者の音声を検出した場合に、前記チャット相手の端末に送信される前記音声データの音声をミュートするステップと、を備えた音声チャット端末の制御方法。