JP2023009574A - 制御装置、制御システム、方法および利用者端末 - Google Patents

制御装置、制御システム、方法および利用者端末 Download PDF

Info

Publication number
JP2023009574A
JP2023009574A JP2021112976A JP2021112976A JP2023009574A JP 2023009574 A JP2023009574 A JP 2023009574A JP 2021112976 A JP2021112976 A JP 2021112976A JP 2021112976 A JP2021112976 A JP 2021112976A JP 2023009574 A JP2023009574 A JP 2023009574A
Authority
JP
Japan
Prior art keywords
sound
sound data
unit
time
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021112976A
Other languages
English (en)
Inventor
真 鳥越
Makoto Torigoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2021112976A priority Critical patent/JP2023009574A/ja
Publication of JP2023009574A publication Critical patent/JP2023009574A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】円滑な遠隔コミュニケーションを実現する。【解決手段】複数の利用者端末から収音により得られた音データを受信する受信部と、前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信する送信部と、を備える、制御装置。【選択図】図3

Description

本発明は、制御装置、制御システム、方法および利用者端末に関する。
近年、パンデミック対策として各企業においてテレワークの導入が加速している。テレワークにおいては、オフィスと在宅のテレワーカー、または在宅のテレワーカー同士がインターネット経由で結ばれ、ネットワーク対応のTV会議システムまたはPC上のビデオ通話ソフトを用いて、遠隔会議および研修などの遠隔コミュニケーションなどが行われる。
遠隔コミュニケーションにおいて、ある端末で収音された雑音が他の端末に配信されることで、円滑なコミュニケーションの進行が妨げられる場合がある。例えば、オフィスにいる参加者の端末からはオフィスの雑音、例えば空調の音や近隣メンバーの音声等が配信され、自宅にいる参加者の端末からは近所の騒音あるいは家族の物音や音声等が配信され得る。このような雑音の配信による弊害は、発話者以外の参加者が自身の端末のマイクをミュートにすることで軽減することが可能である。
また、特許文献1には、遠隔会議において、会議の進行に伴って、会議参加端末のひとつが司会者端末となり、適切な参加者に対して発言権限を与えることにより、遠隔会議を円滑に進行させる技術が開示されている。特許文献1に開示された技術によれば、参加者による勝手な発言および雑音の配信を抑制し得る。
特開2012-217068号公報
しかし、特許文献1に記載の技術では、発言権限を与えられた参加者が、端末がミュートになっていることに気付かずに発話し続けてしまう場合がある。この場合、司会者が当該参加者に端末がミュートになっていることを伝えることで参加者はミュートに気付けるが、司会者などの他の参加者はこのような指摘をすることを煩雑に感じ得る。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、円滑な遠隔コミュニケーションを実現することが可能な、新規かつ改良された制御装置、制御システム、方法および利用者端末を提供することにある。
上記課題を解決するために、本発明のある観点によれば、複数の利用者端末から収音により得られた音データを受信する受信部と、前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信する送信部と、を備える、制御装置が提供される。
前記通知信号は、前記利用者端末において通知音として出力される音データ、または前記利用者端末に通知音を出力させる制御コマンドであってもよい。
前記送信部は、前記通知信号を前記複数の利用者端末に送信してもよい。
前記時間計測部は、さらに、前記複数の利用者端末から受信された音データの各々について、音声が検出されず、かつ、雑音が検出されている雑音区間の時間を計測し、前記送信部は、いずれかの利用者端末から受信された音データの前記雑音区間が第2の設定時間を上回ったことに基づき、当該利用者端末に音データの送信を停止させる制御コマンドを送信してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、複数の利用者端末および制御装置を有する制御システムであって、前記複数の利用者端末は、収音により音データを取得する収音部を有し、前記制御装置は、前記複数の利用者端末から前記音データを受信する受信部と、前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信する送信部と、を有する、制御システムが提供される。
また、上記課題を解決するために、本発明の別の観点によれば、複数の利用者端末から収音により得られた音データを受信することと、前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測することと、前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信することと、を含む、制御方法が提供される。
また、上記課題を解決するために、本発明の別の観点によれば、利用者端末であって、収音により音データを取得する収音部と、前記収音部により取得された前記音データを他の利用者端末に送信する送信部と、前記他の利用者端末から収音により得られた音データを受信する受信部と、前記収音部により取得された音データ、および前記他の利用者端末から受信された音データのいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、前記非音声区間の時間が設定時間を上回ったことに基づき、前記利用者端末の利用者への所定の通知を制御する制御部と、を備える、利用者端末が提供される。
前記時間計測部は、さらに、前記収音部により取得された音データについて、音声が検出されず、かつ、雑音が検出されている雑音区間の時間を計測し、前記制御部は、前記雑音区間の時間が第2の設定時間を上回ったことに基づき、前記送信部からの前記音データの送信を停止させてもよい。
以上説明した本発明によれば、円滑な遠隔コミュニケーションを実現することが可能である。
本発明の一実施形態による遠隔コミュニケーションシステムの構成を示す説明図である。 本発明の一実施形態による音声会議端末20の構成を示す説明図である。 本発明の一実施形態による会議サーバ30の構成を示す説明図である。 本発明の一実施形態による遠隔コミュニケーションシステムの基本動作を示す説明図である。 音声会議端末20Aから送信された音データから雑音が検出された場合の動作を示す説明図である。 非音声区間が検出された場合の動作を示す説明図である。 会議サーバ30のハードウェア構成を示したブロック図である。
以下に添付図面を参照しながら、本発明の実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成または論理的意義を有する複数の構成を、必要に応じて音声会議端末20A、20Bおよび20Cのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、複数の構成要素の各々に同一符号のみを付する。例えば、音声会議端末20A、20Bおよび20Cを特に区別する必要が無い場合には、各音声会議端末を単に音声会議端末20と称する。
<遠隔コミュニケーションシステムの概要>
本発明の一実施形態は、制御システムに関し、特に、遠隔する拠点から複数の利用者が参加する遠隔コミュニケーションを実現する遠隔コミュニケーションシステムに関する。以下では、遠隔コミュニケーションの態様が主に音声で行われる遠隔会議である例を想定して、遠隔コミュニケーションシステムの概要を説明する。
図1は、本発明の一実施形態による遠隔コミュニケーションシステムの構成を示す説明図である。図1に示したように、本発明の一実施形態による遠隔コミュニケーションシステムは、音声会議端末20A~20Fおよび会議サーバ30を有する。
これら音声会議端末20A~20Fおよび会議サーバ30はネットワーク12を介して接続されている。ネットワーク12は、ネットワーク12に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、ネットワーク12は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク12は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網を含んでもよい。
図1に示した例では、利用者UAが音声会議端末20Aを利用し、利用者UBが音声会議端末20Bを利用し、利用者UCが音声会議端末20Cを利用し、利用者UDが音声会議端末20Dを利用し、利用者UEが音声会議端末20Eを利用し、利用者UFが音声会議端末20Fを利用している。ただし、遠隔コミュニケーションシステムを構成する音声会議端末20の数、および遠隔コミュニケーションシステムを利用する利用者Uの数は、より少なくてもよいし、より多くてもよい。
(会議サーバ)
会議サーバ30は、制御装置の一例であり、各音声会議端末20による遠隔会議への参加と退出を管理する。例えば、会議サーバ30は、WebRTC(Web Real-Time Communication)のような会議用のプロトコルを用いて各音声会議端末20の遠隔会議への参加と退出を管理する。映像データおよび音声データの通信は、会議サーバ30を介さずに、音声会議端末20間で行われてもよい。また、音声会議端末20同士がPeer2Peerで接続する場合には、会議サーバ30は設けられなくてもよい。
(音声会議端末)
音声会議端末20は、利用者端末の一例であり、音声会議端末20の利用者が発した音声を示す音データを他の音声会議端末20に会議サーバ30を介して送信する。また、音声会議端末20は、他の音声会議端末20の利用者が発した音声を示す音データを他の音声会議端末20から会議サーバ30を介して受信し、当該音データに基づいて他の音声会議端末20の利用者が発した音声を出力する。
例えば、図1に示した例では、利用者UAが発した音声を示す音データを音声会議端末20Aが他の音声会議端末20B~20Fに送信し、音声会議端末20B~20Fが当該音データに基づいて利用者UAが発した音声を出力する。また、利用者UBが発した音声を示す音データを音声会議端末20Bが音声会議端末20Aおよび音声会議端末20C~20Fに送信し、音声会議端末20Aおよび音声会議端末20C~20Fが当該音データに基づいて利用者UBが発した音声を出力する。同様に、利用者UC~利用者UFが発した音声も他の利用者が利用する音声会議端末20で出力される。かかる構成により、利用者UA~UFが音声会議を行うことが可能である。
なお、音声会議端末20は、音データに加えて、映像データを他の音声会議端末20と送受信してもよい。また、図1においては音声会議端末20の一例としてノート型のPC(Personal Computer)を示しているが、音声会議端末20は、デスクトップ型のPC、スマートフォン、携帯電話またはPHS(Personal Handyphone System)などの他の情報処理装置であってもよい。
(背景)
遠隔コミュニケーションにおいて、ある端末で収音された雑音が他の端末に配信されることで、円滑なコミュニケーションの進行が妨げられる場合がある。例えば、オフィスにいる参加者の端末からはオフィスの雑音、例えば空調の音や近隣メンバーの音声等が配信され、自宅にいる参加者の端末からは近所の騒音あるいは家族の物音や音声等が配信され得る。このような雑音の配信による弊害は、発話者以外の参加者が自身の端末のマイクをミュートにすることで軽減することが可能である。
また、特許文献1には、遠隔会議において、会議の進行に伴って、会議参加端末のひとつが司会者端末となり、適切な参加者に対して発言権限を与えることにより、遠隔会議を円滑に進行させる技術が開示されている。特許文献1に開示された技術によれば、参加者による勝手な発言および雑音の配信を抑制し得る。
しかし、上記技術では、各端末のマイクで収音された後に音声データが許可データに基づいて他の端末またはサーバ宛に音声データが送信されるので、各端末ではマイクデバイスが常に収音状態を維持している。マイクの種類によっては、収音時にはデバイスに備わったステータスランプが点灯しマイクの状態が収音状態であることが示されることから、参加者が不快または不安に感じる恐れがある。
また、マイクをデバイスレベルでミュートやオフラインにするすることが可能なマイクもあり、参加者がこのようなマイクを使う可能性もある。発言権を有する参加者がマイクをミュートやオフライン(以下OFFとする)にしている場合、参加者がそれに気づかず発話し続け得る。この場合、司会者が当該参加者に端末のマイクがOFFになっていることを伝えることで参加者はマイクのOFFに気付けるが、その間の時間をロスしてしまうという課題が残る。
また遠隔会議の場合、ネットワークの接続が必ずしも完全に保証されておらず、突然切断されてしまうことがある。この切断が司会者の端末が接続しているネットワークで発生した場合、司会者がネットワークの切断に気が付かないまま発言を継続してしまう可能性がある。
さらに、当該技術では発言意志を示す通知情報をもとに司会者が発言許可を与えるが、ワークショップやグループディスカッションでは高頻度で発話者が入れ替わるため、挙手による発言意志表示や発言許可を行うことは不向きであり、参加者全員が発言権を持つことが望ましい。この時、参加者のうち少なくとも一人が自らマイクをOFFにしたことを忘れて発話し続けて、会議中の音声が全く流れない状態になり得る。発言者のカメラ映像があれば発言している参加者をカメラ映像から特定し、その発言者に対してマイクがOFFであることを伝えることが可能である。しかし、端末処理負荷やネットワーク使用帯域削減を目的としてカメラをOFFにする運用も多く、誰が発言しようとしているのかわからない時がある。
本件発明者は、上記事情を一着眼点にして本発明の一実施形態を創作するに至った。本発明の一実施形態による遠隔コミュニケーションシステムは、円滑な遠隔コミュニケーションを実現することが可能である。以下、このような遠隔コミュニケーションシステムの構成および動作を順次詳細に説明する。
<音声会議端末の構成>
図2は、本発明の一実施形態による音声会議端末20の構成を示す説明図である。図2に示したように、本発明の一実施形態による音声会議端末20は、収音部220、符号化部224、通信部228、復号部232、音出力部236、操作部238および制御部240を備える。
(収音部220)
収音部220は、収音により音を電気的な音データに変換する構成である。収音部220は、例えば、音声会議端末20の利用者が発した音声を含む音データを収音により取得し、当該音データを符号化部224に供給する。収音部220は、マイクデバイスで構成されてもよいし、会議に使用されるカメラデバイスに搭載されるマイクであってもよい。
(符号化部224)
符号化部224は、収音部220から供給された音データを符号化して符号化された音データを生成する。符号化部224は、符号化された音データを通信部228に供給する。当該音データには、上述の通り、利用者の音声が含まれ得るし、雑音も含まれ得る。
(通信部228)
通信部228は、符号化部224から供給された音データを会議サーバ30に送信する送信部、および会議サーバ30から他の音声会議端末20において得られた音データを受信する受信部として機能する。通信部228は、例えばUDPのような会議に適した低遅延のプロトコルを用いて通信する。通信部228は、他のプロトコルとしてTCPを用いてもよいが、パケット遅延が大きくなった場合には遅延解消のためにパケットを破棄することが想定される。
(復号部232)
復号部232は、通信部228により会議サーバ30から受信された音データを、符号化部224が利用する符号化方式と対になる復号方式で復号する。
(音出力部236)
音出力部236は、復号部232により得られた音データに基づき、他の音声会議端末20において収音された音を出力する。音出力部236は、スピーカデバイス、マイクデバイスと一体のヘッドセット、またはマイクスピーカなどであってもよい。
(操作部238)
操作部238は、音声会議端末20の利用者が音声会議端末20に情報または指示などを入力するために操作する構成である。操作部238は、表示面を有するタッチパネルであってもよい。この場合、操作部238は、音声会議への参加および音声会議の進行のための操作画面を表示し、利用者は当該操作画面において音声会議への参加のための操作、および音声会議の進行のための操作などを行い得る。
(制御部240)
制御部240は、音声会議端末20の動作全般を制御する。例えば、制御部240は、操作部238に対する利用者の指示に従い、収音部220、符号化部224、通信部228、復号部232および音出力部236の動作を制御する。
なお、音声会議端末20A~音声会議端末20Fの構成は上述した音声会議端末20の構成に完全一致している必要はなく、音声会議端末20A~音声会議端末20Fは、上述した構成の一部を有さなくてもよいし、追加的な他の構成を有してもよい。
<会議サーバの構成>
以上、本発明の一実施形態による音声会議端末20の構成を説明した。続いて、図3を参照し、本発明の一実施形態による会議サーバ30の構成を説明する。
図3は、本発明の一実施形態による会議サーバ30の構成を示す説明図である。図3に示したように、本発明の一実施形態による会議サーバ30は、通信部328、会議管理部332、配信制御部336、復号部340、音声検出部342、雑音検出部344、タイマー348および端末制御部352を備える。
(通信部328)
通信部328は、音声会議端末20と多様な通信を行う。例えば、通信部328は、音声会議端末20から、遠隔会議への接続要求、遠隔会議の切断要求、および音データなどを受信する受信部としての機能、会議ステータスおよび音データなどを音声会議端末20に送信する送信部としての機能を有する。また、通信部328は、後述する通知信号および制御コマンドも音声会議端末20に送信する。
(会議管理部332)
会議管理部332は、同一会議に参加している音声会議端末20を管理する。例えば、会議管理部332は、通信部328により音声会議端末20から遠隔会議への接続要求が受信されると、当該音声会議端末20の情報を接続要求先の遠隔会議のIDに関連付けて登録する。
(配信制御部336)
配信制御部336は、通信部328により音声会議端末20から受信された音データが他の音声会議端末20に配信されるように通信部328を制御する。
(復号部340)
復号部340は、通信部328により音声会議端末20から受信された音データを復号する。復号部340は、復号後の音データを音声検出部342および雑音検出部344に供給する。
(音声検出部342)
音声検出部342は、復号部340から供給された音データから音声を検出する。音声検出部342は、音声の検出に加えて音声認識を行ってもよい。
(雑音検出部344)
雑音検出部344は、復号部340から供給された音データから雑音区間を検出する。雑音区間は、音データが所定値以上の振幅を有するが、音声が検出されていない区間であってもよい。
(タイマー348)
タイマー348は、いずれの音声会議端末20から受信された音データからも音声が検出されていない非音声区間の時間、および、いずれかの音声会議端末20から受信された音データについて雑音検出部344により検出された雑音区間の時間を計測する時間計測部である。タイマー348は、非音声区間の時間が第1の設定時間を上回った場合に、端末制御部352に非音声区間の時間が第1の設定時間を上回ったことを示す信号を出力する。また、タイマー348は、雑音区間の時間が第2の設定時間を上回った場合に、端末制御部352に雑音区間の時間が第2の設定時間を上回ったことを示す信号を出力する。
第1の設定時間と第2の設定時間は異なる時間であってもよいし、同じ時間であってもよい。また、タイマー348が計測する非音声区間の時間は、単位時間内当たりでの非音声区間の時間であってもよいし、連続する1つの非音声区間の時間であってもよい。同様に、タイマー348が計測する雑音区間は、単位時間内当たりでの雑音区間の時間であってもよいし、連続する1つの雑音区間の時間であってもよい。
(端末制御部352)
端末制御部352は、タイマー348による時間の計測結果に基づき、音声会議端末20の動作を制御する信号を通信部328に音声会議端末20に送信させる。例えば、端末制御部352は、タイマー348により測定された非音声区間の時間が第1の設定時間を上回った場合、遠隔会議に参加している少なくともいずれかの音声会議端末20に通知信号が送信されるように通信部328を制御する。通知信号は、音声会議端末20において通知音として出力される符号化済みの音データであってもよいし、音声会議端末20に通知音の出力を指示するコマンドであってもよい。また、端末制御部352は、遠隔会議に参加する全ての音声会議端末20に通知信号が送信されるように通信部328を制御してもよい。カメラ映像などにより実際には音声を発している利用者を特定できる場合、端末制御部352は、当該利用者の音声会議端末20に通知信号が送信されるように通信部328を制御してもよい。
さらに、端末制御部352は、いずれかの音声会議端末20から受信された音データの雑音区間の時間が第2の設定時間を上回った場合、当該音声会議端末20に音データの送信を停止させる制御コマンドが送信されるように通信部328を制御する。端末制御部352は、音データの送信を停止させる制御コマンドに代えて、音データの送信を誘導する通知を出力させる制御コマンドの送信を制御してもよいし、音データの送信を誘導するメッセージの送信を制御してもよい。
<動作>
以上、本発明の一実施形態による音声会議端末20および会議サーバ30の構成を説明した。続いて、本発明の一実施形態による遠隔コミュニケーションシステムの動作を説明する。
(基本動作)
図4は、本発明の一実施形態による遠隔コミュニケーションシステムの基本動作を示す説明図である。図4~図6においては、3人の利用者UA~UCが遠隔会議を行う例を示している。
図4に示したように、まず、利用者UAが音声会議端末20Aに対して遠隔会議に参加するための操作を行うと(S1)、音声会議端末20Aが会議サーバ30に接続要求を送信する(S2)。遠隔会議に参加するための操作は、会議サーバ30において事前に用意された会議室を指定する操作であってもよいし、新たに会議室を作成する操作であってもよい。会議サーバ30が音声会議端末20Aからの接続要求を受信すると、会議サーバ30の会議管理部332が当該音声会議端末20Aを遠隔会議に参加する端末として登録する(S3)。
また、利用者UBが音声会議端末20Bに対して遠隔会議に参加するための操作を行うと(S4)、音声会議端末20Bが会議サーバ30に接続要求を送信し(S5)、会議サーバ30の会議管理部332が当該音声会議端末20Bを遠隔会議に参加する端末として登録する(S6)。同様に、利用者UCが音声会議端末20Cに対して遠隔会議に参加するための操作を行うと(S7)、音声会議端末20Cが会議サーバ30に接続要求を送信し(S8)、会議サーバ30の会議管理部332が当該音声会議端末20Cを遠隔会議に参加する端末として登録する(S9)。
その後、利用者UCが音声を発すると(S10)、音声会議端末20Cの収音部220が当該音声を収音して音データを取得し、符号化部224が音データを符号化し、通信部228が符号化された音データを会議サーバ30に送信する(S11)。会議サーバ30は、配信制御部336の制御により、音声会議端末20Cから受信された音データを他の音声会議端末20である音声会議端末20Aおよび音声会議端末20Bに配信する(S12、S14)。音声会議端末20Aおよび音声会議端末20Bは、会議サーバ30から配信された音データを復号し、復号された音データに基づいて利用者UCの音声を出力する(S13、S15)。
同様に、利用者UBが音声を発すると(S16)、音声会議端末20Bの収音部220が当該音声を収音して音データを取得し、符号化部224が音データを符号化し、通信部228が符号化された音データを会議サーバ30に送信する(S17)。会議サーバ30は、配信制御部336の制御により、音声会議端末20Bから受信された音データを他の音声会議端末20である音声会議端末20Aおよび音声会議端末20Cに配信する(S18、S20)。音声会議端末20Aおよび音声会議端末20Cは、会議サーバ30から配信された音データを復号し、復号された音データに基づいて利用者UBの音声を出力する(S19、S21)。
(雑音検出時の動作)
続いて、図5を参照し、音声会議端末20から送信された音データから雑音が検出された場合の動作を説明する。
図5は、音声会議端末20Aから送信された音データから雑音が検出された場合の動作を示す説明図である。図5に示したように、利用者UAが音声を発せずに、音声会議端末20Aの収音部220により雑音のみが収音された場合(S22)、音声会議端末20Aの符号化部224が雑音の音データを符号化し、通信部228が符号化された音データを会議サーバ30に送信する(S23)。会議サーバ30は、配信制御部336の制御により、音声会議端末20Aから受信された音データを他の音声会議端末20である音声会議端末20Bおよび音声会議端末20Cに配信する(S24、S26)。音声会議端末20Bおよび音声会議端末20Cは、会議サーバ30から配信された音データを復号し、復号された音データに基づいて音声会議端末20Aにおいて収音された雑音を出力する(S25、S27)。
ここで、雑音検出部344が音声会議端末20Aから送信された音データから雑音区間を検出すると(S28)、タイマー348が雑音区間の時間の計測を開始する(S29)。そして、雑音区間の時間が第2の設定時間を上回ると、会議サーバ30は音声会議端末20Aに音データの送信を停止させる制御コマンドを送信する(S30)。音データの送信を停止させる制御コマンドは、図5に示したように音声会議端末20Aの収音部220にマイクをOFFにさせる制御コマンドであってもよい。音声会議端末20Aは、当該制御コマンドの受信に基づき、収音部220のマイクをOFFにする、または、音データの送信を停止する。
(非音声区間検出時の動作)
次に、図6を参照し、非音声区間が検出された場合の動作を説明する。
図6は、非音声区間が検出された場合の動作を示す説明図である。図6に示したように、利用者UCが何も発言していない場合(S51)、音声会議端末20Cは、振幅が無い、または振幅が非常に小さい音データを会議サーバ30に送信する(S52)。会議サーバ30は、配信制御部336の制御により、音声会議端末20Cから受信された音データを他の音声会議端末20である音声会議端末20Aおよび音声会議端末20Bに配信する(S53、S55)。音声会議端末20Aおよび音声会議端末20Bは、会議サーバ30から配信された音データを復号し、復号された音データに基づいて振幅が無い、または振幅が非常に小さい音を出力する(S54、S56)。この場合、会議サーバ30の342は、音声会議端末20Cから受信された音データから音声を検出しない(S57)。
同様に、利用者UBが何も発言していない場合(S58)、音声会議端末20Bは、振幅が無い、または振幅が非常に小さい音データを会議サーバ30に送信する(S59)。会議サーバ30は、配信制御部336の制御により、音声会議端末20Bから受信された音データを他の音声会議端末20である音声会議端末20Aおよび音声会議端末20Cに配信する(S60、S62)。音声会議端末20Aおよび音声会議端末20Cは、会議サーバ30から配信された音データを復号し、復号された音データに基づいて振幅が無い、または振幅が非常に小さい音を出力する(S61、S63)。この場合、会議サーバ30の342は、音声会議端末20Bから受信された音データから音声を検出しない(S64)。
その後、利用者UAがマイクOFFのまま音声を発した場合(S65)、音声会議端末20Aは会議サーバ30への音データの送信を行わない(S66)。このため、会議サーバ30の音声検出部342は音声会議端末20Aの利用者UAの音声も検出しない(S67)。
タイマー348は、このようにいずれの利用者の音声も検出されない非音声区間の時間の計測を開始する(S68)。そして、非音声区間の時間が第1の設定時間を上回ると、会議サーバ30は各音声会議端末20に通知信号を送信する(S69、S71、S73)。各音声会議端末20は、通知信号の受信に基づき、通知音を出力する(S70、S72、S74)。通知音は、マイクがOFFになっている可能性があることを伝えるメッセージの音声であってもよい。
<作用効果>
以上説明した本発明の一実施形態によれば、多様な作用効果が得られる。例えば、本発明の一実施形態によれば、いずれの利用者の音声も検出されない非音声区間の時間が第1の設定時間を上回った場合に、会議サーバ30は通知信号を各音声会議端末20に送信し、各音声会議端末20が通知音を出力する。音声を発している利用者は、当該通知音に基づき、音声会議端末20のマイクがOFFになっている、または何かしらの原因で音声が他の利用者に届いていないことに気付くことができる。結果、遠隔会議の円滑な進行に繋がる。
特に、音声会議端末20のマイクがOFFになっている場合、利用者は発言することに意識が集中するため、自身の音声会議端末20のマイク状態までは気が回らないことが多く、マイク状態を示す表示や音レベルのインジケーター表示に気付き難い。このように発言に集中している場合であっても音による通知は利用者の耳に入るので、より確実に利用者が音声会議端末20のマイクがOFFになっていることに気付き得る。
また、本発明の一実施形態によれば、会議サーバ30は、いずれかの音声会議端末20から受信された音データの雑音区間の時間が第2の設定時間を上回った場合、当該音声会議端末20に音データの送信を停止させる制御コマンドを送信する。かかる構成によれば、遠隔会議の進行が雑音により妨害されることを抑制することができる。また、会議サーバ30が自動的に制御コマンドを送信し、音声会議端末20は当該制御コマンドに従って自動的に例えばマイクをOFFにするので、他の利用者が雑音を指摘する場合と比較して人的関係に角が立つ恐れが少ないという利点もある。
<変形例>
以上、本発明の一実施形態を説明した。以下では、上述した実施形態の幾つかの変形例を説明する。なお、以下に説明する各変形例は、単独で上述した実施形態に適用されてもよいし、組み合わせで上述した実施形態に適用されてもよい。また、各変形例は、上述した実施形態の構成に代えて適用されてもよいし、上述した実施形態の構成に対して追加的に適用されてもよい。
例えば、上記の実施形態では、遠隔コミュニケーションシステムに遠隔会議を中央管理する会議サーバ30が設けられる例を説明したが、遠隔コミュニケーションシステムには会議サーバ30が設けられなくてもよい。この場合、各音声会議端末20に、音声検出部342、雑音検出部344、タイマー348および端末制御部352に対応する機能が実装される。具体的には、各音声会議端末20は、自身の収音部220で得られた音データ、および他の音声会議端末20から受信された音データから音声および雑音の検出を行う。そして、いずれの音データからも音声が検出されない非音声区間の時間が第1の設定時間を上回った場合、音声会議端末20は所定の通知として通知音を出力してもよい。また、音声会議端末20は、自身の収音部220で得られた音データの雑音区間の時間が第2の設定時間を上回った場合、音声会議端末20からの音データの送信が停止されるように、例えば収音部220のマイクをOFFにしてもよい。このような変形例によっても、上述した実施形態と同等の効果を得ることが可能である。
<ハードウェア構成>
以上、本発明の実施形態を説明した。上述した非音声区間の検出および通知信号の送信などの情報処理は、ソフトウェアと、以下に説明する会議サーバ30のハードウェアとの協働により実現される。
図7は、会議サーバ30のハードウェア構成を示したブロック図である。会議サーバ30は、CPU(Central Processing Unit)301と、ROM(Read Only Memory)302と、RAM(Random Access Memory)303と、ホストバス304と、を備える。また、会議サーバ30は、ブリッジ305と、外部バス306と、インターフェース307と、入力装置308と、表示装置309と、音声出力装置310と、ストレージ装置(HDD)311と、ドライブ312と、ネットワークインターフェース315とを備える。
CPU301は、演算処理装置および制御装置として機能し、各種プログラムに従って会議サーバ30内の動作全般を制御する。また、CPU301は、マイクロプロセッサであってもよい。ROM302は、CPU301が使用するプログラムや演算パラメータ等を記憶する。RAM303は、CPU301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバス304により相互に接続されている。これらCPU301、ROM302およびRAM303とソフトウェアとの協働により、図3を参照して説明した復号部340、音声検出部342、雑音検出部344、タイマー348および端末制御部352などの各機能が実現され得る。
ホストバス304は、ブリッジ305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス306に接続されている。なお、必ずしもホストバス304、ブリッジ305および外部バス306を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
入力装置308は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、センサー、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU301に出力する入力制御回路などから構成されている。会議サーバ30のユーザは、該入力装置308を操作することにより、会議サーバ30に対して各種のデータを入力したり処理動作を指示したりすることができる。
表示装置309は、例えば、液晶ディスプレイ(LCD)装置、プロジェクター装置、OLED(Organic Light Emitting Diode)装置およびランプなどの表示装置を含む。また、音声出力装置310は、スピーカおよびヘッドホンなどの音声出力装置を含む。
ストレージ装置311は、本実施形態にかかる会議サーバ30の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置311は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置311は、例えば、HDD(Hard Disk Drive)またはSSD(Solid Strage Drive)、あるいは同等の機能を有するメモリ等で構成される。このストレージ装置311は、ストレージを駆動し、CPU301が実行するプログラムや各種データを格納する。
ドライブ312は、記憶媒体用リーダライタであり、会議サーバ30に内蔵、あるいは外付けされる。ドライブ312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体34に記録されている情報を読み出して、RAM303またはストレージ装置311に出力する。また、ドライブ312は、リムーバブル記憶媒体34に情報を書き込むこともできる。
ネットワークインターフェース315は、例えば、ネットワーク12に接続するための通信デバイス等で構成された通信インターフェースである。また、ネットワークインターフェース315は、無線LAN(Local Area Network)対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。
なお、上述した会議サーバ30のハードウェア構成は音声会議端末20にも適用可能である。
<補足>
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、本明細書の音声会議端末20および会議サーバ30の処理における各ステップは、必ずしもシーケンス図またはフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、音声会議端末20および会議サーバ30の処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、音声会議端末20および会議サーバ30に内蔵されるCPU、ROMおよびRAMなどのハードウェアに、上述した音声会議端末20および会議サーバ30の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた非一時的な記憶媒体も提供される。
20 音声会議端末
220 収音部
224 符号化部
228 通信部
232 復号部
236 音出力部
238 操作部
240 制御部
30 会議サーバ
328 通信部
332 会議管理部
336 配信制御部
340 復号部
342 音声検出部
344 雑音検出部
348 タイマー
352 端末制御部

Claims (8)

  1. 複数の利用者端末から収音により得られた音データを受信する受信部と、
    前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、
    前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信する送信部と、
    を備える、制御装置。
  2. 前記通知信号は、前記利用者端末において通知音として出力される音データ、または前記利用者端末に通知音を出力させる制御コマンドである、請求項1に記載の制御装置。
  3. 前記送信部は、前記通知信号を前記複数の利用者端末に送信する、請求項1または2に記載の制御装置。
  4. 前記時間計測部は、さらに、前記複数の利用者端末から受信された音データの各々について、音声が検出されず、かつ、雑音が検出されている雑音区間の時間を計測し、
    前記送信部は、いずれかの利用者端末から受信された音データの前記雑音区間が第2の設定時間を上回ったことに基づき、当該利用者端末に音データの送信を停止させる制御コマンドを送信する、請求項1~3のいずれか一項に記載の制御装置。
  5. 複数の利用者端末および制御装置を有する制御システムであって、
    前記複数の利用者端末は、
    収音により音データを取得する収音部を有し、
    前記制御装置は、
    前記複数の利用者端末から前記音データを受信する受信部と、
    前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、
    前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信する送信部と、
    を有する、制御システム。
  6. 複数の利用者端末から収音により得られた音データを受信することと、
    前記複数の利用者端末から受信されたいずれの音データからも音声が検出されない非音声区間の時間を計測することと、
    前記非音声区間の時間が第1の設定時間を上回ったことに基づき、前記複数の利用者端末のうちの少なくともいずれかの利用者端末に通知信号を送信することと、
    を含む、制御方法。
  7. 利用者端末であって、
    収音により音データを取得する収音部と、
    前記収音部により取得された前記音データを他の利用者端末に送信する送信部と、
    前記他の利用者端末から収音により得られた音データを受信する受信部と、
    前記収音部により取得された音データ、および前記他の利用者端末から受信された音データのいずれの音データからも音声が検出されない非音声区間の時間を計測する時間計測部と、
    前記非音声区間の時間が設定時間を上回ったことに基づき、前記利用者端末の利用者への所定の通知を制御する制御部と、
    を備える、利用者端末。
  8. 前記時間計測部は、さらに、前記収音部により取得された音データについて、音声が検出されず、かつ、雑音が検出されている雑音区間の時間を計測し、
    前記制御部は、前記雑音区間の時間が第2の設定時間を上回ったことに基づき、前記送信部からの前記音データの送信を停止させる、請求項7に記載の利用者端末。
JP2021112976A 2021-07-07 2021-07-07 制御装置、制御システム、方法および利用者端末 Pending JP2023009574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021112976A JP2023009574A (ja) 2021-07-07 2021-07-07 制御装置、制御システム、方法および利用者端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021112976A JP2023009574A (ja) 2021-07-07 2021-07-07 制御装置、制御システム、方法および利用者端末

Publications (1)

Publication Number Publication Date
JP2023009574A true JP2023009574A (ja) 2023-01-20

Family

ID=85118484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021112976A Pending JP2023009574A (ja) 2021-07-07 2021-07-07 制御装置、制御システム、方法および利用者端末

Country Status (1)

Country Link
JP (1) JP2023009574A (ja)

Similar Documents

Publication Publication Date Title
US9253303B2 (en) Signal processing apparatus and storage medium
US11570223B2 (en) Intelligent detection and automatic correction of erroneous audio settings in a video conference
US10499136B2 (en) Providing isolation from distractions
US8817061B2 (en) Recognition of human gestures by a mobile phone
US10681453B1 (en) Automatic active noise reduction (ANR) control to improve user interaction
US7742587B2 (en) Telecommunications and conference calling device, system and method
US7822050B2 (en) Buffering, pausing and condensing a live phone call
EP2761809B1 (en) Method, endpoint, and system for establishing a video conference
US8743743B1 (en) Management of mute and unmute requests during an electronic-conference session
US9094524B2 (en) Enhancing conferencing user experience via components
US6754546B1 (en) Electronic audio connection system and methods for providing same
US20190019067A1 (en) Multimedia conferencing system for determining participant engagement
US7973818B2 (en) Mixing background effects with real communication data to enhance personal communications
CN114845144B (zh) 一种投屏方法、辅助投屏装置及存储介质
US10469800B2 (en) Always-on telepresence device
JP2023009574A (ja) 制御装置、制御システム、方法および利用者端末
JP2019184800A (ja) 情報処理装置、プログラム、及び情報処理システム
JP7095356B2 (ja) 通信端末及び会議システム
JP2020036225A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2005151002A (ja) 遠隔会議システム
JP7331976B2 (ja) 情報処理装置、プログラム、及び情報処理システム
JP7293863B2 (ja) 音声処理装置、音声処理方法およびプログラム
US11825283B2 (en) Audio feedback for user call status awareness
US11509993B2 (en) Ambient noise detection using a secondary audio receiver
JP2004207892A (ja) 通信システム及び通信端末並びにコンピュータ・ソフトウエア