JP2023097781A - 音声処理システム及び音声処理方法 - Google Patents
音声処理システム及び音声処理方法 Download PDFInfo
- Publication number
- JP2023097781A JP2023097781A JP2021214079A JP2021214079A JP2023097781A JP 2023097781 A JP2023097781 A JP 2023097781A JP 2021214079 A JP2021214079 A JP 2021214079A JP 2021214079 A JP2021214079 A JP 2021214079A JP 2023097781 A JP2023097781 A JP 2023097781A
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- speaker device
- audio
- processing unit
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】音声データの到達時間が異なる複数のマイクスピーカー装置を併用する場合の音声品質を向上させることが可能な音声処理システム及び音声処理方法を提供する。【解決手段】音声処理システムは、特定音声が出力された場合に、第1マイクスピーカー装置が集音した前記特定音声の第1音声データと、第2マイクスピーカー装置が集音した前記特定音声の第2音声データとを受信する受信処理部と、前記受信処理部が前記第1音声データを受信した時点から前記受信処理部が前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する調整処理部と、を備える。【選択図】図1
Description
本発明は、マイクスピーカー装置の音声の送受信を行う音声処理システム及び音声処理方法に関する。
従来、複数の拠点(会議室など)をネットワーク接続して、複数のユーザーが参加して会議(オンライン会議)を行うことを可能にするシステムが知られている(例えば特許文献1参照)。例えば、前記システムは、各拠点に配置されたマイクスピーカー装置をネットワークに接続して、一方のマイクスピーカー装置が集音するユーザーの発話音声の音声データを他のマイクスピーカー装置から再生させることによりオンライン会議を実現する。
ところで、マイク及びスピーカーを備え、ユーザーの首周りに装着可能なウェアラブル型のマイクスピーカー装置が知られている。このマイクスピーカー装置は、装着者の発話音声を取得して他のマイクスピーカー装置に送信したり、他のマイクスピーカー装置から受信した音声を当該装着者に向けて再生したりすることができる。ユーザーは、ウェアラブル型のマイクスピーカー装置を利用することにより、自身の発話音声をマイクに確実に集音(音声認識)させることができ、またスピーカーから再生される音声を容易に聞き取ることができる。
ここで、例えば、会議室において、ネットワークに有線接続される卓上型のマイクスピーカー装置と、ネットワークに無線接続されるウェアラブル型のマイクスピーカー装置とを併用する場合に、各マイクスピーカー装置における音声データの到達時間(例えば伝送速度)の違いに起因して以下の問題が生じることが考えられる。具体的には、一方の会議室において、卓上型のマイクスピーカー装置とウェアラブル型のマイクスピーカー装置とがユーザーの発話音声を集音した場合に、他方の会議室のスピーカー装置(卓上型のマイクスピーカー装置、ウェアラブル型のマイクスピーカー装置など)から異なるタイミングで当該音声が再生され、他方の会議室のユーザーにとって音声が二重に聞こえてしまう問題が生じる。
この問題は、有線接続及び無線接続など接続方式が異なる複数のマイクスピーカー装置を併用する場合だけに生じるものではない。例えば、接続方式が同一の複数のマイクスピーカー装置を併用する場合であっても音声データの到達時間が異なる複数のマイクスピーカー装置を併用する場合には、同様の問題が起こり得る。具体的には、機種(型番)が同一であり、かつ接続方式も同一(例えばBluetooth(登録商標)方式)である複数のマイクスピーカー装置を併用する場合に、環境の影響により互いの到達時間が異なると、上述の問題が生じる可能性がある。
本発明の目的は、音声データの到達時間が異なる複数のマイクスピーカー装置を併用する場合の音声品質を向上させることが可能な音声処理システム及び音声処理方法を提供することにある。
本発明の一の態様に係る音声処理システムは、第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理システムであって、特定音声が再生された場合に、前記第1マイクスピーカー装置が集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置が集音した前記特定音声の第2音声データとを受信する受信処理部と、前記受信処理部が前記第1音声データを受信した時点から前記受信処理部が前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する調整処理部と、を備えるシステムである。
本発明の一の態様に係る音声処理システムは、第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理システムであって、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれのスピーカーから特定音声を再生させる出力処理部と、前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のいずれか一方のマイクスピーカー装置のマイクが集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置のスピーカーから再生され、前記一方のマイクスピーカー装置のマイクが集音した前記特定音声の第2音声データとを受信する受信処理部と、前記受信処理部が前記第1音声データを受信した時点から前記受信処理部が前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの再生タイミングを調整する調整処理部と、を備えるシステムである。
本発明の他の態様に係る音声処理方法は、第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理方法であって、一又は複数のプロセッサーが、特定音声が再生された場合に、前記第1マイクスピーカー装置が集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置が集音した前記特定音声の第2音声データとを受信する受信ステップと、前記受信ステップにおいて前記第1音声データを受信した時点から前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する調整ステップと、を実行する方法である。
本発明の他の態様に係る音声処理方法は、第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理方法であって、一又は複数のプロセッサーが、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれのスピーカーから特定音声を再生させる出力ステップと、前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のいずれか一方のマイクスピーカー装置のマイクが集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置のスピーカーから再生され、前記一方のマイクスピーカー装置のマイクが集音した前記特定音声の第2音声データとを受信する受信ステップと、前記受信ステップにおいて前記第1音声データを受信した時点から前記受信ステップにおいて前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの再生タイミングを調整する調整ステップと、を実行する方法である。
本発明によれば、音声データの到達時間が異なる複数のマイクスピーカー装置を併用する場合の音声品質を向上させることが可能な音声処理システム及び音声処理方法を提供することが可能である。
以下、添付図面を参照しながら、本発明の実施形態について説明する。なお、以下の実施形態は、本発明を具体化した一例であって、本発明の技術的範囲を限定する性格を有さない。
本発明に係る音声処理システムは、例えば2つの拠点(例えば会議室R1,R2)において、会議室R1,R2のそれぞれに設置された卓上型マイクスピーカー装置と、複数のユーザーのそれぞれが所持するウェアラブル型マイクスピーカー装置とを使用して会議(オンライン会議など)を行うケースに適用することができる。前記ウェアラブル型マイクスピーカー装置は、例えばネックバンド型の形状を有し、各ユーザーは、前記ウェアラブル型マイクスピーカー装置を自身の首に装着して前記会議に参加する。
各ユーザーは、前記ウェアラブル型マイクスピーカー装置のスピーカーから再生される音声を聞き取ることができ、また自身が発話した発話音声を前記ウェアラブル型マイクスピーカー装置のマイクに集音させることができる。また、卓上型マイクスピーカー装置は、会議室の机上に載置されており、卓上型マイクスピーカー装置に搭載されたマイクにより当該会議室にいるユーザーの発話音声を集音したり、卓上型マイクスピーカー装置に搭載されたスピーカーから当該会議室にいるユーザーに向けて音声を再生(放音)したりする。
同一拠点において、卓上型マイクスピーカー装置とウェアラブル型マイクスピーカー装置とを併用することにより、当該拠点にいる各ユーザーは、自身の発話音声を各装置のマイクに確実に集音(音声認識)させることができ、また各装置のスピーカーから再生される音声を確実に聞き取ることができる。
なお、本発明に係る音声処理システムは、1つの拠点において複数のユーザーが卓上型マイクスピーカー装置とウェアラブル型マイクスピーカー装置とを併用して会議を行うケースにも適用することができる。
[会議システム100]
図1は、本発明の実施形態に係る会議システム100の構成を示す図である。会議システム100は、本発明の音声処理システムの一例である。会議システム100は、音声処理装置1とウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3と会議サーバー4とを含んでいる。ウェアラブル型マイクスピーカー装置2は、マイク24及びスピーカー25(図3参照)を搭載する音響機器であり、ユーザーが自身(例えば首)に装着可能なネックバンド型の形状を有する。卓上型マイクスピーカー装置3は、マイク31及びスピーカー32(図1参照)を搭載する音響機器である。なお、ウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3は、例えばAIスピーカー、スマートスピーカなどの機能を備えてもよい。卓上型マイクスピーカー装置3は本発明の第1マイクスピーカー装置の一例であり、ウェアラブル型マイクスピーカー装置2は本発明の第2マイクスピーカー装置の一例である。
図1は、本発明の実施形態に係る会議システム100の構成を示す図である。会議システム100は、本発明の音声処理システムの一例である。会議システム100は、音声処理装置1とウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3と会議サーバー4とを含んでいる。ウェアラブル型マイクスピーカー装置2は、マイク24及びスピーカー25(図3参照)を搭載する音響機器であり、ユーザーが自身(例えば首)に装着可能なネックバンド型の形状を有する。卓上型マイクスピーカー装置3は、マイク31及びスピーカー32(図1参照)を搭載する音響機器である。なお、ウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3は、例えばAIスピーカー、スマートスピーカなどの機能を備えてもよい。卓上型マイクスピーカー装置3は本発明の第1マイクスピーカー装置の一例であり、ウェアラブル型マイクスピーカー装置2は本発明の第2マイクスピーカー装置の一例である。
会議システム100は、例えば複数の拠点のそれぞれに、複数台のウェアラブル型マイクスピーカー装置2と、1台の卓上型マイクスピーカー装置3とが配置され、これらウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3の間でユーザーの発話音声の音声データを送受信することによりオンライン会議を実現する。
会議サーバー4は、前記オンライン会議を実現する会議アプリケーションを実行する。また、会議サーバー4は、会議情報を管理する。音声処理装置1は、ウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3を制御し、会議が開始されると各マイクスピーカー装置(ウェアラブル型マイクスピーカー装置2、卓上型マイクスピーカー装置3)の間で音声を送受信する処理を実行する。なお、音声処理装置1単体が、本発明の音声処理システムを構成してもよい。
本実施形態では、図2に示すオンライン会議を例に挙げて説明する。オンライン会議の参加者であるユーザーA~HのうちユーザーA,B,C,Dは会議室R1に位置しており、ユーザーE,F,G,Hは会議室R2に位置している。ユーザーA~Hは、それぞれウェアラブル型マイクスピーカー装置2A~2Hを首に装着して会議に参加する。また、会議室R1には音声処理装置1a、卓上型マイクスピーカー装置3a、及びディスプレイDP1が設置されており、会議室R2には音声処理装置1b、卓上型マイクスピーカー装置3b、及びディスプレイDP2が設置されている。ディスプレイDP1,DP2は、それぞれの画面が共有されており、例えば会議資料を表示する。
会議サーバー4と、音声処理装置1a及び音声処理装置1aのそれぞれとは、インターネットなどの通信網N1(図1参照)を介してデータ通信可能に構成されている。
音声処理装置1aと、卓上型マイクスピーカー装置3a及びディスプレイDP1のそれぞれとは、有線LANなどの通信網N3(図1参照)を介してデータ通信可能に構成されている。同様に、音声処理装置1bと、卓上型マイクスピーカー装置3b及びディスプレイDP2のそれぞれとは、有線LANなどの通信網N3(図1参照)を介してデータ通信可能に構成されている。
音声処理装置1aと、ウェアラブル型マイクスピーカー装置2A~2Dのそれぞれとは、無線LAN(例えばBluetooth(登録商標)、Wi-Fi(登録商標))などの通信網N2(図1参照)を介してデータ通信可能に構成されている。同様に、音声処理装置1bと、ウェアラブル型マイクスピーカー装置2E~2Hのそれぞれとは、無線LAN(例えばBluetooth、Wi-Fi)などの通信網N2(図1参照)を介してデータ通信可能に構成されている。
音声処理装置1a,1bは、同一の機能(ミキシング機能など)を有する音響機器(例えばミキサー)である。なお、音声処理装置1a,1bは、情報処理装置(例えばパーソナルコンピュータ)であってもよい。音声処理装置1a,1bにおいて共通の説明する場合は、「音声処理装置1」と称す。
具体的には、会議サーバー4は、インターネットの通信網N1を利用して、会議室R1,R2の音声データを音声処理装置1a,1bの間で送受信する。例えば音声処理装置1aは、ユーザーAの発話音声の音声データをウェアラブル型マイクスピーカー装置2Aから取得すると、当該音声データを会議サーバー4に送信する。会議サーバー4は、音声処理装置1aから取得した前記音声データを音声処理装置1bに送信する。音声処理装置1bは、会議サーバー4から取得した前記音声データをユーザーE~Hのウェアラブル型マイクスピーカー装置2E~2Hのそれぞれと、卓上型マイクスピーカー装置3bとに送信してそれぞれから当該発話音声を再生させる。なお、音声処理装置1aは、さらに、ウェアラブル型マイクスピーカー装置2Aから取得した前記音声データをユーザーB~Dのウェアラブル型マイクスピーカー装置2B~2Dのそれぞれと、卓上型マイクスピーカー装置3aとに送信してそれぞれから当該発話音声を再生させてもよい。また、会議サーバー4は、ユーザーの操作を受け付けて会議資料などをディスプレイDP1,DP2に表示させる。このようにして、会議サーバー4は、オンライン会議を実現する。
また、会議サーバー4には、オンライン会議に関する会議情報D1などのデータが記憶される。図4には、会議情報D1の一例を示している。図4に示すように、会議情報D1には、会議ごとに、会議の識別情報(会議ID)、会議の開催場所、会議の開始日時及び終了日時、会議の参加者、会議に使用する資料の各情報が含まれる。会議ID「M001」には、図2に示すオンライン会議に対応する情報が登録されている。例えば前記オンライン会議の主催者は、自身の端末(パーソナルコンピューター)を使用して会議情報D1を事前に登録する。会議サーバー4は、クラウドサーバーで構成されてもよい。
[ウェアラブル型マイクスピーカー装置2]
図3には、ウェアラブル型マイクスピーカー装置2の外観の一例を示している。図3に示すように、ウェアラブル型マイクスピーカー装置2は、電源22、接続ボタン23、マイク24、スピーカー25、通信部(不図示)などを備える。ウェアラブル型マイクスピーカー装置2は、例えばユーザーの首に装着可能なネックバンド型のウェアラブル機器である。ウェアラブル型マイクスピーカー装置2は、ユーザーの音声をマイク24を介して取得したり、当該ユーザーに対してスピーカー25から音声を再生したりする。ウェアラブル型マイクスピーカー装置2は、各種情報を表示する表示部を備えてもよい。
図3には、ウェアラブル型マイクスピーカー装置2の外観の一例を示している。図3に示すように、ウェアラブル型マイクスピーカー装置2は、電源22、接続ボタン23、マイク24、スピーカー25、通信部(不図示)などを備える。ウェアラブル型マイクスピーカー装置2は、例えばユーザーの首に装着可能なネックバンド型のウェアラブル機器である。ウェアラブル型マイクスピーカー装置2は、ユーザーの音声をマイク24を介して取得したり、当該ユーザーに対してスピーカー25から音声を再生したりする。ウェアラブル型マイクスピーカー装置2は、各種情報を表示する表示部を備えてもよい。
図3に示すように、ウェアラブル型マイクスピーカー装置2の本体21は、ウェアラブル型マイクスピーカー装置2を装着したユーザーから見て左右のアームを備え、U字状に形成されている。
マイク24は、ユーザーの発話音声を集音し易いように、ウェアラブル型マイクスピーカー装置2の先端部に配置されている。マイク24は、ウェアラブル型マイクスピーカー装置2に内蔵されたマイク用基板(不図示)に接続されている。
スピーカー25には、ウェアラブル型マイクスピーカー装置2を装着したユーザーから見て左側のアームに配置されるスピーカー25Lと右側のアームに配置されるスピーカー25Rとが含まれる。スピーカー25L,25Rは、ユーザーが再生音を聞き取り易いように、ウェアラブル型マイクスピーカー装置2のアームの中央付近に配置されている。スピーカー25L,25Rは、ウェアラブル型マイクスピーカー装置2に内蔵されたスピーカー用基板(不図示)に接続されている。
前記マイク用基板は、音声データを音声処理装置1に送信するためのトランスミッター基板であり、前記通信部に含まれる。また、前記スピーカー用基板は、音声処理装置1から音声データを受信するためのレシーバー基板であり、前記通信部に含まれる。なお、前記マイク用基板及び前記スピーカー用基板が一つの基板(例えばBluetooth用基板)で構成され、当該基板が音声データを送受信してもよい。
前記通信部は、ウェアラブル型マイクスピーカー装置2を無線で音声処理装置1との間で所定の通信プロトコルに従ったデータ通信を実行するための通信インターフェースである。具体的には、前記通信部は、例えばBluetooth方式により音声処理装置1と接続して通信を行う。例えば、ユーザーが電源22をオン状態にした後に接続ボタン23を押下すると、前記通信部は、ペアリング処理を実行してウェアラブル型マイクスピーカー装置2を音声処理装置1に接続する。なお、ウェアラブル型マイクスピーカー装置2と音声処理装置1との間に中継機が配置され、当該中継機がウェアラブル型マイクスピーカー装置2とペアリング(Bluetooth接続)し、当該中継機と音声処理装置1とが有線LANなどにより接続されてもよい。
[卓上型マイクスピーカー装置3]
図1に示すように、卓上型マイクスピーカー装置3は、電源(不図示)、マイク31、スピーカー32、通信部(不図示)などを備える。卓上型マイクスピーカー装置3は、持ち運び可能な携帯型の機器であってもよいし、会議室内の机上などに据え置かれた据え置き型の機器であってもよい。卓上型マイクスピーカー装置3は、設置される場所が限定されるものではなく、また移動(携帯)可能であってもよい。本発明の第1マイクスピーカー装置には、ユーザーが使用時に自身に装着しない非ウェアラブル型の各種機器が含まれる。また、卓上型マイクスピーカー装置3は、音声処理装置1に内蔵されてもよい。卓上型マイクスピーカー装置3は、所定領域内のユーザーの発話音声をマイク31を介して取得したり、当該ユーザーに対してスピーカー32から音声を再生したりする。卓上型マイクスピーカー装置3は、各種情報を表示する表示部を備えてもよい。
図1に示すように、卓上型マイクスピーカー装置3は、電源(不図示)、マイク31、スピーカー32、通信部(不図示)などを備える。卓上型マイクスピーカー装置3は、持ち運び可能な携帯型の機器であってもよいし、会議室内の机上などに据え置かれた据え置き型の機器であってもよい。卓上型マイクスピーカー装置3は、設置される場所が限定されるものではなく、また移動(携帯)可能であってもよい。本発明の第1マイクスピーカー装置には、ユーザーが使用時に自身に装着しない非ウェアラブル型の各種機器が含まれる。また、卓上型マイクスピーカー装置3は、音声処理装置1に内蔵されてもよい。卓上型マイクスピーカー装置3は、所定領域内のユーザーの発話音声をマイク31を介して取得したり、当該ユーザーに対してスピーカー32から音声を再生したりする。卓上型マイクスピーカー装置3は、各種情報を表示する表示部を備えてもよい。
前記通信部は、卓上型マイクスピーカー装置3を有線で音声処理装置1との間で所定の通信プロトコルに従ったデータ通信を実行するための通信インターフェースである。具体的には、前記通信部は、例えばLANケーブルにより音声処理装置1と接続して通信を行う。卓上型マイクスピーカー装置3は、周知の機器を適用することができる。
[音声処理装置1]
図1に示すように、音声処理装置1は、制御部11、記憶部12、操作表示部13、通信部14などを備える音響機器(ミキサー)である。なお、音声処理装置1は、1台の機器に限らず、複数台の機器が協働して動作するコンピュータシステムであってもよい。また、音声処理装置1で実行される各種の処理は、一又は複数のプロセッサーによって分散して実行されてもよい。
図1に示すように、音声処理装置1は、制御部11、記憶部12、操作表示部13、通信部14などを備える音響機器(ミキサー)である。なお、音声処理装置1は、1台の機器に限らず、複数台の機器が協働して動作するコンピュータシステムであってもよい。また、音声処理装置1で実行される各種の処理は、一又は複数のプロセッサーによって分散して実行されてもよい。
通信部14は、音声処理装置1を有線又は無線で通信網に接続し、通信網を介して会議サーバー4、ウェアラブル型マイクスピーカー装置2、卓上型マイクスピーカー装置3、ディスプレイDP1,DP2などの外部機器との間で所定の通信プロトコルに従ったデータ通信を実行するための通信部である。例えば、通信部14は、Bluetooth方式によるペアリング処理を実行して通信網N2に接続して、ウェアラブル型マイクスピーカー装置2とデータ通信を行う。また、通信部14は、有線LANにより通信網N3に接続して、卓上型マイクスピーカー装置3とデータ通信を行う。また、通信部14は、オンライン会議を行う場合に、インターネットにより通信網N1に接続して会議サーバー4とデータ通信を行う。
操作表示部13は、各種の情報を表示する液晶ディスプレイ又は有機ELディスプレイのような表示部と、操作を受け付けるマウス、キーボード、又はタッチパネルのような操作部とを備えるユーザーインターフェースである。
記憶部12は、各種の情報を記憶するHDD(Hard Disk Drive)又はSSD(Solid State Drive)などの不揮発性の記憶部である。具体的には、記憶部12には、ウェアラブル型マイクスピーカー装置2の設定情報D2などのデータが記憶される。
図5には、音声処理装置1aの記憶部12に記憶される設定情報D2の一例を示している。図5に示すように、設定情報D2には、「機器ID」、「第1遅延量」、「第2遅延量」、「音量」、「マイクゲイン」などの情報が含まれる。前記機器IDは、ウェアラブル型マイクスピーカー装置2の識別情報であり、例えば機器番号が登録される。ここでは、「MS001」~「MS004」のそれぞれは、ウェアラブル型マイクスピーカー装置2A~2Dのそれぞれに対応する。前記第1遅延量及び前記第2遅延量は、卓上型マイクスピーカー装置3の音声データの伝送速度と、ウェアラブル型マイクスピーカー装置2の音声データの伝送速度との違いに対応する遅延時間に関する情報である。詳細は後述するが、制御部11は、前記第1遅延量に基づいて、発話音声の音声データの送信(伝達)処理を実行し、前記第2遅延量に基づいて、発話音声の音声データの再生処理を実行する。
前記音量は、各ウェアラブル型マイクスピーカー装置2の音量であり、前記マイクゲインは、各ウェアラブル型マイクスピーカー装置2のマイクゲインである。各音声処理装置1は、自身に接続されるウェアラブル型マイクスピーカー装置2に対応する設定情報D2を記憶している。
また、記憶部12には、制御部11に後述の音声調整処理(図8参照)を実行させるための音声調整プログラムなどの制御プログラムが記憶されている。例えば、前記音声調整プログラムは、CD又はDVDなどのコンピュータ読取可能な記録媒体に非一時的に記録され、音声処理装置1が備えるCDドライブ又はDVDドライブなどの読取装置(不図示)で読み取られて記憶部12に記憶されてもよい。
制御部11は、CPU、ROM、及びRAMなどの制御機器を有する。前記CPUは、各種の演算処理を実行するプロセッサーである。前記ROMは、前記CPUに各種の演算処理を実行させるためのBIOS及びOSなどの制御プログラムが予め記憶される不揮発性の記憶部である。前記RAMは、各種の情報を記憶する揮発性又は不揮発性の記憶部であり、前記CPUが実行する各種の処理の一時記憶メモリー(作業領域)として使用される。そして、制御部11は、前記ROM又は記憶部12に予め記憶された各種の制御プログラムを前記CPUで実行することにより音声処理装置1を制御する。
具体的には、制御部11は、図1に示すように、会議処理部111、出力処理部112、受信処理部113、調整処理部114などの各種の処理部を含む。なお、制御部11は、前記CPUで前記制御プログラムに従った各種の処理を実行することによって前記各種の処理部として機能する。また、一部又は全部の前記処理部が電子回路で構成されていてもよい。なお、前記制御プログラムは、複数のプロセッサーを前記処理部として機能させるためのプログラムであってもよい。
会議処理部111は、オンライン会議を実行する。具体的には、会議処理部111は、会議が開始されると、ウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3のそれぞれが集音した発話者の発話音声の音声データを取得する。
例えば、会議が開始されて会議室R1のユーザーAが発話すると、ウェアラブル型マイクスピーカー装置2Aのマイク24がユーザーAの発話音声を集音し、ウェアラブル型マイクスピーカー装置2Aが当該発話音声の音声データを、会議室R1の音声処理装置1aに送信する。また、ユーザーAが発話すると、会議室R1の卓上型マイクスピーカー装置3aのマイク31がユーザーAの発話音声を集音し、卓上型マイクスピーカー装置3aが当該発話音声の音声データを音声処理装置1aに送信する。
音声処理装置1aの会議処理部111は、ウェアラブル型マイクスピーカー装置2A及び卓上型マイクスピーカー装置3aのそれぞれから、ユーザーAの発話音声の音声データを取得する。会議処理部111は、前記音声データに対して後述の第1音声調整処理(図6A及び図6B参照)が実行された音声データを会議サーバー4に送信(伝達)する。会議サーバー4は、音声処理装置1aから前記音声データを受信すると、当該音声データを会議室R2の音声処理装置1bに送信する。音声処理装置1bの会議処理部111は、前記音声データを受信すると、前記音声データに対して後述の第2音声調整処理(図7A及び図7B参照)が実行された音声データを、会議室R2のウェアラブル型マイクスピーカー装置2E~2Hと、卓上型マイクスピーカー装置3bとに送信する。なお、音声処理装置1aの会議処理部111は、前記音声データを会議室R1のウェアラブル型マイクスピーカー装置2B~2Dと、卓上型マイクスピーカー装置3aとに送信してもよい。
これにより、各ユーザーは、自身のウェアラブル型マイクスピーカー装置2又は卓上型マイクスピーカー装置3から再生される前記発話音声を聞き取ることができる。会議処理部111が前記音声データを送信する送信先の機器である会議サーバー4及び会議サーバー4から前記音声データを受信する音声処理装置1bは、本発明の機器の一例である。
このように、会議室R1の音声処理装置1aの会議処理部111は、会議室R1内のウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3aのそれぞれが集音した発話音声の音声データを受信して、後述の第1音声調整処理が施された音声データを会議サーバー4に送信する。会議サーバー4は、音声処理装置1aから受信した音声データを会議室R2の音声処理装置1bに送信する。また、会議室R2の音声処理装置1bの会議処理部111は、会議サーバー4から前記音声データを受信して、後述の第2音声調整処理が施された音声データを会議室R2のウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3とに送信する。
同様に、会議室R2の音声処理装置1bの会議処理部111は、会議室R2内のウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3bのそれぞれが集音した発話音声の音声データを受信して、後述の第1音声調整処理が施された音声データを会議サーバー4に送信する。会議サーバー4は、音声処理装置1bから受信した音声データを会議室R1の音声処理装置1aに送信する。また、会議室R1の音声処理装置1aの会議処理部111は、会議サーバー4から前記音声データを受信して、後述の第2音声調整処理が施された音声データを会議室R1のウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3とに送信する。このようにして、各音声処理装置1の会議処理部111は、音声データの送受信を実行してオンライン会議を実現する。会議処理部111は、本発明の音声処理部の一例である。
ここで、ウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3とは、音声データの伝送速度が互いに異なる。例えばウェアラブル型マイクスピーカー装置2は無線通信により音声データを音声処理装置1に伝送し、卓上型マイクスピーカー装置3は有線通信により音声データを音声処理装置1に伝送するため、ウェアラブル型マイクスピーカー装置2における音声データの伝送速度は卓上型マイクスピーカー装置3における音声データの伝送速度よりも遅くなる。このため、例えば会議室R1において、ウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3aとがユーザーの発話音声を集音した場合に、会議室R2の卓上型マイクスピーカー装置3bから異なるタイミングで当該発話音声が再生され、会議室R2のユーザーに音声が二重に聞こえてしまう問題が生じる。
そこで、本実施形態に係る音声処理装置1は、以下に示す音声調整処理(第1音声調整処理、第2音声調整処理)を実行する。制御部11は、第1音声調整処理及び第2音声調整処理を個別に実行する。
具体的には、前記第1音声調整処理では、出力処理部112は、音声調整用のテスト音声(本発明の特定音声)を出力する。例えば、出力処理部112は、テスト音声の音声データ(テスト音声データTs)を、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2の少なくともいずれかのスピーカーから再生させる。出力処理部112は、本発明の出力処理部の一例である。
例えば図6Aに示すように、音声処理装置1aの出力処理部112は、テスト音声データTsを、卓上型マイクスピーカー装置3aのスピーカー32から再生させる。卓上型マイクスピーカー装置3aは、音声処理装置1aからテスト音声データTsを受信すると、スピーカー32からテスト音声を再生する。
受信処理部113は、前記テスト音声が再生された場合に、卓上型マイクスピーカー装置3が集音した前記テスト音声の第1集音データSc1と、ウェアラブル型マイクスピーカー装置2が集音した前記テスト音声の第2集音データSc2とを受信する。
例えば図6Bに示すように、卓上型マイクスピーカー装置3aは、自身のスピーカー32から前記テスト音声を再生すると、自身のマイク31により当該テスト音声を集音する。卓上型マイクスピーカー装置3aは、集音した前記テスト音声の第1集音データSc1を音声処理装置1aに送信し、音声処理装置1aの受信処理部113は、当該第1集音データSc1を受信する。また、ウェアラブル型マイクスピーカー装置2Aは、卓上型マイクスピーカー装置3aから再生される前記テスト音声を、自身のマイク24により集音する。ウェアラブル型マイクスピーカー装置2Aは、集音した前記テスト音声の第2集音データSc2を音声処理装置1aに送信し、音声処理装置1aの受信処理部113は、当該第2集音データSc2を受信する。
なお、受信処理部113は、ウェアラブル型マイクスピーカー装置2B~2Dのそれぞれからも同様に第2集音データSc2を受信してもよい。
このように、受信処理部113は、卓上型マイクスピーカー装置3aのスピーカー32から再生され、卓上型マイクスピーカー装置3aのマイク31が集音したテスト音声の第1集音データSc1と、卓上型マイクスピーカー装置3aのスピーカー32から再生され、ウェアラブル型マイクスピーカー装置2のマイク24が集音した前記テスト音声の第2集音データSc2とを受信する。受信処理部113は、本発明の受信処理部の一例である。
調整処理部114は、受信処理部113が第1集音データSc1を受信した時点から受信処理部113が第2集音データSc2を受信した時点までの時間差(経過時間)に基づいて、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する処理(第1音声調整処理)を実行する。調整処理部114は、本発明の調整処理部の一例である。
具体的には、調整処理部114は、前記時間差に応じたバッファリングを実行する。例えば、図6Bに示す例において、受信処理部113が第1集音データSc1を受信した時点から受信処理部113が第2集音データSc2を受信した時点までの時間差がDt1の場合に、調整処理部114は、第2集音データSc2の送信元のウェアラブル型マイクスピーカー装置2(ここではウェアラブル型マイクスピーカー装置2A)に第1遅延量Dt1(遅延時間)を設定する。調整処理部114は、設定した第1遅延量Dt1の情報を設定情報D2に登録する(図5参照)。
会議処理部111は、調整処理部114により設定される前記第1遅延量に基づいて、前記発話音声の音声データを機器に送信(伝達)する。例えば、音声処理装置1aの会議処理部111は、ウェアラブル型マイクスピーカー装置2A及び卓上型マイクスピーカー装置3aのそれぞれから、ユーザーAの発話音声の音声データを取得すると、卓上型マイクスピーカー装置3aから取得する前記音声データに対して設定された第1遅延量Dt1に基づいて前記音声データを会議サーバー4に送信する。例えば、会議処理部111は、卓上型マイクスピーカー装置3aから前記音声データを取得した時点から第1遅延量Dt1の時間が経過した時点で前記音声データを会議サーバー4に送信する。
これにより、ウェアラブル型マイクスピーカー装置2A及び卓上型マイクスピーカー装置3aのそれぞれが前記音声データを伝達するタイミングを一致させることができる。すなわち、会議サーバー4が卓上型マイクスピーカー装置3aから前記音声データを受信するタイミングと、会議サーバー4がウェアラブル型マイクスピーカー装置2Aから前記音声データを受信するタイミングとを一致させることができる。また、会議サーバー4は、同一のタイミングで受信する音声データを音声処理装置1bに送信することができる。
調整処理部114は、各ウェアラブル型マイクスピーカー装置2に対して前記第1遅延量を設定する(図5参照)。会議処理部111は、例えばユーザーBの発話音声の音声データをウェアラブル型マイクスピーカー装置2B及び卓上型マイクスピーカー装置3aのそれぞれから取得すると、卓上型マイクスピーカー装置3aから前記音声データを取得した時点から第1遅延量Dt2の時間が経過した時点で前記音声データを会議サーバー4に送信する。このように、会議処理部111は、ウェアラブル型マイクスピーカー装置2に対応する第1遅延量に基づいて、ウェアラブル型マイクスピーカー装置2B及び卓上型マイクスピーカー装置3aのそれぞれが集音した音声データの伝達タイミングを一致させる。
また、前記第2音声調整処理では、例えば図7Aに示すように、音声処理装置1aの出力処理部112は、テスト音声データTs1を卓上型マイクスピーカー装置3aのスピーカー32から再生させ、テスト音声データTs2をウェアラブル型マイクスピーカー装置2のスピーカー25から再生させる。卓上型マイクスピーカー装置3aは、音声処理装置1aからテスト音声データTs1を受信すると、スピーカー32からテスト音声を再生し、ウェアラブル型マイクスピーカー装置2は、音声処理装置1aからテスト音声データTs2を受信すると、スピーカー25からテスト音声を再生する。なお、出力処理部112は、テスト音声データTs1,Ts2を同一のタイミングで卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2に出力する。
図7Bに示すように、卓上型マイクスピーカー装置3aは、自身のスピーカー32から前記テスト音声を再生すると、自身のマイク31により当該テスト音声を集音する。また、卓上型マイクスピーカー装置3aは、ウェアラブル型マイクスピーカー装置2がスピーカー25から前記テスト音声を再生すると、自身のマイク31により当該テスト音声を集音する。卓上型マイクスピーカー装置3aは、スピーカー32から再生されて集音した前記テスト音声の第1集音データSc1を音声処理装置1aに送信し、音声処理装置1aの受信処理部113は、当該第1集音データSc1を受信する。また、卓上型マイクスピーカー装置3は、ウェアラブル型マイクスピーカー装置2のスピーカー25から再生されて集音した前記テスト音声の第2集音データSc2を音声処理装置1aに送信し、音声処理装置1aの受信処理部113は、当該第2集音データSc2を受信する。このように、受信処理部113は、卓上型マイクスピーカー装置3aのスピーカー32から再生され、卓上型マイクスピーカー装置3aのマイク31が集音した前記テスト音声の第1集音データSc1と、ウェアラブル型マイクスピーカー装置2のスピーカー25から再生され、卓上型マイクスピーカー装置3aのマイク31が集音した前記テスト音声の第2集音データSc2とを受信する。
調整処理部114は、受信処理部113が第1集音データSc1を受信した時点から受信処理部113が第2集音データSc2を受信した時点までの時間差(経過時間)に基づいて、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2の少なくともいずれかにおける前記発話音声の音声データの再生タイミングを調整する処理(第2音声調整処理)を実行する。
具体的には、調整処理部114は、前記時間差に応じたバッファリングを実行する。例えば、図7Bに示す例において、受信処理部113が第1集音データSc1を受信した時点から受信処理部113が第2集音データSc2を受信した時点までの時間差がDs1の場合に、調整処理部114は、第2集音データSc2の送信元のウェアラブル型マイクスピーカー装置2(ここではウェアラブル型マイクスピーカー装置2A)に第2遅延量Ds1(遅延時間)を設定する。調整処理部114は、設定した第2遅延量Ds1の情報を設定情報D2に登録する(図5参照)。
会議処理部111は、調整処理部114により設定される前記第2遅延量に基づいて、前記発話音声の音声データを機器に再生させる。
例えば、音声処理装置1aの会議処理部111は、会議サーバー4から会議室R2のユーザーDの発話音声の音声データを取得すると、ウェアラブル型マイクスピーカー装置2Aに前記音声データを出力して再生させるとともに、第2遅延量Ds1の時間が経過した時点で前記音声データを卓上型マイクスピーカー装置3aに出力して再生させる。
これにより、会議室R1において、卓上型マイクスピーカー装置3aから前記音声データが再生されるタイミングと、ウェアラブル型マイクスピーカー装置2Aから前記音声データが再生されるタイミングとを一致させることができる。これにより、会議室R1のユーザーに音声が二重に聞こえてしまう問題を防ぐことができる。
なお、調整処理部114は、各ウェアラブル型マイクスピーカー装置2に対して第2遅延量を設定する(図5参照)。
[音声調整処理]
以下、図8を参照しつつ、音声処理装置1の制御部11によって実行される音声調整処理の手順の一例について説明する。なお、本発明は、前記音声調整処理に含まれる一又は複数のステップを実行する音声調整方法(本発明の音声処理方法)の発明として捉えることができる。また、ここで説明する前記音声調整処理に含まれる一又は複数のステップが適宜省略されてもよい。また、前記音声調整処理における各ステップは、同様の作用効果を生じる範囲で実行順序が異なってもよい。さらに、ここでは制御部11が前記音声調整処理における各ステップを実行する場合を例に挙げて説明するが、他の実施形態では、1又は複数のプロセッサーが前記音声調整処理における各ステップを分散して実行してもよい。
以下、図8を参照しつつ、音声処理装置1の制御部11によって実行される音声調整処理の手順の一例について説明する。なお、本発明は、前記音声調整処理に含まれる一又は複数のステップを実行する音声調整方法(本発明の音声処理方法)の発明として捉えることができる。また、ここで説明する前記音声調整処理に含まれる一又は複数のステップが適宜省略されてもよい。また、前記音声調整処理における各ステップは、同様の作用効果を生じる範囲で実行順序が異なってもよい。さらに、ここでは制御部11が前記音声調整処理における各ステップを実行する場合を例に挙げて説明するが、他の実施形態では、1又は複数のプロセッサーが前記音声調整処理における各ステップを分散して実行してもよい。
ここでは、会議室R1に配置される卓上型マイクスピーカー装置3aとウェアラブル型マイクスピーカー装置2Aとを例に挙げて説明する。
また、制御部11は、卓上型マイクスピーカー装置3aが集音する第1集音データSc1と、ウェアラブル型マイクスピーカー装置2Aが集音する第2集音データSc2とを会議サーバー4に送信(伝達)するタイミングを調整する第1音声調整処理(図6A及び図6B参照)と、会議サーバー4から送信される音声データを卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれにおいて再生させるタイミングを調整する第2音声調整処理(図7A及び図7B参照)とを個別に実行することが可能である。図8に示す音声調整処理は、前記第1音声調整処理及び前記第2音声調整処理のそれぞれに、共通に適用可能である。
[第1音声調整処理]
先ず、ステップS11において、制御部11は、テスト音声データTsを卓上型マイクスピーカー装置3aに出力して、卓上型マイクスピーカー装置3aのスピーカー32からテスト音声を再生させる。卓上型マイクスピーカー装置3aは、音声処理装置1aからテスト音声データTsを受信すると、スピーカー32からテスト音声を再生する(図6A参照)。
先ず、ステップS11において、制御部11は、テスト音声データTsを卓上型マイクスピーカー装置3aに出力して、卓上型マイクスピーカー装置3aのスピーカー32からテスト音声を再生させる。卓上型マイクスピーカー装置3aは、音声処理装置1aからテスト音声データTsを受信すると、スピーカー32からテスト音声を再生する(図6A参照)。
次に、ステップS12において、制御部11は、卓上型マイクスピーカー装置3aが集音した第1集音データSc1を受信したか否かを判定する。例えば、卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれは、卓上型マイクスピーカー装置3aのスピーカー32から再生されるテスト音声を集音すると、集音した第1集音データSc1及び第2集音データSc2を音声処理装置1に送信する。
ここでは、卓上型マイクスピーカー装置3aにおける音声データの伝送速度が、ウェアラブル型マイクスピーカー装置2Aにおける音声データの伝送速度よりも早いため、卓上型マイクスピーカー装置3aから送信される第1集音データSc1が、ウェアラブル型マイクスピーカー装置2Aから送信される第2集音データSc2よりも早く音声処理装置1に到達する(図6B参照)。
制御部11は、卓上型マイクスピーカー装置3aから第1集音データSc1を受信すると(S12:Yes)、処理をステップS13に移行させる。制御部11は、卓上型マイクスピーカー装置3aから第1集音データSc1を受信するまで待機する(S12:No)。
ステップS13において、制御部11は、時間の計測を開始する。
次に、ステップS14において、制御部11は、ウェアラブル型マイクスピーカー装置2Aが集音した第2集音データSc2を受信したか否かを判定する。制御部11は、卓上型マイクスピーカー装置3aから第1集音データSc1を受信した後、ウェアラブル型マイクスピーカー装置2Aから第2集音データSc2を受信する。制御部11は、ウェアラブル型マイクスピーカー装置2Aから第2集音データSc2を受信すると(S14:Yes)、処理をステップS15に移行させる。制御部11は、ウェアラブル型マイクスピーカー装置2Aから第2集音データSc2を受信するまで待機する(S14:No)。
ステップS15において、制御部11は、第1集音データSc1を受信してから第2集音データSc2を受信するまでの経過時間(時間差)を算出する。ここでは、前記時間差を「Dt1」とする。
ステップS16において、制御部11は、ウェアラブル型マイクスピーカー装置2Aに前記時間差である第1遅延量Dt1(遅延時間)を設定する。制御部11は、設定した第1遅延量Dt1の情報を設定情報D2に登録する(図5参照)。
以上の前記第1音声調整処理により、卓上型マイクスピーカー装置3aが集音する第1集音データSc1と、ウェアラブル型マイクスピーカー装置2Aが集音する第2集音データSc2とを会議サーバー4に送信(伝達)するタイミングとを一致させることが可能となる。
また、前記第1音声調整処理によれば、例えば会議において、会議サーバー4は、ユーザーAの発話音声を卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれから同一のタイミングで受信して、他の機器(マイクスピーカー装置)から前記発話音声を再生することにより、当該機器から再生される発話音声が二重に聞こえる問題を防ぐことができる。
[第2音声調整処理]
先ず、ステップS11において、制御部11は、テスト音声データTsを卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aに出力して、卓上型マイクスピーカー装置3aのスピーカー32と、ウェアラブル型マイクスピーカー装置2Aのスピーカー25とからテスト音声を再生させる。なお、制御部11は、同一のタイミングでテスト音声データTsを卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aに出力する。
先ず、ステップS11において、制御部11は、テスト音声データTsを卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aに出力して、卓上型マイクスピーカー装置3aのスピーカー32と、ウェアラブル型マイクスピーカー装置2Aのスピーカー25とからテスト音声を再生させる。なお、制御部11は、同一のタイミングでテスト音声データTsを卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aに出力する。
卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれは、音声処理装置1aからテスト音声データTs1,Ts2を受信すると、それぞれのスピーカー32,25からテスト音声を再生する。
ここでは、卓上型マイクスピーカー装置3aにおける音声データの伝送速度が、ウェアラブル型マイクスピーカー装置2Aにおける音声データの伝送速度よりも早いため、先に卓上型マイクスピーカー装置3aから前記テスト音声が再生され、その後にウェアラブル型マイクスピーカー装置2Aから前記テスト音声が再生される(図7A参照)。
次に、ステップS12において、制御部11は、卓上型マイクスピーカー装置3aが集音した第1集音データSc1を受信したか否かを判定する。例えば、卓上型マイクスピーカー装置3aは、卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれから再生されるテスト音声を順に集音すると、集音した第1集音データSc1及び第2集音データSc2を順に音声処理装置1に送信する(図7B参照)。
制御部11は、卓上型マイクスピーカー装置3aから第1集音データSc1を受信すると(S12:Yes)、処理をステップS13に移行させる。制御部11は、卓上型マイクスピーカー装置3aから第1集音データSc1を受信するまで待機する(S12:No)。
ステップS13において、制御部11は、時間の計測を開始する。
次に、ステップS14において、制御部11は、卓上型マイクスピーカー装置3aが集音した第2集音データSc2を受信したか否かを判定する。制御部11は、卓上型マイクスピーカー装置3aから第1集音データSc1を受信した後、ウェアラブル型マイクスピーカー装置2Aから第2集音データSc2を受信する。制御部11は、卓上型マイクスピーカー装置3aから第2集音データSc2を受信すると(S14:Yes)、処理をステップS15に移行させる。制御部11は、卓上型マイクスピーカー装置3aから第2集音データSc2を受信するまで待機する(S14:No)。
ステップS15において、制御部11は、第1集音データSc1を受信してから第2集音データSc2を受信するまでの経過時間(時間差)を算出する。ここでは、前記時間差を「Ds1」とする。
ステップS16において、制御部11は、ウェアラブル型マイクスピーカー装置2Aに前記時間差である第2遅延量Ds1(遅延時間)を設定する。制御部11は、設定した第2遅延量Ds1の情報を設定情報D2に登録する(図5参照)。
以上の前記第2音声調整処理により、会議サーバー4から送信される音声データを卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれにおいて再生させるタイミングを一致させることが可能となる。
また、前記第2音声調整処理によれば、例えば会議において、会議サーバー4は、他の機器(マイクスピーカー装置)から受信したユーザーDの発話音声を卓上型マイクスピーカー装置3a及びウェアラブル型マイクスピーカー装置2Aのそれぞれから同一のタイミングで再生することにより、当該機器から再生される発話音声が二重に聞こえる問題を防ぐことができる。
以上説明したように、本実施形態に係る会議システム100は、第1マイクスピーカー装置(例えば卓上型マイクスピーカー装置3)と、音声データの伝送速度が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置(ウェアラブル型マイクスピーカー装置2)とを含み、ユーザーの発話音声を取得して送受信する音声処理システムである。
また、前記第1音声調整処理において、会議システム100は、特定音声(テスト音声)が再生された場合に、前記第1マイクスピーカー装置が集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置が集音した前記特定音声の第2音声データとを受信する。そして、会議システム100は、前記第1音声データを受信した時点から前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する。
これにより、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれが集音した音声データを機器(サーバーなど)に送信する送信タイミングを一致させることができる。
また、前記第2音声調整処理において、会議システム100は、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれのスピーカーから特定音声を再生させる。また、会議システム100は、前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のいずれか一方のマイクスピーカー装置のマイクが集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置のスピーカーから再生され、前記一方のマイクスピーカー装置のマイクが集音した前記特定音声の第2音声データとを受信する。そして、会議システム100は、前記第1音声データを受信した時点から前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの再生タイミングを調整する。
これにより、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれが機器(サーバーなど)から受信して再生する音声データの再生タイミングを一致させることができる。
よって、音声データの伝送速度が異なる複数のマイクスピーカー装置を併用する場合の音声品質を向上させることが可能となる。
本発明は上述の実施形態に限定されない。以下、本発明の他の実施形態について説明する。
会議システム100は、第1マイクスピーカー装置(例えばウェアラブル型マイクスピーカー装置2)と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置(ウェアラブル型マイクスピーカー装置2)とを含み、ユーザーの発話音声を取得して送受信する音声処理システムであってもよい。例えば、第2マイクスピーカー装置と音声処理装置1との距離が、第1マイクスピーカー装置と音声処理装置1との距離よりも遠い場合に、第2マイクスピーカー装置から音声処理装置1に入力される音声データの到達時間が、音声処理装置1に入力される音声データよりも遅くなる。このような場合でも、上記各構成によれば、複数のマイクスピーカー装置を併用する場合の音声品質を向上させることが可能となる。すなわち、本発明の第1マイクスピーカー装置及び第2マイクスピーカー装置は、伝送速度(例えば有線接続及び無線接続など接続方式)が異なるマイクスピーカー装置であってもよいし、伝送速度の相違に依らず位置関係(音声処理装置1との距離)が異なるマイクスピーカー装置であってもよい。
また、本発明の第1マイクスピーカー装置及び第2マイクスピーカー装置のそれぞれは、通信方式が同一であってもよい。例えば第1マイクスピーカー装置及び第2マイクスピーカー装置のそれぞれは、ネットワークに無線接続されて無線通信により音声データを送受信してもよい。すなわち、本発明の第1マイクスピーカー装置及び第2マイクスピーカー装置のそれぞれは、互いに同一の通信方式を備えてもよいし、異なる通信方式を備えてもよい。また、本発明では、第2マイクスピーカー装置における音声データの伝送速度が第1マイクスピーカー装置における音声データの伝送速度よりも遅ければよい。
また、本発明では、前記第1音声調整処理において、会議システム100は、1台の卓上型マイクスピーカー装置3と1台のウェアラブル型マイクスピーカー装置2とを備えて構成されてもよい。また、会議システム100は、1台の卓上型マイクスピーカー装置3と複数台のウェアラブル型マイクスピーカー装置2とを備えて構成されてもよい。会議システム100が複数台のウェアラブル型マイクスピーカー装置2を備える場合、制御部11は、例えば発話するユーザーのウェアラブル型マイクスピーカー装置2を特定し、特定したウェアラブル型マイクスピーカー装置2に対応する第1遅延量(図5参照)を取得し、取得した第1遅延量に基づいて、卓上型マイクスピーカー装置3から受信した音声データを会議サーバー4に送信する。
また、本発明では、前記第2音声調整処理において、会議システム100は、1台の卓上型マイクスピーカー装置3と1台のウェアラブル型マイクスピーカー装置2とを備えて構成されてもよい。また、会議システム100は、1台の卓上型マイクスピーカー装置3と複数台のウェアラブル型マイクスピーカー装置2とを備えて構成されてもよい。会議システム100が複数台のウェアラブル型マイクスピーカー装置2を備える場合、制御部11は、例えば再生させる複数台のウェアラブル型マイクスピーカー装置2を特定し、特定した複数台のウェアラブル型マイクスピーカー装置2のそれぞれに対応する第2遅延量(図5参照)を取得し、取得した第2遅延量に基づいて、各ウェアラブル型マイクスピーカー装置2及び卓上型マイクスピーカー装置3に音声データを出力する。
他の実施形態として、制御部11(調整処理部114)は、前記時間差に応じた時間差情報を操作表示部13(本発明の表示部の一例)に表示させ、操作表示部13においてユーザーの操作により入力された入力情報に基づいて前記遅延量(第1遅延量、第2遅延量)を設定してもよい。
例えば図9に示すように、制御部11は、ウェアラブル型マイクスピーカー装置2A~2D(図9の「dev1」~「dev4」に相当)のそれぞれに対応する時間差情報を操作表示部13に表示させる。例えば、制御部11は、前記テスト音声に対応する集音データの到達時間が最も早いウェアラブル型マイクスピーカー装置2Aを基準(「-」)として、この基準に対するウェアラブル型マイクスピーカー装置2B~2Dにおける到達時間の遅延時間を表示させる。
また例えば図10に示すように、制御部11は、ウェアラブル型マイクスピーカー装置2A~2D(図10の「dev1」~「dev4」に相当)のそれぞれに対応する時間差情報をインジケーターとして操作表示部13に表示させてもよい。
ユーザーは、図9及び図10に示す操作画面において、調整ボタンを押下することにより各ウェアラブル型マイクスピーカー装置2の前記遅延量を設定してもよい。制御部11は、ユーザーにより設定された前記遅延量を設定情報D2(図5参照)に登録する。
他の実施形態として、音声処理装置1は、録音機能を備えてもよい。例えば図11に示す操作画面において、ユーザーが録音ボタンを押下してテスト音声を発話すると、制御部11は、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2のそれぞれから送信されるテスト音声(図6B参照)を録音する。制御部11は、録音したテスト音声を再生させて、ユーザーから前記遅延量の設定操作(図11参照)を受け付ける。
また、制御部11は、図9~図11の操作画面を音声処理装置1に接続される機器(ディスプレイDP1(図2参照)、パーソナルコンピュータなど)に表示させてもよい。また、音声処理装置1がスピーカーを備える場合には、制御部11は、当該スピーカーから前記テスト音声を再生させてもよい。
また本発明の他の実施形態として、前記第1音声調整処理における前記テスト音声は、ユーザーの発話音声であってもよい。この場合、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2のそれぞれは、ユーザーの発話音声を集音すると、当該発話音声に対応する第1集音データSc1及び第2集音データSc2を音声処理装置1に送信する。
また本発明の他の実施形態として、前記第1音声調整処理(図6A及び図6B参照)において、ウェアラブル型マイクスピーカー装置2が前記テスト音声を再生してもよい。この場合、卓上型マイクスピーカー装置3は、ウェアラブル型マイクスピーカー装置2から再生される前記テスト音声を集音した第1集音データSc1を音声処理装置1に送信し、ウェアラブル型マイクスピーカー装置2は、自身から再生される前記テスト音声を集音した第2集音データSc2を音声処理装置1に送信する。
また本発明の他の実施形態として、前記第1音声調整処理(図6A及び図6B参照)において、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2のそれぞれが前記テスト音声を再生してもよい。この場合、制御部11は、卓上型マイクスピーカー装置3が前記テスト音声を再生した場合の遅延量と、ウェアラブル型マイクスピーカー装置2が前記テスト音声を再生した場合の遅延量とを算出して、両者を比較してウェアラブル型マイクスピーカー装置2の遅延量を設定する。例えば、両者の遅延量の差が所定値以上の場合には、両者の遅延量の信頼性が低いと判断されるため、前記第1音声調整処理をやり直してもよい。
このように、本発明の調整処理部114は、受信処理部113が第1音声データを受信した時点から受信処理部113が第2音声データを受信した時点までの時間差に基づいて、第1マイクスピーカー装置及び第2マイクスピーカー装置の少なくともいずれかにおける発話音声の音声データの送信タイミングを調整する。
また本発明の他の実施形態として、前記第2音声調整処理(図7A及び図7B参照)において、ウェアラブル型マイクスピーカー装置2が前記テスト音声を集音してもよい。この場合、ウェアラブル型マイクスピーカー装置2は、自身から再生される前記テスト音声を集音した第2集音データSc2を音声処理装置1に送信し、卓上型マイクスピーカー装置3から再生される前記テスト音声を集音した第1集音データSc1を音声処理装置1に送信する。
また本発明の他の実施形態として、前記第2音声調整処理(図7A及び図7B参照)において、卓上型マイクスピーカー装置3及びウェアラブル型マイクスピーカー装置2のそれぞれが前記テスト音声を集音してもよい。この場合、制御部11は、卓上型マイクスピーカー装置3が前記テスト音声を集音した場合の遅延量と、ウェアラブル型マイクスピーカー装置2が前記テスト音声を集音した場合の遅延量とを算出して、両者を比較してウェアラブル型マイクスピーカー装置2の遅延量を設定する。例えば、両者の遅延量の差が所定値以上の場合、両者の遅延量の信頼性が低いと判断されるため、前記第2音声調整処理をやり直してもよい。
このように、本発明の調整処理部114は、受信処理部113が第1音声データを受信した時点から受信処理部113が第2音声データを受信した時点までの時間差に基づいて、第1マイクスピーカー装置及び第2マイクスピーカー装置の少なくともいずれかにおける発話音声の音声データの再生タイミングを調整する。
また本発明の他の実施形態として、前記音声調整処理(前記第1音声調整処理、前記第2音声調整処理)において、出力処理部112は、特定の周波数帯域のテスト音声を出力してもよい。例えば、出力処理部112は、人間の可聴域(可聴周波数帯域)外の周波数帯域(超低周波数帯域、超音波帯域)のテスト音声を出力する。これにより、前記音声調整処理を実行する際に、ユーザーに前記テスト音声が聞き取られることがないため、ユーザーにストレスを与えることを防ぐことができる。なお、一般的なマイク使用時のBluetoothのサンプリング周波数は16kHz程度であるため、実際に集音できる周波数はその半分の8kHz程度となる。そのため、上記構成において超音波帯域を使用する場合は、超音波そのものはミキサーへ送れないが、例えばBluetooth方式のマイクスピーカー装置のマイク部品は、人間の可聴域を超える音を集音することも可能である。その場合、その判定結果のみをミキサーに送ればよいため、サンプリング周波数の問題は回避できる。
また、前記音声調整処理において前記可聴域外のテスト音声を出力する構成において、さらに、調整処理部114は、ユーザーがウェアラブル型マイクスピーカー装置2を使用中に、前記音声調整処理を実行してもよい。例えば、調整処理部114は、会議開始前に前記音声調整処理を実行し、さらに、会議中に前記音声調整処理を実行する。例えば、出力処理部112は、会議中に一定の間隔で前記可聴域外のテスト音声を出力し、調整処理部114は、当該一定の間隔で前記音声調整処理を実行して、前記発話音声の音声データの送信タイミング及び再生タイミングを調整する。Bluetooth等の無線を使用する際に、音声データの遅延は厳密には周辺環境によって常に変化している。例えば、Bluetooth方式のマイクスピーカー装置を装着したユーザーが歩き回ると、送受信機(音声処理装置1)との距離が変わるため、音声データの遅延量が変化する。この場合、会議開始前の初回の前記音声調整処理(遅延量調整)だけでは、会議中の遅延量の変化に対応できないケースが起こり得る。これに対して、前記可聴域外のテスト音声を用いて会議中に前記音声調整処理を実行する構成によれば、会議中でもユーザーに影響を与えない範囲で常時遅延量調整を行って、音声の重なりを防止するなど音声品質を向上させることが可能となる。
本発明の他の実施形態として、制御部11は、各ウェアラブル型マイクスピーカー装置2から受信する発話音声の音声データの到達時間を監視し、当該到達時間に基づいて各ウェアラブル型マイクスピーカー装置2の通信状態をユーザーに通知してもよい。例えば制御部11は、特定のウェアラブル型マイクスピーカー装置2において発話音声の音声データの到達時間が遅くなり通信速度が不安定な状態になった場合に、音声処理装置1の操作表示部13、音声処理装置1に接続されるディスプレイDP、ユーザー端末などに通知する。例えば図12に示すように、制御部11は、各ウェアラブル型マイクスピーカー装置2の通信状態を表示させる。
本発明の他の実施形態として、制御部11(調整処理部114)は、卓上型マイクスピーカー装置3に入力される、ウェアラブル型マイクスピーカー装置2が集音した発話音声の音声データの音圧が変化した場合に、前記発話音声の音声データの送信タイミング又は再生タイミングを調整してもよい。例えば図13に示すように、卓上型マイクスピーカー装置3の周辺にウェアラブル型マイクスピーカー装置2を装着しないユーザーが位置し、卓上型マイクスピーカー装置3から離れた場所にウェアラブル型マイクスピーカー装置2を装着したユーザーA~Dが位置する場合を例に挙げる。ユーザーA~Dが同じ場所にいて移動しない場合には、卓上型マイクスピーカー装置3に入力される発話音声(会議室R1内の発話音声)の音圧は変化しない。この場合、制御部11は、初めに設定した遅延量に基づいて、発話音声の音声データの送信(伝達)処理を実行する。
一方、例えばウェアラブル型マイクスピーカー装置2を装着したユーザーCが移動(図13の矢印方向)すると、卓上型マイクスピーカー装置3との距離が変化し、距離に応じて前記発話音声の遅延量が変化する。この場合、音声が二重に聞こえてしまう問題が生じする。そこで、制御部11は、卓上型マイクスピーカー装置3に入力される音声データの音圧が変化したことをトリガーとして、上述の第1音声調整処理又は第2音声調整処理を実行して遅延量を再調整する。これにより、ウェアラブル型マイクスピーカー装置2を装着したユーザーが会議中に歩き回っても、自動で適切に卓上型マイクスピーカー装置3との遅延量を調整することできる。
なお、本発明の音声処理システムは、音声処理装置1とウェアラブル型マイクスピーカー装置2と卓上型マイクスピーカー装置3と会議サーバー4とにより構成されてもよい。また、本発明の音声処理システムは、音声処理装置1単体で構成されてもよいし、会議サーバー4単体で構成されてもよいし、音声処理装置1及び会議サーバー4の組み合わせにより構成されてもよい。
1 :音声処理装置
2 :ウェアラブル型マイクスピーカー装置
3 :卓上型マイクスピーカー装置
4 :会議サーバー
100 :会議システム
111 :会議処理部
112 :出力処理部
113 :受信処理部
114 :調整処理部
2 :ウェアラブル型マイクスピーカー装置
3 :卓上型マイクスピーカー装置
4 :会議サーバー
100 :会議システム
111 :会議処理部
112 :出力処理部
113 :受信処理部
114 :調整処理部
Claims (16)
- 第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理システムであって、
特定音声が再生された場合に、前記第1マイクスピーカー装置が集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置が集音した前記特定音声の第2音声データとを受信する受信処理部と、
前記受信処理部が前記第1音声データを受信した時点から前記受信処理部が前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する調整処理部と、
を備える音声処理システム。 - 前記特定音声の音声データを出力する出力処理部をさらに備え、
前記出力処理部は、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかのスピーカーから前記特定音声を再生させ、
前記受信処理部は、前記出力処理部が再生した前記特定音声に対応する前記第1音声データ及び前記第2音声データを受信し、
前記調整処理部は、前記受信処理部が受信した前記第1音声データ及び前記第2音声データの前記時間差に基づいて前記発話音声の音声データの送信タイミングを調整する、
請求項1に記載の音声処理システム。 - 前記出力処理部は、前記第1マイクスピーカー装置のスピーカーから前記特定音声を再生させ、
前記受信処理部は、前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置のマイクが集音した前記特定音声の前記第1音声データと、前記第1マイクスピーカー装置のスピーカーから再生され、前記第2マイクスピーカー装置のマイクが集音した前記特定音声の前記第2音声データとを受信し、
前記調整処理部は、前記受信処理部が受信した前記第1音声データ及び前記第2音声データの前記時間差に基づいて前記発話音声の音声データの送信タイミングを調整する、
請求項2に記載の音声処理システム。 - 前記発話音声の音声データを前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれから受信し、当該音声データを、前記発話音声を出力する機器に送信する音声処理部をさらに備え、
前記調整処理部は、前記第1マイクスピーカー装置に前記時間差に応じた遅延量を設定し、
前記音声処理部は、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれから受信する前記音声データを、前記調整処理部により設定される前記遅延量に基づいて、前記機器に送信する、
請求項1から請求項3のいずれか1項に記載の音声処理システム。 - 第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理システムであって、
前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれのスピーカーから特定音声を再生させる出力処理部と、
前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のいずれか一方のマイクスピーカー装置のマイクが集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置のスピーカーから再生され、前記一方のマイクスピーカー装置のマイクが集音した前記特定音声の第2音声データとを受信する受信処理部と、
前記受信処理部が前記第1音声データを受信した時点から前記受信処理部が前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの再生タイミングを調整する調整処理部と、
を備える音声処理システム。 - 前記出力処理部は、前記特定音声の音声データを、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれに対して同一タイミングで出力し、
前記受信処理部は、前記出力処理部が再生した前記特定音声に対応する前記第1音声データ及び前記第2音声データを受信し、
前記調整処理部は、前記受信処理部が受信した前記第1音声データ及び前記第2音声データの前記時間差に基づいて前記発話音声の音声データの再生タイミングを調整する、
請求項5に記載の音声処理システム。 - 前記受信処理部は、前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置のマイクが集音した前記特定音声の前記第1音声データと、前記第2マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置のマイクが集音した前記特定音声の前記第2音声データとを受信し、
前記調整処理部は、前記受信処理部が受信した前記第1音声データ及び前記第2音声データの前記時間差に基づいて前記発話音声の音声データの再生タイミングを調整する、
請求項6に記載の音声処理システム。 - 前記発話音声の音声データを機器から受信し、当該音声データを前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれから再生させる音声処理部をさらに備え、
前記調整処理部は、前記第1マイクスピーカー装置に前記時間差に応じた遅延量を設定し、
前記音声処理部は、前記機器から受信する前記音声データを、前記調整処理部により設定される前記遅延量に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれから再生させる、
請求項5から請求項7のいずれか1項に記載の音声処理システム。 - 前記調整処理部は、前記時間差に応じた時間差情報を表示部に表示させ、前記表示部においてユーザーの操作により入力された入力情報に基づいて前記遅延量を設定する、
請求項4又は請求項8に記載の音声処理システム。 - 前記第1マイクスピーカー装置は、ネットワークに有線接続される非ウェアラブル型の機器であり、
前記第2マイクスピーカー装置は、ネットワークに無線接続されるウェアラブル型の機器である、
請求項1から請求項9のいずれか1項に記載の音声処理システム。 - 前記特定音声は、人間の可聴域外の周波数帯域の音声である、
請求項1から請求項10のいずれか1項に記載の音声処理システム。 - 前記第2マイクスピーカー装置から受信する前記発話音声の音声データの到達時間を監視し、当該到達時間に基づいて前記第2マイクスピーカー装置の通信状態をユーザーに通知する、
請求項1から請求項11のいずれか1項に記載の音声処理システム。 - 前記調整処理部は、前記第1マイクスピーカー装置に入力される、前記第2マイクスピーカー装置が集音した発話音声の音声データの音圧が変化した場合に、前記発話音声の音声データの送信タイミング又は再生タイミングを調整する、
請求項1から請求項12のいずれか1項に記載の音声処理システム。 - 前記特定音声の音声データを出力する出力処理部をさらに備え、
前記出力処理部は、一定の間隔で前記特定音声を出力し、
前記調整処理部は、前記一定の間隔で前記発話音声の音声データの送信タイミング又は再生タイミングを調整する、
請求項1から請求項13のいずれか1項に記載の音声処理システム。 - 第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理方法であって、
一又は複数のプロセッサーが、
特定音声が再生された場合に、前記第1マイクスピーカー装置が集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置が集音した前記特定音声の第2音声データとを受信する受信ステップと、
前記受信ステップにおいて前記第1音声データを受信した時点から前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの送信タイミングを調整する調整ステップと、
を実行する音声処理方法。 - 第1マイクスピーカー装置と、音声データの到達時間が前記第1マイクスピーカー装置よりも遅い第2マイクスピーカー装置とを含み、ユーザーの発話音声を取得して送受信する音声処理方法であって、
一又は複数のプロセッサーが、
前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のそれぞれのスピーカーから特定音声を再生させる出力ステップと、
前記第1マイクスピーカー装置のスピーカーから再生され、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置のいずれか一方のマイクスピーカー装置のマイクが集音した前記特定音声の第1音声データと、前記第2マイクスピーカー装置のスピーカーから再生され、前記一方のマイクスピーカー装置のマイクが集音した前記特定音声の第2音声データとを受信する受信ステップと、
前記受信ステップにおいて前記第1音声データを受信した時点から前記受信ステップにおいて前記第2音声データを受信した時点までの時間差に基づいて、前記第1マイクスピーカー装置及び前記第2マイクスピーカー装置の少なくともいずれかにおける前記発話音声の音声データの再生タイミングを調整する調整ステップと、
を実行する音声処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021214079A JP2023097781A (ja) | 2021-12-28 | 2021-12-28 | 音声処理システム及び音声処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021214079A JP2023097781A (ja) | 2021-12-28 | 2021-12-28 | 音声処理システム及び音声処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023097781A true JP2023097781A (ja) | 2023-07-10 |
Family
ID=87072240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021214079A Pending JP2023097781A (ja) | 2021-12-28 | 2021-12-28 | 音声処理システム及び音声処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023097781A (ja) |
-
2021
- 2021-12-28 JP JP2021214079A patent/JP2023097781A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180014117A1 (en) | Wearable headset with self-contained vocal feedback and vocal command | |
WO2021189990A1 (zh) | 一种用于听力耳机的验配方法和装置 | |
US10922044B2 (en) | Wearable audio device capability demonstration | |
US11735194B2 (en) | Audio input and output device with streaming capabilities | |
WO2020063069A1 (zh) | 音频播放方法、装置、电子设备及计算机可读介质 | |
US20220295184A1 (en) | Voice processing system and voice processing method | |
JP2023097781A (ja) | 音声処理システム及び音声処理方法 | |
JP4453614B2 (ja) | 語学学習システム | |
JP4457986B2 (ja) | 語学学習システム及び端末装置 | |
JP2023072187A (ja) | 音声処理システム、音声処理方法、及び音声処理プログラム | |
CA3155543A1 (en) | Wireless midi headset | |
JP2023145911A (ja) | 音声処理システム、音声処理方法、及び音声処理プログラム | |
JP2016071096A (ja) | 通信カラオケシステム | |
JP2024008112A (ja) | 音声処理システム、音声処理方法、及び音声処理プログラム | |
JP2004170717A (ja) | カラオケシステム | |
WO2024100920A1 (ja) | 情報処理装置、情報処理方法及び情報処理用プログラム | |
JP2019140503A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
US20240163621A1 (en) | Hearing aid listening test presets | |
JP7293863B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
JP2012074872A (ja) | 通信装置、通信方法、および通信プログラム | |
JP2017034476A (ja) | 情報処理装置、情報処理方法、プログラム | |
JP6952524B2 (ja) | 録音機、録音方法及び録音のためのプログラム | |
JP2021156910A (ja) | 再生システム、電子機器、サーバー、方法、及び、プログラム | |
US20130188802A1 (en) | Headset with two interfaces | |
JP6170738B2 (ja) | 通信デュエット時の通信方式に特徴を有する通信カラオケシステム |