JP2023107364A - コミュニケーション装置及びコミュニケーション方法 - Google Patents

コミュニケーション装置及びコミュニケーション方法 Download PDF

Info

Publication number
JP2023107364A
JP2023107364A JP2022008532A JP2022008532A JP2023107364A JP 2023107364 A JP2023107364 A JP 2023107364A JP 2022008532 A JP2022008532 A JP 2022008532A JP 2022008532 A JP2022008532 A JP 2022008532A JP 2023107364 A JP2023107364 A JP 2023107364A
Authority
JP
Japan
Prior art keywords
output mode
audio signal
unit
user
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022008532A
Other languages
English (en)
Inventor
純 大木
Jun Oki
弘幸 熊倉
Hiroyuki Kumakura
祐一 田代
Yuichi Tashiro
健太朗 児玉
Kentaro Kodama
俊輔 山本
Shunsuke Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2022008532A priority Critical patent/JP2023107364A/ja
Publication of JP2023107364A publication Critical patent/JP2023107364A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】複数人と同時にコミュニケーションするに際し、各人の発話が聞き取り難いという問題を解決する。【解決手段】音声信号取得部10は、第1の利用者端末及び第2の利用者端末を含む複数の利用者端末から発信された音声信号を取得する。発信元特定部11は、各音声信号の発信元を特定する。出力態様設定部17は、発信元特定部11により特定された第1の利用者端末から発信された音声信号の出力態様が、発信元特定部11により特定された、第1の利用者端末と異なる第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。音声信号出力部18は、各音声信号を設定された出力態様に応じて出力する。そして、出力態様とは、対応する音声信号の再生時における音像位置又は音量の少なくとも何れか一方である。【選択図】図2

Description

本発明は、コミュニケーション装置及びコミュニケーション方法に関する。
特許文献1は、複数のマイクロフォンが生成した複数チャネルの音響信号について例えば50msecのフレーム毎に音源定位を行い、音源定位の結果に基づいて音響信号を音源別に切り分けた音源別信号を生成し、音源別信号の音響特徴量を算出することにより当該音源別信号の話者を同定する技術を開示している。また、特許文献1では、音源定位の結果、幾つかの音源の定位位置がほとんど一致している場合、これらの音源の話者が同一であると推定することが記載されている。
特開2018-169473号公報
ところで、複数人と同時にコミュニケーションするに際し、各人の発話が聞き取り難いという問題があった。
本開示の目的は、複数人と同時にコミュニケーションするに際し、各人の発話が聞き取り難いという問題を解決する技術を提供することにある。
本開示の第1の観点によれば、複数の利用者端末から発信された音声信号を取得する音声信号取得部と、各音声信号の発信元を特定する発信元特定部と、前記発信元特定部により特定された第1の利用者端末から発信された音声信号の出力態様が、前記発信元特定部により特定された、前記第1の利用者端末と異なる第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する出力態様設定部と、各音声信号を設定された出力態様に応じて出力する音声信号出力部と、を備え、前記出力態様は、対応する音声信号の再生時における音像位置又は音量の少なくとも何れか一方である、コミュニケーション装置が提供される。
本開示の第2の観点によれば、コンピュータが、複数の利用者端末から発信された音声信号を取得するステップと、各音声信号の発信元を特定するステップと、前記特定するステップにより特定された第1の利用者端末から発信された音声信号の出力態様が、前記特定するステップにより特定された、前記第1の利用者端末と異なる第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定するステップと、各音声信号を設定された出力態様に応じて出力するステップと、を含む処理を実行し、前記出力態様は、対応する音声信号の再生時における音像位置又は音量の少なくとも何れか一方である、コミュニケーション方法が提供される。
本開示によれば、複数人と同時にコミュニケーションするに際し、各人が発信したメッセージが聞き取り難いという問題を解決することができる。
コミュニケーションシステムの概略図である。 サーバの機能ブロック図である。 第1出力DBをテーブル形式で示す図である。 第2出力DBをテーブル形式で示す図である。 利用者端末の機能ブロック図である。 コミュニケーションシステムの動作フローのシーケンス図である。
以下、図1から図6を参照して、本開示の実施形態を説明する。
図1には、コミュニケーションシステム1の概略図を示している。本実施形態において、コミュニケーションシステム1は、複数の参加者(ユーザとも称する。以下同じ。)が参加するオンライン会議システムに適用される。コミュニケーションシステム1は、コミュニケーション装置であるサーバ2と、複数の利用者端末3と、を含む。複数の利用者端末3は、WAN4(Wide Area Network)を経由してサーバ2と双方向通信可能に構成されている。本実施形態では、説明の便宜上、オンライン会議システムにユーザA、ユーザB、ユーザC、ユーザDが参加するものとする。複数の利用者端末3は、ユーザAが利用する利用者端末3A、ユーザBが利用する利用者端末3B、ユーザCが利用する利用者端末3C、ユーザDが利用する利用者端末3Dを含む。各ユーザは、利用者端末3が備えるマイクに向かって発話し、利用者端末3が備えるスピーカを介して他のユーザの発話を聞き取る。
図2には、サーバ2(コミュニケーション装置)の機能ブロック図を示している。図2に示すように、サーバ2は、中央演算処理器としてのCPU2a(Central Processing Unit)と、読み書き自由のRAM2b(Random Access Memory)、読み出し専用のROM2c(Read Only Memory)、通信IF2dを備えている。そして、CPU2aがROM2cに記憶されている制御プログラムを読み出して実行することで、制御プログラムは、CPU2aなどのハードウェアを、音声信号取得部10、発信元特定部11、変更指示情報取得部13、設定情報変更部14、同時発信検出部15、人数検出部16、出力態様設定部17、音声信号出力部18として機能させる。また、サーバ2は、設定情報記憶部12を備える。設定情報記憶部12は、RAM2b又は図示しないHDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成されている。
音声信号取得部10は、複数のユーザから発信された音声信号を取得する。具体的には、音声信号取得部10は、複数のユーザが利用する利用者端末3から音声信号を受信して取得する。
発信元特定部11は、各音声信号の発信元を特定する。発信元とは、その音声を発信したユーザ、または、ユーザが利用する、ユーザの音声を発信した利用者端末である。
発信元特定部11は、音声認識により各音声信号の発信元を特定する。音声認識は、典型的には声紋認証により行われ得る。この場合、発信元特定部11は、ユーザとその声紋の特徴量を関連付けた声紋DBを参照して、各音声信号から抽出した声紋の特徴量に対応するユーザを特定し、特定したユーザが利用する利用者端末を特定する。複数のユーザが同一の利用者端末を利用する場合があってもよい。
発信元特定部11は、各音声信号を含むパケットのヘッダに記載されたIPアドレスに基づいて、各音声信号の発信元を特定してもよい。この場合、発信元特定部11は、ユーザと当該ユーザが利用する利用者端末3のIPアドレスを関連付けたIPアドレスDBを参照して、各音声信号を含むパケットのヘッダに記載されたIPアドレスに対応するユーザを特定する。発信元特定部11は、各利用者端末のIDを用いて、各音声信号の発信元を特定してもよい。
設定情報記憶部12には、出力態様設定部17が各音声信号の出力態様を設定する際に参照する各種DBが格納されている。設定情報記憶部12には、第1出力DB12aと第2出力DB12bが格納されている。
図3に、第1出力DB12aをテーブル形式で示している。図3に示すように、第1出力DB12aは、発信元と出力先と音声信号の出力態様を関連付けるデータベースである。ここで、音声信号の出力態様とは、音声信号を再生するときの音像位置及び音量を意味する。音声信号の出力態様は、音声信号を再生するときの音像位置又は音量の何れか一方でもよい。第1出力DB12aは、出力態様設定情報の一具体例である。
図3に例示するように、発信元がユーザAであって出力先がユーザBである場合、音像位置は中央(middle)であり、出力する音量は大(loud)とすることができる。同様に、発信元がユーザAであって出力先がユーザCである場合、音像位置は中央であり、出力する音量は大とすることができる。同様に、発信元がユーザAであって出力先がユーザDである場合、音像位置は中央であり、出力する音量は大とすることができる。即ち、発信元がユーザAである場合、すべての出力先に対して音像位置は中央であり、音量は大とすることができる。
発信元がユーザBであって出力先がユーザAである場合、音像位置は左(left)であり、出力する音量は中(normal)とすることができる。出力先がユーザC及びユーザDの場合も同様である。即ち、発信元がユーザBである場合、すべての出力先に対して音像位置は左であり、音量は中とすることができる。
発信元がユーザCであって出力先がユーザAである場合、音像位置は右(right)であり、出力する音量は中(normal)とすることができる。出力先がユーザB及びユーザDの場合も同様である。即ち、発信元がユーザCである場合、すべての出力先に対して音像位置は右であり、音量は中とすることができる。
発信元がユーザDであって出力先がユーザAである場合、音像位置は右(right)であり、出力する音量は小(low)とすることができる。出力先がユーザB及びユーザCの場合も同様である。即ち、発信元がユーザDである場合、すべての出力先に対して音像位置は右であり、音量は小とすることができる。
図3に示す出力態様設定情報は一例であり、これに限定されない。例えば、発信元がユーザAであるとき、出力先によって出力態様が異なっていてもよい。このようにすることで、発信元であるユーザAは、自分が発した音声の音像が定位する位置や音量を、出力先である相手ごとに設定することができる。また例えば、出力先がユーザAであるとき、発信元によって出力態様が異なっていてもよい。このようにすることで、出力先であるユーザAは、発信元である相手が発した音声の音像が定位する位置や音量を、発信元ごとに設定することができる。
図4に、第2出力DB12bをテーブル形式で示している。図4に示すように、第2出力DB12bは、人数と当該人数分の出力態様を関連付けるデータベースである。ここで、音声信号の出力態様とは、音声信号を再生するときの音像位置を意味する。第2出力DB12bは、出力態様設定情報の一具体例である。
図4に示すように、人数が2人である場合、音像位置は左と右の組み合わせとすることができる。
人数が3人である場合、音像位置は左と中央と右の組み合わせとすることができる。
人数が4人である場合、音像位置は左とやや左とやや右と右の組み合わせとすることができる。ここで、「やや左」は、正面から左へ30度ズレた方向を意味し、「やや右」は、正面から右へ30度ズレた方向を意味する。
このように、人数に応じ、それぞれのユーザが発する音声が定位する位置を設定することで、各ユーザが発する音声がより聞き取り易くなるよう、出力態様を設定することができる。
図2に戻り、変更指示情報取得部13は、第1出力DB12aを変更するための変更指示情報を利用者端末3から取得する。変更指示情報は、送信元と出力先と出力態様を関連付けた情報である。
設定情報変更部14は、変更指示情報に基づいて第1出力DB12aを変更する。即ち、設定情報変更部14は、図3に示す第1出力DB12aのうち変更指示情報が示す送信元及び出力先が一致する出力態様を、変更指示情報が示す出力態様で上書きする。
同時発信検出部15は、複数の利用者端末のうち少なくとも2以上の利用者端末が同時に音声信号を発信したことを検出する。
人数検出部16は、同時発信検出部15が同時発信を検出した場合、当該同時発信の発信元の人数を検出する。
出力態様設定部17は、第1出力DB12a又は第2出力DB12bの何れか一方を参照して、第1の利用者端末から発信された音声信号の出力態様が、第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。
出力態様設定部17は、同時発信検出部15が複数の利用者端末のうち少なくとも2以上の利用者端末が同時に音声信号を発信したことを検出した場合、第2出力DB12bを参照して、第1の利用者端末から発信された音声信号の出力態様が、第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。
これに対し、出力態様設定部17は、同時発信検出部15が複数の利用者端末のうち少なくとも2以上の利用者端末が同時に音声信号を発信したことを検出しなかった場合、第1出力DB12aを参照して、第1の利用者端末から発信された音声信号の出力態様が、第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。
出力態様設定部17が第1出力DB12aを参照する場合、出力態様設定部17は、例えば、ユーザAから発信された音声信号の出力態様が、ユーザBから発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。図3によれば、出力態様設定部17は、ユーザCに対するユーザAの音声信号の出力態様を「音像位置middle,音量loud」と設定し、ユーザCに対するユーザBの音声信号の出力態様を「音像位置left, 音量normal」と設定する。従って、ユーザCにとっては、ユーザAの発話が正面から大きな音で聞こえ、ユーザBの発話が左から相対的に若干静かに聞こえる。従って、ユーザCにとってみれば、ユーザAの発話とユーザBの発話を容易に聞き分けることができるので、ユーザAの発話とユーザBの発話とが聞き取り易くなる。
出力態様設定部17が第2出力DB12bを参照する場合、出力態様設定部17は、例えば、ユーザAから発信された音声信号の出力態様が、ユーザBから発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。図4によれば、人数検出部16が検出した同時発信の発信元の人数がユーザA及びユーザBの2人であるとき、出力態様設定部17は、第2出力DB12bを参照して、ユーザAの音声信号の音像位置を「left」とし、ユーザBの音声信号の音像位置を「right」と設定する。従って、ユーザCにとっては、ユーザAの発話が左から聞こえ、ユーザBの発話が右から聞こえる。従って、ユーザCにとってみれば、ユーザAの発話とユーザBの発話を容易に聞き分けることができるので、ユーザAの発話とユーザBの発話とが聞き取り易くなる。
音声信号出力部18は、各音声信号を設定された出力態様に応じて複数の利用者端末3に出力する。
例えば、音声信号の出力態様が「音像位置left」と設定されている場合、音声信号出力部18は、当該音声信号に対して「音像位置left」を実現する頭部インパルス応答の畳み込み処理を行う。音声信号出力部18は、畳み込み処理した音声信号をWAN4を介して複数の利用者端末3に送信する。音声信号出力部18は、当該音声信号に対して「音像位置left」を実現するため、ステレオ音声の左音声の音量を右音声に比べて大きくしたり、遅延量を制御したりする処理を行ってもよい。
また、例えば、音声信号の出力態様が「音量loud」と設定されている場合、音声信号出力部18は、当該音声信号の音量を増大させる音量調整処理を行う。音声信号出力部18は、音量調整処理した音声信号をWAN4を介して複数の利用者端末3に送信する。
次に、図5を参照して、利用者端末3を説明する。図3は、利用者端末3の機能ブロック図である。利用者端末3は、中央演算処理器としてのCPU3a(Central Processing Unit)と、読み書き自由のRAM3b(Random Access Memory)、読み出し専用のROM3c(Read Only Memory)、マイク3d、スピーカ3e、タッチパネルディスプレイ3f、通信IF3gを備えている。そして、CPU3aがROM3cに記憶されている制御プログラムを読み出して実行することで、制御プログラムは、CPU3aなどのハードウェアを、音声信号送信部30、音声信号受信部31、音声信号再生部32、変更指示情報受付部33、変更指示情報送信部34として機能させる。
音声信号送信部30は、マイク3dから出力された音声信号をサーバ2にWAN4を介して送信する。
音声信号受信部31は、サーバ2からWAN4を介して音声信号を受信する。
音声信号再生部32は、音声信号受信部31が受信した音声信号を再生してスピーカ3eに出力する。スピーカ3eは、典型的にはステレオスピーカである。しかし、これに代えて、音声信号再生部32は、音声信号受信部31が受信した音声信号を再生して、利用者端末3に接続されたステレオイヤホン、ステレオヘッドホン、5.1chスピーカ、又は、7.1chスピーカに出力してもよい。
変更指示情報受付部33は、利用者端末3を利用するユーザがタッチパネルディスプレイ3fを介して入力した変更指示情報を受け付ける。
変更指示情報送信部34は、変更指示情報受付部33が受け付けた変更指示情報をサーバ2にWAN4を介して送信する。
次に、図6を参照して、コミュニケーションシステム1の動作フローを説明する。図6は、コミュニケーションシステム1のシーケンス図である。ここでは、説明の便宜上、利用者端末3C及び利用者端末3Dに関する記載を省略している。
S100:
まず、ユーザAが発話すると利用者端末3Aは当該発話に対応する音声信号をサーバ2に送信する。
S110:
同様に、ユーザBが発話すると利用者端末3Bは当該発話に対応する音声信号をサーバ2に送信する。
S120:
同時発信検出部15は、2以上の利用者端末が同時に音声信号を発信したか判定し(S120)、2以上の利用者端末が同時に音声信号を発信したことを検出した場合は(S120:YES)、処理をS130に進める。一方、同時発信検出部15は、2以上の利用者端末が同時に音声信号を発信したことを検出しなかった場合は(S120:NO)、処理をS200に進める。ここで、「2以上の利用者端末が同時に音声信号を発信した」とは、「2以上のユーザが時間軸上で同時に発話した」ことを意味する。
S130:
人数検出部16は、当該同時発信の発信元の人数を検出する。
S140:
出力態様設定部17は、第2出力DB12bを参照して、同時発信の発信元毎に、発信元の音声信号の音像位置を設定する。
S150-S160:
音声信号出力部18は、同時発信の発信元毎に、発信元の音声信号に対して前述の畳み込み処理を実行し(S150)、畳み込み処理した音声信号をすべての利用者端末3に配信する(S160)。
S200:
S120で同時発信検出部15が2以上の利用者端末が同時に音声信号を発信したことを検出しなかった場合(S120:NO)、発信元特定部11は、各音声信号の発信元を特定する。
S210:
出力態様設定部17は、第1出力DB12aを参照して、各音声信号の出力態様を設定する。
S220-S230:
音声信号出力部18は、各音声信号に対して前述の畳み込み処理や音量調整処理を実行し(S220)、畳み込み処理した音声信号を利用者端末3に配信する(S230)。
S300-S310:
各利用者端末3の音声信号受信部31がサーバ2から音声信号を受信すると(S230)、各利用者端末3の音声信号再生部32は、受信した音声信号を再生してスピーカ3eに出力する(S300、S310)。
S400:
各利用者端末3の変更指示情報受付部33が変更指示情報を受け付ける。
S410:
各利用者端末3の変更指示情報送信部34は変更指示情報をサーバ2にWAN4を介して送信する。サーバ2の変更指示情報取得部13は、各利用者端末3から変更指示情報を受信して取得する。
S420:
サーバ2の設定情報変更部14は、変更指示情報に基づいて第1出力DB12aを変更する。
以上に、本開示の実施形態を説明したが、上記実施形態は以下の特徴を有する。
サーバ2は、音声信号取得部10と発信元特定部11、出力態様設定部17、音声信号出力部18を備える。音声信号取得部10は、第1の利用者端末及び第2の利用者端末を含む複数の利用者端末から発信された音声信号を取得する。発信元特定部11は、各音声信号の発信元を特定する。出力態様設定部17は、発信元特定部11により特定された第1の利用者端末から発信された音声信号の出力態様が、発信元特定部11により特定された、第1の利用者端末と異なる第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する。音声信号出力部18は、各音声信号を設定された出力態様に応じて出力する。そして、出力態様とは、対応する音声信号の再生時における音像位置又は音量の少なくとも何れか一方である。以上の構成によれば、発話者毎に出力態様が異なるので、複数人と同時にコミュニケーションするに際し、各人の発話が聞き取り難いという問題を解決することができる。
また、発信元特定部11は、声紋認証により、各音声信号の発信元を特定する。以上の構成によれば、各音声信号の発信元を精度良く特定することができる。
また、サーバ2は、設定情報記憶部12と変更指示情報取得部13、設定情報変更部14を更に備える。設定情報記憶部12は、発信元と出力先と出力態様を関連付けた出力態様設定情報としての第1出力DB12aを記憶する。変更指示情報取得部13は、第1出力DB12aを変更するための変更指示情報を取得する。設定情報変更部14は、変更指示情報に基づいて12aを変更する。そして、出力態様設定部17は、第1出力DB12aに基づいて各音声信号の出力態様を設定する。以上の構成によれば、例えばWEB会議中にリアルタイムに第1出力DB12aを変更できるようになる。従って、WEB会議中に利用者端末の人数が増減したり、重要な人物が追加で参加したりした場合、第1出力DB12aを柔軟に変更して、現状のWEB会議に最も適した第1出力DB12aとすることができる。また、以上の構成によれば、重要な事項に関して発話するときに、自身の発話の、他の利用者端末に対する出力態様を一時的に変更できるようになる。
また、サーバ2は、同時発信検出部15と人数検出部16を更に備える。同時発信検出部15は、複数の利用者端末のうち少なくとも2以上の利用者端末が同時に音声信号を発信したことを検出する。人数検出部16は、同時発信検出部15が同時発信を検出した場合、当該同時発信の発信元の人数を検出する。そして、出力態様設定部17は、人数検出部16が検出した人数に応じて、各音声信号の再生時における音像位置を設定する。以上の構成によれば、同時に音声信号を発信した利用者端末の人数に応じて、それらの音声信号に対応する発話が最も聞き取り易くなるように、それらの音声信号の再生時における最適な音像位置を実現することができる。
以上に、実施形態を説明したが、実施形態は以下のように変更できる。
即ち、ユーザまたは利用者端末毎に優先度を設定し、優先度に応じて各音声信号の出力態様を設定してもよい。具体的には、優先度が相対的に高いユーザまたは利用者端末から発信された音声信号の音像位置を左右何れかの耳の近傍とすることが考えられる。優先度が相対的に低いユーザまたは利用者端末から発信された音声信号の音量を相対的に小さくすることが考えられる。このようにすることで、例えば会議の主催者や、重要な役割を担うユーザ、または発話が聞き取りにくいユーザの発話がより聞き取り易くなるように出力態様を変更することができる。優先度は、WEB会議中に随時変更できるようにしてもよい。
また、サーバ2が備える各種機能を利用者端末3が備える構成も考えられる。即ち、サーバ2が備える各種機能はコミュニケーションシステム1を構成する複数の装置のうち何れかで実現されていればよい。また、サーバ2が備える各種機能を複数の装置で分散処理する構成も考えられる。
また、出力態様設定部17は、音声信号の周波数特性を調整することで聞き取り難い音声を聞き取り易い音声に変換することが考えられる。この場合、出力態様設定部17は、典型的には、音声信号に対してローパスフィルタやハイパスフィルタを適用することで、音声の聞き取り易さを実現する。
上述した実施形態では、図1に示すように、複数の利用者端末3がWAN4を介してサーバ2に接続されているとした。変形例では、複数の利用者端末3がLAN5(Local area network)を介してサーバ2に接続されてもよい。また複数の利用者端末3が直接サーバ2に接続されてもよい。また各利用者端末3が、上述した実施形態におけるサーバ2の機能を有し、サーバ2を介さずに直接接続される形態であってもよい。
以上の構成によれば、複数人と同時にコミュニケーションするに際し、各人の発話が聞き取り難いという問題を解決することができる。
上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)を含む。非一時的なコンピュータ可読媒体の例は、更に、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROMを含む。非一時的なコンピュータ可読媒体の例は、更に、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1 コミュニケーションシステム
2 サーバ
3 利用者端末
3A 利用者端末
3B 利用者端末
3C 利用者端末
3D 利用者端末
10 音声信号取得部
10a メッセージ取得部
10b 音声信号生成部
11 発信元特定部
12 設定情報記憶部
12a 第1出力DB
12b 第2出力DB
13 変更指示情報取得部
14 設定情報変更部
15 同時発信検出部
16 人数検出部
17 出力態様設定部
18 音声信号出力部
28 メッセージ受付部
29 メッセージ送信部
30 音声信号送信部
31 音声信号受信部
32 音声信号再生部
33 変更指示情報受付部
34 変更指示情報送信部
40 マイク
40a マイク
40b マイク
40c マイク
40d マイク
41 ヘッドフォン
41a ヘッドフォン
41b ヘッドフォン
41c ヘッドフォン
41d ヘッドフォン

Claims (5)

  1. 複数の利用者端末から発信された音声信号を取得する音声信号取得部と、
    各音声信号の発信元を特定する発信元特定部と、
    前記発信元特定部により特定された第1の利用者端末から発信された音声信号の出力態様が、前記発信元特定部により特定された、前記第1の利用者端末と異なる第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定する出力態様設定部と、
    各音声信号を設定された出力態様に応じて出力する音声信号出力部と、
    を備え、
    前記出力態様は、対応する音声信号の再生時における音像位置又は音量の少なくとも何れか一方である、
    コミュニケーション装置。
  2. 前記発信元特定部は、声紋認証により、各音声信号の発信元を特定する、
    請求項1に記載のコミュニケーション装置。
  3. 前記発信元と、出力先及び出力態様を関連付けた出力態様設定情報を記憶する設定情報記憶部と、
    前記出力態様設定情報を変更するための変更指示情報を取得する変更指示情報取得部と、
    前記変更指示情報に基づいて前記出力態様設定情報を変更する設定情報変更部と、
    を更に備え、
    前記出力態様設定部は、前記出力態様設定情報に基づいて各音声信号の出力態様を設定する、
    請求項1又は2に記載のコミュニケーション装置。
  4. 前記複数の利用者端末のうち少なくとも2以上の利用者端末が同時に音声信号を発信したことを検出する同時発信検出部と、
    前記同時発信検出部が同時発信を検出した場合、当該同時発信の発信元の人数を検出する人数検出部と、
    を更に備え、
    前記出力態様設定部は、前記人数検出部が検出した人数に応じて、各音声信号の再生時における音像位置を設定する、
    請求項1に記載のコミュニケーション装置。
  5. コンピュータが、
    複数の利用者端末から発信された音声信号を取得するステップと、
    各音声信号の発信元を特定するステップと、
    前記特定するステップにより特定された第1の利用者端末から発信された音声信号の出力態様が、前記特定するステップにより特定された、前記第1の利用者端末と異なる第2の利用者端末から発信された音声信号の出力態様と異なるように、各音声信号の出力態様を設定するステップと、
    各音声信号を設定された出力態様に応じて出力するステップと、
    を含む処理を実行し、
    前記出力態様は、対応する音声信号の再生時における音像位置又は音量の少なくとも何れか一方である、
    コミュニケーション方法。
JP2022008532A 2022-01-24 2022-01-24 コミュニケーション装置及びコミュニケーション方法 Pending JP2023107364A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022008532A JP2023107364A (ja) 2022-01-24 2022-01-24 コミュニケーション装置及びコミュニケーション方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022008532A JP2023107364A (ja) 2022-01-24 2022-01-24 コミュニケーション装置及びコミュニケーション方法

Publications (1)

Publication Number Publication Date
JP2023107364A true JP2023107364A (ja) 2023-08-03

Family

ID=87474644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022008532A Pending JP2023107364A (ja) 2022-01-24 2022-01-24 コミュニケーション装置及びコミュニケーション方法

Country Status (1)

Country Link
JP (1) JP2023107364A (ja)

Similar Documents

Publication Publication Date Title
JP2011512694A (ja) 通信システムの少なくとも2人のユーザ間の通信を制御する方法
US20050281421A1 (en) First person acoustic environment system and method
US20090112589A1 (en) Electronic apparatus and system with multi-party communication enhancer and method
JP2017527148A (ja) 音質改善のための方法及びヘッドセット
US20070109977A1 (en) Method and apparatus for improving listener differentiation of talkers during a conference call
US10510361B2 (en) Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user
US11240621B2 (en) Three-dimensional audio systems
US11521636B1 (en) Method and apparatus for using a test audio pattern to generate an audio signal transform for use in performing acoustic echo cancellation
JP5295115B2 (ja) 補聴器の駆動方法および補聴器
CN113784274A (zh) 三维音频系统
JP2006254064A (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
WO2020017518A1 (ja) 音声信号処理装置
JP2523367B2 (ja) 音声再生方式
CN110891216A (zh) 一种耳机装置
JP2023107364A (ja) コミュニケーション装置及びコミュニケーション方法
JP2001274912A (ja) 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体
JP3898673B2 (ja) 音声通信システム、方法及びプログラム並びに音声再生装置
CN110856068B (zh) 一种耳机装置的通话方法
JP2523366B2 (ja) 音声再生方式
JP2004072354A (ja) 音声会議システム
JP2539672B2 (ja) 音声再生方式
JP2019066601A (ja) 音響処理装置、プログラム及び方法
JP6392161B2 (ja) 音声会議システム、音声会議装置、その方法及びプログラム
WO2023286320A1 (ja) 情報処理装置および方法、並びにプログラム
EP4184507A1 (en) Headset apparatus, teleconference system, user device and teleconferencing method