JPWO2020022154A1 - 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体 - Google Patents
通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体 Download PDFInfo
- Publication number
- JPWO2020022154A1 JPWO2020022154A1 JP2020532319A JP2020532319A JPWO2020022154A1 JP WO2020022154 A1 JPWO2020022154 A1 JP WO2020022154A1 JP 2020532319 A JP2020532319 A JP 2020532319A JP 2020532319 A JP2020532319 A JP 2020532319A JP WO2020022154 A1 JPWO2020022154 A1 JP WO2020022154A1
- Authority
- JP
- Japan
- Prior art keywords
- localization
- localization position
- call
- voice
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42348—Location-based services which utilize the location information of a target
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2207/00—Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
- H04M2207/18—Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place wireless networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2242/00—Special services or facilities
- H04M2242/30—Determination of the location of a subscriber
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
- Stereophonic System (AREA)
Abstract
多人数による通話を好適に実現することができる通話端末およびその関連技術を提供する。通話端末は、1以上の通話相手の各々の音声信号を受信する音声信号取得部と、受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定部と、各音声信号に対応する音声が、定位位置決定部が決定した定位位置に定位するように音声を出力する音声信号再生部と、を備える。
Description
本発明は、複数人との通話を行う、通話端末、通話システムおよび通話端末の制御方法に関する。また、本発明は、当該通話端末としてコンピュータを動作させるための通話プログラム、および、そのような通話プログラムが記録されている記録媒体にも関する。
本願は、2018年7月27日に、日本に出願された特願2018−141663に優先権を主張し、その内容をここに援用する。
本願は、2018年7月27日に、日本に出願された特願2018−141663に優先権を主張し、その内容をここに援用する。
昨今、スマートフォンなどに代表される情報端末の普及によって、各個人がインターネットを介して様々な情報を取得したり、コミュニケーションを行ったりすることが当たり前となっている。そのような情報端末としては、スマートフォンだけでなく、インターネット上の情報をテレビのインターフェースを介して享受できるスマートテレビや、音声によって当該情報を受け取ることができるスマートスピーカなどが開発されており、目的および用途に応じて使い分けされている。
また、情報端末を用いたコミュニケーション手段の1つとして通話がある。音声を主体とした対話形式のコミュニケーションである通話は、自然なコミュニケーションを実現することができ、現代においても頻繁に用いられている。換言すれば、上述した情報端末は、通話端末としても利用されている。
しかし、従来、一般的な通話端末による通話は、主に1対1の通話を想定している。テレビ会議システムなどの1対多または多対多の通話は、専用のシステムを前提としている。例えば、特許文献1に記載の多人数通話システムは、専用の通話サーバ装置を前提としている。
本発明の一態様の主たる目的は、多人数による通話を好適に実現することができる通話端末およびその関連技術を提供することにある。
本発明の一態様に係る通話端末は、1以上の通話相手の各々の音声信号を受信する受信部と、前記受信部で受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定部と、各音声信号に対応する音声が、前記定位位置決定部が決定した前記定位位置に定位するように当該音声を出力する音声出力部と、を備える。
本発明の一態様に係る通話システムは、通話端末と、通話サーバとを備える通話システムであって、前記通話端末は、1以上の通話相手の各々の音声信号を受信し、前記通話システムは、前記通話端末が受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定部を備え、前記通話端末は、受信した各音声信号に対応する音声が、前記定位位置決定部が決定した定位位置に定位するように当該音声を出力する。
本発明の一態様に係る通話端末の制御方法は、前記通話端末が、1以上の通話相手の各々の音声信号を受信する受信工程と、前記通話端末が、前記受信工程において受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定工程と、前記通話端末が、各音声信号に対応する音声が、前記定位位置決定工程において決定した前記定位位置に定位するように当該音声を出力する音声出力工程と、を含む。
本発明の一態様によれば、通話端末によって多人数による通話を好適に実現することができる。
本発明の各実施形態について、以下に詳細に説明する。ただしこれらの実施形態に記載される構成は、特に記載がない限り、本発明の範囲を当該構成のみに限定するものではない。
<実施形態1>
実施形態1に係る通話端末1および通話端末1の制御方法について、図1〜7を参照して以下に説明する。
実施形態1に係る通話端末1および通話端末1の制御方法について、図1〜7を参照して以下に説明する。
〔通話端末1〕
図1は、実施形態1に係る通話端末1の要部構成を示すブロック図である。図1に示すように、通話端末1は、通話者数取得部101、音声信号取得部(受信部)102、制御部103、音声信号再生部(音声出力部)104、および記憶部105を備えている。
図1は、実施形態1に係る通話端末1の要部構成を示すブロック図である。図1に示すように、通話端末1は、通話者数取得部101、音声信号取得部(受信部)102、制御部103、音声信号再生部(音声出力部)104、および記憶部105を備えている。
なお、通話端末1は、多人数(少なくとも3人)による通話を実現可能なように構成されている。また、通話端末1は、テレビ会議システムや、VR空間を介した通話システム等にも好適に利用することができる。以下、多人数による通話に参加する者を通話者と呼び、通話者のうち、通話端末1を操作する者をユーザ、それ以外の者を通話相手と呼ぶ。
[通話者数取得部101]
通話者数取得部101は、通話端末1の外部からユーザと通話する通話相手の数を取得する。本実施形態においては、通話相手の数は通話に参加している通話者のうち、ユーザ自身を除いた通話者の人数を指す。例えば、あるユーザと1対1の通話を行っているのであれば通話相手の数は1であり、3者間の通話を行っている場合は、通話相手の数は2となる。なお、通話者数取得部101は、通話に参加する通話者の数を取得し、それから1を減算することで通話相手の数を算出してもよい。
通話者数取得部101は、通話端末1の外部からユーザと通話する通話相手の数を取得する。本実施形態においては、通話相手の数は通話に参加している通話者のうち、ユーザ自身を除いた通話者の人数を指す。例えば、あるユーザと1対1の通話を行っているのであれば通話相手の数は1であり、3者間の通話を行っている場合は、通話相手の数は2となる。なお、通話者数取得部101は、通話に参加する通話者の数を取得し、それから1を減算することで通話相手の数を算出してもよい。
なお、通話者数取得部101は、通話者全ての通話端末に備えられていなくてもよい。例えば、ユーザの通話端末1を主端末とし、ユーザの通話端末1のみが通話者数取得部101を備えていてもよい。この場合、ユーザの通話端末1における通話者数取得部101が取得した通話者数の情報を他の通話者(通話相手)の通話端末に送信するようになっていてもよい。これにより、システム全体の処理量を減らしながら効率的に通話者数を取得することができる。また、各通話者の通話端末の代わりに、サーバ(不図示)が通話者数取得部を備えていてもよい。この場合、サーバの通話者数取得部が取得した通話者数の情報を各通話者の通話端末に送信するようになっていてもよい。これによっても、システム全体の処理量を減らしながら効率的に通話者数を取得することができる。
[音声信号取得部102]
音声信号取得部102は、1以上の通話相手各々の音声信号を取得する。具体的には、音声信号取得部102は、通話者数取得部101が取得した通話者数分の音声信号を通話端末1の外部から取得する。本実施形態においては、音声信号は、ユーザが通話を行う通話相手の音声に対応する音声信号であり、好ましくは、モノラル形式の音声信号である。音声信号取得部102は、何らかの圧縮方式によって圧縮された音声信号を取得するようになっていてもよい。この場合、音声信号取得部102は、取得した音声信号を適切な復号手法によって復号する。また、音声信号取得部102はモノラル以外の形式の音声信号、すなわち、2以上のチャネル数を持つ音声信号を取得するようになっていてもよい。この場合、音声信号取得部102は、取得した多チャンネルの音声信号を、モノラル信号へダウンミックスするようになっていてもよい。
音声信号取得部102は、1以上の通話相手各々の音声信号を取得する。具体的には、音声信号取得部102は、通話者数取得部101が取得した通話者数分の音声信号を通話端末1の外部から取得する。本実施形態においては、音声信号は、ユーザが通話を行う通話相手の音声に対応する音声信号であり、好ましくは、モノラル形式の音声信号である。音声信号取得部102は、何らかの圧縮方式によって圧縮された音声信号を取得するようになっていてもよい。この場合、音声信号取得部102は、取得した音声信号を適切な復号手法によって復号する。また、音声信号取得部102はモノラル以外の形式の音声信号、すなわち、2以上のチャネル数を持つ音声信号を取得するようになっていてもよい。この場合、音声信号取得部102は、取得した多チャンネルの音声信号を、モノラル信号へダウンミックスするようになっていてもよい。
[制御部103]
制御部103は、通話者数取得部101、音声信号取得部102、音声信号再生部104、および記憶部105を制御すると共に、これらの各部との間でデータを入出力する。制御部103は、例えば、所定のメモリに格納されたプログラムをCPU(Central Processing Unit)が実行することによって実現される。また、制御部103は、定位位置決定部106および音声信号処理部107を備えている。
制御部103は、通話者数取得部101、音声信号取得部102、音声信号再生部104、および記憶部105を制御すると共に、これらの各部との間でデータを入出力する。制御部103は、例えば、所定のメモリに格納されたプログラムをCPU(Central Processing Unit)が実行することによって実現される。また、制御部103は、定位位置決定部106および音声信号処理部107を備えている。
(定位位置決定部106)
定位位置決定部106は、音声信号取得部102で取得した各音声信号に対応する定位位置を互いに重ならないように決定する。各音声信号に対応する定位位置とは、出力音声における各音声信号に対応する音声の定位位置を意味する。定位位置決定部106は、通話端末1から出力される出力音声において、1以上の通話相手各々の音声の定位位置が重ならないように、各定位位置を決定する。これにより、通話端末1は、通話相手各々に由来する音声をユーザが聞き分けやすいように出力することができる。定位位置決定部106による音声の定位位置の決定方法の詳細については後述する。
定位位置決定部106は、音声信号取得部102で取得した各音声信号に対応する定位位置を互いに重ならないように決定する。各音声信号に対応する定位位置とは、出力音声における各音声信号に対応する音声の定位位置を意味する。定位位置決定部106は、通話端末1から出力される出力音声において、1以上の通話相手各々の音声の定位位置が重ならないように、各定位位置を決定する。これにより、通話端末1は、通話相手各々に由来する音声をユーザが聞き分けやすいように出力することができる。定位位置決定部106による音声の定位位置の決定方法の詳細については後述する。
(音声信号処理部107)
音声信号処理部107は、音声信号取得部102から得られる通話相手各々の音声信号と、定位位置決定部106から得られる各々の音声信号に対応する定位位置とに基づいて、音声信号再生部104から再生される音声を構築(生成)する。
音声信号処理部107は、音声信号取得部102から得られる通話相手各々の音声信号と、定位位置決定部106から得られる各々の音声信号に対応する定位位置とに基づいて、音声信号再生部104から再生される音声を構築(生成)する。
ここで、音声信号処理部107が構築する音声は、定位位置決定部106によって決定された定位位置に基づく定位感をユーザに知覚させることのできる音声である。当該定位感を実現する方法は、音声信号再生部104の構成によって様々である。例えば、音声信号再生部104がヘッドホンまたはイヤホンである場合、音声信号処理部107は、頭部伝達関数(Head-Related Transfer Function; HRTF)を用いて実現したバイノーラル音声信号を構築する。これにより、音声信号処理部107は、ユーザ(受聴者)に定位感を知覚させる。一方で、音声信号再生部104がステレオスピーカである場合、音声信号処理部107は、上述の頭部伝達関数を用いたトランスオーラル音声信号を構築することでユーザ(受聴者)に定位感を知覚させてもよい。また、音声信号処理部107は、VBAP(vector base amplitude panning)などの音圧パンニングを利用して音声信号を構築してもよい。
[音声信号再生部104]
音声信号再生部(音声出力部)104は、各音声信号に対応する音声が、定位位置決定部106が決定した定位位置に定位するように各音声を出力する。一例として、音声信号再生部104は、制御部103によって音響効果処理が施された各音声信号を当該音声信号再生部104に接続されたスピーカ、ヘッドホン、またはイヤホンなどを介して再生する。これにより、音声信号再生部104は、音声を出力し、ユーザ(受聴者)に聞かせることができる。また、音声信号再生部104は、定位位置決定部106によって決定された定位位置に通話相手各々の音声が定位するように該音声を出力する。これにより、通話相手各々に由来する音声をユーザが聞き分けやすいように出力することができる。
音声信号再生部(音声出力部)104は、各音声信号に対応する音声が、定位位置決定部106が決定した定位位置に定位するように各音声を出力する。一例として、音声信号再生部104は、制御部103によって音響効果処理が施された各音声信号を当該音声信号再生部104に接続されたスピーカ、ヘッドホン、またはイヤホンなどを介して再生する。これにより、音声信号再生部104は、音声を出力し、ユーザ(受聴者)に聞かせることができる。また、音声信号再生部104は、定位位置決定部106によって決定された定位位置に通話相手各々の音声が定位するように該音声を出力する。これにより、通話相手各々に由来する音声をユーザが聞き分けやすいように出力することができる。
[記憶部105]
記憶部105は、制御部103が用いる所定のデータを記憶するための二次記憶装置によって構成される。記憶部105は、例えば、磁気ディスク、光ディスク、またはフラッシュメモリとして実現される。具体的には、記憶部105は、HDD(Hard Disk Drive)、SSD(Solid State Drive)またはBD(Blu-Ray(登録商標) Disc)などとして実現される。制御部103は、必要に応じて記憶部105からデータを読み出したり、記憶部105にデータを記録したりすることができる。
記憶部105は、制御部103が用いる所定のデータを記憶するための二次記憶装置によって構成される。記憶部105は、例えば、磁気ディスク、光ディスク、またはフラッシュメモリとして実現される。具体的には、記憶部105は、HDD(Hard Disk Drive)、SSD(Solid State Drive)またはBD(Blu-Ray(登録商標) Disc)などとして実現される。制御部103は、必要に応じて記憶部105からデータを読み出したり、記憶部105にデータを記録したりすることができる。
〔定位位置決定部106による定位位置の決定〕
次に、定位位置決定部106による定位位置の決定方法について、以下、図2〜6を参照して、詳細に説明する。
次に、定位位置決定部106による定位位置の決定方法について、以下、図2〜6を参照して、詳細に説明する。
[定位可能範囲の設定]
定位位置決定部106は、各音声信号に対応する音声の定位位置を決定する前に、各音声を定位することが可能な範囲である定位可能範囲を設定してもよい。これにより、より好適に各音声の定位位置を決定することができる。ただし、定位位置決定部106は、定位可能範囲を設定せずに、各音声の定位位置を決定してもよい。以下、定位位置決定部106による定位可能範囲の設定方法について、図2を参照して説明する。図2は実施形態1における定位可能範囲の一例を示す図である。
定位位置決定部106は、各音声信号に対応する音声の定位位置を決定する前に、各音声を定位することが可能な範囲である定位可能範囲を設定してもよい。これにより、より好適に各音声の定位位置を決定することができる。ただし、定位位置決定部106は、定位可能範囲を設定せずに、各音声の定位位置を決定してもよい。以下、定位位置決定部106による定位可能範囲の設定方法について、図2を参照して説明する。図2は実施形態1における定位可能範囲の一例を示す図である。
(定位可能範囲の設定例1)
一態様において、定位位置決定部106は、例えば図2の(A)に示すように、ユーザ201を中心とした円内(ユーザ201の周囲)のうち、定位可能範囲開始位置2030と定位可能範囲終了位置204とに挟まれた定位可能範囲202aを設定してもよい。この場合、定位位置決定部106は、定位可能範囲202a内に、各音声の定位位置(例えば定位位置205)を決定する。
一態様において、定位位置決定部106は、例えば図2の(A)に示すように、ユーザ201を中心とした円内(ユーザ201の周囲)のうち、定位可能範囲開始位置2030と定位可能範囲終了位置204とに挟まれた定位可能範囲202aを設定してもよい。この場合、定位位置決定部106は、定位可能範囲202a内に、各音声の定位位置(例えば定位位置205)を決定する。
一態様において、通話端末1は、例えばキーボードまたはタッチパネルなど、ユーザ201から定位可能範囲の入力を受け付ける範囲入力部108(不図示)を備え、定位位置決定部106は、範囲入力部108に入力された範囲を、定位可能範囲として設定してもよい。例えば、範囲入力部108は、定位可能範囲開始位置203および定位可能範囲終了位置204の入力を受け付けるようになっており、定位位置決定部106は、定位可能範囲開始位置203および定位可能範囲終了位置204に挟まれた範囲を定位可能範囲202aとして設定する。
これにより、通話相手が少ない場合などには、定位可能範囲202aを限定して、通話中に注意を払うべき範囲を少なくしたり、通話相手が多い場合などには、定位可能範囲202aを広くして、各通話相手に由来する音声を聞き分けやすくしたりすることができる。
なお、定位可能範囲を規定するために用いるユーザ201を中心とした円の半径は特に限定されず、任意の距離に設定することができる。例えば、定位位置決定部106は、ユーザ201からキーボードまたはタッチパネルなどの任意の指示入力部109(不図示)を介してユーザ201から音声の定位位置までの距離を受け付けることで当該円の半径を決定してもよい。
(定位可能範囲の設定例2)
ユーザ201は、定位可能範囲開始位置203と定位可能範囲終了位置204とを同一であるように入力してもよい。また、ユーザ201は、定位可能範囲の入力を省略してもよい。これらの場合、定位位置決定部106は、図2の(B)に示すように、定位可能範囲を、ユーザ201を中心とした円の全体である定位可能範囲202bに設定してもよい。この場合、定位位置決定部106は、定位可能範囲202b内に、各音声の定位位置(例えば定位位置206)を決定する。
ユーザ201は、定位可能範囲開始位置203と定位可能範囲終了位置204とを同一であるように入力してもよい。また、ユーザ201は、定位可能範囲の入力を省略してもよい。これらの場合、定位位置決定部106は、図2の(B)に示すように、定位可能範囲を、ユーザ201を中心とした円の全体である定位可能範囲202bに設定してもよい。この場合、定位位置決定部106は、定位可能範囲202b内に、各音声の定位位置(例えば定位位置206)を決定する。
(定位可能範囲の設定例3)
上述の例では、定位可能範囲が連続した範囲である場合について説明したが、定位可能範囲は必ずしも連続した範囲である必要はない。定位位置決定部106は、例えば図2の(C)に示すように、定位可能範囲として、複数の不連続な定位可能範囲202cおよび202dを設定してもよい。
上述の例では、定位可能範囲が連続した範囲である場合について説明したが、定位可能範囲は必ずしも連続した範囲である必要はない。定位位置決定部106は、例えば図2の(C)に示すように、定位可能範囲として、複数の不連続な定位可能範囲202cおよび202dを設定してもよい。
(定位可能範囲の設定例4)
一態様において、通話端末1は、通話端末1の周位の音を検知する検知部110(不図示)を備え、定位位置決定部106は、検知部110が検知した音の発生源を避けるように、各音声信号に対応する定位位置を決定してもよい。
一態様において、通話端末1は、通話端末1の周位の音を検知する検知部110(不図示)を備え、定位位置決定部106は、検知部110が検知した音の発生源を避けるように、各音声信号に対応する定位位置を決定してもよい。
例えば、検知部110が、ユーザ201の前方からテレビ音等の音を検知した場合、定位位置決定部106は、図2の(C)に示すように、定位可能範囲として、ユーザ201の前方を除く不連続な定位可能範囲202cおよび202dを設定し、定位可能範囲202cおよび202d内に、各音声の定位位置207〜209を決定する。これにより、定位位置決定部106は、検知部110が検知した音の発生源を避けるように、各音声信号に対応する定位位置を決定することができる。
これにより、例えばある方向からテレビ音等の音が発生している場合であっても、音の発生源とは異なる方向から通話相手由来の音声が聞こえるようにすることができる。これにより、通話相手各々由来の音声をユーザ201に聞き分けやすくすることができる。なお、音の発生源を避けて各音声の定位位置を決定する構成であれば、音の発生源を避けて定位可能範囲を設定する構成に限定されず、定位位置決定部106は、任意に設定された定位可能範囲内において、音の発生源を避けて各音声の定位位置を決定するようになっていてもよい。
(定位可能範囲の設定例5)
一態様において、定位位置決定部106は、音声信号再生部104が実際に出力音声を定位させることができる範囲に基づいて、定位可能範囲を設定してもよい。具体的には、定位位置決定部106は、音声信号再生部104の位置、または、音声信号再生部104の位置と音声信号処理部107の音声信号構築法とに基づいて、定位可能範囲を設定してもよい。
一態様において、定位位置決定部106は、音声信号再生部104が実際に出力音声を定位させることができる範囲に基づいて、定位可能範囲を設定してもよい。具体的には、定位位置決定部106は、音声信号再生部104の位置、または、音声信号再生部104の位置と音声信号処理部107の音声信号構築法とに基づいて、定位可能範囲を設定してもよい。
例えば図2の(D)に示すように、音声信号再生部104がステレオスピーカ210および211であり、音声信号処理部107の音声信号構築法がVBAPであるとする。この場合、音声信号再生部104が出力音声を定位することができる範囲は、ステレオスピーカ210とステレオスピーカ211との間となる。このとき、定位位置決定部106は、ユーザ201とステレオスピーカ210とを結ぶ線を定位可能範囲開始位置203に決定し、ユーザ201とステレオスピーカ211とを結ぶ線を定位可能範囲終了位置204に設定してもよい。
また、図2の(E)に示すように、音声信号再生部104が、ユーザ201を中心とした円上に隣接して配置された5.1chのマルチチャンネルスピーカ212〜214であり、音声信号処理部107の音声信号構築法がVBAPである場合には、音声信号再生部104は、ユーザ201から見て全方位の先に出力音声を定位することができる。このとき、定位位置決定部106は、定位可能範囲として、例えば図2の(B)に示す定位可能範囲202bを設定してもよい。
(定位可能範囲の設定例6)
上述の例では、定位位置決定部106は、定位可能範囲を予め設定しているが、本実施形態ではこれに限定されない。本実施形態では、定位位置決定部106は、通話中に定位可能範囲を設定したり変更(再設定)したりしてもよい。
上述の例では、定位位置決定部106は、定位可能範囲を予め設定しているが、本実施形態ではこれに限定されない。本実施形態では、定位位置決定部106は、通話中に定位可能範囲を設定したり変更(再設定)したりしてもよい。
例えば、通話端末1は、通話中に、指示入力部109を介してユーザ201から定位位置の変更指示を受け付け、定位位置決定部106は、変更指示に基づいて、各音声信号に対応する定位位置を変更してもよい。これにより、例えば、通話中、通話相手各々由来の音声が、定位位置の範囲が広すぎる、または、狭すぎるといった理由で、聞き取りにくい場合に、定位可能範囲の設定を変更することにより、通話相手各々由来の音声の定位位置を、より聞き分けやすい位置に変更することができる。
(定位可能範囲の設定例7)
上述の例では、定位位置決定部106は、ユーザ201を中心とした円内の少なくとも一部の範囲を定位可能範囲に設定しているが、本実施形態ではこれに限定されない。本実施形態では、定位位置決定部106は任意の範囲を定位可能範囲に決定することができ、一態様において、定位位置決定部106は、ユーザ201を中心とした半球上の少なくとも一部の範囲を定位可能範囲に設定してもよい。この場合、定位位置決定部106は、ユーザ201の上方を音声の定位位置に決定することができる。また一態様において、定位位置決定部106は、定位可能範囲として、ユーザ201を中心とした円の円周上の範囲を設定し、当該円周上に各音声の定位位置を決定するようにしてもよい。また一態様において、定位可能範囲は、円の以外の形状を有していてもよい。
上述の例では、定位位置決定部106は、ユーザ201を中心とした円内の少なくとも一部の範囲を定位可能範囲に設定しているが、本実施形態ではこれに限定されない。本実施形態では、定位位置決定部106は任意の範囲を定位可能範囲に決定することができ、一態様において、定位位置決定部106は、ユーザ201を中心とした半球上の少なくとも一部の範囲を定位可能範囲に設定してもよい。この場合、定位位置決定部106は、ユーザ201の上方を音声の定位位置に決定することができる。また一態様において、定位位置決定部106は、定位可能範囲として、ユーザ201を中心とした円の円周上の範囲を設定し、当該円周上に各音声の定位位置を決定するようにしてもよい。また一態様において、定位可能範囲は、円の以外の形状を有していてもよい。
[定位位置の決定]
次に、通話相手由来の出力音声の定位位置の決定方法について、図3〜6を参照して説明する。
次に、通話相手由来の出力音声の定位位置の決定方法について、図3〜6を参照して説明する。
(定位位置の決定例1)
定位位置決定部106による各通話相手の音声信号に対応する音声(各通話相手由来の出力音声)の定位位置の決定方法の一例について図3を参照して説明する。なお、以下では、定位位置決定部106は、定位可能範囲202aを設定しているものとする。
定位位置決定部106による各通話相手の音声信号に対応する音声(各通話相手由来の出力音声)の定位位置の決定方法の一例について図3を参照して説明する。なお、以下では、定位位置決定部106は、定位可能範囲202aを設定しているものとする。
通話相手の数が1である場合、定位位置決定部106は、図3の(A)に示すように、定位可能範囲202aのうち予め決定されている定位位置301を、通話相手由来の音声の定位位置として決定する。なお、定位位置301は、ユーザ201の正面の位置であるが、これに限定されず、定位位置決定部106が、他の位置に決定してもよいし、指示入力部109を介したユーザ201の指示に基づいて決定してもよい。
通話相手の数が2以上である場合、定位位置決定部106は、各通話相手由来の音声の定位位置が重ならないように当該音声の定位位置を決定する。詳細には、定位位置決定部106は、定位可能範囲202a内において、各通話相手由来の音声の定位位置を、互いに異なる位置に決定するものであり、好ましくは、各通話相手由来の音声が、ユーザ201に到来する方向が重ならないように、各通話相手由来の音声の定位位置を決定する。例えば、定位位置決定部106は、図3の(B)に示すように、定位可能範囲202aの両端に、各通話相手由来の音声の定位位置302および303を決定してもよい。
また、一態様において、定位可能範囲202aにおいて隣り合う定位位置同士の間隔が均一となるように、各音声信号に対応する定位位置を決定してもよい。例えば、定位位置決定部106は、図3の(C)に示すように、音声の定位可能範囲202aにおいて隣り合う2つの定位位置同士の間隔が均一となるように定位位置を決定する。すなわち、定位位置決定部106は、5人の通話相手由来の音声の定位位置を、音声の定位可能範囲202aを4等分した位置それぞれに決定する。これにより、各通話相手由来の音声をより聞き分けやすくすることができる。
上述のように、定位位置決定部106が、通話相手の数に基づき、通話相手各々由来の音声の定位位置を決定することで、通話相手の数に応じて、通話相手各々の音声をユーザ201が聞き分けやすいように出力することができる。
(定位位置の決定例2)
定位位置決定部106による通話相手の音声信号に対応する音声(各通話相手由来の出力音声)の定位位置の決定方法の他の例について図4を参照して説明する。なお、以下では、定位位置決定部106は、定位可能範囲202bを設定しているものとする。
定位位置決定部106による通話相手の音声信号に対応する音声(各通話相手由来の出力音声)の定位位置の決定方法の他の例について図4を参照して説明する。なお、以下では、定位位置決定部106は、定位可能範囲202bを設定しているものとする。
通話相手の数が1である場合、図4の(A)に示すように、定位位置決定部106は、定位可能範囲202bのうち、例えばユーザ201の正面の位置である予め決定されている定位位置401を定位位置として決定する。ただし、定位位置401の位置はこれに限定されない。
通話相手の数が2以上である場合、定位位置決定部106は、各通話相手由来の音声の定位位置が重ならないように当該音声の定位位置を決定する。詳細には、定位位置決定部106は、定位可能範囲202b内において、各通話相手由来の音声の定位位置を、互いに異なる位置に決定するものであり、好ましくは、各通話相手由来の音声が、ユーザ201に到来する方向が重ならないように、各通話相手由来の音声の定位位置を決定する。
また、一態様において、定位可能範囲202bにおいて隣り合う定位位置同士の間隔が均一となるように、各音声信号に対応する定位位置を決定してもよい。
例えば、定位位置決定部106は、図4の(B)および(C)に示すように、音声の定位可能範囲202bにおいて隣り合う2つの定位位置同士の間隔が均一となるように定位位置を決定する。例えば、通話相手が2人である場合には、定位位置決定部106は、図4の(B)に示すように、2人の通話相手由来の音声の定位位置を、音声の定位可能範囲202bを2等分した位置それぞれに決定する。例えば、通話相手が5人である場合には、定位位置決定部106は、図4の(C)に示すように、5人の通話相手由来の音声の定位位置を、音声の定位可能範囲202bを5等分した位置それぞれに決定する。これにより、各通話相手由来の音声をより聞き分けやすくすることができる。
また、定位位置決定部106は、定位可能範囲202bを数等分する際に、任意の分け方で等分することができる。例えば、通話者数が2であり、定位位置決定部106が定位可能範囲202bを2等分した位置に各通話相手由来の音声の定位位置を決定する際に、図4の(B)に示す定位位置402および403の代わりに、図4の(D)に示す定位位置409および410に決定してもよい。また、通話者数が5であり、定位位置決定部106が音声の定位可能範囲202bを5等分した位置に各通話相手由来の音声の定位位置を決定する際に、図4の(C)に示す定位位置404〜408の代わりに、図4の(E)に示す定位位置411〜415に決定してもよい。
(定位位置の決定例3)
定位位置決定部106による通話相手の音声信号に対応する音声(各通話相手由来の出力音声)の定位位置の決定方法の他の例について図5を参照して説明する。なお、以下では、定位位置決定部106は、定位可能範囲202cおよび202dを設定しているものとする。
定位位置決定部106による通話相手の音声信号に対応する音声(各通話相手由来の出力音声)の定位位置の決定方法の他の例について図5を参照して説明する。なお、以下では、定位位置決定部106は、定位可能範囲202cおよび202dを設定しているものとする。
通話相手の数が1である場合、定位位置決定部106は、定位可能範囲202cおよび202dのうちのいずれかにおける予め決定されている定位位置を、通話相手由来の音声の定位位置として決定する。例えば、図5の(A)に示すように、定位位置決定部106は、定位可能範囲202cのうち予め決定されている定位位置501を、通話相手由来の音声の定位位置として決定してもよい。
通話相手の数が2以上である場合、定位位置決定部106は、各通話相手由来の音声の定位位置が重ならないように当該音声の定位位置を決定する。この場合、定位位置決定部106は、定位可能範囲202cおよび定位可能範囲202dの両方に定位位置が分布するように定位位置を決定する。
例えば、通話相手の数が2である場合、定位位置決定部106は、図5の(B)に示すように、定位可能範囲202cおよび202dにそれぞれ1つの定位位置(定位可能範囲202cにおける定位位置502および定位可能範囲202dにおける定位位置503)を決定する。
また例えば、通話相手の数が3である場合、定位位置決定部106は、図5の(C)に示すように、定位可能範囲202c内に2つの定位位置(504および505)を決定し、定位可能範囲202d内に1つの定位位置(506)を決定してもよい。また、定位位置決定部106は、図5の(D)に示すように、定位可能範囲202c内に1つの定位位置(507)を決定し、定位可能範囲202d内に2つの定位位置(508および509)を決定してもよい。
また例えば、通話相手の数が5である場合、定位位置決定部106は、定位可能範囲202cおよび202dのそれぞれにおいて、隣り合う通話者の音声の定位位置同士の間隔が均一となるように定位位置を決定する。この場合、定位位置決定部106は、例えば、図5の(E)に示すように、定位可能範囲202c内に4つの定位位置510〜513を決定し、定位可能範囲202d内に1つの定位位置514を決定してもよい。また、定位位置決定部106は、図5の(F)に示すように、定位可能範囲202c内に3つの定位位置515〜517を決定し、定位可能範囲202d内に2つの定位位置518および519を決定してもよい。
このとき、定位位置決定部106は、図5の(E)および(F)に示すように、音声の定位可能範囲202cおよび202dの少なくとも一方において、隣り合う通話者の音声の定位位置同士の間隔が均一となるように各定位位置を決定することが好ましい。
このように、通話者数が3以上である場合、定位可能範囲202dおよび202dの少なくとも一方において、隣り合う通話者の音声の定位位置同士の間隔が均一となるように当該定位位置を決定することで、ユーザ201にとって聞き分けやすい位置に各通話者の音声を容易に定位させることができる。
(定位位置の決定例4)
定位位置決定部106は、通話中に、通話相手由来の音声の定位位置を変更してもよい。これにより、ユーザ201は、予め決定した音声の定位位置に定位した音声が聞き分けにくい場合であっても、指示入力部109を介して変更指示を入力するなどして、定位位置決定部106に、各通話相手に由来する音声の定位位置を後から変更させることができる。その結果、各通話相手に由来する音声の定位位置をユーザ201にとってより聞き分けやすい好適な位置に決定することができる。
定位位置決定部106は、通話中に、通話相手由来の音声の定位位置を変更してもよい。これにより、ユーザ201は、予め決定した音声の定位位置に定位した音声が聞き分けにくい場合であっても、指示入力部109を介して変更指示を入力するなどして、定位位置決定部106に、各通話相手に由来する音声の定位位置を後から変更させることができる。その結果、各通話相手に由来する音声の定位位置をユーザ201にとってより聞き分けやすい好適な位置に決定することができる。
(定位位置の決定例5)
また、指示入力部109を介した変更指示が定位位置の回転指示である場合、定位位置決定部106は、回転指示に基づいて、各通話相手由来の音声の定位位置を、ユーザ201(各音声の受聴者)を中心として回転させてもよい。
また、指示入力部109を介した変更指示が定位位置の回転指示である場合、定位位置決定部106は、回転指示に基づいて、各通話相手由来の音声の定位位置を、ユーザ201(各音声の受聴者)を中心として回転させてもよい。
例えば、通話相手の数が2であり、定位位置決定部106が定位可能範囲を定位可能範囲202bに決定しているとする。この場合、定位位置決定部106は、ユーザ201の指示に基づき、図4の(B)に示す定位位置402および403から図4の(D)に示す定位位置409および410にユーザ201(各音声の受聴者)を中心に回転してもよい。そして、定位位置決定部106は、各通話相手由来の音声の定位位置を、回転後の定位位置409および410に決定してもよい。
また例えば、通話相手の数が5であり、定位位置決定部106が定位可能範囲を定位可能範囲202bに決定しているとする。この場合、定位位置決定部106は、ユーザ201の指示に基づき、図5の(C)に示す各通話相手由来の音声の定位位置404〜408を図5の(E)に示す定位位置411〜415にユーザ201(各音声の受聴者)を中心に回転してもよい。そして、定位位置決定部106は、各通話相手由来の音声の定位位置を、回転後の定位位置411〜415に決定してもよい。
これにより、例えば、通話相手と通話した際に、予め決定された音声の定位位置から聞こえる通話相手各々由来の音声が聞き分けにくい場合であっても、通話相手由来の音声の定位位置を、ユーザ201にとって通話者各々由来の音声をより聞き分けやすい位置に変更することができる。
(定位位置の決定例6)
上述の例では、定位位置決定部106は、通話相手の数が所定の数以上である場合に、定位可能範囲における各定位位置を、隣り合う定位位置同士の間隔が均一となるように決定している。ただし、定位位置決定部106は、隣り合う定位位置同士の間隔が均一となるように、各定位位置を決定しなくてもよい。
上述の例では、定位位置決定部106は、通話相手の数が所定の数以上である場合に、定位可能範囲における各定位位置を、隣り合う定位位置同士の間隔が均一となるように決定している。ただし、定位位置決定部106は、隣り合う定位位置同士の間隔が均一となるように、各定位位置を決定しなくてもよい。
以下、図6を参照して、定位位置決定部106による通話者の音声の定位位置の決定方法の一例について説明する。図6は、実施形態1における音声の定位位置の一例を示す図である。
例えば、通話相手の数が5である場合に、定位位置決定部106は、図6の(A)に示すように、定位可能範囲202bを5等分してもよいが、図6の(B)に示すように、5等分しなくともよい。特に、定位可能範囲202bを境界線603によって前方領域601と後方領域602とに分けた場合、ユーザ201の音声の知覚は、前方に比べて後方からの音声に対して鈍いことがある。この場合、定位位置決定部106は、図6の(B)に示すように、後方領域602における定位位置607および608の間隔を、前方領域601における定位位置604〜606に比べて広くなるように決定することにより、より好適にユーザに対して各音声を出力することができる。
また、定位位置決定部106は、少なくとも各通話相手由来の音声の定位位置が、ユーザ201から見て所定の角度以上離れるように各定位位置を決定してもよい。所定の角度は特に限定されないが、1度、5度、10度、15度、20度、25度、30度等、適宜設定することができる。これによっても、ユーザ201にとって通話相手の音声が聞き取りやすい範囲に定位位置を決定することができる。
〔通話端末1の制御処理〕
次に、図7を参照して、本実施形態に係る通話端末1の制御処理(通話端末の制御方法)の流れを説明する。図7は、実施形態1に係る通話端末1の制御処理の流れの一例を示すフローチャートである。
次に、図7を参照して、本実施形態に係る通話端末1の制御処理(通話端末の制御方法)の流れを説明する。図7は、実施形態1に係る通話端末1の制御処理の流れの一例を示すフローチャートである。
ステップS101において、通話者数取得部101は、通話端末1の外部から通話相手の数を取得する。また、音声信号取得部102は、1以上の通話相手の各々の音声信号を取得(受信)する(受信工程、音声信号取得工程)。その後、ステップS102に進む。
ステップS102において、定位位置決定部106は、通話者数取得部101が取得した通話相手の数が1より多いかを判定する。通話相手の数が1より多い場合(ステップS102のYES)、ステップS103に進む。通話相手の数が1である場合(ステップS102のNO)、ステップS104に進む。
ステップS103において、定位位置決定部106は、音声信号取得工程において取得した各音声信号に対応する定位位置を互いに重ならないように決定する(定位位置決定工程)。このとき、好ましくは、定位位置決定部106は、隣り合う通話者の音声の定位位置同士の間隔が均一となるように、当該定位位置を決定する。その後、ステップS105に進む。
ステップS104において、定位位置決定部106は、通話相手由来の出力音声の定位位置を、予め決定されている位置に決定する(定位位置決定工程)。その後、ステップS105に進む。
ステップS105において、音声信号処理部107は、各通話相手の音声信号に対応する音声が、定位位置決定工程において決定した定位位置に定位するように出力音声を生成し、音声信号再生部104から出力させる(音声出力工程)。
以上の処理により、通話端末1によって多人数による通話を好適に実現することができる。
<実施形態2>
以下、実施形態2に係る通話端末10について図8〜10を参照して説明する。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を割愛する。
以下、実施形態2に係る通話端末10について図8〜10を参照して説明する。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を割愛する。
〔通話端末10〕
図8は、実施形態2に係る通話端末10の要部構成を示すブロック図である。
図8は、実施形態2に係る通話端末10の要部構成を示すブロック図である。
図8に示すように、通話端末10は、実施形態1に係る通話端末1の制御部103の代わりに制御部1030を備えている。この点以外は、通話端末10は、実施形態1に係る通話端末1と同様の構成である。
[制御部1030]
図8に示すように、制御部1030は、実施形態1における定位位置決定部106の代わりに、定位位置決定部1060を備えている。この点以外は、制御部1030は、実施形態1における制御部103と同様の構成である。
図8に示すように、制御部1030は、実施形態1における定位位置決定部106の代わりに、定位位置決定部1060を備えている。この点以外は、制御部1030は、実施形態1における制御部103と同様の構成である。
(定位位置決定部1060)
定位位置決定部1060は、通話者数取得部101から得られる通話相手の数に基づき、各通話相手の音声信号に対応する定位位置を決定する。
定位位置決定部1060は、通話者数取得部101から得られる通話相手の数に基づき、各通話相手の音声信号に対応する定位位置を決定する。
一態様において、定位位置決定部1060は、通話相手の数が多ければ多いほど定位可能範囲が大きくなるように定位可能範囲を決定する。例えば、記憶部105に、通話相手の数ごとに予め決定された定位可能範囲が記憶してあり、定位位置決定部1060は、記憶部105から通話相手の数に応じた定位可能範囲を読み出すことによって、定位可能範囲を決定してもよい。
通話相手の数が多ければ多いほど定位可能範囲が大きくなるように定位可能範囲を決定することにより、通話相手の数が少ない場合には定位可能範囲が小さくなるため、通話中に注意を払うべき範囲を必要最小限に抑えることができ、通話相手の数が多い場合には定位可能範囲が大きくなるため、多数の音声を聞き分けられるように各定位位置を配置することができる。
そして、定位位置決定部1060は、決定した定位可能範囲において、隣り合う定位位置同士の間隔が均一となり、かつ、当該間隔が最大となるように、各音声信号に対応する定位位置を決定する。これにより、定位位置決定部1060は、通話者数取得部101から得られる通話相手の数に応じた適切な定位位置を決定することができる。
なお、本実施形態はこれに限定されず、定位位置決定部1060が、通話相手の数が多ければ多いほど定位位置同士の間隔が小さくなるように定位位置を決定してもよい。これによっても、定位位置決定部1060は、通話者数取得部101から得られる通話相手の数に応じた適切な定位位置を決定することができる。
以下に、定位位置決定部1060による定位可能範囲および定位位置の決定方法の一例について、図9を参照して説明する。図9は実施形態2における定位可能範囲の一例を示す図である。
通話相手の数が1である場合、図9の(A)に示すように、定位位置決定部1060は、定位可能範囲を、ユーザ201の正面の直線である定位可能範囲902aに決定する。また、定位位置決定部1060は、通話相手由来の音声の定位位置を定位可能範囲902aから一意に定まる定位位置901に決定する。
通話相手の数が2である場合、定位位置決定部1060は、図9の(B)に示すように、定位可能範囲を、通話者数が2である場合に対応する定位可能範囲902bに決定する。また、定位位置決定部1060は、定位可能範囲902bにおいて隣り合う定位位置同士の間隔が均一となるように各通話相手由来の音声の定位位置903および904を決定する。
通話者数が5である場合、定位位置決定部1060は、図9の(C)に示すように、定位可能範囲を、通話者数が5である場合に対応する定位可能範囲902cに決定する。また、定位位置決定部1060は、定位可能範囲902cにおいて隣り合う定位位置の間隔が均一となるように、定位可能範囲902cを4等分した定位位置905〜909に、各通話相手由来の音声の定位位置をそれぞれ決定する。
なお、本実施形態においても、定位位置決定部1060は、通話中に定位可能範囲および定位位置を変更してもよい。これにより、例えば、通話相手と通話した際に、予め決定された定位可能範囲における定位位置から聞こえる通話相手各々由来の音声が聞き分けにくい場合であっても、通話相手由来の音声の定位位置を、ユーザ201にとってより聞き分けやすい位置に変更することができる。
〔通話端末10の制御処理〕
次に、図10を参照して、本実施形態に係る通話端末10の制御処理(通話端末の制御方法)の流れを説明する。図10は、実施形態2に係る通話端末10の制御処理の流れの一例を示すフローチャートである。
次に、図10を参照して、本実施形態に係る通話端末10の制御処理(通話端末の制御方法)の流れを説明する。図10は、実施形態2に係る通話端末10の制御処理の流れの一例を示すフローチャートである。
ステップS201において、通話者数取得部101は、通話端末1の外部から通話相手の数を取得する。また、音声信号取得部102は、1以上の通話相手の各々の音声信号を取得(受信)する(受信工程、音声信号取得工程)。
ステップS202において、定位位置決定部1060は、通話者数取得部101から取得した通話者数に基づき、音声の定位可能範囲を決定する。
ステップS203において、定位位置決定部1060は、音声信号取得工程において取得した各音声信号に対応する定位位置を互いに重ならないように決定する。また、定位位置決定部1060は、決定した定位可能範囲において隣り合う定位位置の間隔が均一となるように、各定位位置を決定する(定位位置決定工程)。
ステップS204において、音声信号再生部104は、各音声信号に対応する音声が、ステップS203の定位位置決定工程において決定した定位位置に定位するように当該音声を出力し、処理を終了する(音声出力工程)。
<実施形態3>
実施形態1に係る通話端末1の機能は、実施形態3に係る通話システム100によって実現されてもよい。
実施形態1に係る通話端末1の機能は、実施形態3に係る通話システム100によって実現されてもよい。
以下、実施形態3に係る通話システム100について図11を参照して説明する。なお、説明の便宜上、上述の実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を割愛する。
〔通話システム100〕
図11は、実施形態3に係る通話システム100の要部構成を示すブロック図である。通話システム100は、通話端末200と、通話サーバ300とを備えている。また、通話サーバ300は、定位位置決定部106を備えている。
図11は、実施形態3に係る通話システム100の要部構成を示すブロック図である。通話システム100は、通話端末200と、通話サーバ300とを備えている。また、通話サーバ300は、定位位置決定部106を備えている。
このように、通話システム100は、通話端末200が、実施形態1に係る通話端末1における定位位置決定部106を備える制御部103の代わりに、定位位置決定部106を備えていない制御部10300を備えており、定位位置決定部106を備える通話サーバ300をさらに備えている。
通話システム100は、通話端末200が、1以上の通話相手の各々の音声信号を受信し、通話システム100は、通話端末200が受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定部106を備え、通話端末200は、受信した各音声信号に対応する音声が、定位位置決定部106が決定した定位位置に定位するように当該音声を出力する。
より具体的には、図11に示すように、通話システム100は、通話端末200の通話者数取得部101が通話相手の数を取得し、音声信号取得部102が通話相手各々の音声信号を取得する。通話サーバ300の定位位置決定部106は、通話端末200の音声信号取得部102で取得した各音声信号に対応する定位位置を互いに重ならないように決定する。通話端末200の音声信号処理部107は、通話端末200の音声信号取得部102から得られる通話相手各々の音声信号と、通話サーバ300の定位位置決定部106から得られる各々の音声信号に対応する定位位置とに基づいて、音声信号再生部104から再生される音声を構築(生成)する。通話端末200の音声信号再生部104は、各音声信号に対応する音声が、通話サーバ300の定位位置決定部106が決定した定位位置に定位するように各音声を出力する。
このように、通話システム100は、全体として、実施形態1に係る通話端末1と同様に機能する。また、通話システム100によれば、定位位置決定部106の処理を通話サーバ300が行うことで、通話端末200の処理量を低減させることができる。
なお、上述の例では、通話システム100は、通話端末200の代わりに通話サーバ300が定位位置決定部106を備えている場合について説明したが、本実施形態ではこれに限定されない。本実施形態では、通話端末200は、少なくとも音声信号再生部104を備えていればよく、その他の部材を通話端末200の代わりに通話サーバ300が備えていてもよい。例えば、通話端末200の代わりに通話サーバ300が記憶部105、定位位置決定部106および制御部10300、すなわち、図1の記憶部105および制御部103を備えていたり、通話端末200の代わりに通話サーバ300が、制御部103および記憶部105に加え、通話者数取得部101および音声信号取得部102をさらに備えていたりしてもよい。この場合も、通話システム100は、通話端末200の処理量を減らしつつ、全体として、実施形態1に係る通話端末1と同様に機能することができる。
〔ソフトウェアによる実現例〕
通話端末1、10の制御ブロック(特に定位位置決定部106、1060および音声信号再生部104)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
通話端末1、10の制御ブロック(特に定位位置決定部106、1060および音声信号再生部104)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、通話端末1、10は、各機能を実現するソフトウェアである通話プログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記通話プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記通話プログラムを上記記録媒体から読み取って実行することにより、本実施形態の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記通話プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記通話プログラムは、該通話プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記通話プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
Claims (11)
- 1以上の通話相手の各々の音声信号を受信する受信部と、
前記受信部で受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定部と、
各音声信号に対応する音声が、前記定位位置決定部が決定した前記定位位置に定位するように当該音声を出力する音声出力部と、を備えることを特徴とする通話端末。 - 前記定位位置決定部は、前記通話相手の数に応じて、前記各音声信号に対応する定位位置を決定することを特徴とする請求項1に記載の通話端末。
- 前記定位位置決定部は、隣り合う前記定位位置同士の間隔が均一となるように、前記各音声信号に対応する定位位置を決定することを特徴とする請求項1または2に記載の通話端末。
- 前記定位位置の変更指示を受け付ける指示入力部を備え、
前記定位位置決定部は、前記変更指示に基づいて、前記各音声信号に対応する定位位置を変更することを特徴とする請求項1〜3のいずれか1項に記載の通話端末。 - 前記変更指示は、前記定位位置の回転指示であり、
前記定位位置決定部は、前記回転指示に基づいて、前記各音声信号に対応する定位位置を、前記音声の受聴者を中心として回転させることを特徴とする請求項4に記載の通話端末。 - 前記通話端末の周囲の音を検知する検知部を備え、
前記定位位置決定部は、前記検知部が検知した音の発生源を避けるように、前記各音声信号に対応する定位位置を決定することを特徴とする請求項1〜5のいずれか1項に記載の通話端末。 - 定位可能範囲の入力を受け付ける範囲入力部を備え、
前記定位位置決定部は、前記定位可能範囲内において、前記各音声信号に対応する定位位置を決定することを特徴とする請求項1〜6のいずれか1項に記載の通話端末。 - 通話端末と、通話サーバとを備える通話システムであって、
前記通話端末は、1以上の通話相手の各々の音声信号を受信し、
前記通話システムは、前記通話端末が受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定部を備え、
前記通話端末は、受信した各音声信号に対応する音声が、前記定位位置決定部が決定した定位位置に定位するように当該音声を出力することを特徴とする通話システム。 - 通話端末の制御方法であって、
前記通話端末が、1以上の通話相手の各々の音声信号を受信する受信工程と、
前記通話端末が、前記受信工程において受信した各音声信号に対応する定位位置を互いに重ならないように決定する定位位置決定工程と、
前記通話端末が、各音声信号に対応する音声が、前記定位位置決定工程において決定した前記定位位置に定位するように当該音声を出力する音声出力工程と、を含むことを特徴とする通話端末の制御方法。 - 請求項1〜7のいずれか1項に記載の通話端末としてコンピュータを機能させるための通話プログラムであって、前記定位位置決定部として前記コンピュータを機能させるための通話プログラム。
- 請求項10に記載の通話プログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018141663 | 2018-07-27 | ||
JP2018141663 | 2018-07-27 | ||
PCT/JP2019/028141 WO2020022154A1 (ja) | 2018-07-27 | 2019-07-17 | 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2020022154A1 true JPWO2020022154A1 (ja) | 2021-08-19 |
Family
ID=69180430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020532319A Ceased JPWO2020022154A1 (ja) | 2018-07-27 | 2019-07-17 | 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210185174A1 (ja) |
JP (1) | JPWO2020022154A1 (ja) |
WO (1) | WO2020022154A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2022118671A1 (ja) * | 2020-12-04 | 2022-06-09 | ||
GB2610605A (en) * | 2021-09-10 | 2023-03-15 | Nokia Technologies Oy | Apparatus, methods and computer programs for repositioning spatial audio streams |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007116494A (ja) * | 2005-10-21 | 2007-05-10 | Yamaha Corp | 音声会議装置 |
JP2009033298A (ja) * | 2007-07-25 | 2009-02-12 | Nec Corp | 通信システム及び通信端末 |
US20090111443A1 (en) * | 2007-10-31 | 2009-04-30 | Embarq Holdings Company Llc | System and method for wireless conferencing |
US20150373477A1 (en) * | 2014-06-23 | 2015-12-24 | Glen A. Norris | Sound Localization for an Electronic Call |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1042396A (ja) * | 1996-07-23 | 1998-02-13 | Sanyo Electric Co Ltd | 音像制御装置 |
JP3905364B2 (ja) * | 2001-11-30 | 2007-04-18 | 株式会社国際電気通信基礎技術研究所 | ステレオ音像制御装置および多対地間通話システムにおける対地側装置 |
JP2006114942A (ja) * | 2004-10-12 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | 音声提示システム、音声提示方法、この方法のプログラム、および記録媒体 |
-
2019
- 2019-07-17 JP JP2020532319A patent/JPWO2020022154A1/ja not_active Ceased
- 2019-07-17 US US17/263,538 patent/US20210185174A1/en not_active Abandoned
- 2019-07-17 WO PCT/JP2019/028141 patent/WO2020022154A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007116494A (ja) * | 2005-10-21 | 2007-05-10 | Yamaha Corp | 音声会議装置 |
JP2009033298A (ja) * | 2007-07-25 | 2009-02-12 | Nec Corp | 通信システム及び通信端末 |
US20090111443A1 (en) * | 2007-10-31 | 2009-04-30 | Embarq Holdings Company Llc | System and method for wireless conferencing |
US20150373477A1 (en) * | 2014-06-23 | 2015-12-24 | Glen A. Norris | Sound Localization for an Electronic Call |
US20170272880A1 (en) * | 2014-06-23 | 2017-09-21 | Glen A. Norris | Sound Localization for an Electronic Call |
Also Published As
Publication number | Publication date |
---|---|
US20210185174A1 (en) | 2021-06-17 |
WO2020022154A1 (ja) | 2020-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108141696B (zh) | 用于空间音频调节的系统和方法 | |
CN102318373B (zh) | 解码装置、编解码装置及解码方法 | |
US20140226842A1 (en) | Spatial audio processing apparatus | |
CN102860048B (zh) | 用于处理产生声场的多个音频信号的方法和设备 | |
KR102375482B1 (ko) | 오디오의 공간 프리젠테이션을 위한 장치 및 관련 방법 | |
EP2901668B1 (en) | Method for improving perceptual continuity in a spatial teleconferencing system | |
US20170195817A1 (en) | Simultaneous Binaural Presentation of Multiple Audio Streams | |
JPWO2020022154A1 (ja) | 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体 | |
US11930350B2 (en) | Rendering audio | |
US20220095047A1 (en) | Apparatus and associated methods for presentation of audio | |
US20120134499A1 (en) | Audio Processing Devices, Multi-Channel Audio Application System, and Method Thereof | |
US11665271B2 (en) | Controlling audio output | |
US10206031B2 (en) | Switching to a second audio interface between a computer apparatus and an audio apparatus | |
JP7375817B2 (ja) | 音声処理装置、通話デバイス、音声処理方法、およびプログラム | |
WO2016009850A1 (ja) | 音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体 | |
JPWO2020022155A1 (ja) | 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体 | |
KR101111734B1 (ko) | 복수 개의 음원을 구분하여 음향을 출력하는 방법 및 장치 | |
CN113852780B (zh) | 一种音频数据处理方法及电子设备 | |
US20230276187A1 (en) | Spatial information enhanced audio for remote meeting participants | |
CN117931116A (zh) | 音量调节方法、电子设备及介质 | |
JP2022143165A (ja) | 再生装置、再生システムおよび再生方法 | |
Costerton | A systematic review of the most appropriate methods of achieving spatially enhanced audio for headphone use | |
CN112689825A (zh) | 实现远程用户访问介导现实内容的装置、方法、计算机程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220301 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20220726 |