JP2010166424A - 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法 - Google Patents

多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法 Download PDF

Info

Publication number
JP2010166424A
JP2010166424A JP2009008126A JP2009008126A JP2010166424A JP 2010166424 A JP2010166424 A JP 2010166424A JP 2009008126 A JP2009008126 A JP 2009008126A JP 2009008126 A JP2009008126 A JP 2009008126A JP 2010166424 A JP2010166424 A JP 2010166424A
Authority
JP
Japan
Prior art keywords
audio
audio signal
terminals
monaural
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009008126A
Other languages
English (en)
Inventor
Hironori Ito
伊藤  博紀
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009008126A priority Critical patent/JP2010166424A/ja
Publication of JP2010166424A publication Critical patent/JP2010166424A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】異なる音声チャネル数に対応した音声信号による多地点会議サービスを提供可能とする。
【解決手段】多地点会議サーバ100は、信号分離部103で、受信部101から供給される音声データを、上記呼制御情報S1から取得した、それぞれの音声データの音声チャネル数に応じて、モノラル音声データとステレオ音声データとに分類し、音声ミキシング装置104に供給する。音声ミキシング装置104は、複数のモノラル音声端末200、及び複数のステレオ音声端末300毎に、複数のモノラル音声データと複数のステレオ音声データとをミキシングし、対応する端末からの音声データのみを除去し、対応する複数のモノラル音声端末200、及び複数のステレオ音声端末300に送信する。
【選択図】図1

Description

本発明は、複数の音声信号をミキシングする技術に関し、特に、多地点会議サービスを提供する多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法に関する。
多地点会議サービスを提供するシステムとして、特許文献1に記載の多地点テレビ会議システムがある。この多地点テレビ会議システムは、複数の会議端末と、これら会議端末が接続される多地点制御装置とからなる。会議端末が参加者に割り当てられる。
この多地点テレビ会議システムでは、各会議端末が、自端末にて検出した音響(音声)に関する音響信号を多地点制御装置に送信する。多地点制御装置は、各会議端末から受信した音響信号を加算する。そして、多地点制御装置は、会議端末のそれぞれに対して、加算した音響信号から当該会議端末から受信した音響信号を減算し、その減算結果として得られる音響信号を符号化し、その符号化した音響信号を当該会議端末に送信する。
ところで、多地点制御装置は、回線交換網、モバイル網、パケット網等の種々の通信網に適用することが可能である。回線交換網では、ITU‐T(Telecommunication Union Telecommunication Standardization Sector)勧告のH.323や、H.324により規定される通信プロトコルが用いられる。モバイル網では、3G−324Mにより規定される通信プロトコルが用いられる。IP(Internet Protocol)に基づくパケット網では、IETF(The Internet Engineering Task Force)のRFC3550RTPが用いられる。「RFC」は、「Request for Comments」の略であり、「RTP」は「Real-time Transport Protocol」の略である。
また、多地点制御装置に接続する端末の音声信号は、通常モノラル音声であるが、近年、携帯端末の高機能化に伴い、携帯端末においてもステレオ音声や、多チャネル信号が用いられることが考えられる。3GPPで採用された携帯端末向け音声符号化であるAMR−WB+(Adaptive Multi-Rate Wide Band Plus)は、モノラル音声だけでなくステレオ音声にも対応している。また、MPEG−4AAC(Advanced Audio Coding)符号化方式は、多チャネル音声に対応している。さらに、モノラル音声信号のみ対応しているAMRや、AMR−WBを用いる場合であっても、ステレオ、又は多チャネル信号における各チャネルの信号を独立に符号化して伝送する方法がRFC4867に記載されている。
特開2000−175170号公報
上述した背景から、将来、多地点テレビ会議システムでは、モノラル音声の端末と、ステレオや、多チャネル音声の端末とが混在する状況が増えると考えられる。したがって、上述した多地点会議サービスを利用する上での利便性を考慮すると、モノラル音声を利用し、単一の音声チャネルで音声(音響)信号を送受信する端末と、ステレオ、又は多チャネル音声を利用し、複数の音声チャネルで音声(音響)信号を送受信する端末との間においても、多地点会議サービスを提供できることが望ましい。
しかしながら、上述した特許文献1の多地点制御装置は、一般にモノラル音声向けにしか対応していないため、異なる音声チャネル数で音声信号を送受信する端末間に対して多地点会議サービスを提供することは困難であるという問題がある。
本発明は、このような事情を考慮してなされたものであり、その目的は、モノラル音声の端末とステレオや、多チャネル音声の端末とが混在している場合であっても、それぞれの端末の音声チャネル数に対応した音声信号による多地点会議サービスを提供することができ、多地点音声会議サービスにおける利便性の向上を図ることができる多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法を提供することにある。
上述した課題を解決するために、本発明は、多地点に設けられた複数の端末と、該複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置とからなる多地点会議システムであって、前記複数の端末は、異なる音声チャネル数の音声信号を送受信する複数の端末からなり、前記サーバ装置は、音声チャネル数毎に、前記複数の端末からの同一音声チャネル数の音声信号を加算して第1の音声信号を生成する加算手段と、音声チャネル数毎に、前記加算手段によって生成された同一音声チャネル数毎の前記第1の音声信号を合算して第2の音声信号を生成する合算手段と、前記合算手段により生成された音声チャネル数毎の第2の音声信号を、対応する音声チャネル数の音声信号を送受信する端末に前記ネットワークを介して送信する送信手段とを備えることを特徴とする多地点会議システムである。
また、上述した課題を解決するために、本発明は、多地点に設けられた複数の端末と、該複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置とからなる多地点会議システムであって、前記複数の端末は、異なる音声チャネル数の音声信号を送受信する複数の端末からなり、前記サーバ装置は、前記複数の端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成する第1の加算手段と、前記複数の端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成する第2の加算手段と、前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号とを合算して、第2のモノラル音声信号を生成する第1の合算手段と、前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号とを合算して、第2の多チャネル音声信号を生成する第2の合算手段と、前記第1の合算手段により生成された前記第2のモノラル音声信号を、前記複数の端末の対応する端末に前記ネットワークを介して送信するとともに、前記第2の合算手段により生成された前記第2の多チャネル音声信号を、前記複数の端末の対応する端末に前記ネットワークを介して送信する送信手段とを備えることを特徴とする多地点会議システムである。
また、上述した課題を解決するために、本発明は、多地点に設けられた複数の端末と、該複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置とからなる多地点会議システムであって、前記複数の端末は、モノラル音声信号を送受信する複数のモノラル音声端末と、多チャネル音声信号を送受信する複数の多チャネル音声端末とからなり、前記サーバ装置は、前記複数のモノラル音声端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成する第1の加算手段と、前記複数の多チャネル音声端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成する第2の加算手段と、前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号とを合算して、第2のモノラル音声信号を生成する第1の合算手段と、前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号を合算して、第2の多チャネル音声信号を生成する第2の合算手段と、
前記第1の合算手段により生成された前記複数のモノラル音声端末毎の前記第2のモノラル音声信号を、前記複数のモノラル音声端末の対応するモノラル音声端末にネットワークを介して送信するとともに、前記第2の合算手段により生成された前記複数の多チャネル音声端末毎の第2の多チャネル音声信号を、前記複数の多チャネル音声端末の対応する多チャネル音声端末にネットワークを介して送信する送信手段とことを特徴とする多地点会議システムである。
また、上述した課題を解決するために、本発明は、多地点に設けられた複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置であって、前記サーバ装置は、前記複数の端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成する第1の加算手段と、前記複数の音声端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成する第2の加算手段と、前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号を合算して、第2のモノラル音声信号を生成する第1の合算手段と、前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号を合算して、第2の多チャネル音声信号を生成する第2の合算手段と、前記第1の合算手段により生成された前記第2のモノラル音声信号を、前記複数の端末の対応する端末にネットワークを介して送信するとともに、前記第2の合算手段により生成された前記第2の多チャネル音声信号を、前記複数の端末の対応する端末にネットワークを介して送信する送信手段とを備えることを特徴とするサーバ装置である。
また、上述した課題を解決するために、本発明は、複数の端末から異なる音声チャネル数を有する複数の音声信号が入力される音声ミキシング装置であって、音声チャネル数毎に設けられた複数のミキシング処理部を備え、前記複数のミキシング処理部は、各々、同一音声チャネル数の音声信号を加算して第1の音声信号を生成する加算手段と、前記加算手段によって生成された同一音声チャネル数毎の前記第1の音声信号を合算して第2の音声信号を生成する合算手段とを備えることを特徴とする音声ミキシング装置である。
また、上述した課題を解決するために、本発明は、多地点に設けられ、モノラル音声信号を送受信する複数のモノラル音声端末とステレオ音声信号を送受信する複数のステレオ音声端末との間で行われる音声信号の送受信をネットワークを介してサーバ装置により制御する多地点会議サービス提供方法であって、前記サーバ装置は、前記複数のモノラル音声端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成するステップと、前記複数のステレオ音声端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成するステップと、前記第1のモノラル音声信号と前記第1の多チャネル音声信号を合算して、第2のモノラル音声信号を生成するステップと、前記第1のモノラル音声信号と前記第1の多チャネル音声信号を合算して、第2の多チャネル音声信号を生成するステップと、前記第2のモノラル音声信号を、前記複数のモノラル音声端末の対応するモノラル音声端末にネットワークを介して送信するとともに、前記第2の多チャネル音声信号を、前記複数のステレオ音声端末の対応するステレオ音声端末にネットワークを介して送信するステップとを含むことを特徴とする多地点会議サービス提供方法である。
この発明によれば、音声チャネル数が異なる端末の音声信号を混在させた音声ミキシングを行うことが可能であるので、例えば、モノラル音声の端末とステレオや多チャネル音声の端末が混在している場合であっても、それぞれの端末の音声チャネル数に対応した音声信号による多地点会議サービスを提供することができ、多地点音声会議サービスにおける利便性の向上を図ることができるという利点が得られる。
本発明による音声ミキシング装置を搭載した多地点会議サーバを用いた多地点会議システムの構成を示すブロック図である。 本発明の第1実施形態による音声ミキシング装置の構成を示すブロック図である。 本発明の第2実施形態による音声ミキシング装置の構成を示すブロック図である。 本発明の第3実施形態による音声ミキシング装置の構成を示すブロック図である。
以下、本発明の一実施形態を、図面を参照して説明する。
A.第1実施形態
まず、本発明の第1実施形態について説明する。
図1は、本第1実施形態による音声ミキシング装置を搭載した多地点会議サーバを用いた多地点会議システムの構成を示すブロック図である。この多地点会議システムは、複数のモノラル音声端末200と、複数のステレオ音声端末300と、これらの端末が伝送路400を介して接続される多地点会議サーバ100とを有する。
複数のモノラル音声端末200は、各々、AD変換部201、符号化部202、送信部203、DA変換部204、復号部205、及び受信部206から構成される。また、複数のステレオ音声端末300は、各々、AD変換部301、符号化部302、送信部303、DA変換部304、復号部305、及び受信部306から構成される。
AD変換部201、301は、マイクロフォンからの音声信号(アナログ信号)をデジタル信号に変換する。符号化部202、302は、それぞれAD変換部201、301から供給される音声信号(デジタル信号)を符号化する。送信部203、303は、各々、符号化部202、302から供給される符号化された音声データ(複数のモノラル音声データ、または複数のステレオ音声データ)を、伝送路400を介して多地点会議サーバ100に送信する。
受信部206、306は、多地点会議サーバ100からの符号化された複数のモノラル音声データ、または複数のステレオ音声データを、伝送路400を介して受信する。復号部205、305は、各々、受信部206、306から供給される符号化された複数のモノラル音声データ、または複数のステレオ音声データを復号する。DA変換部204、304は、それぞれ復号部205、305からの復号された音声信号(複数のモノラル音声データ、または複数のステレオ音声データ)をアナログ信号に変換する。アナログ信号に変換された音声信号(複数のモノラル音声信号、または複数のステレオ音声信号)は、それぞれDA変換部204、304からスピーカに供給される。
伝送路400は、回線交換網、モバイル網、パケット網等の複数の通信網を含む。伝送路400は、モノラル音声端末200、ステレオ音声端末300と多地点会議サーバ100との間において音声データを送受信する際に、それぞれの通信網のプロトコルを通じて、音声データの呼接続情報(音声信号を送信した端末のアドレス情報や、音声チャネル数に関する情報などを含む)を多地点会議サーバ100に供給する。
多地点会議サーバ100は、異なる音声チャネル数の複数の音声データを受信するようになっており、各音声チャネル毎に設けられている複数のミキシング処理部を備えている。すなわち、ミキシング処理部の数は、多地点会議サーバで取り扱うことができる音声チャネルの最大数に対応する。ここでは、多地点会議サーバは、モノラル音声信号とステレオ音声信号とを受信するように構成されている。
すなわち、多地点会議サーバ100は、複数のモノラル音声データ、及び複数のステレオ音声データを復号し、該復号した複数のモノラル音声データ、及び複数のステレオ音声データをミキシングして、それぞれのモノラル音声端末200や、ステレオ音声端末300の音声チャネル数に対応した音声データを生成し、伝送路400を介して、対応する端末に送信するようになっている。以下に、多地点会議サーバ100の詳細について説明する。
本実施形態による多地点会議サーバ100は、受信部101、信号分類部103、音声ミキシング装置104、及び送信部105を有する。受信部101は、複数のモノラル音声端末200からのモノラル音声データ、及び/または複数のステレオ音声端末300からのステレオ音声データを、伝送路400を介して受信し、信号分類部103に供給する。また、受信部101は、音声データを受信した際に得られる呼制御情報S1を取得し、信号分類部103、及び送信部105に供給する。該呼制御情報S1には、音声データを送信した端末のアドレス情報や、音声チャネル数に関する情報などが含まれる。
信号分類部103は、受信部101から供給される複数のモノラル音声データ、及び複数のステレオ音声データを、上記呼制御情報S1から取得した、それぞれの音声データの音声チャネル数に応じて、モノラル音声データとステレオ音声データとに分類して、ミキシング装置104に供給する。また、信号分類部103は、音声ミキシング装置104から供給される、ミキシングされた複数のモノラル音声データ、及び複数のステレオ音声データを送信部105に供給する。
音声ミキシング装置104は、信号分類部103から供給される、複数のモノラル音声データ、及び複数のステレオ音声データを復号し、ミキシングし、さらに、符号化した後、該符号化した音声データを信号分類部103に供給する。送信部105は、信号分類部103から供給される複数のモノラル音声データ、及び複数のステレオ音声データを、伝送路400を介して、上記呼制御情報S1から取得した、端末のアドレス情報に基づいて、複数のモノラル音声端末200、または複数のステレオ音声端末300のうちの対応する端末に送信する。
図2は、本第1実施形態による音声ミキシング装置の構成を示すブロック図である。図において、音声データ入力端子10−1〜10−nには、複数のモノラル音声端末200から受信したモノラル音声データが入力される。例えば、モノラル音声データとして、n個の音声データを受信した場合には、音声データ入力端子10−1〜10−nのそれぞれにモノラル音声データが供給される。復号部11−1〜11−nは、それぞれの音声データ入力端子10−1〜10−nに入力されたモノラル音声データを復号し、グループ信号加算部400に供給する。グループ信号加算部400は、復号部11−1〜11−nからのモノラル音声データを加算し、その加算結果を全信号加算部500、及びステレオ信号におけるグループ信号加算部501、502に供給する。
音声データ入力端子20−1〜20−nには、複数のステレオ音声端末300から受信したステレオ音声データが入力される。例えば、ステレオ音声データとして、n個の音声データを受信した場合には、音声データ入力端子20−1〜20−nのそれぞれにステレオ音声データが供給される。復号部21−1〜21−nは、それぞれの音声データ入力端子20−1〜20−nに入力されたステレオ音声データを復号し、2チャネルのステレオ音声データとして出力し、一方のチャネルの音声データ(例えば、右側(R))をグループ信号加算部401に供給し、他方のチャネルの音声データ(例えば、左側(L))をグループ信号換算部402に供給する。
グループ信号加算部401は、復号部21−1〜21−nからの一方のチャネルの音声データを全て加算し、その加算結果を全信号加算部501、及びゲイン調整器601を介してモノラル信号における全信号加算部500に供給する。グループ信号加算部402は、復号部21−1〜21−nからの他方のチャネルの音声データを全て加算し、その加算結果を全信号加算部502、及びゲイン調整器602を介してモノラル信号における全信号加算部500に供給する。ゲイン調整器601、602は、各々、一方のチャネルの音声データ、及び他方のチャネルの音声データに対してゲイン調整を行い、該ゲイン調整した一方のチャネルの音声データ、及び他方のチャネルの音声データを全加算器500に出力する。ゲイン調整としては、ステレオ音声信号のレベルをモノラル音声信号のレベルに変換するために、入力信号の振幅を半分にする。
全信号加算部500は、グループ信号加算部400から供給される加算結果(全てのモノラル音声データの合計)と、ゲイン調整器601を介してグループ信号加算部401から供給される一方のチャネルの音声データ(全てのステレオ音声データの一方のチャネルの音声データの合計)と、ゲイン調整器602を介してグループ信号加算部402から供給される他方のチャネルの音声データ(全てのステレオ音声データの他方のチャネルの音声データの合計)とを加算し、信号減算部12−1〜12−nに供給する。
信号減算部12−1〜12−nは、各々、復号部11−1〜11−nのうち、それぞれに対応する復号部からのモノラル音声データを第1の入力とし、全信号加算部500からの全音声データを第2の入力とし、該第2の入力から第1の入力を減算して生成した音声データを、それぞれに対応する符号化部13−1〜13−nに供給する。符号化部13−1〜13−nは、各々、信号減算部12−1〜12−nから供給されるモノラル音声データを符号化し、該符号化したモノラル音声データを音声データ出力端子14−1〜14−nに出力する。
すなわち、音声データ出力端子14−1〜14−nには、それぞれに対応する入力端子10−1〜10−nの各々に入力されたモノラル音声データが減算された、他の全てのモノラル音声データ、及び全てのステレオ音声データを含むモノラル音声データが出力されることになる。
全信号加算部501は、グループ信号加算部401から供給される加算結果(全てのステレオ音声データの一方のチャネルの音声データの合計)と、グループ信号加算部400から供給される全てのモノラル音声データの合計とを加算し、信号減算部22−1〜22−nに供給する。
信号減算部22−1〜22−nは、各々、復号部21−1〜21−nのうち、それぞれに対応する復号部からの、ステレオ音声データの一方のチャネルの音声データを第1の入力とし、全信号加算部501からの音声データ(全モノラル音声データの合計と全ステレオ音声データの一方のチャネルの音声データの合計)を第2の入力とし、該第2の入力から第1の入力を減算して生成した音声データを、それぞれに対応する符号化部23−1〜23−nに供給する。
全信号加算部502は、グループ信号加算部402から供給される加算結果(全てのステレオ音声データの他方のチャネルの音声データの合計)と、グループ信号加算部400から供給される全てのモノラル音声データの合計とを加算し、信号減算部32−1〜32−nに供給する。
信号減算部32−1〜32−nは、各々、それぞれに対応する復号部21−1〜21−nからの、ステレオ音声データの他方のチャネルの音声データを第1の入力とし、全信号加算部502からの音声データ(全モノラル音声データと全ステレオ音声データの他方のチャネルの音声データの合計)を第2の入力とし、該第2の入力から第1の入力を減算して生成した音声データを、それぞれに対応する符号化部23−1〜23−nに供給する。
符号化部23−1〜23−nは、各々、信号減算部22−1〜22−nから供給される一方のチャネルの音声データと、信号減算部32−1〜32−nから供給される他方のチャネルの音声データとを符号化し、該符号化したステレオ音声データを音声データ出力端子24−1〜24−nに出力する。
すなわち、音声データ出力端子24−1〜24−nには、それぞれに対応する入力端子20−1〜20−nの各々に入力されたステレオ音声データが減算された、全てのモノラル音声データ、及び他の全てのステレオ音声データを含むステレオ音声データが出力されることになる。
次に、上述した第1実施形態の動作について説明する。
複数のモノラル音声端末200では、マイクロフォンから入力された音声信号は、AD変換部201でデジタル化され、符号化部202で符号化され、送信部203で、伝送路400を介して、モノラル音声データとして多地点会議サーバ100に送信される。一方、複数のステレオ音声端末300では、マイクロフォンから入力された音声信号は、AD変換部301でデジタル化され、符号化部302で符号化され、送信部303で、伝送路400を介して、ステレオ音声データとして多地点会議サーバ100に送信される。
多地点会議サーバ100では、受信部101で、上記複数のモノラル音声端末200からの複数のモノラル音声データと、上記複数のステレオ音声端末300からの複数のステレオ音声データとが受信される。このとき、受信部101では、音声データを受信した際に、各音声データから呼制御情報S1が取得され、信号分類部103、及び送信部105に供給される。
信号分離部103では、受信部101から供給される音声データ(モノラル音声データ、及びステレオ音声データ)が、上記呼制御情報S1から取得した、それぞれの音声データの音声チャネル数に応じて、モノラル音声データとステレオ音声データとに分類され、音声ミキシング装置104に供給される。
音声ミキシング装置104では、複数のモノラル音声端末200から送信された、複数のモノラル音声データが音声データ入力端子10−1〜10−nに入力され、それぞれに対応する復号部11−1〜11−nに供給される。また、複数のステレオ音声端末300から送信された、複数のステレオ音声データが音声データ入力端子20−1〜20−nに入力され、それぞれに対応する復号部21−1〜21−nに供給される。
復号部11−1〜11−nでは、それぞれのモノラル音声データが復号され、グループ信号加算部400に供給される。そして、グループ信号加算部400では、復号部11−1〜11−nからのモノラル音声データが全て加算され、その加算結果が全信号加算部500、及びステレオ信号におけるグループ信号加算部501、502に供給される。
一方、復号部21−1〜21−nでは、それぞれのステレオ音声データが復号され、2チャネルのステレオ音声データとして出力される。一方のチャネルの音声データ(例えば、右側(R))は、グループ信号加算部401に供給され、他方のチャネルの音声データ(例えば、左側(L))は、グループ信号換算部402に供給される。
グループ信号加算部401では、復号部21−1〜21−nからの一方のチャネルの音声データが全て加算され、その加算結果が全信号加算部501、及びゲイン調整器601を介してモノラル信号における全信号加算部500に供給される。グループ信号加算部402では、復号部21−1〜21−nからの他方のチャネルの音声データを全て加算され、その加算結果が全信号加算部502、及びゲイン調整器602を介してモノラル信号における全信号加算部500に供給される。
全信号加算部500では、全てのモノラル音声データと、ゲイン調整器601によりゲイン調整された、全てのステレオ音声データの一方のチャネルの音声データと、ゲイン調整器602によりゲイン調整された、全てのステレオ音声データの他方のチャネルの音声データとが加算され、信号減算部12−1〜12−nに供給される。信号減算部12−1〜12−nでは、各々、全信号加算部500からの音声信号(全音声データ)から、それぞれに対応する復号部11−1〜11−nからのモノラル音声データが減算され、それぞれに対応する符号化部13−1〜13−nに供給される。
符号化部13−1〜13−nでは、各々、信号減算部12−1〜12−nから供給されるモノラル音声データが符号化され、音声データ出力端子14−1〜14−nに出力される。すなわち、音声データ出力端子14−1〜14−nには、それぞれに対応する入力端子10−1〜10−nの各々に入力されたモノラル音声データが減算された、他の全てのモノラル音声端末200からのモノラル音声データ、及び全てのステレオ音声端末300からのステレオ音声データを含むモノラル音声データが出力されることになる。
一方、全信号加算部501では、全てのステレオ音声データの一方のチャネルの音声データと、全てのモノラル音声データとが加算され、信号減算部22−1〜22−nに供給される。また、全信号加算部502では、全てのステレオ音声データの他方のチャネルの音声データと、全てのモノラル音声データとが加算され、信号減算部32−1〜32−nに供給される。
信号減算部22−1〜22−nでは、各々、全てのモノラル音声データと全てのステレオ音声データの一方のチャネルの音声データとが含まれる音声データから、それぞれに対応する復号部21−1〜21−nからのステレオ音声データの一方のチャネルの音声データが減算され、それぞれに対応する符号化部23−1〜23−nに供給される。同様に、信号減算部32−1〜32−nでは、各々、全てのモノラル音声データと全てのステレオ音声データの他方のチャネルの音声データとが含まれる音声データから、それぞれに対応する復号部21−1〜21−nからのステレオ音声データの他方のチャネルの音声データが減算され、それぞれに対応する符号化部23−1〜23−nに供給される。
符号化部23−1〜23−nでは、各々、信号減算部22−1〜22−nから供給される音声データ(右側(R))と信号減算部32−1〜32−nから供給される音声データ(左側(L))とが符号化され、それぞれステレオ音声データとして、音声データ出力端子24−1〜24−nに出力される。すなわち、音声データ出力端子24−1〜24−nには、それぞれに対応する入力端子20−1〜20−nの各々に入力されたステレオ音声データが減算された、全てのモノラル音声端末200からのモノラル音声データ、及び他の全てのステレオ音声端末300からのステレオ音声データを含むステレオ音声データが出力される。
次に、信号分類部103では、音声データ出力端子14−1〜14−nに出力されるモノラル音声データと、音声データ出力端子24−1〜24−nに出力されるステレオ音声データとが送信部105に供給される。そして、送信部105では、信号分類部103から供給されるモノラル音声データ、及びステレオ音声データの各々が、伝送路400を介して、複数のモノラル音声端末200、または複数のステレオ音声端末300のうち、呼制御情報S1に基づいて識別した送信先の端末に送信される。
複数のモノラル音声端末200では、各々、受信部206で、多地点会議サーバ100からのモノラル音声データが、伝送路400を介して受信され、復号部205で、受信されたモノラル音声データが復号され、DA変換部204で、復号されたモノラル音声データがアナログ信号に変換され、スピーカからモノラル音声として出力される。このとき、複数のモノラル音声端末200で受信され、スピーカから出力されるモノラル音声には、自身から送信したモノラル音声は含まれておらず、その他のモノラル音声端末200や、複数のステレオ音声端末300からの音声は全て含まれている。
一方、複数のステレオ音声端末300では、各々、受信部306で、多地点会議サーバ100からのステレオ音声データが、伝送路400を介して受信され、復号部305で、受信されたステレオ音声データが復号され、DA変換部304で、復号されたステレオ音声データがアナログ信号に変換され、スピーカからステレオ音声として出力される。このとき、複数のステレオ音声端末300で受信され、スピーカから出力されるステレオ音声には、複数のモノラル音声端末200や、他のステレオ音声端末300からの音声は全て含まれているが、自身から送信したステレオ音声は含まれていない。
上述した第1実施形態によれば、複数のモノラル音声端末と複数のステレオ音声端末とが混在している場合であっても、それぞれの端末の音声チャネル数に対応した音声データを送受信する多地点会議サービスを提供することができ、多地点音声会議サービスにおける利便性の向上を図ることができる。
B.第2実施形態
次に、本発明の第2実施形態について説明する。
本第2実施形態による、音声ミキシング装置104は、モノラル音声をステレオ化すること、及び端末毎にステレオ化する際のパラメータを独立に設定可能とすることにより、会議における臨場感を向上させることを特徴としている。また、音声に加えて映像も送受信するテレビ電話端末の場合に、各端末の音源位置と映像の表示位置とを一致させるようにステレオ化する際のパラメータを設定可能としている。なお、多地点会議システムの構成については図1と同様であるので説明を省略する。
図3は、本第2実施形態による音声ミキシング装置104の構成を示すブロック図である。図において、音声データ入力端子10−1〜10−nには、各々、モノラル音声データが入力される。例えば、モノラル音声データとして、n個の音声データを受信した場合は、音声データ入力端子10−1〜10−nのそれぞれにモノラル音声データが供給される。復号部11−1〜11−nは、それぞれの音声データ入力端子10−1〜10−nに入力されたモノラル音声データを復号し、ステレオ化部15−1〜15−nに供給する。
なお、ここでは、受信する音声データは、モノラル音声データのみであるが、ステレオ音声データを受信した場合には、復号したステレオ音声データをモノラル化した後、ステレオ化部15−1〜15−nに供給すれば、ステレオ音声データにも対応することができる。ステレオ音声データをモノラル化するには、例えば、2チャネルのステレオ信号同士を加算し、さらにその振幅を半分にした信号をモノラル化した信号として用いればよい。
ステレオ化部15−1〜15−nは、各々、ステレオ化制御部700から供給される制御情報SSに基づいて、入力されたモノラル音声データをステレオ化し、該ステレオ化したステレオ音声データの一方のチャネルの音声データ(例えば、右側(R))を、信号減算部22−1〜22−nの第1の入力として供給するとともに、全信号加算部501に供給し、他方のチャネルの音声データ(例えば、左側(L))を、信号減算部32−1〜32−nの第1の入力として供給するとともに、全信号加算部502に供給する。
モノラル音声データをステレオ化する方法としては、例えば、ステレオ化制御部700に保持された各モノラル音声端末200の位置情報に基づいて、モノラル音声信号の振幅値と時間差とを調整することによりステレオ音声データを作成する。具体的には、ステレオ音声端末300において、あるモノラル音声端末200の音声が斜め右方向から到来するようにステレオ化する場合、右チャネルの音声信号の振幅が左チャネルの音声信号の振幅よりも大きくなるよう調整する。さらに右チャネルの音声信号の到達時間が早くなるように、左チャネルの音声信号を遅延させる。
他の方ステレオ化する方法としては、モノラル音声端末200の位置に応じて予め用意しておいた頭部伝達関数(Head Related Transfer Function, HRTF)をモノラル音声データに畳み込むことにより、ステレオ音声データを生成することもできる。ステレオ音声端末300において、スピーカから出力する場合には、左(右)のスピーカの音が右(左)耳に届くことによる影響を考慮する必要もある。この方法の詳細については、例えば、参考文献1(Surrounded by Sound, IEEE Signal Processing Magazine, January 1999,pp.55-66.)に記載されている。
全信号加算部501は、ステレオ化部15−1〜15−nから供給される全てのステレオ音声データの一方のチャネルの音声データを加算し、信号減算部22−1〜22−nの第2の入力として供給する。また、全信号加算部502は、ステレオ化部15−1〜15−nから供給される全てのステレオ音声データの一方のチャネルの音声データを加算し、信号減算部22−1〜22−nの第2の入力として供給する。
信号減算部22−1〜22−nは、各々、第2の入力として供給される全てのステレオ音声データの一方のチャネルの音声データの合計から、第1の入力として供給される、それぞれに対応するステレオ化部15−1〜15−nからの、一方のチャネルのステレオ音声データを減算し、該減算して得られた一方のチャネルの音声データ号を、それぞれ符号化部13−1〜13−nに供給する。同様に信号減算部32−1〜32−nは、各々、第2の入力として供給される全てのステレオ音声データの他方のチャネルのステレオ音声データの合計から、第1の入力として供給される、それぞれに対応するステレオ化部15−1〜15−nからの、他方のチャネルの音声データを減算し、該減算して得られた他方の音声データを、それぞれ符号化部13−1〜13−nに供給する。
符号化部13−1〜13−nは、各々、信号減算部22−1〜22−nから供給される一方のチャネルの音声データと信号減算部32−1〜32−nから供給される他方のチャネルの音声データとを符号化し、それぞれ符号したステレオ音声データを音声データ出力端子14−1〜14−nに出力する。
すなわち、音声データ出力端子14−1〜14−nには、それぞれに対応する入力端子10−1〜10−nの各々に入力されたモノラル音声データ(をステレオ化したステレオ音声データ)が減算された、他の全てのモノラル音声データ(をステレオ化したステレオ音声データ)を含むステレオ音声データが出力されることになる。
次に、上述した第2実施形態の動作について説明する。
複数のモノラル音声端末200では、マイクロフォンから入力された音声信号が、AD変換部201でデジタル化され、符号化部202で符号化され、送信部203で、伝送路400を介して、モノラル音声データとして多地点会議サーバ100に送信される。
多地点会議サーバ100では、上記複数のモノラル音声端末200からの複数のモノラル音声データが受信部101で受信される。このとき、受信部101では、音声データを受信した際に、各音声データから呼制御情報S1が取得され、信号分類部103、及び送信部105に供給される。モノラル音声データは、そのままミキシング装置104に供給される。
音声ミキシング装置104では、複数のモノラル音声データが音声データ入力端子10−1〜10−nに入力され、それぞれに対応する復号部11−1〜11−nに供給される。復号部11−1〜11−nでは、それぞれのモノラル音声データが復号され、ステレオ化部15−1〜15−nに供給される。ステレオ化部15−1〜15−nでは、入力されたモノラル音声信号がステレオ化制御部700から入力される制御情報に基づいてステレオ化される。
このとき、ステレオ化制御部700は、各モノラル音声端末200の位置情報に基づいて、モノラル音声信号の振幅値と時間差とを調整するような制御情報をステレオ化部15−1〜15−nに供給する。あるいは、音声に加えて映像も送受信するテレビ電話端末の場合には、ステレオ化制御部700は、各モノラル音声端末200の音源位置と映像の表示位置とを一致させるようにステレオ化するような制御情報をステレオ化部15−1〜15−nに供給する。
2チャネルのステレオ音声データの一方のチャネルの音声データ(例えば、右側(R))は、信号減算部22−1〜22−nの第1の入力として供給されるとともに、全信号加算部501に供給され、他方のチャネルの音声データ(例えば、左側(L))は、信号減算部32−1〜32−nの第1の入力として供給されるとともに、全信号加算部502に供給される。
全信号加算部501、502では、各々、入力された一方のチャネルの音声データが全て加算されるとともに、他方のチャネルの音声データが全て加算され、それぞれ信号減算部22−1〜22−n、32−1〜32−nの第2の入力として供給される。信号減算部22−1〜22−nでは、第2の入力として供給される、一方のチャネルの音声データの合計から、第1の入力として供給される、それぞれに対応するステレオ化部15−1〜15−nからの一方のシャネルの音声データが減算され、それぞれ符号化部13−1〜13−nに供給される。
また、信号減算部32−1〜32−nでは、第2の入力として供給される、他方のチャネルの音声データの合計から、第1の入力として供給される、それぞれに対応するステレオ化部15−1〜15−nからの他方のシャネルの音声データが減算され、それぞれ符号化部13−1〜13−nに供給される。符号化部13−1〜13−nでは、入力された一方の音声データと他方の音声データとを符号化し、ステレオ音声データとして音声データ出力端子14−1〜14−nに出力する。
複数のステレオ音声端末300では、各々、受信部306で、多地点会議サーバ100からのステレオ音声データが、伝送路400を介して受信され、復号部305で、受信部されたステレオ音声データが復号され、DA変換部304で、復号されたステレオ音声データがアナログ信号に変換され、スピーカからステレオ音声として出力される。このとき、複数のステレオ音声端末300で受信され、スピーカから出力されるステレオ音声には、複数のモノラル音声端末200や、他のステレオ音声端末300からの音声は全て含まれているが、自身から送信されたステレオ音声は含まれていない。
なお、図3に示す構成では、符号化部13−1〜13−nの全てが符号化したステレオ音声データを出力するが、ステレオ音声データに対応していないモノラル音声端末200に送信する場合には、符号化部13−1〜13−nに入力する音声データをモノラル化して、モノラル音声データを符号化して出力するようにしてもよい。
上述した第2実施形態によれば、複数のモノラル音声端末と複数のステレオ音声端末とが混在している場合であっても、それぞれの端末の音声チャネル数に対応した音声信号による多地点会議サービスを提供することができ、多地点音声会議サービスにおける利便性の向上を図ることができる。さらに、モノラル音声をステレオ化し、及び端末毎にステレオ化するパラメータを独立に設定可能とすることにより、会議における臨場感を向上させることができる。また、音声に加えて映像も送受信するテレビ電話端末の場合には、各端末の音源位置と映像の表示位置とを一致させることができる。
C.第3実施形態
次に、本発明の第3実施形態について説明する。
本第3実施形態による音声ミキシング装置は、上述した第2実施形態の音声ミキシング装置と同じであるが、さらに、モノラル音声信号のミキシングも行う点が異なる。
図4は、本発明の第3実施形態による音声ミキシング装置の構成を示すブロック図である。なお、図3に対応する部分には同一の符号を付けて説明を省略する。図4において、復号部11−1〜11−nは、復号したモノラル音声信号をステレオ化部15−1〜15−nに供給するだけでなく、全信号加算部500にも供給し、ステレオ音声データが受信できないモノラル音声端末200に対応するモノラル音声データを、信号減算部12−2の第1の入力として供給する。
全信号加算部500は、復号部11−1〜11−nから供給される、復号されたモノラル音声データを全て加算し、該加算したモノラル音声データを信号減算部12−2の第2の入力として供給する。信号減算部12−2は、第2の入力に供給される、モノラル音声データの合計から、第1の入力として供給される、対応する復号部11−2からのモノラル音声データを減算して生成したモノラル音声データを、符号化部13−2に供給する。符号化部13−2は、入力されたモノラル音声データを符号化し、音声データ出力端子14−2に出力する。
上述した本第3実施形態によれば、ステレオ音声データが受信できないモノラル音声端末に対しては、モノラル音声データをミキシングし、符号化したモノラル音声データを送信することで、ステレオ音声データが受信できないモノラル音声端末200があった場合でも、それぞれの端末の音声チャネル数に対応した音声信号による多地点会議サービスを提供することができ、多地点音声会議サービスにおける利便性の向上を図ることができる。
100 多地点サーバ
103 信号分類部
104 音声ミキシング装置
101、206、306 受信部
102、205、305 復号部
105、203、303 送信部
200 モノラル音声端末
300 ステレオ音声端末
201、301 AD変換部
202、302 符号化部
204、304 DA変換部
400 伝送路
10−1〜10−n、20−1〜20−n 音声データ入力端子
11−1〜11−n、21−1〜21−n 復号部
12−1〜12−n、22−1〜22−n、32−1〜32−n 信号減算部
13−1〜13−n、23−1〜23−n 符号化部
14−1〜14−n、24−1〜24−n 音声データ出力端子
15−1〜15−n、25−1〜25−n ステレオ化部
400〜402 グループ信号加算部
500〜502 全信号加算部
700 ステレオ化制御部

Claims (16)

  1. 多地点に設けられた複数の端末と、該複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置とからなる多地点会議システムであって、
    前記複数の端末は、
    異なる音声チャネル数の音声信号を送受信する複数の端末からなり、
    前記サーバ装置は、
    音声チャネル数毎に、前記複数の端末からの同一音声チャネル数の音声信号を加算して第1の音声信号を生成する加算手段と、
    音声チャネル数毎に、前記加算手段によって生成された同一音声チャネル数毎の前記第1の音声信号を合算して第2の音声信号を生成する合算手段と、
    前記合算手段により生成された音声チャネル数毎の第2の音声信号を、対応する音声チャネル数の音声信号を送受信する端末に前記ネットワークを介して送信する送信手段と
    を備えることを特徴とする多地点会議システム。
  2. 多地点に設けられた複数の端末と、該複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置とからなる多地点会議システムであって、
    前記複数の端末は、
    異なる音声チャネル数の音声信号を送受信する複数の端末からなり、
    前記サーバ装置は、
    前記複数の端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成する第1の加算手段と、
    前記複数の端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成する第2の加算手段と、
    前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号とを合算して、第2のモノラル音声信号を生成する第1の合算手段と、
    前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号とを合算して、第2の多チャネル音声信号を生成する第2の合算手段と、
    前記第1の合算手段により生成された前記第2のモノラル音声信号を、前記複数の端末の対応する端末に前記ネットワークを介して送信するとともに、前記第2の合算手段により生成された前記第2の多チャネル音声信号を、前記複数の端末の対応する端末に前記ネットワークを介して送信する送信手段と
    を備えることを特徴とする多地点会議システム。
  3. 多地点に設けられた複数の端末と、該複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置とからなる多地点会議システムであって、
    前記複数の端末は、
    モノラル音声信号を送受信する複数のモノラル音声端末と、
    多チャネル音声信号を送受信する複数の多チャネル音声端末とからなり、
    前記サーバ装置は、
    前記複数のモノラル音声端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成する第1の加算手段と、
    前記複数の多チャネル音声端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成する第2の加算手段と、
    前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号とを合算して、第2のモノラル音声信号を生成する第1の合算手段と、
    前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号を合算して、第2の多チャネル音声信号を生成する第2の合算手段と、
    前記第1の合算手段により生成された前記複数のモノラル音声端末毎の前記第2のモノラル音声信号を、前記複数のモノラル音声端末の対応するモノラル音声端末にネットワークを介して送信するとともに、前記第2の合算手段により生成された前記複数の多チャネル音声端末毎の第2の多チャネル音声信号を、前記複数の多チャネル音声端末の対応する多チャネル音声端末にネットワークを介して送信する送信手段と
    ことを特徴とする多地点会議システム。
  4. 前記サーバ装置は、
    前記複数のモノラル音声端末のうち少なくとも1つのモノラル音声端末からのモノラル音声信号の音声チャネル数を拡張して多チャネル音声信号を生成する音声チャネル数拡張手段を更に備え、
    前記第2の加算手段は、
    前記音声チャネル数拡張手段により音声チャネル数が拡張された多チャネル音声信号を、前記複数の多チャネル音声端末からの多チャネル音声信号と同じく処理する、
    ことを特徴とする請求項3記載の多地点会議システム。
  5. 前記サーバ装置は、
    前記音声チャネル数拡張手段による、音声チャネル数を拡張して多チャネル音声信号を生成する際のパラメータを、前記音声チャネル数が拡張されたモノラル音声信号に対応するモノラル音声端末毎に制御する音声チャネル数拡張制御手段を更に備えることを特徴とする請求項4に記載の多地点会議システム。
  6. 前記サーバ装置は、
    前記複数のモノラル音声端末から入力されるモノラル音声信号毎に、前記第1の合算手段により生成された前記第2のモノラル音声信号から、前記入力されるモノラル音声信号を差し引いて、前記複数のモノラル音声端末毎の第3のモノラル音声信号を生成する第1の減算手段と、
    前記複数の多チャネル音声端末から入力される多チャネル音声信号毎に、前記第2の合算手段により生成された前記第2の多チャネル音声信号から、前記入力される多チャネル音声信号を差し引いて、前記複数の多チャネル音声端末毎の第3の多チャネル音声信号を生成する第2の減算手段と
    を更に備え、
    前記送信手段は、
    前記第1の減算手段により生成された前記複数のモノラル音声端末毎の前記第3のモノラル音声信号を、前記複数のモノラル音声端末の対応するモノラル音声端末にネットワークを介して送信するとともに、前記第2の減算手段により生成された前記複数の多チャネル音声端末毎の前記第3の多チャネル音声信号を、前記複数の多チャネル音声端末の対応する多チャネル音声端末にネットワークを介して送信する、
    ことを特徴とする請求項3乃至5のいずれかに記載の多地点会議システム。
  7. 多地点に設けられた複数の端末間で行われる音声信号の送受信をネットワークを介して制御するサーバ装置であって、
    前記サーバ装置は、
    前記複数の端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成する第1の加算手段と、
    前記複数の音声端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成する第2の加算手段と、
    前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号を合算して、第2のモノラル音声信号を生成する第1の合算手段と、
    前記第1の加算手段によって生成された前記第1のモノラル音声信号と前記第2の加算手段によって生成された前記第1の多チャネル音声信号を合算して、第2の多チャネル音声信号を生成する第2の合算手段と、
    前記第1の合算手段により生成された前記第2のモノラル音声信号を、前記複数の端末の対応する端末にネットワークを介して送信するとともに、前記第2の合算手段により生成された前記第2の多チャネル音声信号を、前記複数の端末の対応する端末に前記ネットワークを介して送信する送信手段と
    を備えることを特徴とするサーバ装置。
  8. 前記複数の端末のうち少なくとも1つの端末からのモノラル音声信号の音声チャネル数を拡張して多チャネル音声信号を生成する音声チャネル数拡張手段を更に備え、
    前記第2の加算手段は、
    前記音声チャネル数拡張手段により音声チャネル数が拡張された多チャネル音声信号を、前記複数の端末からの多チャネル音声信号として処理する、
    ことを特徴とする請求項7記載のサーバ装置。
  9. 前記音声チャネル数拡張手段による、音声チャネル数を拡張して多チャネル音声信号を生成する際のパラメータを、前記音声チャネル数が拡張された音声信号に対応する端末毎に制御する音声チャネル数拡張制御手段を更に備えることを特徴とする請求項8記載のサーバ装置。
  10. 前記複数の端末から入力されるモノラル音声信号毎に、前記第1の合算手段により生成された前記第2のモノラル音声信号から、前記入力されるモノラル音声信号を差し引いて、前記複数の端末毎の第3のモノラル音声信号を生成する第1の減算手段と、
    前記複数の端末から入力される多チャネル音声信号毎に、前記第2の合算手段により生成された前記第2の多チャネル音声信号から、前記入力される多チャネル音声信号を差し引いて、前記複数の端末毎の第4の多チャネル音声信号を生成する第2の減算手段と
    を更に備え、
    前記送信手段は、
    前記第1の減算手段により生成された前記複数の端末毎の前記第3のモノラル音声信号を、前記複数の端末の対応する端末にネットワークを介して送信するとともに、前記第2の減算手段により生成された前記複数の端末毎の第4の多チャネル音声信号を、前記複数の端末の対応する端末にネットワークを介して送信する、
    ことを特徴とする請求項7記載のサーバ装置。
  11. 複数の端末から異なる音声チャネル数を有する複数の音声信号が入力される音声ミキシング装置であって、
    音声チャネル数毎に設けられた複数のミキシング処理部を備え、
    前記複数のミキシング処理部は、各々、
    同一音声チャネル数の音声信号を加算して第1の音声信号を生成する加算手段と、
    前記加算手段によって生成された同一音声チャネル数毎の前記第1の音声信号を合算して第2の音声信号を生成する合算手段と
    を備えることを特徴とする音声ミキシング装置。
  12. 前記複数の端末のうち少なくとも1つの端末からの音声信号の音声チャネル数を拡張して多チャネル音声信号を生成する音声チャネル数拡張手段を更に備え、
    前記第加算手段は、
    前記音声チャネル数拡張手段により音声チャネル数が拡張された多チャネル音声信号を、拡張された音声チャネル数と同一音声チャネル数の音声信号として処理する、
    ことを特徴とする請求項11記載の音声ミキシング装置。
  13. 前記音声チャネル数拡張手段による、音声チャネル数を拡張して多チャネル音声信号を生成する際のパラメータを、前記音声チャネル数が拡張された音声信号に対応する端末毎に制御する音声チャネル数拡張制御手段を更に備えることを特徴とする請求項12記載の音声ミキシング装置。
  14. 前記複数のミキシング処理部は、各々、
    前記複数の端末から入力される音声信号毎に、前記合算手段により生成された前記第1の音声信号から、前記入力される音声信号を減算して第2の音声信号を生成する減算手段を備えることを特徴とする請求項11乃至13のいずれかに記載の音声ミキシング装置。
  15. 多地点に設けられ、モノラル音声信号を送受信する複数のモノラル音声端末とステレオ音声信号を送受信する複数のステレオ音声端末との間で行われる音声信号の送受信をネットワークを介してサーバ装置により制御する多地点会議サービス提供方法であって、
    前記サーバ装置は、
    前記複数のモノラル音声端末からのモノラル音声信号を加算して第1のモノラル音声信号を生成するステップと、
    前記複数のステレオ音声端末からの多チャネル音声信号を加算して第1の多チャネル音声信号を生成するステップと、
    前記第1のモノラル音声信号と前記第1の多チャネル音声信号を合算して、第2のモノラル音声信号を生成するステップと、
    前記第1のモノラル音声信号と前記第1の多チャネル音声信号を合算して、第2の多チャネル音声信号を生成するステップと、
    前記第2のモノラル音声信号を、前記複数のモノラル音声端末の対応するモノラル音声端末にネットワークを介して送信するとともに、前記第2の多チャネル音声信号を、前記複数のステレオ音声端末の対応するステレオ音声端末にネットワークを介して送信するステップと
    を含むことを特徴とする多地点会議サービス提供方法。
  16. 前記複数のモノラル音声端末から入力されるモノラル音声信号毎に、前記第2のモノラル音声信号から、前記入力されるモノラル音声信号を差し引いて、前記複数のモノラル音声端末毎の第3のモノラル音声信号を生成するステップと、
    前記複数の端末から入力される多チャネル音声信号毎に、前記第2の多チャネル音声信号から、前記入力される多チャネル音声信号を差し引いて、前記複数の多チャネル端末毎の第3の多チャネル音声信号を生成するステップとを更に含み、
    前記送信するステップは、
    前記複数のモノラル音声端末毎の前記第3のモノラル音声信号を、前記複数のモノラル音声端末の対応するモノラル音声端末にネットワークを介して送信するとともに、前記複数の多チャネル音声端末毎の第4の多チャネル音声信号を、前記複数の多チャネル音声端末の対応する多チャネル音声端末にネットワークを介して送信する、
    ことを特徴とする請求項15記載の多地点会議サービス提供方法。
JP2009008126A 2009-01-16 2009-01-16 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法 Pending JP2010166424A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009008126A JP2010166424A (ja) 2009-01-16 2009-01-16 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009008126A JP2010166424A (ja) 2009-01-16 2009-01-16 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法

Publications (1)

Publication Number Publication Date
JP2010166424A true JP2010166424A (ja) 2010-07-29

Family

ID=42582224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009008126A Pending JP2010166424A (ja) 2009-01-16 2009-01-16 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法

Country Status (1)

Country Link
JP (1) JP2010166424A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108270935A (zh) * 2016-12-30 2018-07-10 展讯通信(上海)有限公司 会议电话装置
CN113330514A (zh) * 2019-01-17 2021-08-31 日本电信电话株式会社 多点控制方法、装置及程序

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0440146A (ja) * 1990-06-06 1992-02-10 Fujitsu Ltd 音声会議装置
JPH04369152A (ja) * 1991-06-18 1992-12-21 Hitachi Ltd 会議電話サービスの通話方式
JPH0974446A (ja) * 1995-03-01 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 音声通信制御装置
JPH1168977A (ja) * 1997-08-20 1999-03-09 Casio Comput Co Ltd 通話システム及び通話サーバ装置
JP2002058005A (ja) * 2000-06-02 2002-02-22 Canon Inc テレビ会議・テレビ電話システム、送信装置、受信装置、画像通信システム、通信装置、通信方法、記録媒体、プログラム
JP2006072269A (ja) * 2004-09-06 2006-03-16 Matsushita Electric Ind Co Ltd 音声符号化装置、通信端末装置、基地局装置および音声符号化方法
JP2006237864A (ja) * 2005-02-23 2006-09-07 Yamaha Corp 複数話者の音声信号を処理する端末装置、サーバ装置およびプログラム
WO2008026754A1 (fr) * 2006-08-30 2008-03-06 Nec Corporation Procédé de mixage vocal, serveur de conférence multipoint utilisant le procédé et programme

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0440146A (ja) * 1990-06-06 1992-02-10 Fujitsu Ltd 音声会議装置
JPH04369152A (ja) * 1991-06-18 1992-12-21 Hitachi Ltd 会議電話サービスの通話方式
JPH0974446A (ja) * 1995-03-01 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 音声通信制御装置
JPH1168977A (ja) * 1997-08-20 1999-03-09 Casio Comput Co Ltd 通話システム及び通話サーバ装置
JP2002058005A (ja) * 2000-06-02 2002-02-22 Canon Inc テレビ会議・テレビ電話システム、送信装置、受信装置、画像通信システム、通信装置、通信方法、記録媒体、プログラム
JP2006072269A (ja) * 2004-09-06 2006-03-16 Matsushita Electric Ind Co Ltd 音声符号化装置、通信端末装置、基地局装置および音声符号化方法
JP2006237864A (ja) * 2005-02-23 2006-09-07 Yamaha Corp 複数話者の音声信号を処理する端末装置、サーバ装置およびプログラム
WO2008026754A1 (fr) * 2006-08-30 2008-03-06 Nec Corporation Procédé de mixage vocal, serveur de conférence multipoint utilisant le procédé et programme

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108270935A (zh) * 2016-12-30 2018-07-10 展讯通信(上海)有限公司 会议电话装置
CN113330514A (zh) * 2019-01-17 2021-08-31 日本电信电话株式会社 多点控制方法、装置及程序
CN113330514B (zh) * 2019-01-17 2024-03-22 日本电信电话株式会社 多点控制方法、多点电话连接系统及记录介质

Similar Documents

Publication Publication Date Title
CN113273153B (zh) 会议环境中用于分布式呼叫处理及音频增强的系统及方法
US7245710B1 (en) Teleconferencing system
EP3512186B1 (en) Conference audio management
US6850496B1 (en) Virtual conference room for voice conferencing
US6973184B1 (en) System and method for stereo conferencing over low-bandwidth links
US8600530B2 (en) Method for determining an audio data spatial encoding mode
US7903828B2 (en) Remote multipoint architecture for full-duplex audio
KR20090098993A (ko) 분산형 원격회의 멀티채널 구조, 시스템, 방법, 및 컴퓨터 프로그램 제품
JP2001516890A (ja) 音声処理装置
US20060079271A1 (en) Stereo terminal and method for voice calling using the stereo terminal
JPWO2008069160A1 (ja) Pttサーバ、ptt通信システム、ptt通信方法、及びプログラム
JP2010166425A (ja) 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
JP4804014B2 (ja) 音声会議装置
JP2010166424A (ja) 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
JPH0974446A (ja) 音声通信制御装置
US8526589B2 (en) Multi-channel telephony
JPH01241959A (ja) 多地点間通信方式
Rothbucher et al. Backwards compatible 3d audio conference server using hrtf synthesis and sip
JP2006237841A (ja) 音声会議システム及び話者特定用処理装置
CN113330514B (zh) 多点控制方法、多点电话连接系统及记录介质
US11973900B2 (en) Multipoint control method, apparatus and program
US11949817B2 (en) Multipoint control method, apparatus and program
US11810581B2 (en) Multipoint control method, apparatus and program
US11837241B2 (en) Encoding and decoding method, decoding method, apparatuses therefor and program
JP2009272764A (ja) 通信システム及び呼制御装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Effective date: 20100716

Free format text: JAPANESE INTERMEDIATE CODE: A7424

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130131

A131 Notification of reasons for refusal

Effective date: 20130205

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Effective date: 20130404

Free format text: JAPANESE INTERMEDIATE CODE: A523

A02 Decision of refusal

Effective date: 20130521

Free format text: JAPANESE INTERMEDIATE CODE: A02