JP2005045737A - 通話装置及び通話方法、並びに通話システム - Google Patents

通話装置及び通話方法、並びに通話システム Download PDF

Info

Publication number
JP2005045737A
JP2005045737A JP2003280429A JP2003280429A JP2005045737A JP 2005045737 A JP2005045737 A JP 2005045737A JP 2003280429 A JP2003280429 A JP 2003280429A JP 2003280429 A JP2003280429 A JP 2003280429A JP 2005045737 A JP2005045737 A JP 2005045737A
Authority
JP
Japan
Prior art keywords
sound
gain
output
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003280429A
Other languages
English (en)
Inventor
Akihiro Hokimoto
晃弘 保木本
Tadayuki Hattori
忠幸 服部
Satoru Kawabata
哲 川畑
Yoshiyuki Kunito
義之 國頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2003280429A priority Critical patent/JP2005045737A/ja
Publication of JP2005045737A publication Critical patent/JP2005045737A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

【課題】 BGM等の音量レベルを通話相手が制御する技術は想定されていなかった。
【解決手段】 BGM受信側端末は、ユーザからの入力に基づきRTCPアプリケーション固有情報に変更した音量、例えば音量を下げる場合には、現在の音量と、音量の変更量としてマイナスの値を付加し、受信者情報として送信側に送る。送信側は、RTCPパケットから音量の変更量を取りだし、ゲイン調整部21の係数k3を下げる。
【選択図】 図2

Description

本発明は高い音質環境下での通話を可能とする例えばインターネットのようなネットワークを用いた通話装置及び通話方法に関し、通話音声の他にバックグランドミュージック(Back ground music:BGM)或いは効果音(Sound effect:SE)を送受信する通話装置及び通話方法、並びに通話システムに関する。
本件出願人は、特開2000−49948号公報にて、電話会議システム等の通話装置において、会話の中心となる相手の話の聞き分けを容易にし、使い勝手をよくするための技術を開示した。この技術は、通話中の各人の音声の重なりを判定し、音声の重なりに応じて通話中の各人の音声のレベルを調整するという構成である。
また、本件出願人は、特開2002−344571号公報にて、音楽を聴きながら通話を行うことができるようにし、より楽しく通話を楽しむことができる通話装置及び通話方法等に関する技術を開示した。この通話装置は、BGMとして用いる音楽コンテンツデータを記憶手段に記憶しており、相手と通話する通話手段により通話が行われているとき、再生手段により記憶手段から音楽コンテンツを再生する。このとき、制御手段により、相手からの音声とコンテンツの再生音の両方が聞こえるように制御している。また、通話手段は、コンテンツの再生音を相手側にも送信する。なお、通話中にあってBGMとして用いる音楽の再生レベルは、予め設定されている所定のレベルに低下させる。この技術により、ユーザは、通話しつつ、音楽をBGMとして楽しむことが可能となる。
また、本件出願人は、特開平7−143221号公報にて、保留音として用いる複数の音楽コンテンツを外部から電話回線を介して取り込み、識別データに対応付けて光磁気ディスクに記録し、識別データに基づいたユーザの選択等に応じて保留音として再生することができる電話装置に関する技術を開示した。
特開2000−49948号公報 特開2002−344571号公報 特開平7−143221号公報
ところで、前記特許文献1に開示された技術では、前記特許文献2や特許文献3で使用されるBGM等の音量レベルを通話相手が制御する技術は想定されていなかった。
もちろん、通話音とBGM等の音量レベルを別々に調節する技術も未だ開示されてはいなかった。
本発明に係る通話装置は、前記課題を解決するために、ネットワークを介して音声による対話のための双方向通信を行う通話装置において、送信系として、収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整手段と、音のデータをファイル単位で記憶している音データ記憶手段と、前記音データ記憶手段から読み出したファイル単位の音データをデコードするデコード手段と、前記デコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整手段と、前記第1のゲイン調整手段からの第1の出力と前記第2のゲイン調整手段からの第2の出力とを合成する合成手段と、前記合成手段の合成出力をエンコードするエンコード手段と、前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信手段とを備え、受信系として、前記ネットワークを介して他の通話装置の送信手段から送信されてきたエンコード出力を受信する受信手段と、前記受信手段で受信されたエンコードデータをデコードするデコード手段と、前記デコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整手段と、前記第3のゲイン調整手段からの出力を音に変換して出力する音出力手段とを備え、さらに、送信側にて設定されて送信されてきた前記合成出力に含まれる音の音量調節を制御する制御手段とを備える。
RTPの受信側より、RTCPを用いてBGMの音量制御やBGM拒否の情報を送信側に通知する。通知された送信側は、その情報を基にBGMの音量調節やBGMのミキシングをやめる。
本発明の通話装置によれば、送信側の利用者だけでなく、受信側の利用者からも好みに合わせて、BGMの音量を適切に制御できるようになる。
本発明の通話方法によれば、送信側の利用者だけでなく、受信側の利用者からも好みに合わせて、BGMの音量を適切に制御できるようになる。
本発明の通話システムによれば、送信側の利用者だけでなく、受信側の利用者からも好みに合わせて、BGMの音量を適切に制御できるようになる。
以下、本発明を実施するための最良の形態としてボイス・オーバー・アイピー(Voice over IP:VoIP)と呼ばれるインターネット電話のプロトコルに従ったVoIP通話システムに用いられるVoIPクライアントを挙げる。
VoIPクライアントを詳細に説明する前に、先ず、VoIP通話システム1の概略について説明する。このVoIP通話システムは、VoIPクライアント間の通話音声の他にバックグランドミュージック(Back ground music:BGM)或いは効果音(Sound effect:SE)を送受信する。
図1に示すように、VoIPクライアント(Client)2は、例えば公衆回線等3によりインターネット4に接続され、同じくインターネット4に接続されている他のVoIPクライアント5と音声による対話のための双方向の通信を行う。インターネット4には、VoIPサーバ(Server)6も接続されており、VoIPに基づいた通信の制御等を行う。なお、このVoIP通話システム1では、VoIPクライアント2とVoIPクライアント5の二者間の通話を例に挙げるが、VoIPクライアントは二つに限らず、よって通話システムへの参加者は2以上であることはもちろんである。
インターネット4は、一般公衆回線などの通信回線や、情報通信ネットワークを複数接続することによって世界中に拡がったネットワーク環境である。現在、広帯域、高速な通信回線の普及によってブロードバンド伝送(Broadband Transmission)を可能としている。光ファイバー、非対称ディジタル加入者線、無線等を用い、500kbps以上の通信回線でネットワークを構成している。
VoIPサーバ6は、VoIP通話システム1にあって契約者のIPアドレスの管理や、認証、あるいは通信の制御を行う。ワークステーションのようなコンピュータより構成されている。もちろん、課金処理のためのサーバや、契約者のIPアドレス他管理情報を処理するサーバを別に設けてもよい。
VoIPクライアント2は、マイクロフォンとスピーカ、又はマイクロフォン7aとヘッドフォン7bとをセットにしてなり使用者が装着するヘッドセット7を接続した例えばパーソナルコンピュータ(Personal computer:PC)である。PCがソフトウェアで実現されるVoIPクライアントプログラム2aを実行することによりVoIPクライアント2になる。なお、以下では、VoIPクライアント2がVoIPクライアント5に電話をかける場合、つまりVoIPクライアント2が始めに送信し、VoIPクライアント5が受信するという状況を想定する。もちろん、VoIPクライアント5も、VoIPクライアントプログラム5aを実行するPCよりなり、始めに送信側となるときには本発明に基づいて同様の動作を行う。
送信側であるVoIPクライアント2は、VoIP通話中に背景音として例えば数分間単位の連続した時間継続する音である音楽(Back ground music:BGM)等や、例えば数秒間単位の効果音(Sound effect:SE)を通話音声にミキシングすることができる。
また、受信側であるVoIpクライアント5は、通話中において、送信側にて設定されて送信されてきたBGMの拒否や音量調節を制御することができる。
以下、VoIPクライアント2が背景音や効果音の音量レベルを個別に調整できる構成及び動作、またVoIPクライアント5が通話中において、送信側にて設定されて送信されてきたBGMの拒否や音量調節を制御する構成及び動作について図2を参照して説明する。VoIPクライアント2,5は、VoIPクライアントプログラム2a,5aを実行することにより、送信系、受信系がそれぞれ機能的に以下に説明するように構成される。先ず、送信系10にあって、マイクロフォン7aにて収音されて電気信号に変換されたユーザの音声に基づく電気信号はマイクキャプチャー部11にて取り込まれる。マイクキャプチャー部11が取り込んだ音声に基づく電気信号には、ユーザが設定するマイク音量レベルであるゲイン係数k1がゲイン調整部12により乗算される。このゲイン調整部12の乗算出力は、加算部13に供給される。
また、VoIPクライアント2は、例えば、マシンガンの銃声、雷鳴、拍手音、笑い声など、数秒間単位の効果音を例えばPCMデータにしてからそれぞれMP3(MPEG-1 Audio Layer-III)や、MPEG4、あるいはATRAC(Adaptive Transform Acoustic Coding)等の圧縮技術により予め圧縮し、ファイル単位のSEデータとしてSEファイル記憶部14に複数ファイル分記憶している。SEファイル記憶部14としては、後述するようなハードディスクドライブ(HDD)や、ROM、光磁気ディスクが挙げられる。
また、VoIPクライアント2は、例えば、波の音、小鳥のさえずり、或いは様々なジャンルの音楽などよりなる、数分間単位の背景音を例えばPCMデータにしてからそれぞれMP3や、MPEG4、あるいはATRAC等の圧縮技術により予め圧縮し、ファイル単位のBGMデータとしてBGMファイル記憶部15に複数ファイル分記憶している。
SEファイル記憶部14に記憶されているSEファイルは、使用者の所望によって選択されるとSEファイル読み出し部16によって図示しないRAMに読み出されながらデコード部17にてデコードされてPCMデータとなる。デコード部17のデコード出力(PCMデータ)には、ユーザが設定するSE音量レベルであるゲイン係数k2がゲイン調整部18により乗算される。このゲイン調整部18の乗算出力は、加算部13に供給される。
BGMファイル記憶部15に記憶されているBGMファイルも、使用者の所望によって選択されるとBGMファイル読み出し部17によって図示しないRAMに読み出されながらデコード部20にてデコードされてPCMデータとなる。デコード部20のデコード出力には、ユーザが設定するBGM音量レベルであるゲイン係数k3がゲイン調整部21により乗算される。このゲイン調整部21の乗算出力は、加算部13に供給される。加算部13は、3つのゲイン調整部12、18、21の乗算出力を飽和処理をしつつ加算し、加算出力をエンコード部22に供給する。
エンコード部22は、加算部13の加算出力(PCMデータ)をMP3や、MPEG4、あるいはATRAC等の圧縮技術により数十kbps、例えば64kbpsに圧縮する。このエンコード部22が行う、MP3や、MPEG4、あるいはATRAC等の圧縮技術は、CDで採用されているPCMオーディオデータ等に対して施される高能率の音響圧縮符号化復号化技術である。よって、パケット化されてからインターネットを介して伝送され、受信側にて再生されたオーディオは、ステレオ2チャンネル化が可能であり、また高音質である。
この圧縮データは、リアルタイム・トランスポート・プロトコル(Real-time Transport Protocol:RTP)に従ってデータをパケット化するRTPパケット化(packetize)部23に供給される。RTPパケット化部23は、前記圧縮データをRTPのパケットに入れ、さらにUDP、IPとパケッタイズする。RTPに従ったパケット化については詳細を後述する。パケット化されたパケットデータは送信処理部24からインターネットに送られる。
受信系30にあって、インターネット4を介して他のVoIPクライアント5から送信されてきたパケットデータは受信処理部31によって受信される。受信処理部31で受信されたパケット化データは、RTPデパケット化(depacketize)部32にて解かれる。デジッタ(de-jitter)部33は、RTPデパケット化部32にてIP、UDPから解かれたRTPのタイムスタンプ、シーケンシャルナンバーを基に到着時間の補正を行う。
パケット補償(packet loss compensator)部34は前記RTPのタイムスタンプ、シーケンシャルナンバーを基にパケット損失の補償を行い、補償データをデコード部35に送る。デコード部35は、到着時間の補正、パケットロスの補償が行われた圧縮データをPCMデータにデコードし、PCMデータをゲイン調整部36に送る。ゲイン調整部36は、前記PCMデータに使用者が設定する再生音量レベルであるゲイン係数k5を乗算する。このゲイン調整部36の乗算出力は加算部37に送られる。また、送信される音声を通話相手と共有するため、ゲイン調整部38において送信音声データに使用者が設定するループバック音量レベルであるゲイン係数k4を乗算する。ゲイン調整部38の乗算出力も加算部37に供給される。
さらに、このVoIPクライアント2は、着信音(Ring Tone)を例えばPCMデータにしてからそれぞれMP3や、MPEG4、あるいはATRAC等の圧縮技術により予め圧縮し、ファイル単位の着信音データとして着信音ファイル記憶部39に複数ファイル分記憶している。
着信音ファイル記憶部39からの着信音ファイルは、使用者の所望によって予め選択されており、着信のタイミングに従ってリングトーン読み出し部40によって図示しないRAMに読み出され、デコード部41にてPCMデータにデコードされる。デコード部41のデコード出力は、ゲイン調整部42及びゲイン調整部43に供給される。ゲイン調整部42は、使用者が設定するヘッドフォン着信音量レベルであるゲイン係数k6をリングトーンのデコード出力(PCMデータ)に乗算して加算部37に供給する。加算部37は、ゲイン調整部36の乗算出力である通話音声と背景音等のミキシング出力(PCMデータ)にゲイン調整部38の乗算出力である自分の通話音のPCMデータとを加算し、加算出力をヘッドフォン再生部44に供給する。ヘッドフォン再生部44は、前記加算出力をアナログ信号に変換してから増幅し、ヘッドフォン7bに供給する。ヘッドフォン7bは、使用者の耳に前記ミキシング出力を発音する。
また、加算部37は、他のVoIPクライアント5からの電話がかかってきたタイミングにて、リングトーンファイル読み出し部40が読み出したリングトーンファイルのデコード出力(PCMデータ)に使用者が設定したヘッドフォン着信音量レベルであるゲイン係数k6の乗算されたデータを、ヘッドフォン再生部44に供給する。ヘッドフォン再生部44は、前記ゲイン係数k6の乗算されたリングトーンデータをアナログ信号に変換してからヘッドフォン7bに供給する。よって、ヘッドフォン7bは他のVoIPクライアント5からの電話がかかってきたタイミングで、使用者が設定したヘッドフォン着信音量レベルの着信音を使用者の耳に発音する。
ゲイン調整部43は、デコード部41からのデコード出力であるリングトーンのPCMデータに使用者の設定するスピーカ着信音音量レベルであるゲイン係数k7を乗算し、スピーカ再生部45に供給する。スピーカ再生部45は、前記乗算出力をアナログ信号に変換してから増幅しスピーカ46に供給する。スピーカ46は、使用者がスピーカ用に設定したスピーカ着信音音量レベルの着信音を発音する。
次に、RTPに基づいたパケット化及びデパケット化について説明しておく。RTPは、インターネット等のIPネットワークにおいて、リアルタイムに音声や動画を送信/受信するトランスポートプロトコルである。RFC1889で勧告されている。RTPは、トランスポート層に位置し、一般にユーザ・データグラム・プトロコル(User Datagram Protocol:UDP)上でリアルタイム・コントロール・プトロコル(Real-time Control Protcol)とともに用いられる。
RTPパケットは、図3に示すように、IPヘッダ、UDPヘッダ、RTPヘッダ及びRTPデータからなる。RTPヘッダには、バージョン情報(Verasion:V)、パディング(Padding:P)、拡張ヘッダ(extension:X)の有無、送信元(Contoributing source:CRSC)数、マーカ情報(Marker:M)、ペイロードタイプ(Payload Type:PT)、シーケンス番号(Sequence Number)、RTPタイムスタンプ、同期送信元(Sychronization Source:SSRC)識別子、及び寄与送信元(Contoributeing source:CRSC)識別子を格納する各フィールドが設けられている。
図2におけるRTPパケット化部23は、エンコード部22の出力である圧縮データを、前述したRTPに従ってパケット化する。圧縮データそのものは図3に示すRTPデータ部分に含まれる。このRTPパケットを送信処理部24からインターネット4を介して他のVoIPクライアント(例えば図1のVoIPクライアント5)に送る。
他のVoIPクライアント5の受信系30では、受信処理部31により前記RTPパケットを受信する。ここでは、他のVoIPクライアント5の動作になるが、図2を用いて説明する。RTPデパケット化部32は、RTPヘッダとRTPデータをIPヘッダ、UDPヘッダから分離する。RTPヘッダに格納されているシーケンス番号及びタイプスタンプをデジッタ部33に送る。
デジッタ部33は、前記シーケンス番号及びタイプスタンプを基に到着時刻の不均等を補正する。RTPパケットは、他のデータが伝送されているインターネットによって送信されてくるので、伝送が込んでいるときの影響を受けたりし、その到着時刻は等間隔ではない。時間軸上で詰まったり、伸びたりして、通信間隔が不均等になることがある。そこで、デジッタ部33は、前記シーケンス番号及びタイプスタンプを基に補正し、等間隔とする。
また、パケット補償部34は、前記シーケンス番号及びタイプスタンプを基にパケットの損失を補正する。RTPパケットは、インターネットによって送受信されるので、パケットが欠落したり、受信不能になることがある。そこで、パケット補償部34は、欠落したパケットの代わりにその前又は後ろのパケットと同じパケットを使用したり、欠落したデータを0にする等してパケットの損失を補償する。
そして、デコード部35は、到着時刻が補正され、パケット損失が補償された前記通話音と背景音等のミキシングデータをデコードし、PCMデータにする。
このような機能構成のVoIPクライアント2にあって、特徴的となるのは、通話音はもちろん、背景音の音量レベルも個別に調整することができることである。
通話音の音量レベルの調整は、ゲイン調整部12にて音声データにユーザが設定するマイク音量レベルであるゲイン係数k1を乗算することによって行われる。また、効果音又はBGMの音量レベルの調整は、ゲイン調整部18、又はゲイン調整部21にて各オーディオデータにユーザが設定するSE音量レベルであるゲイン係数k2、又はBGM音量レベルであるゲイン係数k3を乗算することによって行われる。
各ゲイン調整部12、ゲイン調整部18、ゲイン調整部21にて音量レベルが調整された後の、通話音データ、効果音又はBGMのオーディオデータは加算部13にて合成され、エンコード部22にてエンコードされた後、RTPパケット化部23にてパケット化され、送信処理部24から通話相手の他のVoIPクライアント5に送信される。
通話相手のVoIPクライアント5は、インターネット4を介して伝送されてきたRTPパケットを受信処理部31にて受信し、RTPデパケット化部32によりデパケット化し、デジッタ部33により到着時刻の間隔を補正し、パケット補償部34によりパケット損失を補償した後、デコード部35にてPCMデータにデコードする。デコードされた後のオーディオデータ(PCMデータ)には、受信側使用者により、音量レベルであるゲイン係数k5がゲイン調整部36により乗算されて、送信者からの通話音を、BGM又はSEとミキシングした状態でヘッドフォン44により聞くことができる。
また、このVoIPクライアント2,5は、通話中において、送信側にて設定されて送信されてきたBGMの拒否や音量調節を制御するために、図2に示すように、BGMゲイン制御信号に応じてゲイン調整部21の係数k3を制御するとともに前記制御信号に基づいたゲインパラメータを生成するゲインコントローラ120と、このゲインコントローラ120から供給されたゲインパラメータを後述するRTCP(Real-time Transport Control Protocol)パケット内に格納するためのアプリケーション固有情報とするRTCP処理部121と、このRTCP処理部121からのアプリケーション固有情報をRTCPパケット内に格納し、送信処理部24に供給するRTCPパケット化部122とを備える。
また、このVoIPクライアント2,5は、受信処理部31にて送信側の他のVoIPクライアントから送られてきたRTCPパケットをデパケット化し、アプリケーション固有情報を取り出してRTCP処理部121に供給するするRTCPデパケット化部123を備える。RTCP処理部121は、アプリケーション固有情報からゲインパラメータを取りだしゲインコントローラ120に供給する。
RTCPは、RTPが音声・動画像データそのものを送信/受信するプトロコルであるのに対し、周期的に、パケットロス、遅延ジッタ、ラウンドトリップ等の回線品質を評価し、その帯域に見合ったリアルタイム通信を実現するための情報を送信/受信するプロトコルである。
このRTCPを用いることにより、相手からフィードバックされている情報により、ネットワークの状態などを推測して送信レートを変更するなどの動的な処理を行うことができる。また、今誰がデータを送信していて、誰が受信しているかを示す情報もRTCPパケットで同時に送っているので、今現在の通話者の情報を知ることもできる。
RTCPパケットは、図4に示すように、IPヘッダ、UDPヘッダ、RTCPヘッダ及びRTCPデータからなる。RTCPヘッダには、バージョン情報(Verasion:V)、パディング(Padding:P)、サブタイプ(subtype)、パケットタイプ(PcketType)、レングス(Length)情報、SSRC/CSRC識別子、アスキー(ASCII)で記述されるNameが記述されている。さらに、この後に、アプリケーション固有の情報が付加される。
このVoIPクライアント2,5にあっては、アプリケーション固有の情報には、BGM音量制御のために、最大音量、現在の音量、音量の変更量(プラスの値:音量大、マイナスの値:音量小)がゲインパラメータに基づいて記述されている。
以上に説明したRTPパケット、RTCPパケットを用いたVoIPクライアント2とVoIPクライアント5間のBGM送受信動作について図5、図6を参照して説明する。ここでは、VoIPクライアント2をBGM送信側端末、VoIPクライアント5をBGM受信側端末とする。
先ず、通常の動作は、図5に示すように、BGM送信側端末において、図2のRTCP処理部121、RTCPパケット化部122がRTCP処理を行い、送信者情報をRTCPパケットにして送信処理部24からBGM受信側端末に送る。そして、図2のRTPパケット化部23がRTP処理を行い、エンコードされたBGMをRTPパケットにして送信する。RTPパケットは、複数個任意の時間間隔で送信される。BGM受信側端末は、受信したRTCPパケットに記述されているウォールクロックタイム(Wall Clock Time)を用いて送信端末のクロック速度を推定する。この推定したクロック速度を用いてパケットから取り出されたRTPデータを繋ぎ合わせながら前記デジッタ処理や、パケット補償処理を行い、デコードしてゲイン調整部36に渡す。また、受信したパケットからパケットの破棄率や、ジッタを計算し、受信側RTCPで送信する。送信側では、前記受信側RTCPから前記パケットの破棄率や、ジッタ情報を取りだし、次のRTPパケット送信の制御に用いる。
次に、受信側がBGMの音量を制御する処理について図6を参照して説明する。BGM送信側端末から図2のRTCP処理部121、RTCPパケット化部122がRTCP処理を行い、BGMの音量情報をRTCPアプリケーション固有情報として付加した送信者情報をRTCPパケットにして送信処理部24からBGM受信側端末に送る。そして、図2のRTPパケット化部23がRTP処理を行い、エンコードされたBGMをRTPパケットにして送信する。RTPパケットは、複数個任意の時間間隔で送信される。BGM受信側端末は、ユーザからの入力に基づきRTCPアプリケーション固有情報に変更した音量、例えば音量を下げる場合には、現在の音量と、音量の変更量としてマイナスの値を付加し、受信者情報として送信側に送る。送信側は、前記RTCPパケットから音量の変更量を取りだし、ゲイン調整部21の係数k3を下げる。
このように、RTPの受信側より得られるRTCPにユーザ操作に基づいてBGMの音量制御やBGM拒否の情報をアプリケーション固有情報内に入れ、送信側に通知する。通知された送信側は、その情報を基に、ゲイン調整部18,あるいはゲイン調整部21の係数k2、k3を制御し、BGMの音量やSEの音量を制御したり、BGM、SEのミキシングを停止する制御を行うことができる。
このVoIPクライアント2は、次の図7に示す開放型システム間相互接続(Open System Interconnection:OSI)のアーキテクチャに基づく各階層のプロトコルに応じたソフトウェアモジュールを実行することにより前記図2に示した機能を達成する。
図7において下位層から上位層に向かって各階層を説明する。先ず、物理層としての機能にはユニバーサル・シリアル・バス(Universal Serial Bus:USB)カメラドライバー、USBオーディオドライバ及び各種ドライバがある。カメラドライバからのビデオデータやオーディオドライバからのオーディオデータの伝送条件の物理的条件を合わせるレイヤである。次に、データリンク層としての機能には、オペレーティングシステム(Operating System:OS)がある。隣接ノード間の誤りのないデータ転送を実行するためのものである。
ネットワーク層としての機能には、インターネットプロトコル(Internet Protocol:IP)がある。ネットワーク層は、データ送受信に使用する通信経路を選択し、フロー制御・品質制御などの通信制御を行うところである。信頼性を追求しないコネクションレス(Conectionless)パケット転送プロトコルであるIPは、信頼性保証機能、フロー制御機能、エラー回復機能を上位階層(トランスポート層とアプリケーション層)に任せている。
トランスポート層としての機能には、トランスポート・コントロール・プロトコル(Transport Control Protocol)/ユーザ・データグラム・プロトコル(User Datagram Protocol)がある。トランスポート層では、IPアドレスを使用してエンド・ツー・エンドの伝送を行う。ネットワークの種類に依存せず、要求される品質クラスに従ってフロー制御や順序制御を行う。TCPは信頼性保証機能を持ち、転送したデータの各バイトにシーケンス番号を付け、受信側から受け取り通知(ACK)が送られてこなければデータを再送する。UDPは、アプリケーション間のデータグラムの送信機能を提供する。IPネットワークを用いて、音声・動画像をストリーミング再生する場合、一般にエラー時に再送を行うTCPのようなトランスポートプロトコルは使用できない。また、TCPは、1対1通信用のプロトコルであり、複数の相手に情報を送信することができない。そこで、このような用途には、UDPが用いられる。
UDPは、アプリケーションのプロセスがリモートマシン上の他のアプリケーションのプロセスへデータを転送することを、最小のオーバーヘッドで行えるように設計されている。そのため、UDPのヘッダに入る情報は、送信元ポート番号、宛先ポート番号、データ長、チェックサムのみであり、TCPにあるパケットの順序を表す番号を入れるフィールドがないので、ネットワーク上で異なる経路を介して伝送されるなどによりパケットの順序が入れ替わってしまった場合に、その順序を正しい状態に戻す処理を行うことができない。また、送信時のタイムスタンプ等の時間情報を入れるフィールドは、TCPにもUDPにもない。
セッション層としての機能には、セッション・イニシエーション・プロトコル(Session Initiation Protocol:SIP)と、本発明の要部となる前記通話音とBGM又はSEの合成処理ソフトウェアに必要とされるモジュールがある。保留音発生とBGM合成と着信音発生とコーデック(codec)とRTPである。セッション層は、情報の転送制御を行う。アプリケーション間における対話モードを管理して会話単位の制御を行う。SIPは、IPネットワーク上でマルチメディアセッションを確立・変更・終了するための、アプリケーション層のシグナリングプロトコルである。RFC3261で標準化されている。
プレゼンテーション層としての機能には、VoIP通話制御がある。プレゼンテーション層では、アプリケーションで送受信する情報の表現形式を管理して、データの変換や暗号化を行う。
アプリケーション層としての機能には、グラフィカルユーザインターフェース(Graphical User Interface:GUI)がある。アプリケーション層では、ユーザプログラムで使用する通信機能の外部仕様を管理して、それに基づく情報のやり取りを行う。
次に、実際に前記ソフトウェアモジュールを実行するVoIPクライアント2のハードウェア構成を説明する。図8はVoIPクライアント2の構成を表している。図8において、CPU(Central Processing Unit)51は、ROM(Read Only Memory)52に記憶されている前記ソフトウェアモジュールを構成する各種プログラム、または記憶部58からRAM(Random Access Memory)53にロードされた前記ソフトウェアモジュールを構成する各種プログラムに従って各種の処理を実行する。RAM53にはまた、CPU51が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU51,ROM52及びRAM53は、バス54を介して相互に接続されている。このバス54にはまた、入出力インターフェース55も接続されている。入出力インタフェース55には、キーボード、マウスなどよりなる入力部56、CRT、LCDなどよりなるディスプレイ、並びに、ヘッドフォンやスピーカなどよりなる出力部57、ハードディスクなどより構成される記憶部58、モデム、ターミナルアダプタなどより構成される通信部59が接続されている。ヘッドセット7のマイクロフォン7aは入力部56に含まれる。また、ヘッドフォン7bは出力部57に含まれる。
通信部59は、インターネット4を介しての通信処理を行う。CPU51から提供されたデータを送信する。また通信部59は通信相手から受信したデータをCPU51、RAM53、記憶部58に出力する。記憶部58はCPU51との間でやり取りし、情報の保存・消去を行う。通信部59はまた、他のクライアントとの間で、アナログ信号またはデジタル信号の通信処理を行う。
入出力インタフェース55にはまた、必要に応じてドライブ60が接続され、磁気ディスク61、光ディスク62、光磁気ディスク63、或いは半導体メモリ64などが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部58にインストールされる。
なお、記憶部58は例えばHDDであり、図2に示したSEファイル記憶部14、BGMファイル記憶部15、着信音ファイル記憶部39を構成する。
以上のハードウェア構成は、VoIPクライアント2及び5の構成を示すとともに、VoIPサーバ6や、後述のWebサーバの構成を示すものでもある。
次に、出力部57を構成するディスプレイに表示されるGUI(Graphical Use Interface)について図9を参照して説明する。このGUIは、VoIPクライアントのアプリケーション層に属する。PCをユーザが視覚的に操作するためのインターフェースであり、ユーザの手入力情報をハンドリングする。送信側のVoIPクライアントはもちろん、受信側のVoIPクライアントにも表示される。このGUIは、上部から下部に向かって、アプリケーション制御部71、情報表示部72、ダイヤル部73、ヘッドセットボリューム部74、スピーカボリューム部75、効果音(SE)選択表示部76、SE制御部77、BGM選択表示部78、BGM制御部79を備えている。
アプリケーション制御部71は、VoIPクライアントアプリケーションの終了処理を行う。情報表示部72は、ダイヤル番号、相手情報(話中等)を表示する。ダイヤル部73は、VoIP相手先をダイヤルするテンキーである。ヘッドセットボリューム部74は、ヘッドセット7のヘッドフォン7bから出力される音量を調節するためのものである。使用者がマウスを用いてスライダ74aを左右に移動することにより、ゲイン調整部36におけるゲイン係数k5を設定することになる。また、ヘッドフォン7bから出力される着信音の音量を調節するために用いてもよい。この場合には、使用者がマウスを用いてスライダ74aを左右に移動することにより、ゲイン調整部42におけるゲイン係数k6を設定することになる。
スピーカボリューム部75は、スピーカ46から出力される着信音のボリュームを調整するためのものである。使用者がマウスを用いてスライダ75aを左右に移動することにより、ゲイン調整部43におけるゲイン係数k7を設定することになる。
SE選択表示部76は、ユーザに選択させる使用可能なSE音源データファイル(SEファイル記憶部14に記憶されているSEファイル)を表示するものであり、例えば銃声音、雷音、拍手の音、歓声等の効果音を使用者に選択させるために表示する。SE制御部77は、効果音の再生及び停止、並びに音量調整を、再生ボタン77b、停止ボタン77c及びスライダ77aを用いた使用者にマウス等の入力部を介して行わせる。
例えば、使用者がマウスを用いてSE選択表示部76にて所望のSEを選択し、スライダ77aを適切な位置に移動し、再生ボタン77bをクリックしたとする。すると、デコード部17は、SEファイル読み出し部16で読み出された所望のSEファイルをデコードし、ゲイン調整部18にてスライダ77aに対応したSE音量レベルであるゲイン係数k2がSEファイルのPCMデータに乗算され加算部13に出力される。これにより、効果音の各種効果音で使用者が通話相手への気持ち等を表現することができる。
BGM選択表示部78は、ユーザに選択させる使用可能なBGM音源データファイルを表示する。BGM制御部79は、BGMの再生及び停止、並びに音量調整を、再生ボタン79b、停止ボタン79c及びスライダ79aを用いた使用者にマウス等の入力部を介して行わせる。例えば、使用者がマウスを用いてBGM選択表示部78にて所望のBGMを選択し、スライダ79aを適切な位置に移動し、再生ボタン79bをクリックしたとする。すると、デコード部20は、BGMファイル読み出し部19で読み出された所望のBGMファイルをデコードし、ゲイン調整部21にてスライダ79aに対応したBGM音量レベルであるゲイン係数k3がBGMファイルのPCMデータに乗算され加算部13に出力される。これにより、SEと同様、使用者自身が選択し、調節した音量により、使用者の気分やその場の雰囲気を通信相手へ伝えることができる。
したがって、VoIPクライアント2は、前記ソフトウェアモジュールを構成する各種プログラムを実行することにより、従来、マイクロフォンより入力される通話音が固定の音量レベルとされた背景音によって聞きとりにくくなったり、逆に背景音としての効果が発揮できないという問題を解決することができる。また、送信側及び受信側にてPCMデータを用い、これをMP3や、MPEG4、あるいはATRAC等の圧縮技術に圧縮しているので、高音質のオーディオデータの伝送を実現でき、また例えば2チャンネル再生を可能としている。よって、通話音と背景音等を適切にミキシングすることにより、送信者側からの通話音の定位を際だたせることができる。
本実施の形態は、前述したように、通話中において、送信側にて設定されて送信されてきたBGMの拒否や音量調節を制御するために、以下の図10、図11、図12に示すような処理手順を実行する。
ここでは、BGM送信側から、既にBGMが受信側に送信されてきていることを前提に説明する。BGM受信側は、ゲインコントローラ120にてBGMの音量をチェックする(ステップS41)。受信側使用者が前記図9のGUIのBGM音量制御部79を用いて音量を変更したのをステップS42にて判定すると、BGMゲインコントローラ120は、現在の音量をどのくらい変更するのかを検出(ステップS43にてYES)する。そして、ステップS44に進んで、RTCP処理部121、RTCPパケット化部122を通してRTCPパケットを生成する。ここでは、前述したように、アプリケーション固有の情報に、BGM音量制御のために、現在の音量、音量の変更量(プラスの値:音量大、マイナスの値:音量小)を付加する。ステップS45において、このパケットを送信処理部24を介してBGM送信側に送信する。これらステップS41〜ステップS45までの処理は、ステップS46にてストリーミングが終了したと判定するまで繰り返されることになる。
次に、受信者側では、受信処理部31を通じてRTCPパケットを受信し(ステップS51)、RTCPデパケット化部123にてパケットを解き、アプリケーション固有の情報にBGM音量制御情報が入っているか否かをRTCP処理部121でチェックする(ステップS52)。そして、ゲインコントローラ120により、BGM音量制御情報により音量値が0より大きいのか否かをチェックする(ステップS53)。ゲインコントローラ120は、音量が0より大きくないと判定すればステップS54に進んでゲイン調整部21にてBGMの係数を小さくして音量を小さくする。音量が0より大きいと判定すればステップS55に進んでゲイン調整部21にてBGMの係数を大きくして音量を大きくする。これらステップS51〜ステップS55までの処理は、ステップS56にてストリーミングが終了したと判定するまで繰り返されることになる。
以上の処理手順を実行することにより、VoIPクライアント2,5は、BGM受信側において使用されても、使用者の好みに合わせてBGM等の音量を適切に制御できる。また、音量制御の情報をRTCPパケットを使って送受するので専用のパケットを不要とする。
なお、以上の説明は、BGMの音量を受信者側にて制御する処理について説明してきたが、SEの音量も同様に受信者側にて制御することができる。また、受信者側では送信者により音量が当初設定された保留音も制御することができる。
先ず、保留音発生の仕組みについて説明する。VoIPクライアント2及び5は、BGMを保留音として用いることができる。以下、VoIPクライアント2がBGMファイル記憶部15のBGMファイルを保留音として再生する動作について説明する。
保留音は、図13(1)のように保留者(ユーザA)が音源を持つ場合と、図13(2)のように保留者(ユーザA)と会話中の話者(ユーザAと通話中のユーザB)が持つ場合の2通りが考えられる。保留者が音源を持つ図13(1)の場合は、図2に示したBGMファイル記憶部15と、BGMファイル読み出し部19と、デコード部20と、ゲイン調整部21からなるBGM再生系と全く同じ仕組みで発信することができる。よって、BGM再生系の仕組みそのままで保留音を実現することができる。
しかし、BGMはその利用形態から保留音としては、音量が小さく、適切な音量でない場合が多い。そこで、BGMを保留音として用いる場合には、音量を自動的に調整することが考えられる。
例えば、VoIPクライアント2側から送信をしてBGMとミキシングしながら通話中、使用者が図14のGUI上の保留ボタン100をクリックすると、BGMとして設定された音量に代わり、保留音に予めセットされた、より大きめの音量に係数k3をゲイン調整部21にて自動的に切り替えるようにする。
図15には、保留音ルーチンの一例を示す。前記GUIの保留ボタン100がクリックされ保留ONとされたことをステップS1にて判定する(YES)と、VoIPクライアント2は、再生ファイルをBGMファイルから保留ファイルに切り替え(ステップS2)、通話中であったときのBGMの係数k3をM1(メモリ)に代入する(ステップS3)。そして、BGMの係数k3を予めプリセットされている保留値のレベルに設定する(ステップS4)。これにより、保留音用にBGMの音量レベルが大きくなる。次に、GUIにて保留ボタンがクリックされ、オフとされたと判定すると(ステップS5)、再生ファイルを保留ファイルからBGMファイルに切り替え(ステップS6)、BGM用にM1(メモリ)に代入していた値を係数k3に代入してBGMとして用いる。
また、保留音に切り替える際に同時にマイクロフォン7aの音量をミュート(MUTE)するべくゲインを零にするようにしてもよい。この場合の保留ルーチンの一例を図16に示す。前記GUIの保留ボタン100がクリックされ保留ONとされとことをステップS11にて判定する(YES)と、VoIPクライアント2は、再生ファイルをBGMファイルから保留ファイルに切り替え(ステップS12)、通話中であったときのBGMの係数k3をM1(メモリ)に代入し、かつマイクロフォン7a出力に乗算していた係数k1の値をM2(メモリ)に代入する(ステップS13)。そして、BGMの係数k3を予めプリセットされている保留値のレベルに設定し、かつマイクロフォン7a用の係数k1をヌル(NULL)に設定する(ステップS14)。これにより、保留音用にBGMの音量レベルが大きくなり、かつマイクロフォン7aがオフとされる。次に、GUIにて保留ボタンがクリックされ、オフとされたと判定すると(ステップS15)、再生ファイルを保留ファイルからBGMファイルに切り替え(ステップS16)、BGM用にM1(メモリ)に代入していた値を係数k3に代入してBGMとして用い、かつマイクロフォン7a用の係数k1をメモリ(M2)に記憶しておいた値にする(ステップS17)。以上により、保留ボタンが押されるとBGMの音量レベルを自動的に調整し、保留音として用いるとともに、マイクロフォン7aをオフにする動作が可能となる。また、再度保留ボタンがクリックされ保留オフとされると、BGM用の音量レベルに戻るとともにマイクロフォン7aのスイッチがオンになる。
したがって、BGMを保留音として用いるときには、BGMの係数k3を自動的にプリセットされた値にし、適切な音量の保留音として用いることができる。また、保留音としてBGMを用いることにより、VoIPクライアント2の構成をシンプルにすることができる。
このようにして設定された保留音も、前述の図6、図10〜図12に示した処理手順により、受信者側にて音量を制御することができる。
VoIP通話システムの構成図である。 VoIPクライアントの機能ブロック図である。 RTPパケットのフォーマット図である。 RTCPパケットのフォーマット図である。 RTP/RTCPの通常の役割を説明するためのシーケンス図である。 RTP/RTCPのBGM制御時の役割を説明するためのシーケンス図である。 VoIPクライアントが実行するソフトウェアモジュール示す図である。 VoIPクライアントとなるPCのハードウェア構成図である。 VoIPクライアントの表示部に表示されるGUIを示す図である。 BGM送信側とBGM受信側の機能を説明するための図である。 BGM受信側における音量制御処理手順を示すフローチャートである。 BGM送信側における音量制御処理手順を示すフローチャートである。 保留音の音源を説明するための図である。 GUI上の保留ボタンを示す図である。 保留音ルーチンの処理手順を示すフローチャートである。 保留音ルーチンの他の処理手順を示すフローチャートである。
符号の説明
1 VoIPシステム、2,5 VoIPクライアント、4 インターネット、6 VoIPサーバ、7 ヘッドセット、12 ゲイン調整部、13 合成部、14 SEファイル、15 BGMファイル、17 デコード部、18 ゲイン調整部、21 ゲイン調整部、22 エンコード、36 ゲイン調整部、42 ゲイン調整部、43 ゲイン調整部、120 ゲインコントローラ、121 RTCP処理部、122 RTCPパケット化部、123 RTCPデパケット化部

Claims (9)

  1. ネットワークを介して音声による対話のための双方向通信を行う通話装置において、
    送信系として、
    収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整手段と、
    音のデータをファイル単位で記憶している音データ記憶手段と、
    前記音データ記憶手段から読み出したファイル単位の音データをデコードするデコード手段と、
    前記デコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整手段と、
    前記第1のゲイン調整手段からの第1の出力と前記第2のゲイン調整手段からの第2の出力とを合成する合成手段と、
    前記合成手段の合成出力をエンコードするエンコード手段と、
    前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信手段とを備え、
    受信系として、
    前記ネットワークを介して他の通話装置の送信手段から送信されてきたエンコード出力を受信する受信手段と、
    前記受信手段で受信されたエンコードデータをデコードするデコード手段と、
    前記デコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整手段と、
    前記第3のゲイン調整手段からの出力を音に変換して出力する音出力手段とを備え、
    さらに、
    送信側にて設定されて送信されてきた前記合成出力に含まれる音の音量調節を制御する制御手段とを
    備えることを特徴とする通話装置。
  2. 前記制御手段は、送信側から送信されてきた前記合成出力に含まれる数分間単位で継続する音である音楽や、数秒間単位の効果音のデータの音量調節を制御することを特徴とする請求項1記載の通話装置。
  3. 前記制御手段は、リアルタイム・トランスポート・コントロール・プロトコルのアプリケーション固有情報に音量制御データを記述して送信側に送信することを特徴とする請求項2記載の通話装置。
  4. 送信側にあっては前記アプリケーション固有情報に記述された音量制御データを基に前記第2のゲイン調整手段のゲインを可変して、数分間単位で継続する音である音楽や、数秒間単位の効果音のデータの音量調節を行うことを特徴とする請求項3記載の通話装置。
  5. ネットワークを介して音声による対話のための双方向通信を行う通話方法において、
    収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整工程と、
    音のデータをファイル単位で記憶している音データ記憶手段から読み出したファイル単位の音データをデコードするデコード工程と、
    前記デコード工程からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整工程と、
    前記第1のゲイン調整工程からの第1の出力と前記第2のゲイン調整工程からの第2の出力とを合成する合成工程と、
    前記合成工程の合成出力をエンコードするエンコード工程と、
    前記エンコード工程からのエンコード出力を前記ネットワークに送信する送信工程とを備え、
    前記ネットワークを介して他の通話装置の送信手段から送信されてきたエンコード出力を受信する受信工程と、
    前記受信工程で受信されたエンコードデータをデコードするデコード工程と、
    前記デコード工程からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整工程と、
    前記第3のゲイン調整工程からの出力を音に変換して出力する音出力工程とを備え、
    さらに、
    送信側にて設定されて送信されてきた前記合成出力に含まれる音の音量調節を制御する制御工程とを
    備えることを特徴とする通話方法。
  6. 前記制御工程は、送信側から送信されてきた前記合成出力に含まれる数分間単位で継続する音である音楽や、数秒間単位の効果音のデータの音量調節を制御することを特徴とする請求項5記載の通話方法。
  7. 前記制御工程は、リアルタイム・トランスポート・コントロール・プロトコルのアプリケーション固有情報に音量制御データを記述して送信側に送信することを特徴とする請求項6記載の通話方法。
  8. 送信側にあっては前記アプリケーション固有情報に記述された音量制御データを基に前記第2のゲイン調整手段のゲインを可変して、数分間単位で継続する音である音楽や、数秒間単位の効果音のデータの音量調節を行うことを特徴とする請求項7記載の通話方法。
  9. ネットワークに接続された複数の通話装置を用いて音声による対話のための双方向通信を行う通話システムにおいて、
    前記複数の通話装置は、送信系として、
    収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整手段と、
    音のデータをファイル単位で記憶している音データ記憶手段と、
    前記音データ記憶手段から読み出したファイル単位の音データをデコードするデコード手段と、
    前記デコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整手段と、
    前記第1のゲイン調整手段からの第1の出力と前記第2のゲイン調整手段からの第2の出力とを合成する合成手段と、
    前記合成手段の合成出力をエンコードするエンコード手段と、
    前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信手段とを備え、
    受信系として、
    前記ネットワークを介して他の通話装置の送信手段から送信されてきたエンコード出力を受信する受信手段と、
    前記受信手段で受信されたエンコードデータをデコードするデコード手段と、
    前記デコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整手段と、
    前記第3のゲイン調整手段からの出力を音に変換して出力する音出力手段とを備え、
    さらに、
    送信側にて設定されて送信されてきた前記合成出力に含まれる音の音量調節を制御する制御手段とを
    備えることを特徴とする通話システム。
JP2003280429A 2003-07-25 2003-07-25 通話装置及び通話方法、並びに通話システム Withdrawn JP2005045737A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003280429A JP2005045737A (ja) 2003-07-25 2003-07-25 通話装置及び通話方法、並びに通話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003280429A JP2005045737A (ja) 2003-07-25 2003-07-25 通話装置及び通話方法、並びに通話システム

Publications (1)

Publication Number Publication Date
JP2005045737A true JP2005045737A (ja) 2005-02-17

Family

ID=34266262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003280429A Withdrawn JP2005045737A (ja) 2003-07-25 2003-07-25 通話装置及び通話方法、並びに通話システム

Country Status (1)

Country Link
JP (1) JP2005045737A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012175237A (ja) * 2011-02-18 2012-09-10 Nec Corp 音声切替装置、プログラム及び方法
US8325639B2 (en) 2007-08-21 2012-12-04 Universal Entertainment Corporation IP telephone system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8325639B2 (en) 2007-08-21 2012-12-04 Universal Entertainment Corporation IP telephone system
JP2012175237A (ja) * 2011-02-18 2012-09-10 Nec Corp 音声切替装置、プログラム及び方法

Similar Documents

Publication Publication Date Title
US10930262B2 (en) Artificially generated speech for a communication session
US11910344B2 (en) Conference audio management
JP4367657B2 (ja) 音声通信方法及び装置
JP3948904B2 (ja) エッジポイントミキシングを有する遠隔会議ブリッジ
JP5185631B2 (ja) マルチメディア会議方法および信号
WO2009067954A1 (fr) Procédé et dispositif de traitement de flux audio
JP2005045738A (ja) 通話装置及び通話方法、並びに通話システム
US7280650B2 (en) Method and apparatus to manage a conference
US20020057333A1 (en) Video conference and video telephone system, transmission apparatus, reception apparatus, image communication system, communication apparatus, communication method
JP4471086B2 (ja) オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム
JP2005044310A (ja) 通話装置及び著作権保護方法、並びに通話システム
US20110235632A1 (en) Method And Apparatus For Performing High-Quality Speech Communication Across Voice Over Internet Protocol (VoIP) Communications Networks
JP4218456B2 (ja) 通話装置、通話方法及び通話システム
JP4207701B2 (ja) 通話装置及び通話方法、並びに通話システム
JP2005045737A (ja) 通話装置及び通話方法、並びに通話システム
JP2005045739A (ja) 通話装置、通話方法及び通話システム
JP4193669B2 (ja) 通話システム及び画像情報送受信方法
JP5210788B2 (ja) 音声信号通信システム、音声合成装置、音声合成処理方法、音声合成処理プログラム、並びに該プログラムを格納した記録媒体
JP2008271415A (ja) 受信音声出力装置
Perkins et al. Multicast audio: The next generation
JP2003023499A (ja) 会議サーバ装置および会議システム
JP2005045740A (ja) 通話装置、通話方法及び通話システム
KR101444466B1 (ko) 원격 통신 엔드포인트
Christianson et al. Hierarchical audio encoder for network traffic adaptation
JP2008067270A (ja) ソフトフォン端末の音声レベル調整システム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061003