JP5200764B2 - 電話通信システム、並びに、音声データ処理装置、プログラム及び方法 - Google Patents

電話通信システム、並びに、音声データ処理装置、プログラム及び方法 Download PDF

Info

Publication number
JP5200764B2
JP5200764B2 JP2008216792A JP2008216792A JP5200764B2 JP 5200764 B2 JP5200764 B2 JP 5200764B2 JP 2008216792 A JP2008216792 A JP 2008216792A JP 2008216792 A JP2008216792 A JP 2008216792A JP 5200764 B2 JP5200764 B2 JP 5200764B2
Authority
JP
Japan
Prior art keywords
voice data
volume value
telephone terminal
data processing
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008216792A
Other languages
English (en)
Other versions
JP2010056634A (ja
Inventor
正博 林
収 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008216792A priority Critical patent/JP5200764B2/ja
Publication of JP2010056634A publication Critical patent/JP2010056634A/ja
Application granted granted Critical
Publication of JP5200764B2 publication Critical patent/JP5200764B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、電話通信システム、並びに、音声データ処理装置、プログラム及び方法に関し、例えば、電話会議システムに適用することができる。
特許文献1には、複数の接続相手を対象に音声情報を送受する際に、回線接続相手によって音声情報の音量を適正化制御する音量自動制御機能をもつことにより、複数の通話相手を対象に、常に、円滑に適正音量で通話を開始することの出来るマルチメディア情報通信システムが示されている。
特許文献2には、ダイナミックに音量調整し、一定の音量で聞くことが可能な音量調整装置が示されている。
特開2001−94604号公報 特開2006−140542号公報
しかしながら、特許文献1、2に記載の方法では、複数の話者が会話を行う電話会議システムで、会議に参加する複数の話者のうち任意の話者の音声量(音声のボリューム)を、音声を受信する側から適宜に制御することができない。すなわち、会議システムでA者、B者、C者、および、D者により会議が開始され、それぞれの話者の間で通話の対向関係が確立された状態で、A者がB者、C者、および、D者の音声を聞くとき(A者にB者、C者、および、D者の音声が同時に流入するとき)、A者がD者の音声量を適宜に制御しようとした場合、従来の方法を会議システムに適用したとしても行えない。特許文献1、2に記載の方法では、例えば、PoC(Push to talk over Cellular)などの、複数の話者が交代で話す形態の電話会議に適用するものであり、通常の対面での会議のように複数の話者が同時に話す場合に、任意の話者の音量を適宜に制御することはできないからである。
そのため、複数の電話端末から送出された音声データを合成(ミキシング)する際に、任意の電話端末の音声データに係る音量を制御することができる電話通信システム、並びに、音声データ処理装置、プログラム及び方法が望まれている。
第1の本発明の電話通信システムは、(1)複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムにおいて、(2)上記音声データ処理装置は、(2−1)上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録する指定音量値登録手段と、(2−2)上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工する音声データ加工手段と、(2−3)上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成する音声データ合成手段とを有し、(3)上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、(4)上記音声データ処理装置は、(4−1)上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入する指定音量値挿入手段を有し、(4−2)上記音声データ加工手段は、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工することを特徴とする。
第2の本発明の音声データ処理装置は、(1)複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムを構成する上記音声データ処理装置において、(2)上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録する指定音量値登録手段と、(3)上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工する音声データ加工手段と、(4)上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成する音声データ合成手段とを有し、(5)上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、(6)上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入する指定音量値挿入手段をさらに有し、(7)上記音声データ加工手段は、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工することを特徴とする。
第3の本発明の音声データ処理プログラムは、(1)複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムを構成する上記音声データ処理装置に搭載されたコンピュータを、(2)上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録する指定音量値登録手段と、(3)上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工する音声データ加工手段と、(4)上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成する音声データ合成手段として機能させ、(5)上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、(6)上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入する指定音量値挿入手段としてさらに機能させ、(7)上記音声データ加工手段は、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工することを特徴とする。
第4の本発明の音声データ処理方法は、(1)複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムにおける音声データ処理方法において、(2)指定音量値登録手段、音声データ加工手段、音声データ合成手段、指定音量値挿入手段を有し、(3)上記指定音量値登録手段は、上記音声データ処理装置において、上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録し、(4)上記音声データ加工手段は、上記音声データ処理装置において、上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工し、(5)上記音声データ合成手段は、上記音声データ処理装置において、上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成し、(7)上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、(8)上記指定音量値挿入手段は、上記音声データ処理装置において、上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入し、(9)上記音声データ加工手段は、上記音声データ処理装置において、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工することを特徴とする。
本発明によれば、複数の電話端末から送出された音声データを合成(ミキシング)する際に、任意の電話端末の音声データに係る音量を制御することができる。
(A)第1の実施形態
以下、本発明による電話通信システム、並びに、音声データ処理装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1は、この実施形態の電話通信システム1の全体構成を示すブロック図である。
電話通信システム1は、図1において、IP網Nに、4台の電話端末20、30、40、50が接続されている。電話端末間において、音声データは、RTP(Real-time Transport Protocol;IETF RFC1889参照)の形式のパケット(以下、「RTPパケット」という)で伝送されるものとして説明する。
電話端末20は、IP網Nに接続されている電話端末であり、通話処理装置21を有している。電話端末20は、電話端末30〜50と接続し、各電話端末のユーザとの電話会議を提供するものである。なお、図1において図示は省略しているが、電話端末20には、スピーカやマイクロフォンなど、電話端末が有している他の構成も有しているものとする。
通話処理装置31は、電話端末20において、電話会議などの通話に係る処理を行う機能を担っているものであり、電話機能部22、会議機能部23、音声データ処理装置24を有している。
通話処理装置31は、電話端末に搭載されたものであっても良いし、ソフトフォンとして構築されたパソコンなどの情報処理装置上に実現するようにしても良い。
電話機能部22は、通話処理装置21において、音声通話を行う機能を担っている。
会議機能部23は、通話処理装置21において、複数の通話相手(電話端末30〜50)と同時に通話するための会議機能(例えば、会議参加する電話端末とのセッション管理など)を提供する機能を担っている。会議機能部23は、既存の電話会議システムにおける、会議機能と同様のものを適用することができる。
図2は、音声データ処理装置24内部の機能的構成について示したブロック図である。
音声データ処理装置24は、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成有する情報処理装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)上に、実施形態の音声データ処理プログラム等をインストールすることにより構築されるものであり、機能的には上述の図2のように示すことができる。例えば、電話端末20が、パソコンなどの情報処理装置上に実現されている場合には、音声データ処理装置24もその情報処理装置上に、実施形態の音声データ処理プログラム等をインストールすることにより構築しても良い。
音声データ処理装置24は、複数の通話相手(電話端末30〜50)から受信したRTPパケットの音声データを相手先ごとに音量を指定してミキシングを行い、一つの音声データに合成して出力するものであり、制御部243、音量制御部244、パケット処理部245(245−1〜245−3)を有している。
UDP/IP制御部246は、RTPパケットを受信する汎用ソケットの機能を担っている。
パケット処理部245(245−1〜245−3)は、UDP/IP制御部246が受信したRTPパケットについて、バッファリングや送信元の解析などの処理を行うものであり、パケット解析部245a(245a−1〜245a−3)、バッファ部245b(245b−1〜245b−3)を有している。
音声データ処理装置24において、パケット処理部245は、通信相手先ごとに配置されるものであり、通信相手は、電話端末30〜50と3つあるので、図2では3つのパケット処理部245−1〜245−3が配置されている。なお、音声データ処理装置24においては、パケット処理部245の数は固定でも良いし、動的に変動させるようにしても良い。例えば、それぞれのパケット処理部245を、プログラム上における一つのスレッドとして生成し、動的にそのスレッドの数を変動させるようにしても良い。この実施形態においては、UDP/IP制御部246が、RTP(Real−time Transport Protocol)パケットを受信した場合に、パケットの送信元ごとにパケット処理部245のスレッドが生成されるものとして説明する。また、音声データ処理装置24において、予めパケット処理部245を複数配置しておいて、通信相手の数だけ利用するようにしても良い。このように、音声データ処理装置24において、パケット処理部245の配置(生成)や管理方法は限定されないものである。
バッファ部245b−1〜245b−3は、RTPパケットを受信した際に、相手先ごとにVoIP特有の、遅延・揺らぎを吸収して、パケット解析部245a−1〜245a−3にRTPパケットを供給するジッタバッファの機能を担っている。
パケット解析部245a−1〜245a−3は、バッファ部245b−1〜245b−3から与えられたRTPパケットの送信元を解析する。この実施形態においては、例として、パケット解析部245a−1〜245a−3は、RTPパケットのヘッダ情報から送信元に係る情報として、送信元IPアドレスを抽出することにより、送信元を解析するものとして説明する、そして、パケット解析部245a−1〜245a−3は、RTPパケットと、そのRTPパケットから抽出した送信元IPアドレスを組として、音量制御部244に与える。なお、以下の説明においては、電話端末30のIPドレスをA、電話端末40のIPドレスをB、電話端末50のIPアドレスをCとして説明する。
制御部243は、上位機能部(電話機能部22、会議機能部23など)との間で音量調整用のインタフェースを備え、現在通話中の相手先(複数)に係る情報を保持するものであり、音量制御指定部243aを有している。
音量制御指定部243aでは、現在電話端末20において、電話会議の接続中の相手先の電話端末の識別情報と、相手先の電話端末ごとの音量値(以下、「指定音量値」という)を対応付けて登録する。指定音量値としては、例えば、10db、20dbなどの具体的な音量値を設定しても良いし、1、2、3…などの係数を設定するようにしても良いが、この実施形態においては係数を設定するものとして説明する。また、音量制御指定部243aでは、例えば、指定音量値としてデフォルト値を予め設定しておき、ユーザの操作に応じて、指定音量値をそのデフォルト値から上下させるようにしても良い。
音量制御指定部243aに設定される指定音量値は、予め設定された内容であっても良いし、ユーザの操作に応じて変更するようにしても良い。例えば、電話端末20において、電話会議の相手先の電話端末(IPアドレス)ごとに指定音量値をより高くしたり、低くしたりするボタンを備えたり、指定音量値を設定するテンキーを備えるようにしても良いし、通話処理装置21が、ソフトフォンとして構築されたパソコンなどの情報処理装置上に実現されている場合には、その情報処理装置(パソコン)上でマウス操作やキー操作などにより、ユーザに電話会議の相手先の電話端末(IPアドレス)ごとの指定音量値を入力させるようにしても良く、ユーザに指定音量値を入力させる構成は限定されないものである。また、音量制御指定部243aに設定される指定音量値は、電話端末20において、電話会議を接続中に、ユーザの操作に応じて変更するようにしても良い。
また、音量制御指定部243aにおいて、設定する対象の相手先の電話端末に係る識別情報は、例えば、上位機能部(電話機能部22、会議機能部23など)において、電話会議の設定(接続)をする際に適用されるセッション情報などから抽出して適用するようにしても良い。
音量制御部244は、パケット処理部245−1〜245−3から与えられたRTPパケットについて、音量制御の処理を行うものであり、Gain調整部244a、パケット制御部244bを有している。
図3は、パケット制御部244bの処理について示した説明図である。
パケット制御部244bは、図3に示すように、パケット解析部245a−1〜245a−3から、送信元IPアドレスと組となったRTPパケットが与えられると、音量制御指定部243aに登録されている指定音量値を、そのRTPパケットに挿入して、Gain調整部244aに与える。
パケット制御部244bは、図3に示すように、パケット解析部245a−1〜245a−3から、送信元IPアドレスと組となったRTPパケットが与えられると、音量制御指定部243aに登録されている情報から、その送信元IPアドレスに対応する指定音量値を検索し、その指定音量値をRTPパケットに設挿入する。
図4は、Gain調整部244a及び、ミキシング部242の処理について示した説明図である。
Gain調整部244aは、図4に示すように、パケット制御部244bから与えられたRTPパケットから、音声データ(例えば、PCMのデータ)を抽出し、さらにその音声データの音量を、パケット制御部244bにより挿入された指定音量値により指定された音量に変更(Gain調整)し、ミキシング部242に与えるものである。Gain調整部244aは、RTPパケットにおいて挿入されている指定音量値が、より大きいRTPパケットに係る音声データの音量を大きく調整する。例えば、Gain調整部244aは、指定音量値が1のRTPパケットの音声データよりも、指定音量値が3のRTPパケットの音声データの方が大きな音量になるように調整する。
Gain調整部244aは、例えば、指定音量値として、1、2、3、…などの係数が割当られていた場合には、指定音量値が1の場合には10db、2の場合には20dbなど、係数に対応する音量を予めGain調整部244aに設定しておき、該当する音量に音声データの音量を調整するようにしても良い。
また、Gain調整部244aは、例えば、指定音量値に応じた音量の比率で音声データの音量を設定するようにしても良い。例えば、送信元IPアドレスAのRTPパケットの指定音量値が2でGain調整後の音量値がX、送信元IPアドレスBの指定音量値が1でGain調整後の音量値がY、送信元IPアドレスCの指定音量値が1でGain調整後の音量値がZであった場合には、X、Y、Zの音量の比率が、2:1:1になるように調整することが挙げられる。
ミキシング部242は、図4に示すように、送信元のIPドレスごとの音声データが、Gain調整部244aから与えられると、それらの音声データを一つの音声データにミキシング(合成)し、サウンド出力部241に与える。ミキシング部242において、複数の音声データを合成する方法としては、例えば、既存のPCMデータを合成する方法や、既存のVoIPを用いた電話会議システムなどにおいて、複数の電話端末からの音声を合成する方法などを適用することができる。
サウンド出力部241は、ミキシング部242から与えられた音声データを、音声出力装置(スピーカ)を用いて出力する。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の電話通信システム1の全体の動作(実施形態の音声データ処理方法)を説明する。
図5は、電話通信システム1における、通話処理装置21の動作について説明したフローチャートである。
図5の説明では、音声データ処理装置24において、UDP/IP制御部246の制御により、3つのパケット処理部245−1〜245−3(のスレッド)が生成されているものとして説明する。パケット処理部245−1は、電話端末30向けに生成されたものであり、パケット処理部245−2は、電話端末40向けに生成されたものであり、パケット処理部245−3は、電話端末50向けに生成されたものであるものとして説明する。
まず、UDP/IP制御部246により、他の電話端末30〜50からRTPパケットが受信されると(S101)、バッファ部245b−1〜245b−3に与えられ、バッファ部245b−1〜245b−3において一定量のRTPパケットがバッファリングされると、パケット解析部245a−1〜245a−3において、RTPパケットの送信元IPアドレスが解析される(S102)。
そして、パケット制御部244bにおいて、制御部243(音量制御指定部243a)に設定されている音量指定値に基づいて、送信元のIPアドレスごとに、パケット解析部245a−1〜245a−3により解析されたRTPパケットに指定音量値が挿入される(S103)。
そして、Gain調整部244aにおいて、パケット制御部244bで指定音量値が挿入されたRTPパケットから、音声データが抽出され、指定音量値に応じて音量が調整される(S104)。
そして、ミキシング部242において、Gain調整部244aにおいて音量が調整された音声データが、Gain調整部244aにより調整された音量比でミキシング(合成)が行われ、ミキシングされた音声データが生成される(S105)。
そして、ミキシング部242でミキシングされた音声データが、サウンド出力部241において、適切な出力形式に変換され(S106)、電話端末20のスピーカにより出力される。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
音声データ処理装置では、指定音量値が大きく設定されているほど大きな音量でミキシングするため、特定の相手先の音声を明瞭に出力させることができる。特に、相手先ごとに、背景雑音の大きさが異なる場合には、背景雑音の大きな相手先の音声を小さくする必要が生じる場合もあるため、そのような場合にも対応できる。
また、パケット制御部により、それぞれのRTPパケットに送信元IPアドレスに応じた指定音量値の情報を挿入し、Gain調整部では、その挿入された指定音量値に基づいて、音声データの音量を調整している。これにより、PoCなどの、複数の話者が交代で話す形態の電話会議だけでなく、複数の電話端末における話者が同時に話す形態の電話会議であっても、任意の電話端末の話者の音声量をユーザの操作に応じて制御することができる。
(B)第2の実施形態
以下、電話通信システム、並びに、音声データ処理装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図6は、第2の実施形態の電話通信システムの全体構成を示すブロック図である。
第1の実施形態では、通話処理装置21が、電話端末20自体に搭載されている例について示したが、第2の実施形態においては、図6に示すように第1の実施形態の音声データ処理装置に相当する手段を、IP網N上の別の装置であるサーバ60上に、音声データ処理装置61として配置した場合の例について示している。以下、第2の実施形態について、第1の実施形態との差異について説明する。
IP網Nは、第1の実施形態と同様のものであるので詳しい説明は省略する。
第2の実施形態においては、電話端末20A、30A、40Aは、直接他の電話端末と音声パケットのやりとりをせずに、音声データ処理装置61を搭載したサーバ60を介して音声パケットに係る通信を行う。第1の実施形態においては、電話端末20Aは、他の電話端末30A、40Aから音声パケットを受信して、それらの音声パケットに係る音声をミキシングして出力しているが、第2の実施形態においては、サーバ60(通話処理装置41)が、電話端末20A〜40AからRTPパケットを受信して、ミキシングした音声データを生成してから、それぞれの電話端末にその音声データを配信する。そして、サーバ60(音声データ処理装置61)は、音声データをミキシングする際に、各電話端末(ユーザ)において指定された音量値でミキシングを行う。
電話端末20Aは、通話処理装置21Aを有しており、通話処理装置21Aは、電話機能部22、会議機能部23、多入力音声制御部24、音量制御指定部25を有している。第1の実施形態の通話処理装置は、音声データ処理装置を有していたが、第2の実施形態では、音声データ処理装置は有しておらず、音量制御指定部25のみを有している。なお、電話機能部22、会議機能部23については、第1の実施形態とほぼ同様のものであるので詳しい説明を省略するが、通話相手の電話端末に直接RTPパケットを送信せずに、サーバ60(音声データ処理装置61)を介する点で異なっている。
音量制御指定部25は、第1の実施形態における、音量制御指定部243aとほぼ同様のものであるが、外部装置であるサーバ60に対して、指定音量値を与える点において、第1の実施形態と異なっている。音量制御指定部25からサーバ60(音声データ処理装置61)に与えられた指定音量値は、サーバ60(音声データ処理装置61)において保持されるようにしても良い。また、音量制御指定部25が、サーバ60に対して指定音量値を与えるタイミングは、定期的でも良いし、指定音量値がユーザの操作に応じて変更された場合のみであっても良く、そのタイミングは限定されないものである。
図7は、この実施形態の音声データ処理装置内部の機能的構成について説明したブロック図である。
音声データ処理装置61は、ミキシング処理部611−1〜611−3、パケット制御部612、パケット処理部613(613−1〜613−3)、UDP/IP制御部614を有している。
UDP/IP制御部614は、電話端末20A〜40Aと、RTPパケット等のデータの送受信を行う通信インタフェースの機能を担っている。また、電話端末20A〜40Aから、音量指定に係るパケットが与えられると、そのパケットを、パケット制御部612に与える。
パケット処理部613(613−1〜613−3)は、第1の実施形態のパケット処理部245(245−1〜245−3)とほぼ同様のものであるので詳しい説明を省略する。音声データ処理装置61においては、3つの電話端末20A〜電話端末40Aに係る音声データを処理するので、図7に示すように、3つのパケット処理部613−1〜613−3(のスレッド)が生成配置されることになる。
パケット制御部612は、第1の実施形態のパケット制御部244bとほぼ同様のものであるが、第2の実施形態では、音声データ処理装置61は、複数の電話端末に係る音声データを処理するので、それぞれの電話端末20A〜40Aから指定音量値のデータが与えられると、そのデータを保持して音量指定に係る処理を行う。
ミキシング処理部611−1(611−1〜611−3)は、パケット制御部612から与えられた音声データについてミキシングの処理を行うものであり、ミキシング部611a(611a−1〜611a−3)、音量制御部611b(611b−1〜611b−3)を有している。また、音量制御部611b(611b−1〜611b−4)は、Gain調整部611c(611c−1〜611c−4)を有している。
ミキシング処理部611−1(611−1〜611−3)は、パケット処理部613と同様に、少なくとも音声データを処理する対象の電話端末の数が配置される。音声データ処理装置61においては、3つの電話端末20A〜電話端末40Aに係る音声データを処理するので、図7に示すように、3つのミキシング処理部611−1〜611−3配置されている。なお、音声データ処理装置61においては、ミキシング処理部611の数は固定でも良いし、動的に変動させるようにしても良い。例えば、それぞれのミキシング処理部611を、プログラム上における一つのスレッドとして生成し、動的にそのスレッドの数を変動させるようにしても良い。この実施形態においては、UDP/IP制御部614が、RTPパケットを受信した場合に、パケットの送信元ごとにミキシング処理部611のスレッドが生成されるものとして説明する。また、音声データ処理装置61において、予めミキシング処理部611を複数配置しておいて、通信相手の数だけ利用するようにしても良い。このように、音声データ処理装置61において、ミキシング処理部611の配置や管理方法は限定されないものである。
ミキシング部611a、Gain調整部611cは、第1の実施形態のミキシング部242、Gain調整部244aとほぼ同様のものであるので詳しい説明を省略する。第2の実施形態では、それぞれのミキシング処理部611−1〜611−3(ミキシング部611a−1〜611a−3、Gain調整部611c−1〜611c−3)が、それぞれ対応する電話端末20A〜電話端末40Aに係る音声データの音量調整及びミキシングの処理を行う点で、第1の実施形態のものとは異なっている。なお、図7においては、ミキシング処理部611−1〜611−3が、それぞれ電話端末20A〜電話端末40Aに係る音声データのミキシングを行うものとする。また、ミキシング処理部611−1〜611−3は、ミキシングした音声データに係るパケットを、UDP/IP制御部614を介して、それぞれの電話端末20A〜電話端末40Aに配信する。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の電話通信システムの動作(この実施形態の音声データ処理方法)を説明する。
図8は、第2の実施形態の電話通信システム1Aの動作について示したフローチャートである。
図8の説明では、音声データ処理装置61において、UDP/IP制御部614の制御により、3つのパケット処理部613−1〜613−3(のスレッド)が生成されているものとして説明する。また、パケット処理部613−1〜613−3は、それぞれ電話端末20A〜電話端末40Aに対応するものとして生成されたものとして説明する。
まず、UDP/IP制御部614により、電話端末20A〜40AからRTPパケットが受信されると(S201)、パケット処理部613−1〜613−3に与えられて、パケット処理部613−1〜613−3において一定量RTPパケットがバッファリングされ、パケット解析部613a−1〜613a−3において、RTPパケットの送信元が解析される(S202)。
そして、パケット制御部612において、電話端末20A〜電話端末40Aから与えられた音量指定値に基づいて、電話端末ごとに、パケット解析部613a−1〜613a−3により解析されたRTPパケットに音量値が挿入される(S203)。
次に、Gain調整部611c−1〜611c−3において、パケット制御部612で付加された音声パケットの音量値によって、音量が変更される(S204)。
次に、Gain調整部611c−1〜611c−3において音量が変更されたRTPパケットを、一つの音声出力とするために、ミキシング部242において、Gain調整部611c−1〜611c−3により調整された音量比でミキシングが行われ、ミキシングされた音声データが生成される(S205)。
次に、ミキシング部611a−1〜611a−3でミキシングされた音声データが、UDP/IP制御部614を介して、それぞれの電話端末20A〜電話端末40Aに配信され、それぞれの電話端末20A〜電話端末40Aにおいて出力される(S206)。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態における効果に加えて、さらに以下のような効果を奏することができる。
第2の実施形態では、音声データ処理装置を外部装置として構築しているため、第1の実施形態のように音声データ処理装置を電話端末自体に備えなくても良い。
電話端末上で音量調整のミキシングに係る処理を行わずに、サーバ上で行っているため、電話端末において、必要となる情報処理量や記憶容量などのリソースを低減することができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態においては、電話端末から送出される音声データはRTPパケットの形式を用いる例について説明したが、例えば、RTSP(Real Time Streaming Protocol;IETF RFC2326参照)などその他の形式のパケットを用いても良い。
(C−2)第1の実施形態においては、音声データ処理装置を電話端末に搭載する例について説明し、第2の実施形態においては、音声データ処理装置を電話端末の外部に配置する例について説明したが、電話通信システム上で、内部に音声データ処理装置を搭載する電話端末と、外部に配置する電話端末の両方を組み合わせて配置するようにしても良い。この場合、音声データ処理装置を搭載していない電話端末は、RTPパケットをサーバ(外部の音声データ処理装置)と、音声データ処理装置を内蔵している電話端末の両方に送信し、音声データ処理装置を内蔵している電話端末は、RTPパケットを他の音声データ処理装置を内蔵している電話端末と、サーバ(外部の音声データ処理装置)に送信する。
これにより、例えば、処理能力や機能が異なる電話端末が混在していた場合であっても、第1及び第2の実施形態と同様の効果を奏することができる。
第1の実施形態に係る電話通信システムの全体構成を示すブロック図である。 第1の実施形態に係る音声データ処理装置の機能的構成について示したブロック図である。 第1の実施形態に係るパケット制御部の処理について示した説明図である。 第1の実施形態に係るGain調整部及びミキシング部の処理について示した説明図である。 第1の実施形態に係る電話通信システムの動作について説明したフローチャートである。 第2の実施形態に係る電話通信システムの全体構成を示すブロック図である。 第2の実施形態に係る音声データ処理装置の機能的構成について示したブロック図である。 第2の実施形態に係る電話通信システムの動作について説明したフローチャートである。
符号の説明
1…電話通信システム、N…IP網、20、30、40、50…電話端末、21…通話処理装置、22…電話機能部、23…会議機能部、24…音声データ処理装置、241…サウンド出力部、242…ミキシング部、243…制御部、243a…音量制御指定部、244…音量制御部、244a…Gain調整部、244b…パケット制御部、245、245−1〜245−3…パケット処理部、245a、245a−1〜245a−3…パケット解析部、245b、245b−1〜245b−3…バッファ部、246…UDP/IP制御部。

Claims (5)

  1. 複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムにおいて、
    上記音声データ処理装置は、
    上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録する指定音量値登録手段と、
    上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工する音声データ加工手段と、
    上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成する音声データ合成手段とを有し、
    上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、
    上記音声データ処理装置は、
    上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入する指定音量値挿入手段を有し、
    上記音声データ加工手段は、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工する
    ことを特徴とする電話通信システム。
  2. 上記第2の電話端末は、
    ユーザから指定音量値が入力されると、その指定音量値のデータを取り込んで、上記音声データ処理装置に通知する指定音量値入力手段をさらに有し、
    上記音声データ処理装置は、
    上記第2の電話端末から指定音量値が通知されると、上記音量値登録手段に、指定音量値を登録、又は、登録されている指定音量値を更新する指定音量値更新登録手段をさらに有する
    ことを特徴とする請求項1に記載の電話通信システム。
  3. 複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムを構成する上記音声データ処理装置において、
    上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録する指定音量値登録手段と、
    上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工する音声データ加工手段と、
    上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成する音声データ合成手段とを有し、
    上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、
    上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入する指定音量値挿入手段をさらに有し、
    上記音声データ加工手段は、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工する
    ことを特徴とする音声データ処理装置。
  4. 複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムを構成する上記音声データ処理装置に搭載されたコンピュータを、
    上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録する指定音量値登録手段と、
    上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工する音声データ加工手段と、
    上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成する音声データ合成手段として機能させ、
    上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、
    上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入する指定音量値挿入手段としてさらに機能させ、
    上記音声データ加工手段は、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工する
    ことを特徴とする音声データ処理プログラム。
  5. 複数の第1の電話端末と、全ての上記第1の電話端末から与えられた音声データを合成して合成音声データを作成する音声データ処理装置と、上記音声データ処理装置が作成した合成音声データの音声を出力する第2の電話端末とを有する電話通信システムにおける音声データ処理方法において、
    指定音量値登録手段、音声データ加工手段、音声データ合成手段、指定音量値挿入手段を有し、
    上記指定音量値登録手段は、上記音声データ処理装置において、上記各第1の電話端末の識別情報と指定音量値とを対応付けて登録し、
    上記音声データ加工手段は、上記音声データ処理装置において、上記各第1の電話端末から与えられた音声データを、上記指定音量値登録手段に登録されている指定音量値に基づいて音量調整した音量データに加工し、
    上記音声データ合成手段は、上記音声データ処理装置において、上記音声データ加工手段により加工された音声データを合成して、合成音声データを作成し、
    上記各第1の電話端末から上記第2の電話端末に与えられる音声データは、上記各第1の電話端末の電話端末から上記第2の電話端末に与えられるパケットに挿入されており、
    上記指定音量値挿入手段は、上記音声データ処理装置において、上記各第1の電話端末からパケットが与えられると、そのパケットに挿入されている送信元の第1の電話端末の識別情報に対応する指定音量値を、上記指定音量値登録手段に登録されている情報から検出し、検出した指定音量値のデータを、そのパケットに挿入し、
    上記音声データ加工手段は、上記音声データ処理装置において、上記指定音量値挿入手段により指定音量値が挿入されたパケットから、挿入されている音声データと指定音量値を抽出し、抽出した音声データを、抽出した指定音量値に基づいて音量を調整した音声データに加工する
    ことを特徴とする音声データ処理方法。
JP2008216792A 2008-08-26 2008-08-26 電話通信システム、並びに、音声データ処理装置、プログラム及び方法 Active JP5200764B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008216792A JP5200764B2 (ja) 2008-08-26 2008-08-26 電話通信システム、並びに、音声データ処理装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008216792A JP5200764B2 (ja) 2008-08-26 2008-08-26 電話通信システム、並びに、音声データ処理装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2010056634A JP2010056634A (ja) 2010-03-11
JP5200764B2 true JP5200764B2 (ja) 2013-06-05

Family

ID=42072140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008216792A Active JP5200764B2 (ja) 2008-08-26 2008-08-26 電話通信システム、並びに、音声データ処理装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP5200764B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11393448B2 (en) 2017-01-27 2022-07-19 Nec Corporation Wireless terminal, server, communications method for wireless terminal, and recording medium for further enhancing voice synthesis in a mobile communication system
JP7430076B2 (ja) 2020-02-21 2024-02-09 株式会社タムラ製作所 無線システム、主装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004032296A (ja) * 2002-06-25 2004-01-29 Sanyo Electric Co Ltd 通信装置
JP2006148816A (ja) * 2004-11-24 2006-06-08 Nec Corp 中継制御装置、多地点間会議システム及び多地点間会議方法

Also Published As

Publication number Publication date
JP2010056634A (ja) 2010-03-11

Similar Documents

Publication Publication Date Title
US8385513B2 (en) Processing a received voicemail message
CN1284335C (zh) 基于预测的平均主观评估得分值的呼叫路由选择方法
US7697947B2 (en) Method of combining audio signals in a wireless communication device
US20080037749A1 (en) Adjusting audio volume in a conference call environment
JP4738058B2 (ja) リアルタイムマルチメディア情報の効率的なルーティング
US7539486B2 (en) Wireless teleconferencing system
US8504605B2 (en) Proximity filtering of multiparty VoIP communications
US7697511B2 (en) Selective voice switching of multiparty communications
US8971217B2 (en) Transmitting packet-based data items
US20070263607A1 (en) Extensible metadata structure
JP2006262467A (ja) ネットワークにおいて音声信号を処理する方法およびプッシュ・トゥ・トーク電話システム
JP5200764B2 (ja) 電話通信システム、並びに、音声データ処理装置、プログラム及び方法
JP2005045738A (ja) 通話装置及び通話方法、並びに通話システム
JP2007235810A (ja) 携帯電話システムおよび携帯電話装置
JP2012151555A (ja) テレビ会議システム、テレビ会議中継装置、テレビ会議中継方法および中継プログラム
JP4513514B2 (ja) 多地点通話システム、携帯端末装置及びそれらに用いる音量調整方法並びにそのプログラム
US8483409B2 (en) Volume adjustment for multiple voice over internet protocal streams
JP4440166B2 (ja) 電話機、サーバ装置及び通信方法
US20110235632A1 (en) Method And Apparatus For Performing High-Quality Speech Communication Across Voice Over Internet Protocol (VoIP) Communications Networks
JP2010109738A (ja) Ipボタン電話装置
JP2006319779A (ja) テレビ会議制御装置、テレビ会議制御方法およびそのコンピュータ・プログラム
US8335209B2 (en) Group paging synchronization for VoIP system
US8767942B2 (en) Muting audio in turret switching systems
JP2006210973A (ja) 通信端末装置およびそのセッション接続方法
JP4207701B2 (ja) 通話装置及び通話方法、並びに通話システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110322

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130128

R150 Certificate of patent or registration of utility model

Ref document number: 5200764

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3