JP4836705B2 - Ip電話多者通話システム - Google Patents

Ip電話多者通話システム Download PDF

Info

Publication number
JP4836705B2
JP4836705B2 JP2006217834A JP2006217834A JP4836705B2 JP 4836705 B2 JP4836705 B2 JP 4836705B2 JP 2006217834 A JP2006217834 A JP 2006217834A JP 2006217834 A JP2006217834 A JP 2006217834A JP 4836705 B2 JP4836705 B2 JP 4836705B2
Authority
JP
Japan
Prior art keywords
voice
packet
terminal
call terminal
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006217834A
Other languages
English (en)
Other versions
JP2008042798A (ja
Inventor
嘉英 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
On Semiconductor Trading Ltd
Original Assignee
On Semiconductor Trading Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by On Semiconductor Trading Ltd filed Critical On Semiconductor Trading Ltd
Priority to JP2006217834A priority Critical patent/JP4836705B2/ja
Publication of JP2008042798A publication Critical patent/JP2008042798A/ja
Application granted granted Critical
Publication of JP4836705B2 publication Critical patent/JP4836705B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

本発明は、IP電話多者通話システムに関する。
通信網を介して情報を交換することによって、遠隔地間の会議を可能とする電話会議システムが用いられている。
特許文献1には、3台の電話機を相互に繋いで3者間の会議を可能とする電話会議システムが開示されている。また、特許文献2には、複数の電話機を相互に接続して会議を行う際に、話者を表示する電話会議システムの話者表示方法が開示されている。このシステムでは、会議に用いられている電話機を表示すると共に、現在発言中の話者に対応する電話機を点滅表示する。
また、特許文献3には、3者以上で通話を行う際に、現在接続されている相手と、現在の話者を視覚的に表示できる話者通知システムが開示されている。具体的には、携帯電話端末を複数話者通話用交換機に接続し、複数話者通話用交換機は接続されている携帯電話端末の情報をそれぞれの携帯電話端末に通知するとともに、現在どの携帯電話端末の話者が話をしているか検出し、その情報を各携帯電話端末へ通知する。これによって、携帯電話端末は複数話者通話用交換機から通知される各携帯電話端末の情報を接続先/話者情報
表示部に表示するとともに、複数話者通話用交換機から通知される現在の話者情報も表示する。
また、近年、インターネット等のデジタル通信網を介して、UDP/IP等の所定のプロトコルにそって音声信号を通信することによって複数地点を接続して会議を行う電話会議システムが用いられるようになっている。このような電話会議システムのプロトコルとしてVoIP(Voice over Internet Protocol)が知られている。
図8に、VoIPに沿った電話会議システムにおいて用いられる端末の基本構成を示す。マイクなどにより端末に入力されたアナログの音声信号は、アナログ/デジタル変換器10においてリニアPCMデータ等のデジタル信号に変換され、接続される複数の端末に対応するそれぞれのエンコーダ12a,12b・・・に入力される。各エンコーダ12a,12b・・・では、デジタルの音声信号が符号化データに変換され、CPU14に受け渡される。CPU14では、符号化データに接続先となる端末のIPアドレス、送信元となる端末のIPアドレス等が付されたパケットに変換され、ネットワークインターフェース等を介してIP網に出力される。
一方、IP網から音声情報を含むパケットが受信された場合、CPU14で1つ又は複数のパケットから符号化された音声データが再現される。CPU14は、パケットの送信元の端末をIPアドレスから特定し、端末毎に割り当てられているデコーダ16a,16b・・・のいずれかに対応する音声データを入力する。各デコーダ16a,16b・・・では、入力された符号化データをリニアPCMデータ等に変換して、ミキサ18へ入力する。ミキサ18では、各デコーダ16a,16b・・・において生成された音声データがミキシングされて、デジタル/アナログ変換器20へ出力される。デジタル/アナログ変換器20では、ミキシングされた音声データがアナログ信号に変換されてスピーカ等から出力される。
特開昭62−195966号公報 特開昭64−085464号公報 特開2004−064236号公報
ところで、VoIPに則って3以上の地点を相互に接続して通話を行う場合、通話相手が男性と女性である場合等は通話相手を容易に特定することができるが、通話相手の性別が同じであり、かつ、音声が似通っている場合には、誰が現在の話している話者なのかを特定することが困難である。そのため、会話の内容が把握し難くなり、会議がスムーズに進行し難いという問題がある。
本発明は、インターネットを介して他の通話端末からパケットを受信する受信手段と、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定する音声判定手段と、前記受信手段において受信されたパケットの送信元を特定する端末特定手段と、前記音声判定手段においてパケットに有効な音声信号が含まれていると判断された場合に、前記受信手段において当該パケットの送信元として特定された通話端末を示す表示を行う表示手段と、を備えることを特徴とする通話端末である。
上記通話端末は、例えば、通話端末を示す表示を行う表示手段を備えたコンピュータを、インターネットを介して他の通話端末からパケットを受信する受信手段と、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定する音声判定手段と、前記受信手段において受信されたパケットの送信元を特定する端末特定手段と、として機能させ、前記音声判定手段においてパケットに有効な音声信号が含まれていると判断された場合に、前記表示手段に当該パケットの送信元として特定された通話端末を示す表示を行わせることを特徴とする通話端末プログラムにより実現することができる。
このように、パケットの送信元を特定することによって、どの通話端末から送られてきた音声(有効な音声信号)が再生されているのかを容易に把握させることができる。
ここで、前記音声判定手段を複数備え、前記端末特定手段において特定されたパケットの送信元に基づいて、送信元毎に定められた前記音声判定手段に前記受信手段において受信されたパケットを入力して、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定することが好適である。これによって、複数の送信元からのパケットを扱うことが可能となる。
また、前記端末特定手段は、パケットに含まれる送信元のネットワークアドレスに基づいて前記受信手段において受信されたパケットの送信元を特定することが好適である。この場合、送信元の通話端末において特別な処理を行うことなく、TCP/IP等のプロトコルに則った通信方式において有効な音声信号の送信元となる通話端末を容易に把握させることができる。
また、前記パケットがRTPパケットである場合、前記端末特定手段は、RTPパケットに含まれる拡張部に含まれる端末特定情報に基づいて前記受信手段において受信されたパケットの送信元を特定することが好適である。RTPパケットは、リアルタイムの音声信号を通信するためのプロトコルであり、その拡張部に端末特定情報を含めることによって、有効な音声信号の送信元となる通話端末を容易に把握させることができる。
また、前記表示手段は、パケットから抽出された音声信号のエネルギー値を示すことが好適である。例えば、音声信号のエネルギー値をイコライザー形式で表示するとよい。
また、本発明は、信号内に有効な音声信号が含まれているか否かを判定する音声判定手段と、前記信号を音声データとしてパケット化してインターネットへ送出する手段であって、前記音声判定手段において前記信号内に有効な音声信号が含まれていると判定された場合に前記信号が入力された通話端末を特定する端末特定情報をパケットに付加して送信する送信手段と、を備えることを特徴とする通話端末である。
上記通話端末は、例えば、コンピュータを、信号内に有効な音声信号が含まれているか否かを判定する音声判定手段と、前記信号を音声データとしてパケット化してインターネットへ送出する手段であって、前記音声判定手段において前記信号内に有効な音声信号が含まれていると判定された場合に前記信号が入力された通話端末を特定する端末特定情報をパケットに付加して送信する送信手段と、として機能させることを特徴とする通話端末プログラムにより実現することができる。
このように、パケットの送信元を特定する端末特定情報をパケットに含めることによって、受信先となる通話端末において、パケットにどの通話端末から送られてきた音声信号が含まれているのかを容易に判定でき、その情報をユーザに呈示することができる。
ここで、前記パケットがRTPパケットである場合には、前記送信手段は、RTPパケットに含まれる拡張部に前記端末特定情報を付加して送信を行うことが好適である。RTPパケットは、リアルタイムの音声信号を通信するためのプロトコルであり、その拡張部に端末特定情報を含めることによって、有効な音声信号の送信元となる通話端末を容易に把握させることができる。
また、前記送信手段は、前記信号内の有効な音声信号のエネルギー値を前記端末特定情報に含めることが好適である。これにより、受信先の通話端末において、例えば、音声信号のエネルギー値をイコライザー形式で表示することができる。
また、本発明は、インターネットを介して他の通話端末からパケットを受信する受信手段と、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定する音声判定手段と、前記受信手段において受信されたパケットの送信元を特定する端末特定手段と、音声信号をパケット化してインターネットへ送出する手段であって、前記受信手段において受信されたパケットから抽出された音声信号を音声データとしてパケット化し、前記音声判定手段において前記音声データに有効な音声信号が含まれていると判定された場合に、前記端末特定手段において特定された通話端末を示す端末特定情報を当該パケットに付加して送信する送信手段と、を備えることを特徴とする通話端末である。
上記通話端末は、例えば、コンピュータを、インターネットを介して他の通話端末からパケットを受信する受信手段と、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定する音声判定手段と、前記受信手段において受信されたパケットの送信元を特定する端末特定手段と、音声信号をパケット化してインターネットへ送出する手段であって、前記受信手段において受信されたパケットから抽出された音声信号を音声データとしてパケット化し、前記音声判定手段において前記音声データに有効な音声信号が含まれていると判定された場合に、前記端末特定手段において特定された通話端末を示す端末特定情報を当該パケットに付加して送信する送信手段と、として機能させることを特徴とする通話端末プログラムにより実現することができる。
このように、受信したパケットに有効な音声情報が含まれている場合に、そのパケットの送信元となる通話端末を特定し、そのパケットに含まれている音声情報を新たにパケット化して転送する際にその通話端末を特定する端末特定情報をパケットに付加することによって、そのパケットの受信先となる通話端末において、そのパケットにどの通話端末から送られてきた音声信号が含まれているのかを容易に判定でき、その情報をユーザに呈示することができる。
さらに、音声の入力を受けて音声信号を生成する音声入力手段と、前記音声入力手段において生成された音声信号に有効な音声信号が含まれているか否かを判定する音声検出手段と、を備え、前記送信手段は、前記音声入力手段において生成された音声信号及び前記受信手段において受信されたパケットから抽出された音声信号を音声データとしてパケット化し、前記音声判定手段において前記音声データに有効な音声信号が含まれていると判定された場合に前記端末特定手段において特定された通話端末を示す端末特定情報を当該パケットに付加し、前記音声検出手段において有効な音声信号が含まれていると判定された場合に前記音声入力手段を備える通話端末を示す端末特定情報を当該パケットに付加して送信することも好適である。
このように通話端末は、前記通話端末プログラムにおいて、さらに音声入力手段を備えたコンピュータを、前記音声入力手段において生成された音声信号に有効な音声信号が含まれているか否かを判定する音声検出手段と、として機能させ、前記送信手段は、前記音声入力手段において生成された音声信号及び前記受信手段において受信されたパケットから抽出された音声信号を音声データとしてパケット化し、前記音声判定手段において前記音声データに有効な音声信号が含まれていると判定された場合に前記端末特定手段において特定された通話端末を示す端末特定情報を当該パケットに付加し、前記音声検出手段において有効な音声信号が含まれていると判定された場合に前記音声入力手段を備える通話端末を示す端末特定情報を当該パケットに付加して送信する手段として機能させる通話端末プログラムにより実現することができる。
これによって、受信したパケットに含まれる音声情報に加えて、新たに音声入力手段で取得された音声信号もパケットに含めて送信することができる。このとき、新たに取得された音声信号に有効な音声信号が含まれている場合、送信元となる通話端末を特定する端末特定情報をパケットに付加することによって、そのパケットの受信先となる通話端末において、そのパケットに新たな音声信号がどの通話端末から送信されてきたのかを容易に判定でき、その情報をユーザに呈示することができる。
また、前記音声判定手段を複数備え、前記端末特定手段において特定されたパケットの送信元に基づいて、送信元毎に定められた前記音声判定手段に前記受信手段において受信されたパケットを入力して、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定し、前記送信手段は、複数の前記音声判定手段のうち音声データに有効な音声信号が含まれていると判定した音声判定手段に対応する送信元である通話端末を示す端末特定情報をパケットに付加して送信することが好適である。これによって、複数の送信元からのパケットを扱うことが可能となる。
また、前記音声判定手段においてパケットに有効な音声信号が含まれていると判断された場合に、前記受信手段において当該パケットの送信元として特定された通話端末を示す表示を行う表示手段をさらに備えることが好適である。このように、パケットの送信元を特定することによって、どの通話端末から送られてきた音声(有効な音声信号)が再生されているのかを容易に把握させることができる。
また、前記パケットがRTPパケットである場合、前記送信手段は、RTPパケットに含まれる拡張部に前記端末特定情報を付加して送信を行うことが好適である。RTPパケットの拡張部に端末特定情報を含めることによって、有効な音声信号の送信元となる通話端末を容易に把握させることができる。
また、前記送信手段は、前記信号内の有効な音声信号のエネルギー値を前記端末特定情報に含めることが好適である。これにより、受信先の通話端末において、例えば、音声信号のエネルギー値をイコライザー形式で表示することができる。
本発明によれば、IP電話により多者通話を行う際に、話者(通話端末)を容易に把握することができる。
<第1の実施の形態>
図1に、本発明の実施の形態における電話会議システムの構成の概念図を示す。ここでは、Aさん、Bさん、Cさんの3者間においてVoIPに則って電話会議を行う場合について示している。ただし、これに限定されるものではなく、さらに多くの地点を接続して会議を行う場合も同様である。
Aさんが使用する通話端末100Aからは、Bさん及びCさんの使用する通話端末100B,100CへそれぞれAさんの音声データが送信される。同様に、Bさんが使用する通話端末100Bからは、Aさん及びCさんの使用する通話端末100A,100CへそれぞれBさんの音声データが送信される。また、Cさんが使用する通話端末100Cからは、Aさん及びBさんの使用する通話端末100A,100BへそれぞれCさんの音声データが送信される。
図2に、通話端末100A,100B,100Cの構成を示す。通話端末100A,100B,100Cは、それぞれ同様の構成を有しており、マイク30、アナログ/デジタル変換器32、エンコーダ34、CPU36、通信インターフェース38、デコーダ40a,40b、ミキサ42、スピーカ44及び話者表示部46を含んで構成される。通話端末100Aは、通信インターフェース38を介して、インターネットに接続されており、UDP/IPプロトコル上で展開されるVoIPにより他の通話端末と音声信号の通信を行う。
まず、通話端末100Aから他の通話端末100B,100Cへ音声データを送信する場合について説明する。以下の処理は通話端末100Aで行われる。
マイク30を用いてAさんが音声を入力すると、アナログ/デジタル変換器32において音声信号がデジタル化されたリニアPCMデータに変換されてエンコーダ34に入力される。エンコーダ34では、リニアPCMデータに変換された音声信号が符号化される。音声信号のダイナミックレンジを50dB程度に設定した場合、12ビット程度のデジタル信号に量子化及び符号化すればよい。符号化された音声データはCPU36に入力される。
CPU36は、音声データをVoIPに則ったRTPパケット(Real−Time Transport Protocol Packet)に変換する。符号データ毎のフレーミングは、RFC3551やRFC1889等のプロトコルに則って行われる。
RTPパケットは、図3に示すように、IPヘッダ部、UDPヘッダ部、RTPヘッダ部及び符号データ部を含んで構成される。RTPでは、符号データのフレーミングを行う。PTPヘッダ部は、基本部は8ビット×15のビット数で構成され、図4に示すように、識別部、シーケンス番号、タイムスタンプ、同期送信元(SSRC)識別子及び寄与送信元(CSRC)識別子を含む。
識別部は、RTPのバージョン番号(RFC1889は2)を示すバージョンビット(V)、パディング・データを示すパディングビット(P)、拡張ヘッダの有無を示す拡張ビット(X)、CSRC識別子の数を示すCSRCビット(CC)、使用方法が次のペイロードタイプ毎に定義可能なマーカービット(M)、伝送する符号データの種類を示すペイロードタイプビット(PT)を含んで構成される。
CPU36は、図3に示すように、さらにRTPパケットにUDPヘッダ及びIPヘッダを付加して音声データをインターネットで送信可能なパケットに変換する。すなわち、Bさんが使用する通信端末100Bに送信されるパケットには、送信元となるAさんの使用する通話端末100AのIPアドレス及び送信先となるBさんの使用する通信端末100BのIPアドレスが付与される。また、Cさんが使用する通信端末100Cに送信されるパケットには、送信元となるAさんの使用する通話端末100AのIPアドレス及び送信先となるCさんの使用する通信端末100CのIPアドレスが付与される。
CPU36においてパケット化された音声データは、通信インターフェース38を介してネットワークへ送出される。これによって、ネットワークを介して、Aさんの通話端末100Aから通話端末100B,100CのそれぞれのIPアドレスが送信先として付与されたパケットが送信される。
Bさんが使用する通話端末100Bから通話端末100A,100Cへ音声データを送信する場合、Cさんが使用する通話端末100Cから通話端末100A,100Bへ音声データを送信する場合も同様に処理が行われる。
次に、通話端末100Aにおいて他の通話端末100B,100Cから送信されてきた音声データを受信する場合について説明する。以下の処理は通話端末100Aで行われる。
CPU36は、通信インターフェース38を介して、通話端末100AのIPアドレスが送信先として付加されているパケットをネットワークから受信する。CPU36は、受信したパケット毎に付されている送信元の通話端末のIPアドレスから、その送信元が通話端末100Bか通話端末100Cであるかを判定し、送信元毎にパケットに含まれる符号データを組み合わせて音声データを再現する。
CPU36は、1組のパケット群から音声データを再現すると、通話端末毎に設けられているデコーダに音声データを出力する。すなわち、通話端末100Bが送信元であるパケットから再現された音声データはデコーダ40aへ入力され、通話端末100Cが送信元であるパケットから再現された音声データはデコーダ40bへ入力される。
デコーダ40a,40bは、CPU36から入力された音声データをリニアPCMデータの音声信号に復号化する。すなわち、デコーダ40aでは、Bさんが使用する通話端末100Bから送信されてきた音声データが復号化される。また、デコーダ40bでは、Cさんが使用する通話端末100Cから送信されてきた音声データが復号化される。復号化された音声信号はミキサ42へ出力される。
さらに、デコーダ40a,40bは、既存のVAD方法(Voice Activity Detection)等によりそれぞれが復号化する音声データ内に有効な音声信号が含まれているか否かを判定して、有効な音声信号が含まれているか否かを示す音声フラグを話者表示部46へ出力する。
ミキサ42は、デコーダ40a,40bから入力された音声信号をミキシングしてスピーカ44へ送信し、音声として出力させる。このとき、スピーカ44にはデジタル/アナログ変換器及びアンプ等を設けてデジタル信号をアナログ信号に変換して、音声信号を増幅するなどの処理を行ってもよい。
話者表示部46は、デコーダ40a,40bから入力された音声フラグに基づいて、現在スピーカ44から出力されている音声の話者が誰であるかを示す表示を行う。例えば、話者表示部46は、通話端末100B,100C毎に対応する発光ダイオードを備えており、デコーダ40a,40bから入力された音声フラグに基づいて有効音声信号を含む音声データの送信元である通話端末100B,100Cに対応する発光ダイオードを点灯させる。すなわち、デコーダ40aから入力された音声フラグが有効音声信号を含むことを示しているものである場合には通話端末100Bに対応する発光ダイオードを点灯させ、デコーダ40bから入力された音声フラグが有効音声信号を含むことを示しているものである場合には通話端末100Cに対応する発光ダイオードを点灯させる。
なお、デコーダ40a,40bでは、復号化する音声データ内の有効な音声信号のエネルギーを検出してそのエネルギー値を示すエネルギー信号を話者表示部46へ出力するものとしてもよい。この場合、話者表示部46は、デコーダ40a,40bから入力されたエネルギー信号に基づいて、現在スピーカ44から出力されている音声の話者毎にその音声のエネルギーを示す表示を行う。例えば、話者表示部46は、通話端末100B,100C毎にイコライザー形式の表示部を備えており、デコーダ40a,40bから入力されたエネルギー信号に基づいて有効音声信号を含む音声データの送信元である通話端末100B,100Cに対応する表示部を点灯させる。すなわち、デコーダ40aから入力されたエネルギー信号に応じて通話端末100Bに対応するイコライザー形式の発光部を点灯させ、デコーダ40bから入力されたエネルギー信号に応じて通話端末100Cに対応するイコライザー形式の発光部を点灯させる。
Bさんが使用する通話端末100Bにおいて通話端末100A,100Cから送信されてきた音声データを受信・再生する場合、Cさんが使用する通話端末100Cにおいて通話端末100A,100Bから送信された音声データを受信・再生する場合も同様に処理が行われる。
<第2の実施の形態>
図5に、本発明の実施の形態における電話会議システムの構成の概念図を示す。ここでは、Aさん、Bさん、Cさんの3者間においてVoIPに則って電話会議を行う場合について示している。ただし、これに限定されるものではなく、さらに多くの地点を接続して会議を行う場合も同様である。
Aさんが使用する通話端末200AにはBさん及びCさんの使用する通話端末200B,200Cから音声データか直接送信される。一方、Bさんが使用する通話端末200Bへは、Aさんの使用する通話端末200Aからの音声信号とCさんの使用する通話端末200Cからの音声信号とが重畳された音声データがAさんの使用する通話端末200Aから送信される。また、Cさんが使用する通話端末200Cへは、Aさんの使用する通話端末200Aからの音声信号とBさんの使用する通話端末200Bからの音声信号とが重畳された音声データがAさんの使用する通話端末200Aから送信される。
図6に、本実施の形態における通話端末200Aの構成を示す。通話端末200Aは、マイク30、アナログ/デジタル変換器32、音声検出部31、ミキサ33a,33b、エンコーダ34a,34b、CPU36、通信インターフェース38、デコーダ40a,40b、ミキサ42、スピーカ44及び話者表示部46を含んで構成される。通話端末200Aにおいて、上記通話端末100Aと同じ機能を有する構成要素には同じ符号を付している。
通話端末200Aは、通信インターフェース38を介して、インターネットに接続されており、UDP/IPプロトコル上で展開されるVoIPにより他の通話端末と音声信号の通信を行う。
まず、通話端末200Aにおいて他の通話端末200B,200Cから送信されてきた音声データを受信する場合について説明する。以下の処理は通話端末200Aで行われる。
CPU36は、通信インターフェース38を介して、通話端末200AのIPアドレスが送信先として付加されているパケットをネットワークから受信する。CPU36は、受信したパケット毎に付されている送信元の通話端末のIPアドレスから、その送信元が通話端末200Bか通話端末200Cであるかを判定し、送信元毎にパケットに含まれる符号データを組み合わせて音声データを再現する。
CPU36は、1組のパケット群から音声データを再現すると、通話端末毎に設けられているデコーダに音声データを出力する。すなわち、通話端末200Bが送信元であるパケットから再現された音声データはデコーダ40aへ入力され、通話端末200Cが送信元であるパケットから再現された音声データはデコーダ40bへ入力される。
デコーダ40a,40bは、CPU36から入力された音声データをリニアPCMデータの音声信号に復号化する。すなわち、デコーダ40aでは、Bさんが使用する通話端末200Bから送信されてきた音声データが復号化される。また、デコーダ40bでは、Cさんが使用する通話端末200Cから送信されてきた音声データが復号化される。本実施の形態では、復号化された音声信号はミキサ42へ出力されると共に、エンコーダ34a,34bにも出力される。
なお、本実施の形態においても、デコーダ40a,40bは、既存のVAD方法(Voice Activity Detection)等によりそれぞれが復号化する音声データ内に有効な音声信号が含まれているか否かを判定して、有効な音声信号が含まれているか否かを示す音声フラグを話者表示部46へ出力すると共に、CPU36へ出力する。
ミキサ42は、デコーダ40a,40bから入力された音声信号をミキシングしてスピーカ44へ送信し、音声として出力させる。このとき、アンプ等を設けて音声信号を増幅するなどの処理を行ってもよい。
話者表示部46は、デコーダ40a,40bから入力された音声フラグに基づいて、現在スピーカ44から出力されている音声の話者が誰であるかを示す表示を行う。上記第1の実施の形態と同様に、話者表示部46は、通話端末200B,200C毎に対応する発光ダイオードを備えており、デコーダ40a,40bから入力された音声フラグに基づいて有効音声信号を含む音声データの送信元である通話端末200B,200Cに対応する発光ダイオードを点灯させる。また、デコーダ40a,40bでは、復号化する音声データ内の有効な音声信号のエネルギーを検出してそのエネルギー値を示すエネルギー信号を話者表示部46へ出力するものとし、話者表示部46は、デコーダ40a,40bから入力されたエネルギー信号に基づいてイコライザー形式に表示部を点灯させるものとしてもよい。
次に、通話端末200Aから他の通話端末200B,200Cへ音声データを送信する場合について説明する。以下の処理は通話端末200Aで行われる。
マイク30を用いてAさんが音声を入力すると、アナログ/デジタル変換器32において音声信号がデジタル化されたリニアPCMデータに変換されて音声検出部31及びミキサ33a,33bに入力される。
音声検出部31は、アナログ/デジタル変換器32からの信号を受けて、既存のVAD方法(Voice Activity Detection)等により信号に有効な音声信号が含まれているか否かを判定して、有効な音声信号が含まれているか否かを示す音声フラグをCPU36へ出力する。すなわち、音声検出部31では、マイク30にAさんの音声が入力されているか否かを判定し、Aさんの音声信号が含まれているか否かを示す音声フラグをCPU36へ出力する。
ミキサ42は、デコーダ40a,40bから入力された音声信号をミキシングしてスピーカ44へ送信し、音声として出力させる。このとき、アンプ等を設けて音声信号を増幅するなどの処理を行ってもよい。
ミキサ33aは、アナログ/デジタル変換器32から出力されたAさんの音声信号と、上記処理によってデコーダからBさんの通話端末200Bから送信されてきたパケットから再現されたBさんの音声信号と、を受けて、それらの信号をミキシングしてエンコーダ34aへ出力する。ミキサ33bは、アナログ/デジタル変換器32から出力されたAさんの音声信号と、上記処理によってデコーダからCさんの通話端末200Cから送信されてきたパケットから再現されたCさんの音声信号と、を受けて、それらの信号をミキシングしてエンコーダ34bへ出力する。
エンコーダ34aは、ミキサ33aから信号を受けて、Aさん及びBさんの音声をミキシングして得られたリニアPCMデータを符号化する。符号化された音声データはCPU36に入力される。エンコーダ34bは、ミキサ33bから信号を受けて、Aさん及びCさんの音声をミキシングして得られたリニアPCMデータを符号化する。符号化された音声データはCPU36に入力される。
CPU36は、エンコーダ34a,34bから音声データを受けて、それぞれをVoIPに則ったRTPパケット(Real−Time Transport Protocol Packet)に変換する。符号データ毎のフレーミングは、RFC3551やRFC1889等のプロトコルに則って行われる。RTPヘッダ部は、図4に示したように、識別部、シーケンス番号、タイムスタンプ、同期送信元(SSRC)識別子及び寄与送信元(CSRC)識別子を含むが、本実施の形態では、寄与送信元(CSRC)識別子の後にさらに拡張部を備える。
CPU36は、RTPヘッダの識別部における拡張ビット(X)を1とする。これにより、RTPパケットに拡張部が含まれることが示される。拡張部には、音声データに含まれる音声信号を受け付けた通話端末を特定する端末特定情報が設定される。すなわち、CPU36は、音声検出部31及びデコーダ40a,40bから音声フラグを受けて、RTPパケットに載せられる符号データに含まれる音声データが入力された通話端末がどれであるかを示す端末特定情報をRTPパケットに拡張部に設定する。
すなわち、音声検出部31からの音声フラグがAさんの音声が含まれることを示していれば、Aさん及びBさんの音声信号を符号化した音声データを載せるRTPパケット及びAさん及びCさんの音声信号を符号化した音声データを載せるRTPパケットのいずれかの拡張部にAさんが使用する通話端末200Aを特定する端末特定情報を設定する。さらに、デコーダ40aからの音声フラグがBさんの音声が含まれることを示していれば、Aさん及びBさんの音声信号を符号化した音声データを載せるRTPパケットの拡張部にBさんが使用する通話端末200Bを特定する端末特定情報を設定する。同様に、デコーダ40bからの音声フラグがCさんの音声が含まれることを示していれば、Aさん及びCさんの音声信号を符号化した音声データを載せるRTPパケットの拡張部にCさんが使用する通話端末200Cを特定する端末特定情報を設定する。
CPU36は、図3に示すように、さらにRTPパケットにUDPヘッダ及びIPヘッダを付加して音声データをインターネットで送信可能なパケットに変換する。すなわち、Aさん及びCさんの音声信号を符号化した音声データを載せたRTPパケットはBさんが使用する通信端末200Bに送信されるパケットであるので、送信元となるAさんの使用する通話端末200AのIPアドレス及び送信先となるBさんの使用する通信端末200BのIPアドレスが付与される。また、Aさん及びBさんの音声信号を符号化した音声データを載せたRTPパケットはCさんが使用する通信端末200Cに送信されるパケットであるので、送信元となるAさんの使用する通話端末200AのIPアドレス及び送信先となるCさんの使用する通信端末200CのIPアドレスが付与される。
CPU36においてパケット化された音声データは、通信インターフェース38を介してネットワークへ送出される。これによって、ネットワークを介して、Aさんの通話端末200Aから通話端末200B,200CのそれぞれのIPアドレスが送信先として付与されたパケットが送信される。
図7に、本実施の形態における通話端末200B,200Cの構成を示す。通話端末200B,200Cは、マイク30、アナログ/デジタル変換器32、エンコーダ34、CPU36、通信インターフェース38、デコーダ40、スピーカ44及び話者表示部46を含んで構成される。通話端末200B,200Cにおいて、上記通話端末200Aと同じ機能を有する構成要素には同じ符号を付している。
通話端末200B,200Cは、通信インターフェース38を介して、インターネットに接続されており、UDP/IPプロトコル上で展開されるVoIPにより通話端末200Aと音声信号の通信を行う。
まず、通話端末200Bにおいて通話端末200Aから送信されてきた音声データを受信する場合について説明する。以下、通話端末200Bで行われる処理について説明するが、通話端末200Cにおいても同様に通話端末200Aから送信されてきた音声データを受信することができる。
CPU36は、通信インターフェース38を介して、通話端末200BのIPアドレスが送信先として付加されているパケットをネットワークから受信する。CPU36は、パケットに含まれる符号データを組み合わせて音声データを再現する。CPU36は、1組のパケット群から音声データを再現すると、通話端末毎に設けられているデコーダ40に音声データを出力する。
また、CPU36は、RTPヘッダの識別部における拡張ビット(X)が1であると、RTPパケットの拡張部を調査し、拡張部に設定されている端末特定情報を抽出する。拡張部に端末特定情報が含まれていない場合、受信したRTPパケットに載せられた信号に誰の音声も含まれていないことを示す音声フラグ(例えば0)を話者表示部46へ出力する。拡張部にAさんが使用する通話端末200Aの端末特定情報のみが含まれている場合、受信したRTPパケットに載せられた信号にAさんの音声のみが含まれていることを示す音声フラグ(例えば1)を話者表示部46へ出力する。拡張部にCさんが使用する通話端末200Cの端末特定情報のみが含まれている場合、受信したRTPパケットに載せられた信号にCさんの音声のみが含まれていることを示す音声フラグ(例えば2)を話者表示部46へ出力する。拡張部にAさん及びCさんが使用する通話端末200A,200Cの両方の端末特定情報が含まれている場合、受信したRTPパケットに載せられた信号にAさん及びCさんの音声が含まれていることを示す音声フラグ(例えば3)を話者表示部46へ出力する。
デコーダ40は、CPU36から入力された音声データをリニアPCMデータの音声信号に復号化する。デコーダ40から出力された音声信号はスピーカ44へ送信され、音声として出力される。このとき、スピーカ44にアンプ等を設けて音声信号を増幅するなどの処理を行ってもよい。
話者表示部46は、CPU36から入力された音声フラグに基づいて、現在スピーカ44から出力されている音声の話者が誰であるかを示す表示を行う。話者表示部46は、Aさんの通話端末200A及びCさんの通話端末200C毎に対応する発光ダイオードを備えており、CPU36から入力された音声フラグに基づいて有効音声信号を含む音声データの送信元である通話端末200A,200Cに対応する発光ダイオードを点灯させる。
具体的には、誰の音声も含まれていないことを示す音声フラグ(例えば0)を受信した場合、話者表示部46へ出力する。拡張部に通話端末200Aの端末特定情報のみが含まれている場合、通話端末200A,200Cに対応する発光ダイオードのいずれも点灯させない。Aさんの通話端末200Aから入力された音声のみが含まれていることを示す音声フラグ(例えば1)を受信した場合、通話端末200Aに対応する発光ダイオードのみを点灯させる。Cさんの通話端末200Cから入力された音声のみが含まれていることを示す音声フラグ(例えば2)を受信した場合、通話端末200Cに対応する発光ダイオードのみを点灯させる。Aさん及びCさんの通話端末200A,200Cの両方から入力された音声が含まれていることを示す音声フラグ(例えば3)を受信した場合、通話端末200A,200Cに対応する両方の発光ダイオードを点灯させる。
次に、通話端末200Bから通話端末200Aへ音声データを送信する場合について説明する。以下、通話端末200Bで行われる処理について説明するが、通話端末200Cにおいても同様に処理することができる。
マイク30を用いてBさんが音声を入力すると、アナログ/デジタル変換器32において音声信号がデジタル化されたリニアPCMデータに変換されてエンコーダ34に入力される。エンコーダ34では、リニアPCMデータに変換された音声信号が符号化される。符号化された音声データはCPU36に入力される。
CPU36は、音声データをVoIPに則ったRTPパケット(Real−Time Transport Protocol Packet)に変換する。符号データ毎のフレーミングは、RFC3551やRFC1889等のプロトコルに則って行われる。CPU36は、さらにRTPパケットにUDPヘッダ及びIPヘッダを付加して音声データをインターネットで送信可能なパケットに変換する。すなわち、送信元となるBさんの使用する通話端末200BのIPアドレス及び送信先となるAさんの使用する通信端末200AのIPアドレスが付与される。
CPU36においてパケット化された音声データは、通信インターフェース38を介してネットワークへ送出される。これによって、ネットワークを介して、Bさんの通話端末200Bから通話端末200AのIPアドレスが送信先として付与されたパケットが送信される。
なお、本実施の形態では、通話端末200Aにおける音声検出部31及びデコーダ40a,40bにおいて有効な音声信号が含まれるか否かを示す音声フラグを生成するものとしたが、これらにおいて音声信号内の有効な音声信号のエネルギーを検出してそのエネルギー値を示すエネルギー信号をCPU36へ出力するものとしてもよい。この場合、CPU36は、RTPパケットに乗せられる音声データに含まれる有効な音声信号の話者毎のエネルギー値をRTPパケットの拡張部に設定する。一方、受け手となる通話端末200B,200CのCPU36では、RTPパケットの拡張部に設定された話者毎のエネルギー値を抽出して話者表示部46へ出力する。話者表示部46では、入力された信号に基づいて、話者毎にエネルギー値をイコライザー形式に表示させる。
なお、音声検出部31、ミキサ33、エンコーダ34、CPU36、デコーダ40、ミキサ42の機能は、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)において通話端末プログラムを実行することによって実現することもできる。すなわち、通信インターフェース38において受信されたパケットから得られた音声データをDSP内で上記の通り処理することによって本願第1及び第2の実施の形態における通話端末を実現することができる。
第1の実施の形態における電話会議システムの構成を説明するための図である。 第1の実施の形態における通話端末の構成を示すブロック図である。 RTPパケットの構成を示す図である。 RTPヘッダの構成を示す図である。 第2の実施の形態における電話会議システムの構成を説明するための図である。 第2の実施の形態における通話端末の構成を示すブロック図である。 第2の実施の形態における通話端末の構成を示すブロック図である。 従来の電話会議システムにおける通話端末の構成を示すブロック図である。
符号の説明
10 アナログ/デジタル変換器、12a,12b エンコーダ、16a,16b デコーダ、18 ミキサ、20 デジタル/アナログ変換器、30 マイク、31 音声検出部、32 アナログ/デジタル変換器、33a,33b ミキサ、34,34a,34b エンコーダ、36 CPU、38 通信インターフェース、40,40a,40b デコーダ、42 ミキサ、44 スピーカ、46 話者表示部、100A〜C,200A〜200C 通話端末。

Claims (10)

  1. インターネットを介して他の通話端末からパケットを受信する受信手段と、
    前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定する音声判定手段と、
    前記受信手段において受信されたパケットの送信元を特定する端末特定手段と、
    音声の入力を受けて音声信号を生成する音声入力手段と、
    前記音声入力手段において生成された音声信号に有効な音声信号が含まれているか否かを判定する音声検出手段と
    音声信号をパケット化してインターネットへ送出する送信手段と、
    を備え
    前記送信手段は、前記音声入力手段において生成された音声信号及び前記受信手段において受信されたパケットから抽出された音声信号を音声データとしてパケット化し、前記音声判定手段において前記音声データに有効な音声信号が含まれていると判定された場合に前記端末特定手段において特定された通話端末を示す端末特定情報を当該パケットに付加し、前記音声検出手段において有効な音声信号が含まれていると判定された場合に前記音声入力手段を備える通話端末を示す端末特定情報を当該パケットに付加して送信することを特徴とする通話端末。
  2. 請求項に記載の通話端末であって、
    前記音声判定手段を複数備え、
    前記端末特定手段において特定されたパケットの送信元に基づいて、送信元毎に定められた前記音声判定手段に前記受信手段において受信されたパケットを入力して、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定し、
    前記送信手段は、複数の前記音声判定手段のうち音声データに有効な音声信号が含まれていると判定した音声判定手段に対応する送信元である通話端末を示す端末特定情報をパケットに付加して送信することを特徴とする通話端末。
  3. 請求項1又は2に記載の通話端末であって、
    前記音声判定手段においてパケットに有効な音声信号が含まれていると判断された場合に、前記受信手段において当該パケットの送信元として特定された通話端末を示す表示を行う表示手段をさらに備えることを特徴とする通話端末。
  4. 請求項1〜3のいずれか1つに記載の通話端末であって、
    前記パケットはRTPパケットであり、
    前記送信手段は、RTPパケットに含まれる拡張部に前記端末特定情報を付加して送信を行うことを特徴とする通話端末。
  5. 請求項1〜4のいずれか1つに記載の通話端末であって、
    前記送信手段は、前記信号内の有効な音声信号のエネルギー値を前記端末特定情報に含めることを特徴とする通話端末。
  6. コンピュータを、
    インターネットを介して他の通話端末からパケットを受信する受信手段と、
    前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定する音声判定手段と、
    前記受信手段において受信されたパケットの送信元を特定する端末特定手段と、
    音声の入力を受けて音声信号を生成する音声入力手段と、
    前記音声入力手段において生成された音声信号に有効な音声信号が含まれているか否かを判定する音声検出手段と、
    音声信号をパケット化してインターネットへ送出する送信手段と、
    を備え、
    前記送信手段は、前記音声入力手段において生成された音声信号及び前記受信手段において受信されたパケットから抽出された音声信号を音声データとしてパケット化し、前記音声判定手段において前記音声データに有効な音声信号が含まれていると判定された場合に前記端末特定手段において特定された通話端末を示す端末特定情報を当該パケットに付加し、前記音声検出手段において有効な音声信号が含まれていると判定された場合に前記音声入力手段を備える通話端末を示す端末特定情報を当該パケットに付加して送信するように機能させることを特徴とする通話端末プログラム。
  7. 請求項6に記載の通話端末プログラムであって、
    前記音声判定手段を複数備え、
    前記端末特定手段において特定されたパケットの送信元に基づいて、送信元毎に定められた前記音声判定手段に前記受信手段において受信されたパケットを入力して、前記受信手段において受信されたパケットに含まれている音声データに有効な音声信号が含まれているか否かを判定し、
    前記送信手段は、複数の前記音声判定手段のうち音声データに有効な音声信号が含まれていると判定した音声判定手段に対応する送信元である通話端末を示す端末特定情報をパケットに付加して送信することを特徴とする通話端末プログラム。
  8. 請求項6又は7に記載の通話端末プログラムであって、
    前記音声判定手段においてパケットに有効な音声信号が含まれていると判断された場合に、前記受信手段において当該パケットの送信元として特定された通話端末を示す表示を行う表示手段をさらに備えることを特徴とする通話端末プログラム。
  9. 請求項6〜8のいずれか1つに記載の通話端末プログラムであって、
    前記パケットはRTPパケットであり、
    前記送信手段は、RTPパケットに含まれる拡張部に前記端末特定情報を付加して送信を行うことを特徴とする通話端末プログラム。
  10. 請求項6〜9のいずれか1つに記載の通話端末プログラムであって、
    前記送信手段は、前記信号内の有効な音声信号のエネルギー値を前記端末特定情報に含めることを特徴とする通話端末プログラム。

JP2006217834A 2006-08-10 2006-08-10 Ip電話多者通話システム Expired - Fee Related JP4836705B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006217834A JP4836705B2 (ja) 2006-08-10 2006-08-10 Ip電話多者通話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006217834A JP4836705B2 (ja) 2006-08-10 2006-08-10 Ip電話多者通話システム

Publications (2)

Publication Number Publication Date
JP2008042798A JP2008042798A (ja) 2008-02-21
JP4836705B2 true JP4836705B2 (ja) 2011-12-14

Family

ID=39177287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006217834A Expired - Fee Related JP4836705B2 (ja) 2006-08-10 2006-08-10 Ip電話多者通話システム

Country Status (1)

Country Link
JP (1) JP4836705B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081027A (ja) * 2008-09-24 2010-04-08 Nippon Telegr & Teleph Corp <Ntt> 通信装置
JP2010118809A (ja) * 2008-11-12 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 電話会議装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10215331A (ja) * 1997-01-30 1998-08-11 Toshiba Corp 音声会議システムとその情報端末装置
JP3045390B1 (ja) * 1999-02-17 2000-05-29 日本電気株式会社 電話会議装置
CN100574287C (zh) * 2002-07-04 2009-12-23 斯比德航海有限公司 管理分组交换电话会议
JP4238544B2 (ja) * 2002-08-30 2009-03-18 パナソニック株式会社 ハンズフリー電話装置

Also Published As

Publication number Publication date
JP2008042798A (ja) 2008-02-21

Similar Documents

Publication Publication Date Title
US8169937B2 (en) Managing a packet switched conference call
US7012901B2 (en) Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks
KR100607140B1 (ko) 인터넷 전화기
CN101427551B (zh) 会议端点的系统和方法
US7778206B2 (en) Method and system for providing a conference service using speaker selection
JP4870103B2 (ja) 圧縮された情報信号全体にわたって散在させられたデジタル・メッセージの伝送
KR20050088397A (ko) 음성 호출 경보를 제공하는 방법 및 장치
JP4836705B2 (ja) Ip電話多者通話システム
JP2008283667A (ja) VoIP通信装置
WO2021017807A1 (zh) 通话连接建立方法和第一终端、服务器及存储介质
US20100268529A1 (en) Voice communication apparatus
JPWO2003081897A1 (ja) ファクシミリ通信可能なVoIP端末およびその通信方法
JP2008141348A (ja) 通信装置
JP2005039461A (ja) 音声通信システム、方法及びプログラム並びに音声再生装置
JP2020053836A (ja) 中継装置
JP6289178B2 (ja) 通話会議システム
JP4154184B2 (ja) 音声端末及び音声通信方法
JP3963814B2 (ja) 親機電話端末装置および子機電話端末装置
JP3606206B2 (ja) パケット網電話網複合システム
JP2001345804A (ja) 電話システム、ターミナルアダプタ装置、及び電話機
JPH11308372A (ja) 情報通信装置
KR101000590B1 (ko) 키폰 시스템에서 엑스캐스트를 이용한 회의 기능 수행장치 및 그 방법
JP4127274B2 (ja) 電話音声認識システム
JP2006020074A (ja) 移動通信サービスシステム
JP2006100968A (ja) 発言者通知機能付き通信端末および発言者通知方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090803

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110516

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110927

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees