JP2007228506A - 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法 - Google Patents

多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法 Download PDF

Info

Publication number
JP2007228506A
JP2007228506A JP2006050074A JP2006050074A JP2007228506A JP 2007228506 A JP2007228506 A JP 2007228506A JP 2006050074 A JP2006050074 A JP 2006050074A JP 2006050074 A JP2006050074 A JP 2006050074A JP 2007228506 A JP2007228506 A JP 2007228506A
Authority
JP
Japan
Prior art keywords
call
mixing
voice
terminal
call server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006050074A
Other languages
English (en)
Other versions
JP4644813B2 (ja
Inventor
Matsuaki Terada
松昭 寺田
Masatoshi Sato
雅俊 佐藤
Kota Oshima
浩太 大島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo University of Agriculture and Technology NUC
Tokyo University of Agriculture
Original Assignee
Tokyo University of Agriculture and Technology NUC
Tokyo University of Agriculture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo University of Agriculture and Technology NUC, Tokyo University of Agriculture filed Critical Tokyo University of Agriculture and Technology NUC
Priority to JP2006050074A priority Critical patent/JP4644813B2/ja
Publication of JP2007228506A publication Critical patent/JP2007228506A/ja
Application granted granted Critical
Publication of JP4644813B2 publication Critical patent/JP4644813B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract


【課題】 複数の端末からの音声ストリームを高効率にミキシングを行う多者間通話システム、多者間通話システムにおける通話端末およびサーバ、多者間通話方法を実現する
【解決手段】 通話端末は、設定値以上の大きさの音声が入力されると、既に通話サーバとミキシング状態確立済みか調べ、確立されていない場合はSPEAKメッセージを送信してミキシング状態確立を通話サーバに要求する。ミキシング状態が確立できたら、通話サーバにRTPパケットを送信する。通話端末に一定時間音声の入力がない場合、通話端末は通話サーバにMUTEメッセージを送信してミキシング状態を終了する。
【選択図】 図1

Description

本発明は、複数の通話端末で多者間通話を行う多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法に関する。
IP(Internet Protocol)電話における応用サービスの一つとして多者間通話がある。多者間通話とは、多人数が同時に通話を行うサービスである。回線交換網では以前からMultipoint Conference Unit(MCU)と呼ばれる専用の機器を用いて電話会議等の多者間通話を行うことは可能であったが、この機器は高価であり、かつ通信業者のサービスでは無いため機器を所有している特定のコミュニティ向けのサービスであった。これに対してIP電話では、ソフトウェアベースでサービスを提供する事が可能であるため、一般利用者に対してもサービスの提供を行うことが可能である。
IP電話における多者間通話サービスには、主に2種類のサービスの提供形態がある。
一つは、ユーザ端末に多者間通話用の機能を新規に追加し、ユーザ同士が連携することでサービスを受ける形態である。この形態は、機能を有する端末を所有するユーザのみがサービスを受けることができるため、汎用性に乏しい。
もう一つは、サーバでサービスを提供する形態である。この形態では、サーバに負荷が集中するものの、ユーザの使い勝手が向上し、サービス提供業者の課金管理などが容易になる。
多者間通話サービスにおいて、IP電話の場合、対象に対して電話をかける「シグナリング」機能と、シグナリングにより相手と通話できることが確定した後に音声を送信する「全2重音声伝送」機能が必要となる。これらの機能は通常1対1の通信用である。
シグナリング機能では、端末(A、B、C)がそれぞれ多者間通話サーバに対して電話をかける。こうすることにより、見かけ上、Aは多者間通話サーバと1対1セッションを張っているだけであるが、サーバは他のユーザ(B、C)ともセッションを張っているため、A、B、Cはサーバを介して仮想的にマルチセッションを張っていることになる。
全2重音声伝送機能における「全2重」とは、自身の音声と相手の音声を同時に扱う事を意味する。全2重音声伝送機能では、ユーザから送信された音声を適切にミキシングし、複数の音声ストリームを一つのストリームに圧縮し、送出する。この全2重音声伝送機能を用いて複数の音声ストリームをやり取りすることが可能になる。
通話サーバを用いた従来のデジタル音声ミキシングシステムとして、「全参加者ミキシング」がある。これは複数の端末からの音声ストリームを通話サーバで受信して、各端末からの音声サンプルを重ね合わせるなどの手法により、ミキシングを行う。次に、ミキシング結果の音声ストリームをすべての端末に向けて送信することで多者間通話を実現する。このとき、通話サーバから全端末に送信される音声ストリームのうち、端末iから通話サーバへ送信された音声を端末iに返す場合については、音声がエコーとなって聞こえるのを防ぐため、自身の音声を差し引くことが知られている(非特許文献1参照)。
各端末ではマイクからの音声入力の有無によらず、通話サーバに音声ストリームを送り続ける。ただし、無音圧縮機能を有する端末の場合は、無音区間は音声パケットを送信しないで、クロックだけをカウントしておく。
Internet Telephony Workshop 2001「Centralized Conferencing using SIP」(2001.4)
多者間通話サーバを介するサービスでは、通話サーバにおける処理遅延が上乗せされる。ミキシングでは、波形の重ね合わせを行う場合、音声が8kHzサンプリングでは2つのストリームをミキシングする際に8000回/秒の処理を必要とする。また、ミキシングすべき端末の数に比例して処理量が大きくなる。
全参加者ミキシング方式は通話サーバに負荷が集中するため、通話サーバでミキシング可能な最大ストリーム数には限界がある。また通話サーバでは、端末からの音声データ送信があってもなくても、音声ストリームが来ているものとして、ミキシング処理をしていた。このため、端末数が多くなると、通話サーバの処理量が増大するという問題があった。また、無音区間があっても、次にいつ有音パケットが来るか予測できないので、上記無音圧縮機能を備えていても、通話サーバでミキシングすべき音声ストリーム数が減るわけではなかった。
本発明は、このような従来の手法が有している問題を解決しようとするものであり、複数の通話端末からの音声ストリームを高効率にミキシングを行う多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法を実現することを目的とする。
上記した目的を達成するために、請求項1記載の多者間通話システムは、通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話システムにおいて、前記通話端末が、音声が入力される音声入力手段と、前記音声入力手段に入力された音声の大きさが、設定値よりも大きいか否かを判断する入力音声判断手段と、前記入力音声判断手段により入力された音声が設定値よりも大きい場合、前記通話サーバへミキシング要求を行い、前記通話サーバから応答を受信してミキシング状態を確立するミキシング状態確立手段と、前記ミキシング状態確立手段により前記通話サーバとのミキシング状態が確立した後、前記音声入力手段で入力された音声をパケット化して前記通話サーバへ送信する第1の音声パケット送信手段とを有し、前記通話サーバが、前記ミキシング要求を行った通話端末へ応答を送信し、ミキシング制御対象として記録するミキシング制御対象記録手段と、前記ミキシング制御対象記録手段により記録した当該通話端末から送信された音声パケットを、セッションを確立している他の通話端末へ送信する第2の音声パケット送信手段とを有することを特徴とする。
請求項2記載の発明は、請求項1記載の多者間通話システムにおいて、前記通話端末が、前記入力音声判断手段により、入力された音声が設定値よりも小さい場合、設定値よりも小さい音声入力が何回連続しているかを記憶する回数記憶手段と、前記回数記憶手段で記憶された、設定値よりも小さい音声入力回数が所定回数以上連続していた場合、前記通話サーバへミキシング切断要求を行い、前記通話サーバからの応答を受信してミキシング状態を切断するミキシング状態切断手段とを更に有し、前記通話サーバが、前記ミキシング状態切断手段によりミキシングの切断要求を行った通信端末へ応答を送信し、ミキシング制御対象から削除するミキシング制御対象削除手段とを更に有することを特徴とする。
請求項3記載の発明は、請求項1または2記載の多者間通話システムにおいて、前記通話端末が、前記通話サーバへセッション開始要求メッセージを送信し、前記通話サーバが該セッション開始要求メッセージに対するセッション開始応答メッセージを送信することで、前記通話端末と前記通話サーバとのセッションを確立することを特徴とする。
請求項4記載の発明は、請求項1または2記載の多者間通話システムにおいて、前記通話端末が、前記通話サーバへセッション切断要求メッセージを送信し、前記通話サーバが該セッション切断要求メッセージに対するセッション切断応答メッセージを送信することで、前記通話端末と前記通話サーバとのセッションを切断することを特徴とする。
請求項5記載の通話端末は、通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話システムにおける通話端末において、音声が入力される音声入力手段と、前記音声入力手段に入力された音声の大きさが、設定値よりも大きいか否かを判断する入力音声判断手段と、前記入力音声判断手段により入力された音声が設定値よりも大きい場合、前記通話サーバへミキシング要求を行い、前記通話サーバからの応答を受信してミキシング状態を確立するミキシング状態確立手段と、前記ミキシング状態確立手段により前記通話サーバとのミキシング状態が確立した後、前記音声入力手段で入力された音声をパケット化して前記通話サーバへ送信する第1の音声パケット送信手段とを有することを特徴とする。
請求項6記載の発明は、請求項5記載の通話端末において、前記入力音声判断手段により、入力された音声が設定値よりも小さい場合、設定値よりも小さい音声入力が何回連続しているかを記憶する回数記憶手段と、前記回数記憶手段で記憶された、設定値よりも小さい音声入力回数が所定回数以上連続していた場合、前記通話サーバへミキシング切断要求を行い、前記通話サーバからの応答を受信してミキシング状態を切断するミキシング状態切断手段とを更に有することを特徴とする。
請求項7記載の通話サーバは、通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話システムにおける通話サーバにおいて、ミキシング要求を行った通話端末へ応答を送信し、ミキシング制御対象として記録するミキシング制御対象記録手段と、前記ミキシング制御対象記録手段により記録した当該通話端末から送信された音声パケットを、セッションを確立している他の通話端末へ送信する第2の音声パケット送信手段とを有することを特徴とする。
請求項8記載の発明は、請求項7記載の通話サーバにおいて、ミキシングの切断要求を行った通話端末を、ミキシング制御対象から削除するミキシング制御対象削除手段を更に有することを特徴とする。
請求項9記載の多者間通話方法は、通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話方法において、前記通話端末が、音声が入力されるステップと、入力された音声の大きさが、設定値よりも大きいか否かを判断するステップと、入力された音声が設定値よりも大きい場合、前記通話サーバへミキシング要求を行い、前記通話サーバからの応答を受信してミキシング状態を確立するステップと、前記通話サーバとのミキシング状態が確立した後、前記音声入力手段で入力された音声をパケット化して前記通話サーバへ送信するステップとを有し、前記通話サーバが、ミキシング要求を行った通話端末へ応答を送信し、ミキシング制御対象として記録するステップと、記録した当該通話端末から送信された音声パケットを、セッションを確立している他の通話端末へ送信するステップとを有することを特徴とする。
請求項10記載の発明は、請求項9記載の多者間通話方法において、前記通話端末が、入力された音声が設定値よりも小さい場合、設定値よりも小さい音声入力が何回連続しているかを記憶するステップと、記憶された設定値よりも小さい音声入力回数が所定回数以上連続していた場合、前記通話サーバへミキシング切断要求を行い前記通話サーバからの応答を受信してミキシング状態を切断するステップとを更に有し、前記通話サーバが、ミキシングの切断要求に対する応答を送信した通話端末を、ミキシング制御対象から削除するステップとを更に有することを特徴とする。
以上の説明で明らかなように、本発明によれば、通話端末に入力された音声の大きさが設定値よりも大きい場合に、ミキシング状態を確立し、音声を通話サーバに送信し、通話サーバから他の通話端末へ該音声を送信する。よって、実際に音声入力があった通話端末からの音声のみをミキシング処理の対象にすればよいので、通話サーバのミキシング処理を効率的に行うことができる。その結果、端末数を増加させることができる。
また、現に発言している通話端末の音声だけを通話サーバで処理することで、ミキシングが必要なストリーム数を大幅に削減することができる。通話サーバで、入力のあった通話端末からの音声のみをミキシングし、得られた音声パケットを他の通話端末へ送信することで、多者間通話を実現する。
通話端末は通話サーバとセッションを開始するだけで、多者間通話を開始できる。さらに、通話端末は、セッションを確立した後は、マイクなど入力装置を利用するだけで、付加的操作を要することなく通話できる。
また、請求項2記載の本発明によれば、設定値よりも小さい音声入力が所定回数以上連続していた場合、ミキシング状態を切断するので、連続して音声入力がない場合のネットワークの負荷も低減できる。
また、請求項3記載の本発明によれば、通話端末から通話サーバへセッション開始の要求を行い、通話サーバから通話端末へ応答を行うことでセッションが確立されるので、音声パケットを送信する通話端末を特定することができる。
また、請求項4記載の本発明によれば、通話端末から通話サーバへセッション切断の要求を行い、通話サーバから通話端末へ応答を行うことでセッションが切断されるので、音声パケットを送信しない通話端末を特定することができる。
請求項5記載の通話端末によれば、入力された音声の大きさが設定値よりも大きい場合に、ミキシング状態を確立し、音声を通話サーバに送信する。よって、通話端末は音声の入力のみで多者間通話を開始できる。
請求項6記載の通話端末によれば、設定値よりも小さい音声入力が所定回数以上連続していた場合、通話サーバへミキシング切断要求を行うので、ミキシングが必要な音声パケット数を大幅に削減することができる。
請求項7記載の通話サーバによれば、ミキシング要求を行った通話端末からの音声パケットを、セッションを確立している他の通話端末へ送信するので、通話サーバのミキシング処理を効率的に行うことができる。
請求項8記載の通話サーバによれば、ミキシングの切断要求を行った通話端末を、ミキシング制御対象から削除するので、通話サーバでのミキシングが必要なパケット数を大幅に削減することができる。
請求項9記載の多者間通話方法によれば、通話端末に入力された音声の大きさが設定値よりも大きい場合に、ミキシング状態を確立し、音声を通話サーバに送信し、通話サーバから他の通話端末へ該音声を送信する。よって、実際に音声入力があった通話端末からの音声のみをミキシング処理の対象にすればよいので、通話サーバのミキシング処理を効率的に行うことができる。その結果、端末数を増加させることができる。
また、現に発言している通話端末の音声だけを通話サーバで処理することで、ミキシングが必要なストリーム数を大幅に削減することができる。通話サーバで、入力のあった通話端末からの音声のみをミキシングし、得られた音声パケットを他の通話端末へ送信することで、多者間通話を実現する。
通話端末は通話サーバとセッションを開始するだけで、多者間通話を開始できる。さらに、通話端末は、セッションを確立した後は、マイクなど入力装置を利用するだけで、付加的操作を要することなく通話できる。
請求項10記載の多者間通話方法によれば、設定値よりも小さい音声入力が所定回数以上連続していた場合、ミキシング状態を切断するので、連続して音声入力がない場合のネットワークの負荷も低減できる。
以下、図面を参照して本発明の実施の形態を説明する。本発明で提案する「限定ミキシング」方式は、参加する端末が多くても、実際に同時に発言する端末は少ない点に着目した方式である。
図1は、本発明の一実施形態に係る多者間通話システムを適用した多者間通話サーバと通話端末との概略構成を示すブロック図である。図1において、1は多者間通話サーバで、複数の通話端末2(IP電話機)に対して多者間通話サービスを提供する。1、2は共にネットワーク3で接続されている。ネットワーク3は、IP電話トラフィックのみ伝送する専用網と、インターネットのように電話以外のトラフィックが伝送されている共有回線も含む。
通話サーバ1には、音声ミキシングの機能を持たせる。各通話端末2はあらかじめ通話サーバ1とセッションを確立しておく。発言を行う端末(2Aとする)は、通話サーバ1との間でミキシング状態が確立される。セッションを確立しているがミキシング状態を確立していない端末には、通話サーバ1から、ミキシング状態を確立した端末からの音声のみが送信される。次に通話端末2Aが発言をした時に、同時に発言をした他の端末数が一定数 (N) を超えている場合は、他の端末は発言不可能とする。すなわち、先に発言(ミキシング状態を確立)していた通話端末2Aを優先する。端末は、音声が一定時間入力されなかった場合、通話サーバ1とのミキシング状態を終了する。
本実施例で使用するシグナリングプロトコルは、標準として定められているSIP (Session Initiation Protocol) を用いる。
図2は通話サーバ1と通話端末2とのセッション確立および終了におけるSIPメッセージのやり取りを示している。通話端末2が通話を開始するとき、通話端末2は通話サーバ1へ、セッション開始要求としてINVITEメッセージを送信する(ステップS201)。呼び出しが成功すると、通話サーバ1は応答として180 Ringing、200 OKのメッセージを返し(ステップS101、103)、これに対して通話端末2がACKを送信することで(ステップS203)セッションを確立する。
セッションを切断する場合は、切断を要求したい通話端末2がBYEメッセージを送信し(ステップS211)、通話サーバ1が応答として200 OKのメッセージを返す(ステップS111)。
図3は通話サーバ1と通話端末2がセッション確立した後に、ミキシング状態を確立するためのメッセージのやり取りを示している。ここで、SIPに準じたメッセージとして、SPEAKとMUTEを定義する。
通話端末2は通話サーバ1とセッションを確立した後、音声データを送信する前にSPEAKメッセージを用いて通話サーバ1にミキシングを要求する(ステップS221)。SPEAKを受信した通話サーバ1は、図2でINVITEを受信したときと同様に180 Ringing、200 OKを返す(ステップS121、123)。通話端末2は、これを受けてACKを通話サーバ1に送信して(ステップS223)、通話サーバ1とのミキシング状態を確立する。
通話端末2が音声データを送信しなくなった場合は、通話端末2からMUTEメッセージを送信する(ステップS231)。MUTEは図2におけるSIPメッセージのBYEに相当する。MUTEを受信した通話サーバ1は、通話端末2に200 OKを返し(ステップS131)、ミキシング状態が終了する。
ここで、通話サーバ1、通話端末2それぞれの構成と、図2、図3で説明したSIPメッセージのやり取りにおけるそれぞれの詳細な動作について、以下に記載する。
まず、通話サーバ1の機能ブロックを図4に示す。本実施例での通話サーバ1は、接続している通話端末2から受信するSIPの各種メッセージとRTPの音声パケットを処理する必要がある。通話サーバ1は、制御部10(ミキシング制御対象記録手段、ミキシング制御対象削除手段)、SIPプロトコルスタック部11、ミキシング部12、端末接続状態管理テーブル13、ミキシング制御テーブル14、パケット送受信部15(第2の送信手段)、符号化部16、復号化部17、RTP(Real-Time Transport Protocol)パケット生成部18、RTPパケット解析部19を有する。
パケット送受信部15は、通話端末2からの音声パケットの受信および通話端末2への送信を行うためのモジュールで、音声パケットの送受信に関してRTP (Real-Time Transport Protocol : ストリーム制御プロトコル) を用い、受信したパケットの正当性チェックを行う。そして、パケットロスやパケット遅延を検出し、制御や破棄を行う。
SIPプロトコルスタック部11は、SIPメッセージを送信した通話端末2に対して応答を返す処理を行う。
次に、通話サーバ1の詳細な動作について説明する。
図5に通話サーバ1と通話端末2とでセッション確立・切断を行う際の通話サーバ1の動作フローを示す。通話サーバ1のパケット送受信部15は、特定の通話端末2AからSIPメッセージを受信する(ステップSa101)。受信したSIPメッセージがINVITEメッセージの場合(ステップSa105で「Yes」)、SIPプロトコルスタック部11は図2のステップS101、103に示した応答を返し(ステップSa103)、通話端末2Aとのセッションを確立する(ステップSa107)。また制御部10は、端末接続状態管理テーブル13に通話端末2Aが接続されたことを追加する(ステップSa109)。そして図6の処理に移る。
パケット送受信部15が通話端末2Aから受信したSIPメッセージがBYEメッセージの場合(ステップSa105で「No」)、SIPプロトコルスタック部11は図2のステップS111に示した応答を返して(ステップSa121)、通話端末2Aとのセッションを切断する(ステップSa123)。そして制御部10は、端末接続状態管理テーブル13から通話端末2Aの情報を削除する(ステップSa125)。
図6に通話サーバ1と通話端末2とでミキシング状態の確立・切断を行う際の通話サーバ1の動作フローを示す。通話サーバ1はステップSa107で通話端末2Aとのセッションを確立し、通話端末2Aからのミキシング要求を待機している。パケット送受信部15は、通話端末2Aからメッセージを受信する(ステップSa151)。ここで受信するメッセージはSIPに準じている。受信したメッセージがSPEAKメッセージの場合(ステップSa155で「Yes」)、SIPプロトコルスタック部11は図3のステップS121、123に示した応答を返す(ステップSa153)。そして制御部10は、ミキシング制御テーブル14に通話端末2Aを追加する(ステップSa157)。これにより、通話端末2Aの音声がミキシング処理されるようになる。そして、図7の処理に移る。
パケット送受信部15が通話端末2Aから受信したメッセージがMUTEメッセージの場合(ステップSa155で「No」)、SIPプロトコルスタック部11は図3のステップS131に示した応答を返し(ステップSa159)、制御部10はミキシング制御テーブル14から通話端末2Aを削除する(ステップSa161)。つまり、通話端末2Aの音声がミキシング処理されないようにする。
図7にミキシング確立状態における、通話サーバ1のRTP送受信処理の動作フローを示す。パケット送受信部15が通話端末2AからのRTPパケットを受信すると(ステップSa171)、RTPパケット解析部19は、受信したRTPパケットを解析する。RTPパケットにエラーが無ければ、復号化部17で音声データを復号化し(ステップSa173)、ミキシング部12に送る。ミキシング部12は、ミキシング制御テーブル14から、ステップSa157で追加した通話端末2Aの情報を呼び出し、ミキシング状態が確立している通話端末2Aの音声のみをミキシングする(ステップSa175)。ミキシング済みのパケットは、符号化部16で符号化した後(ステップSa177)、RTPに合わせた形式になるようパケットを生成し、パケット送受信部15を用いてセッションを確立しているネットワーク3内の端末すべてに送信する(ステップSa179)。
図8に通話サーバ1における端末接続状態管理テーブル13のデータ構造を、図9にミキシング制御テーブル14のデータ構造を示す。端末接続状態管理テーブル13の最大要素数は最大参加人数、ミキシング制御テーブル14の最大要素数は最大同時発言者数となる。
例えば、通話端末2からのSPEAKを受け付けると、制御部10は各種情報(SIP交換情報など)をミキシング制御テーブル14に保存する。逆に、通話端末2からMUTEを受信すると、制御部10は通話端末2の各種情報をミキシング制御テーブル14から破棄する。
次に通話端末2の機能ブロックを図10に示す。通話端末2は、SIPの送信、受信、RTPの送信、受信を処理する必要がある。通話端末2は、メモリ20(回数記憶手段)、SIPプロトコルスタック部21、接続制御部22(入力音声判断手段、ミキシング状態確立手段、ミキシング状態切断手段)、パケット送受信部23(第2の音声パケット送信手段)、音声入力部24(音声入力手段)、音声出力部25、符号化部26、復号化部27、RTPパケット生成部28、RTPパケット解析部29、ミキシング状態管理部30を有する。
パケット送受信部23は、通話サーバ1とのパケットの送受信をつかさどる。音声パケットの送受信に関してRTPを用い、受信したパケットの正当性チェックを行う。そして、パケットロスやパケット遅延を検出し、制御や破棄を行う。
SIPプロトコルスタック部21は、SIPメッセージを送信し、それに対する通話サーバ1からの応答を受信する処理を行う。メモリ20は、入力音声と判断される音声の大きさの最小値(閾値)を記憶している。ミキシング状態管理部30は、通話端末2が通話サーバ1とミキシング状態を確立しているか否かの情報を管理している。
次に通話端末2の詳細な動作について説明する。
図11に特定の通話端末2Bと通話サーバ1とでセッション確立・切断を行う際の通話端末2Bの動作フローを示す。図11aにおいて、ユーザが通話端末2Bを用いて発呼を行い、通話サーバ1とのセッションを確立しようとすると、通話端末2BのSIPプロトコルスタック部21は、パケット送受信部23を介してINVITEメッセージを通話サーバ1へ送信する(ステップSb201)。パケット送受信部23が、通話サーバ1から図2のステップS101、S103で示した応答を受信すると(ステップSb203)、SIPプロトコルスタック部21はACKを通話サーバ1へ返し(ステップSb205)、セッションを確立する。
図11bにおいてユーザからのセッション切断要求があると、SIPプロトコルスタック部21は、パケット送受信部23を介してBYEメッセージを通話サーバ1へ送信する(ステップSb207)。そして、パケット送受信部23は通話サーバ1から図2のステップS111で示した応答を受信する(ステップSb209)。
図12に通話端末2Bと通話サーバ1とでミキシング状態の確立・切断を行う際の通話端末2の動作フローを示す。
通話端末2Bの音声入力部24から音声が入力されると(ステップSb251)、接続制御部22はその音声の大きさを、メモリ20であらかじめ記憶された音声の閾値と比較する(ステップSb253)。入力された音声が閾値より大きければ(ステップSb253で「Yes」)、音声が入力されたと判断する。次に接続制御部22はミキシング状態管理部30から、通話端末2Bと通話サーバ1とがミキシング状態か否かの情報を取得する。ミキシング状態が確立されていない場合(ステップSb255で「No」)、SIPプロトコルスタック部21はパケット送受信部23を介して通話サーバ1にSPEAKを送信する(ステップSb257)。そして、図3のステップS121、S123に示す通話サーバ1からの応答をパケット送受信部23が受信すると、SIPプロトコルスタック部21はACKを返してミキシング状態を確立する(ステップSb258)。接続制御部22はミキシング状態管理部30に、通話端末2がミキシング状態であることを記録する(ステップSb259)。
ステップSb255でミキシング状態が確立されている場合は(ステップSb255で「Yes」)、後述する図13aのステップSb275の処理に移る。
入力された音声の大きさがメモリ20に記憶された音声の閾値以下の場合(ステップSb253で「No」)、接続制御部22はメモリ20に、閾値以下の音声入力回数を記録する(ステップSb260)。また、接続制御部22はミキシング状態管理部30から、通話端末2Bと通話サーバ1とがミキシング状態か否かの情報を取得する。ミキシング状態が確立されている場合(ステップSb261で「Yes」)、接続制御部22はメモリ20に記録している、音声入力が連続して閾値を下回った回数を取得する。
音声入力が一定回数以上連続して閾値を下回った場合(ステップSb263で「Yes」)、接続制御部22は一定時間音声の入力がないと判定する。そして、ミキシング状態を切断するために、SIPプロトコルスタック部21はパケット送受信部23を介して通話サーバ1へMUTEを送信する(ステップSb265)。パケット送信部23が、図3のステップS131に示す通話サーバ1からの応答を受信すると、ミキシング状態が切断となる(ステップSb267)。接続制御部22はミキシング状態管理部30に、通話端末2がミキシング状態でなくなったことを記録する(ステップSb269)。
音声入力が閾値を下回った回数が一定回数連続していない場合(ステップSb263で「No」)、再び次の音声入力を待機する。
図13aにミキシング確立状態における、通話端末2のRTP送信処理の動作フローを示す。音声入力部24から入力された音声(ステップSb271)は、図12に示す動作でミキシング状態を確立し(ステップSb273)、符号化部26で符号化される(ステップSb275)。符号化された音声データは、RTPパケット生成部28でRTPパケットとして生成され、パケット送受信部23から通話サーバ1へ送信される(ステップSb277)。
図13bに通話端末2のRTP受信処理の動作フローを示す。パケット送受信部23が通話サーバ1からRTPパケットを受信すると(ステップSb281)、RTPパケット解析部29は、受信したRTPパケットを解析する。エラーが無ければ復号化部で音声データに復号化し(ステップSb283)、音声データを音声出力部25に送って音声を出力する(ステップSb285)。
以上説明したように、本発明の「限定ミキシング」と呼ぶ方式は、現に発言している端末の音声だけを多者間通話サーバで処理することで、ミキシングが必要なストリーム数を大幅に削減する。多者間通話サーバで発言者の音声のみをミキシングし、得られた音声を端末へ送信することで、多者間通話を実現する。
音声が入力されると、既に通話サーバとミキシング状態確立済みか調べ、確立されていない場合はSPEAKメッセージを送信してミキシング状態確立を通話サーバに要求する。ミキシング状態が確立できたら、入力された音声を符号化部で符号化する。次に、RTPパケット生成部でRTPパケットとして整形した後、パケット送受信部に渡す。また、一定時間音声の入力がない場合、ミキシング状態を終了するためにサーバにMUTEメッセージを送信する。RTPパケット解析部は、RTPパケットを受信すると、エラーの有無をチェックし、エラーが無ければ音声データを復号化し、データを音声出力部に渡す。
通話端末は多者間通話サーバとセッションを開始するだけで、多者間通話を開始できる。さらに、通話端末は、セッションを確立した後は、マイクなど入力装置を利用するだけで、発言権要求ボタンを押すなどの付加的操作を要することなく通話できる。発言者にとっては、マイクからの音声入力により発言が可能になるので、議長制発言方式のような発言権の意識を不要にできるという効果がある。
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
本発明の一実施形態に係る通話システムを適用した多者間通話サーバとユーザ端末との概略構成を示すブロック図である。 同上の実施形態における通話サーバ1と通話端末2とのセッション確立および切断におけるSIPメッセージのやり取りを示す図である。 同上の実施形態における、通話サーバ1と通話端末2とのミキシング状態の確立および切断におけるメッセージのやり取りを示す図である。 同上の実施形態における通話サーバ1の機能ブロックを示す図である。 セッション確立・切断を行う際の通話サーバ1の動作を示すフローチャートである。 ミキシング状態の確立・切断を行う際の通話サーバ1の動作を示すフローチャートである。 通話サーバ1のRTP送受信処理の動作を示すフローチャートである。 通話サーバ1における端末接続状態管理テーブル13のデータ構造を示すテーブルである。 通話サーバ1におけるミキシング制御テーブル14のデータ構造を示すテーブルである。 同上の実施形態における通話端末2の機能ブロックを示す図である。 セッションの確立を行う際の通話端末2の動作を示すフローチャートである。 セッションの切断を行う際の通話端末2の動作を示すフローチャートである。 ミキシング状態の確立・切断を行う際の通話端末2の動作を示すフローチャートである。 通話端末2のRTP送信処理の動作を示すフローチャートである。 通話端末2のRTP受信処理の動作を示すフローチャートである。
符号の説明
1…通話サーバ、2…通話端末(IP電話機)、3…インターネット、
10…制御部、11…通話サーバのSIPプロトコルスタック部、12…ミキシング部、13…端末接続状態管理テーブル、14…ミキシング制御テーブル、15…パケット送受信部、16…符号化部、17…復号化部、18…RTPパケット生成部、19…RTPパケット解析部、
20…端末のメモリ、21…SIPプロトコルスタック部、22…接続制御部、23…パケット送受信部、24…音声入力部、25…音声出力部、26…符号化部、27…復号化部、28…RTPパケット生成部、29…RTPパケット解析部、30…ミキシング状態管理部

Claims (10)

  1. 通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話システムにおいて、
    前記通話端末が、
    音声が入力される音声入力手段と、
    前記音声入力手段に入力された音声の大きさが、設定値よりも大きいか否かを判断する入力音声判断手段と、
    前記入力音声判断手段により入力された音声が設定値よりも大きい場合、前記通話サーバへミキシング要求を行い、前記通話サーバから応答を受信してミキシング状態を確立するミキシング状態確立手段と、
    前記ミキシング状態確立手段により前記通話サーバとのミキシング状態が確立した後、前記音声入力手段で入力された音声をパケット化して前記通話サーバへ送信する第1の音声パケット送信手段とを有し、
    前記通話サーバが、
    前記ミキシング要求を行った通話端末へ応答を送信し、ミキシング制御対象として記録するミキシング制御対象記録手段と、
    前記ミキシング制御対象記録手段により記録した当該通話端末から送信された音声パケットを、セッションを確立している他の通話端末へ送信する第2の音声パケット送信手段とを有する
    ことを特徴とする多者間通話システム。
  2. 前記通話端末が、
    前記入力音声判断手段により、入力された音声が設定値よりも小さい場合、設定値よりも小さい音声入力が何回連続しているかを記憶する回数記憶手段と、
    前記回数記憶手段で記憶された、設定値よりも小さい音声入力回数が所定回数以上連続していた場合、前記通話サーバへミキシング切断要求を行い、前記通話サーバからの応答を受信してミキシング状態を切断するミキシング状態切断手段とを更に有し、
    前記通話サーバが、
    前記ミキシング状態切断手段によりミキシングの切断要求を行った通信端末へ応答を送信し、ミキシング制御対象から削除するミキシング制御対象削除手段とを更に有する
    ことを特徴とする請求項1記載の多者間通話システム。
  3. 前記通話端末が、前記通話サーバへセッション開始要求メッセージを送信し、前記通話サーバが該セッション開始要求メッセージに対するセッション開始応答メッセージを送信することで、前記通話端末と前記通話サーバとのセッションを確立することを特徴とする請求項1または2記載の多者間通話システム。
  4. 前記通話端末が、前記通話サーバへセッション切断要求メッセージを送信し、前記通話サーバが該セッション切断要求メッセージに対するセッション切断応答メッセージを送信することで、前記通話端末と前記通話サーバとのセッションを切断することを特徴とする請求項1または2記載の多者間通話システム。
  5. 通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話システムにおける通話端末において、
    音声が入力される音声入力手段と、
    前記音声入力手段に入力された音声の大きさが、設定値よりも大きいか否かを判断する入力音声判断手段と、
    前記入力音声判断手段により入力された音声が設定値よりも大きい場合、前記通話サーバへミキシング要求を行い、前記通話サーバからの応答を受信してミキシング状態を確立するミキシング状態確立手段と、
    前記ミキシング状態確立手段により前記通話サーバとのミキシング状態が確立した後、前記音声入力手段で入力された音声をパケット化して前記通話サーバへ送信する第1の音声パケット送信手段と
    を有することを特徴とする通話端末。
  6. 前記入力音声判断手段により、入力された音声が設定値よりも小さい場合、設定値よりも小さい音声入力が何回連続しているかを記憶する回数記憶手段と、
    前記回数記憶手段で記憶された、設定値よりも小さい音声入力回数が所定回数以上連続していた場合、前記通話サーバへミキシング切断要求を行い、前記通話サーバからの応答を受信してミキシング状態を切断するミキシング状態切断手段とを更に有する
    ことを特徴とする請求項5記載の通話端末。
  7. 通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話システムにおける通話サーバにおいて、
    ミキシング要求を行った通話端末へ応答を送信し、ミキシング制御対象として記録するミキシング制御対象記録手段と、
    前記ミキシング制御対象記録手段により記録した当該通話端末から送信された音声パケットを、セッションを確立している他の通話端末へ送信する第2の音声パケット送信手段と
    を有することを特徴とする通話サーバ。
  8. ミキシングの切断要求を行った通話端末を、ミキシング制御対象から削除するミキシング制御対象削除手段を更に有する
    ことを特徴とする請求項7記載の通話サーバ。
  9. 通話サーバと、複数の通話端末とがネットワークで接続され、特定の通話端末の音声が、通話サーバとセッションを確立している各通話端末へ送信される多者間通話方法において、
    前記通話端末が、
    音声が入力されるステップと、
    入力された音声の大きさが、設定値よりも大きいか否かを判断するステップと、
    入力された音声が設定値よりも大きい場合、前記通話サーバへミキシング要求を行い、前記通話サーバからの応答を受信してミキシング状態を確立するステップと、
    前記通話サーバとのミキシング状態が確立した後、前記音声入力手段で入力された音声をパケット化して前記通話サーバへ送信するステップとを有し、
    前記通話サーバが、
    ミキシング要求を行った通話端末へ応答を送信し、ミキシング制御対象として記録するステップと、
    記録した当該通話端末から送信された音声パケットを、セッションを確立している他の通話端末へ送信するステップとを有する
    ことを特徴とする多者間通話方法。
  10. 前記通話端末が、
    入力された音声が設定値よりも小さい場合、設定値よりも小さい音声入力が何回連続しているかを記憶するステップと、
    記憶された設定値よりも小さい音声入力回数が所定回数以上連続していた場合、前記通話サーバへミキシング切断要求を行い前記通話サーバからの応答を受信してミキシング状態を切断するステップとを更に有し、
    前記通話サーバが、
    ミキシングの切断要求に対する応答を送信した通話端末を、ミキシング制御対象から削除するステップとを更に有する
    ことを特徴とする請求項9記載の多者間通話方法。
JP2006050074A 2006-02-27 2006-02-27 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法 Active JP4644813B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006050074A JP4644813B2 (ja) 2006-02-27 2006-02-27 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006050074A JP4644813B2 (ja) 2006-02-27 2006-02-27 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法

Publications (2)

Publication Number Publication Date
JP2007228506A true JP2007228506A (ja) 2007-09-06
JP4644813B2 JP4644813B2 (ja) 2011-03-09

Family

ID=38549827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006050074A Active JP4644813B2 (ja) 2006-02-27 2006-02-27 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法

Country Status (1)

Country Link
JP (1) JP4644813B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141400A (ja) * 2007-12-03 2009-06-25 Audio Technica Corp 音声会議装置および音声会議方法
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06217303A (ja) * 1993-01-14 1994-08-05 Nippon Telegr & Teleph Corp <Ntt> 多地点間通信会議方式における発言制御装置
JPH1032638A (ja) * 1996-07-12 1998-02-03 Ricoh Co Ltd テレビ会議装置
JP2000092218A (ja) * 1998-08-28 2000-03-31 Lucent Technol Inc 電話会議の際のオ―ディオ信号を効果的に混合するための技法
JP2003500935A (ja) * 1999-05-21 2003-01-07 トゥルーチャット, インコーポレイテッド エッジポイントミキシングを有する遠隔会議ブリッジ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06217303A (ja) * 1993-01-14 1994-08-05 Nippon Telegr & Teleph Corp <Ntt> 多地点間通信会議方式における発言制御装置
JPH1032638A (ja) * 1996-07-12 1998-02-03 Ricoh Co Ltd テレビ会議装置
JP2000092218A (ja) * 1998-08-28 2000-03-31 Lucent Technol Inc 電話会議の際のオ―ディオ信号を効果的に混合するための技法
JP2003500935A (ja) * 1999-05-21 2003-01-07 トゥルーチャット, インコーポレイテッド エッジポイントミキシングを有する遠隔会議ブリッジ

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141400A (ja) * 2007-12-03 2009-06-25 Audio Technica Corp 音声会議装置および音声会議方法
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法
US8504184B2 (en) 2009-02-04 2013-08-06 Panasonic Corporation Combination device, telecommunication system, and combining method

Also Published As

Publication number Publication date
JP4644813B2 (ja) 2011-03-09

Similar Documents

Publication Publication Date Title
CA2473147C (en) Method and system for conducting conference calls with optional voice to text translation
US7283154B2 (en) Systems and methods for videoconference and/or data collaboration initiation
US7058168B1 (en) Method and system for participant control of privacy during multiparty communication sessions
US8433050B1 (en) Optimizing conference quality with diverse codecs
US8149261B2 (en) Integration of audio conference bridge with video multipoint control unit
WO2017129129A1 (zh) 即时通话方法、装置和系统
US20060050658A1 (en) Method and system for providing a conference service
US20040263610A1 (en) Apparatus, method, and computer program for supporting video conferencing in a communication system
US7983199B1 (en) Voice over internet protocol push-to-talk communication system
CN109802913B (zh) 融合会议实现方法及装置、电子设备、可读存储介质
CN103475499A (zh) 一种基于网络电话会议的语音对讲方法及系统
WO2009052746A1 (fr) Méthode de lancement de conférences, mandataire de services d&#39;applications, serveur de conférences et système associé
TW201320708A (zh) 視訊會議系統及視訊會議方法
US20090325561A1 (en) Method and system for enabling a conference call
KR101589195B1 (ko) 양자간 통화로부터 컨퍼런스로의 끊김 없는 전환을 구현하기 위한 방법 및 장치
CN102843336A (zh) 一种ims多媒体会议接入的方法及系统
CN101132554B (zh) 通信终端设备、会议服务器装置以及相关方法
WO2009052750A1 (fr) Méthode, dispositif et système d&#39;établissement d&#39;une communication entre deux parties
JP4644813B2 (ja) 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法
JP2010512075A (ja) 呼セッションのための方法、電話システムおよび電話端末
WO2016183774A1 (zh) 一种通话录音的方法、装置及系统
JP4684240B2 (ja) 多人数通話用の通話端末、多人数通話システム、多人数通話方法、多人数通話用のプログラムおよびプログラムを格納した記録媒体
JP5248891B2 (ja) Sipを用いたボタン電話装置による会議招集方法、そのシステム、その装置及びそのプログラム
CN101651817A (zh) 多方交互式影音处理方法及其系统与通讯架构
JP4447534B2 (ja) 加入者収容装置、通信処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Effective date: 20080926

Free format text: JAPANESE INTERMEDIATE CODE: A621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20101104

Free format text: JAPANESE INTERMEDIATE CODE: A01

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150