JP2010529814A - アクティブ発言者識別 - Google Patents

アクティブ発言者識別 Download PDF

Info

Publication number
JP2010529814A
JP2010529814A JP2010512258A JP2010512258A JP2010529814A JP 2010529814 A JP2010529814 A JP 2010529814A JP 2010512258 A JP2010512258 A JP 2010512258A JP 2010512258 A JP2010512258 A JP 2010512258A JP 2010529814 A JP2010529814 A JP 2010529814A
Authority
JP
Japan
Prior art keywords
client
active
cname
ssrc
clients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010512258A
Other languages
English (en)
Other versions
JP5579598B2 (ja
Inventor
ジェイ.クリノン レジス
エム.カーン フマーユーン
クコレカ ダリボール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2010529814A publication Critical patent/JP2010529814A/ja
Application granted granted Critical
Publication of JP5579598B2 publication Critical patent/JP5579598B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • H04L65/4038Arrangements for multi-party communication, e.g. for conferences with floor control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • H04M3/569Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants using the instant speaker's algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/50Aspects of automatic or semi-automatic exchanges related to audio conference
    • H04M2203/5072Multiple active speakers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

音声イベントにおいてクライアントを識別する手法が示されている。例においては、メディアサーバが入力レベルに基づいて音声を提供するクライアントを順位付けする。識別子が当該イベント内で入力を提供するクライアントを識別するためにそのクライアントと関連付けられる。順位付けられたクライアントは、音声コンテンツを担うパケットヘッダに挿入されるリストに含まれる。

Description

メディア会議参加者は他のメディア会議参加者と識別する難しさを持っている。参加者は発言者の声又は顔となじみがなかったり、又は音声のやり取りをしたりすることは聞き手を混乱させる。後者の場合には、様々な参加者が同時に話していたり、又は複数の参加者間の早いやり取りがあったりするならば、聞き手、話しているか否かの区別が付かない。ある場合には、発言者は名前「ボブです....。」を含むか、聞き手は前の発言者の身元を尋ねる。この問題の複雑さは、話すか又は音声入力に貢献する(contributing)参加者の数が増えるほど増大する。聞き手が会話の中で「文脈の手がかり」から発言者の身元を見いだす一方、ある場合には、どの参加者が音声入力をしているかを参加者は理解していない。
加えて、情報を担う帯域幅消費又はデータ処理量の最小化が望まれている。例えば、データを伝送するための物理的接続が追加の処理能力を有する一方、ユーザが限定したネットワーク帯域幅を有したならば、消費する通信リンクリソースは他のデータ転送に利用可能な能力を減少させるか又は会議音声データ転送に影響を与える。
メディア会議改善の受け入れはその改善が「過去との互換性」がないならば、限定される。例えば、変更が存在するプロトコル及びバージョンと一致しないならば、ユーザは変更したバージョンを実装する参加者と通信するために更新したバージョンを得るか、及び/又は組織の承認を探さなければならない。上記の状況は変更した技術の受け入れを妨げている。
音声イベント又は音声/映像イベントにおけるクライアントを識別する手法が示されている。例えば、メディアサーバは入力レベルに基づいて音声を提供するクライアントを順位付ける。識別子はイベント内で入力を提供するクライアントを識別するためにクライアントと関連付けられる。順位付けしたクライアントは音声コンテンツを担うパケットヘッダに挿入されるリストに含まれる。
この概要は以下に詳細な説明で更に説明される簡単なフォームにおいてコンセプトの選択を導くために与えられる。この概要は請求項の構成の重要な特徴又は主たる特徴を認識することを意図しておらず、又は請求項の構成の範囲を限定するために用いられることを意図していない。
詳細な説明は添付図面を参照して説明されている。図において、参照番号の最も左の数字はその参照番号が最初に現れる図を特定している。詳細な説明及び図において異なる例における同一の参照番号の使用は同類又は同一のアイテムを示している。
アクティブ発言者識別を可能にする技術を用いた実施例における環境を示している図である。 貢献ソース(CSRC)フィールドのリストにおいて順位付けした/又は再順位付けしたアクティブクライアントリストを含むリアルタイムプロトコルデータパケットを示す図である。 アクティブクライアントを識別するための実施例における手法を示すフロー図である。 リアルタイムプロトコル会議においてアクティブクライアントを識別するための実施例における手法を示すフロー図である。
概説
技術はメディアイベントにおいてアクティブ音声貢献者を識別することについて説明されている。実施例において、貢献する又は参加する音声クライアントのリストがセッションへのクライアント貢献に基づいて形成される。識別子は、どのクライアントがイベントにアクティブに貢献しているかクライアントが識別できるように参加するクライアントと関連付けられる。形成されたリストは会議クライアントに送信するためにデータストリームパケットヘッダに挿入される。実施例において、識別情報はデータ伝送と共に用いられるコントロールパケットに含まれる。本明細書で説明される技術は、最小のネットワークリソースの消費で、かつ同期問題を生ずることなく、発言者情報を提供する。
更なる実施例においては、音声ストリームを切り替える/混合するメディアサーバはデータパケットヘッダに順位付けしたアクティブクライアントのリストを挿入するように構成される。例えば、メディアサーバは現在のアクティブ発言者に基づいて順位付けされているアクティブ発言者のリストを含んでおり、それによりどのクライアントがアクティブに発言しているかについての情報がクライアントに提供される。リストはネットワークについてのメディア伝送費を増大させることなく提供される。
環境例
図1はアクティブ発言者識別を用いて動作可能な実施例における環境100を示している。例えば、メディアサーバ102はメディアイベントにおけるクライアント提供の音声ストリーム間で混合及び切り替える一方、アクティブ音声クライアントを識別する。音声データの処理が説明されるが、メディアサーバ102はクライアント装置の会議及び互換性に基づいて映像等の他の種類のメディアデータを扱っても良い。例えば、メディアサーバ102は一部のクライアントに対しては音声/映像データを処理し、一方、映像互換性等を欠くクライアントに音声データを送信する。
例えば、メディアサーバプロセッサ104は、クライアントのために音声ストリームを混合/切り替える一方、どのクライアント又はどの複数のクライアントが音声コンテンツにアクティブに貢献しているか判別する。メディアサーバプロセッサ104は、送信メディアストリームを発生するプロセッサによって用いられる混合/切り替えのアルゴリズム/技術に基づいてどのクライアントが音声データをアクティブに入力しているか判別する。当該判別は、メディアサーバ102からの出力メディアストリームに関与するクライアントのリストを順位付けるために用いられる。
クライアント“A”106、クライアント“B”108、クライアント“C”110、クライアント“D”112及びクライアント“E”114を含む音声イベントについて、クライアント“A”106及びクライアント“E”114が音声入力に貢献しており(クライアント“A”106及びクライアント“E”114等が会話を続けている)、非アクティブクライアント“B”108、“C”110、及び“D”112にはメディアサーバ102からの“A+E”送信ストリーム、すなわち2人の発言者の組み合わせが供給され、一方、クライアント“A”106及びクライアント“E”114はメディアサーバ102から相手の送信ストリームを各々受信する(例えば、クライアント“A”106はクライアントEの送信ストリームを受信し、クライアント“E”114はクライアントAの送信ストリームを受信する)。適切なクライアント装置は、限定されないが、ゲートウエイを介してディジタル音声セッションに接続されたVoIP(voice over internet protocol)電話、音声互換性を有するコンピューティング装置、PSTN(publicly switched network telephones)電話等を含む。
一部の実施例では、アクティブ発言者にはフィードバック又はエコーを避けるために発言者自身の送信ストリームを含む信号が供給されない(例えば、クライアント“A”106にはクライアントAの音声を含む音声ストリームが送り届かない)。様々な一般的な識別シナリオ、例えば、クライアントAがクライアントEと(クライアント“A”106と関係した参加者が大声で話し、(クライアント“E”114と関係した)参加者“E”が比較的普通の声で話しているように)話し合い、現在の発言者がその2人の発言者間で交代する早いやり取りの最中に参加者“A及び“Eがあるか、又は、参加者Aがその会話を支配し、参加者Bが比較的少ない入力を提供することが考慮される。後者の状況の例は、第1の発言者の支配的な一人の発言にマイナーな承認(acknowledgements)を加える参加者を含む。
実施例において、メディアサーバ102は音声コンテンツが受信されたときクライアントから受信したパケット数、パケットサイズ、エネルギー音声レベル等に基づいて支配的なクライアント(dominant client)(及び発言者)を判別する。よって、2以上のクライアントがコンテンツに同時に貢献している間に、1のアクティブクライアントは上記のファクタに基づいて支配的クライアント(及び発言者)として割り当てられる。例えば、メディアサーバ102は異なる複数のクライアントから受信した入力の間で混合及び又は切り替えると共に、アクティブクライアントから受信した音声コンテンツを含む現在のデータパケットに基づいて現在のアクティブクライアント(及び関係した発言者)を判別する。例えば、メディアサーバ102は、クライアントEがデータパケットを現在提供していないならば、現在の“アクティブ”クライアントとしてクライアント“A”106を指定する。他の例では、クライアント“A”106及びクライアント“E114の両方がアクティブで、クライアント“A”106はクライアント“E”114より大なるエネルギーレベルを有する音声コンテンツに貢献しているならば(すなわち、参加者Aは大きな声で発言し、一方、参加者Eは小さな声で発言している)、クライアント“A”106は支配的なアクティブ発言者として割り当てられる。クライアントにはクライアント“A”106で始まるアクティブクライアントリストが備えられる。この種類の判別は1以上の進行している会議のためにクライアント入力音声ストリームを混合する/切り替えるときに行われる。例えば、メディアサーバ102のプロセッサは混合するアルゴリズムを用いるときアクティブクライアント間を区別し、識別モジュール116は適用可能なデータパケットに情報を挿入するために用いられる。
図2を参照して、実施例において、リアルタイムトランスポートプロトコル(RTP)及び関連したリアルタイムコントロールプロトコル(RTCP)を実装するとき、メディアサーバ102はクライアントから送信されたデータ伝送ストリーム及びシグナリングストリームを含むストリーム内のデータを調べることによりアクティブクライアント及びアクティブ発言者を識別する。クライアント“A”106の場合には、メディアサーバ102は、RTPパケット内の同期ソース(SSRC)フィールドを調べることにより、又はクライアントSSRC(セッション内のクライアントについての識別子)及びRTCPレポートに含まれる正規名(CNAME)から、音声クライアント送信ストリームがクライアント“A”106から発せられていることを識別する。他の情報は同様に調べられる。また、SSRCはRTPパケットヘッダから得られる。例えば、SSRCはRTCPレポート内のCNAMEにマッピングされる。
RTCPシグナリングは欠落パケットを識別するため、データ伝送クオリティを保証するため等に用いられ、RTCPレポートはRTCP帯域外信号から得られる。例えば、RTCPレポートはクライアントCNAMEにマッピングされたランダム発生のクライアントSSRCを含む。CNAMEは一般にクライアント装置のために用いられるエイリアスと関連付けされている識別子/記録である。一部の場合には、CNAMEは数字等の文字列である。実施例においては、メディアサーバ102はセッション内のSSRCを割り当てられる。一部の場合には、SSRCはセッションに含まれるクライアントについて変更することができる。例えば、クライアントSSRCは、クライアントが切断する(例えば、長いポーズ、その後の再接続)、クライアントSSRCが衝突する(1以上のクライアントが共通のSSRCを発せられる)等ならば、変更する。このように、入力データストリームがそのデータストリームにおいてSSRCから又はRTCPシグナリングから識別される。また、メディアサーバ102はクライアントの識別に用いるためにRTCPシグナリングから正規名を得ても良い。
(音声出力を含む)送信ストリームを発生するときに、メディアサーバ102はどのクライアントがアクティブクライアントから得られるSSRC及びCNAMEからセッションに音声入力に貢献しているか識別する。例えば、メディアサーバ102はRTCPパケットに挿入されたSSRC、CNAMEを音声コンテンツ送信ストリーム(すなわち、音声データを担うメディアサーバ出力ストリーム)と関連付ける。クライアント“A”106、クライアント“B”108、クライアント“C”110、クライアント“D”112及びクライアント“E”114間の前のセッション例に戻ると、混合した信号“A+E”の場合においてメディアサーバ102はどのクライアントが現在アクティブでそのセッションを支配しているか等に応じてクライアント“A”及び“E”を順位付ける。その順位付けは音声入力を提供するクライアントに基づいて変更される。この場合において、クライアント“A”が現在入力を提供しているか、又はクライアント“A”が会話を支配しているならば、リストはクライアント“A”106の識別子で始め、クライアント“E”114を含む。クライアント“A”106とクライアント“E”114との間で音声交換がある状況では、その指令はパケット単位ベースで示されるように現在発言している参加者に基づいて変更される。
図2を参照すると、RTP構成において、メディアサーバ識別モジュール116は出力ストリームRTPパケットヘッダにSSRCの順位付けリストを挿入する。例えば、順位付けた識別子は、データストリームにおいて送信されたパケットヘッダ内の貢献ソース(CSRC)フィールドのリストに挿入される。クライアント“A”とクライアント“E”とが現在のアクティブ役割を交代しているならば、SSRCの配列は“クライアント“A”,クライアント“E”...”204(a)から“クライアント“E”,クライアント“A”...”204(b)に変化する。その前の方式において、データストリームを受信するクライアント(セッションの聴取クライアント又は参加者)は、どのクライアントが入力、関係する貢献等を提供しているかについて通知され、追加のシグナリング、関連付けた同期発生及びネットワークオーバヘッドを避ける。例えば、CSRCフィールドは各32ビットの15識別子まで含むことが可能にされ、仕様に従っている。本明細書で述べる技術に従って動作していないクライアントは、本明細書で述べる利益なしに参加することになる。よって、互換性がないシステム及び技術をなす。
SSRCはアクティブクライアントを識別するが、SSRCを用いることは問題があり、それは、SSRCがランダムに割り当てられること、類似のSSRCを有する他のクライアントや、セッションを止めた後、そのセッションに再加入してSSRCを再割り当てされているクライアントとの衝突のため変化すること等である。
メディアサーバ102は、クライアントに送信するRTCPパケットにアクティブクライアントCNAMEを挿入する(例えば、それで他の「聴取している」クライアントをアクティブクライアントCNAME及びSSRCに気付かせる)。例えば、メディアサーバ識別モジュール116はメディアサーバRTCPパケットにおける「聴取クライアント」に送信されるアクティブクライアント識別子を「展開する」。例えば、様々なアクティブクライアントが会議に貢献しているならば、メディアサーバは、メディアサーバデータストリームと共に送信されるRTCPパケット内に、獲得したクライアント識別子を指定の間隔で挿入する。更に、RTCPパケットは各パケット内にCNAMEを含んでいる。CNAMEは聴取クライアントに送信されるRTCPパケット内に組み入れられ伝送オーバヘッドを最小化する。アクティブクライアント識別子を含むメディアサーバRTCPデータを受信するクライアントは、音声コンテンツが受信されるときCNAMEがデータパケットと関連付けられるようにローカルメモリ内にデータを格納する。例えば、CNAME、マッピングされたSSRC及び他の関係した情報がルックアップテーブル等に格納される。例えば、データストリームに含まれる音声コンテンツは普通の連続的方式で送信されるが、RTCP信号伝送は特定の間隔(例えば、5又は10秒間隔)のように断続的にのみ生じる。よって、データパケットを受信するクライアントはCSRC内のSSRCを前に受信したCNAMEと関連付ける。実施例においては、GRUU(Globally Routable User Agent URI:グロバリルータブルユーザエージェントURI)が特定のクライアントを識別するために用いられる。
実施例において、アクティブクライアントには、そのクライアントが会議でアクティブな1人であることが通知される。例えば、(アクティブクライアントと関係した)参加者は彼/彼女が他の参加者と「話し合って」いないことを知りたい。クライアント“A”106、クライアント“B”108、クライアント“C”110、クライアント“D”112及びクライアント“E”114間の前のセッション例に戻ると、例えば、クライアント“A”106がアクティブでクライアント“B”108,“C”110,“D”112及び“E”114がアクティブでないならば、これはクライアント“A”に送信されるRTCP信号を介して識別される。よって、メディアサーバ102は、クライアント“A”送信ストリームを通過させることによりクライアント“B”,“C”,“D”及び“E”のために送信メディアストリームを発生し、一方、クライアント“A”106はCSRC/RTCPパケットに基づいて「聴取する」クライアント又はセッションのメンバとして他のクライアントがアクティブでないことを識別する。
更なる実施例においては、人が理解可能な情報はSSRC/CNAMEと関連付けられる。例えば、ユーザは、参加者が発言しているときに発言中の参加者の映像が関連のモニタに表示されることを望む。実施例においては、人が理解可能なクライアント情報がクライアント間で交換される。例えば、そのデータは通常、イベント又はセッションの開始時に交換される。
インターネット(ワールドワイドウェブ)がクライアント及び他のコンポーネントを接続するために用いられ、他のネットワーク及び様々なリンクも同様に適切である。例えば、メディアサーバ102をクライアントに接続するネットワークはワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、無線ネットワーク、公衆電話ネットワーク、イントラネット等を含む。そのネットワークは複数のサブネットワークを含んで構成される。
次の説明は、上記したシステム及び装置を用いて実施される技術を示している。その手法の各々の態様はハードウエア、ファームウエア、すなわちソフトウエア、又はそれらの組み合わせで実施される。その手法は、1以上の装置によって実行される動作を特定する1組のブロックとして示され、各ブロックによる動作を行うために示された順番に必ずしも限定されない。
手法例
次の説明は、上記したシステム及び装置を用いて実施される技術を示している。その手法の各々の態様はハードウエア、ファームウエア、すなわちソフトウエア、又はそれらの組み合わせで実施される。その手法は、1以上の装置によって実行される動作を特定する1組のブロックとして示され、各ブロックによる動作を行うために示された順番に必ずしも限定されない。また、各種の他の例が予想される。
図3はメディアセッションにおけるアクティブ音声入力クライアントを識別するための手法例を示している。例えば、その技術は、一部のクライアントが映像互換性等を有していない電話会議又はメディア会議において用いられる。
実施例において、メディアサーバは、各アクティブクライアントによって提供される入力に対する音声入力クライアントを判別する(302)。例えば、判別は音声クライアント入力を混合する及び/又は切り替えることの一部として行われる。よって、クライアント“A”は異なるクライアントが音声入力を提供するまで最高のアクティブクライアントとして割り当てられる。他の例では、クライアント“A”及びクライアント“E”が貢献しており、クライアント“A”の音声がより高いエネルギーレベルを有しているならば、クライアント“A”が選択される。クライアントと関係した参加者がそのクライアントが音声入力を支配しているように大きな声で話しているか又はより連続的な方法で話しているならば、クライアント音声はより高いエネルギーレベルを有する。
音声入力クライアントが現在、アクティブであり、会話を支配している等であるならば、その音声入力クライアントは「トップ」クライアントとして識別される。本技術に応じて機能しているRTP/RTCPシステムにおいては、メディアサーバはクライアント入力ストリーム及び関連したRTCPパケット(例えば、クライアントから送信されたRTCPパケット)を受信し、そのRTCPパケットは音声コンテンツを含むストリームを発生する特定のクライアントのためにCNAMEにマッピングされたSSRCを含む(304)。例えば、メディアサーバはクライアントについてSSRC及びCNAMEを得る。CNAMEはSSRCと共にクライアントを識別する。メディアサーバは、どのクライアントが音声入力を現在提供し、会話を支配しているか等に応じて入力クライアントSSRCを順位付けする(306)。例えば、メディアサーバは、現在のアクティブ「発言者」、例えば、入力を提供するアクティブクライアントからの順番とするようにアクティブクライアントSSRC識別子を順位付けする。例において、RTPは、CRSCに含まれるアクティブクライアント当たり32ビットの識別子を用いて15のアクティブ発言者の識別を可能にする。
メディアサーバは識別子を音声入力クライアントと関連付ける。例えば、メディアサーバは音声入力クライアントのRTCPパケットからSSRC及びCNAMEを得る。SSRCは、メディアサーバの出力ストリームに含まれるCRSCフィールド内の音声入力クライアントを識別するために用いられる。
クライアントは他のデータを受信してそれを音声入力クライアントと関連付ける。例えば、受信するクライアント(聴取するクライアント又はメディアイベントにおけるクライアント)は、CNAMEと関連付けられた、人が理解可能な情報を有する。例えば、クライアントは、(CNAME/SSRCと関連付けられた)参加者の写真、参加者の名前等を有する。
順位付けられた音声入力クライアントの識別子はパケットヘッダ内のリストに挿入される(308)。例えば、クライアント“A”及び“E”が音声入力を提供しているならば(クライアント“A”が現在のアクティブクライアントである状態で)、RTPヘッダのCSRCフィールドはリストの始まりをクライアント“A”についてのSSRCとした複数のSSRCを含む。このように、聴取するクライアント(他のアクティブクライアントからの音声入力を受信する音声入力クライアントを含む)にはコンテンツストリーム内の発言者の同一性が伝えられる。他の例においては、リストの音声入力クライアントの順位は、どの音声入力クライアントがメディアセッションを支配しているかについての少なくとも一部に基づいている。支配についての考慮には、音声入力のエネルギーレベル、その入力の期間、無言の期間、パケットサイズ等が含まれる。例えば、クライアント“A”が現在アクティブで、クライアント“A”の送信ストリームが1以上の他の音声入力クライアントと比較して高エネルギーレベルを示すので、リストはクライアント“A”で始まる。
メディアサーバは、メディアサーバの送信ストリーム(コンテンツ伝送と共に送信されるRTCPパケット等)内のSSRC及びCNAMEを聴取するクライアント(セッションクライアント)に送信する(310)。音声入力クライアントについてのSSRCは、RTPパケット内のデータストリームパケットヘッダにCSRCフィールドを配置させても良い。例えば、5つのクライアントメディアイベントにおいて3人の参加者が発言しているならば、音声入力クライアントと関連付けられたクライアントSSRC及びCNAMEは、音声コンテンツを伝送するRTPパケットと関連付けられたメディアサーバの(聴取するクライアントに送信される)RTCPパケットに含まれる。このように、メディアサーバはアクティブ音声クライアントを識別するSSRC及びCNAMEをクライアントに送信する。よって、聴取するクライアントはRTPパケット内のSSRC及びCNAMEを参照して音声コンテンツの発生ソースを識別する。クライアントSSRCが他のクライアントに発せられたSSRCと衝突するならば、又はクライアントが他の理由でソース伝送アドレスを変更したならば、クライアントSSRCは更新される。聴取するクライアントがメディアイベントの間に情報をアクセスできるようにSSRC及びCNAMEはローカルメモリに格納される(312)。
図4はメディア会議においてアクティブクライアントを識別する技術例を示している。例えば、本技術は一部のクライアントが映像を欠いているか又は音声会議コールにおいて使用されているメディア会議の間に用いられる。
本実施例においては、メディアサーバは、アクティブクライアントからの識別子と共にアクティブクライアント入力(音声コンテンツ)を受信する(402)。例えば、音声会議に貢献するクライアントは、クライアントを識別するSSRC及びCNAMEを送信する。例えば、SSRCはRTPパケットヘッダ内、またCNAMEと共にRTCPパケット内のデータストリームに含まれる。
会議内の1以上のアクティブクライアントの順位付けのリストが発生される(404)。例えば、メディアサーバの混合する/切り替える音声入力ストリームはアクティブクライアント(RTP/RTCP内のSSRC識別子)、すなわち会議又はセッションに入力を提供するクライアントのリストを配置している。例えば、メディアサーバは、データ部分及び関連した信号部分を順に含むアクティブクライアント送信ストリームからSSRC識別を得る音声/映像混合サーバ(AVMCU)である。AVMCUはセッション内のクライアントについてのアクティブクライアントSSRC又は他の識別子の相対的な配列を決定する。SSRCはクライアントCNAMEにマッピングするRTCPレポートから識別される。例えば、ランキングはクライアントが現在アクティブであることに基づいてされる。他の実施例では、エネルギーレベル、供給されたデータパケットの数、無言の期間、パケットサイズ等のファクタは考慮に入れられる。例えば、順位付けされたリストは供給されたパケットの数のためにセッションを支配するアクティブクライアントで始まるが、次に同時にアクティブなクライアントにはより低い相対的位置が割り当てられる。
順位付けされたリストは、メディアサーバ送信データストリームの流れ内のパケットヘッダに含まれるCSRCリストフィールドに挿入される(406)。例えば、メディアサーバ出力はアクティブクライアントによって提供される音声、アクティブクライアントについてのSSRC識別子の順位付けされたリストを有するCSRCフィールドを含む。その結果として、聴取するクライアント、すなわち音声コンテンツストリームを受信するクライアントはどのクライアントがアクティブであるか、及び複数のアクティブクライアントの相対的関係について伝えられる。加えて、SSRC及びCNAMEはメディアサーバ送信RTCPパケットに含まれる。
SSRCはアクティブ音声クライアントのCNAMEと関連付けられる(408)。例えば、メディアサーバは、RTPパケットヘッダ内のCRSCフィールドに含まれるSSRCに関係したクライアントCNAMEを含むRTCPパケットを送信する。
人が理解可能な情報は、同様に、CNAME及び/又は音声入力クライアントSSRCと関連付けられる。例えば、写真又は名前は、関連付けられたクライアントが音声コンテンツを提供しているときに参加者の写真又は名前が現れるようにクライアントCNAMEと関連付けられる。この情報は会議内で伝達されるか、又はクライアントがこの人が理解可能な情報を入力する。
更なる実施例ではGRUUがアクティブクライアントについてのSSRCと関連付けられる。1クライアントがアクティブであり、他のクライアントがアクティブでないある状況において、メディアサーバは、アクティブクライアント送信ストリームはそのアクティブクライアントには戻らないが、そのアクティブクライアントに他のクライアントがアクティブでないことを気付かせるようにそのアクティブクライアントに対する表示を提供する(410)。このように、アクティブクライアントは、参加者が他の参加者と「話し合って」いないことを気付かされる。
RTP及びRTCPが説明されているが、本開示の技術及び実施例は他のプロトコルデータ伝送メカニズムに適用することができる。
結論
本発明は構成上の特徴及び/又は方法論的な動作に特有の言語で説明されているが、添付の特許請求の範囲に定義された本発明が説明された特有の特徴及び動作に必ずしも限定されないことは理解されるべきである。むしろ、特有の特徴及び動作は請求項の本発明を実施する形態例として開示されている。

Claims (20)

  1. 1以上の音声入力クライアントに含まれる各音声入力クライアントによって提供される入力に応じて前記1以上の音声入力クライアントを順位付けするステップ(306)と、
    識別子を前記各音声入力クライアントと関連付けるステップ(304)と、
    順位付けした1以上の音声入力クライアント識別子のリストをパケットヘッダに挿入するステップ(308)と、を備えることを特徴とする方法。
  2. 前記リストは、前記パケットヘッダ内のリアルタイムトランスポートプロトコル(RTP)の貢献ソースリスト(CSRC)に挿入されることを特徴とする請求項1記載の方法。
  3. 順位は、前記リストが現在のアクティブ音声入力クライアントから順序付けられるようにホスト混合音声ストリームによって決定されることを特徴とする請求項1記載の方法。
  4. 前記各クライアントについて、正規名(CNAME)と、前記CNAMEにマッピングされた同期ソース(SSRC)識別とを送信するステップ(310)を更に備えることを特徴とする請求項1記載の方法。
  5. 前記CNAME及び関連付けられたSSRCは、前記各クライアントについてリアルタイムコントロールプロトコル(RTCP)レコードから得られることを特徴とする請求項4記載の方法。
  6. 前記CNAME及び関連付けられたSSRCは、聴取するクライアントにRTCPパケットで送信されることを特徴とする請求項5記載の方法。
  7. 前記CNAME及びSSRCを、聴取するクライアントのローカルメモリに格納するステップ(312)を更に備えることを特徴とする請求項1記載の方法。
  8. 支配的クライアントはエネルギーレベル、無言の期間、持続時間又はパケットサイズのうちの少なくとも1に基づいて決定されることを特徴とする請求項1記載の方法。
  9. 前記クライアントがセッション内のソース伝送アドレスを変更するならば、クライアント正規名(CNAME)で同期ソース(SSRC)識別を更新するステップを更に備えることを特徴とする請求項1記載の方法。
  10. 会議内の各アクティブ音声クライアント参加者に基づいて前記会議の1以上のアクティブ音声クライアントのリストを順位付けるステップ(404)と、
    1以上の音声ストリーム内のリアルタイムプロトコル(RTP)貢献ソースリストフィールドに当該順位付けリストを挿入するステップと、を備え、
    前記各アクティブ音声クライアントは正規名(CNAME)及び同期ソース(SSRC)識別情報と関連付けられていることを特徴とする方法。
  11. 前記順位付けリストは支配的アクティブクライアントから始まることを特徴とする請求項10記載の方法。
  12. エネルギーレベル、無言の期間、持続時間又はパケットサイズのうちの少なくとも1に基づいて前記支配的クライアントを判別するステップを更に備えることを特徴とする請求項11記載の方法。
  13. 前記SSRC識別情報は1以上の受信した音声ストリームのためのコントロールパケットから得られる前記CNAMEにマッピングされることを特徴とする請求項11記載の方法。
  14. 前記コントロールパケットはリアルタイムコントロールプロトコル(RTCP)準拠であることを特徴とする請求項13記載の方法。
  15. 前記SSCR及び前記CNAMEはリアルタイムコントロールプロトコル(RTCP)パケットに含まれることを特徴とする請求項13記載の方法。
  16. 1以上のアクティブクライアントに含まれる支配的アクティブ音声クライアントに、他の音声クライアントがアクティブでないという表示を提供するステップ(410)を更に備えることを特徴とする請求項10記載の方法。
  17. 受信したアクティブクライアントから1以上の送信メディアストリームを発生するメディアサーバ(102)を備え、
    前記メディアサーバは前記1以上のメディアストリームに1以上のアクティブクライアントの順位付けリストを挿入することを特徴とするシステム。
  18. 前記メディアサーバは、前記順位付けリストをパケットヘッダ内のリアルタイムトランスポートプロトコル(RTP)の貢献ソースリスト(CSRC)に挿入することを特徴とする請求項17記載のシステム。
  19. 前記順位付けリストは、前記支配的クライアントから受信されたメディアストリームに関するエネルギーレベル、無言の期間、持続時間、又はパケットサイズのうちの少なくとも1に基づいて支配的クライアントを示すことを特徴とする請求項17記載のシステム。
  20. 前記メディアサーバは、送信メディアストリームを受信するクライアントに、前記正規名(CNAME)と、リアルタイムコントロールプロトコル(RTCP)パケット内の前記アクティブクライアントについての前記CNAMEにマッピングされた前記同期ソース(SSRC)識別情報とを含むアクティブクライアント識別子を送信することを特徴とする請求項17記載のシステム。
JP2010512258A 2007-06-12 2008-05-30 コンピュータにより実行される方法、メモリ及びシステム Active JP5579598B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/761,963 US8385233B2 (en) 2007-06-12 2007-06-12 Active speaker identification
US11/761,963 2007-06-12
PCT/US2008/065441 WO2008157005A1 (en) 2007-06-12 2008-05-30 Active speaker identification

Publications (2)

Publication Number Publication Date
JP2010529814A true JP2010529814A (ja) 2010-08-26
JP5579598B2 JP5579598B2 (ja) 2014-08-27

Family

ID=40133145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010512258A Active JP5579598B2 (ja) 2007-06-12 2008-05-30 コンピュータにより実行される方法、メモリ及びシステム

Country Status (8)

Country Link
US (3) US8385233B2 (ja)
EP (1) EP2163035B1 (ja)
JP (1) JP5579598B2 (ja)
KR (1) KR101486607B1 (ja)
CN (1) CN101689998A (ja)
BR (1) BRPI0812128A2 (ja)
RU (1) RU2483452C2 (ja)
WO (1) WO2008157005A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8385233B2 (en) 2007-06-12 2013-02-26 Microsoft Corporation Active speaker identification
US7782802B2 (en) * 2007-12-26 2010-08-24 Microsoft Corporation Optimizing conferencing performance
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US8370887B2 (en) 2008-05-30 2013-02-05 Microsoft Corporation Media streaming with enhanced seek operation
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
WO2010045869A1 (zh) * 2008-10-20 2010-04-29 华为终端有限公司 一种3d音频信号处理的方法、系统和装置
US8587634B1 (en) * 2008-12-12 2013-11-19 Cisco Technology, Inc. System and method for intelligent mode switching in a communications environment
CN102594776B (zh) * 2011-01-11 2016-08-03 中兴通讯股份有限公司 一种同步源标识更新的方法、装置和系统
CN103533294B (zh) * 2012-07-03 2017-06-20 中国移动通信集团公司 视频数据流的发送方法、终端及系统
CN104469255A (zh) 2013-09-16 2015-03-25 杜比实验室特许公司 改进的音频或视频会议
US20140114664A1 (en) * 2012-10-20 2014-04-24 Microsoft Corporation Active Participant History in a Video Conferencing System
US9210269B2 (en) 2012-10-31 2015-12-08 Cisco Technology, Inc. Active speaker indicator for conference participants
US9065971B2 (en) * 2012-12-19 2015-06-23 Microsoft Technology Licensing, Llc Video and audio tagging for active speaker detection
US10348778B2 (en) * 2013-02-08 2019-07-09 Avaya Inc. Dynamic device pairing with media server audio substitution
CN104079870B (zh) * 2013-03-29 2017-07-11 杭州海康威视数字技术股份有限公司 单路视频多路音频的视频监控方法及系统
JP6534926B2 (ja) * 2013-06-10 2019-06-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 話者識別方法、話者識別装置及び話者識別システム
CN105100698A (zh) * 2014-05-23 2015-11-25 中兴通讯股份有限公司 一种幼儿园视频监控方法及装置
US9257120B1 (en) 2014-07-18 2016-02-09 Google Inc. Speaker verification using co-location information
CN105376515B (zh) * 2014-09-02 2019-03-19 华为技术有限公司 用于视频通讯的通讯信息的呈现方法、装置及系统
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
US9812128B2 (en) 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
US9424841B2 (en) 2014-10-09 2016-08-23 Google Inc. Hotword detection on multiple devices
US9704488B2 (en) * 2015-03-20 2017-07-11 Microsoft Technology Licensing, Llc Communicating metadata that identifies a current speaker
US9325853B1 (en) * 2015-09-24 2016-04-26 Atlassian Pty Ltd Equalization of silence audio levels in packet media conferencing systems
US11291235B2 (en) 2016-01-19 2022-04-05 Firmenich Sa Phloretin
US9779735B2 (en) 2016-02-24 2017-10-03 Google Inc. Methods and systems for detecting and processing speech signals
CN106648722B (zh) * 2016-05-10 2020-01-10 深圳前海信息技术有限公司 基于大数据的Flume接收端数据处理方法和装置
CA3031250A1 (en) * 2016-07-19 2018-01-25 Schneider Electric Industries Sas Time-sensitive software defined networking
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
KR102241970B1 (ko) 2016-11-07 2021-04-20 구글 엘엘씨 기록된 미디어 핫워드 트리거 억제
US10559309B2 (en) 2016-12-22 2020-02-11 Google Llc Collaborative voice controlled devices
WO2018195185A1 (en) 2017-04-20 2018-10-25 Google Llc Multi-user authentication on a device
US10170119B2 (en) * 2017-05-18 2019-01-01 International Business Machines Corporation Identifying speaker roles in a streaming environment
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US10708320B2 (en) * 2017-06-27 2020-07-07 Atlassian Pty Ltd Selective internal forwarding in conferences with distributed media servers
EP3503092A1 (en) * 2017-12-21 2019-06-26 Thomson Licensing Method for establishing a link between a device and a speaker in a gateway, corresponding computer program computer and apparatus
US10595083B2 (en) * 2018-04-20 2020-03-17 The Nielsen Company (Us), Llc Methods and apparatus to determine audio source impact on an audience of media
US10692496B2 (en) 2018-05-22 2020-06-23 Google Llc Hotword suppression
US11095702B2 (en) 2018-12-20 2021-08-17 Cisco Technology, Inc. Realtime communication architecture over hybrid ICN and realtime information centric transport protocol
KR102188537B1 (ko) * 2019-08-14 2020-12-08 라인플러스 주식회사 유니캐스트 및 멀티캐스트를 이용한 그룹 통화 방법 및 시스템
US10841357B1 (en) * 2019-09-12 2020-11-17 Dialpad, Inc. Using transport layer protocol packet headers to encode application layer attributes in an audiovisual over internet protocol (AVoIP) platform
CN111049792B (zh) * 2019-10-08 2022-03-22 广州视源电子科技股份有限公司 音频传输方法、装置、终端设备和存储介质
CN111245851B (zh) * 2020-01-13 2021-12-03 广州视源电子科技股份有限公司 多终端音频传输方法、装置、终端设备和存储介质
US10880315B1 (en) 2020-02-28 2020-12-29 Cisco Technology, Inc. Active speaker naming and request in ICN-based real-time communication systems
US11863592B2 (en) * 2021-05-14 2024-01-02 Cisco Technology, Inc. Active speaker tracking using a global naming scheme
CN113271432B (zh) * 2021-06-30 2022-11-18 北京二六三企业通信有限公司 发送和接收说话者列表的方法及装置
US11546398B1 (en) * 2022-03-09 2023-01-03 Cisco Technology, Inc. Real-time transport (RTC) with low latency and high scalability

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004534457A (ja) * 2001-06-29 2004-11-11 アイピー ユニティ メディアサービスを提供する方法およびシステム
JP2005531999A (ja) * 2002-07-04 2005-10-20 ノキア コーポレイション パケット交換型電話会議の管理方法、サーバ、及び端末装置
WO2007063922A1 (ja) * 2005-11-29 2007-06-07 Kyocera Corporation 通信端末および通信システム、並びに通信端末の表示方法

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4658398A (en) 1984-10-29 1987-04-14 Gte Laboratories Incorporated Framed digital voice summing for teleconferencing
US4658396A (en) * 1985-03-11 1987-04-14 Barden Robert A Redundancy arrangement for a local area network
US5317567A (en) 1991-09-12 1994-05-31 The United States Of America As Represented By The Secretary Of The Air Force Multi-speaker conferencing over narrowband channels
US6453022B1 (en) 1998-12-31 2002-09-17 At&T Corporation Multi-line telephone with input/output mixing and audio control
US6728221B1 (en) 1999-04-09 2004-04-27 Siemens Information & Communication Networks, Inc. Method and apparatus for efficiently utilizing conference bridge capacity
US7006616B1 (en) 1999-05-21 2006-02-28 Terayon Communication Systems, Inc. Teleconferencing bridge with EdgePoint mixing
US6662211B1 (en) 2000-04-07 2003-12-09 Lucent Technologies Inc. Method and system for providing conferencing services in a telecommunications system
US6970935B1 (en) 2000-11-01 2005-11-29 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US6963561B1 (en) * 2000-12-15 2005-11-08 Atrica Israel Ltd. Facility for transporting TDM streams over an asynchronous ethernet network using internet protocol
US6728358B2 (en) * 2001-01-25 2004-04-27 Paltalk Holdings, Inc. Efficient buffer allocation for current and predicted active speakers in voice conferencing systems
US6894715B2 (en) 2001-06-16 2005-05-17 Eric Harold Henrikson Mixing video signals for an audio and video multimedia conference call
US7161939B2 (en) 2001-06-29 2007-01-09 Ip Unity Method and system for switching among independent packetized audio streams
US6753375B2 (en) 2001-07-02 2004-06-22 The Goodyear Tire & Rubber Company Process for preparing composite, composition and article thereof
US7006618B1 (en) * 2001-11-09 2006-02-28 Cisco Technology, Inc. Method and apparatus for managing incoming and outgoing calls at an endpoint placed on hold
FR2844938B1 (fr) * 2002-09-23 2005-01-14 Cit Alcatel Procede d'interception de donnees de controle, notamment de qualite de service, et dispositif associe
US6888935B1 (en) 2003-01-15 2005-05-03 Cisco Technology, Inc. Speak-louder signaling system for conference calls
WO2005018192A1 (en) 2003-08-18 2005-02-24 Alcatel Method of voip communication with additional data transmission
RU2006101325A (ru) * 2003-08-18 2006-06-10 Алькатель (Fr) СПОСОБ СВЯЗИ VoIP С ПЕРЕДАЧЕЙ ДОПОЛНИТЕЛЬНЫХ ДАННЫХ
US7460656B2 (en) 2003-12-18 2008-12-02 Intel Corporation Distributed processing in conference call systems
US20050147261A1 (en) 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
US7558221B2 (en) 2004-02-13 2009-07-07 Seiko Epson Corporation Method and system for recording videoconference data
KR100652655B1 (ko) * 2004-08-11 2006-12-06 엘지전자 주식회사 발언권 제어를 위한 피티티 서비스 시스템 및 방법
US7864209B2 (en) 2005-04-28 2011-01-04 Apple Inc. Audio processing in a multi-participant conference
DE102005049074B4 (de) 2005-10-13 2008-04-03 Infineon Technologies Ag Verfahren zum rechnergestützten Vergeben eines Kommunikationsrechts, Verfahren zum rechnergestützten Erzeugen einer Kommunikationsrecht-Anforderungsnachricht, Kommunikationsrecht-Vergabe-Einheit, Kommunikations-Konferenz-Servereinheit, Kommunikations-Konferenz-Nachricht-Erzeugungseinheit, Kommunikations-Endgerät und Verfahren zum rechnergestützten Initialisieren eines Konferenz-Nachrichtenflusses in einer Kommunikations-Konferenz
US7664246B2 (en) * 2006-01-13 2010-02-16 Microsoft Corporation Sorting speakers in a network-enabled conference
US20080159507A1 (en) * 2006-12-27 2008-07-03 Nokia Corporation Distributed teleconference multichannel architecture, system, method, and computer program product
US8014322B2 (en) * 2007-02-26 2011-09-06 Cisco, Technology, Inc. Diagnostic tool for troubleshooting multimedia streaming applications
US20080260131A1 (en) * 2007-04-20 2008-10-23 Linus Akesson Electronic apparatus and system with conference call spatializer
US8385233B2 (en) 2007-06-12 2013-02-26 Microsoft Corporation Active speaker identification
US8300080B2 (en) * 2007-06-29 2012-10-30 Microsoft Corporation Techniques for detecting a display device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004534457A (ja) * 2001-06-29 2004-11-11 アイピー ユニティ メディアサービスを提供する方法およびシステム
JP2005531999A (ja) * 2002-07-04 2005-10-20 ノキア コーポレイション パケット交換型電話会議の管理方法、サーバ、及び端末装置
WO2007063922A1 (ja) * 2005-11-29 2007-06-07 Kyocera Corporation 通信端末および通信システム、並びに通信端末の表示方法

Also Published As

Publication number Publication date
US20140177482A1 (en) 2014-06-26
EP2163035A1 (en) 2010-03-17
US20080312923A1 (en) 2008-12-18
EP2163035B1 (en) 2013-06-26
EP2163035A4 (en) 2012-04-25
KR20100021435A (ko) 2010-02-24
JP5579598B2 (ja) 2014-08-27
KR101486607B1 (ko) 2015-01-26
RU2009146029A (ru) 2011-06-20
RU2483452C2 (ru) 2013-05-27
WO2008157005A1 (en) 2008-12-24
US20130138740A1 (en) 2013-05-30
US8385233B2 (en) 2013-02-26
US8717949B2 (en) 2014-05-06
US9160775B2 (en) 2015-10-13
CN101689998A (zh) 2010-03-31
BRPI0812128A2 (pt) 2014-11-18

Similar Documents

Publication Publication Date Title
JP5579598B2 (ja) コンピュータにより実行される方法、メモリ及びシステム
US6457043B1 (en) Speaker identifier for multi-party conference
US7266091B2 (en) System and method for conferencing in inter/intranet telephony
US8149261B2 (en) Integration of audio conference bridge with video multipoint control unit
US9787844B2 (en) Conference bridge server
US20070041366A1 (en) Distributed conference bridge
KR101149987B1 (ko) 실시간 멀티미디어 정보를 효율적으로 라우팅하는 방법 및시스템
EP1487149B1 (en) VoIP system and method using multicast packet communication
US20140222921A1 (en) Third-party session modification
KR20050013667A (ko) 패킷 교환 회의 통화 관리
US20050122389A1 (en) Multi-conference stream mixing
JP2004187108A (ja) 多地点会議方法、端末状態監視サーバ及び端末
Aguirre et al. Darkcube: A k-Hypercube based P2P VoIP protocol
US20080294783A1 (en) Grid Identification for Audio Provider
KR101063706B1 (ko) 차세대 통신망에서 멀티-sdp를 이용한 회의통화부가서비스 제공방법
KR20030003433A (ko) 이기종 망간의 다자간 회의 장치 및 그 방법
KR20070080017A (ko) 다자간 통화를 주관하는 단말기 및 다자간 통화 제공방법
KR20020085931A (ko) 논리링 방식의 인터넷에서의 다자간 음성통신방법
KR20060070664A (ko) 키폰 시스템에서 엑스캐스트를 이용한 회의 기능 수행장치 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110415

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130703

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130712

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140610

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140709

R150 Certificate of patent or registration of utility model

Ref document number: 5579598

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250