JP2010512106A - Announcement Media Processing in Communication Network Environment - Google Patents

Announcement Media Processing in Communication Network Environment Download PDF

Info

Publication number
JP2010512106A
JP2010512106A JP2009540202A JP2009540202A JP2010512106A JP 2010512106 A JP2010512106 A JP 2010512106A JP 2009540202 A JP2009540202 A JP 2009540202A JP 2009540202 A JP2009540202 A JP 2009540202A JP 2010512106 A JP2010512106 A JP 2010512106A
Authority
JP
Japan
Prior art keywords
media
announcement
configuration
user
session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009540202A
Other languages
Japanese (ja)
Other versions
JP5112447B2 (en
Inventor
トマス フランキラ,
ダニエル エンストレム,
インゲマル ヨハンソン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2010512106A publication Critical patent/JP2010512106A/en
Application granted granted Critical
Publication of JP5112447B2 publication Critical patent/JP5112447B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/35Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
    • H04M2203/352In-call/conference information service

Abstract

ユーザメディアとアナウンスメディアとの切替を効果的に処理するために、基本ステップ(S1)は、まず、ユーザメディアのコンフィグレーションを判定することである。次に、判定されたユーザメディアコンフィグレーションに基づいて、提示されるアナウンスメディアのコンフィグレーションが判定される(S2)。続いて、アナウンスメディアコンフィグレーションに従って、アナウンスメディアがコンフィグレーションされ(S3)、最後にコンフィグレーションされたアナウンスメディアが意図したユーザに送信される(S4)。このようにして、アナウンスの全体的な外観または音は、ユーザメディアの全体的な外観または音と事実上同一または少なくとも類似し、好ましくは歪がない。これにより、ユーザは、アナウンスをできるだけはっきりと知覚することが可能になる。
【選択図】 なし
In order to effectively handle switching between user media and announcement media, the basic step (S1) is first to determine the configuration of the user media. Next, the configuration of the announcement media to be presented is determined based on the determined user media configuration (S2). Subsequently, the announcement media is configured according to the announcement media configuration (S3), and the finally configured announcement media is transmitted to the intended user (S4). In this way, the overall appearance or sound of the announcement is substantially the same or at least similar to the overall appearance or sound of the user media and is preferably undistorted. This allows the user to perceive the announcement as clearly as possible.
[Selection figure] None

Description

本発明は、一般的には、現代の通信ネットワークにおけるアナウンス技術(announcement technology)に関し、より詳細には、アナウンスメディアの処理と、ユーザメディアとアナウンスメディアとの切替に関係する課題とに関するものである。   The present invention relates generally to announcement technology in modern communication networks, and more particularly to processing of announcement media and issues related to switching between user media and announcement media. .

アナウンス(告知)は、テレフォニーサービス等の通信サービスにおいて重要な役割を果たす。アナウンスは、通常は、予め録音されたメディア(pre-recorded media)、または機械で生成されたメディア(machine-generated media)である。機械で生成されたメディアは、例えば、テキストを音声に変換する機能(別名、音声合成)またはテキストを画像に変換する機能で生成され得る。アナウンスは、通信ネットワーク内で生成されてもよいし、またリモートユーザの交換台またはコンピュータによって生成されてもよい。   Announcements play an important role in communication services such as telephony services. Announcements are usually pre-recorded media or machine-generated media. The machine-generated media can be generated, for example, with a function for converting text into speech (also called speech synthesis) or a function for converting text into images. Announcements may be generated within the communications network, or may be generated by a remote user switchboard or computer.

通信ネットワークからのアナウンスの使用例には、以下のものを含む。   Examples of the use of announcements from communication networks include:

・ユーザが開始しているコマンドを完了できない場合のエラーメッセージ。例えば、発呼者が電話番号を非通知にしていて、電話番号を見ることなしには電話に応答しないと着呼者が設定している場合、システムは、発呼者にエラーメッセージを提示しなければならない。   An error message when the user-initiated command cannot be completed. For example, if the caller has hidden the phone number and the caller has configured not to answer the phone without seeing the phone number, the system will present an error message to the caller. There must be.

・ユーザがセッションを保留する場合、システムは、通話相手に保留メッセージまたは保留音を再生することができる。   • If the user puts the session on hold, the system can play a hold message or tone on the other party.

・会議電話において、新規のユーザがセッションに参加する場合またはユーザがセッションから退出する場合に、会議サーバが、例えば、「John Smith(ジョン スミス)が会議に参加しました」および「John Smithが会議から退出しました」等のアナウンスを提示することができる。   -In a conference call, when a new user joins a session or when a user leaves the session, the conference server may, for example, “John Smith joins the conference” and “John Smith Announcement such as “I was withdrawn from” can be presented.

・ユーザが料金を前払いしていて、その前払い金を使い切りそうになっている。オペレータは、残金が少ないので使用を制限してもよく、セッション開始時またはセッション中(非常に長いセッションのことがある)にそれについてアナウンスしたい。   -The user has paid upfront and is about to use up the upfront payment. Operators may limit their use due to low balance and want to announce about it at the start of a session or during a session (which may be a very long session).

・インターネットでますます使用されている方法は、ウェブページ上にピンコード(またはパスワード)を有する画像を提示することである。ピンコードの画像はかなり歪んでいるので、自動テキスト認識システムはピンコードを検出できないはずであるが、賢明な人間にとっては、それでも文字と数字を読むことができるはずである。これは、(安全でない)電子メールで、対応するピンコードを送信する代わりに使用される。   An increasingly used method on the Internet is to present an image with a pin code (or password) on a web page. The pin code image is quite distorted, so an automatic text recognition system should not be able to detect the pin code, but a sensible person should still be able to read letters and numbers. This is used in (insecure) email instead of sending the corresponding pin code.

着呼者側のアナウンスの使用例には、以下のものがある。   Examples of caller side announcement usage include:

・ユーザが旅行会社に電話してチケットを予約する。以下のシナリオが想定される。   A user calls a travel agency to reserve a ticket. The following scenario is assumed.

1.ユーザが旅行会社のスタッフと相談して、最善の旅行プランを見つける。このステップでは、話し合いは2人の人間の間で行われる。   1. Users consult with travel agency staff to find the best travel plan. In this step, the discussion takes place between two people.

2.旅行について決定後、ユーザは、自身のクレジットカード番号をキーインするように依頼される。これは、人間と機械の通信であり、ここで、ユーザは、事前録音メッセージまたは機械生成メッセージを聞いて、ダイヤルボタン(0〜9)を押して自身のクレジットカード番号を入力する。このプロセスでは、以下の文が想定される。「あなたのクレジットカード番号をキーインしてください」、「番号は、1234 5678 9012 3456ですね」、「これで正しい場合は1を押してください、正しくない場合は2を押してください」、「あなたのクレジットカードの有効期限を入力してください」、「有効期限は、2007年1月1日ですね」。これらの文は、アナウンスサーバによって生成されるであろう。   2. After making a decision about the trip, the user is asked to key in their credit card number. This is a human-machine communication where the user listens to a pre-recorded message or a machine-generated message and presses the dial buttons (0-9) to enter his / her credit card number. In this process, the following statements are assumed: "Please key in your credit card number", "The number is 1234 5678 9012 3456", "If this is correct, press 1", if not, press 2 "," Your credit Please enter the expiration date of the card ”,“ The expiration date is January 1, 2007 ”. These sentences will be generated by the announcement server.

3.クレジットカード番号および他の必要なデータをキーイン後、更なる旅行のオプションを決定するために、旅行会社のスタッフとのセッションは続く。   3. After keying in the credit card number and other necessary data, the session with the travel agency staff continues to determine further travel options.

4.これらのステップは、複数回繰り返される場合がある。   4). These steps may be repeated multiple times.

・ユーザは、新しいコンピュータの購入後後のいくつかの問題を解決するために、サービスデスクまたは顧客電話窓口に電話する。サービスデスクは、スクリーニングプロセスを使用して問題を分類してから、電話を技術者に連絡する。このスクリーニングプロセスでは、ユーザは次のような質問に回答しなければならない。「お客様の問題がソフトウェア関連の場合は『1』と#を押してください。ハードウェア関連の場合は『2』を押してください。わからない場合は『3』を押してください」。このスクリーニングプロセス後、セッションは保留され、待機メッセージがユーザに対して再生される。技術者が電話に応答してもよく、また、待機メッセージを任意の時点で中断してもよい。   • The user calls a service desk or customer contact to solve some problems after purchasing a new computer. The service desk uses a screening process to classify the problem and then call the technician. In this screening process, the user must answer the following questions: “If your problem is software related, please press“ 1 ”and #. If your problem is hardware related, please press“ 2 ”. If you are not sure, please press“ 3 ”.” After this screening process, the session is suspended and a waiting message is played to the user. The technician may answer the call and the waiting message may be interrupted at any time.

従来、プロンプトおよび音声アナウンス等の情報メッセージの生成は、エンコーディング(encoding:符号化)およびデコーディング(decoding:復号)用の従来のパルス符号変調(PCM)または適応的差分PCM(ADPCM)を使用する、回線交換システムの相対的に単純な時分割多重(TDM)ベースのアナウンスマシンによって実行されている。現代および未来の通信システムでは、アナウンスを処理する条件および要件は劇的に変化するであろうから、そのような通信システムにおいてアナウンスメディアを効果的に処理するためのソリューションを提供する一般的必要性がある。   Traditionally, the generation of information messages such as prompts and voice announcements uses conventional pulse code modulation (PCM) or adaptive differential PCM (ADPCM) for encoding and decoding. It is implemented by a relatively simple time division multiplexing (TDM) based announcement machine of a circuit switched system. In modern and future communication systems, the conditions and requirements for processing announcements will change dramatically, so there is a general need to provide a solution for effectively processing announcement media in such communication systems. There is.

本発明は、上述および他の先行技術の装置の欠点を解決する。   The present invention overcomes the above and other shortcomings of the prior art devices.

本発明の一般的な目的は、通信ネットワーク環境におけるアナウンスメディアの処理を改良することである。   It is a general object of the present invention to improve the processing of announcement media in a communication network environment.

本発明の一目的は、遷移に伴う不快さおよび歪の少なくとも一方を伴うことなく、または少なくとも切替によって引き起こされる歪を削減するように、ユーザメディアとアナウンスメディアとの切替を効果的に処理することである。   One object of the present invention is to effectively handle switching between user media and announcement media without at least one of discomfort and distortion associated with transition, or at least reducing distortion caused by switching. It is.

特に、ユーザができるだけはっきりとアナウンスを知覚できるようにすることが望ましい。   In particular, it is desirable to allow the user to perceive the announcement as clearly as possible.

特に、具体的な一目的は、ユーザメディアとアナウンスメディアとを切り替える方法およびシステムを改良し提供することである。   In particular, one particular objective is to improve and provide a method and system for switching between user media and announcement media.

別の具体的な目的は、通信ネットワーク用のアナウンスサーバを改良し提供することである。   Another specific object is to improve and provide an announcement server for communication networks.

上述および他の目的は、添付の特許請求の範囲によって定義される本発明によって達成される。   The above and other objects are achieved by the present invention as defined by the appended claims.

現代の通信ネットワークがもたらす広範囲の様々なメディアコンフィグレーションにより、アナウンスメディアの全体的な音または外観が通常のユーザメディアの音または外観と比べて非常に異なることになることがあるので、それはアナウンスサーバに問題を引き起こすことがあることを、発明者たちは認識している。これは、ユーザにとって非常に不快なことがある。   Because of the wide variety of media configurations that modern communication networks provide, the overall sound or appearance of the announcement media can be very different compared to the sound or appearance of normal user media, so it is an announcement server. The inventors have recognized that this can cause problems. This can be very uncomfortable for the user.

ユーザメディアとアナウンスメディアの切替を処理するために、本発明の基本的な概念は、まず、ユーザメディアのコンフィグレーションを判定し、次いで判定したユーザメディアコンフィグレーションに基づいて、提示されるアナウンスメディアのコンフィグレーションを判定することである。続いて、アナウンスメディアをアナウンスメディアコンフィグレーションに従ってコンフィグレーションし、このコンフィグレーションされたアナウンスメディアを、意図したユーザに送信する。このようにして、アナウンスの全体的な外観または音は、ユーザメディアの全体的な外観または音と事実上同一または少なくとも類似し、好ましくは、歪がなく、ユーザができるだけはっきりとアナウンスを知覚することを可能にするであろう。   In order to handle switching between user media and announcement media, the basic concept of the present invention is to first determine the configuration of the user media, and then based on the determined user media configuration, the announcement media to be presented. It is to determine the configuration. Subsequently, the announcement media is configured according to the announcement media configuration, and the configured announcement media is transmitted to the intended user. In this way, the overall appearance or sound of the announcement is substantially the same or at least similar to the overall appearance or sound of the user media, preferably without distortion and the user perceiving the announcement as clearly as possible Will enable.

しかしながら、本発明が、音声やオーディオに限定されず、映像にも適用されてもよいことも理解されるべきである。   However, it should be understood that the present invention is not limited to voice and audio, but may be applied to video.

通常、ユーザメディアは、通話相手のリモートユーザから到来し、アナウンスメディアは、アナウンスサーバまたはプロセッサから到来する。しかしながら、アナウンスサーバは、ネットワークベースのアナウンスサーバとしてネットワーク側に配置されてもよいし、またリモートユーザに関連したユーザ側、例えば、ユーザ機器もしくは構内交換機(PBX)内に配置されてもよい。   Typically, the user media comes from the remote user with whom you are talking, and the announcement media comes from the announcement server or processor. However, the announcement server may be located on the network side as a network-based announcement server, or it may be located on the user side associated with the remote user, eg, user equipment or a private branch exchange (PBX).

本発明の好ましい例示的実施形態では、そのユーザメディアコンフィグレーションから適切なユーザメディアコンフィグレーションを選択または他の手段で判定されてもよい、1つ以上の有効なユーザメディアコンフィグレーションを識別するために、当該ユーザ(considered users)間のユーザメディアに関する通信セッションのセットアップがモニタされる。   In a preferred exemplary embodiment of the present invention, to identify one or more valid user media configurations that may be selected or otherwise determined from its user media configuration. The setup of the communication session regarding the user media between the concerned users is monitored.

好ましくは、現在使用されているユーザメディアコンフィグレーションを検出するために、ユーザ通信がモニタされ、アナウンスメディアコンフィグレーションを現在のユーザメディアコンフィグレーションに一致(マッチング)させることを可能にする。次いで、アナウンスサーバにそのコンフィグレーションされたアナウンスメディアをセッションに挿入させることによって、コンフィグレーションされたアナウンスメディアは、意図したユーザに転送されることが好ましい。選択的には、アナウンスメディアは、例えば、アナウンスメディア用の新規のセッションを確立することによって、ユーザメディアと並行して送信される。   Preferably, user communications are monitored to detect the currently used user media configuration, allowing the announcement media configuration to match the current user media configuration. The configured announcement media is then preferably transferred to the intended user by causing the announcement server to insert the configured announcement media into the session. Optionally, the announcement media is transmitted in parallel with the user media, for example by establishing a new session for the announcement media.

好ましくは、ユーザメディアに対するコーデックおよび/または伝送フォーマットコンフィグレーションが判定され、次いで、アナウンスメディアコンフィグレーションが、アナウンスメディアのコーデックおよび/または伝送フォーマットコンフィグレーションとユーザメディアのコーデックおよび/または伝送フォーマットコンフィグレーションとの一致(マッチング)に基づいて判定される。   Preferably, the codec and / or transmission format configuration for the user media is determined, and then the announcement media configuration includes the announcement media codec and / or transmission format configuration and the user media codec and / or transmission format configuration, and It is determined based on the matching (matching).

別の態様では、本発明は、通信ネットワーク用のアナウンスサーバに関する。基本的には、アナウンスサーバは、ネットワークの通信セッションにおけるユーザメディアのコンフィグレーションを示すメディアコンフィグレーション情報を取得するように、かつメディアコンフィグレーション情報に基づいてセッションに挿入されるアナウンスメディアをコンフィグレーションするように構成される。さらに、アナウンスサーバは、コンフィグレーションされたアナウンスメディアをセッションに挿入するように動作可能である。   In another aspect, the invention relates to an announcement server for a communication network. Basically, the announcement server configures the announcement media to be inserted into the session based on the media configuration information so as to obtain the media configuration information indicating the configuration of the user media in the network communication session. Configured as follows. In addition, the announcement server is operable to insert the configured announcement media into the session.

本発明によって提供される他の利点は、本発明の実施形態についての以下の説明を読むと理解されるであろう。   Other advantages provided by the present invention will be appreciated upon reading the following description of embodiments of the invention.

本発明の他の目的および利点とともに、本発明は、添付の図面と一緒に以下の説明を参照することにより最もよく理解されるであろう。   The invention, together with other objects and advantages thereof, will be best understood by reference to the following description taken in conjunction with the accompanying drawings.

例示的システム概観を示す概略図である。FIG. 1 is a schematic diagram illustrating an example system overview. エンコーダ状態がリセットされるのに対してデコーダ状態がリセットされない場合の歪を示す概略図である。FIG. 6 is a schematic diagram showing distortion when the encoder state is reset while the decoder state is not reset. デコーダ状態がリセットされるのに対してエンコーダ状態がリセットされない場合の歪を示す概略図である。FIG. 6 is a schematic diagram showing distortion when the encoder state is not reset while the decoder state is reset. 本発明の一例示的実施形態に従うユーザメディアとアナウンスメディアの切替の基本的方法の概略のフロー図である。FIG. 4 is a schematic flow diagram of a basic method of switching between user media and announcement media according to an exemplary embodiment of the present invention. 本発明の別の例示的実施形態に従うユーザメディアとアナウンスメディアの切替方法の概略のフロー図である。FIG. 6 is a schematic flow diagram of a method for switching between user media and announcement media according to another exemplary embodiment of the present invention. 本発明の一例示的実施形態に従うネットワーク側およびユーザ側を含むシステム概観図である。FIG. 2 is a system overview including a network side and a user side according to an exemplary embodiment of the present invention. 本発明の別の例示的実施形態に従う概観図である。FIG. 4 is an overview according to another exemplary embodiment of the present invention. 本発明のまた別の例示的実施形態に従う概観図である。FIG. 3 is an overview diagram according to yet another exemplary embodiment of the present invention. 取り得る好ましい実施形態に従うアナウンスサーバの概略のブロック図である。FIG. 2 is a schematic block diagram of an announcement server according to a possible preferred embodiment.

図面全体を通して、同一の参照文字は、対応する要素または同様の要素に対して使用される。   Throughout the drawings, the same reference characters are used for corresponding or similar elements.

本発明のより良い理解のためには、簡潔なシステム概観から始めるのが役立つであろう。   For a better understanding of the present invention, it may be helpful to start with a brief system overview.

図1は、例示的なシステムの概観を示す概略図である。この例示的なシステムは、関連基地局20−1、20−2経由で通信中の2人のエンドユーザAおよびBのユーザ機器(UE)10−1、10−2と、ネットワークベースのアナウンスサーバ30とを有する。この場合、リアルタイムプロトコル(RTP)[1]メディアストリーム等のメディアストリームは、メディアリソース機能プロセッサ(MRFP)[2]でもよいアナウンスサーバを常に通過する。この例では、アナウンスサーバは、ユーザAからのRTPストリームをアナウンスに置換する、これは、インバンドアナウンス(in-band announcement:帯域内アナウンス)と呼ばれる。   FIG. 1 is a schematic diagram showing an overview of an exemplary system. This exemplary system includes two end user A and B user equipment (UE) 10-1, 10-2 communicating via associated base stations 20-1, 20-2 and a network-based announcement server. 30. In this case, a media stream, such as a real-time protocol (RTP) [1] media stream, always passes through an announcement server which may be a media resource function processor (MRFP) [2]. In this example, the announcement server replaces the RTP stream from user A with an announcement, which is called an in-band announcement.

アナウンスを導入する他の方法も可能であり、例えば、アナウンスサーバを通過することなく、メディアがAとBの間で直接送信されるものがある。この場合、アナウンスは、アナウンスサーバからUE(ユーザ機器)BへSIP INVITEで送信されてもよく、UE Bは、アナウンスサーバから受信されるメディアを生成するために、UE Aから受信されるメディアを破棄しなければならない。別の代替方法としては、アナウンスメディアへのリンク(URL)を含むSIP INFOまたはSIP NOTIFYメッセージ等のメッセージを送信することである。一般に、代替方法は、このように、アナウンスメディア用に新規のセッションを確立してまたは確立せずに、ユーザメディアに並行してアナウンスメディアを送信することである。   Other ways of introducing announcements are possible, for example, where media is sent directly between A and B without going through the announcement server. In this case, the announcement may be sent in SIP INVITE from the announcement server to the UE (User Equipment) B, and the UE B receives the media received from UE A to generate the media received from the announcement server. Must be destroyed. Another alternative is to send a message such as a SIP INFO or SIP NOTIFY message that includes a link (URL) to the announcement media. In general, an alternative method is thus to send announcement media in parallel to the user media, with or without establishing a new session for the announcement media.

アナウンスサーバは、通信ネットワーク内に設置されてもよい。IPマルチメディアサブシステム(IMS)等の現代のシステムでは、アナウンスサーバは、メディアリソース機能プロセッサ(MRFP)内に通常設置されるであろうが、例えば、会議サーバ等のアプリケーションサーバにも設置できよう。   The announcement server may be installed in the communication network. In modern systems such as the IP Multimedia Subsystem (IMS), the announcement server will typically be installed in the Media Resource Capability Processor (MRFP), but could also be installed in an application server such as a conference server, for example. .

アナウンスサーバを、エンドポイント内もしくはエンドポイント近くに、ユーザ機器内に、コンピュータ内に、または構内交換機(PBX)内に有することも可能である。   It is also possible to have an announcement server in or near the endpoint, in user equipment, in a computer, or in a private branch exchange (PBX).

発明者たちによる入念な分析で、既存のソリューションは、以下に説明する1つ以上の問題に晒されていることが明らかになっている。   Careful analysis by the inventors has revealed that existing solutions are exposed to one or more of the problems described below.

現在のところ既存の回線交換システムでは、アナウンスが機能しているが、これは、使用されるコーデックが典型的にはPCM[4]またはADPCM[5]であるからうまく機能しているのである。これらのコーデックは、予測を全く使用しない(PCM)、または非常に限られた量の予測しか使用しない(ADPCM)、サンプル単位のコーデックである。これは、デコーダが状態不一致から非常に急激に回復すると、聞き取れる歪を引き起こす可能性が低いことを意味する。   At present, in existing circuit-switched systems, the announcement works, which works well because the codec used is typically PCM [4] or ADPCM [5]. These codecs are sample-by-sample codecs that do not use prediction at all (PCM) or use only a very limited amount of prediction (ADPCM). This means that if the decoder recovers very quickly from a state mismatch, it is unlikely to cause audible distortion.

さらに、従来のシステムは、コーデックを1つだけ使用する、例えば、PCMまたはADPCMのどちらかを使用するのであって、決して両方を使用しない。システムは、全セッション中に、同一の伝送フォーマットも使用し、例えば、コーデックレート、フレームアグリゲーション(frame aggregation:フレーム集約)、または冗長度を決して状況に応じて変化させない。実際のところ、システムは、すべてのセッションに対して同一の構成を使用する。   Furthermore, conventional systems use only one codec, for example using either PCM or ADPCM, and never both. The system also uses the same transmission format during all sessions, for example, never changes codec rate, frame aggregation, or redundancy depending on the situation. In fact, the system uses the same configuration for all sessions.

IPマルチメディアサブシステム(IMS)等の現代および将来のシステムでは、その中でも特にマルチメディアテレフォニ(MMTel)[6]に関しては、状況は完全に異なる。数種類のメディアを送信することが可能である。このメディアは、異なるコーデックでかつ異なるレートで符号化され得る。異なる伝送フォーマットが使用される可能性がある。すなわち、ペイロードフォーマットが、フレームアグリゲーションありでまたはなしで、冗長度ありでまたはなしでも、使用される得る。これらの変形は、ネットワーク輻輳に対するリスクを減らし、輻輳期間中でさえ合理的な品質でセッションを維持できるようにセッションを適応させるために必要である。これは、無線チャネルが大幅に変化するセルラ方式では特に重要である。しかしながら、これらの変形は、アナウンスサーバに対して問題を引き起こす。以前したような1つの方法だけでアナウンスメディアを符号化し、受信者が満足することを望むことはできない。UE AとUE Bとの間のメディアは、通常、広帯域コーデック(AMR−WB)で符号化されているが、アナウンスを狭帯域コーデック(適応マルチレート:AMR)で符号化する場合、メディアは全く異なって聞こえるであろうし、受信ユーザは、アナウンスが通常のメディアとはなぜ大幅に異なって聞こえるのか疑問に感じるであろう。最悪の場合、受信ユーザは、不快になりアナウンスの実際の内容よりメディア品質に関心が行ってしまうかもしれず、これは、ユーザがアナウンスを誤解さえしかねないことを意味する。   In modern and future systems such as the IP Multimedia Subsystem (IMS), the situation is completely different, especially with regard to Multimedia Telephony (MMTel) [6]. Several types of media can be sent. This media may be encoded with different codecs and at different rates. Different transmission formats may be used. That is, the payload format may be used with or without frame aggregation and with or without redundancy. These variations are necessary to reduce the risk to network congestion and to adapt the session so that it can be maintained with reasonable quality even during periods of congestion. This is particularly important in cellular systems where the radio channel changes significantly. However, these variants cause problems for the announcement server. It is not possible to encode the announcement media in just one way as it did before and hope that the recipient is satisfied. Media between UE A and UE B is typically encoded with a wideband codec (AMR-WB), but if the announcement is encoded with a narrowband codec (adaptive multirate: AMR), the media is completely It will sound different, and the receiving user will be wondering why the announcement sounds so different from normal media. In the worst case, the receiving user may become uncomfortable and more interested in media quality than the actual content of the announcement, which means that the user may even misunderstand the announcement.

さらに、現代の予測ベースのコーデックの使用は、アナウンスが通常のメディアを中断する場合に、状態不一致をもたらすことがあり、同様に、ユーザを不快にさせることがある聞き取り可能な歪を生じる可能性がある。予測は、例えば、AMR[7]またはAMR−WB[8]等の現代のコーデックに関しては非常に重要である。フレーム間予測は、ビットレートを減少させるために、すなわち、高圧縮比にするために使用されるが、それでもよい品質を提供する。フレーム間予測では、フレームからフレームへ状態が渡される必要がある。アナウンスが通常のメディアを中断する場合、ユーザからの音声メディアに対するUE Aの1つのコーデックインスタンスと、アナウンスサーバの1つのコーデックインスタンスとの2つの異なるコーデックインスタンスが使用されるので、状態不一致となるであろう。UE Aの状態は、使用される予測に従って進展しているのに対して、アナウンスサーバの状態は、初期設定状態から開始する。状態不一致は、現在のコンテンツに依存して、多かれ少なかれ聞き取れる歪を引き起こし得るる。そのような歪の2つの例が、図2および図3に示されている。両方の場合とも歪は、はっきり聞き取れ、聞き手によって容易に気付かれるが、図2のスパイクの方がはるかに気に障る。   In addition, the use of modern prediction-based codecs can lead to state discrepancies when announcements interrupt regular media, and can also cause audible distortions that can be uncomfortable for the user. There is. Prediction is very important for modern codecs such as AMR [7] or AMR-WB [8]. Inter-frame prediction is used to reduce the bit rate, ie to achieve a high compression ratio, but still provides good quality. In inter-frame prediction, the state needs to be passed from frame to frame. If the announcement interrupts normal media, two different codec instances are used, one codec instance for UE A for voice media from the user and one codec instance for the announcement server, resulting in a state mismatch. I will. The state of UE A is evolving according to the prediction used, while the state of the announcement server starts from the default state. State mismatch can cause more or less audible distortion, depending on the current content. Two examples of such distortion are shown in FIGS. In both cases, the distortion is clearly audible and easily noticed by the listener, but the spike in FIG. 2 is much more disturbing.

図2および3からは、非同期のリセット後、合成音が正常な状態に回復させるためには、約100〜200msかかることを把握することができる。その代わりに、PCM等のステートレス(state-less)コーデックは、状態(ステート)を適切なコンテンツに「作り上げる」必要がないので、直ぐに正常な状態に戻るであろう。   2 and 3, it can be understood that it takes about 100 to 200 ms for the synthesized sound to recover to a normal state after the asynchronous reset. Instead, a stateless codec such as PCM will soon return to a normal state as it does not have to “make up” the state with the appropriate content.

従来の回線交換システムは、典型的には、音量レベルの制御も有しており、音量が適切でない場合、ネットワーク内で音量を調節する。マルチメディアテレフォニのようなVoIPシステムは、着想が変換(transcoding:トランスコーディング)および他の種類の変更なしにVoIPパケットをエンドツーエンドで送信するものなので、おそらくそのような機能を持たないであろう。VoIPに関しては、それゆえ、通話相手が大声または小声で話している場合、エンドユーザは音量をかなり多く調整していそうである。アナウンスサーバが音量を確認せずにアナウンスメディアを挿入する場合、小さすぎる音量で提示されたり、とても大きな音量で提示され、聞き手が直ぐに耳から電話機を離さなければならなかったりするので、メッセージ全部が聞き洩らされるかもしれない。   Conventional circuit switching systems typically also have control of the volume level, and adjust the volume within the network if the volume is not appropriate. VoIP systems such as multimedia telephony will probably not have such functionality, since the idea is to send VoIP packets end-to-end without transcoding and other types of changes. . With respect to VoIP, therefore, if the other party is speaking loudly or quietly, the end user is likely to adjust the volume considerably. If the announcement server inserts the announcement media without checking the volume, it will be presented at a volume that is too low, or it will be presented at a very high volume and the listener will have to take the phone off the ear immediately, so the entire message It may be overlooked.

これらの問題は、音声に限られていない。同様の問題は、オーディオおよび映像に関しても起こる。これらの問題に関して、これらのメディアタイプに対するコーデックが、典型的には、音声コーデックよりさらに高い圧縮比を有し、また、この圧縮比を達成するために、よい品質状態にさらにもっと依存するので、さらに大きな問題を予想することができる。   These problems are not limited to voice. Similar problems occur with audio and video. With respect to these issues, since the codecs for these media types typically have a higher compression ratio than the voice codec, and depend even more on good quality conditions to achieve this compression ratio, Greater problems can be anticipated.

本発明の実施形態は、これらの問題の1つ以上に関連する。   Embodiments of the invention relate to one or more of these issues.

最初に、現代の通信ネットワークの多種多様の可能なメディアコンフィグレーション(configuration:構成)によってもたらされる問題に、主に向けられている実施形態例を説明する。この問題は、アナウンスメディアの全体的な音または外観(appearance:アピアランス)が、通常のユーザメディアの音または外観と比べて非常に異なっていることになることがあるということである。これは、ユーザにとって非常に不快となり得る。   First, an example embodiment will be described that is primarily directed to the problems posed by the wide variety of possible media configurations of modern communication networks. The problem is that the overall sound or appearance of the announcement media can be very different compared to the sound or appearance of normal user media. This can be very uncomfortable for the user.

図4は、本発明の一例示的実施形態に従う、ユーザメディアとアナウンスメディア間の切替の基本的方法の概略のフロー図である。ユーザメディアとアナウンスメディア間の切替を効果的に処理するために、基本ステップ(S1)は、まず、ユーザメディアのコンフィグレーションを判定する。次に、提示されるアナウンスメディアのコンフィグレーションが、判定されたユーザメディアコンフィグレーションに基づいて判定される(S2)。続いて、アナウンスメディアがアナウンスメディアコンフィグレーションに従ってコンフィグレーションされ(S3)、コンフィグレーションされたアナウンスメディアが意図したユーザに最終的に送信される(S4)。このようにして、アナウンスの全体的な外観または音は、好ましくは、歪みなしに、ユーザメディアの全体的な外観または音と事実上同一または少なくとも類似することになる。これにより、ユーザに、できるだけはっきりとアナウンスを知覚させることが可能になる。例えば、ユーザメディアおよびアナウンスメディアは、音声、オーディオまたは映像であってもよい。   FIG. 4 is a schematic flow diagram of a basic method of switching between user media and announcement media according to an exemplary embodiment of the present invention. In order to effectively handle switching between user media and announcement media, the basic step (S1) first determines the configuration of the user media. Next, the configuration of the presented announcement media is determined based on the determined user media configuration (S2). Subsequently, the announcement media is configured according to the announcement media configuration (S3), and the configured announcement media is finally transmitted to the intended user (S4). In this way, the overall appearance or sound of the announcement will preferably be substantially the same or at least similar to the overall appearance or sound of the user media without distortion. This allows the user to perceive the announcement as clearly as possible. For example, user media and announcement media may be voice, audio or video.

好ましくは、本発明の例示的実施形態では、ユーザメディアのコーデックコンフィグレーションが判定され、次いで、アナウンスメディアのコーデックコンフィグレーションがユーザメディアの判定されたコーデックコンフィグレーションに一致させることが好ましい。これは、アナウンスメディアに対して同一または少なくとも類似のコーデックコンフィグレーションが使用されることを意味する。こうすることにより、2つのメディアが意図したユーザに同様に聞こえるまたは同様に見える機会が増加する。例えば、コーデックコンフィグレーションは、コーデックのタイプ、コーデックモード、およびオプションでコーデックモード切替機能も含んでもよい。   Preferably, in the exemplary embodiment of the present invention, the codec configuration of the user media is determined, and then the codec configuration of the announcement media is matched with the determined codec configuration of the user media. This means that the same or at least a similar codec configuration is used for the announcement media. This increases the chance that the two media will sound or look similar to the intended user. For example, the codec configuration may also include a codec type, a codec mode, and optionally a codec mode switching function.

また、ユーザメディアの伝送フォーマットコンフィグレーションを判定し、アナウンスメディアの伝送フォーマットコンフィグレーションをユーザメディアの伝送フォーマットコンフィグレーションに一致させようとすることも可能である。このようにして、アナウンスメディアは、伝送機能障害によって深刻な影響を受けなさそうである。   It is also possible to determine the transmission format configuration of the user media and to match the transmission format configuration of the announcement media with the transmission format configuration of the user media. In this way, the announcement media is not likely to be severely affected by transmission failure.

オプションとして、ユーザメディアのフレームアグリゲーションおよび冗長度フォーマットコンフィグレーションが判定され、アナウンスメディアのフレームアグリゲーションおよび冗長度フォーマットコンフィグレーションを、ユーザメディアのアナウンスメディアのフレームアグリゲーションおよび冗長度フォーマットコンフィグレーションと一致させることが可能になる。   Optionally, the user media frame aggregation and redundancy format configuration is determined, and the announcement media frame aggregation and redundancy format configuration may be matched with the user media announcement media frame aggregation and redundancy format configuration. It becomes possible.

図5は、本発明の別の例示的実施形態によるユーザメディアとアナウンスメディアの切替方法の概略のフロー図である。   FIG. 5 is a schematic flow diagram of a method for switching between user media and announcement media according to another exemplary embodiment of the present invention.

好ましくは、適切なユーザメディアコンフィグレーションを選択または判定することができる、1つ以上の有効なユーザメディアコンフィグレーションを識別するために、該当ユーザのユーザ機器間のユーザメディアに対する通信セッションのセットアップがモニタされる(S11)。続いて、有効なユーザメディアコンフィグレーションの中の現在使用されているメディアコンフィグレーションを検出するために、セッション中のユーザ通信がモニタされる(S12)。次いで、アナウンスメディアコンフィグレーションが現在のユーザメディアコンフィグレーションに一致される(S13)。オプションで、セッション中にアナウンスメディアを挿入する適切なタイミングが、例えば、アナウンスの緊急性を検討することによって判定される(S14)。アナウンスサーバにコンフィグレーションされたアナウンスメディアをセッションに挿入させる(S15)ことによって、コンフィグレーションされたアナウンスメディアは、意図したユーザに最終的に転送される。選択的には、例えば、アナウンスメディア用に新規のセッションを確立することによって、またはアナウンスメディアへのリンクを有する制御メッセージを単に送信することによって、アナウンスメディアは、ユーザメディアと並行して送信される。   Preferably, the setup of a communication session for user media between the user devices of the relevant user is monitored to identify one or more valid user media configurations from which an appropriate user media configuration can be selected or determined. (S11). Subsequently, user communication during the session is monitored to detect the currently used media configuration in the valid user media configuration (S12). Next, the announcement media configuration is matched with the current user media configuration (S13). Optionally, the appropriate timing for inserting the announcement media during the session is determined, for example, by considering the urgency of the announcement (S14). By causing the announcement server to insert the configured announcement media into the session (S15), the configured announcement media is finally transferred to the intended user. Optionally, the announcement media is sent in parallel with the user media, for example, by establishing a new session for the announcement media or simply sending a control message with a link to the announcement media. .

この特定のシナリオでは、セッションの基本定義は、例えば、セッション開始プロトコル(SIP)のセッション記述プロトコル(SDP)を使用することによって、セッションセットアップ中に普通はネゴシエートされる。例えば、いくつかの取り得る有効なメディアコンフィグレーションは、SDPシグナリングで定義され、かつそれぞれの識別子に関連付けられてもよい。特定の例示的実施形態では、識別子として、ペイロードタイプ番号を利用することによって、メディアコンフィグレーションを識別するために、RTPパケットのペイロードタイプフィールドが使用されてもよい。この番号は、有効なメディアコンフィグレーションに関係付けることができる。ペイロードタイプ番号とメディアコンフィグレーションの関連付けは、セッションセットアップ中(例えば、SIP INVITE)およびセッション再コンフィグレーション時(SIP UPDATE、またはいわゆるSIP RE−INVITE)の少なくとも一方の時点で行われるのが好ましい。その後の通信中に、RTPパケット等のメディアパケットの送信時、ペイロードタイプ番号を抽出するために、ペイロードタイプフィールドがモニタされてもよく、次いで、ペイロードタイプ番号は、現在使用されているメディアコンフィグレーションに関連付けられ得る。   In this particular scenario, the basic definition of the session is normally negotiated during session setup, for example by using Session Initiation Protocol (SIP) Session Description Protocol (SDP). For example, several possible valid media configurations may be defined with SDP signaling and associated with each identifier. In certain exemplary embodiments, the payload type field of the RTP packet may be used to identify the media configuration by utilizing the payload type number as an identifier. This number can be associated with a valid media configuration. The association between the payload type number and the media configuration is preferably performed at least one time during session setup (eg, SIP INVITE) and during session reconfiguration (SIP UPDATE or so-called SIP RE-INVITE). During subsequent communication, upon transmission of a media packet, such as an RTP packet, the payload type field may be monitored to extract the payload type number, and then the payload type number is determined based on the currently used media configuration. Can be associated with

一例として、メディアコンフィグレーションは、以下の情報項目の1つまたはいくつかによって定義され得る。   As an example, a media configuration may be defined by one or several of the following information items:

・コーデック(群)
例えば、AMR、GSM−EFR(GSM Enhanced Full Rate:GSM拡張フルレート)、EVRC(Enhanced Variable Rate Codec」拡張可変レートコーデック)等。
Codec (group)
For example, AMR, GSM-EFR (GSM Enhanced Full Rate), EVRC (Enhanced Variable Rate Codec), etc.

・コーデックモード(群)
適用可能な場合
例えば、AMRに対して、8つのコーデックモードのすべてが許容されてもよいし、またコーデックモードのサブセットが許容されてもよい。
Codec mode (group)
Where applicable For example, for AMR, all eight codec modes may be allowed, or a subset of codec modes may be allowed.

・コーデックモード切替機能
適用可能な場合
例えば、AMRに対して、コーデックモード切替が隣接したコーデックモード間だけで許容されると指定されてもよい、すなわち、一例として、ビットレート12.2、7.4、5.9および4.75kbpsで規定されるコーデックモード等のAMRコーデックモードのサブセットが許容され、かつビットレート12.2のコーデックモードからビットレート4.75のコーデックモードへの切替が望まれる場合、その切替は、コーデックモード7.4および5.9を通過しなければならない。
Codec mode switching function When applicable For example, it may be specified for AMR that codec mode switching is allowed only between adjacent codec modes, ie, bit rates 12.2, 7. Subsets of AMR codec modes such as codec modes specified at 4, 5.9 and 4.75 kbps are allowed, and switching from a code rate mode of 12.2 to a codec mode of bit rate 4.75 is desired. If so, the switch must go through codec modes 7.4 and 5.9.

・ペイロードフォーマット
適用可能な場合
例えば、AMRに対しては、帯域幅高効率およびオクテット配列(octet-aligned)の2つの基本的なオプションがある。
Payload format Where applicable For example, there are two basic options for AMR: bandwidth efficient and octet-aligned.

・パケット当たり推奨フレーム数
これは一般に厳格な要件ではない。
• Recommended number of frames per packet This is generally not a strict requirement.

・パケット当たり最大データ量
これは一般に厳格な要件である。
• Maximum amount of data per packet This is generally a strict requirement.

それゆえ、セッションセットアップ時、様々な取り得るメディアコンフィグレーションの範囲が通常は指定される。セッションセットアップ中にネゴシエートされるメディアコンフィグレーションの中の任意のメディアコンフィグレーションを単に選択することによって、適正ではあるが、通常は次善のソリューションを取得することが可能である。いくつかの有効なメディアコンフィグレーションが許容される場合、より良いソリューションは、種々のコンフィグレーションが好ましくはどの順番で使用されるべきかを示す優先順を提供することであってもよい。例えば、例示的なコンフィグレーションA、BおよびCが許容される場合、SIP INVITEの中で好ましい順番はB、C、Aであると指定することができる。   Therefore, during session setup, various possible media configuration ranges are usually specified. By just selecting any media configuration among the media configurations negotiated during session setup, it is possible to obtain a reasonable but usually sub-optimal solution. If several valid media configurations are allowed, a better solution may be to provide a priority order that indicates in which order the various configurations should preferably be used. For example, if exemplary configurations A, B, and C are allowed, the preferred order in SIP INVITE can be specified as B, C, A.

しかしながら、ユーザ通信中にどのコンフィグレーション(群)が現在使用されているかをモニタすることによって、アナウンスメディアに対するメディアコンフィグレーションの選択を最適化することが可能である。   However, by monitoring which configuration (s) are currently being used during user communication, it is possible to optimize the selection of media configuration for the announcement media.

一例として、ユーザクライアントが状態の悪いチャネルを感知し、例えば、可能な最低のビットレートを使用し、かつ同一のフレームを数回送信して冗長性を加えることによってして、ロバスト性(robustness)を最大に適用させている場合、同一のまたは同様のコンフィグレーションを使用してアナウンスが処理される場合が最善となるであろう。そうでなければ、音声コーディング(符号化)に対するデフォルトコンフィグレーションは、可能な最高のビットレートで通常開始され、続いて、よりロバスト性になる方向に適応を実行することになるであろう。しかしながら、この適応は、通常は時間がかかり、ユーザメディアに対して使用されたものに対応する同一のロバスト性のレベルに適応が到達する前に、アナウンスが既に完了しているというリスクがある。本発明を使用して、現在使用されているメディアコンフィグレーションをモニタすることによって、アナウンスメディアコンフィグレーションをユーザメディアコンフィグレーションに直ぐに一致させることができる。   As an example, robustness can be achieved by the user client perceiving a bad channel, eg, using the lowest possible bit rate and adding the same frame several times to add redundancy. Is best applied when the announcement is processed using the same or similar configuration. Otherwise, the default configuration for speech coding (encoding) will usually start at the highest possible bit rate and then perform adaptation in the direction that will be more robust. However, this adaptation is usually time consuming and there is a risk that the announcement is already completed before the adaptation reaches the same level of robustness corresponding to that used for the user media. Using the present invention, the announcement media configuration can be immediately matched to the user media configuration by monitoring the currently used media configuration.

アナウンスサーバが何らかの理由でセッションセットアップ中に示される有効なメディアコンフィグレーションの一部または全部をサポートしない場合、どのメディアコンフィグレーションを使用すべきかについてのローカルでの決定は、アナウンスサーバによって許容されているコンフィグレーション(のサブセット)に基づき、アナウンスサーバで行われてもよい。   If the announcement server does not support some or all of the valid media configurations shown during session setup for any reason, a local decision on which media configuration to use is allowed by the announcement server Based on (a subset of) the configuration, it may be performed on the announcement server.

一般に、ユーザメディアおよびアナウンスメディアは、第1のユーザのユーザ機器等の第1のネットワーク要素を対象にしている。ユーザメディアは、通常、リモートユーザのユーザ機器等の第2のネットワーク要素から到来する。アナウンスメディアは、通常、アナウンスサーバ等の第3のネットワーク要素から到来する。しかしながら、アナウンスサーバは、ネットワークベースのアナウンスサーバとしてネットワーク側に配置されてもよいし、リモートユーザに関連するユーザ側に配置されてもよいことに留意するべきである。後者の場合、第2のネットワーク要素および第3のネットワーク要素は同一であっても良いし、または少なくとも互いに近い関係にあってもよい。本発明の種々の例示的な実施形態について説明する。   In general, user media and announcement media are directed to a first network element, such as a first user's user equipment. User media typically comes from a second network element, such as a remote user's user equipment. Announcement media usually comes from a third network element such as an announcement server. However, it should be noted that the announcement server may be located on the network side as a network-based announcement server or may be located on the user side associated with the remote user. In the latter case, the second network element and the third network element may be the same or at least close to each other. Various exemplary embodiments of the invention are described.

図6は、本発明の一例示的実施形態に従うネットワーク側およびユーザ側を含むシステム概観図である。基本的に、2人のユーザAおよびBのユーザ機器(UE)10−1、10−2が、通信ネットワークを介して通信している。この特定の例では、通信はアナウンスサーバ30を通過し、このアナウンスサーバ30は、適切にコンフィグレーションされたアナウンスをユーザ間の通信に挿入する。アナウンスサーバ30は、ユーザメディアコンフィグレーションおよびアナウンスメディアコンフィグレーションの判定のためのモジュール32と、1つ以上の事前録音アナウンスまたは機械生成アナウンスを保持するデータベース34と、アナウンスメディアのコンフィグレーション用のモジュール36と、ユーザメディアストリームをコンフィグレーションされたアナウンスメディアで置換するための制御可能切替機構38とを備える。   FIG. 6 is a system overview including a network side and a user side according to an exemplary embodiment of the present invention. Basically, user equipment (UE) 10-1, 10-2 of two users A and B are communicating via a communication network. In this particular example, the communication passes through the announcement server 30, which inserts a properly configured announcement into the communication between users. The announcement server 30 includes a module 32 for determining user media configuration and announcement media configuration, a database 34 holding one or more pre-recorded announcements or machine-generated announcements, and a module 36 for configuration of announcement media. And a controllable switching mechanism 38 for replacing the user media stream with the configured announcement media.

好ましくは、アナウンスサーバ30は、ユーザ間のセッションセットアップをモニタし、1つ以上の有効なユーザメディアコンフィグレーションを識別するようにコンフィグレーションされる。有効なユーザメディアコンフィグレーションについての情報は、通常、アナウンスサーバに関連するテーブル(不図示)内に関連識別子とともに記憶される。次いで、アナウンスサーバ30は、いくつかの異なる方法でこれらのメディアコンフィグレーションの中から選択してもよい。本発明の好ましい例示的実施形態では、ユーザメディアパケットが、現在使用されているユーザメディアコンフィグレーションを識別するために、セッション中モニタされる。好ましくは、これは、1つ以上のメディアパケットのパケットヘッダからメディアコンフィグレーション識別子を抽出し、この識別子を有効なユーザメディアコンフィグレーションのテーブルに記憶されている特定のユーザメディアコンフィグレーションにマッピングすることによって実行される。   Preferably, the announcement server 30 is configured to monitor session setup between users and identify one or more valid user media configurations. Information about valid user media configurations is typically stored with associated identifiers in a table (not shown) associated with the announcement server. The announcement server 30 may then select from these media configurations in a number of different ways. In a preferred exemplary embodiment of the present invention, user media packets are monitored during a session to identify the currently used user media configuration. Preferably, this extracts a media configuration identifier from the packet header of one or more media packets and maps this identifier to a specific user media configuration stored in a valid user media configuration table. Executed by.

指定のユーザメディアコンフィグレーションについての情報に基づいて、次いで、アナウンスメディアの適切なコンフィグレーションを判定することが可能である。一旦、アナウンスメディアコンフィグレーションが判定されると、データベース34から取得されるまたは他の手段で生成される、選択されたアナウンスが、それに応じてコンフィグレーションモジュール36でコンフィグレーションされてもよい。これは、典型的には、判定されたコンフィグレーションに従うアナウンスメディアのエンコーディング(encoding)およびフォーマッティング(formatting)の少なくとも一方を含んでいる。次いで、アナウンスメディアは、通信セッションに挿入されてもよい。詳細は後述するが、状況に応じて、アナウンスを挿入するための適切なタイミングを判定する必要があってもよいしなくてもよい。   Based on information about the specified user media configuration, it is then possible to determine the appropriate configuration of the announcement media. Once the announcement media configuration is determined, the selected announcement obtained from the database 34 or generated by other means may be configured in the configuration module 36 accordingly. This typically includes at least one of encoding and formatting of the announcement media according to the determined configuration. The announcement media may then be inserted into the communication session. Although details will be described later, it may or may not be necessary to determine an appropriate timing for inserting the announcement depending on the situation.

ユーザ間の通信セッション中に引き続き制御情報をモニタすることも有利なことがある。特に、コーデックモードもしくは冗長モードの変更等のユーザメディアコンフィグレーションに起こり得るいかなる変化も識別するために、リンク適応に対するフィードバック情報をモニタすることは有利なことがあり、これは、ユーザメディアコンフィグレーションについての最新情報に従ってアナウンスメディアのコンフィグレーションの適応を可能にする。   It may also be advantageous to continuously monitor the control information during a communication session between users. In particular, it may be advantageous to monitor feedback information for link adaptation to identify any possible changes to the user media configuration, such as changes in codec mode or redundancy mode, which Enables adaptation of announcement media configuration according to the latest information.

モニタリングは、アナウンスサーバ30またはアナウンスサーバに関連するオプション部40で実行されてもよい。   The monitoring may be executed by the announcement server 30 or the option unit 40 related to the announcement server.

図7は、本発明の別の例示的実施形態による概観図である。この例では、ユーザメディアは、ネットワークを通してユーザの10−1、10−2間で送信されるが、アナウンスサーバ30を直接通過しない。好ましくは、外部モニタ部40がセッションセットアップおよびオプションでユーザ通信および制御フィードバックの少なくとも一方もモニタして、判定モジュール32にユーザメディアコンフィグレーションおよびアナウンスメディアコンフィグレーションを判定させる。次いで、判定されたアナウンスメディアコンフィグレーションに従って、コンフィグレーションモジュール36で、アナウンスデータベース34から取得されるまたは他の手段で生成されるアナウンスがコンフィグレーションされる。次いで、コンフィグレーションされたアナウンスは、例えば、アナウンスメディア用の新規のセッションを確立するために、SIP INVITE等を使用することによって、出力モジュール38から意図したユーザへ送信されてもよい。次いで、意図したユーザ、例えば、ユーザBは、そのユーザ機器によって複数のセッションがサポートされない限り、アナウンスメディアを生成するためにユーザAからのユーザメディアを通常破棄しなければならない。   FIG. 7 is an overview diagram according to another exemplary embodiment of the present invention. In this example, the user media is transmitted between the users 10-1 and 10-2 through the network, but does not pass directly through the announcement server 30. Preferably, the external monitoring unit 40 also monitors at least one of session setup and optionally user communication and control feedback to cause the determination module 32 to determine the user media configuration and the announcement media configuration. Then, according to the determined announcement media configuration, the configuration module 36 configures an announcement that is obtained from the announcement database 34 or generated by other means. The configured announcement may then be sent from the output module 38 to the intended user, for example by using SIP INVITE, etc., to establish a new session for the announcement media. The intended user, eg, User B, must then typically discard the user media from User A to generate the announcement media unless multiple sessions are supported by the user equipment.

図8は、本発明のまた別の例示的実施形態による概観図である。この例では、アナウンスサーバは、ユーザ側に存在する。ユーザ間通信に対する通常の機器に加えて、ユーザAのユーザ機器(UE)システム10−1全体では、アナウンスサーバ(AS)またはアナウンスメディアを提供できる同等のアナウンスデバイスも備える。ユーザ機器システム全体では、メディアコンフィグレーション部(MC)をさらに備える。ユーザメディアのコンフィグレーションについての情報に基づいて、次いで、MC部は、適切なアナウンスメディアコンフィグレーションを判定し、それに応じて通話相手のユーザB 10−2に提示するアナウンスをコンフィグレーションする。ユーザシステム全体では、ユーザメディアからアナウンスメディアに切替、次いで切り戻ししてもよい。   FIG. 8 is a schematic overview according to yet another exemplary embodiment of the present invention. In this example, the announcement server exists on the user side. In addition to the usual equipment for inter-user communication, the entire user equipment (UE) system 10-1 of user A also comprises an announcement server (AS) or equivalent announcement device that can provide announcement media. The entire user equipment system further includes a media configuration unit (MC). Based on the information about the configuration of the user media, the MC unit then determines an appropriate announcement media configuration and configures the announcement to be presented to the other party user B 10-2 accordingly. In the entire user system, the user media may be switched to the announcement media and then switched back.

また、別の代替実施形態では、アナウンスサーバは、エンドポイントに接続した構内交換機(PBX)に実装される。   In another alternative embodiment, the announcement server is implemented in a private branch exchange (PBX) connected to the endpoint.

実際のところ、当該ネットワークシステムに1つを超えるアナウンスサーバがあってもよく、本発明は、第1のアナウンスサーバからのアナウンスメディアと第2のアナウンスサーバからのアナウンスメディアとの間の切替も、ユーザメディアとアナウンスメディアとの切替に対する上述の方法と同一のまたは同様の方法で処理することができる。例えば、UEからのユーザメディアは、PBXのアナウンスサーバからのアナウンスメディアで置換されてもよく、PBXのアナウンスサーバからのアナウンスメディアは、ネットワークベースのアナウンスサーバからのアナウンスメディアで置換されてもよい。   In fact, there may be more than one announcement server in the network system, and the present invention also switches between announcement media from the first announcement server and announcement media from the second announcement server. It can be processed in the same or similar manner as described above for switching between user media and announcement media. For example, user media from the UE may be replaced with announcement media from the PBX announcement server, and announcement media from the PBX announcement server may be replaced with announcement media from the network-based announcement server.

以下では、通話相手の(人間の)ユーザからのメディアとアナウンスサーバからのメディアとの間の切替をどのように管理することができるかについての、さらなる例示的実施形態について説明する。   In the following, further exemplary embodiments will be described on how switching between media from the caller (human) user and media from the announcement server can be managed.

例えば、ユーザは、メディア伝送用にIP、UDPおよびRTPを使用し、セッション制御用にSIPを使用するマルチメディアテレフォニーにかかわっていてもよい。アナウンスサーバは、電気通信ネットワークに配置されても、また遠隔(リモート)の通話相手(の位置)に配置されてもよい。   For example, a user may be involved in multimedia telephony that uses IP, UDP and RTP for media transmission and SIP for session control. The announcement server may be located in the telecommunications network or at the remote caller's location.

全体的な目標は、2つのメディアソース間およびメディアタイプ間の切替が気に障らないようにすることを保証することである。好ましくは、これは、アナウンスメディアが、UE AとUE Bとの間のメディアと同様のコーデックで、同様のビットレートでエンコードされるべきであり、また、同様の伝送フォーマットを使用して伝送されるべきであることを意味する。これは、切替が歪を全く作らないかまたは少なくともできるだけ少ない歪にするべきであることも意味する。これは、以下の例示的方法で行われてもよい。   The overall goal is to ensure that switching between two media sources and media types does not bother. Preferably, this means that the announcement media should be encoded with a similar codec, similar to the media between UE A and UE B, and transmitted using a similar transmission format. It means that it should be. This also means that the switching should create no distortion or at least as little distortion as possible. This may be done in the following exemplary manner.

アナウンスサーバは、
1.セッションセットアップをモニタし、セッションでどのコーデックを使用してもよいかを判定する。これは、通常は、セッション中の静的情報であるが、任意のセッションパラメータがセッション中に再ネゴシエートされる場合、変更されてもよい。
Announcement server
1. Monitor session setup and determine which codecs can be used in the session. This is usually static information during the session, but may be changed if any session parameters are renegotiated during the session.

2.現在使用されているコーデックおよび伝送フォーマットを判定するために、メディアパケットおよび品質フィードバックの少なくとも一方をモニタする。これは、通常かなり頻繁に更新される必要のある一時的情報であり、おそらく一つ一つのパケットごとではないが、少なくとも定期的に更新される必要がある。これらの更新の頻度は、システム負荷に依存してもよい。高システム負荷およびチャネル状態の変化の少なくとも一方に対しては、ユーザ間のメディアをかなり頻繁に適応する必要があることを予想してもよい。しかしながら、低システム負荷に対しては、適応はかなり稀なはずである。   2. Monitor media packets and / or quality feedback to determine currently used codecs and transmission formats. This is temporary information that usually needs to be updated fairly frequently, and perhaps not every single packet, but at least periodically. The frequency of these updates may depend on the system load. For at least one of high system load and channel condition changes, it may be expected that the media between users will need to be adapted fairly often. However, adaptation should be fairly rare for low system loads.

3.アナウンスメディアに対する適切な符号化および伝送フォーマットを判定する。   3. Determine the appropriate encoding and transmission format for the announcement media.

4.適切な遷移をどのようにして生成するかを判定する。   4). Determine how to generate appropriate transitions.

a.アナウンスに、フェードインおよびフェードアウトを使用すべきかどうか。     a. Whether to use fade-in and fade-out for announcements.

b.アイドル期間(無音、空白画像)を加えるべきかどうか。     b. Whether to add idle periods (silence, blank images).

c.デコーダをリセット(コーデックホーミング(codec homing)、CRCを確実に機能しなくする等)させる必要があるかどうか。     c. Whether the decoder needs to be reset (codec homing, ensure CRC is not functioning, etc.)

5.アナウンスを挿入すべき適切なタイミングを判定する。このタイミングは、通常、アナウンスの緊急度に依存する。   5. Determine the appropriate timing to insert the announcement. This timing usually depends on the urgency of the announcement.

6.アナウンスを挿入し、UE Aからのメディアを破棄する。音量は、UE Aからのメディアの音量と合わせるために調整される必要があってもよい。   6). Insert announcement and discard media from UE A. The volume may need to be adjusted to match the volume of the media from UE A.

7.アナウンスの完了後、UE Aからのメディアへの適切な遷移をどのようにして生成するかについても判定する。   7). It is also determined how to generate an appropriate transition from UE A to the media after the announcement is complete.

これらのステップのすべてが正確にこの順序で行われる必要はないことに留意されたい。場合によっては、これらのステップのいくつかをスキップすることも可能な場合がある。   Note that not all of these steps need to be performed in this exact order. In some cases, it may be possible to skip some of these steps.

本発明のより良い理解のために、あり得る好ましい実施形態に従うアナウンスサーバについて、これより図9を参照してより詳細に説明する。   For a better understanding of the present invention, an announcement server according to a possible preferred embodiment will now be described in more detail with reference to FIG.

この特定の例では、様々なブロックの機能は、以下のようにまとめることができる。   In this particular example, the functions of the various blocks can be summarized as follows:

・UE AとUE Bとの間のセッションセットアップは、SIPで行われるのが好ましい。これは、セッションでどのメディアを使用できるか、各メディアをどのようにエンコードするか、およびどの伝送フォーマットを使用すべきかを判定する。明らかにする例のいくつかは、
−メディアは、音声および/または映像および/またはテキストかどうか。
-Session setup between UE A and UE B is preferably done in SIP. This determines which media can be used in the session, how to encode each media, and which transmission format to use. Some examples to clarify are
Whether the media is audio and / or video and / or text;

−各メディアに対してどのコーデックを使用すべきか。1つのメディアに対していくつかのコーデックが許容されてもよい。セッションセットアップは、例えば、AMRとAMR−WBの両方とも、セッションでの音声に許容されると結論付けても良い。コーデックは、いくつかのコーデックモードも含んでいてもよい。例えば、AMRは8つのコーデックモードを定義している。各コーデックモードは、それ自体のビットレート(12.2、10.2、7.95、7.4、6.7、5.9、5.15および4.75kbps)を有する。一部の映像コーデックは、代わりに映像がどのようにエンコードされるべきかを判定する「プロファイル」および「レベル」を定義している。     -Which codec should be used for each media? Several codecs may be allowed for one medium. Session setup may conclude, for example, that both AMR and AMR-WB are acceptable for voice in the session. A codec may also include several codec modes. For example, AMR defines eight codec modes. Each codec mode has its own bit rate (12.2, 10.2, 7.95, 7.4, 6.7, 5.9, 5.15 and 4.75 kbps). Some video codecs define “profiles” and “levels” that determine how video should be encoded instead.

−どのペイロードフォーマットを使用すべきか。各コーデックは、それ自体のペイロードフォーマットを有する。一部のペイロードフォーマットは、ペイロードフォーマットのいくつかの変形を定義している。例えば、AMRおよびAMR−WBに対しては、ペイロードフォーマットは、帯域幅高効率フォーマットとオクテット配列フォーマットの両方を定義している。     -Which payload format should be used? Each codec has its own payload format. Some payload formats define several variations of the payload format. For example, for AMR and AMR-WB, the payload format defines both a bandwidth efficient format and an octet array format.

−エンコーダがネゴシエートされたどのモードにもいつの時点でも自由に切替できる場合、コーデックモード切替がどのように行われてもよいか。例えば、UTRANおよびGERANにおけるAMRに対する、回線交換サービスとの相互作用のシナリオに関しては、そのようなコーデックモードの切替は、UTRANおよびGERAN CSの少なくとも一方のネットワークに存在する制約に合うように制限される必要がある場合もある。     -How can the codec mode switch be performed if the encoder is free to switch to any negotiated mode at any time? For example, for scenarios of interaction with circuit switched services for AMR in UTRAN and GERAN, such codec mode switching is limited to meet the constraints that exist in at least one of the UTRAN and GERAN CS networks. Sometimes it is necessary.

−このように、メディアは、通常、いくつかの異なる方法でコンフィグレーションされてもよい。セッションに許容される各コンフィグレーションに対して、1つのRTPペイロードタイプ番号が定義される。各メディアに対していくつかのコンフィグレーションを予想してもよいことに気付かれたい。     Thus, media may typically be configured in several different ways. One RTP payload type number is defined for each configuration allowed for the session. Note that you may expect several configurations for each media.

・メディア入力は、UE Aからのメディア(音声、オーディオ、映像、テキスト等)である。選択的には、メディアは、上述のように別のアナウンスサーバからのメディアであることができよう。このメディアは、アナウンスによって中断されることになる。RTPは、通常、メディアを伝送するために使用される。   Media input is media from UE A (voice, audio, video, text, etc.). Optionally, the media could be media from another announcement server as described above. This media will be interrupted by the announcement. RTP is usually used for transmitting media.

・メディア出力は、UE Bに送信されるメディアである。   Media output is media sent to UE B.

・UE Bは、UE Aに品質フィードバックまたは適応要求を送信する。品質フィードバックは、典型的には、RTCPで送信され、たいていは数的指標(パケット損失率、ジッタ等)の形態である。適応要求の例には、コーデックモード要求、フレームアグリゲーション要求、冗長性要求、および映像フレームのイントラリフレッシュがある。フィードバックは、伝送機能障害のメディアへの影響を削減するために、ビットレート、パケットレートおよび冗長度を適応させるように送信者(UE A)によって使用される。   UE B sends a quality feedback or adaptation request to UE A. Quality feedback is typically sent over RTCP and is often in the form of numerical indicators (packet loss rate, jitter, etc.). Examples of adaptation requests include codec mode requests, frame aggregation requests, redundancy requests, and intra refresh of video frames. The feedback is used by the sender (UE A) to adapt the bit rate, packet rate and redundancy to reduce the media impact of transmission dysfunction.

−適応をトリガする伝送の制約がUE Aとアナウンスサーバとの間にあるかどうか、またはそれがアナウンスサーバとUE Bとの間にあるかどうかを知らないことに気付かれたい。しかし、アナウンスがサーバとUE Bとの間の伝送機能障害によってひどく損なわれるリスクを最小にするために、アナウンスがUE Aからのメディアと同一の方法でエンコードされ、かつフォーマットされることは有益である。     Note that you do not know whether there is a transmission constraint that triggers adaptation between UE A and the announcement server, or whether it is between the announcement server and UE B. However, it is beneficial for the announcement to be encoded and formatted in the same way as the media from UE A in order to minimize the risk that the announcement will be severely compromised by transmission failure between the server and UE B. is there.

・セッションおよびメディア分析部は、セッションセットアップおよび/またはメディアおよび/またはメディアフィードバックを分析し、入力メディアの特性および現在使用されている伝送フォーマットを検出する。検出される特性の例には、以下のものがある。   The session and media analysis unit analyzes session setup and / or media and / or media feedback to detect the characteristics of the input media and the currently used transmission format. Examples of detected characteristics include the following.

−メディアタイプ(群)
−コーデック(群)、コーデックレート(群)もしくはコーデックモード(群)、フレームアグリゲーション、冗長度等
−ペイロードフォーマット(群)
−メディアの音のレベル、すなわち、音量。これは、おそらくメディアのデコーディングを必要とする。休みなくデコーダを実行することを回避するために、この分析は、少ない頻度で行われるべきであり、セッション中に、1回だけかまたは2、3回程度行われるのが好ましい。
-Media type (group)
-Codec (group), codec rate (group) or codec mode (group), frame aggregation, redundancy, etc.-Payload format (group)
-The sound level of the media, ie the volume. This probably requires media decoding. In order to avoid running the decoder without a break, this analysis should be done less frequently and preferably only once or a few times during the session.

−メディアがアイドル状態、例えば、無音、背景雑音、空白画像等であるかどうか。これを検出する1つの方法は、SID UPDATEフレームが現在送信されているかどうかを検証することであり、これには、RTPパケットを構文解析する必要がある(または少なくともサイズを点検する必要がある)が、メディアのデコーディングを必要としない。     Whether the media is idle, eg silence, background noise, blank images, etc. One way to detect this is to verify whether a SID UPDATE frame is currently being transmitted, which requires the RTP packet to be parsed (or at least the size needs to be checked). However, it does not require media decoding.

−メディアがアクティブ状態、例えば、話中の音声、動画等であるかどうか。その場合は、
・メディアが構築されているかどうか、または、例えば、音声開始直後等の開始されたばかりかどうか。
Whether the media is in an active state, e.g. active voice, video, etc. In that case,
Whether the media has been constructed or just started, eg immediately after the start of audio.

・メディアがフェードアウトしていくかどうか、これは文および語の終わりで起こる。       Whether the media will fade out, this happens at the end of sentences and words.

−状況次第では、この分析のすべての部分が連続的に実行される必要があるわけではない、または全く必要がないことに留意されたい。一部分は、セッションセットアップおよびセッションが再ネゴシエートされる場合だけに適用されるのに対して、他の部分はセッション中に(頻度に程度の差はあるが)モニタされるのが好ましい。この分析の一部分は、RTPパケットのデコーディングを必要としてもよい。     -Note that depending on the situation, not all parts of this analysis need be performed continuously or at all. Some apply only when session setup and session are renegotiated, while others are preferably monitored during sessions (with varying degrees of frequency). Part of this analysis may require decoding of RTP packets.

・メディアデータベースは、実際のアナウンスメディア(音声、オーディオ、映像、画像等)を収容する。   The media database contains actual announcement media (voice, audio, video, images, etc.).

・メディアエンコーダおよびモディファイア(modifier:モディファイア)は、UE Aからのメディアと同様にメディアをエンコードおよびフォーマットの少なくと一方を行なう能力を有し、例えば、
−様々なコーデック(AMR、AMR−WB、H.263[9]、H.264[10]等)を使用してもよい。
Media encoders and modifiers have the ability to encode and format at least one of the media as well as media from UE A, eg
-Various codecs (AMR, AMR-WB, H.263 [9], H.264 [10], etc.) may be used.

−音響帯域幅を変更してもよい(狭帯域フィルタ(filter to narrowband)、広帯域フィルタ(filter to wideband)、帯域幅拡張、スクリーンサイズ、フェードインおよびフェードアウトの適用等)。     -The acoustic bandwidth may be changed (filter to narrowband, filter to wideband, bandwidth extension, screen size, fade-in and fade-out application, etc.).

−アイドル期間(無音、空白画像)が開始および終了の少なくとも一方の時点に加えられるべきかどうか)。     Whether an idle period (silence, blank image) should be added at the start and / or end time).

−デコーダをリセットさせるために、アナウンスの開始と終了にコーデックホーミング情報も追加してもよい。     -Codec homing information may also be added at the start and end of the announcement to reset the decoder.

−ボリュームレベルを調整する。     -Adjust the volume level.

−様々なペイロードフォーマットを使用する。     -Use various payload formats.

−UE Aによって使用される場合、フレームアグリゲーションおよび冗長度を適用する。     Apply frame aggregation and redundancy when used by UE A.

・アナウンスコマンドは、アナウンスサーバに以下の情報を通知する。   -The announcement command notifies the following information to the announcement server.

−どのアナウンスを使用すべきか。     -Which announcement should be used?

−アナウンスの緊急性、すなわち、アナウンスをユーザに直ちに提示することがどのくらい重要であるか、またはアナウンスが少しの間遅延してもよいかどうか。     -The urgency of the announcement, i.e. how important it is to present the announcement immediately to the user, or whether the announcement may be delayed for a while.

・可能なメディアの変更方法のリストは、メディア分析部によって判定された、各状態に対してどのメディア変更方法が適しているかの記述である。様々な状態に対して適切な様々な動作の例について、以下に説明する。   The list of possible media change methods is a description of which media change method is appropriate for each state as determined by the media analyzer. Examples of various operations appropriate for various states are described below.

・コントローラは、アナウンスコマンド、およびUE AとUE Bとの間のセッションでメディアが現在どのようにフォーマットされているかについての情報を受信する。   The controller receives the announcement command and information about how the media is currently formatted in the session between UE A and UE B.

−コントローラは、メディアを送信する前に何らかの方法でそれを変更するべきである場合、メディアをどのようにエンコードすべききか、またエンコードされたメディアがRTPパケットにどのようにフォーマットされるべきかを判定する。この情報は、メディアエンコーダおよびモディファイアに送信される。     -If the controller should change it in any way before sending the media, how the media should be encoded and how the encoded media should be formatted into RTP packets judge. This information is sent to the media encoder and modifier.

−コントローラは、UE Aからのメディアがいつ中断されるか、およびアナウンスメディアがいつ挿入されるかも判定する。     The controller also determines when the media from UE A is interrupted and when announcement media is inserted.

・緊急性が高い場合、直ちにまたはできるだけ短い遅延で、UE Aからのメディアを中断するべきである。   If the urgency is high, the media from UE A should be interrupted immediately or with the shortest possible delay.

・緊急性が低い場合、UE Aからのメディアにアイドル期間を検出するまで待機するべきである。   If it is less urgent, it should wait until it detects an idle period in the media from UE A.

アナウンスコマンドは、アナウンスもトリガする。このトリガは、背景技術セクションで例示されるように、いくつかの異なる場所から発生してもよい。追加の例としては、緊急呼が待機していることを通話者の一人に通知するために通話を中断することを要望する場合がある電話交換手、または「円滑な中断」を行うことを要望する場合があるネットワークオペレータを含んでいる。例えば、通話者の一人がサービス圏外に移動する場合、オペレータは、単にサービスを中断する代わりに、「通話相手がサービス圏外に移動しました」という種類のアナウンスを挿入したいと要望してもよい。   An announcement command also triggers an announcement. This trigger may occur from several different locations, as illustrated in the background section. As an additional example, a telephone operator who may want to interrupt the call to notify one of the callers that an emergency call is waiting, or wants to make a "smooth interruption" Includes network operators who may do so. For example, if one of the callers moves out of the service area, the operator may desire to insert an announcement of the type “the call partner has moved out of the service area” instead of simply interrupting the service.

例示的メディア符号化および変更方法
エンコーディングおよび伝送フォーマット
コントローラは、エンコーディングおよび伝送フォーマットを、UE AとUE Bとの間で送信されている現在のメディアのエンコーディングおよび伝送フォーマットに一致させるべきである。
Exemplary Media Encoding and Modification Methods Encoding and Transmission Format The controller should match the encoding and transmission format to the current media encoding and transmission format being transmitted between UE A and UE B.

・コントローラは、セッションで現在使用されているコーデック及びコーデックモード/レートと同一のコーデックおよびコーデックモード/レートを選択するべきである。   The controller should select the same codec and codec mode / rate as the codec and codec mode / rate currently used in the session.

−アナウンスメディアがより広い音響帯域幅を有する場合、選択されたコーデックに一致させるために帯域通過フィルタを通するべきである。     If the announcement media has a wider acoustic bandwidth, it should be passed through a band pass filter to match the selected codec.

−アナウンスメディアがより狭い音響帯域幅を有する場合、帯域幅拡張が適用されるべきである。     -If the announcement media has a narrower acoustic bandwidth, bandwidth extension should be applied.

−正確に同一のコーデックまたはコーデックモード/レートを選択できない場合、類似の特性(音響帯域幅、ビットレート、フレームレート、エンコーディング品質等)を有するコーデックを選択するべきである。     -If the exact same codec or codec mode / rate cannot be selected, codecs with similar characteristics (acoustic bandwidth, bit rate, frame rate, encoding quality, etc.) should be selected.

・コントローラは、セッションで現在使用されているフレームアグリゲーション(パケット当たりフレーム数)および冗長フォーマット(数RTPパケットごとにフレームの繰り返し)と同一のフレームアグリゲーションおよび冗長フォーマットを選択するべきである。   The controller should select the same frame aggregation and redundancy format as the frame aggregation currently used in the session (number of frames per packet) and redundancy format (repetition of frames every few RTP packets).

・コントローラは、セッションで現在使用されている伝送フォーマット(RTPペイロードタイプ、ペイロードフォーマット、ペイロードフォーマットバージョン)と同一の伝送フォーマットを選択するべきである。   The controller should select the same transmission format as the transmission format currently used in the session (RTP payload type, payload format, payload format version).

適切なエンコーディングフォーマットの選択は、2つのメディアが事実上同一のように聞こえる機会を増加する。   Choosing an appropriate encoding format increases the chance that the two media will sound virtually identical.

適切な伝送フォーマットの選択は、アナウンスメディアが伝送機能障害によって深刻な影響を受けない機会を増加する。   Selecting an appropriate transmission format increases the chance that the announcement media will not be severely affected by transmission failure.

切替時の円滑な遷移
アナウンスメッセージがあまり重要でない場合で、かつアナウンスサーバが音声内にアイドル期間を検出するまでメッセージを保持している場合、異なる情報源からのメディアの途中で切り替わる場合に、特別なスムージングが必要とされるべきでない。
Smooth transitions when switching If the announcement message is not very important and if the announcement server keeps the message until it detects an idle period in the voice, it is special if the media switches from different sources. Smoothing should not be required.

アナウンスメッセージが非常に重要である場合、アナウンスサーバは、UE Aからのメディアがアクティブな場合でさえ通常は中断することになるであろう。この場合、アナウンスサーバは、以下をするべきである。   If the announcement message is very important, the announcement server will normally suspend even if the media from UE A is active. In this case, the announcement server should:

・UE Aからのメディアにフェードアウトを適用する(これは常に可能ではなくてもよい)。   Apply fade out to media from UE A (this may not always be possible).

・アナウンスメディアをフォーマットし、これが、デコーダを段階的にリセットさせるように、デコーダ状態または数フレームに対するECUの動作のリセットを、例えば、以下によりトリガするようにする。   Format the announcement media so that it resets the decoder's state or operation of the ECU for several frames, for example, by triggering a reset of the decoder in stages.

−AMRに対しては、これは、アナウンスメディアが開始する前に、コーデックホーミングフレームを挿入することによって行うことができる。他のコーデックは、同様の特性を持たない場合がある。     For AMR, this can be done by inserting a codec homing frame before the announcement media starts. Other codecs may not have similar characteristics.

−CRCまたはチェックサム検証を確実に失敗させる。すべてのペイロードフォーマットが、そのような情報を含むわけではない。このソリューションは、信号を十分に弱めることを確実にするために、いくつかのフレームに対して繰り返される必要がある。     Ensure that CRC or checksum verification fails. Not all payload formats contain such information. This solution needs to be repeated for several frames to ensure that the signal is sufficiently weakened.

−不良フレームインジケータ(BFI)ビットを設定し、これで受信機でECUの動作をトリガさせる。すべてのペイロードフォーマットがそのような情報を含むわけではない。このソリューションは、信号を十分に弱めることを確実にするために、いくつかのフレームに対して繰り返される必要がある。     -Set the bad frame indicator (BFI) bit, which triggers the operation of the ECU at the receiver. Not all payload formats contain such information. This solution needs to be repeated for several frames to ensure that the signal is sufficiently weakened.

−ダミーフレームまたはアイドルフレーム(NO_DATA、無音、空白画像)を挿入する。NO_DATAは、すべてのコーデックに対して定義されているわけではない。アナウンスサーバは、これを実現するために無音フレームを符号化しなければならない。このソリューションは、信号を十分に弱めることを確実にするために、いくつかのフレームに対して繰り返される必要がある。     Insert a dummy frame or idle frame (NO_DATA, silence, blank image). NO_DATA is not defined for all codecs. An announcement server must encode silence frames to achieve this. This solution needs to be repeated for several frames to ensure that the signal is sufficiently weakened.

−これらの方法の存在はコーデックに依存するので、コントローラは、どの動作を現在使用されているコーデックに適用するか決定する必要がある。     -The presence of these methods depends on the codec, so the controller needs to decide which operation applies to the currently used codec.

・UE Aからのメディアの大きさと同程度になるように、アナウンスメディアの大きさを調整する。   -Adjust the size of the announcement media to be about the same as the size of media from UE A.

・アナウンスメディアに対してフェードインを適用する。   -Apply fade-in to announcement media.

・アナウンスメディアの送信が完了する場合で、かつUE Aからのメディアに切り戻す場合に、同様の動作が行われるべきである。   A similar operation should be performed when the transmission of the announcement media is complete and when switching back to the media from UE A.

スムージングは、アナウンスメディアの開始もしくは終了のどちらかまたは両方で必要とされてもよいし、また全く必要とされなくてもよいことに留意されたい。   Note that smoothing may be required at the start or end of the announcement media, both, or may not be required at all.

既に説明したように、本発明は、電気通信ネットワークで挿入されるアナウンスだけに限定されない。同様のアナウンスは、ほとんどの商用サービスデスクにも存在する(「切符の注文を続ける場合は1を押してください。日時の変更は2を押してください。販売スタッフと話す場合は3を押してください」)。この場合、アナウンスはリモート「ユーザ」から到来しており、また、リモート「ユーザ」は、事前録音メッセージと人間の話し手を切り替えてもよい。   As already explained, the present invention is not limited to announcements inserted in telecommunications networks. A similar announcement exists at most commercial service desks ("Press 1 to continue ordering tickets. Press 2 to change date and time. Press 3 to talk to sales staff"). In this case, the announcement comes from the remote “user” and the remote “user” may switch between the pre-recorded message and the human speaker.

メディア間の切替による歪は、完全に取り除かれるまたは少なくとも減少されるであろう。アナウンスメディアのフォーマットは、会話で使用されるメディアのフォーマットに一致されることが好ましい。これは、UE Aからのメディアとアナウンスメディアとの間でのより心地良い遷移を提供する。   Distortion due to switching between media will be completely eliminated or at least reduced. The format of the announcement media is preferably matched to the media format used in the conversation. This provides a more comfortable transition between the media from UE A and the announcement media.

受信側のUEで、MIPSとメモリの両方に関して複雑さの面で利点もあるが、これは、並行して実行するいくつかのアクティブコーデックインスタンスを有する必要がないからである。   There is also an advantage in complexity in terms of both MIPS and memory at the receiving UE, since it is not necessary to have several active codec instances running in parallel.

本発明は、RTPメディアストリームに限定されないし、伝送プロトコルとしてのUDPの使用にも限定されないし、また、セッションセットアップに対するSIPの使用にも限定されないことも理解されるべきである。   It should also be understood that the present invention is not limited to RTP media streams, is not limited to the use of UDP as a transport protocol, and is not limited to the use of SIP for session setup.

上述の実施形態は単に例として与えられており、本発明がそれらに限定されないことは理解されるべきである。本明細書で開示され特許請求の範囲で定義されている基礎をなす基本的な原理を維持する、さらなる修正、変更および改良は、本発明の範囲内にある。   It should be understood that the embodiments described above are given by way of example only and the present invention is not limited thereto. Further modifications, changes and improvements that maintain the basic principles disclosed herein and defined in the claims are within the scope of the invention.

略語
ADPCM 適応的差分PCM(Adaptive Differential PCM)
AMR 適応マルチレート(Adaptive Multi-Rate)
AMR−WB AMR広帯域(AMR-WideBand)
BFI 不良フレームインジケータ(Bad Frame Indicator)
CRC 巡回冗長コード(Cyclic Redundancy Code)
CS 回線交換(Circuit Switched)
ECU エラー隠蔽部(Error Concealment Unit)
EVRC 拡張可変レートコーデック(Enhanced Variable Rate Codec)
GERAN GSM/EDGE無線アクセスネットワーク(GSM Edge Radio Access Network)
GSM 移動通信用グローバルシステム(Global System for Mobile communications)
GSM−EFR GSM拡張フルレート(GSM Enhanced Full Rate)
IMS IPマルチメディアサブシステム(IP Multimedia Subsystem)
IP インターネットプロトコル(Internet Protocol)
MIPS 100万命令/秒(Million Instructions Per Second)
MMTel マルチメディアテレフォニー(Multi Media Telephony)
MRFP メディアリソース機能プロセッサ(Media Resource Function Processor)
PCM パルス符号変調(Pulse Code Modulation)
PBX 構内交換機(Private Branch eXchange)
PS パケット交換(Packet Switched)
RTCP リアルタイム制御プロトコル(Real-Time Control Protocol)
RTP リアルタイムプロトコル(Real-Time Protocol)
SDP セッション記述プロトコル(Session Description Protocol)
SIP セッション開始プロトコル(Session Initiation Protocol)
TDM 時分割多重(Time Division Multiplexing)
UDP ユーザデータグラムプロトコル(User Datagram Protocol)
UMTS ユニバーサル移動通信システム(Universal Mobile Telecommunication System)
UTRAN UMTS地上無線アクセスネットワーク(UMTS Terrestrial Radio Access Network)
UE ユーザ機器(User Equipment)
VoIP ボイスオーバIP(Voice over IP)
参考文献
[1] RFC 3550「RTP:リアルタイムアプリケーション用伝送プロトコル(RTP:A Transport Protocol for Real-Time Applications)」、H.Schulzrinne、S.Casner、R.Frederick、V.Jacobson著
[2] 3GPP TS 23.228「IPマルチメディアサブシステム(IMS)ステージ2(IP Multimedia Subsystem(IMS), Stage 2)」
[3] RFC 3261「SIP:セッション開始プロトコル(SIP:Session Initiation Protocol)」、RFC 3261、2002年6月、Rosenberg,J、Schulzrinne,H.、Camarillo,G.、Johnston,A.、Peterson,J.、Sparks,R.、Handley,M.、E.Schooler著
[4] ITU−T勧告G.711「音声周波数のパルス符号変調(PCM)方式(Pulse Code Modulation (PCM) of Voice Frequencies)」
[5] ITU−T勧告G.726「40、32、24、16キロビット/秒適応的差分パルス符号変調(ADPCM)方式(40,32,24,16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)」
[6] 3GPP TS 26.114「IPマルチメディアサブシステム(IMS):マルチメディアテレフォニ:メディア処理および相互作用(IP Multimedia Subsystem(IMS); Multimedia Telephony; Media handling and interaction)」
[7] 3GPP TS 26.071「音声コーデックの必須音声処理機能:AMR音声コーデック:一般記述(Mandatory Speech Codec speech processing functions; AMR Speech CODEC; General description)」
[8] 3GPP TS 26.171「音声コーデックの音声処理機能:適応マルチレート広帯域(AMR−WB)音声コーデック:一般記述(Speech codec speech processing functions; Adaptive Multi-Rate-Wideband (AMR-WB) speech codec; General description)」
[9] ITU−T勧告H.263、低ビットレート通信用ビデオ符号化方式(Video coding for low bit rate communication)
[10] ITU−T勧告H.264、オーディオビジュアルサービス全般のための高度ビデオ符号化方式(Advanced video coding for generic audiovisual services)
Abbreviation ADPCM Adaptive Differential PCM
AMR Adaptive Multi-Rate
AMR-WB AMR Wideband (AMR-WideBand)
BFI Bad Frame Indicator
CRC Cyclic Redundancy Code
CS circuit switching (Circuit Switched)
ECU error concealment unit
EVRC Enhanced Variable Rate Codec
GERAN GSM / EDGE Radio Access Network
GSM Global System for Mobile communications
GSM-EFR GSM Enhanced Full Rate
IMS IP Multimedia Subsystem
IP Internet Protocol
MIPS Million Instructions Per Second
MMTel Multimedia Telephony
MRFP Media Resource Function Processor
PCM Pulse Code Modulation
Private branch exchange (PBX)
PS Packet Switched (Packet Switched)
RTCP Real-Time Control Protocol
RTP Real-Time Protocol
SDP Session Description Protocol
SIP Session Initiation Protocol
TDM Time Division Multiplexing
UDP User Datagram Protocol
UMTS Universal Mobile Telecommunication System
UTRAN UMTS Terrestrial Radio Access Network
UE User Equipment
VoIP Voice over IP
References [1] RFC 3550 “RTP: A Transport Protocol for Real-Time Applications”, by H. Schulzrinne, S. Casner, R. Frederick, V. Jacobson [2] 3GPP TS 23.228 “IP Multimedia Subsystem (IMS), Stage 2”
[3] RFC 3261 “SIP: Session Initiation Protocol”, RFC 3261, June 2002, Rosenberg, J, Schulzrinne, H., Camarillo, G., Johnston, A., Peterson, J By Sparks, R., Handley, M., E. Schooler [4] ITU-T Recommendation G. 711 "Pulse Code Modulation (PCM) of Voice Frequencies"
[5] ITU-T Recommendation G. 726 “40, 32, 24, 16 kbit / s Adaptive Differential Pulse Code Modulation (ADPCM)”
[6] 3GPP TS 26.114 "IP Multimedia Subsystem (IMS): Multimedia Telephony: Media Handling and Interaction"
[7] 3GPP TS 26.071 “Mandatory Speech Codec speech processing functions; AMR Speech CODEC; General description”
[8] 3GPP TS 26.171 “Speech codec speech processing function: Adaptive multi-rate wideband (AMR-WB) speech codec: General description (Speech codec speech processing functions; Adaptive Multi-Rate-Wideband (AMR-WB) speech codec ; General description) "
[9] ITU-T recommendation H.264. 263, Video coding for low bit rate communication
[10] ITU-T recommendation H.264, Advanced video coding for generic audiovisual services

Claims (25)

通信ネットワークにおける第1のネットワーク要素に向けられている、ユーザメディアとアナウンスメディアとを切り替える方法であって、
前記ユーザメディアは、第2のネットワーク要素から到来するものであり、
前記アナウンスメディアは、第3のネットワーク要素から到来するものであり、
前記方法は、
前記ユーザメディアのコンフィグレーションを判定するステップと、
前記判定されたユーザメディアのコンフィグレーションに基づいて、前記第1のネットワーク要素に提示される前記アナウンスメディアのコンフィグレーションを判定するステップと、
前記アナウンスメディアのコンフィグレーションに従って、前記アナウンスメディアをコンフィグレーションするステップと、
前記コンフィグレーションされたアナウンスメディアを前記第1のネットワーク要素に送信するステップと
を備えることを特徴とする方法。
A method for switching between user media and announcement media directed to a first network element in a communication network comprising:
The user media comes from a second network element;
The announcement media comes from a third network element;
The method
Determining a configuration of the user media;
Determining the configuration of the announcement media presented to the first network element based on the determined configuration of the user media;
Configuring the announcement media according to the configuration of the announcement media;
Transmitting the configured announcement media to the first network element.
前記ユーザメディアのコンフィグレーションを判定するステップは、前記ユーザメディアのコーデックコンフィグレーションを判定するステップを含み、
前記アナウンスメディアのコンフィグレーションを判定するステップは、前記アナウンスメディアのコーデックコンフィグレーションと前記ユーザメディアのコーデックコンフィグレーションとのマッチングに基づいている
ことを特徴とする請求項1に記載の方法。
Determining the configuration of the user media includes determining a codec configuration of the user media;
The method according to claim 1, wherein the step of determining the configuration of the announcement media is based on matching between the codec configuration of the announcement media and the codec configuration of the user media.
前記ユーザメディアのコンフィグレーションを判定するステップは、前記ユーザメディアの伝送フォーマットコンフィグレーションを判定するステップを更に含み、
前記アナウンスメディアのコンフィグレーションを判定するステップは、更に、前記アナウンスメディアの伝送フォーマットコンフィグレーションと前記ユーザメディアの伝送フォーマットコンフィグレーションとのマッチングに基づいている
ことを特徴とする請求項2に記載の方法。
Determining the configuration of the user media further includes determining a transmission format configuration of the user media;
The method according to claim 2, wherein the step of determining the configuration of the announcement media is further based on a match between the transmission format configuration of the announcement media and the transmission format configuration of the user media. .
前記ユーザメディアのコンフィグレーションを判定するステップは、前記ユーザメディアのフレームアグリゲーションコンフィグレーションと冗長性フォーマットコンフィグレーションを判定するステップを更に含み、
前記アナウンスメディアのコンフィグレーションを判定するステップは、更に、前記アナウンスメディアのフレームアグリゲーションコンフィグレーションと冗長性フォーマットコンフィグレーションと、前記ユーザメディアのフレームアグリゲーションコンフィグレーションと冗長性フォーマットコンフィグレーションとのマッチングに基づいている
ことを特徴とする請求項2または3に記載の方法。
Determining the user media configuration further comprises determining a frame aggregation configuration and a redundancy format configuration of the user media;
The step of determining the configuration of the announcement medium is further based on matching between the frame aggregation configuration and the redundancy format configuration of the announcement media, and the frame aggregation configuration and the redundancy format configuration of the user media. The method according to claim 2 or 3, characterized in that:
前記ユーザメディアのコーデックコンフィグレーションを判定するステップは、コーデックのタイプ、コーデックモード、及びプションでコーデックモード切替機能の判定を含んでいる
ことを特徴とする請求項2に記載の方法。
The method according to claim 2, wherein the step of determining the codec configuration of the user media includes determining a codec mode switching function according to a codec type, a codec mode, and an option.
通信セッションが、前記第1のネットワーク要素と前記第2のネットワーク要素との間のユーザメディアに対してセットアップされ、
前記コンフィグレーションされたアナウンスメディアを前記第1のネットワーク要素に送信するステップは、前記通信セッションに前記コンフィグレーションされたアナウンスメディアを挿入するステップを含んでいる
ことを特徴とする請求項1に記載の方法。
A communication session is set up for user media between the first network element and the second network element;
The method of claim 1, wherein transmitting the configured announcement media to the first network element includes inserting the configured announcement media into the communication session. Method.
前記ユーザメディアのコンフィグレーションを判定するステップは、
少なくとも1つの有効なユーザメディアのコンフィグレーションを識別するために、前記第1のネットワーク要素と前記第2のネットワーク要素との間のユーザメディア用の通信セッションのセットアップをモニタするステップと、
前記少なくとも1つの有効なユーザメディアのコンフィグレーションに基づいて、前記ユーザメディアのコンフィグレーションを判定するステップと
を備えることを特徴とする請求項1に記載の方法。
The step of determining the configuration of the user media includes:
Monitoring the setup of a communication session for user media between the first network element and the second network element to identify at least one valid user media configuration;
The method of claim 1, comprising determining a configuration of the user media based on a configuration of the at least one valid user media.
複数の有効なユーザメディアのコンフィグレーションが、前記セッションセットアップをモニタする場合に識別され、
前記ユーザメディアのコンフィグレーションは、前記複数の有効なユーザメディアのコンフィグレーションから判定される
ことを特徴とする請求項7に記載の方法。
Multiple valid user media configurations are identified when monitoring the session setup;
8. The method of claim 7, wherein the user media configuration is determined from the plurality of valid user media configurations.
前記ユーザメディアのコンフィグレーションを判定するステップは、更に、前記複数の有効なユーザメディアコンフィグレーションの内の、現在使用されているものを検出するために、前記セッションにおけるネットワーク要素間の通信をモニタするステップを含んでいる
ことを特徴とする請求項8に記載の方法。
The step of determining a configuration of the user media further monitors communication between network elements in the session to detect a currently used one of the plurality of valid user media configurations. 9. The method of claim 8, comprising steps.
前記ネットワーク要素間の通信をモニタするステップは、前記アナウンスメディアのコンフィグレーションの適切な判定を実現するために、前記ユーザメディアのコンフィグレーションの適応用の情報を検出するステップを含んでいる
ことを特徴とする請求項9に記載の方法。
Monitoring the communication between the network elements includes detecting information for adapting the configuration of the user media in order to achieve an appropriate determination of the configuration of the announcement media. The method according to claim 9.
前記セッションに前記アナウンスメディアを挿入するタイミングは、前記アナウンスの緊急性に基づいて判定され、
前記コンフィグレーションされたアナウンスメディアは、前記判定されたタイミングに従って、前記セッションに挿入される
ことを特徴とする請求項6に記載の方法。
The timing for inserting the announcement media into the session is determined based on the urgency of the announcement,
The method of claim 6, wherein the configured announcement media is inserted into the session according to the determined timing.
前記アナウンスメディアが前記セッションに挿入される場合、前記ユーザメディアと前記アナウンスメディアとの間の円滑な遷移のための遷移処理を適用するステップを更に備える
ことを特徴とする請求項6に記載の方法。
The method of claim 6, further comprising applying a transition process for a smooth transition between the user media and the announcement media when the announcement media is inserted into the session. .
前記第1のネットワーク要素は、第1のユーザのユーザ機器を含み、
前記第2のネットワーク要素は、第2のユーザのユーザ機器を含み、
前記第3のネットワーク要素は、第3のユーザのユーザ機器を含む
ことを特徴とする請求項1に記載の方法。
The first network element includes a user equipment of a first user;
The second network element includes a user equipment of a second user;
The method of claim 1, wherein the third network element includes a user equipment of a third user.
前記アナウンスサーバは、前記ネットワークの側と前記ユーザの側との一方に配置されている
ことを特徴とする請求項13に記載の方法。
14. The method of claim 13, wherein the announcement server is located on one of the network side and the user side.
前記ユーザは、メディア伝送用のリアルタイムプロトコル(RTP)と、セッション制御用のセッション開始プロトコル(SIP)を使用するマルチメディアセッションに関与している
ことを特徴とする請求項13に記載の方法。
14. The method of claim 13, wherein the user is involved in a multimedia session that uses a real time protocol (RTP) for media transmission and a session initiation protocol (SIP) for session control.
通信ネットワークにおける通信セッションで、ユーザメディアとアナウンスメディアの切替を行なうためのシステムであって、
前記通信セッション用の前記ユーザメディアのコンフィグレーションを判定する手段と、
前記判定されたユーザメディアコンフィグレーションに基づいて、前記セッションに挿入される前記アナウンスメディアのコンフィグレーションを判定する手段と、
前記アナウンスメディアのコンフィグレーションに従って、前記アナウンスメディアをコンフィグレーションする手段と
前記セッションに、前記コンフィグレーションされたアナウンスメディアを挿入する手段と
を備えることを特徴とするシステム。
A system for switching between user media and announcement media in a communication session in a communication network,
Means for determining a configuration of the user media for the communication session;
Means for determining a configuration of the announcement media to be inserted into the session based on the determined user media configuration;
A system comprising: means for configuring the announcement medium in accordance with the configuration of the announcement medium; and means for inserting the configured announcement medium into the session.
前記ユーザメディアのコンフィグレーションを判定する手段は、前記セッションにおける前記ユーザメディアのコーデックコンフィグレーションを判定する手段を含み、
前記アナウンスメディアのコンフィグレーションを判定する手段は、前記アナウンスメディアのコーデックコンフィグレーションと前記ユーザメディアのコーデックコンフィグレーションとのマッチングを行なうように構成されている
ことを特徴とする請求項16に記載のシステム。
The means for determining the configuration of the user media includes means for determining a codec configuration of the user media in the session,
The system according to claim 16, wherein the means for determining the configuration of the announcement media is configured to match the codec configuration of the announcement media with the codec configuration of the user media. .
前記ユーザメディアのコンフィグレーションを判定する手段は、前記セッションにおける前記ユーザメディアの伝送フォーマットコンフィグレーションを判定する手段を更に含み、
前記アナウンスメディアのコンフィグレーションを判定する手段は、更に、前記アナウンスメディアの伝送フォーマットコンフィグレーションと前記ユーザメディアの伝送フォーマットコンフィグレーションとのマッチングを行なうように構成されている
ことを特徴とする請求項17に記載のシステム。
The means for determining the configuration of the user media further includes means for determining a transmission format configuration of the user media in the session,
The means for determining the configuration of the announcement media is further configured to match the transmission format configuration of the announcement media with the transmission format configuration of the user media. The system described in.
前記セッションにおける前記ユーザメディアのコーデックコンフィグレーションを判定する手段は、コーデックのタイプ及びコーデックモードを判定する手段を含んでいる
ことを特徴とする請求項17に記載のシステム。
The system according to claim 17, wherein the means for determining a codec configuration of the user media in the session includes a means for determining a codec type and a codec mode.
前記ユーザメディアのコンフィグレーションを判定する手段は、
少なくとも1つの有効なユーザメディアのコンフィグレーションを識別するために、前記セッションのセットアップをモニタする手段と、
前記少なくとも1つの有効なユーザメディアのコンフィグレーションに基づいて、前記ユーザメディアのコンフィグレーションを判定する手段と
を備えていることを特徴とする16に記載のシステム。
The means for determining the configuration of the user media is:
Means for monitoring the session setup to identify at least one valid user media configuration;
The system according to claim 16, further comprising: means for determining a configuration of the user media based on a configuration of the at least one valid user media.
前記ユーザメディアのコンフィグレーションを判定する手段は、
複数の有効なユーザメディアのコンフィグレーションを識別するために、前記セッションのセットアップをモニタする手段と、
前記複数の有効なユーザメディアのコンフィグレーションの内の、現在使用されているものを検出するために、前記セッションにおけるユーザ間の通信をモニタする手段と
を備えていることを特徴とする16に記載のシステム。
The means for determining the configuration of the user media is:
Means for monitoring said session setup to identify a plurality of valid user media configurations;
16. A means for monitoring communications between users in the session to detect currently used ones of the plurality of valid user media configurations. System.
前記アナウンスの緊急性に基づいて、前記セッションにおいて前記アナウンスメディアを挿入するタイミングを判定する手段を更に備え、
前記コンフィグレーションされたアナウンスメディアを挿入する手段は、前記判定されたタイミングに従って、前記セッションに、前記コンフィグレーションされたアナウンスメディアを挿入するように動作可能である
ことを特徴とする16に記載のシステム。
Means for determining when to insert the announcement media in the session based on the urgency of the announcement;
The system of claim 16, wherein the means for inserting the configured announcement media is operable to insert the configured announcement media into the session according to the determined timing. .
前記アナウンスメディアが前記セッションに挿入される場合、前記ユーザメディアと前記アナウンスメディアとの間の円滑な遷移のための遷移処理を適用する手段を更に備える
ことを特徴とする16に記載のシステム。
The system of claim 16, further comprising means for applying a transition process for smooth transition between the user media and the announcement media when the announcement media is inserted into the session.
前記通信セッションは、異なるユーザのユーザ機器間の通信に関連し、
前記アナウンスは、前記ネットワークの側と前記ユーザの側との内の一方に配置されているアナウンスサーバから到来する
ことを特徴とする16に記載のシステム。
The communication session relates to communication between user equipment of different users;
The system of claim 16, wherein the announcement comes from an announcement server located on one of the network side and the user side.
通信ネットワーク用のアナウンスサーバであって、
前記通信ネットワークのセッションにおけるユーザメディアのコンフィグレーションを示すメディアコンフィグレーション情報を取得する手段と、
前記メディアコンフィグレーション情報に基づいて、前記セッションに挿入されるアナウンスメディアをコンフィグレーションする手段と、
前記セッションに、前記コンフィグレーションされたアナウンスメディアを挿入する手段と
を備えることを特徴とするアナウンスサーバ。
An announcement server for a communication network,
Means for acquiring media configuration information indicating a configuration of user media in a session of the communication network;
Means for configuring announcement media to be inserted into the session based on the media configuration information;
Means for inserting the configured announcement media into the session.
JP2009540202A 2006-12-08 2007-11-30 Announcement Media Processing in Communication Network Environment Expired - Fee Related JP5112447B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86916206P 2006-12-08 2006-12-08
US60/869,162 2006-12-08
PCT/SE2007/001061 WO2008069723A2 (en) 2006-12-08 2007-11-30 Handling announcement media in a communication network environment

Publications (2)

Publication Number Publication Date
JP2010512106A true JP2010512106A (en) 2010-04-15
JP5112447B2 JP5112447B2 (en) 2013-01-09

Family

ID=39492761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009540202A Expired - Fee Related JP5112447B2 (en) 2006-12-08 2007-11-30 Announcement Media Processing in Communication Network Environment

Country Status (5)

Country Link
US (1) US9307079B2 (en)
EP (1) EP2092726B1 (en)
JP (1) JP5112447B2 (en)
CN (1) CN101601269B (en)
WO (1) WO2008069723A2 (en)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8068871B2 (en) * 2007-12-21 2011-11-29 Texas Instruments Incorporated Systems and methods for time optimization for silencing wireless devices in coexistence networks
FR2930699B1 (en) * 2008-04-24 2010-06-11 Alcatel Lucent OPTIMIZED NEGOTIATION OF CODING RESOURCES BETWEEN COMMUNICATION CLIENTS
US20100238842A1 (en) * 2009-03-19 2010-09-23 Microsoft Corporation Phone conferencing architecture with optimized services management
US9497758B2 (en) * 2009-06-18 2016-11-15 Telefonaktiebolaget L M Ericsson Late Abis activation
EP3139696B1 (en) 2011-06-09 2020-05-20 Panasonic Intellectual Property Corporation of America Communication terminal and communication method
CN102231734B (en) * 2011-06-22 2017-10-03 南京中兴新软件有限责任公司 Realize audio code-transferring method, the apparatus and system from Text To Speech TTS
IN2014KN01633A (en) * 2012-01-13 2015-10-23 Ericsson Telefon Ab L M
EP2856727B1 (en) * 2012-06-04 2018-06-06 Telefonaktiebolaget LM Ericsson (publ) Methods and apparatus for media transmission in telecommunications networks
US9998396B2 (en) * 2012-07-03 2018-06-12 Verizon Patent And Licensing Inc. Method and system for providing dynamic admission control
EP3439360B1 (en) 2016-03-28 2021-10-06 Panasonic Intellectual Property Corporation of America User equipment, base station and codec mode switching method
CN106254354B (en) * 2016-08-10 2019-04-26 东北大学 A kind of SDP negotiation method of asymmetric media parameter
EP3552430B1 (en) 2016-12-12 2022-09-21 Telefonaktiebolaget LM Ericsson (PUBL) Methods and apparatus for adjusting a service continuity threshold in a wireless communication network
US10679608B2 (en) * 2016-12-30 2020-06-09 Google Llc Conversation-aware proactive notifications for a voice interface device
FR3071997A1 (en) * 2017-10-02 2019-04-05 Orange SIGNALING A REQUEST FOR ADAPTATION OF AN IP VOICE COMMUNICATION SESSION

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183952A (en) * 1993-12-24 1995-07-21 Sharp Corp Voice communication equipment
JPH11122307A (en) * 1997-10-14 1999-04-30 Kdd Network connector
JPH11225208A (en) * 1998-02-06 1999-08-17 Nec Commun Syst Ltd Annoucing device for originator information
JP2001024747A (en) * 1999-07-09 2001-01-26 Nec Corp Telephone system
JP2001274829A (en) * 2000-03-27 2001-10-05 Oki Electric Ind Co Ltd Packet receiver
JP2003037606A (en) * 2001-07-25 2003-02-07 Sony Corp Device and method for radio communication
JP2003258996A (en) * 2002-02-27 2003-09-12 Tamura Electric Works Ltd Internet telephone system
JP2004274151A (en) * 2003-03-05 2004-09-30 Hitachi Information Technology Co Ltd Information guiding system
JP2006505151A (en) * 2002-03-12 2006-02-09 シーメンス アクチエンゲゼルシヤフト Control of packet-switched network-based service server using special DTMF tone
JP2006262312A (en) * 2005-03-18 2006-09-28 Fujitsu Ltd Repeater

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614781B1 (en) * 1998-11-20 2003-09-02 Level 3 Communications, Inc. Voice over data telecommunications network architecture
GB9826157D0 (en) * 1998-11-27 1999-01-20 British Telecomm Announced session control
US6407325B2 (en) * 1999-12-28 2002-06-18 Lg Electronics Inc. Background music play device and method thereof for mobile station
US20020188744A1 (en) * 2001-05-31 2002-12-12 Mani Babu V. Direct connect service in a multimedia-capable network
US20030018917A1 (en) * 2001-07-23 2003-01-23 Brown Matthew W. Method and apparatus for delivering digital media using packetized encryption data
KR20050094052A (en) * 2003-01-27 2005-09-26 오끼 덴끼 고오교 가부시끼가이샤 Telephone communications apparatus
US7380011B2 (en) * 2003-10-01 2008-05-27 Santera Systems, Inc. Methods and systems for per-session network address translation (NAT) learning and firewall filtering in media gateway
KR100646343B1 (en) * 2004-07-12 2006-11-23 에스케이 텔레콤주식회사 Method and System for Terminal Codec Setup of Multimedia Ring Back Tone Service
US7796603B1 (en) * 2005-01-14 2010-09-14 Acme Packet, Inc. Method and system for controlling media sessions in networks that use communication protocols with distinct signaling and media channels
US8249076B1 (en) * 2005-01-14 2012-08-21 Acme Packet, Inc. Method, system and architecture for validating media sessions in networks that use communication protocols with distinct signaling and media channels
DE102005050586B3 (en) * 2005-10-21 2006-11-02 Siemens Ag Setting-up video telephone connection or multimedia telephone connection in data network involves converting messages and using specified codes to establish connection between users in telephone and Internet-protocol (IP) based networks
US8522269B2 (en) * 2006-08-22 2013-08-27 Goldspot Media, Inc. Method and apparatus for alternate content scheduling on mobile devices
US20080077410A1 (en) * 2006-09-26 2008-03-27 Nokia Corporation System and method for providing redundancy management

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183952A (en) * 1993-12-24 1995-07-21 Sharp Corp Voice communication equipment
JPH11122307A (en) * 1997-10-14 1999-04-30 Kdd Network connector
JPH11225208A (en) * 1998-02-06 1999-08-17 Nec Commun Syst Ltd Annoucing device for originator information
JP2001024747A (en) * 1999-07-09 2001-01-26 Nec Corp Telephone system
JP2001274829A (en) * 2000-03-27 2001-10-05 Oki Electric Ind Co Ltd Packet receiver
JP2003037606A (en) * 2001-07-25 2003-02-07 Sony Corp Device and method for radio communication
JP2003258996A (en) * 2002-02-27 2003-09-12 Tamura Electric Works Ltd Internet telephone system
JP2006505151A (en) * 2002-03-12 2006-02-09 シーメンス アクチエンゲゼルシヤフト Control of packet-switched network-based service server using special DTMF tone
JP2004274151A (en) * 2003-03-05 2004-09-30 Hitachi Information Technology Co Ltd Information guiding system
JP2006262312A (en) * 2005-03-18 2006-09-28 Fujitsu Ltd Repeater

Also Published As

Publication number Publication date
CN101601269A (en) 2009-12-09
WO2008069723A3 (en) 2008-07-24
EP2092726A4 (en) 2013-01-02
JP5112447B2 (en) 2013-01-09
EP2092726A2 (en) 2009-08-26
US20100017509A1 (en) 2010-01-21
US9307079B2 (en) 2016-04-05
EP2092726B1 (en) 2019-02-27
WO2008069723A2 (en) 2008-06-12
CN101601269B (en) 2015-11-25

Similar Documents

Publication Publication Date Title
JP5112447B2 (en) Announcement Media Processing in Communication Network Environment
EP2105014B1 (en) Receiver actions and implementations for efficient media handling
US20070206505A1 (en) Adjusting CODEC parameters during emergency calls
JP2005531999A (en) Packet-switched conference call management method, server, and terminal device
KR20080023359A (en) System and method for resolving conflicts in multiple simultaneous communications in a wireless system
RU2658602C2 (en) Maintaining audio communication in an overloaded communication channel
US8355334B2 (en) Speech codec selection for improved voice quality in a packet based network
WO2012063888A1 (en) Core network and communication system
US7925503B2 (en) Method and apparatus for dynamically providing comfort noise
US20070177633A1 (en) Voice speed adjusting system of voice over Internet protocol (VoIP) phone and method therefor
GB2427523A (en) Transport Protocol control information for controlling processing of data at the receiving device.
CA2922654C (en) Methods and apparatus for conducting internet protocol telephony communications
CN108650425B (en) Monitoring method and monitoring system
US7313233B2 (en) Tone clamping and replacement
KR100793320B1 (en) Method, System and Apparatus for Transmitting Audio Data by Using Supplementary Information for Use in Multimedia Ring Back Tone Alternative Service
US20230247136A1 (en) Automated attendant that specifies audio transmission characteristics for calls
Pearce et al. An architecture for seamless access to distributed multimodal services.
CN102100057B (en) Digital telecommunications system and method of managing same
KR100814763B1 (en) Method for Reproducing Audio Data for Use in Multimedia Ring Back Tone Alternative Service and Mobile Communication Terminal Therefor
US20090141647A1 (en) Acknowledgment of Media Waveforms between Telecommunications Endpoints
EP1460817A1 (en) Method and system for the concurrent use of a multiple terminals during an audio and/or video telecommunication
KR100747712B1 (en) Method, system and apparatus for transmitting audio data for use in multimedia ring back tone altrenative service
US8751223B2 (en) Encoded packet selection from a first voice stream to create a second voice stream
Lee et al. Internet Telephony Gateway Server-Software Design
JP2011250052A (en) Call originating method and telephone system, returning ring-back content to calling terminal at call connection

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120910

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121010

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5112447

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees