JP5528811B2 - 効率的なメディアの扱いのための受信機の動作及び実装 - Google Patents

効率的なメディアの扱いのための受信機の動作及び実装 Download PDF

Info

Publication number
JP5528811B2
JP5528811B2 JP2009540201A JP2009540201A JP5528811B2 JP 5528811 B2 JP5528811 B2 JP 5528811B2 JP 2009540201 A JP2009540201 A JP 2009540201A JP 2009540201 A JP2009540201 A JP 2009540201A JP 5528811 B2 JP5528811 B2 JP 5528811B2
Authority
JP
Japan
Prior art keywords
media
encoder
decoder
detecting
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009540201A
Other languages
English (en)
Other versions
JP2010512105A (ja
Inventor
インゲマル ヨハンソン,
ダニエル エンストレム,
トマス フランキラ,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2010512105A publication Critical patent/JP2010512105A/ja
Application granted granted Critical
Publication of JP5528811B2 publication Critical patent/JP5528811B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • H04L65/1089In-session procedures by adding media; by removing media
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/765Media network packet handling intermediate

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本発明は一般に通信環境におけるメディア技術に関し、より具体的には効率的なメディアの扱いのための受信機側の動作と実装との少なくとも何れかに関する。
最新の通信システムは、音声、オーディオ、ビデオ、テキスト、及び画像を含む、ユーザ間の幅広い種類のメディアの交換をサポートする。いわゆるマルチメディア・システムのほとんどはインターネット・プロトコル(IP)技術に基づいている。このようなIPベースのシステムの特定の例はIPマルチメディア・サブシステム(IMS)(非特許文献1)であり、これにより、進歩したマルチメディア・サービス及びコンテンツをブロードバンド・ネットワークを通じて供給することが可能となる。例えば、リアルタイムのユーザ間マルティメディア・テレフォニー(MMTel)・サービス(非特許文献2)は様々なマルチメディア・サービスのニーズを満足させるために重要な役割を果たすだろう。
例えば、IMSマルチメディア・テレフォニー(MMTel)のような最新の通信システムにおいて付加サービス(supplementary service)が重要な役割を果たすだろうし、このようなシステムがメディア歪み(media distortion)のような性能劣化を生じさせることなく従来システムで見られるのと同一の又は少なくとも類似する付加サービスをサポートすることが重要である。付加サービスの例として、発呼線識別表示、通話保留、会議、及びアナウンス(announcement)がある。例えば、アナウンスは、通信ネットワークによって生成されてもよく、遠隔ユーザの交換台又はコンピュータによって生成されてもよい。
通信ネットワークからのアナウンスの使用例は以下を含む。
・ユーザが開始したコマンドを完了できない場合のエラー・メッセージ。例えば、発呼者が電話番号の提示を抑制したが、被呼者が電話番号を見ないで呼に応答することはしないと規定している場合に、システムは発呼者にエラー・メッセージを提示しなければならない。
・ユーザAがセッションを保留にした場合に、システムはこれに関するメッセージをユーザBに再生してもよい。
・会議通話において、会議サーバは、新たなユーザが参加した場合に又はユーザがセッションから離れた場合に、例えば「ジョン・スミスが会議に参加しました」及び「ジョン・スミスが会議から離れました」というアナウンスを提示してもよい。
・ユーザは、なくなりかけているプリペイド加入契約を有している。オペレータは少量であることに起因して使用を制限でき、セッションの開始時又は(とても長いセッションの場合にありうるだろうが)セッションの間に、このことをアナウンスすることを望む。
・インターネットでますます用いられている方法は、ウェブ・ページにピンコード(又はパスワード)を有する画像を提示することである。ピンコードの画像は歪んでいるので、自動テキスト認識システムはピンコードを検出できないが、賢い人間が文字及び数字を読みことはなおも可能である。これは、対応するピンコードを(セキュアでない)電子メールで送信するかわりに用いられる。
被呼者からのアナウンスの使用例は以下である。
・ユーザはチケットの予約をするために旅行代理店に電話する。以下のシナリオが起こり得る。
1.ユーザは最良の旅行オプションを見つけるために旅行代理人と会話する。このステップでは、二人の人間の間で議論される。
2.旅行を決定した後に、ユーザは自分のクレジット・カード番号を入力することを要求される。これは、事前に録音されたメッセージ又は機械が生成するメッセージをユーザが聞いて、自分の番号を入力するために電話のボタン(0−9)を押すマン−マシン通信である。この処理において、以下の文が考えられる。「あなたのクレジット・カード番号を入力してください。」「あなたの入力は、1234 5678 9012 3456です。正しい場合は1を、そうでない場合は2を押してください。」「あなたのクレジット・カードの有効期限を入力してください。」「あなたの入力は、2007年1月1日です。」これらの文はアナウンス・サーバによって生成されるだろう。
3.クレジット・カード番号及びその他の要求されたデータを入力した後に、追加の旅行オプションを決定するために、旅行代理人とのセッションが継続する。
4.これらのステップは複数回繰り返されてもよい。
従来の通信システムと比較して、メディアを扱う状況及び要件は最新のマルチメディア通信システムにおいて劇的に変化しているだろうし、よって、このような通信システムにおいてメディアを効率的に扱うためのソリューションを提供する一般的なニーズがある。
3GPP TS 23.228「IPマルチメディア・サブシステム(IMS)、ステージ2」 3GPP TS 26.114「IPマルチメディア・サブシステム(IMS);マルチメディア・テレフォニー;メディアの扱い及びインタラクション」 RFC3550「RTP:リアルタイム・アプリケーションのためのトランスポート・プロトコル」H.シュルズリン、S.キャスナー、R.フレデリック、及びV.ヤコブソン ITU−T勧告G.711「音声周波数のパルス符号変調(PCM)」 ITU−T勧告G.726「40,32,24,16kbit/s適応差分パルス符号変調(ADPCM)」 3GPP TS 26.071「必須音声コーデック音声処理機能;AMR音声コーデック;概要」 3GPP TS 26.171「音声コーデック音声処理機能;AMR音声コーデック;適合マルチレート−広帯域(AMR−WB)音声コーデック;概要」 オープン・モバイル・アライアンス「PoCユーザ・プレーン」候補バージョン1.0、2006年1月27日、6.5章 オープン・モバイル・アライアンス「OMA PoCシステム説明」ドラフト・バージョン2.0、2006年6月21日
本発明は、先行技術の装置のこれらの欠点及びその他の欠点を克服する。
本発明の一般的な目的は、(マルチメディア)通信システムにおけるメディアの扱いを改良することである。
特に、受信機側のメディア歪みを排除又は軽減しつつ、極めてコスト効率の高い方法で付加サービスをサポートすることが望ましい。
個別の目的は、受信メディア・ストリームを復号するデコーダを備える受信機におけるメディア歪みを軽減するための改良された方法及び装置を提供することである。
別の個別の目的は、(マルチメディア)通信システムで用いられる改良された受信機を提供することである。
これらの目的及びその他の目的は添付の特許請求の範囲で規定される発明によって達成される。
通信セッション中に異なるエンコーダ・インスタンスを用いることは、受信機側のデコーダにおける状態不一致(state mismatch)を引き起こし、その結果、エンドユーザを不快にさせるかもしれない歪みが生じるかもしれないことが発明者により認識されていた。例えば、これが生じるのは、新たなメディア送信元からのメディアが通信セッションに挿入された場合、例えば、一つのメディア送信元から別のメディア送信元に切り替わった場合又は新たな送信元からのメディアが既存のメディア・ストリームに追加された場合である。
従って、本発明の基本的な考えは、進行中の通信セッション中に着信メディアの送信元の変更を検出し、新たな着信メディアを復号する前に、このような検出された変更に応じてデコーダのデコーダ状態をリセットすることである。このようにして、受信機内に複数のアクティブなデコーダ・インスタンスを必要とすることなく状態不一致を回避することができ、全体的な複雑さ、メモリ使用量、及び電力消費量の観点で大幅な節減につながる。これはまた、復号されたメディアが最終的にレンダリングされる場合に、メディア歪みを排除でき、又は少なくとも軽減することができることを意味する。
場合によっては、検出メカニズムは、例えば一つのメディア送信元から別のメディア送信元に切り替わった場合又は新たな送信元からのメディアが既存のメディア・ストリームに追加された場合に、新たなメディア送信元からのメディアが通信セッションに挿入されたことを検出するように構成される。しかしながら、一般に、送信元の変更は、送信元間の切り替え、送信元の追加、及び送信元の削除の少なくとも何れかであり得る。
言い換えると、受信機は、進行中の通信セッション中にデコーダで起こり得る状態不一致を検出し、検出された起こり得る状態不一致に応じてデコーダをリセットすることによって状態不一致を回避するように構成される。
本発明の密接に関連する形態では、送信側は、所定の信号パターンを送信することによって、新たな送信元からのメディアに備えて受信側でデコーダのリセットを実施する。受信側では、これは、第1のメディア送信元からのメディアの受信をもたらす進行中の通信セッションの間に、受信機が、異なる第2のメディア送信元からのメディアの後続する受信に備えて所定の信号パターンを受信するだろうことを意味する。その後に、デコーダは、第2のメディア送信元からのメディアの復号を開始する前に、所定の信号パターンに応じてリセットされるだろう。
本発明は特に、アナウンス、通話保留、及び会議サービスのような付加サービスのための最新の通信システムに適用可能である。
本発明により提供されるその他の利点は以下の本発明の実施形態の説明を読む場合に理解されるだろう。
本発明は、その更なる目的及び利点とともに、添付の図面と一緒に以下の明細書を参照することによって最もよく理解されるだろう。
異なるメディア送信元間の切り替えの基本的な例を説明する概略図である。 混合メディア・ストリームの寄与送信元の追加/削除の基本的な例を説明する概略図である。 エンコーダ状態はリセットされるがデコーダ状態はリセットされない場合の歪みを説明する概略図である。 デコーダ状態はリセットされるがエンコーダ状態はリセットされない場合の歪みを説明する概略図である。 本発明の例示的な実施形態に係る基本的な方法の概略フロー図である。 本発明の例示的な実施形態に係る受信機を主に説明する概略ブロック図である。 本発明の別の例示的な実施形態に係る方法の概略フロー図である。 本発明の更なる例示的な実施形態に係る受信機を主に説明する概略ブロック図である。 本発明のさらに別の例示的な実施形態に係る方法の概略フロー図である。
すべての図面を通じて、対応する要素又は類似する要素のために同じ参照文字が用いられる。
発明者の注意深い分析により、既存のソリューションが一つ以上の問題を抱えることが明らかになった。特に、エンコーダの異なるインスタンスによってメディアが符号化される一方で同じデコーダが用いられることによって、デコーダにおいて通常は状態不一致が生じ、その結果、復号されたメディアがレンダリングされる際に顕著な歪みが生じることが認識されてきた。
主な問題は、エンコーダの異なるインスタンスでメディアが符号化されるがデコーダは同一であることである。同一のデコーダを用いる理由は、複雑さを制限することと、メモリを制限することと、電力消費との少なくとも何れかのためである。図1に説明される例では、1種類のメディアがAで表される送信機/エンコーダ10で生成され、このメディアが、Bで表される受信機/デコーダ20に、例えばVoIPセッションで送信されることを考える。セッション中に、Aである送信機/エンコーダ10からのメディアは、Xで表される送信機/エンコーダ30により符号化されたメディアによって置き換えられる。つまり、Aで生成されたメディアがBに送信され、その後にXからのメディアによって少なくとも一時的に置き換えられる。
図2に説明されるように、Aで表される送信機/エンコーダ10とBで表される受信機/デコーダ20との間の通信セッションにおいて、Xで表される送信機/エンコーダ30からのメディアが中間のミキサ40により新たな寄与送信元として混合メディア・ストームに追加される場合に、同様の問題を生じるかもしれない。リアルタイム・トランスポート・プロトコル(RTP)(非特許文献3)に基づくメディア通信の特定の例では、メディア・ストリーム通信にとって特に重要であるRTPデータパケットのヘッダ内の二つのフィールド、つまりSSRCフィールドとCSRCフィールドとがある。SSRCは同期送信元を意味し、個別のRTP送信機を識別する。CSRCは寄与送信元又はコンテンツ送信元を意味し、混合メディアのペイロードの寄与送信元(群)を識別する。複数の寄与送信元がある場合に、ペイロードはこれらの送信元からの混合データである。図2を参照すると、メディア送信元A及びメディア送信元Xのそれぞれは、ペイロード送信元に対応するSSRCで個別のメディア・ストリームをミキサ40に送信してもよいことが見て取れる。ミキサ40からの混合メディア・ストリームはミキサに対応するSSRCを有し、CSRC値はBへの混合メディア・ストリームの寄与送信元A及び寄与送信元Xを識別する。例えば、寄与送信元はもちろん混合メディア・ストリームから除去されてもよい。
ミキサ(又はアプリケーション・サーバ)が送信元の一つを外してもう一方の送信元を受信機に単に転送することも可能である。別の可能性として、両方のストリームが受信機への経路全体を通り、受信機が聞き手に提示するために一つを選択しなければならない。
エンコーダ・インスタンスの切り替えは今日の既存の回線交換システムで動作するが、これは、使用されるコーデックが典型的なPCM(非特許文献4)又はADPCM(非特許文献5)であるためにうまく動作する。これらのコーデックは、予測(PCM)を使用しないか、非常に限られた量の予測(ADPCM)しか使用しないかのいずれかであるサンプル単位のコーデックである。これは、デコーダが状態不一致から非常に速く回復するだろうし、これにより聞き取り可能な又はその他の知覚可能な歪みが生じる可能性が低いことを意味する。
予測及び状態にもっと依存するコーデック、例えばAMR(非特許文献6)又はAMR−WB(非特許文献7)を使用するであろう場合に、二つのエンコーダ間の切り替えはデコーダにおける状態不一致を生じさせるだろう。例えば、エンコーダAからの音声メディアから、エンコーダXからのメディアに切り替える場合に、デコーダ状態は切り替えの瞬間においてエンコーダAと同じである一方で、エンコーダXの状態は初期状態から始まるだろう。エンコーダAからのメディアに戻されるように切り替えが行われる場合に同様の状態不一致が生じるだろう。
AMRのようなマルチレートのコーデックに伴う更なる問題は、エンコーダAからの音声は、低レートのコーデック・モード、例えばAMRの5.9kbpsで符号化されることは十分にありえる一方で、エンコーダXからのメディアは、高レートのコーデック・モード、例えばAMRの12.2kbpsで符号化されることは十分にありえることである。この場合、状態不一致が生じるだけでなく、コーデック・モードの不一致も生じる。別の例では、コーデックの不一致を表すコーデック間の切り替え、例えばAMRとEVRCとの間、又はAMRとAMR−WBとの間の切り替えを伴う。
良好な音声品質をなおも提供しつつ良好な圧縮比を達成するために状態が必要となるため、最新の低レート音声コーデックでは状態は非常に重要である。状態不一致は、現在のコンテンツに依存して多かれ少なかれ聞き取り可能な歪みを生じ得る。従って、品質への影響を軽減するために、メディアを適切に扱うことが重要となる。特に、最新の予測ベースのコーデックの使用は、例えばアナウンスが通常のメディアを中断する際に、通常は状態不一致を生じるだろう。その結果、ユーザを不快にさせもするかもしれない聞き取り可能又はその他の知覚可能な歪みを生じる。良好な品質をなおも提供しつつ、ビットレートを低減するためすなわち高圧縮比を獲得するため、AMR又はAMR−WBのような多くの最新コーデックにおいてフレーム間予測が用いられる。フレーム間予測は、フレームからフレームへと状態が渡されることを要求する。アナウンスが通常のメディアを中断する場合に、コーデックの二つの異なるインスタンス、つまりユーザからの音声メディアのためのUE Aにおける一つのコーデック・インスタンスとアナウンス・サーバにおける一つのコーデック・インスタンスとが用いられるため、状態不一致が生じるだろう。UE Aにおける状態は用いられる予測に従って展開する一方で、アナウンス・サーバにおける状態は初期状態から始まる。状態不一致は、現在のコンテンツに依存して多かれ少なかれ聞き取り可能な歪みを生じ得る。このような歪みの二つの例が図3及び図4に示される。歪みは両方の場合においてはっきりと聞き取り可能であり、聞き手によって容易に気付かれるが、図3のスパイクの方がはるかに不快である。
図3及び図4から、非同期のリセットの後に同期が回復するために約100−200msかかることも見て取れる。その代わりに、PCMのような状態を持たないコーデックは直ちに回復するだろう。なぜなら、適切なコンテンツのための状態を「構築する」必要がないからである。
この問題は音声に制限されない。同様の問題が、一般オーディオに対して、及びビデオに対しても生じる。これらの場合について、これらのコーデックは一般的に音声コーデックよりも高い圧縮比を有し、この圧縮比を達成するために高い品質状態により大きく依存するため、いくつかの場合でさらに大きな問題を予想できる。
前述のように、所与のエンコーダからのメディアが中断されて異なるエンコーダにより符号化されたアナウンスにより置き換えられた場合にエンコーダ・インスタンスの切り替えが生じるだろうし、アナウンスが始まる場合に切り替えが生じるだろうし、アナウンスが終わる場合に別の切り替えが生じるだろうし、及び/又は当初のエンコーダ・インスタンスに戻される場合に切り替えが生じる。アナウンスは「その場で(on the fly)」符号化されてもよく、又は事前に記録された素材として存在してもよいが、受信機の観点からはこれが違いを生じさせることはない。
状態不一致はまた、通話保留状況において生じてもよい。通話保留シナリオにおける状態不一致の問題は以下に説明され得る。
1.ユーザAはユーザBと会話をしていて、両方のUEは送受信状態である。
2.ユーザAはユーザBを保留にする。UE Aは送信専用状態に入り、UE Bは受信専用状態に入るだろう。
3.ユーザAはユーザCとの会話を開始し、両方のUEが送受信モードとなる。ユーザBはその間にXからの保留中のアナウンス又は音楽を得ているかもしれないし、ミュートされているかもしれない。
4.ユーザAはユーザBとの会話を再開する。UE AとUE Bとの両方が送受信モードとなる。
Aからのメディアが保留中のアナウンス又は音楽によって中断される場合のBにおける問題に加えて、上述のシナリオは、ステップ3からステップ4への移行において、少しの起こり得る問題をも与える。
1.ユーザAのUEはユーザCのUEからのパケットを受信してきていて、突然にユーザBのUEからのパケットを得る。二つのストリームC→AとB→Aとが二つの異なるデコーダ・インスタンスで復号される場合に、このことは、通常はささいな問題でなる。一方、二つのストリームが単一のデコーダ・インスタンスを共有する場合には、このことは、デコーダがリセットされない限り、深刻な状態不一致が起こり得るリスクを与える。
2.ユーザBのUEは、ユーザAのUEからのDTX SID更新パケットを受信しているかもしれないし、保留中の通話アナウンス又は音楽を受信しているかもしれないし、何も受信していないかもしれない。これは、デコーダが完全なミュート状態であるかもしれないし、別の未知の状態であるかもしれないことを意味する。保留中の音楽又はアナウンスが別個のデコーダ・インスタンスにより扱われる場合、問題は通常は制限される。一方、一つのデコーダ・インスタンスだけが用いられる場合に、やはり深刻な状態不一致の問題が頻繁に生じるだろう。
デコーダ・インスタンスがただ一つであることによる課題は、複雑さ及び物理サイズの課題が重要な要因となる携帯電話の用途で特に重要である。
例示的な技術に係る基本的な考えは、進行中の通信セッション中にデコーダにおいて起こり得る状態不一致を検出し、状態不一致を回避するため又は少なくとも歪みを軽減するために、デコーダをリセットすることである。
図5は本発明の例示的な実施形態に係る基本的な方法の概略フロー図である。本発明は、進行中の通信セッション中に着信メディアの送信元の変更を検出すること(S1)に基づく。このような検出された変更に応じて、デコーダのデコーダ状態は、新たな着信メディアを復号する前にリセットされる(S2)。このようにして、受信機における複数のアクティブなデコーダ・インスタンスを必要とすることなく、状態不一致を回避でき、又は少なくとも歪みが軽減されるだろう。これは、復号されたメディアが最終的にレンダリングされる際にメディア歪みが軽減されることにつながり、全体的な複雑さ、メモリ使用量、電力消費の観点で大幅な節減にもなる。一般に、デコーダをリセットすることは、検討中のデコーダ状態が明確な初期状態に設定されることを意味する。
図6は、本発明の例示的な実施形態に係る受信機を主に説明する概略ブロック図である。基本的に、着信メディアは複数のメディア送信元から由来してもよく、送信元の変更は例えば、メディア送信元の切り替え、若しくは既存のメディア・ストリームからのメディア送信元の追加又は削除であってもよい。受信器100は、一つ以上のバッファ110、デコーダ120、及び再生器130のほかに、検出器140を含む。ジッタ・バッファのようなバッファ(群)110は着信データパケットを一時的に記憶し、その後に着信データパケットは更なる処理のためにデコーダ120に送られる。パケット到着時間の揺らぎいわゆるジッタが、ネットワーク輻輳、タイミング・ドリフト、又はルート変更のせいで生じるかもしれない。そして、ジッタ・バッファは、意図的に到着パケットを遅延し、当該パケットを一定間隔でデコーダに転送することによって、遅延揺らぎを等しくするために用いられてもよい。このようにして、エンド・ユーザは、極めて小さい歪みを有するクリアな接続を経験する。検出器140は好適には、着信メディアの送信元の変更を検出するために、着信メディア・ストリーム、又はバッファされたメディア・ストリームを監視する。好適には、バッファ110内の既存のメディア・フレームがバッファから連続的に出力され、復号及びレンダリングされ、そして新たなメディア・フレームがバッファされる。その後に、検出器140はデコーダ120に対するリセット信号を生成する。リセット信号に応じて、デコーダ120は、新たなメディア・フレームの復号及びレンダリングを始める前に、自身の初期状態にリセットされる。
有利には、一つ以上のパケット・ヘッダ・フィールドを監視して着信メディア・データ・ストリーム内の複数のパケット間のパケット・フィールドの変化を検出するか、送信元の変化を検出するための信号分類アルゴリズム又はすかし技術を用いてメディア・ペイロードを監視するか、若しくはSIPシグナリングのような明示的な制御シグナリングを監視する。
適切な検出メカニズムの例は、RTPストリームにおけるSSRCフィールドとCSRCフィールドとの少なくとも何れかのようなパケット・ヘッダ・フィールドの変化を検出することと、通話保留状態の変化を検出することと、及び着信メディア・データ内の複数のパケット間のメディア・エンコーディングの変化を検出することとを含む。他の例は以下に説明される。
デコーダに関連付けられたジッタ・バッファの再初期化(いわゆる再バッファリング)がデコーダをリセットすることの特定の形式としてみなされてもよいことも理解されるべきである。
本発明の特定の用途はMMTelシステムにおけるVoIP(ボイス・オーバ・IP)であるが、本発明をビデオ・コーデック及び一般のオーディオ・コーデックに用いることもできる。特に、通話アナウンス、通話保留、明示的通話転送(ECT)のような付加サービス、又はメディア送信元が変更されるその他の付加サービスが、受信機において、一切の歪みなく又は少なくとも可能な限り小さい歪みで再構築されることを保証することが望ましい。例えば、受信機は、アナウンスが(UE Aからの)通常のメディアとは異なる送信元から来ることを検出して、、歪みを最小化(又は少なくとも軽減)するために適切な動作をおこしてもよい。受信機はまた、着信メディアの送信元の変更を示す、通話保留、明示的通話転送、又はその他の同様なサービスへの転送若しくはこれらからの転送を検出してもよい。
上述のように、任意の不快な歪みを最小化するために、メディアを適切に扱うことが重要である。歪みを軽減するための動作の扱いは主に受信機側で行われる。
<状態リセット・トリガの検出の例>
例えば、アナウンスの開始及び終了又はその他の送信元の変更に起因してデコーダのリセットが必要となることを検出する複数の方法がある。いくつかの検出方法は信頼でき、何らかの種類のシグナリングに依存する。その他の検出方法は、何らかの種類の特性を検出することを必要とするため、信頼が低い。
信頼できる方法の例は以下を含む。
・RTPヘッダが、送信元からの乱数を含むSSRC(同期送信元)フィールドを含む。SSRCフィールドが変更された場合に、受信機は送信元が異なることを知る。
・アナウンス・メディアが終了した場合に、SSRC値は当初のSSRC値に戻るように切り替わるだろう。
・一つのRTPパケット内に複数の送信元からのメディアを有することが可能である。この場合、一つのSSRCフィールドと一つ以上のCSRC(寄与送信元)フィールドとがあるだろう。アナウンス・メディアを符号化するエンコーダXは、自身のメディアをエンコーダAからのRTPパケットに加えることを選択してもよい。これは、CSRC値を加えるだろうことを意味する。SSRCとCSRCとの少なくとも何れかが変わった場合に、受信機は追加されたメディアが異なる送信元から来たことを知る。
・アナウンス・メディアが終了した場合に、CSRC値は後続するRTPパケットから除去されるだろう。
・エンコーダAからのメディアとアナウンス・サーバからのメディアとはまた、異なるように符号化されてもよい。例えば、エンコーダAからのメディアはAMR−WB(広帯域AMR)を用いてもよいし、エンコーダXからのメディアはAMR(挟帯域AMR)を用いてもよい。
異なる符号化は、異なる構成のための異なるRTPペイロード・タイプ(PT)を割り当てられることによって示される。これはまた、メディアが異なる送信元から来たことを検出するための一つの信頼できる方法である。
エンコーダXからのメディアが終了した場合に、当初のコーデック形式が、エンコーダAからのメディアに対して用いられるだろう。
・SIPシグナリング。通話保留シナリオにおいて、いくつかのパーティは送信専用状態又は受信専用状態に入り、その後に送受信状態に戻るだろう。そして、これらの移行は送信元の変更を示すものとして働く。
・アナウンス・サーバから由来するメディアが信号分類アルゴリズムによって検出されてもよい。
・何らかの種類のアナウンス識別子がいわゆるメディアすかしを用いて実際のメディアに含まれ得る。
・アナウンス・サーバはまた、アナウンス・メディアの送信が開始されたこと及びアナウンス・メディアの送信がいつ終了したかを受信機に通知するため、明示的な信号を送ってもよい。一つの可能性は、PoC(プッシュ−ツー−トーク・オーバ・セルラ)(非特許文献9)のために規定されるトーク・バースト制御(TBC)シグナリング(非特許文献8)を用いることである。
代替の方法の例は以下を含む。
・通常、エンコーダXはアナウンス・サーバに存在するため、エンコーダAからのメディアからエンコーダXからのメディアに切り替わる場合にジッタ特性が変わる。これは、受信機によって知覚される全体のジッタが、アップリンク、コア・ネットワーク、及びダウンリンクを通じたジッタの合計だからである。そして、アナウンス・サーバからメディアが送られる場合に、この無線インタフェースを通じてメディアが送られないため、アップリンクからのジッタは適用できない。
・同様の理由で、パケットロス特性が変わることも期待できる。
図7は本発明の別の例示的な実施形態に係る方法の概略フロー図である。この特定の例では、進行中のセッション中のメディア送信元の変更がまず検出され(S11)、その後にジッタ・バッファ内の既存のメディアが復号され、すべて再生される(S12)。オプションとして、ジッタ・バッファが再初期化される(S13)。新たな送信元からのメディア・データがジッタ・バッファに記憶される(S14)。送信元の変更の検出に応じて、新たなメディアを復号する前にデコーダ状態がリセットされる(S15)。最後に、新たなメディアが復号され、すべて再生される(S16)。
図6のものと同様に、図8は本発明の更なる例示的な実施形態に係る受信機を主に説明する概略ブロック図である。しかしながら、この特定の例では、受信機100は、ジッタ・バッファ(群)を再初期化するユニット150をさらに備える。さらに、再生器130は、より柔軟で一般的なレンダリング・モジュールとして実装され、異なる送信元からのメディア間の滑らかな移行を実現するための、フェージング、時間スケーリング、及び帯域拡張のようなオプションの機能を含む。
以下では、アナウンス又は保留通話が検出された場合の動作に関する本発明の例示的な実施形態が図9を例示的に参照して説明される。
アナウンス・メディアが受信されたこと又は通話保留状態が変更されたことを検出すると(S21)、受信エンティティ(UE)の動作の例は以下を含む。
・ジッタ・バッファ内のエンコーダAからの既存のメディア・フレームを可能な限り速くすべて再生又は終了させ(S22)、アナウンス・メディアをバッファする(S24)。
・エンコーダAからのメディアのすべての再生をスピードアップするために、受信機は時間スケーリングを用いてもよい。
・アナウンス・メディアの生成を開始する前に、デコーダは初期状態にリセットされるべきである(S25)。デコーダがリセットされた時点で、新たなメディアの復号を開始できる(S26)。
・ジッタ・バッファを再初期化(いわゆる再バッファリング)する(S23)。
・エンコーダXにより符号化されたメディアがアナウンス・メディアである場合に、これは真にリアルタイムではない(リアルタイム要件は事前に記録されたメディアには適用されない)。受信機はすべての再生を開始する前にジッタ・バッファ内により多くのメディアをバッファしてもよく、それによって遅延ロスのリスクを軽減する。
・エンコーダAからのメディアのすべての再生は、好適には、フェードアウト(使用されている(通常の)音量からゼロへ音量を徐々に減少すること)を用いるべきである。受信機は、好適には、アナウンス・メディアに対してフェードイン(ゼロから通常の音量へ音量を徐々に増加すること)を用いるべきである(S28)。
・受信機は、すべてのスパイクを検出してミュートできるようにするために、再生成された信号をすべて再生する前に監視することもできる。
・エンコーダAからの音声メディアとアナウンス・メディアとが異なる音響の帯域幅を使用していること、例えば、それぞれAMR−WB(50−7000Hz)とAMR(300−3400Hz)とで符号化されていることを検出すると、受信機は好適には、滑らかな移行を行うために、帯域拡張(広帯域拡張)を用いるべきである(S27)。異なるメディア間の移行を滑らかに実施するためのその他の同様の手順もオーディオ及びビデオに対して予想できる。
受信しているアナウンス・メディアがこれ以上ない場合に、受信エンティティ(UE)の動作の例は以下を含む。
・ジッタ・バッファ内になおも存在している任意のアナウンス・メディアを出来るだけ速くすべて再生する(S22)。
・受信機は、残っているアナウンス・メディアのすべての再生をスピードアップするために時間スケーリングを用いてもよい。
・エンコーダAからのメディアを再生する前にデコーダをリセットする(S25)。
・ジッタ・バッファを再初期化(再バッファリング)する(S23)。これは特に重要である。なぜなら、アナウンス・サーバのようなネットワーク内のボックスに存在する場合に、エンコーダXからのRTPパケット上のジッタはエンコーダAからのものより通常は少なくなるためである。これは、ジッタ・バッファは、エンコーダAからのRTPパケットに対して用いられるものよりも低いバッファリング・レベルに通常は適合されることを意味する。そして、その後にエンコーダAからのメディアに戻すように切り替わった際に、ジッタ・バッファは、エンコーダAからのメディアについて予想され得る大きなジッタを処理するのに十分なデータを含んでいない。
・可能な変形は、アナウンス・メディアに切り替える前にジッタ・バッファ目標レベルと適合(adaptation)状態とを記憶し、当該レベルと当該状態とでジッタ・バッファ適合を再初期化することである。
前述のように、送信側は、所定の信号パターンを送信することによって、新たな送信元からのメディアに備えて受信機側のデコーダのリセットを実施してもよい。これは、第1のメディア送信元からのメディアの受信を伴う進行中の通信セッション中に、受信機は、異なる第2のメディア送信元からのメディアの後続する受信に備えて所定の信号パターンを受信するだろうことを意味する。そして、デコーダは、第2のメディア送信元からのメディアの復号を開始する前に、所定の信号パターンに応じてリセットされる。例えば、通話保留状態から戻るように切り替わる際に、送信エンティティ(UE)はコーデック・ホーミング・フレーム又は同様の信号パターン(複数の空フレームであってもよい)を送信して、それによって受信機におけるデコーダのリセットを実施してもよい。
本発明の例示的な利点は以下である。
・メディア送信元間の切り替え、メディア送信元の追加、及びメディア送信元の削除の少なくとも何れかに起因する歪みが軽減し、そして完全に除去されさえするかもしれない。これは、例えば、受信ユーザのためにアナウンスが生成されなければならない場合に、メディア間のより好ましい移行を与える。
・UE内のMIPS及びメモリの両方について、複雑さの利点もある。なぜなら、UEは、並列に実行する複数のアクティブなコーデック・インスタンスを有する必要がないからである。
上述の実施形態は単に例として与えられ、本発明がこれに限定されないことが理解されるべきである。本明細書で開示され主張された基本的な根底原理を保持している更なる修正、変更、改良が本発明の範囲に含まれる。
<略語>
ADPCM 適合差分PCM(Adaptive Differential PCM)
AMR 適合マルチレート(Adaptive Multi-Rate)
AMR−WB AMR−広帯域(AMR-WideBand)
CSRC 寄与送信元(Contributing Source)
DTX 不連続送信(Discontinuous Transmission)
ECT 明示的通話転送(Explicit Call Transfer)
EVRC 可変速度符号化(Enhanced Variable Rate Codec)
IMS IPマルチメディア・サブシステム(IP Multimedia Subsystem)
IP インターネット・プロトコル(Internet Protocol)
MIPS 100万命令/秒(Million Instructions Per Second)
MMTel マルチメディア・テレフォニー(Multi Media Telephony)
PCM パルス符号変調(Pulse Code Modulation)
PoC プッシュ−ツー−トーク・オーバ・セルラ(Push-to-talk over Cellular)
RTP リアルタイム・プロトコル(Real-Time Protocol)
SID 無音記述子(Silence Descriptor)
SIP セッション開始プロトコル(Session Initiation Protocol)
SSRC 同期送信元(Synchronization Source)
TBC トーク・バースト制御(Talk-Burst Control)
UE ユーザ装置(User Equipment)
VoIP ボイス・オーバ・IP(Voice over IP)

Claims (25)

  1. 着信メディアを復号するデコーダと復号されたメディアを再生する再生器とを有する受信機において、進行中のVoIP通信セッション中のメディア歪みを軽減する方法であって、
    ‐第1のエンコーダからの着信メディアを受信するステップと、
    ‐前記着信メディアが第2のエンコーダに起因して変更されることを検出するステップと、
    前記第1のエンコーダからの前記着信メディアを復号するために用いられたデコーダによって新たな着信メディアを復号する前に、前記検出された変更に応じて前記デコーダのデコーダ状態をその初期状態にリセットするステップと
    を備えることを特徴とする方法。
  2. 前記変更を検出するステップは、前記第2のエンコーダからのメディアが前記通信セッションに挿入されたことを検出するステップを含むことを特徴とする請求項1に記載の方法。
  3. 前記変更を検出するステップは、前記第1のエンコーダから前記第2のエンコーダへの切り替えを検出するステップを含み、前記新たな着信メディアは前記第2のエンコーダからのメディアを含むことを特徴とする請求項1に記載の方法。
  4. 前記第1のエンコーダから前記第2のエンコーダへの前記切り替えは、遠隔ユーザからのユーザ・メディアとアナウンス・サーバからのアナウンス・メディアとの間の切り替えを含むことを特徴とする請求項3に記載の方法。
  5. 前記変更を検出するステップは、混合メディア・ストリームの寄与エンコーダの変更を検出するステップを含むことを特徴とする請求項1に記載の方法。
  6. 前記変更を検出するステップは、着信メディア・データ内の複数のパケット間のパケット・ヘッダ・フィールドの変更を検出するステップを含むことを特徴とする請求項1に記載の方法。
  7. 前記変更を検出するステップは、通話保留状態の変更を検出するステップを含むことを特徴とする請求項1に記載の方法。
  8. 前記変更を検出するステップは、着信メディア・データ内の複数のパケット間のメディア・エンコーディングの変更を検出するステップを含むことを特徴とする請求項1に記載の方法。
  9. ‐前記受信機内の前記デコーダに関連して提供されるジッタ・バッファに記憶された前記第1のエンコーダからの既存のメディアをすべて再生するステップと、
    ‐前記ジッタ・バッファを再初期化するステップと、
    ‐第2のエンコーダからのメディアを前記ジッタ・バッファにバッファリングするステップとをさらに備え、
    前記デコーダ状態がリセットされた時点で前記バッファリングされたメディアの復号の準備が整うことを特徴とする請求項1に記載の方法。
  10. 前記第1のエンコーダからの前記既存のメディアはフェードアウトを用いてすべて再生され、前記第2のエンコーダからの前記メディアはフェードインを用いてすべて再生されることを特徴とする請求項9に記載の方法。
  11. 前記第1のエンコーダからのメディアと前記第2のエンコーダからのメディアとの間の滑らかな移行を実現するための移行手順を適用するステップをさらに備えることを特徴とする請求項9に記載の方法。
  12. 着信メディアを復号するデコーダと復号されたメディアを再生する再生器とを有する受信機において、進行中のVoIP通信セッション中のメディア歪みを軽減するシステムであって、
    ‐第1のエンコーダからの着信メディアを受信する手段と、
    ‐前記着信メディアが第2のエンコーダに起因して変更されることを検出する手段と、
    前記第1のエンコーダからの前記着信メディアを復号するために用いられたデコーダによって新たな着信メディアを復号する前に、前記検出された変更に応じて前記デコーダのデコーダ状態をその初期状態にリセットする手段と
    を備えることを特徴とするシステム。
  13. 前記変更を検出する手段は、前記第2のエンコーダからのメディアが前記通信セッションに挿入されたことを検出する手段を含むことを特徴とする請求項12に記載のシステム。
  14. 前記変更を検出する手段は、前記第1のエンコーダから前記第2のエンコーダへの切り替えを検出する手段を含み、前記新たな着信メディアは前記第2のエンコーダからのメディアを含むことを特徴とする請求項12に記載のシステム。
  15. 前記第1のエンコーダから前記第2のエンコーダへの前記切り替えは、遠隔ユーザからのユーザ・メディアとアナウンス・サーバからのアナウンス・メディアとの間の切り替えを含むことを特徴とする請求項14に記載のシステム。
  16. 前記変更を検出する手段は、混合メディア・ストリームの寄与エンコーダの変更を検出する手段を含むことを特徴とする請求項12に記載のシステム。
  17. 前記変更を検出する手段は、着信メディア・データ内の複数のパケット間のパケット・ヘッダ・フィールドの変更を検出する手段を含むことを特徴とする請求項12に記載のシステム。
  18. 前記変更を検出する手段は、着信メディア・データ内の複数のパケット間のメディア・エンコーディングの変更を検出する手段を含むことを特徴とする請求項12に記載のシステム。
  19. ‐着信メディアを記憶するために前記デコーダに関連して提供されるジッタ・バッファであって、前記ジッタ・バッファにすでに記憶されている前記第1のエンコーダからの既存のメディアをすべて再生するように前記再生器が動作可能である、ジッタバッファと、
    ‐前記ジッタ・バッファを再初期化する手段と、
    ‐前記第2のエンコーダからのメディアを前記ジッタ・バッファにバッファリングする手段とをさらに備え、
    前記デコーダ状態がリセットされた時点で前記バッファリングされたメディアの復号の準備が整うことを特徴とする請求項12に記載のシステム。
  20. 前記再生器は、フェードアウトを用いて前記既存のメディアをすべて再生するように動作可能であり、フェードインを用いて前記第2のエンコーダからの前記メディアをすべて再生するように動作可能であることを特徴とする請求項19に記載のシステム。
  21. 前記システムは前記受信機内に実装されることを特徴とする請求項12に記載のシステム。
  22. 進行中のVoIP通信セッション中に着信メディアを復号するデコーダを有する受信機であって、
    第1のエンコーダから着信メディアを受信し、第2のエンコーダに起因する前記デコーダで起こり得る状態不一致を検出し、前記状態不一致を避けるため、又は少なくとも歪みを軽減するために、検出された起こり得る状態不一致に応じて、前記第1のエンコーダからの前記着信メディアを復号するために用いられたデコーダによって前記第2のエンコーダからのメディアを復号する前に前記デコーダのデコーダ状態をその初期状態にリセットするように構成されたことを特徴とする受信機。
  23. 前記着信メディアが前記第2のエンコーダに起因して変更されることを検出することによって、前記デコーダ内で起こり得る状態不一致を検出するように構成されたことを特徴とする請求項22に記載の受信機。
  24. 着信メディア・データ内の複数のパケット間のメディア・エンコーディングの変更を検出することによって、前記デコーダ内で起こり得る状態不一致を検出するように構成されたことを特徴とする請求項22に記載の受信機。
  25. 着信メディアを復号するデコーダと復号されたメディアを再生する再生器とを有する受信機におけるメディア歪みを軽減する方法であって、
    ‐第1のエンコーダからのメディアの受信を伴う進行中のVoIP通信セッション中に、第2のエンコーダからのメディアの後続する受信に備えて所定の信号パターンを受信するステップと、
    前記第1のエンコーダからの前記着信メディアを復号するために用いられたデコーダによって前記第2のエンコーダからのメディアを復号する前に、前記所定の信号パターンに応じて前記デコーダのデコーダ状態をその初期状態にリセットするステップと
    を備えることを特徴とする方法。
JP2009540201A 2006-12-08 2007-11-28 効率的なメディアの扱いのための受信機の動作及び実装 Expired - Fee Related JP5528811B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86916006P 2006-12-08 2006-12-08
US60/869,160 2006-12-08
PCT/SE2007/001050 WO2008069722A2 (en) 2006-12-08 2007-11-28 Receiver actions and implementations for efficient media handling

Publications (2)

Publication Number Publication Date
JP2010512105A JP2010512105A (ja) 2010-04-15
JP5528811B2 true JP5528811B2 (ja) 2014-06-25

Family

ID=39492760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009540201A Expired - Fee Related JP5528811B2 (ja) 2006-12-08 2007-11-28 効率的なメディアの扱いのための受信機の動作及び実装

Country Status (5)

Country Link
US (1) US20100080328A1 (ja)
EP (1) EP2105014B1 (ja)
JP (1) JP5528811B2 (ja)
CN (1) CN101601288A (ja)
WO (1) WO2008069722A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016213523A (ja) * 2015-04-28 2016-12-15 日本放送協会 符号化装置、復号装置及びこれらのプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110271307A1 (en) * 2009-12-18 2011-11-03 Tektronix International Sales Gmbh Video data stream evaluation systems and methods
US9635374B2 (en) 2011-08-01 2017-04-25 Apple Inc. Systems and methods for coding video data using switchable encoders and decoders
WO2013091718A1 (en) * 2011-12-22 2013-06-27 Telefonaktiebolaget L M Ericsson (Publ) Method and media handling unit for use in a voip based communications network
CN104272696B (zh) * 2012-04-27 2018-06-01 瑞典爱立信有限公司 驻留在设备上的媒体文件
US9148306B2 (en) * 2012-09-28 2015-09-29 Avaya Inc. System and method for classification of media in VoIP sessions with RTP source profiling/tagging
EP2909990B1 (en) 2012-10-18 2019-01-16 VID SCALE, Inc. Decoding complexity for mobile multimedia streaming
US20160088079A1 (en) * 2014-09-21 2016-03-24 Alcatel Lucent Streaming playout of media content using interleaved media players
KR102338335B1 (ko) * 2015-05-29 2021-12-10 삼성전자주식회사 통화 보류음을 재생하기 위한 방법 및 그 전자 장치
US10841357B1 (en) * 2019-09-12 2020-11-17 Dialpad, Inc. Using transport layer protocol packet headers to encode application layer attributes in an audiovisual over internet protocol (AVoIP) platform
CN113473162B (zh) * 2021-04-06 2023-11-03 北京沃东天骏信息技术有限公司 一种媒体流的播放方法、装置、设备和计算机存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728494A (ja) * 1993-07-09 1995-01-31 Nippon Steel Corp 圧縮符号化音声信号復号化方法および装置
KR100254090B1 (ko) * 1995-02-16 2000-04-15 니시무로 타이죠 기록 매체 재생 장치
US6233389B1 (en) * 1998-07-30 2001-05-15 Tivo, Inc. Multimedia time warping system
US6504826B1 (en) * 1998-08-24 2003-01-07 Hitachi, Ltd. Digital broadcasting receiver
US6581164B1 (en) * 2000-01-03 2003-06-17 Conexant Systems, Inc. System for adjusting clock frequency based upon amount of unread data stored in sequential memory when reading a new line of data within a field of data
JP2002247137A (ja) * 2000-04-25 2002-08-30 Canon Inc 通信装置及び通信方法
JP2002009870A (ja) * 2000-06-20 2002-01-11 Hitachi Kokusai Electric Inc データ伝送装置
JP4551555B2 (ja) * 2000-11-29 2010-09-29 株式会社東芝 符号化データ伝送装置
US20030176198A1 (en) * 2002-03-14 2003-09-18 Chisholm John P. Communication system
US20030212550A1 (en) * 2002-05-10 2003-11-13 Ubale Anil W. Method, apparatus, and system for improving speech quality of voice-over-packets (VOP) systems
US7324736B2 (en) * 2002-10-09 2008-01-29 Lsi Logic Corporation Intelligent recording control system
US7301902B2 (en) * 2003-03-03 2007-11-27 Broadcom Corporation Generic on-chip homing and resident, real-time bit exact tests
JP4364555B2 (ja) * 2003-05-28 2009-11-18 日本電信電話株式会社 音声パケット送信装置とその方法
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
JP4296895B2 (ja) * 2003-10-06 2009-07-15 ソニー株式会社 データ処理装置及び方法
JP2005153722A (ja) * 2003-11-26 2005-06-16 Yazaki Corp タイヤ空気圧検出装置
US20050227657A1 (en) * 2004-04-07 2005-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for increasing perceived interactivity in communications systems
US7609670B2 (en) * 2004-09-29 2009-10-27 MestNetworks, Inc. System and method for performing low-overhead, high spatial reuse medium access control in a wireless network
JP4628798B2 (ja) * 2005-01-13 2011-02-09 Kddi株式会社 通信端末装置
JP4392378B2 (ja) * 2005-04-18 2009-12-24 日本電信電話株式会社 音声符号化選択制御方法
JP4406382B2 (ja) * 2005-05-13 2010-01-27 日本電信電話株式会社 音声符号化選択制御方法
US8045542B2 (en) * 2005-11-02 2011-10-25 Nokia Corporation Traffic generation during inactive user plane

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016213523A (ja) * 2015-04-28 2016-12-15 日本放送協会 符号化装置、復号装置及びこれらのプログラム

Also Published As

Publication number Publication date
WO2008069722A2 (en) 2008-06-12
JP2010512105A (ja) 2010-04-15
EP2105014B1 (en) 2014-08-06
WO2008069722A3 (en) 2008-07-24
EP2105014A2 (en) 2009-09-30
EP2105014A4 (en) 2013-05-15
US20100080328A1 (en) 2010-04-01
CN101601288A (zh) 2009-12-09

Similar Documents

Publication Publication Date Title
JP5528811B2 (ja) 効率的なメディアの扱いのための受信機の動作及び実装
EP2092726B1 (en) Handling announcement media in a communication network environment
JP4426454B2 (ja) 通信リンク間の遅延トレードオフ
JP4367657B2 (ja) 音声通信方法及び装置
EP1782644B1 (en) Interoperability for wireless user devices with different speech processing formats
KR101479393B1 (ko) 대역 내 신호들을 이용한 코덱 전개
US9014028B2 (en) Identifying and transitioning to an improved VOIP session
CN101536088B (zh) 用于提供冗余管理的系统和方法
JP2006238445A (ja) 仮想ジッタ・バッファおよび時間スケール修正を使用した、VoiceoverIP通信ネットワークにおいてネットワーク・ジッタを処理する方法および装置
CN111164946B (zh) 用于适配互联网协议语音通信会话的请求的信令
US20120323568A1 (en) Source Code Adaption Based on Communication Link Quality and Source Coding Delay
RU2658602C2 (ru) Поддержание аудиосвязи в перегруженном канале связи
CN103632671A (zh) 数据编解码方法、装置及数据通信系统
CN101790754B (zh) 用于提供amr-wb dtx同步的系统和方法
CN101272383B (zh) 一种实时音频数据传输方法
EP2408165B1 (en) Method and receiver for reliable detection of the status of an RTP packet stream
WO2008040186A1 (en) A method, system and gateway for negotiating about the ability of the data signal detector
CN101160983B (zh) 一种数据流处理的方法、装置和系统
JPWO2005122455A1 (ja) 双方向通信方法と装置、システムならびにプログラム
WO2007051343A1 (en) A bandwidth adaptive stream medium transmission system of a stream medium serving system and a method thereof
WO2025190692A1 (en) Immersive conversational audio
KR100646308B1 (ko) 패킷망에서의 무선 코덱 송수신 방법
Fredholm et al. Implementing an application for communication and quality measurements over UMTS networks

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111021

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120112

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130702

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130710

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20130726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140416

R150 Certificate of patent or registration of utility model

Ref document number: 5528811

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees