JP6695970B2 - 緩和されたフレーム消去率のための改善された電力利得および容量利得 - Google Patents

緩和されたフレーム消去率のための改善された電力利得および容量利得 Download PDF

Info

Publication number
JP6695970B2
JP6695970B2 JP2018519292A JP2018519292A JP6695970B2 JP 6695970 B2 JP6695970 B2 JP 6695970B2 JP 2018519292 A JP2018519292 A JP 2018519292A JP 2018519292 A JP2018519292 A JP 2018519292A JP 6695970 B2 JP6695970 B2 JP 6695970B2
Authority
JP
Japan
Prior art keywords
frame
threshold
rate
erase
active speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018519292A
Other languages
English (en)
Other versions
JP2019500765A (ja
JP2019500765A5 (ja
Inventor
ヴィヴェク・ラジェンドラン
ダニエル・ジャレッド・シンダー
ヴェンカトラマン・アッティ
サウラバ・タヴィルダール
ニコライ・レオン
アリレザ・ヘイダリ
Original Assignee
クアルコム,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クアルコム,インコーポレイテッド filed Critical クアルコム,インコーポレイテッド
Publication of JP2019500765A publication Critical patent/JP2019500765A/ja
Publication of JP2019500765A5 publication Critical patent/JP2019500765A5/ja
Application granted granted Critical
Publication of JP6695970B2 publication Critical patent/JP6695970B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0203Power saving arrangements in the radio access network or backbone network of wireless communication networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/128Shortest path evaluation for finding disjoint paths
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/23Bit dropping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2416Real-time traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/29Flow control; Congestion control using a combination of thresholds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/32Flow control; Congestion control by discarding or delaying data units, e.g. packets or frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/003Arrangements for allocating sub-channels of the transmission path
    • H04L5/0058Allocation criteria
    • H04L5/006Quality of the received signal, e.g. BER, SNR, water filling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/752Media network packet handling adapting media to network capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Communication Control (AREA)

Description

優先権の主張
本出願は、その全体が参照により本明細書に明確に組み込まれている、2016年9月22日に出願した"IMPROVED POWER GAINS AND CAPACITY GAINS FOR A RELAXED FRAME ERASURE RATE"と題する米国特許出願第15/273,280号、および2015年10月20日に出願した"IMPROVED POWER GAINS AND CAPACITY GAINS FOR A RELAXED FRAME ERASURE RATE"と題する米国仮特許出願第62/244,142号の優先権を主張するものである。
本開示は、一般に、フレーム消去率に関する。
技術の進歩は、より小型で、より強力なコンピューティングデバイスをもたらしてきた。たとえば、現在、小型で軽量であり、ユーザによって容易に携帯される、モバイルフォンおよびスマートフォンなどのワイヤレス電話、タブレット、およびラップトップコンピュータを含む、様々なポータブルパーソナルコンピューティングデバイスが存在する。これらのデバイスは、ワイヤレスネットワークを介して音声パケットおよびデータパケットを通信することができる。さらに、多くのそのようなデバイスは、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤなどの追加の機能を組み込んでいる。また、そのようなデバイスは、インターネットへのアクセスに使用することができるウェブブラウザアプリケーションなどのソフトウェアアプリケーションを含む、実行可能命令を処理することができる。したがって、これらのデバイスは、高度の計算能力を含むことができる。
ソースデバイスは、アクティブフレーム(たとえば、スピーチフレーム)および非アクティブフレームを異なるビットレートで符号化し、符号化フレームを宛先デバイスに送信してもよい。非限定的な例として、第3世代パートナーシッププロジェクト(3GPP)拡張音声サービス(EVS:Enhanced Voice Services)規格によれば、アクティブフレームは、13.2キロビット毎秒(kbps)で符号化されてもよいし、非アクティブフレームは2.4kbpsで符号化されてもよい。前のアクティブフレーム(N-X)の冗長コピー(たとえば、部分的なコピー)は符号化されて、現在アクティブフレーム(N)と組み合わされてもよい。
前のフレームの部分的なコピーを現在フレームに添付することによって、宛先デバイスにおいて不明のアクティブフレームの数(たとえば、フレーム「消去率」)は比較的低くなる場合がある。異なる基準は、通信セッション(たとえば、音声呼)のための異なるフレーム消去率を設定する場合がある。非限定的な例として、EVSチャネル認識モードは、ソースデバイスと宛先デバイスとの間の通信セッションに関して最高で10%のフレーム消去率を容認し、2%のフレーム消去率(商用グレードHD音声サービス)を条件として、適応マルチレート広帯域(AMR-WB:Adaptive Multi-Rate Wideband)と同じ音声品質を依然として配信する場合がある。宛先デバイスにおけるフレーム消去率が、比較的低く、かつEVSチャネル認識モードフレームレートの許容フレーム消去率未満である場合、追加マージン(ドロップフレーム形式)を導入して、2%のフレーム消去率でAMR-WBと同じ音声品質を維持しながら、通信を改善してもよい。下記で説明するように、マージンを使用して、ソースデバイスにおける電力利得、およびソースデバイスと宛先デバイスとを含むシステムの容量利得を改善してもよい。
本明細書で開示する技法の一実装形態によれば、フレーム送信を制御する方法は、第1のデバイスにおいて、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するステップを含む。本方法はまた、フレーム消去率を消去しきい値と比較するステップを含む。本方法は、フレーム消去率が消去しきい値を満たす場合、アクティブスピーチフレームを破棄するステップをさらに含む。
本明細書で開示する技法の別の実装形態によれば、装置は、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するように構成されるレートモニタを含む。本方法はまた、フレーム消去率を消去しきい値と比較するように構成される比較回路を含む。本装置は、フレーム消去率が消去しきい値を満たす場合、アクティブスピーチフレームを破棄するように構成されるアクティブフレーム破棄回路をさらに含む。
本明細書で開示する技法の別の例によれば、非一時的コンピュータ可読媒体は、送信を制御するための命令を含む。これらの命令は、プロセッサによって実行されると、第1のデバイスにおいて、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定することを含む動作をプロセッサに実行させる。本動作はまた、フレーム消去率を消去しきい値と比較することを含む。本動作は、フレーム消去率が消去しきい値を満たす場合、アクティブスピーチフレームを破棄することをさらに含む。
本明細書で開示する技法の別の実装形態によれば、装置は、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するための手段を含む。本装置はまた、フレーム消去率を消去しきい値と比較するための手段と、フレーム消去率が消去しきい値を満たす場合、アクティブスピーチフレームを破棄するための手段とを含む。
本明細書で開示する技法の別の実装形態によれば、通信チャネルに関するブロック誤り率を制御するための方法は、特定のデバイス(たとえば、ネットワークデバイス、第1のデバイス、または第2のデバイス)において、第1のデバイスと第2のデバイスとの間の通信セッションが、拡張音声サービス(EVS)コーダ/デコーダ(コーデック)をサポートすると決定するステップを含む。第1のデバイスおよび第2のデバイスは通信チャネルを介して通信する。本方法はまた、通信セッションがEVSコーデックをサポートするとの決定に応じて、通信チャネルに関するブロック誤り率を増大させるステップを含む。EVSコーデックは様々なモードをサポートしてもよい。非限定的な例として、EVSコーデックはEVSチャネル認識モードをサポートしてもよい。別の非限定的な例として、EVSコーデックは13.2kbps非チャネル認識モードをサポートしてもよい。
フレーム送信を制御するように動作可能であるシステムの特定の例示的実装形態のブロック図である。 フレーム送信を制御するためのプロセスの特定の実装形態のフローチャートである。 フレーム送信を制御するためのプロセスの別の特定の実装形態のフローチャートである。 フレーム送信を制御するための方法のフローチャートである。 フレーム送信を制御するための別の方法のフローチャートである。 フレーム送信を制御するように動作可能であるデバイスの特定の例示的実装形態のブロック図である。 フレーム送信を制御するように動作可能である基地局のブロック図である。
本明細書で使用する「デバイス」という用語は、ワイヤレス通信ネットワークを介した音声および/またはデータ通信に使用されてもよい電子デバイスを指す。デバイスの例には、通信デバイス、セルラーフォン、携帯情報端末(PDA)、ハンドヘルデバイス、ヘッドセット、ワイヤレスモデム、ラップトップコンピュータ、パーソナルコンピュータなどがある。本明細書で説明するデバイスは、1つまたは複数のモバイル電気通信技術に適合してもよい。たとえば、本明細書で説明するデバイスは、第3世代(3G)モバイル電気通信技術、第4世代(4G)モバイル電気通信技術、および/または第5世代(5G)モバイル電気通信技術に適合してもよい。追加または代替として、本明細書で説明するデバイスは、様々な規格(たとえば、ロングタームエボリューション(LTE)ワイヤレス通信規格、LTEアドバンスト(LTE-A)ワイヤレス通信規格、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス(WiMAX)ワイヤレス通信規格、拡張音声サービス(EVS)規格、適応マルチレート広帯域(AMR-WB)規格、LTEダイレクト(LTE-D)ワイヤレス通信規格など)に適合してもよい。
一般的な双方向会話におけるユーザ当たりの平均音声アクティビティは、比較的低い可能性がある。例示的な例として、ユーザは、50%から60%の時間、話している可能性があり、残りの時間はユーザ沈黙に対応することがある。アクティブスピーチは、比較的高いビットレート(たとえば、AMRの場合は12.2kbps、およびEVSの場合は13.2kbps)で符号化されてもよく、非アクティブフレームまたは背景雑音は、比較的低いビットレート(たとえば、2kbps)で間欠送信(DTX)を使用して符号化されてもよい。全二重双方向会話では、DTXの使用は、音声非アクティビティの間に低レートパケット(沈黙記述子またはSIDフレーム)を送信すること、またはNO_DATAまたはブランクフレームに対する送信をスキップすることのいずれかによって節電を実現してもよい。さらに、端末がパケットを送信するためのアクティブ時間は、音声アクティビティに基づいて低減されてもよい。第1の端末における平均音声アクティビティが60%である場合、第1のデバイスにおける送信電力は潜在的におよそ40%だけ低減されてもよい。本明細書で使用する「送信電力(transmit power)」または「送信電力(transmission power)」は、時間平均送信電力、総送信電力、または瞬時送信電力を指す場合がある。
「リンクバジェット」は、ソースデバイスと宛先デバイスとの間の通信リンクがターゲットデータレートに対するブロック誤り率(BLER)を満たす最大パス損失に対応してもよい。BLERは、宛先デバイスにおける受信トランスポートブロック総数に対するエラートランスポートブロック数の比率として表現されてもよい。通信リンクは、EVSチャネル認識モードで比較的高いパス損失を伴って維持可能であり、これは、高いリンクバジェットをもたらすことがある。
さらに、ボイスオーバーロングタームエボリューション(VoLTE:Voice-Over Long-Term Evolution)システムでは、ソースデバイスにおける送信電力を低減させることによって、宛先デバイスにおける信号対雑音比(SNR)を低減させてもよい。固定最大送信電力の場合、電力ヘッドルームの増大によりセルのエッジを外側に移動させることによって、カバレージおよびユーザ機器(UE)電力節約を実現してもよい。代替として、ソースデバイスは比較的高い送信電力を維持することができ、不十分なカバレージエリアにおける音声品質が改善されてもよい。
第1のデバイス(たとえば、送信デバイス)においてパケットを送信しないこと(たとえば、破棄すること)によって、パケット損失率は増大することがある。このシナリオでは、パケットが送信される電力は低減されないことになるが、アクティブ時間の低減により、かつ/または送信数の低減により、第1のデバイスにおける節電が達成されてもよい。したがって、アクティブスピーチ期間の間にDTXを使用してアクティブスピーチパケットをドロップすることによって節電が達成されてもよい。
輻輳および/または不良チャネル状態(たとえば、2%を超えるBLER)の場合、ネットワーク/ゲートウェイ/受信端末は、元のパケットがネットワーク/ゲートウェイ/受信端末に到達しない(または、遅れて到達する)場合、復号のために冗長パケットを送信するように送信端末に要求する場合がある。完全パケット冗長送信は、効果的なネットワーク帯域幅を増大することがある。冗長パケットの可用性によりスピーチ品質を改善することができるが、完全冗長送信による送信電力の増大に伴って、エンドツーエンドレイテンシが増大することがある。別の代替形態は、効果的なネットワーク帯域幅を変更せず、符号化ビットレートを低減させることであってもよい。たとえば、100%の完全パケット冗長送信に対応するために、EVSに関するビットレートが13.2kbpsから7.2kbpsに低減されてもよい。しかしながら、ビットレートの低減はスピーチ品質の低減を有することがある。
EVSチャネル認識モードは、定数ビットレートチャネル(たとえば、13.2kbpsのビットレートチャネル)を使用して動作する。前のパケットの冗長コピーは前のパケットの部分的なコピーであってもよく、前のパケットの冗長コピーは、重要なスピーチフレーム(たとえば、失われた場合、レシーバにおいてかなりの品質上の影響を及ぼすことがあるフレーム)に対して送信されてもよい。一次フレームおよび冗長フレームの結合が定数ビットレートチャネルにフィットするように、一次フレームビットレートを冗長コピー(たとえば、3.6kbps)に対応するように(たとえば、9.6kbpsに)低減させてもよい。一次フレームのビットレート低減は、スピーチ品質全体への影響の低減を確実にするために、(入力スピーチの特性に応じて)ソース制御方式で実行されてもよい。
本明細書で説明する技法は、送信端末のエンコーダにおいていくつかのパケットを選択的にドロップすることを開示する。たとえば、送信端末は、いくつかのパケットを破棄してもよく(たとえば、送信しない)ことができ、エンコーダにおいてフレーム消去を導入してもよく、未送信パケットの部分的なコピーを将来のフレーム内で送信してもよい。未送信パケットの部分的冗長コピーを使用して、受信端末は、送信端末によって送信されないフレームを再構築してもよい。送信端末は、図2Aに関してさらに詳細に説明するように、ソース信号特性とターゲットドロップ率とに基づいて、またはターゲット「オン」タイムに基づいて、パケットを選択的に送信してもよい。代替として、送信端末は固定間隔でパケットを送信しない場合がある。
双方向会話でまたはマルチパーティ会議で、参加している端末(たとえば、ユーザデバイスまたはユーザ機器)は、全二重モードで動作してもよく、部分的冗長性が存在する場合のエンコーダパケットの選択的送信による節電は送信電力を低減することがある。デバイス間(D2D)プッシュツートーク(PTT)グループ通信では、ユーザは、半二重モードで一度に一回通信してもよい。そのようなシナリオでは、部分冗長性がサポートされるとき、アップリンク送信電力を低減させるために、送信端末は、第1のフレームを参加者の第1のグループに選択的に送信しなくてもよく、第2のフレームを参加者の第2のグループに送信しなくてもよく、第3のフレームを参加者の第3のグループに送信しなくてもよい、などである。代替として、端末は、すべてのN-1人の参加者に送信するとき、一定の間隔で送信しなくてもよい。
本明細書で説明する技法は、低減された「オン」タイムによる節電を実現するためにenodeB/ネットワークサイドにも適用されてもよい。(セル当たりのユーザ数の点で)容量利得はまた、低減された平均リソースブロック(RB)消費によりネットワーク上で実現されてもよい。容量利得は、緩和された動的スケジューラ遅延要件によりボイスオーバーロングタームエボリューション(VoLTE)内で実現可能であり(たとえば、enodeB許可は「オン」タイム低減の割合だけ低減されてもよい)、それにより、より多くのユーザまたは他のアプリケーションを追加するためにリソースを解放する。したがって、本明細書で説明する技法は、一般に、ユーザ機器(UE)において実行されるが、これらの技法は、ダウンリンク容量利得を実現するためにネットワークレベルで(たとえば、enodeBにおいて)も実行されてもよいことを了解されたい。これらの技法がUEにおいて実行される場合、アップリンク容量利得が実現されてもよい。
EVS規格のチャネル認識モードは、最高で10%のフレーム誤り率(FER)を容認し、2%のFERでAMR-WBと実質的に同じ音声品質を配信してもよい。したがって、送信端末は、エンコーダにおいて最高で10%のアクティブフレームパケットを破棄(たとえば、ブランキング)してもよい。
パケットドロップ率(たとえば、パケットドロップ割合)または「オン」タイムは、ターゲット容量利得またはターゲット電力低減の関数であってもよい。ターゲット容量利得および/またはターゲット電力低減は、UEにおいて決定されてよく、またはネットワークレベルで決定され、UEに通信されてもよい。(たとえば、高FERシナリオでは)チャネル状態の学習時に、エンコーダは、品質アーティファクトをもたらさないために、何らかのパケットをドロップしない場合がある。代替として、チャネルFERまたは効果的BLERの学習時に、エンコーダは、ドロップすべきパケット(または、ターゲット「オン」タイム)の割合を決定し、音声品質が特定のレベルで、たとえば、2%のフレーム消去率においてAMR-WBでパケットを選択的に送信してもよい。
本明細書で説明する技法は、送信アップリンク電力を低減させるためにオフネットワークD2D PTTセッションにおいて多重ユニキャストアップリンク送信に、送信アップリンク電力を低減させるためにユニキャスト双方向またはマルチユニキャストオフネットワークに、ネットワークカバレージを増大させるためにユニキャスト双方向会話に、容量効率(たとえば、通信セッションに参加することが可能なユーザの数)を増大させるためにユニキャスト双方向会話に、またはそれらの組合せに適用可能であってもよい。
図1を参照すると、フレーム送信を制御するように動作可能であるシステム100が示される。システム100は、ネットワーク150を介して1つまたは複数の他のデバイス(たとえば、第2のデバイス122)と通信している第1のデバイス102を含む。第1のデバイス102は、第1のパス152を使用してネットワーク150を介して第2のデバイス122にデータを送信してもよく、第2のデバイス122は、第2のパス154を使用してネットワーク150を介して第1のデバイス102にデータを送信してもよい。
第1のデバイス102は、第1の逆方向チャネル152a(たとえば、第1の逆方向リンク)および第1の順方向チャネル154b(たとえば、第1の順方向リンク)を介してネットワーク150と通信してもよい。たとえば、第1のデバイス102は、第1の逆方向チャネル152aを使用してネットワーク150にデータを送信してもよく、第1のデバイス102は、第1の順方向チャネル154bを使用してネットワーク150からデータを受信してもよい。第2のデバイス122は、第2の逆方向チャネル154a(たとえば、第2の逆方向リンク)および第2の順方向チャネル152b(たとえば、第2の順方向リンク)を介してネットワーク150と通信してもよい。たとえば、第2のデバイス122は、第2の逆方向チャネル154aを使用してネットワーク150にデータを送信してもよく、第2のデバイス122は、第2の順方向チャネル152bを使用してネットワーク150からデータを受信してもよい。
ネットワーク150は、第1のデバイス102と第2のデバイス122との間でデータを通信するための1つまたは複数の基地局またはアクセスポイントを含んでもよい。本明細書で使用する場合、第1のパス152を介して通信されるデータ(たとえば、パケット、フレーム、オフセット値、肯定応答など)は、第1の逆方向チャネル152aを介して第1のデバイス102からネットワーク150に送信され、第2の順方向チャネル152bを介してネットワーク150から第2のデバイス122において受信されるデータに対応する。同様に、第2のパス154を介して通信されるデータは、第2の逆方向チャネル154aを介して第2のデバイス122からネットワーク150に送信され、第1の順方向チャネル154bを介してネットワーク150から第1のデバイス102において受信されるデータに対応する。
デバイス102、122は、図1に示すものよりも少数または多数の構成要素を含んでもよい。たとえば、デバイス102、122は、1つまたは複数のプロセッサ、1つまたは複数のメモリユニット、または両方を含んでもよい。特定の示される実装形態では、第1のデバイス102および/または第2のデバイス122は、スマートフォン、セルラーフォン、モバイル通信デバイス、タブレット、PDA、またはそれらの組合せであってもよい。そのようなデバイスは、ユーザインターフェース(たとえば、タッチスクリーン、音声認識機能、または他のユーザインターフェース機能)を含んでもよい。
第1のデバイス102は、第1のスピーチボコーダ104と、メモリ105と、レシーバ(RX)106と、トランスミッタ(TX)108とを含む。第1のスピーチボコーダ104は、エンコーダ110と、デジッタバッファ112と、デコーダ114と、比較回路116と、レートモニタ118と、アクティブフレーム破棄回路119とを含む。第2のデバイス122は、第2のスピーチボコーダ124と、メモリ125と、レシーバ(RX)126と、トランスミッタ(TX)128とを含む。第2のスピーチボコーダ124は、エンコーダ130と、デジッタバッファ132と、デコーダ134と、比較回路136と、レートモニタ138と、アクティブフレーム破棄回路139とを含む。
図1に示す例では、第1のデバイス102は「送信端末」であり、第2のデバイス122は「受信端末」である。たとえば、第1のデバイス102は、第2のデバイス122によって受信されるフレームを送信することができる。しかしながら、他の実装形態では、各デバイス102、122は、受信端末および送信端末として同時に動作してもよい。たとえば、第1のデバイス102は、第1のパス152を介して第2のデバイス122にフレームを送信し(たとえば、第1の逆方向チャネル152aを介してネットワーク150にフレームを送信し)、第2のパス154を介して第2のデバイス122からフレームを同時に受信(たとえば、第1の順方向チャネル154bを介してネットワーク150からフレームを受信)してもよい。さらに、第2のデバイス122は、第2のパス154を介して第1のデバイス102にフレームを送信し(たとえば、第2の逆方向チャネル154aを介してネットワーク150にフレームを送信し)、第1のパス152を介して第1のデバイス102からフレームを同時に受信(たとえば、第2の順方向チャネル152bを介してネットワーク150からフレームを受信)してもよい。
第1のスピーチボコーダ104のエンコーダ110は、通信セッション(たとえば、音声呼)の間に第2のデバイス122に送信することがスケジュールされているフレーム内のデータを符号化してもよい。たとえば、エンコーダ110は、第1のフレーム160、第2のフレーム162、第Nのフレーム163などを符号化してもよい。一実装形態によれば、Nは1よりも大きい整数であってもよい。たとえば、Nが45に等しい場合、エンコーダ110は、通信セッションの間に第2のデバイス122に送信することがスケジュールされている45個のフレームを符号化してもよい。各フレーム160、162、163は、アクティブフレーム(たとえば、アクティブスピーチフレーム)または非アクティブフレームとして分類されてもよい。本明細書で使用するアクティブフレームは、音声アクティビティ検出器によって非アクティブであると決定されないフレームを含むことも、またはそれに対応することもある。非限定的な例として、アクティブフレームは、背景雑音に関連するオーディオレベルと比較して、スピーチに関連するより高いオーディオレベルを含むフレームを含んでもよい。一実装形態によれば、アクティブフレームは13.2kbpsで符号化されてもよく、非アクティブフレームは2kbpsで符号化されてもよい。別の実装形態によれば、アクティブフレームは、2.8kbpsから128kbpsの範囲内のビットレートで符号化されてもよい。本明細書で使用する非アクティブフレームは、音声アクティビティ検出器によって非アクティブであると決定されるフレームを含むことも、またはそれに対応することもある。非限定的な例として、非アクティブフレームは、スピーチに関連するオーディオレベルと比較して、背景雑音に関連するより高いオーディオレベルを含むフレームを含んでもよい。
いくつかのフレームは、前のフレームの冗長性情報(たとえば、その部分的なコピー)を含んでもよい。たとえば、前のアクティブフレームの冗長コピーは符号化されて、現在アクティブフレームと組み合わされてもよい。例示のために、第1のフレーム160および第Nのフレーム163はアクティブフレームであってもよく、第1のフレーム160は第1の時点で符号化されてもよく、第Nのフレーム163は、第1の時点の後である第2の時点で符号化されてもよい。第Nのフレーム163(たとえば、現在フレーム)は、送信の間に第1のフレーム(たとえば、前のフレーム)が失われた場合、第2のデバイス122のデコーダ134が、デジッタバッファ132から第Nのフレーム163をフェッチし、第1のフレーム160の部分的なコピーを復号して、第1のフレーム160に関連するスピーチを復元することができるように、第1のフレーム160の部分的なコピーを含んでもよい。一実装形態によれば、総ビットレートが13.2kbpsに等しいように、現在フレーム(たとえば、一次フレーム)のビットレートは9.6kbpsに低減されてもよく、前のフレームの冗長コピーは3.6kbpsで符号化されてもよい。
第1のデバイス102は、第1のデバイス102と第2のデバイス122との間の通信セッションに関する消去しきい値(たとえば、許容フレーム消去率)を決定するように構成されてもよい。本明細書で使用する「消去しきい値」は、通信セッションを維持するため、または通信セッションを比較的高い品質に維持するために満たされるべきドロップアクティブフレーム(または、損失アクティブフレーム)のレートに対応する。非限定的な例として、消去しきい値が10%に等しい場合、通信セッションを維持するために、または比較的高い品質に通信を維持するために、第1のデバイス102のエンコーダ110によって符号化されるあらゆる10個のアクティブフレームのうち9個のアクティブフレームが第2のデバイス122においてデコーダ134によって明らかにされてもよい。
いくつかの実装形態によれば、消去しきい値は、ネットワークレベルで決定(たとえば、enodeB(図示せず)において決定)されてもよく、ネットワーク150を介して第1のデバイス102に通信されてもよい。他の実装形態によれば、消去しきい値は規格によって指定されてもよい。たとえば、EVS規格のチャネル認識モードは、第1のデバイス102と第2のデバイス122との間の通信セッションを維持するために、または通信セッションを比較的高い品質、たとえば、2%のFERでAMR-WBと同じ音声品質に維持するために、最高で10%のフレーム消去率を許容してもよい。別の例として、AMR-WBS規格は、第1のデバイス102と第2のデバイス122との間の通信セッションを維持するために、または通信セッションを比較的高い品質に維持するために、最高で2%のフレーム消去率を許容してもよい。メモリ105は、許容フレーム消去率を示す消去率データ107を記憶することができる。第1のスピーチボコーダ104は、メモリ105から消去率データ107を取り出して、消去しきい値を決定してもよい。以下の説明のために、消去しきい値は、EVSチャネル認識モードに適合して10%に等しいと仮定される。しかしながら、10%は、例示的な非限定的例に過ぎず、限定と理解すべきではないことを理解されたい。
第1のデバイス102はまた、通信セッションに関するフレーム消去率を決定するように構成されてもよい。フレーム消去率は、「リアルタイムトランスポートプロトコル(RTP)損失率」と呼ばれることもある。RTP損失率は、通信セッションの間の損失RTPパケットの割合であってもよい。例示のために、第2のデバイス122のレートモニタ138は、第2のデバイス122におけるアクティブフレームに対して不明のレートを監視してもよい。レートモニタ138は、送信の間にアクティブフレームが失われたかまたはドロップされたレートを決定(たとえば、「フレーム消去率」を決定)してもよい。チャネル状態はフレーム消去率に影響を及ぼすことがある。たとえば、比較的不良なチャネル状態(たとえば、低スループット、チャネル輻輳など)はフレーム消去率を増大することがある。いくつかの実装形態によれば、フレーム消去率は、ある時間期間にわたってアクティブフレームに対して不明の平均数に対応することがあり、またはある時間期間にわたってレシーバに到達しなかったアクティブフレームの平均数に対応することがある。時間期間は、「瞬時」フレーム消去率を決定するために比較的短くてもよい(たとえば、1秒未満であってもよい)。時間期間は、「平均」フレーム消去率を決定するためにより長くてもよい(たとえば、1秒より長くてもよい)。
上記で説明したように、現在フレームは、前のフレームの冗長性情報(たとえば、その部分的なコピー)を含んでもよい。したがって、前のフレームが送信の間に失われた場合、デコーダ134は、現在フレームの冗長性情報を使用して前のフレームを再構築することができる。送信の間に失われたフレームを再構築するために冗長性情報を使用することは、効果的なフレーム誤り率を低減することがある。たとえば、第1のフレーム160が送信の間に失われ、第Nのフレーム163が第1のフレーム160の部分的なコピーを含む場合、デコーダ134は、第Nのフレーム163を使用して第1のフレーム160を再構築することができ、第1のフレーム160は、効果的なフレーム誤り率に関して「失われた」と見なされなくてもよい。レートモニタ138においてフレーム消去率(たとえば、RTP損失率)を決定した後で、第2のデバイス122のトランスミッタ128は、フレーム消去率(たとえば、RTP損失率)を示すレートデータ170を第1のデバイス102のレシーバ106に送信してもよい。
第1のデバイス102はさらに、フレーム消去率を消去しきい値と比較するように構成されてもよい。たとえば、比較回路116は、第2のデバイス122から受信したフレーム消去率を消去率データ107によって示される消去しきい値と比較してもよい。比較に基づいて、第1のスピーチボコーダ104は、そうでなければ第2のデバイス122に送信されることになるアクティブスピーチフレームを破棄するかどうかを判定してもよい。たとえば、フレーム消去率が消去しきい値よりも大きい場合、第1のスピーチボコーダ104は、追加のアクティブスピーチフレーム(または、追加の冗長性情報)を送信して、フレーム消去率を低減させてもよい。いくつかの実装形態によれば、フレーム消去率が消去しきい値よりも高い場合、通信セッションは(不良信号品質などの要因に基づいて)終了することがあり、または低減された品質を有することがある。しかしながら、フレーム消去率が消去しきい値未満である場合、アクティブフレーム破棄回路119は、そうでなければ第2のデバイス122に送信されることになるアクティブスピーチフレームを破棄してもよい。アクティブスピーチフレームを破棄すること(たとえば、アクティブスピーチフレームを送信しないこと)は、第1のデバイス102において送信電力を節約する場合がある。アクティブフレーム破棄回路119(または、スピーチボコーダ104内の他の回路)は、図2Aに関して説明する技法に基づいて、どのアクティブフレームをドロップするかを決定してもよい。
図1のシステム100は、フレーム消去率が消去しきい値未満であるとき、第1のデバイス102がアクティブスピーチフレームを破棄することによって、バッテリー電力を節約することを可能にしてもよい。たとえば、(アクティブスピーチフレームを送信する代わりに)アクティブスピーチフレームを破棄することによって、フレーム消去率が消去しきい値未満であるとき、第1のデバイス102と第2のデバイス122との間の通信セッションの間に、トランスミッタ108に関連するバッテリー消耗を低減させることができる。アクティブスピーチフレームを破棄することはまた、ネットワーク容量(たとえば、セルサイトごとのユーザの数)を増大することがある。
図2Aを参照すると、フレーム送信を制御するためのプロセス200の特定の実装形態のフローチャートが示される。プロセス200は、図1の第1のスピーチボコーダ104の構成要素、図1の第2のスピーチボコーダ124の構成要素、またはそれらの組合せによって実行されてもよい。本明細書で説明するように、プロセス200は、第2のデバイス122に送信するための特定のフレームを選択するために第1のスピーチボコーダ104によって使用される論理を表してもよい。
202において、第1のスピーチボコーダ104は、フレームカウントを1に初期化してもよく、M個のフレーム(TM)を介したターゲット低減カウントを必要とされる低減カウント(TMREQ)に等しく設定してもよい。必要とされる低減カウント(TMREQ)は、ターゲット低減(T)を達成するためにドロップされるべきフレームの数に対応する場合がある。204において、第1のスピーチボコーダ104は、フレームカウントがMよりも大きいかどうかを判定することができ、ここでMは特定の送信ウィンドウ内のフレームの数である。一実装形態によれば、Mはスピーチボコーダ104においてランダムに決定されてもよい。フレームカウントがMよりも大きい場合、206において、第1のスピーチボコーダ104は、調整値(ADJ)を必要とされる低減カウント(TMREQ)とM個のフレームを介して達成される実際の低減カウント(AM)との間の差に等しく設定してもよい(たとえば、ADJ=TMREQ-AM)。調整値を設定した後で、第1のスピーチボコーダ104は、必要とされる低減カウント(TMREQ)をM個のフレーム(TM)を介したターゲット低減カウントと調整値(ADJ)の和に相当するように修正してもよい(たとえば、TMREQ=TM+ADJ)。第1のスピーチボコーダ104はまた、フレームカウントを1にリセットしてもよい。
206において、フレームカウントがM以下である場合、208において、第1のスピーチボコーダ104は必要とされる低減カウント(TMREQ)がゼロに等しいかどうかを判定してもよい。208において、必要とされる低減カウント(TMREQ)がゼロに等しい場合、210において、第1のスピーチボコーダ104は現在フレーム(N)の送信を開始してもよい。たとえば、エンコーダ110は現在フレーム(N)内のデータを符号化することができ、トランスミッタ108は、第1のパス152を介して第2のデバイス122に現在フレーム(N)を送信してもよい。208において、必要とされる低減カウント(TMREQ)がゼロに等しくない場合、212において、第1のスピーチボコーダ104は、前のフレーム(N-3)の部分的なコピーが現在フレーム(N)に含まれているか(たとえば、添付されているか)どうかを決定してもよい。プロセス図200によれば、現在フレームが、現在フレームのシーケンス番号から3だけオフセットされたシーケンス番号を有する、前に送られたフレームの冗長性情報を含むことができるように、順方向誤り訂正(FEC)オフセットは3に等しくてもよい。第1のスピーチボコーダ104は、FECオフセットに基づいて、前のフレーム(N-3)の部分的なコピーが現在フレーム(N)に含まれているかどうかを判定してもよい。たとえば、前のフレーム(N-3)と現在フレーム(N)との間のオフセットがFECオフセットに等しい場合、第1のスピーチボコーダ104は、前のフレーム(N-3)の部分的なコピーが現在フレーム(N)に含まれていると判定してもよい。プロセス200に示すFECオフセットは、非限定的な例の例示に過ぎず、限定として解釈されるべきではないことを理解されたい。
212において、前のフレーム(N-3)の部分的なコピーが現在フレーム(N)に含まれている場合、214において、第1のスピーチボコーダ104は、前のフレーム(N-3)の完全なコピーが第2のデバイス122に送られたかどうかを判定してもよい。たとえば、第1のスピーチボコーダ104が前のフレーム(N-3)を破棄するコマンドを発行しなかった場合、第1のスピーチボコーダ104は、前のフレーム(N-3)の完全なコピーが第2のデバイス122に送られたと判定してもよい。214において、前のフレーム(N-3)の完全なコピーが第2のデバイス122に送られた場合、第1のスピーチボコーダ104は、216において、現在フレーム(N)の臨界値(NCRIT)を第1のしきい値(CT1)と比較してもよく、前のフレーム(N-3)の臨界値((N-3)CRIT)を第2のしきい値(CT2)と比較してもよい。本明細書で使用する「臨界値」は、特定のフレーム内のスピーチのレベルを示す。たとえば、フレームが比較的高い臨界値を有する場合、そのフレームは、多くのスピーチを含む可能性があり、重要性が比較的高いものであってもよい。フレームが比較的低い臨界値を有する場合、そのフレームは、多くの背景雑音を含む可能性があり、重要性が比較的小さい可能性がある。臨界値(NCRIT)が第1のしきい値(CT1)未満であり、臨界値((N-3)CRIT)が第2のしきい値(CT2)未満である場合、224において、第1のスピーチボコーダ104は現在フレーム(N)を破棄してもよい。臨界値(NCRIT)が第1のしきい値(CT1)以上であるか、または臨界値((N-3)CRIT)が第2のしきい値(CT2)以上である場合、220において、第1のスピーチボコーダ104は現在フレーム(N)の送信を開始してもよく、送信されるフレームの数を低減させるためにしきい値(CT1、CT2)をインクリメントさせてもよい。たとえば、しきい値(CT1、CT2)が高ければ高いほど、第2のデバイス122に送信されるフレームの数は少なくなる。しきい値(CT1、CT2)は初期化され、第1のスピーチボコーダ104によって調整されてもよい。しきい値(CT1、CT2)の初期化は、オーディオソースの特性に基づいて実行されてもよい。たとえば、クリーンスピーチはしきい値の第1のセットに初期化されてよく、雑音の多いスピーチはしきい値の第2のセットに初期化されてよく、音楽はしきい値の第3のセットに初期化されてもよい、などである。現在フレーム(N)を送信した後で、222において、第1のスピーチボコーダ104はフレームカウントを1だけインクリメントさせてもよい。
214において、前のフレーム(N-3)の完全なコピーが第2のデバイス122に送られなかった場合、220において、第1のスピーチボコーダ104は、現在フレーム(N)の送信を開始してもよく、しきい値(CT1、CT2)をインクリメントさせてもよい。現在フレーム(N)を送信した後で、222において、第1のスピーチボコーダ104はフレームカウントを1だけインクリメントさせてもよい。212において、前のフレーム(N-3)の部分的なコピーが現在フレーム(N)に含まれていない場合、218において、第1のスピーチボコーダ104は、現在フレーム(N)の臨界値(NCRIT)を第3のしきい値(CT3)と比較してもよい。臨界値(NCRIT)が第3のしきい値(CT3)以上である場合、220において、第1のスピーチボコーダ104は現在フレーム(N)の送信を開始してもよく、送信されるフレームの数を低減させるためにしきい値(CT1、CT2、CT3)をインクリメントさせてもよい。臨界値(NCRIT)が第3のしきい値(CT1)未満である場合、224において、第1のスピーチボコーダ104は現在フレーム(N)を破棄してもよい。
これにより、図2Aのプロセス200は、第1のスピーチボコーダ104が、フレーム消去率が消去しきい値未満であるときに破棄するアクティブフレームを選択することを可能にしてもよい。プロセス200によれば、しきい値(CT1、CT2、CT3)が比較的高い場合、比較的多数のフレームを破棄してもよい。一実装形態によれば、第1および第2のしきい値(CT1、CT2)は、第3のしきい値(CT3)よりも低くてもよい。前のフレーム(N-3)の部分的なコピーが現在フレーム(N)に含まれない場合、より多くの数のフレームを破棄するために第3のしきい値(CT3)を第1および第2のしきい値(CT1、CT2)よりも頻繁にインクリメントさせてもよい。
図2Bを参照すると、フレーム送信を制御するためのプロセス250の特定の実装形態のフローチャートが示される。プロセス250は、図1の第1のスピーチボコーダ104の構成要素、図1の第2のスピーチボコーダ124の構成要素、またはそれらの組合せによって実行されてもよい。本明細書で説明するように、プロセス250は、第2のデバイス122に送信するための特定のフレームを選択するために第1のスピーチボコーダ104によって使用される論理を表してもよい。プロセス250は、図2Aのプロセス200と連携して実装されてもよい。
252において、第1のスピーチボコーダ104は、M個のフレーム上のターゲット破棄率(TDR:target discard rate)を決定してもよい。ターゲット破棄率(TDR)は、M個のフレームごとに破棄されてもよいフレーム数に対応する場合がある。非限定的な例として、ターゲット破棄率(TDR)が10%に等しく、Mが100に等しい場合、第1のスピーチボコーダ104は100個のフレームのうち10個のフレームを破棄してもよい。下記で説明するように、プロセス250は、図2Aに関して説明したしきい値(CT1、CT2、CT3)を選択的に低減させることによって、100個のフレームにわたって10個のフレームを拡散するための機構を提供してもよい。
ターゲット破棄率(TDR)を決定した後で、254において、第1のスピーチボコーダ104は、実際の破棄率(ADR:actual discard rate)をゼロに設定(または、リセット)することができ、フレームカウントを1に設定してもよい。さらに、図2Aのプロセス200に関して説明したように、第1のスピーチボコーダ104はしきい値(CT1、CT2、CT3)を初期値に設定(または、リセット)してもよい。256において、フレームカウントがMよりも大きい場合、254において、第1のスピーチボコーダ104は、実際の破棄率(ADR)をゼロにリセットし直すことができ、フレームカウントを1にリセットし直してもよい。代替として、256において、フレームカウントがM以下である場合、第1のスピーチボコーダ104は、図2のプロセス200に関して説明した技法に基づいて、258において、現在フレーム(N)を送信または破棄してもよい。
260において、第1のスピーチボコーダ104は、フレームカウントに対して実際の破棄率(ADR)を更新してもよい。非限定的な例として、2個のフレームが破棄されており、現在フレームカウントが10(たとえば、カウント=10)である場合、第1のスピーチボコーダ104は、実際の破棄率(ADR)を20%に更新してもよい。262において、第1のスピーチボコーダ104は、実際の破棄率(ADR)がターゲット破棄率(TDR)の特定の割内(X)範囲内であるかどうかを判定してもよい。非限定的な例として、ターゲット破棄率(TDR)は10%であってよく、特定の割合(X)は5%であってもよい。この例では、実際の破棄率(ADR)が5%から15%の間である場合、第1のスピーチボコーダ104は、実際の破棄率(ADR)がターゲット破棄率(TDR)の特定の割合(X)範囲内であると判定してもよい。
262において、実際の破棄率(ADR)がターゲット破棄率(TDR)の特定の割合範囲内でない場合、266において、第1のスピーチボコーダ104はしきい値(CT1、CT2、CT3)を低減させてもよい。図2Aに関して説明したように、しきい値(CT1、CT2、CT3)を低減させることは、結果として、第1のスピーチボコーダ104により少ないフレームを破棄させることがある。したがって、しきい値(CT1、CT2、CT3)を低減させることは、結果として、比較的多数のフレームを最初に破棄し、フレームカウントがMに近づくにつれて、比較的少数のフレームを破棄するのとは対照的に、破棄されるフレームをM個のフレームにわたって拡散させることがある。266において、しきい値(CT1、CT2、CT3)を低減させた後で、264において、第1のスピーチボコーダ104はフレームカウントを1だけインクリメントさせることがある。262において、実際の破棄率(ADR)がターゲット破棄率(TDR)の特定の割合範囲内である場合、第1のスピーチボコーダ104はしきい値(CT1、CT2、CT3)の調整をバイパスすることができ、264において、フレームカウントを1だけインクリメントさせることがある。
図2Bのプロセス250は、比較的多数のフレームを最初に破棄し、フレームカウントがMに近づくにつれて、比較的少数のフレームを破棄するのとは対照的に、破棄されるフレームをM個のフレームにわたって拡散させる技法を実装してもよい。破棄されるフレームをM個のフレームにわたって分布することは、フレームドロップがクラスタ化されるシナリオを低減させることによって、オーディオ品質を維持する。たとえば、ターゲット破棄率(TDR)が10%であり、Mが100%である場合、図2Bの技法は、破棄されるべき10個のフレームが拡散され、すべてが連続的にまたは小さな時間窓内で破棄されないような機構を提供してもよい。
図3Aを参照すると、フレーム送信を制御するための方法300の特定の実装形態が示される。方法300は、図1の第1のデバイス102の構成要素、図1の第2のデバイス122の構成要素、またはそれらの組合せによって実行されてもよい。
方法300は、302において、第1のデバイスにおいて、第1のデバイスと第2のデバイスとの間の通信セッションに関する許容フレーム消去率(たとえば、消去しきい値)を決定するステップを含む。たとえば、図1を参照すると、第1のデバイス102は、第1のデバイス102と第2のデバイス122との間の通信セッションに関する消去しきい値を決定してもよい。消去しきい値は規格によって指定されてもよい。たとえば、EVS規格のチャネル認識モードは、第1のデバイス102と第2のデバイス122との間の通信セッションを維持するために最高で10%のフレーム消去率を許容することがある。別の例として、AMR-WBS規格は、第1のデバイス102と第2のデバイス122との間の通信セッションを維持するために最高で2%のフレーム消去率を許容することがある。メモリ105は、消去しきい値を示す消去率データ107を記憶してもよい。第1のスピーチボコーダ104は、メモリ105から消去率データ107を取り出して、消去しきい値を決定してもよい。
304において、通信セッションに関するフレーム消去率を決定してもよい。たとえば、図1を参照すると、第1のデバイス102は、通信セッションに関するフレーム消去率を決定してもよい。たとえば、第2のデバイス122のレートモニタ138は、第2のデバイス122におけるアクティブフレームに対して不明のレートを監視してもよい。たとえば、レートモニタ138は、アクティブフレームが送信の間に失われたかまたはドロップされたレートを決定してもよい。レートモニタ138においてフレーム消去率を決定した後で、第2のデバイス122のトランスミッタ128は、フレーム消去率を示すレートデータ170を第1のデバイス102のレシーバ106に送信してもよい。
306において、フレーム消去率を許容フレーム消去率と比較してもよい。たとえば、図1を参照すると、第1のデバイス102は、フレーム消去率を消去しきい値と比較してもよい。たとえば、比較回路116は、第2のデバイス122から受信したフレーム消去率を消去率データ107によって示される消去しきい値と比較してもよい。
方法300は、308において、比較に基づいて、第2のデバイスに送信することがスケジュールされたアクティブスピーチフレームを破棄するかどうかを判定するステップをさらに含んでもよい。たとえば、図1を参照すると、比較に基づいて、第1のスピーチボコーダ104は、第2のデバイス122に送信することがスケジュールされたアクティブスピーチを破棄するかどうかを判定してもよい。たとえば、フレーム消去率が消去しきい値以上である場合、第1のスピーチボコーダ104は、追加のアクティブスピーチフレーム(または、追加の冗長性情報)を送信して、フレーム消去率を低減させてもよい。いくつかの実装形態によれば、フレーム消去率が消去しきい値以上である場合、通信セッションは終了してもよい。しかしながら、フレーム消去率が消去しきい値未満である場合、第1のスピーチボコーダ104は、第2のデバイス122に送信することがスケジュールされたアクティブスピーチフレームを破棄してもよい。アクティブスピーチフレームを破棄すること(たとえば、アクティブスピーチフレームを送信しないこと)は、第1のデバイス102において送信電力を節約する場合がある。
一実装形態によれば、方法300は、フレーム消去率が消去しきい値未満である場合、特定のアクティブスピーチフレームを破棄するかどうかを判定するステップを含んでもよい。特定のアクティブスピーチフレームを破棄するかどうかを判定するステップは、その特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含むかどうかを判定するステップを含んでもよい。
特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含むとの判定に応じて、方法300は、第2のデバイスに前のフレームが送信されたかどうかを判定するステップを含んでもよい。第2のデバイスに前のフレームが送信されなかった場合、方法300は、第2のデバイスにその特定のアクティブスピーチフレームを送信するステップを含んでもよい。第2のデバイスに前のフレームが送信された場合、方法300は、特定のアクティブスピーチフレームの第1の臨界値を第1のしきい値と比較し、前のフレームの第2の臨界値を第2のしきい値と比較するステップを含んでもよい。第1の臨界値が第1のしきい値以上である場合、または第2の臨界値が第2のしきい値以上である場合、方法300は、第2のデバイスにその特定のアクティブスピーチフレームを送信するステップを含んでもよい。第1の臨界値が第1のしきい値未満であり、第2の臨界値が第2のしきい値未満である場合、方法300は、その特定のアクティブスピーチフレームを破棄するステップを含んでもよい。
特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含まないとの判定に応じて、方法300は、特定のアクティブスピーチフレームの第1の臨界値が第3のしきい値未満であるかどうかを判定するステップを含んでもよい。方法300は、第1の臨界値が第3のしきい値以上である場合、第2のデバイスに特定のアクティブスピーチフレームを送信するステップを含んでもよい。方法300はまた、第1の臨界値が第3のしきい値未満である場合、特定のアクティブスピーチフレームを破棄するステップを含んでもよい。
図3Bを参照すると、フレーム送信を制御するための方法350の特定の実装形態が示される。方法350は、図1の第1のデバイス102の構成要素、図1の第2のデバイス122の構成要素、またはそれらの組合せによって実行されてもよい。
方法350は、352において、第1のデバイスにおいて、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するステップを含む。たとえば、図1を参照すると、第1のデバイス102は、第1のデバイス102と第2のデバイス122との間の通信セッションに関するフレーム消去率を決定してもよい。他の実装形態では、追加のデバイスを通信セッション内に含めてもよい。非限定的な例として、第3のデバイスを通信セッション内に含めてもよい。第1のデバイス102は、ユーザエンドデバイス、enodeBデバイス、またはもう1つの他の通信デバイスであってもよい。
方法350はまた、354において、フレーム消去率を消去しきい値と比較するステップを含む。たとえば、図1を参照すると、比較回路116は、第2のデバイス122から受信したフレーム消去率を消去率データ107によって示される消去しきい値と比較してもよい。一実装形態によれば、方法350は、フレーム消去率を消去しきい値と比較する前に、消去しきい値を示す信号を受信するステップを含んでもよい。たとえば、ネットワークデバイス(たとえば、enodeB)は、消去しきい値を決定し、(消去しきい値を示す)信号を第1のデバイス102に送信してもよい。別の実装形態によれば、第1のデバイス102は、消去しきい値を示すデータ(たとえば、消去率データ107)を記憶してもよい。別の実装形態によれば、第1のデバイス102は、アルゴリズムに基づいて消去しきい値を決定してもよい。別の実装形態によれば、方法350は、フレーム消去率を示す信号を受信するステップを含んでもよい。信号は、第2のデバイス122から受信されてもよい。たとえば、第2のデバイス122は、デバイス102と122との間の通信セッションに関するフレーム消去率を決定し、(フレーム消去率を示す)信号を第1のデバイス102に送信してもよい。
方法350はまた、356において、フレーム消去率が消去しきい値を満たす場合、アクティブスピーチフレームを破棄するステップを含む。いくつかの実装形態によれば、フレーム消去率が消去しきい値未満である場合、フレーム消去率は消去しきい値を満たす。たとえば、図1を参照すると、フレーム消去率が消去しきい値を満たす場合、第1のスピーチボコーダ104は、そうでなければ第2のデバイス122に送信されることになるアクティブスピーチフレームを破棄してもよい。たとえば、アクティブフレーム破棄回路119は、第2のデバイス122に送られるべきスピーチフレームのキューからアクティブスピーチフレームを除去してもよい。アクティブスピーチフレームをキューから除去した後で、アクティブフレーム破棄回路119はアクティブスピーチフレームを消去(たとえば、破棄)してもよい。したがって、アクティブスピーチフレームを破棄することは、第1のデバイス102における送信電力を低減させるために、アクティブスピーチフレームの送信をバイパスするステップを含む。一実装形態によれば、第1のデバイス102における節電を増大させるために、かつリンクバジェット利得を改善するために、通信セッションに関するブロック誤り率を低減させてもよい。
図3A〜図3Bの方法300、350は、フレーム消去率が消去しきい値未満であるとき、第1のデバイス102がアクティブスピーチフレームを破棄することによって、バッテリー電力を節約することを可能にしてもよい。たとえば、(アクティブスピーチフレームを送信する代わりに)アクティブスピーチフレームを破棄することによって、フレーム消去率が消去しきい値未満であるとき、第1のデバイス102と第2のデバイス122との間の通信セッションの間に、トランスミッタ108に関連するバッテリー消耗を低減させてもよい。
図3A〜図3Bの方法300、350は、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、中央処理装置(CPU)のような処理ユニット、デジタル信号プロセッサ(DSP)、コントローラ、別のハードウェアデバイス、ファームウェアデバイス、またはこれらの任意の組合せによって実施されてもよい。たとえば、図3A〜図3Bの方法300、350は、図4に関して説明するように、命令を実行するプロセッサによって実行されてもよい。
本開示の一実装形態によれば、特定の方法または通信チャネルに関するブロック誤り率を制御するステップは、ネットワークデバイスにおいて、第1のデバイスと第2のデバイスとの間の通信セッションがEVSチャネル認識モードをサポートすると決定するステップを含む。第1のデバイスおよび第2のデバイスは、通信チャネルを介して通信してもよい。たとえば、図1を参照すると、ネットワークデバイス(たとえば、第1のデバイス102、第2のデバイス122、または別のネットワークデバイス)は、デバイス102と122との間の通信セッションがEVSチャネル認識モードをサポートすると決定してもよい。
特定の方法はまた、通信セッションがEVSコーデックをサポートするとの決定に応じて、通信チャネルに関するブロック誤り率を増大させるステップを含む。たとえば、図1を参照すると、ネットワークデバイス(たとえば、第1のデバイス102、第2のデバイス122、または別のネットワークデバイス)は、デバイス102と122との間の通信セッションがEVSチャネル認識コーデックをサポートするとの決定に応じて、通信チャネルに関するブロック誤り率を増大させてもよい。EVSコーデックは様々なモードをサポートしてもよい。非限定的な例として、EVSコーデックはEVSチャネル認識モードをサポートしてもよい。別の非限定的な例として、EVSコーデックは13.2kbps非チャネル認識モードをサポートしてもよい。特定の方法は、ブロック誤り率を増大させることによって、通信セッションに関するリンクバジェット利得/カバレージを改善すること(たとえば、増大させること)ができる。
図4を参照すると、フレーム送信を制御するように動作可能であるデバイス400(たとえば、ワイヤレス通信デバイス)の特定の例示的な実装形態のブロック図が示される。様々な実装形態では、デバイス400は、図4に示すよりも多数または少数の構成要素を有してもよい。例示的な実装形態では、デバイス400は、図1の第1のデバイス102または図1の第2のデバイス122に対応してもよい。例示的な実装形態では、デバイス400は、図2Aのプロセス200、図2Bのプロセス250、図3A〜図3Bの方法300、350、またはそれらの組合せに従って動作してもよい。
特定の実装形態では、デバイス400はプロセッサ406(たとえば、CPU)を含む。デバイス400は、1つまたは複数のさらなるプロセッサ410(たとえば、1つまたは複数のDSP)を含んでもよい。プロセッサ410は、第1のスピーチボコーダ104を含んでもよい。代替実装形態では、第1のスピーチボコーダ104は、CPU(たとえば、プロセッサ406)など、異なるタイプのプロセッサ内に含まれてもよい。
デバイス400は、メモリ452とコーデック434とを含んでもよい。メモリ452は、プロセッサ410によって実行可能な命令456を含んでもよい。デバイス400は、トランシーバ450を介してアンテナ442に結合されるワイヤレスコントローラ440を含んでもよい。特定の実装形態では、トランシーバ450は、図1のレシーバ106、トランスミッタ108、または両方を含んでもよい。
デバイス400は、ディスプレイコントローラ426に結合されるディスプレイ428を含んでもよい。デバイス400はまた、コーデック434に結合されるマイクロフォン446とスピーカー448とを含んでもよい。コーデック434は、デジタルアナログ変換器402とアナログデジタル変換器404とを含んでもよい。ある特定の実装形態では、コーデック434は、マイクロフォン446からアナログ信号を受信し、アナログデジタル変換器404を使用してアナログ信号をデジタル信号に変換し、デジタル信号を第1のスピーチボコーダ104に提供してもよい。第1のスピーチボコーダ104はデジタル信号を処理してもよい。特定の実装形態では、第1のスピーチボコーダ104は、コーデック434にデジタル信号を提供してもよい。コーデック434は、デジタルアナログ変換器402を使用してデジタル信号をアナログ信号に変換してもよく、スピーカー448にアナログ信号を提供してもよい。特定の実装形態では、コーデック434は、利得制御およびパラメータ調整などの機能を実行するオーディオ処理のためのアナログフロントエンドを表す。
第1のスピーチボコーダ104は、本明細書で説明するような技法に関連してハードウェアを実装するために使用されてもよい。代替または追加として、ソフトウェア(または、結合したソフトウェア/ハードウェア)は本明細書で説明する技法に関連して実装されてもよい。たとえば、メモリ452は、図2Aのプロセス200、図2Bのプロセス250、図3A〜図3Bの方法300、350、またはそれらの組合せを実行するために、プロセッサ410またはデバイス400の他の処理ユニット(たとえば、プロセッサ406、コーデック434、または両方)によって実行可能な命令456を含んでもよい。
特定の実装形態では、デバイス400は、システムインパッケージまたはシステムオンチップデバイス422内に含まれてもよい。特定の実装形態では、メモリ452、プロセッサ406、プロセッサ410、ディスプレイコントローラ426、コーデック434、およびワイヤレスコントローラ440は、システムインパッケージまたはシステムオンチップデバイス422内に含まれる。ある特定の実装形態では、入力デバイス430および電源444が、システムオンチップデバイス422に結合される。その上、特定の実装形態では、図4に示すように、ディスプレイ428、入力デバイス430、スピーカー448、マイクロフォン446、アンテナ442、および電源444は、システムオンチップデバイス422の外部にある。特定の実装形態では、ディスプレイ428、入力デバイス430、スピーカー448、マイクロフォン446、アンテナ442、および電源444の各々は、インターフェースまたはコントローラなどの、システムオンチップデバイス422の構成要素に結合されてもよい。デバイス400は、モバイル通信デバイス、スマートフォン、セルラーフォン、タブレット、PDA、またはそれらの何らかの組合せを含んでもよい。
説明する実装形態に関連して、装置は、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するための手段を含む。たとえば、フレーム消去率を決定するための手段は、図1および図4の第1のスピーチボコーダ104、図1のメモリ105、図1の第2のスピーチボコーダ124、図4のプロセッサ406、図4のプロセッサ410、図4のコーデック434、またはそれらの何らかの組合せを含んでもよい。
本装置はまた、フレーム消去率を消去しきい値と比較するための手段を含んでもよい。たとえば、フレーム消去率を消去しきい値と比較するための手段は、図1および図4の第1のスピーチボコーダ104、図1の比較回路116、図1の第2のスピーチボコーダ124、図1の比較回路136、図4のプロセッサ406、図4のプロセッサ410、図4のコーデック434、またはそれらの何らかの組合せを含んでもよい。
本装置は、フレーム消去率が消去しきい値を満たす場合、アクティブスピーチフレームを破棄するための手段をさらに含んでもよい。たとえば、アクティブスピーチフレームを破棄するための手段は、図1および図4の第1のスピーチボコーダ104、図1のアクティブフレーム破棄回路119、図1の第2のスピーチボコーダ124、図4のプロセッサ406、図4のプロセッサ410、図4のコーデック434、またはそれらの何らかの組合せを含んでもよい。
図5を参照すると、基地局500の特定の例示的な例のブロック図が示される。様々な実装形態では、基地局500は、図5に示すより多数の構成要素または少数の構成要素を有してもよい。例示的な例では、基地局500は、図1のシステム100を含んでもよい。例示的な例では、基地局500は、図3Aの方法300、図3Bの方法350、またはそれらの組合せに従って動作してもよい。
基地局500は、ワイヤレス通信システムの一部であってもよい。ワイヤレス通信システムは、複数の基地局と複数のワイヤレス通信デバイスとを含んでもよい。ワイヤレス通信システムは、ロングタームエボリューション(LTE)システム、符号分割多元接続(CDMA)システム、モバイル通信用グローバルシステム(GSM(登録商標):Global System for Mobile Communications)システム、ワイヤレスローカルエリアネットワーク(WLAN)システム、または何らかの他のワイヤレスシステムであってもよい。CDMAシステムは、広帯域CDMA(WCDMA(登録商標))、CDMA 1X、エボリューションデータオプティマイズド(EVDO:Evolution-Data Optimized)、時分割同期CDMA(TD-SCDMA:Time Division Synchronous CDMA)、またはCDMAの何らかの他のバージョンを実装する場合がある。
ワイヤレスデバイスは、ユーザ機器(UE)、移動局、端末、アクセス端末、加入者ユニット、局などと呼ばれる場合もある。ワイヤレスデバイスには、セルラーフォン、スマートフォン、タブレット、ワイヤレスモデム、携帯情報端末(PDA)、ハンドヘルドデバイス、ラップトップコンピュータ、スマートブック、ネットブック、タブレット、コードレスフォン、ワイヤレスローカルループ(WLL)局、Bluetooth(登録商標)デバイスなどが含まれる場合がある。ワイヤレスデバイスは、図4のデバイス400を含むことも、またはそれに対応することもある。
メッセージおよびデータ(たとえば、オーディオデータ)を送受信することなどの様々な機能は、基地局500の1つまたは複数の構成要素によって(かつ/または図示されていない他の構成要素において)実行されてもよい。特定の例では、基地局500はプロセッサ506(たとえば、CPU)を含む。基地局500はトランスコーダ510を含んでもよい。トランスコーダ510はオーディオコーデック508を含んでもよい。たとえば、トランスコーダ510は、オーディオコーデック508の演算を実行するように構成される1つまたは複数の構成要素(たとえば、回路)を含んでもよい。別の例として、トランスコーダ510は、1つまたは複数のコンピュータ可読命令を実行して、オーディオコーデック508の演算を実行するように構成されてもよい。オーディオコーデック508はトランスコーダ510の構成要素として示されるが、他の例では、オーディオコーデック508の1つまたは複数の構成要素が、プロセッサ506、別の処理構成要素、またはそれらの組合せの中に含まれる場合がある。たとえば、ボコーダデコーダ538は、レシーバデータプロセッサ564内に含まれる場合がある。別の例として、ボコーダエンコーダ536は、送信データプロセッサ567内に含まれる場合がある。
トランスコーダ510は、2つ以上のネットワークの間でメッセージおよびデータをトランスコーディングするように機能することができる。トランスコーダ510は、メッセージおよびオーディオデータを第1のフォーマット(たとえば、デジタルフォーマット)から第2のフォーマットに変換するように構成されてもよい。例示のために、ボコーダデコーダ538は、第1のフォーマットを有する符号化信号を復号することができ、ボコーダエンコーダ536は、復号信号を、第2のフォーマットを有する符号化信号に符号化することができる。追加または代替として、トランスコーダ510は、データレート適応を実行するように構成されてもよい。たとえば、トランスコーダ510は、オーディオデータのフォーマットを変更せずに、データレートをダウンコンバートするか、またはデータレートをアップコンバートしてもよい。例示のために、トランスコーダ510は、64kbit/s信号を16kbit/s信号にダウンコンバートする場合がある。
オーディオコーデック508は、ボコーダエンコーダ536とボコーダデコーダ538とを含んでもよい。ボコーダエンコーダ536は、図4を参照して説明したように、エンコーダセレクタと、スピーチエンコーダと、音楽エンコーダとを含んでもよい。ボコーダデコーダ538は、デコーダセレクタと、スピーチデコーダと、音楽デコーダとを含んでもよい。
基地局500はメモリ532を含んでもよい。コンピュータ可読ストレージデバイスなどのメモリ532は命令を含んでもよい。命令は、図3Aの方法300、図3Bの方法350、またはそれらの組合せを実行するように、プロセッサ506、トランスコーダ510、またはそれらの組合せによって実行可能な1つまたは複数の命令を含んでもよい。基地局500は、アンテナのアレイに結合される、第1のトランシーバ552および第2のトランシーバ554など、複数のトランスミッタおよびレシーバ(たとえば、トランシーバ)を含んでもよい。アンテナのアレイは、第1のアンテナ542と第2のアンテナ544とを含んでもよい。アンテナのアレイは、図4のデバイス400などの1つまたは複数のワイヤレスデバイスとワイヤレス通信するように構成されてもよい。たとえば、第2のアンテナ544は、ワイヤレスデバイスからデータストリーム514(たとえば、ビットストリーム)を受信してもよい。データストリーム514は、メッセージ、データ(たとえば、符号化スピーチデータ)、またはそれらの組合せを含んでもよい。
基地局500は、バックホール接続などのネットワーク接続560を含む場合がある。ネットワーク接続560は、ワイヤレス通信ネットワークのコアネットワークまたは1つもしくは複数の基地局と通信するように構成されてもよい。たとえば、基地局500は、ネットワーク接続560を介してコアネットワークから第2のデータストリーム(たとえば、メッセージまたはオーディオデータ)を受信してもよい。基地局500は、第2のデータストリームを処理して、メッセージまたはオーディオデータを生成し、アンテナのアレイの1つまたは複数のアンテナを介して1つまたは複数のワイヤレスデバイスに、またはネットワーク接続560を介して別の基地局に、メッセージまたはオーディオデータを提供してもよい。特定の実装形態では、ネットワーク接続560は、例示的な非限定的例として、ワイドエリアネットワーク(WAN)接続であってもよい。いくつかの実装形態では、コアネットワークは、公衆交換電話網(PSTN)、パケットバックボーンネットワーク、または両方を含んでもよく、またはそれらに対応してもよい。
基地局500は、ネットワーク接続560およびプロセッサ506に結合されるメディアゲートウェイ570を含んでもよい。メディアゲートウェイ570は、異なる電気通信技術のメディアストリーム同士の間で変換するように構成されてもよい。たとえば、メディアゲートウェイ570は、異なる送信プロトコル、異なるコーディング方式、またはその両方の間で変換してもよい。例示のために、メディアゲートウェイ570は、例示的で非限定的な例として、PCM信号からリアルタイムトランスポートプロトコル(RTP)信号に変換してもよい。メディアゲートウェイ570は、パケット交換ネットワーク(たとえば、ボイスオーバーインターネットプロトコル(VoIP)ネットワーク、IPマルチメディアサブシステム(IMS)、LTE、WiMax、およびUMBなどの第4世代(4G)ワイヤレスネットワークなど)、回線交換ネットワーク(たとえば、PSTN)、ならびにハイブリッドネットワーク(たとえば、GSM(登録商標)、GPRS、およびEDGEなどの第2世代(2G)ワイヤレスネットワーク、WCDMA(登録商標)、EV-DO、およびHSPAなどの第3世代(3G)ワイヤレスネットワークなど)の間でデータを変換してもよい。
加えて、メディアゲートウェイ570は、トランスコーダ510などのトランスコーダを含む場合があり、コーデックの互換性がないときにデータをトランスコーディングするように構成されてもよい。たとえば、メディアゲートウェイ570は、例示的で非限定的な例として、適応マルチレート(AMR)コーデックとG.711コーデックとの間をトランスコーディングしてもよい。メディアゲートウェイ570は、ルータと複数の物理インターフェースとを含んでもよい。いくつかの実装形態では、メディアゲートウェイ570はコントローラ(図示せず)を含む場合もある。特定の実装形態では、メディアゲートウェイコントローラは、メディアゲートウェイ570の外部、基地局500の外部、または両方にあってもよい。メディアゲートウェイコントローラは、複数のメディアゲートウェイの動作を制御および調整してもよい。メディアゲートウェイ570は、メディアゲートウェイコントローラから制御信号を受信してもよく、様々な伝送技術間をブリッジするように機能してもよく、エンドユーザの機能および接続にサービスを追加してもよい。
基地局500は、トランシーバ552、554、レシーバデータプロセッサ564、およびプロセッサ506に結合される復調器562を含む場合があり、レシーバデータプロセッサ564はプロセッサ506に結合される場合がある。復調器562は、トランシーバ552、554から受信された変調信号を復調し、復調データをレシーバデータプロセッサ564に提供するように構成されてもよい。レシーバデータプロセッサ564は、復調データからメッセージまたはオーディオデータを抽出し、メッセージまたはオーディオデータをプロセッサ506に送信するように構成されてもよい。
基地局500は、送信データプロセッサ567と送信多入力多出力(MIMO)プロセッサ568とを含む場合がある。送信データプロセッサ567は、プロセッサ506および送信MIMOプロセッサ568に結合される場合がある。送信MIMOプロセッサ568は、トランシーバ552、554、およびプロセッサ506に結合される場合がある。いくつかの実装形態では、送信MIMOプロセッサ568は、メディアゲートウェイ570に結合される場合がある。送信データプロセッサ567は、プロセッサ506からメッセージまたはオーディオデータを受信し、例示的で非限定的例として、CDMAまたは直交周波数分割多重化(OFDM)などのコーディング方式に基づいて、メッセージまたはオーディオデータをコーディングするように構成されてもよい。送信データプロセッサ567は、送信MIMOプロセッサ568にコード化データを提供してもよい。
コード化データは、多重化データを生成するために、CDMA技法またはOFDM技法を使用して、パイロットデータなどの他のデータと多重化されてもよい。次いで、多重化データは、変調シンボルを生成するために、特定の変調方式(たとえば、二位相シフトキーイング("BPSK")、四位相シフトキーイング("QSPK")、多値位相シフトキーイング("M-PSK")、多値直交振幅変調("M-QAM")など)に基づいて、送信データプロセッサ567によって変調(すなわち、シンボルマッピング)されてもよい。特定の実装形態では、コード化データおよび他のデータは、様々な変調方式を使用して変調されてもよい。データストリームごとのデータレート、コーディング、および変調は、プロセッサ506によって実行される命令によって決定されてもよい。
送信MIMOプロセッサ568は、送信データプロセッサ567から変調シンボルを受信するように構成されてよく、変調シンボルをさらに処理してもよく、データに対してビームフォーミングを実行してもよい。たとえば、送信MIMOプロセッサ568は、変調シンボルにビームフォーミング重みを加えてもよい。ビームフォーミング重みは、変調シンボルがそこから送信されるアンテナのアレイの1つまたは複数のアンテナに対応する場合がある。
動作中、基地局500の第2のアンテナ544は、データストリーム514を受信してもよい。第2のトランシーバ554は、第2のアンテナ544からデータストリーム514を受信することができ、復調器562にデータストリーム514を提供してもよい。復調器562は、データストリーム514の変調信号を復調し、復調データをレシーバデータプロセッサ564に提供してもよい。レシーバデータプロセッサ564は、復調データからオーディオデータを抽出し、抽出されたオーディオデータをプロセッサ506に提供してもよい。
プロセッサ506は、トランスコーディングするためにオーディオデータをトランスコーダ510に提供してもよい。トランスコーダ510のボコーダデコーダ538は、オーディオデータを第1のフォーマットから復号オーディオデータに復号してもよく、ボコーダエンコーダ536は、復号オーディオデータを第2のフォーマットに符号化してもよい。いくつかの実装形態では、ボコーダエンコーダ536は、ワイヤレスデバイスから受信されたよりも高いデータレート(たとえば、アップコンバート)または低いデータレート(たとえば、ダウンコンバート)を使用して、オーディオデータを符号化してもよい。他の実装形態では、オーディオデータはトランスコーディングされない場合がある。トランスコーディング(たとえば、復号および符号化)は、トランスコーダ510によって実行されるものとして示されるが、トランスコーディング動作(たとえば、復号および符号化)は、基地局500の複数の構成要素によって実行される場合がある。たとえば、復号はレシーバデータプロセッサ564によって実行される場合があり、符号化は送信データプロセッサ567によって実行される場合がある。他の実装形態では、プロセッサ506は、別の伝送プロトコル、コーディング方式、または両方への変換のために、メディアゲートウェイ570にオーディオデータを提供してもよい。メディアゲートウェイ570は、ネットワーク接続560を介して別の基地局またはコアネットワークに変換されたデータを提供してもよい。
ボコーダデコーダ538、ボコーダエンコーダ536、または両方は、パラメータデータを受信してもよく、フレームごとにパラメータデータを識別してもよい。ボコーダデコーダ538、ボコーダエンコーダ536、または両方は、フレームごとに、パラメータデータに基づいて合成信号を分類してもよい。合成信号は、スピーチ信号、非スピーチ信号、音楽信号、雑音が多いスピーチ信号、背景雑音信号、またはそれらの組合せとして分類されてもよい。ボコーダデコーダ538、ボコーダエンコーダ536、または両方は、分類に基づいて、特定のデコーダ、エンコーダ、または両方を選択してもよい。トランスコーディングされたデータなどの、ボコーダエンコーダ536において生成された符号化オーディオデータは、プロセッサ506を介して送信データプロセッサ567またはネットワーク接続560に提供されてもよい。
トランスコーダ510からのトランスコーディングされたオーディオデータは、変調シンボルを生成するために、OFDMなどの変調方式によるコーディング用に送信データプロセッサ567に提供されてもよい。送信データプロセッサ567は、変調シンボルを、さらなる処理およびビームフォーミングのために送信MIMOプロセッサ568に提供してもよい。送信MIMOプロセッサ568は、ビームフォーミング重みを加えることができ、第1のトランシーバ552を介して、第1のアンテナ542などのアンテナのアレイの1つまたは複数のアンテナに変調シンボルを提供してもよい。したがって、基地局500は、ワイヤレスデバイスから受信されたデータストリーム514に対応するトランスコーディングされたデータストリーム516を別のワイヤレスデバイスに提供してもよい。トランスコーディングされたデータストリーム516は、データストリーム514とは異なる符号化フォーマット、データレート、または両方を有する場合がある。他の実装形態では、トランスコーディングされたデータストリーム516は、別の基地局またはコアネットワークへの送信用に、ネットワーク接続560に提供されてもよい。
したがって、基地局500は、プロセッサ(たとえば、プロセッサ506またはトランスコーダ510)によって実行されると、符号化オーディオ信号を復号して合成信号を生成することを含む動作をプロセッサに実行させる命令を記憶するコンピュータ可読ストレージデバイス(たとえば、メモリ532)を含んでもよい。動作は、符号化オーディオ信号から特定された少なくとも1つのパラメータに基づいて合成信号を分類することを含む場合もある。
上記で説明した技法は、第3世代パートナーシッププロジェクト(3GPP)ネットワークに適合してもよい。たとえば、今日の商用VoLTEネットワークにおけるAMR-WBの特定の基準(たとえば、スピーチ品質、スピーチ了解度、エラー耐性、および呼機能)にわたるエクスペリエンス品質は:(QCI=1に関して指定されるように)モバイルリンク当たり1%のFERのユニキャストLTE PSチャネルを介して動作する12.65kbpsにおけるAMR-WBであり、結果として、モバイル間呼において2%の総FERをもたらす。セルエリアのおよそ90%がエンドツーエンドFER≦2%を有する。これは、基準「HD音声」カバレージがセルエリアの90%に等しいことを意味すると解釈してもよい。残りの10%で、AMR-WBコーデックスピーチ品質は2%を超えるFERにおいて劣化し始める。
MCPTTサービスは、それらの利用可能なネットワークトポロジーの中で最も適切なネットワークトポロジーに応じて、3つのタイプのベアラを介しで動作させることができる。MCPTTは、媒体の複製および分布のために中央会議サーバを使用しての今日のモバイルネットワークにおいて遠隔会議が実行されるのと同じ方法でユニキャストチャネルを介して動作させることができる。LTEユニキャストチャネルの各々は、チャネルを介して送信されるVoIPフレームにターゲットBLERまたはパケット損失率を提供するために、HARQなどの再送信方式をやはり使用する電力制御チャネルであってもよい。このトポロジーにおいてAMR-WBを使用するとき、カバレージ、エラー耐性、スピーチ品質、スピーチ了解度、および呼能力は「HD音声」のそれと同等であってもよい。
あるグループ内の複数の参加者が単一セル内にあるとき、システムは、リソースを低減させて、ユーザに電力制御されていない共通ダウンリンクMBMSベアラを共有させることによって、ユーザをサポートすることができる。eNBがエラー性能を改善するか、またはターゲット誤り率を満たすためにその送信リソースを動的に調整することを判断することができる動的フィードバックは何も存在しない場合がある。再送信はACK/NACKなどの動的フィードバックに基づいて送られないという点で、再送信の使用は「ブラインド」である。これらの再送信を使用して、セル全体を通して一定レベルの性能またはターゲット誤り率を保証することはできない。したがって、MBMSベアラ上の誤り率はセルを通して、たとえば、屋内、地下、エレベータ、階段吹き抜け、またはSC-PTMトポロジーにおけるセルのエッジでかなり変化してもよい。
MBMSベアラを使用するためのトポロジーは、シングルセルポイントツーマルチポイント(SC-PTM:Single-Cell Point-to-Multipoint)ベアラとして構成されてもよく、この場合、隣接するセルは同じMBMSベアラ上で同じグループのコンテンツを必ずしも送信するとは限らない。このトポロジーでは、隣接するセルは、一般に、サービスセル内でMBMSベアラに干渉し、結果として、MBSFNトポロジーよりも不十分なカバレージを生じさせる。トポロジーはMBSFNの一部であってもよく、この場合、すべてのセルは同じMBMSベアラ上で同じコンテンツをブロードキャストしており、セル間干渉を防止し、ユーザがこれらの送信を組み合わせてカバレージおよび受信を改善することを可能にする。MCPTTグループが非常に大きく、オペレータのネットワークの大部分にまたがらない限り、システムはそのグループにサービスするセル内でSC-PTMを使用する可能性が最も高いが、それは、これがネットワークリソース全体をそれほど使用しないためである。
LTE-Direct通信は、2つの(または、それを超える)UE同士の間の通信のための2つの物理チャネル、制御およびデータを定義する(物理層フィードバックのない)ブロードキャスト機構である。直接通信のために使用されるリソースは、制御リソースおよびデータリソースからなる。ネットワーク内動作の場合、制御リソースプールはRRCシグナリングを介して提供され、オフネットワーク動作の場合、制御リソースプールは事前に構成される。さらに、2つのモードのリソース割振りがサポートされる。すなわち、モード1(ネットワーク内)およびモード2(ネットワーク内およびオフネットワーク)である。モード2では、送信側UEは制御およびデータ送信のために使用されるべきリソースを決定する。UEは後続のデータ送信のために使用されるべきリソースを告知するための制御を送信する。受信側UEは、制御リソースを監視して、いつウェイクアップしてデータ送信を聴取するかを決定する。
拡張音声サービス(EVS)は、低遅延リアルタイム通信のための幅広い新しい特徴および改善を提供する新しいスピーチコーデック規格(3GPPリリース12の一部)である。主要な進歩には、クリーン/雑音の多いスピーチおよび音楽コンテンツに対するかなり改善された品質、より高い圧縮効率、およびパケット損失およびPSシステム内で受ける遅延ジッタに対するかつてないエラー耐性がある。
概して、EVS-WBコーデックは、同様のビットレートにおいてAMR-WBよりもかなり良好な品質、および低ビットレートにおいてAMR-WBに等しい品質を提供する。EVS-SWBコーデック性能は、AMR-WBとEVS-WBの対応するビットレートの両方よりもかなり良好である。クリーンスピーチコンテンツの場合、EVS-WBの最低ビットレート、すなわち、5.9kbpsは、8.85kbpsにおけるAMR-WBよりかなり良好な品質、および12.65kbpsにおけるAMR-WBと等しい品質を提供することができる。9.6kbpsで開始するEVS-WBコーディングの主観品質は、その23.85kbpsの最高ビットレートにおけるAMR-WBコーディングよりもかなり良好である。13.2kbpsにおけるEVSの超広帯域モードは、ダイレクトソースに対する透過性を達成し、23.85kbpsのAMR-WBおよび24.4kbpsのEVS-WBよりもかなり良好な品質を提供する。
雑音の多いスピーチの場合、9.6kbpsにおけるEVS-WBは、12.65kbpsにおけるAMR-WBと同等の品質を提供する。これはまた、様々な言語/雑音タイプにわたって示され、TR26.952において要約されている。しかしながら、雑音の多いスピーチテストのいずれも、コーダに対する入力においてより高いSNRを提供することによって、9.6kbpsよりも低いビットレートにおいてAMR-WB12.65kbpsと同等の品質を確立することが予想されるフロントエンド雑音抑圧の存在を含まなかった。13.2kbpsにおけるEVS-WBは、ビットレートを増大した状態で一貫して主観品質を向上させながら、ビットレートのおよそ2倍におけるAMR-WBと同等の品質を提供する。13.2kbpsにおけるEVS-SWBコーディングの主観品質は、23.85kbpsにおけるAMR-WBおよび同じビットレートにおけるEVS-WBよりもかなり良好である。クリーンなチャネル状態下のミックス/音楽コーディングの場合、13.2kbpsで開始するEVS-WBとEVS-SWBの両方のコーデックは、いずれのビットレートにおいてもAMR-WBの主観品質よりかなり良好な主観品質を達成する。北米英語音楽および混合コンテンツの場合、EVS-SWBコーディングは同じビットレートにおいてEVS-WBよりもかなり良好に機能する。
大部分の3GPPネットワークは、各リンクに対してFERがおよそ1%であるように構成されることが予想される。2%のデータポイントはこのテストにおいてテストされなかったが、最も近いデータレート、すなわち、0%(クリーンチャネル)および3%のFERにおけるEVSモードとAMR-WBとの間の比較は行われた。概して、チャネル認識モードが有効にされた、正常に機能しないチャネルの下で13.2kbps EVS-SWBのクリーンスピーチ性能は、チャネル認識モードがないものよりもかなり良好であり、チャネル認識モードがないものは、その23.85kbpsの最高ビットレートにおいてAMR-WBよりもかなり良好である。両方の言語に関して、クリーンチャネルにおけるEVS SWB 13.2kbpsのチャネル認識モードおよび非チャネル認識モードの品質は、その23.85kbpsの最高ビットレートにおけるAMR-WBよりもかなり良好である。北米英語の場合、およそ6%のFERにおいて動作するEVS SWB13.2kbpsのチャネル認識モードは、損失のない状態で、AMR-WB(23.85kbps)の最高ビットレートの品質と同等の品質を配信する。13.2Kbps SWB非チャネル認識モードは、およそ3%のFERで動作するとき、AMR-WB 23.85kbpsのクリーンチャネルと同等の品質を達成してもよい。10%のFERにおいてすらEVS13.2kbpsクリーン認識モードは、3%のFERにおけるAMR-WB 23.85kbpsよりも良好な品質を配信するのに対して、13.2kbpsのEVS SWB非チャネル認識モードは、8%のFERにおいて動作できるが、3%のFERにおいてAMR-WB 23.85kbpsと同等の品質を達成することができる。デンマーク語の場合、およそ3%のFERにおいて動作するEVS SWB 13.2kbpsのチャネル認識モードは、何の損失も伴わない、AMR-WB(23.85kbps)の最高ビットレートの品質と同等の品質を配信する。10%のFERにおけるEVS 13.2kbpsクリーン認識モードイベントは、3%のFERにおけるAMR-WB 23.85kbpsと等価の品質を配信するのに対して、13.2kbpsのEVS SWB非チャネル認識モードは、6%のFERにおいて動作することができ、3%のFE
RにおいてAMR-WB 23.85kbpsと同等の品質を達成することができる。
概して、チャネル認識モードが有効にされた、正常に機能しないチャネルの下で13.2kbpsのEVS-SWBの雑音のあるスピーチ性能は、チャネル認識モードがないものよりもかなり良好であり、チャネル認識モードがないものは、その23.85kbpsの最高ビットレートにおいてAMR-WBよりもかなり良好である。15dB SNR自動車雑音を伴う北米英語の場合、10%のFERにおいて動作するEVS 13.2kbpsチャネル認識モード、および6%のFERにおいて動作するEVS SWB非チャネル認識モードは、3%のFERにおいてAMR-WB 23.85kbps同等の品質を達成することができる。両方の言語の場合、チャネル認識モードが有効でない、正常に機能しないチャネル下の13.2kbps EVS-WBクリーンスピーチ性能は、15.85kbpsにおけるAMR-WBよりもかなり良好である。北米英語の場合、チャネル認識モードが有効にされた、正常に機能しないチャネルの下で13.2kbps EVS-SWBのクリーンスピーチ性能は、チャネル認識モードがないものよりもかなり良好であり、チャネル認識モードがないものは、15.85kbpsにおけるAMR-WBよりもかなり良好である。クリーンチャネルにおけるEVS SWB 13.2kbpsのチャネル認識モードおよび非チャネル認識モードの品質は、15.85kbpsにおけるAMR-WBよりもかなり良好である。具体的には、テストされた両方の言語に関して、10%のFERにおいて動作するEVS 13.2kbpsチャネル認識モードは、3%のFERにおいて、15.85kbpsにおけるAMR-WBと同等の品質を配信できることが理解できる。さらに、13.2kbps非チャネル認識モードは、6%のFERで動作することができ、3%のFERにおけるAMR-WB 15.85kbpsとの同等の品質を達成してもよい。
電力制御されたLTEユニキャストチャネルは、一般に、リンク当たり1%のターゲットBLERにおいて動作するように構成される。13.2kbpsにおいて動作するEVS-SWBモード(チャネル認識および非チャネル認識)は、同じビットレートにおいてEVS-WBよりもかなり良好なオーディオ品質を提供する。これは、クリーンスピーチ、背景雑音のあるスピーチ、および混合/音楽コンテンツを含む幅広い入力信号にも当てはまる。EVSはAMR-WB(HD音声)よりもかなりの音声品質改善を提供する。背景雑音に対する改善されたロバストネスおよびエラーに対する耐性は、MCPTTサービスに特に関連し、概して、「HD音声」により良好なまたは少なくとも等しいスピーチ了解度をもたらすことが予想される。
ターゲットBLERの厳格な制御のためにHARQなどの再送信方式を使用することができるが、電力制限されたアップリンクにより、セルエッジまたは奥行のある屋内は依然としてより高いBLER(>1%)を受ける可能性がある。これらの条件下で、EVS WBおよびEVS SWBのチャネル認識モードは、改善されたエラー耐性により、12.65kbpsにおけるAMR-WBよりもかなり良好なスピーチ品質を提供する場合がある。13.2kbpsにおけるEVS WBチャネルモードは、最高で8%のFERを許容することができ、セル「HD音声」スピーチ品質のセンターである2%のFERで動作するAMR-WB 12.65kbpsと同じスピーチ品質を依然として配信できることを了解されよう。より高いパス損失を許容しながらリンクを維持する能力は、改善されたリンクバジェット/カバレージをもたらす。13.2kbpsにおけるEVS SWBチャネル認識モードは、セルスピーチ品質のHD音声の中心を維持しながら、カバレージをさらに拡張するために、さらに高いFER(最高で10%まで)を許容することができる。13.2kbpsのEVS WBおよびFVS SWBの非チャネル認識モードはまた、より高いFERで動作し、セルスピーチ品質の「HD音声」の中心を配信し、それにより、チャネル認識モードのカバレージよりは低いとしても、改善されたカバレージをもたらすことができる。13.2kbpsのEVSモードは、AMR-WB 12.65kbpsと同じトランスポートブロックを利用する。これは、結果として、AMR-WB 12.65kbpsと同じセルサイト音声容量をもたらす。カバレージが一定に維持される場合、パケットをUE自体において送信しないことによって、パケット損失率を増大させることによって、容量利得のために改善されたエラー耐性を利用することができる。各パケットが送信される電力は低減されないことになるが、この機構は、低減されたONタイムまたは低減された送信数(DTXと同様であるか、またはブランキングするが、アクティブスピーチに関する)により、UEにおいて節電をもたらすことができる。これをスケジューラに組み込むことは、必要とされるリソースブロックの平均数を低減し、それにより、より多くのユーザを追加するため、またはベストエフォートトラフィックのためにリソースを解放することができる。容量利得は、EVSモードがセル音声品質のHD音声の中心を依然として維持することができる最大FER率に正比例する場合がある。13.2kbpsで、EVS SWBチャネル認識モードは、最高容量利得を提供することになり、その後に、EVS WBチャネル認識、EVS SWBおよびEVS WBの非チャネル認識モードが続くことになる。たとえば、EVS SWBチャネル認識モードで動作するときにONタイムを10%だけ低減させること(すなわち、アクティブフレームボコーダパケットの10%をブランキングすること)は、セルサイト当たりの追加ユーザの数の点で測定された18%の容量利得をもたらすことができる。EVSのより低いビットレート、すなわち、5.9VBRモードおよび7.2kbpsのWBモードは、より小さなトランスポートブロックサイズ/リソースブロックを利用することにより、かなりのセルサイト音声容量改善を提供することができる。
AMR-WBは、1%のFERシナリオを除くすべてのシナリオにおいて、基準エラー耐性、スピーチ品質、およびスピーチ了解度を満たすことができない。EVSは、たいていの場合、これらの基準KPIを満たすか、またはこれらを超える。さらに、EVSの広帯域モードと超広帯域モードは両方とも、様々なエラー条件下でAMR-WB上で音声品質の点で著しい改善を提供する。場合によっては、AMR-WB上のEVSによるP.OLQAスコアの改善は0.65であるが、AMR-WBはおよそ2.84の低いP.OLQAスコアをもたらす。これは、EVSはクリアで有意味なスピーチを提供することになるが、エンドユーザがMBMSカバレージエリアにおいてある種のFER条件下でAMR-WBでのスピーチのいくつかの部分を理解することができないシナリオにつながる場合がある。AMR-WBは基準「HD音声」品質を満たすことができないが、これは、AMR-WBはチャネルエラーの間に音声品質のかなりの低減を受けるためである。カバレージの観点から、これは、エラーを伴う上記のチャネル特性を示すエリア内の音声品質のかなりの劣化として経験されることになる。
当業者は、本明細書において開示される実装形態に関して説明した様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップが、電子ハードウェア、プロセッサによって実行されるコンピュータソフトウェア、または両方の組合せとして実装されてもよいことをさらに理解されよう。様々な説明のための構成要素、ブロック、構成、モジュール、回路、およびステップが、全般にそれらの機能に関して上で説明された。そのような機能がハードウェアとして実装されるかプロセッサ実行可能命令として実装されるかは、システム全体に課される特定の用途および設計制約に依存する。当業者は、説明された機能を具体的な適用例ごとに様々な方法で実装してもよいが、そのような実装の決定は、本開示の範囲からの逸脱をもたらすものと解釈されるべきではない。
本明細書で開示した実装形態に関して説明した方法またはアルゴリズムのステップは、直接ハードウェアにおいて、プロセッサによって実行されるソフトウェアモジュールにおいて、またはその2つの組合せにおいて具現化されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、フラッシュメモリ、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、消去可能プログラマブル読出し専用メモリ(EPROM)、電気的消去可能プログラマブル読出し専用メモリ(EEPROM)、レジスタ、ハードディスク、取外し可能ディスク、コンパクトディスク読出し専用メモリ(CD-ROM)、または当技術分野で既知の任意の他の形態の非一時的記憶媒体に存在してもよい。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサと一体であってもよい。プロセッサおよび記憶媒体は、ASIC内に存在してもよい。ASICはコンピューティングデバイスまたはユーザ端末内に存在してもよい。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末内に別個の構成要素として存在する場合がある。
開示された実装形態のこれまでの説明は、開示した実装形態を当業者が作成または使用することを可能にするために提供される。これらの実装形態に対する様々な修正は当業者には容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実装形態に適用されてもよい。したがって、本開示は、本明細書に示された実装形態に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴と一致する、考えられる最も広い範囲を与えられるべきである。
100 システム
102 第1のデバイス
104 第1のスピーチボコーダ
105 メモリ
106 レシーバ(RX)
107 消去率データ
108 トランスミッタ(TX)
110 エンコーダ
112 デジッタバッファ
114 デコーダ
116 比較回路
118 レートモニタ
119 アクティブフレーム破棄回路
122 第2のデバイス
124 第2のスピーチボコーダ
125 メモリ
126 レシーバ(RX)
128 トランスミッタ(TX)
130 エンコーダ
132 デジッタバッファ
134 デコーダ
136 比較回路
138 レートモニタ
139 アクティブフレーム破棄回路
150 ネットワーク
152 第1のパス、第1の逆方向チャネル
152a 第1の逆方向チャネル
152b 第2の順方向チャネル
154 第2のパス
154a 第2の逆方向チャネル
154b 第1の順方向チャネル
160 第1のフレーム、フレーム
162 第2のフレーム、フレーム
163 第Nのフレーム、フレーム
200 プロセス
250 プロセス
300 方法
350 方法
400 デバイス
402 デジタルアナログ変換器
404 アナログデジタル変換器
406 プロセッサ
410 プロセッサ
422 システムインパッケージまたはシステムオンチップデバイス
426 ディスプレイコントローラ
428 ディスプレイ
430 入力デバイス
434 コーデック
440 ワイヤレスコントローラ
442 アンテナ
444 電源
446 マイクロフォン
448 スピーカー
450 トランシーバ
452 メモリ
456 命令
500 基地局
506 プロセッサ
508 オーディオコーデック
510 トランスコーダ
514 データストリーム
532 メモリ
536 ボコーダエンコーダ
538 ボコーダデコーダ
542 第1のアンテナ
544 第2のアンテナ
552 第1のトランシーバ、トランシーバ
554 第2のトランシーバ、トランシーバ
560 ネットワーク接続
562 復調器
564 レシーバデータプロセッサ
567 送信データプロセッサ
568 送信多入力多出力(MIMO)プロセッサ
570 メディアゲートウェイ

Claims (31)

  1. フレーム送信を制御する方法であって、
    第1のデバイスにおいて、前記第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するステップと
    前記フレーム消去率を消去しきい値と比較するステップと
    前記フレーム消去率が前記消去しきい値を満たすとの判定に応じて特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含むかどうかを判定するステップと
    前記特定のアクティブスピーチフレームを破棄するか送信するかを判定するステップであって、前記判定が、前記特定のアクティブスピーチフレームが前記前のフレームの部分的なコピーを含むかどうかの前記判定に少なくとも部分的に基づく、ステップと
    を含む、方法。
  2. 前記フレーム消去率は、ある時間期間にわたって前記第2のデバイスに到達しなかったアクティブフレームの平均数に基づく率に対応し、前記消去しきい値は、A)ネットワークを介して前記第1のデバイスに通信される信号に基づいて決定されるか、またはB)拡張音声サービス(EVS)規格によって規定される、請求項1に記載の方法。
  3. 前記フレーム消去率が前記消去しきい値未満である場合、前記フレーム消去率が前記消去しきい値を満たす、請求項1に記載の方法。
  4. 前記フレーム消去率を前記消去しきい値と比較する前に、前記消去しきい値を示す信号をネットワークデバイスから受信するステップをさらに含む、請求項1に記載の方法。
  5. 前記第1のデバイスが前記消去しきい値を示すデータを記憶する、請求項1に記載の方法。
  6. 記特定のアクティブスピーチフレームが前記前のフレームの前記部分的なコピーを含むとの判定に応じて、前記第2のデバイスに前記前のフレームが送信されたかどうかを判定するステッ
    をさらに含む、請求項1に記載の方法。
  7. 前記第2のデバイスに前記前のフレームが送信されなかった場合、前記第2のデバイスに前記特定のアクティブスピーチフレームを送信するステップをさらに含む、請求項6に記載の方法。
  8. 前記第2のデバイスに前記前のフレームが送信された場合、前記特定のアクティブスピーチフレームの第1の臨界値を第1のしきい値と比較し、かつ前記前のフレームの第2の臨界値を第2のしきい値と比較するステップをさらに含む、請求項6に記載の方法。
  9. 前記第1の臨界値が前記第1のしきい値以上である場合、または前記第2の臨界値が前記第2のしきい値以上である場合、前記第2のデバイスに前記特定のアクティブスピーチフレームを送信するステップと、
    前記第1の臨界値が前記第1のしきい値未満であり、前記第2の臨界値が前記第2のしきい値未満である場合、前記特定のアクティブスピーチフレームを破棄するステップと
    をさらに含む、請求項8に記載の方法。
  10. 前記特定のアクティブスピーチフレームが前記前のフレームの前記部分的なコピーを含まないとの判定に応じて、前記特定のアクティブスピーチフレームの第1の臨界値が第3のしきい値未満であるかどうかを判定するステップをさらに含む、請求項6に記載の方法。
  11. 前記特定のアクティブスピーチフレームの前記第1の臨界値が前記第3のしきい値以上である場合、前記第2のデバイスに前記特定のアクティブスピーチフレームを送信するステップをさらに含む、請求項10に記載の方法。
  12. 前記特定のアクティブスピーチフレームの前記第1の臨界値が前記第3のしきい値未満である場合、前記特定のアクティブスピーチフレームを破棄するステップをさらに含む、請求項10に記載の方法。
  13. 前記アクティブスピーチフレームを前記破棄するステップが、モバイルデバイスおよび基地局の中の1つを含むデバイス内で実行される、請求項1に記載の方法。
  14. 前記フレーム消去率が、リアルタイムトランスポートプロトコル(RTP)損失率に対応する、請求項1に記載の方法。
  15. 前記フレーム消去率を示す信号を前記第2のデバイスから受信するステップをさらに含む、請求項1に記載の方法。
  16. 前記アクティブスピーチフレームを前記破棄するステップが、前記第1のデバイスにおける電力消費量を低減させる、請求項1に記載の方法。
  17. 前記アクティブスピーチフレームを前記破棄するステップがネットワーク容量を増大させる、請求項1に記載の方法。
  18. 装置であって、
    第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するように構成されるレートモニタと
    前記フレーム消去率を消去しきい値と比較するように構成される比較回路と
    音声ボコーダであって、
    前記フレーム消去率が前記消去しきい値を満たすとの判定に応じて特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含むかどうかを判定することと
    前記特定のアクティブスピーチフレームを破棄するか送信するかを判定することであって、前記判定が、前記特定のアクティブスピーチフレームが前記前のフレームの部分的なコピーを含むかどうかの前記判定に少なくとも部分的に基づく、判定することと
    を行うように構成される音声ボコーダと
    を含む、装置。
  19. 記フレーム消去率は、ある時間期間にわたって前記第2のデバイスに到達しなかったアクティブフレームの平均数に基づく率に対応し、前記消去しきい値は、A)ネットワークを介して前記第1のデバイスに通信される信号に基づいて決定されるか、またはB)拡張音声サービス(EVS)規格によって規定される、請求項18に記載の装置。
  20. 前記フレーム消去率が前記消去しきい値未満である場合、前記フレーム消去率が前記消去しきい値を満たす、請求項18に記載の装置。
  21. 前記フレーム消去率を前記消去しきい値と比較する前に、前記消去しきい値を示す信号をネットワークデバイスから受信するように構成されるレシーバをさらに含む、請求項18に記載の装置。
  22. 前記スピーチボコーダが、アルゴリズムに基づいて前記消去しきい値を決定するようにさらに構成される、請求項18に記載の装置。
  23. 前記スピーチボコーダが、
    前記特定のアクティブスピーチフレームが前記前のフレームの前記部分的なコピーを含むとの判定に応じて、前記第2のデバイスに前記前のフレームが送信されたかどうかを判定する
    ようにさらに構成される、請求項18に記載の装置。
  24. 前記第2のデバイスに前記前のフレームが送信されなかった場合、前記第2のデバイスに前記特定のアクティブスピーチフレームを送信するように構成されるトランスミッタをさらに含む、請求項23に記載の装置。
  25. 前記第2のデバイスに前記前のフレームが送信された場合、前記比較回路が、
    前記特定のアクティブスピーチフレームの第1の臨界値を第1のしきい値と比較し、
    前記前のフレームの第2の臨界値を第2のしきい値と比較する
    ようにさらに構成され、
    前記スピーチボコーダが、
    前記第1の臨界値が前記第1のしきい値以上である場合、または前記第2の臨界値が前記第2のしきい値以上である場合、前記第2のデバイスへの前記特定のアクティブスピーチフレームの送信を開始し、
    前記第1の臨界値が前記第1のしきい値未満であり、前記第2の臨界値が前記第2のしきい値未満である場合、前記特定のアクティブスピーチフレームを破棄する
    ようにさらに構成される、請求項23に記載の装置。
  26. アンテナと、
    前記アンテナに結合され、かつ符号化オーディオ信号を受信するように構成されるレシーバと
    をさらに含む、請求項18に記載の装置。
  27. 前記アンテナ、前記レシーバ、前記レートモニタ、前記比較回路、および前記アクティブフレーム破棄回路が、モバイルデバイスまたは基地局内に組み込まれる、請求項26に記載の装置。
  28. フレーム送信を制御するための命令を含む、非一時的コンピュータ可読記録媒体であって、前記命令が、プロセッサによって実行されると、
    第1のデバイスにおいて、前記第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定することと
    前記フレーム消去率を消去しきい値と比較することと
    前記フレーム消去率が前記消去しきい値を満たすとの判定に応じて特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含むかどうかを判定することと、
    前記特定のアクティブスピーチフレームを破棄するか送信するかを判定することであって、前記判定が、前記特定のアクティブスピーチフレームが前記前のフレームの部分的なコピーを含むかどうかの前記判定に少なくとも部分的に基づく、判定することと
    を含む動作を前記プロセッサに行わせる、非一時的コンピュータ可読記録媒体。
  29. 前記フレーム消去率は、ある時間期間にわたって前記第2のデバイスに到達しなかったアクティブフレームの平均数に基づく率に対応し、前記消去しきい値は、A)ネットワークを介して前記第1のデバイスに通信される信号に基づいて決定されるか、またはB)拡張音声サービス(EVS)規格によって規定される、請求項28に記載の非一時的コンピュータ可読記録媒体。
  30. 装置であって、
    第1のデバイスにおいて、第1のデバイスと少なくとも第2のデバイスとの間の通信セッションに関するフレーム消去率を決定するための手段と
    前記フレーム消去率を消去しきい値と比較するための手段と
    前記フレーム消去率が前記消去しきい値を満たすとの判定に応じて特定のアクティブスピーチフレームが前のフレームの部分的なコピーを含むかどうかを判定するための手段と
    前記特定のアクティブスピーチフレームを破棄するか送信するかを判定するスための手段であって、前記判定が、前記特定のアクティブスピーチフレームが前記前のフレームの部分的なコピーを含むかどうかの前記判定に少なくとも部分的に基づく、手段と
    を含む、装置。
  31. 前記フレーム消去率は、ある時間期間にわたって前記第2のデバイスに到達しなかったアクティブフレームの平均数に基づく率に対応し、前記消去しきい値は、A)ネットワークを介して前記第1のデバイスに通信される信号に基づいて決定されるか、またはB)拡張音声サービス(EVS)規格によって規定される、請求項30に記載の装置。
JP2018519292A 2015-10-20 2016-09-23 緩和されたフレーム消去率のための改善された電力利得および容量利得 Active JP6695970B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562244142P 2015-10-20 2015-10-20
US62/244,142 2015-10-20
US15/273,280 2016-09-22
US15/273,280 US10334518B2 (en) 2015-10-20 2016-09-22 Power gains and capacity gains for a relaxed frame erasure rate
PCT/US2016/053353 WO2017069911A1 (en) 2015-10-20 2016-09-23 Improved power gains and capacity gains for a relaxed frame erasure rate

Publications (3)

Publication Number Publication Date
JP2019500765A JP2019500765A (ja) 2019-01-10
JP2019500765A5 JP2019500765A5 (ja) 2019-10-03
JP6695970B2 true JP6695970B2 (ja) 2020-05-20

Family

ID=58523307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018519292A Active JP6695970B2 (ja) 2015-10-20 2016-09-23 緩和されたフレーム消去率のための改善された電力利得および容量利得

Country Status (6)

Country Link
US (1) US10334518B2 (ja)
EP (2) EP3365892A1 (ja)
JP (1) JP6695970B2 (ja)
KR (1) KR102124267B1 (ja)
CN (1) CN108140388B (ja)
WO (1) WO2017069911A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10587365B2 (en) * 2017-03-16 2020-03-10 Integrated Silicon Solutions, (Cayman) Inc. Repetition scheme for flexible bandwidth utilization
US11765094B2 (en) * 2018-12-12 2023-09-19 Telefonaktiebolaget Lm Ericsson (Publ) Communication system with de-jitter buffer for reducing jitter
US11133888B2 (en) * 2019-05-06 2021-09-28 Qualcomm Incorporated Codec configuration adaptation based on packet loss rate
US11575777B2 (en) 2019-05-27 2023-02-07 Massachusetts Institute Of Technology Adaptive causal network coding with feedback
CN110890945B (zh) * 2019-11-20 2022-02-22 腾讯科技(深圳)有限公司 数据传输方法、装置、终端及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5828672A (en) * 1997-04-30 1998-10-27 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of radio channel bit error rate in a digital radio telecommunication network
US7069013B2 (en) * 2002-01-11 2006-06-27 Motorola, Inc. High integrity radio access network client reallocation in a wireless communication network
US6920187B2 (en) * 2002-10-02 2005-07-19 Micron Technology, Inc. Constant delay zero standby differential logic receiver and method
US7596143B2 (en) * 2004-12-16 2009-09-29 Alcatel-Lucent Usa Inc. Method and apparatus for handling potentially corrupt frames
GB2427790B (en) * 2005-06-29 2008-02-06 Motorola Inc Apparatus and method for determining call quality in a communication system
WO2007034809A1 (ja) * 2005-09-20 2007-03-29 Taisho Pharmaceutical Co., Ltd. 組み換え蛋白質産生のための宿主細胞
US20070136372A1 (en) * 2005-12-12 2007-06-14 Proctor Lee M Methods of quality of service management and supporting apparatus and readable medium
US8438018B2 (en) * 2006-02-06 2013-05-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for speech coding in wireless communication systems
GB0705324D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
US8670355B1 (en) * 2007-10-18 2014-03-11 At&T Mobility Ii Llc System and method for network based hearing aid compatible mode selection
EP2465237B1 (en) * 2009-08-12 2020-04-29 BlackBerry Limited System and method for modulation and coding scheme adaptation and power control in a relay network
US9666204B2 (en) * 2014-04-30 2017-05-30 Qualcomm Incorporated Voice profile management and speech signal generation

Also Published As

Publication number Publication date
JP2019500765A (ja) 2019-01-10
CN108140388A (zh) 2018-06-08
CN108140388B (zh) 2022-05-03
BR112018007845A2 (pt) 2018-10-30
EP4369338A1 (en) 2024-05-15
WO2017069911A1 (en) 2017-04-27
US20170111856A1 (en) 2017-04-20
KR20180074681A (ko) 2018-07-03
EP3365892A1 (en) 2018-08-29
US10334518B2 (en) 2019-06-25
KR102124267B1 (ko) 2020-06-17

Similar Documents

Publication Publication Date Title
JP6695970B2 (ja) 緩和されたフレーム消去率のための改善された電力利得および容量利得
US7787377B2 (en) Selective redundancy for Voice over Internet transmissions
US8687607B2 (en) Method and apparatus for feedback reporting in a wireless communications system
JP5956348B2 (ja) 可変レート・ボコーダを利用するユーザ機器のためのボイスオーバip容量を改善する方法
EP2452482B1 (en) Media forwarding for a group communication session in a wireless communications system
US20060088065A1 (en) Method of scheduling data and signaling packets for push-to-talk over cellular networks
US9398253B2 (en) Video pause indication in video telephony
US20180279321A1 (en) Wireless base station, wireless terminal, wireless communication system, and voice signal communication method
EP3949456B1 (en) System of wireless communication using a dynamic multicast distribution scheme
US20030202475A1 (en) Multiplexing variable-rate data with data services
WO2009147643A2 (en) Communication methods, a communication device, and a communication apparatus
BR112018007845B1 (pt) Ganhos de potência melhorados e ganhos de capacidade para uma taxa de eliminação de quadro relaxada
Xu et al. Impact of jitter and packet loss on enhanced voice serviced for voice over nr
JP2009526433A (ja) メディアフレームの耐性のある表現形を使用してメディア伝送品質を改善する方法および装置
Ozturk et al. Circuit-Switched Voice Services Over HSPA
Heiskari Dynamic and Persistent Scheduling for Voice over IP Traffic in the Long-Term Evolution Uplink
WO2009099381A1 (en) Robust speech transmission

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190819

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190819

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190819

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20191202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200422

R150 Certificate of patent or registration of utility model

Ref document number: 6695970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250