JP7245856B2 - 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 - Google Patents
符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 Download PDFInfo
- Publication number
- JP7245856B2 JP7245856B2 JP2021006984A JP2021006984A JP7245856B2 JP 7245856 B2 JP7245856 B2 JP 7245856B2 JP 2021006984 A JP2021006984 A JP 2021006984A JP 2021006984 A JP2021006984 A JP 2021006984A JP 7245856 B2 JP7245856 B2 JP 7245856B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- decoder
- parameters
- encoder
- concealment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 70
- 230000002708 enhancing effect Effects 0.000 title description 13
- 230000003111 delayed effect Effects 0.000 claims description 38
- 239000000872 buffer Substances 0.000 claims description 35
- 230000007246 mechanism Effects 0.000 claims description 22
- 230000003595 spectral effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 13
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000001052 transient effect Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 230000001965 increasing effect Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 3
- 230000002950 deficient Effects 0.000 description 34
- 230000007704 transition Effects 0.000 description 19
- 230000003044 adaptive effect Effects 0.000 description 18
- 238000013213 extrapolation Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 12
- 238000013139 quantization Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000005284 excitation Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 230000001934 delay Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000012805 post-processing Methods 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000009044 synergistic interaction Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
すべての現行の技術は冗長性に基づき、これは、後のフレームによって、現在のフレームの実際には低ビットレートのバージョンを送信することを意味する。冗長オーディオ符号化は、(冗長コピーがプライマリと同一である場合)正確な修復を可能にすることができるが、より低いビットレートが使用される可能性が高くなり、それによって、達成される品質がより低くなる。先進的発話およびオーディオコード化の文脈において、データレートは、フレームごとに大きくなっており、その実際には低ビットレートのバージョンを送信することによって、品質は相対的に不満足なものになる。
冗長情報(パラメータ6)は以下のようなものであり得る
ISF/LSFパラメータ表現は、LPCパラメータの量子化およびコード化のために使用される。TCXにおいて、LPCは、マスキング閾値を表現するために使用される。これは重要なパラメータであり、フレーム損失の場合に復号器側で正確に利用可能にするために非常に有用である。特に、ISF/LSFが予測コード化される場合、この情報を隠蔽中に利用可能にすることによって、復号器側の予測器状態が正確な(符号化器に同期した)ままになり、これによって損失後の迅速な回復がもたらされるため、隠蔽品質が大幅に改善される。
信号分類は、以下の内容タイプ、すなわち、UNVOICED(無声)、UNVOICED TRANSITION(無声遷移)、VOICED TRANSITION(有声遷移)、VOICED(有声)およびONSET(オンセット)をシグナリングするために使用される。一般的に、このタイプの分類は、発話コード化、および、トーン/予測成分が信号中に存在するか、または、トーン/予測成分が変化しているかの指示において使用される。隠蔽中にこの情報を復号器側で利用可能にすることによって、信号の予測可能性を判定するのを助けることができ、したがって、LPCパラメータの振幅フェードアウト速度、LPCパラメータの補間速度を調整するのを助けることができる。
グローバルゲインは、隠蔽されるフレームのエネルギーを、利用可能である場合に正確なレベル(符号化器によって決定されるレベル)に容易に設定するために送信され得る。
・将来のTCXフレーム4bから生成される部分コピー8bが先頭にあるTCXプライマリフレーム4c。
・将来のACELPフレームから生成される部分コピー16が先頭にあるTCXプライマリフレーム4。
ACELPフレーム15の後の最初のTCXフレーム4
TCXフレームの部分冗長フレームの構築
・通常の低レートTCXコード化に使用されるものと同じLSF量子化器(たとえば、LPCパラメータをコード化するための)に13ビットが使用される。
・グローバルTCXゲインが7ビットを使用して量子化される。
・分類子情報(たとえば、VOICED(有声)、UNVOICED(無声)など)が2ビットでコード化される。
・LTPデータが存在する場合、LTPラグ遅延が送信される。
・分類子情報がシグナリングされる(UNVOICED(無声)、UNVOICED TRANSITION(無声遷移)、VOICED(有声)、VOICED TRANSITION(有声遷移)、ONSET(オンセット)…)。信号分類は、以下の内容タイプ、すなわち、UNVOICED(無声)、UNVOICED TRANSITION(無声遷移)、VOICED TRANSITION(有声遷移)、VOICED(有声)およびONSET(オンセット)をシグナリングするために使用される。一般的に、このタイプの分類は、発話コード化、および、トーン/予測成分が信号中に存在するか、または、トーン/予測成分が変化しているかの指示において使用される。隠蔽中にこの情報を復号器側で利用可能にすることによって、信号の予測可能性を判定するのを助けることができ、したがって、LPCパラメータの振幅フェードアウト速度、LPCパラメータの補間速度を調整するのを助けることができ、(たとえば、ノイズ除去のために)有声もしくは無声励振信号のハイパスもしくはローパスフィルタリングの可能な使用状況を制御することができる。
・帯域幅拡張の場合に全スペクトル範囲を記述するLPCパラメータが通常のコード化に使用される、
・LTPゲイン、
・ノイズレベル、および
・パルス位置。
複数フレーム損失
RF_TCXFD部分コピーモードには29ビットが使用される(すなわち、エラー隠蔽パラメータ6の符号化表現内に29ビットが含まれており、隠蔽ユニット36によって使用される)。
・通常の低レートTCXコード化に使用されるものと同じであるLSF量子化器には13ビットが使用される。
・グローバルTCXゲインは、7ビットを使用して量子化される。
・分類子情報は、2ビットでコード化される。
全体的に、18ビットのサイドデータ(すなわち、パラメータ6)が両方のモードに使用される。
・TCX LTPラグ遅延をシグナリングするためには、9ビットが使用される。
・分類子情報をシグナリングするためには、2ビットが使用される。
チャネルアウェアコード化の原理
EVSチャネルアウェアモードは、(たとえば、単一のRTPペイロード内に複数のパケットを含むことによる)トランスポート層における冗長性の送信とは対照的に、コーデックペイロードの一部分として帯域内で冗長性を送信する。帯域内に冗長性を含むことによって、冗長性の送信が、(たとえば、ネットワークの混雑に対抗するために)チャネルまたはソースのいずれかで制御されることを可能にする。後者の事例において、符号化器は、入力ソース信号の特性を使用して、復号器における高品質再構築のためにいずれのフレームが最も致命的であるかを判定し、それらのフレームのみについて冗長性を選択的に送信することができる。帯域内冗長性のもう1つの利点は、ソース制御を使用して、合計パケットサイズを変更することなく冗長性の付随に対応するために、入力のいずれのフレームが低減したフレームレートにおいて最良にコード化され得るかを判定することができることである。このように、チャネルアウェアモードは、一定ビットレートチャネル(13.2kbps)における冗長性を含む。
・グローバルTCXゲインは、7ビットを使用して量子化される。
・分類子情報は、2ビットでコード化される。
・TCX LTPラグ遅延をシグナリングするためには、9ビットが使用される。
・分類子情報をシグナリングするためには、2ビットが使用される。
プライマリフレームのビットレート低減、および、部分冗長フレームコード化メカニズムはともに、13.2kbpsペイロード内に含まれるべきプライマリフレームおよび冗長フレームの間のビットレート配分を決定する。
式中、EACBは適応的コードブック(ACB)エネルギーを示し、EFCBは、固定コードブック(FCB)エネルギーを示す。低い値のτ(たとえば、0.15以下)は、現在のフレーム内の情報の大部分が、FCB寄与分によって搬送されることを示す。そのような場合、RF_NOPRED部分コピー符号化は、1つまたは複数のFCBパラメータ(たとえば、FCBパルスおよびゲイン)のみを使用する。他方、高い値のτ(たとえば、0.35以上)は、現在のフレーム内の情報のほとんどが、ACB寄与分によって搬送されることを示す。そのような場合、RF_ALLPRED部分コピー符号化は、1つまたは複数のACBパラメータ(たとえば、ピッチラグ遅延およびゲイン)のみを使用する。τが[0.15,0.35]の範囲内にある場合、混合コード化モードRF_GENPREDが、部分コピー符号化のために、ACBとFCBの両方のパラメータを使用する。UNVOICEDフレームについて、低ビットレートノイズ励起線形予測(NELP)[16]が、RF_NELP部分コピーを符号化するために使用される。上側帯域部分コピーコード化は、ゲインパラメータの粗い符号化、および、以前のフレームからのLSFパラメータの外挿に依拠する[11]。
Claims (41)
- 発話様内容および/または一般オーディオ内容(2)をコード化するための符号化器(1)であって、
前記符号化器(1)は、ビットストリーム(5)内で、少なくともいくつかのフレーム(8)において、パラメータ(6)を組み込むように構成されており、前記パラメータ(6)は、元のフレームが損失、破損または遅延した場合に隠蔽を増強し、
前記符号化器(1)は、プライマリフレーム(4)および部分コピー(8)を生成するように構成されており、前記部分コピー(8)は前記プライマリフレーム(4)の低ビットレートバージョンではなく、前記部分コピー(8)は前記パラメータ(6)を含み、
前記符号化器(1)は、前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの一方のプライマリフレーム(4)を、前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの他方の部分コピー(8)と組み合わせて生成するように構成されている、符号化器(1)。 - 前記符号化器(1)は、いくらかの時間だけ前記パラメータ(6)を遅延させ、後の時点において符号化および送信されるパケット(9)内に前記パラメータ(6)を組み込むように構成されている、請求項1に記載の符号化器。
- 前記符号化器(1)は、プライマリフレームビットレートを低減するように構成されており、前記プライマリフレームビットレート低減および部分コピーフレームコード化メカニズムはともに、一定の合計ビットレート内に含まれるべき前記プライマリフレーム(4)と前記部分コピーフレーム(8)との間でビットレート配分を決定する、請求項1または2に記載の符号化器。
- 前記符号化器(1)は、TCXコード化方式を使用するコーデックの一部分である、請求項1~3のいずれか一項に記載の符号化器。
- 前記符号化器(1)は、前記フレームがノイズの多いオーディオ信号を含むか否か、または、前記フレームが、一定の期間にわたって変化しない鮮鋭なスペクトルラインを有するノイズフロアを含むか否かを検出し、前記検出に基づいて、前記パラメータ(6)をTCXフレーム内へと組み込むように構成されている、請求項4に記載の符号化器。
- 前記パラメータ(6)は、ISFまたはLSFパラメータ、特に、予測コード化ISFまたはLSFパラメータを含む、請求項4または5のいずれか一項に記載の符号化器。
- 前記パラメータ(6)は信号分類パラメータを含む、請求項4~6のいずれか一項に記載の符号化器。
- 前記パラメータ(6)はTCXグローバルゲインまたはTCXグローバルレベルを含む、請求項4~7のいずれか一項に記載の符号化器。
- 前記パラメータ(6)は、ウィンドウ情報およびスペクトルピーク位置のうちの少なくとも1つを含む、請求項4~8のいずれか一項に記載の符号化器。
- 前記符号化器(1)は、切り替えコーデックの一部分であり、前記切り替えコーデックは、少なくとも2つのコアコード化方式から構成され、第1のコアコード化方式はACELPを使用し、第2のコアコード化方式はTCXを使用する、請求項1~3に記載の符号化器。
- 前記符号化器(1)は、ACELPフレームの後に最初のTCXフレームがあるときに、切り替え後にTCXフレーム(4)の先頭に部分コピー(8)を置かないように構成されている、請求項10に記載の符号化器。
- 前記符号化器(1)は、符号化の前に前記信号を分析し、前記分析された信号に基づいて、前記部分コピーの使用をオフにするか、または、低減した部分コピー(8)を提供するように構成されている、請求項4~11のいずれか一項に記載の符号化器。
- 前記符号化器(1)は、種々の量の情報および/または異なるパラメータセット(6)を使用する複数の部分コピーモードの間で選択するように構成されており、前記部分コピーモードの前記選択は、パラメータに基づく、請求項1~12に記載の符号化器。
- 前記複数の部分コピーモードのうちの少なくとも1つは、周波数領域隠蔽モードである、請求項13に記載の符号化器。
- 前記複数の部分コピーモードのうちの少なくとも2つは、異なる時間領域隠蔽モードである、請求項13に記載の符号化器。
- フレームが過渡を含む場合、または、前記フレームのグローバルゲインが以前のフレームのグローバルゲインよりも低い場合、前記少なくとも2つの時間領域隠蔽モードのうちの1つが選択される、請求項15に記載の符号化器。
- 前記符号化器(1)は、LTPデータが存在する場合、LTPラグ遅延を送信するように構成されている、請求項1~16のいずれか一項に記載の符号化器。
- 前記符号化器(1)は、分類子情報を送信するように構成されている、請求項1~17のいずれか一項に記載の符号化器。
- 前記符号化器(1)は、LPCパラメータ、LTPゲイン、ノイズレベルおよびパルス位置のうちの少なくとも1つを送信するように構成されている、請求項1~18のいずれか一項に記載の符号化器。
- 発話様内容および/または一般オーディオ内容(2)を復号するための復号器(31)であって、
前記復号器(31)は、元のフレーム(4)が損失、破損または遅延した場合に、隠蔽を増強するために、後の時点において送信されるパラメータ(6)を使用するように構成されており、
前記復号器(31)は、プライマリフレーム(4)および部分コピー(8)を受信するように構成されており、前記部分コピー(8)は前記プライマリフレーム(4)の低ビットレートバージョンではなく、前記部分コピー(8)は前記パラメータ(6)を含み、
前記復号器(31)は、前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの一方のプライマリフレーム(4)を、前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの他方の部分コピー(8)と組み合わせて受信するように構成されている、復号器(31)。 - 前記パラメータ(6)は部分コピー(8)内に含まれており、前記復号器(31)は、デジッタバッファから、利用可能である場合に現在損失しているフレーム(4b)の前記部分コピー(8b)を受信するように構成されている、請求項20に記載の復号器(31)。
- 前記復号器(31)は、TCXコード化方式を使用するコーデックの一部分である、請求項20または21に記載の復号器。
- 前記パラメータ(6)は、ISFまたはLSFパラメータ、特に、予測コード化ISFまたはLSFパラメータを含む、請求項22に記載の復号器。
- 前記パラメータ(6)は信号分類パラメータを含む、請求項22または23のいずれか一項に記載の復号器。
- 前記パラメータ(6)はTCXグローバルゲインまたはTCXグローバルレベルを含む、請求項22~24のいずれか一項に記載の復号器。
- 前記パラメータ(6)は、ウィンドウ情報およびスペクトルピーク位置のうちの少なくとも1つを含む、請求項22~25のいずれか一項に記載の復号器。
- 前記復号器(31)は、切り替えコーデックの一部分であり、前記切り替えコーデックは、少なくとも2つのコアコード化方式から構成され、第1のコアコード化方式はACELPを使用し、第2のコアコード化方式はTCXを使用する、請求項20または21に記載の復号器。
- 前記復号器(31)は、ACELPフレームの後の最初のTCXフレームが前記復号器(31)にとって利用可能でない場合に、切り替え後にACELP隠蔽を使用するように構成されている、請求項27に記載の復号器。
- 前記復号器(31)は、種々の量の情報および/または異なるパラメータセット(6)を使用する複数の部分コピーモードの間で選択するように構成されている、請求項20~28に記載の復号器。
- 前記複数の部分コピーモードのうちの少なくとも1つは、周波数領域隠蔽モードである、請求項29に記載の復号器。
- 前記複数の部分コピーモードのうちの少なくとも2つは、異なる時間領域隠蔽モードである、請求項29に記載の復号器。
- 前記復号器(31)は、LTPデータが存在する場合、LTPラグ遅延を受信するように構成されている、請求項20~31のいずれか一項に記載の復号器。
- 前記復号器(31)は、分類子情報を受信するように構成されている、請求項20~32のいずれか一項に記載の復号器。
- 前記復号器(31)は、LPCパラメータ、LTPゲイン、ノイズレベルおよびパルス位置のうちの少なくとも1つを受信するように構成されている、請求項20~33のいずれか一項に記載の復号器。
- 前記復号器(31)は、隠蔽モードに応じて2つの異なる係数を用いて、ピッチゲインおよびコードゲインを低減するように構成されている、請求項20~34のいずれか一項に記載の復号器。
- 第1の係数は0.4であり、第2の係数は0.7である、請求項35に記載の復号器。
- 前記復号器(31)は、以前のプライマリフレーム(4a)が損失している場合に前記部分コピー(8b)から復号されるピッチを考慮に入れないように構成されており、前記復号器(31)は、送信される前記ピッチを使用する代わりに、後続する損失したプライマリフレームの予測されるピッチへと、前記ピッチを修正するように構成されている、請求項20~36のいずれか一項に記載の復号器。
- 請求項1~19のいずれか一項に記載の符号化器(1)と、請求項20~37のいずれか一項に記載の復号器(31)とを備える、システム。
- 発話様内容および/または一般オーディオ内容(2)を符号化するための方法であって、
ビットストリーム(5)内で、少なくともいくつかのフレーム(8)において、パラメータ(6)を組み込むステップを含み、前記パラメータ(6)は、元のフレーム(4)が損失、破損または遅延した場合に隠蔽を増強するステップと、
プライマリフレーム(4)および部分コピー(8)を生成するステップであって、前記部分コピー(8)は前記プライマリフレーム(4)の低ビットレートバージョンではなく、前記部分コピー(8)は前記パラメータ(6)を含む、ステップと、
前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの一方のプライマリフレーム(4)を、前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの他方の部分コピー(8)と組み合わせて生成するステップと、を含む方法。 - 発話様内容および/または一般オーディオ内容(2)を復号するための方法であって、
元のフレームが損失、破損または遅延した場合に、隠蔽を増強するために、後の時点において送信されるパラメータ(6)を使用するステップと、
プライマリフレーム(4)および部分コピー(8)を受信するステップであって、前記部分コピー(8)は前記プライマリフレーム(4)の低ビットレートバージョンではなく、前記部分コピー(8)は前記パラメータ(6)を含む、ステップと、
前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの一方のプライマリフレーム(4)を、前記発話様内容タイプおよび前記一般オーディオ内容タイプのうちの他方の部分コピー(8)と組み合わせて受信するステップと、を含む、方法。 - コンピュータまたは信号プロセッサ上で実行されると、請求項39または40のいずれか一項に記載の方法を実施するための、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14182553.9 | 2014-08-27 | ||
EP14182553 | 2014-08-27 | ||
EP15164126.3 | 2015-04-17 | ||
EP15164126 | 2015-04-17 | ||
JP2018208097A JP6827997B2 (ja) | 2014-08-27 | 2018-11-05 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018208097A Division JP6827997B2 (ja) | 2014-08-27 | 2018-11-05 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021101235A JP2021101235A (ja) | 2021-07-08 |
JP7245856B2 true JP7245856B2 (ja) | 2023-03-24 |
Family
ID=53887141
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017511668A Active JP6533285B2 (ja) | 2014-08-27 | 2015-08-24 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
JP2018208097A Active JP6827997B2 (ja) | 2014-08-27 | 2018-11-05 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
JP2021006984A Active JP7245856B2 (ja) | 2014-08-27 | 2021-01-20 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017511668A Active JP6533285B2 (ja) | 2014-08-27 | 2015-08-24 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
JP2018208097A Active JP6827997B2 (ja) | 2014-08-27 | 2018-11-05 | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10878830B2 (ja) |
EP (3) | EP3220389B1 (ja) |
JP (3) | JP6533285B2 (ja) |
KR (1) | KR102016542B1 (ja) |
CN (2) | CN107077851B (ja) |
AU (1) | AU2015308980B2 (ja) |
BR (1) | BR112017003887B1 (ja) |
CA (3) | CA3008321C (ja) |
ES (3) | ES2826374T3 (ja) |
HK (1) | HK1244349A1 (ja) |
MX (1) | MX2017002427A (ja) |
MY (1) | MY192253A (ja) |
PL (2) | PL3220389T3 (ja) |
RU (1) | RU2701707C2 (ja) |
SG (1) | SG11201701517XA (ja) |
TW (1) | TWI602172B (ja) |
WO (1) | WO2016030327A2 (ja) |
ZA (1) | ZA201701930B (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK3379535T3 (da) * | 2014-05-08 | 2019-12-16 | Ericsson Telefon Ab L M | Audiosignalklassifikator |
PL3163571T3 (pl) * | 2014-07-28 | 2020-05-18 | Nippon Telegraph And Telephone Corporation | Kodowanie sygnału dźwiękowego |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
US20170187635A1 (en) * | 2015-12-28 | 2017-06-29 | Qualcomm Incorporated | System and method of jitter buffer management |
KR102250472B1 (ko) | 2016-03-07 | 2021-05-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합 |
US10517021B2 (en) | 2016-06-30 | 2019-12-24 | Evolve Cellular Inc. | Long term evolution-primary WiFi (LTE-PW) |
US9967306B1 (en) * | 2016-09-08 | 2018-05-08 | Sprint Spectrum L.P. | Prioritized transmission of redundancy data for packetized voice communication |
US10439641B2 (en) * | 2017-06-02 | 2019-10-08 | Nxp B.V. | Error estimation in signal communications |
KR102051891B1 (ko) * | 2017-08-10 | 2019-12-04 | 한양대학교 산학협력단 | 대립쌍 구조 기반의 생성모델을 이용한 패킷손실은닉 방법 및 장치 |
FR3071997A1 (fr) * | 2017-10-02 | 2019-04-05 | Orange | Signalisation d’une requete d’adaptation d’une session de communication en voixsur ip |
US11032580B2 (en) | 2017-12-18 | 2021-06-08 | Dish Network L.L.C. | Systems and methods for facilitating a personalized viewing experience |
US10365885B1 (en) * | 2018-02-21 | 2019-07-30 | Sling Media Pvt. Ltd. | Systems and methods for composition of audio content from multi-object audio |
US10652121B2 (en) * | 2018-02-26 | 2020-05-12 | Genband Us Llc | Toggling enhanced mode for a codec |
US10475456B1 (en) * | 2018-06-04 | 2019-11-12 | Qualcomm Incorporated | Smart coding mode switching in audio rate adaptation |
US10990812B2 (en) * | 2018-06-20 | 2021-04-27 | Agora Lab, Inc. | Video tagging for video communications |
CN109599124B (zh) * | 2018-11-23 | 2023-01-10 | 腾讯科技(深圳)有限公司 | 一种音频数据处理方法、装置及存储介质 |
US11990141B2 (en) * | 2018-12-20 | 2024-05-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for controlling multichannel audio frame loss concealment |
US10803876B2 (en) | 2018-12-21 | 2020-10-13 | Microsoft Technology Licensing, Llc | Combined forward and backward extrapolation of lost network data |
US10784988B2 (en) * | 2018-12-21 | 2020-09-22 | Microsoft Technology Licensing, Llc | Conditional forward error correction for network data |
JP7266689B2 (ja) * | 2019-01-13 | 2023-04-28 | 華為技術有限公司 | ハイレゾリューションオーディオ符号化 |
WO2020164751A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
CN110275828B (zh) * | 2019-06-06 | 2022-11-22 | 江西理工大学 | 一种计算机软件优化测试数据有效载荷的方法 |
WO2020253941A1 (en) * | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
CN110266625B (zh) * | 2019-06-25 | 2022-01-04 | 西安空间无线电技术研究所 | 一种基于帧同步码隐含于信息码的qpsk调制的动态门限判决的解调方法及系统 |
US11501787B2 (en) * | 2019-08-22 | 2022-11-15 | Google Llc | Self-supervised audio representation learning for mobile devices |
WO2021200151A1 (ja) * | 2020-03-30 | 2021-10-07 | ソニーグループ株式会社 | 送信装置、送信方法、受信装置、及び受信方法 |
CN111554309A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
CN111554322A (zh) * | 2020-05-15 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
CN112634868B (zh) * | 2020-12-21 | 2024-04-05 | 北京声智科技有限公司 | 一种语音信号处理方法、装置、介质和设备 |
CN113035208B (zh) * | 2021-03-04 | 2023-03-28 | 北京百瑞互联技术有限公司 | 一种音频解码器的分级错误隐藏方法、装置及存储介质 |
CN112802485B (zh) * | 2021-04-12 | 2021-07-02 | 腾讯科技(深圳)有限公司 | 语音数据处理方法、装置、计算机设备及存储介质 |
KR20230023306A (ko) * | 2021-08-10 | 2023-02-17 | 삼성전자주식회사 | 컨텐츠 데이터를 기록하는 전자 장치 및 그 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130185062A1 (en) | 2012-01-12 | 2013-07-18 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for criticality threshold control |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5091945A (en) * | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm Inc | Vocoder mit veraendlicher bitrate |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
US7209900B2 (en) * | 1999-08-27 | 2007-04-24 | Charles Eric Hunter | Music distribution systems |
GB2358558B (en) * | 2000-01-18 | 2003-10-15 | Mitel Corp | Packet loss compensation method using injection of spectrally shaped noise |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
FR2813722B1 (fr) * | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US20040204935A1 (en) * | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
US7013267B1 (en) * | 2001-07-30 | 2006-03-14 | Cisco Technology, Inc. | Method and apparatus for reconstructing voice information |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
KR100617165B1 (ko) * | 2004-11-19 | 2006-08-31 | 엘지전자 주식회사 | 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US20070174054A1 (en) * | 2006-01-25 | 2007-07-26 | Mediatek Inc. | Communication apparatus with signal mode and voice mode |
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101437009B (zh) * | 2007-11-15 | 2011-02-02 | 华为技术有限公司 | 丢包隐藏的方法及其系统 |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
WO2011042464A1 (en) * | 2009-10-08 | 2011-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
KR101411759B1 (ko) * | 2009-10-20 | 2014-06-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법 |
US9020812B2 (en) * | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
TWI476760B (zh) * | 2011-02-14 | 2015-03-11 | Fraunhofer Ges Forschung | 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 |
US9026434B2 (en) * | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
CN107103910B (zh) * | 2011-10-21 | 2020-09-18 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
US9275644B2 (en) * | 2012-01-20 | 2016-03-01 | Qualcomm Incorporated | Devices for redundant frame coding and decoding |
US9558750B2 (en) * | 2012-06-08 | 2017-01-31 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
WO2014110281A1 (en) * | 2013-01-11 | 2014-07-17 | Db Networks, Inc. | Systems and methods for detecting and mitigating threats to a structured data storage system |
ES2872024T3 (es) * | 2013-03-04 | 2021-11-02 | Voiceage Evs Llc | Dispositivo y método para reducir ruido de cuantificación en un decodificador de dominio de tiempo |
BR112016004299B1 (pt) * | 2013-08-28 | 2022-05-17 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida |
US10614816B2 (en) * | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
-
2015
- 2015-08-14 TW TW104126580A patent/TWI602172B/zh active
- 2015-08-24 MY MYPI2017000301A patent/MY192253A/en unknown
- 2015-08-24 PL PL17168268T patent/PL3220389T3/pl unknown
- 2015-08-24 ES ES15753061T patent/ES2826374T3/es active Active
- 2015-08-24 EP EP17168268.5A patent/EP3220389B1/en active Active
- 2015-08-24 RU RU2017109774A patent/RU2701707C2/ru active
- 2015-08-24 WO PCT/EP2015/069348 patent/WO2016030327A2/en active Application Filing
- 2015-08-24 ES ES17168268T patent/ES2839509T3/es active Active
- 2015-08-24 CN CN201580058327.7A patent/CN107077851B/zh active Active
- 2015-08-24 AU AU2015308980A patent/AU2015308980B2/en active Active
- 2015-08-24 EP EP15753061.9A patent/EP3186806B1/en active Active
- 2015-08-24 EP EP19202304.2A patent/EP3618066B1/en active Active
- 2015-08-24 KR KR1020177007740A patent/KR102016542B1/ko active IP Right Grant
- 2015-08-24 PL PL19202304.2T patent/PL3618066T3/pl unknown
- 2015-08-24 ES ES19202304T patent/ES2924351T3/es active Active
- 2015-08-24 MX MX2017002427A patent/MX2017002427A/es active IP Right Grant
- 2015-08-24 BR BR112017003887-0A patent/BR112017003887B1/pt active IP Right Grant
- 2015-08-24 JP JP2017511668A patent/JP6533285B2/ja active Active
- 2015-08-24 CN CN202110063494.8A patent/CN112786060B/zh active Active
- 2015-08-24 CA CA3008321A patent/CA3008321C/en active Active
- 2015-08-24 CA CA2958932A patent/CA2958932C/en active Active
- 2015-08-24 SG SG11201701517XA patent/SG11201701517XA/en unknown
- 2015-08-24 CA CA3051511A patent/CA3051511C/en active Active
-
2017
- 2017-02-27 US US15/442,980 patent/US10878830B2/en active Active
- 2017-03-20 ZA ZA2017/01930A patent/ZA201701930B/en unknown
-
2018
- 2018-03-19 HK HK18103781.7A patent/HK1244349A1/zh unknown
- 2018-11-05 JP JP2018208097A patent/JP6827997B2/ja active Active
-
2020
- 2020-12-18 US US17/127,140 patent/US11735196B2/en active Active
-
2021
- 2021-01-20 JP JP2021006984A patent/JP7245856B2/ja active Active
-
2023
- 2023-07-05 US US18/347,526 patent/US20240005935A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130185062A1 (en) | 2012-01-12 | 2013-07-18 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for criticality threshold control |
Non-Patent Citations (2)
Title |
---|
3GPP TS 26.445 V.0.1.0; Codec for Enhanced Voice Services; EVS Codec Detailed Algorithmic Description (Release 12), [online],2014年07月30日,pp. 348-349,[2023年2月14日検索], <URL: https://3gpp.org/ftp/tsg_sa/WG4_CODEC/TSGS4_80/Docs/S4-140827.zip>,26445-010_s0505_s0505.doc |
3GPP TS 26.447 V.0.0.1; Codec for Enhanced Voice Services EVS Codec; Error Concealment of Lost Packets, [online],2014年07月30日,pp.8-9, 12, 14-15, 38-40,[2023年2月14日検索], <URL: https://3gpp.org/ftp/tsg_sa/WG4_CODEC/TSG4_80/Docs/S4-140829.zip>,26447_010_s01_s53_4_23.doc, 26447_010_s01_end.doc |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7245856B2 (ja) | 符号化器、復号器ならびに隠蔽を増強するためのパラメータを使用してオーディオ内容を符号化および復号するための方法 | |
US7668712B2 (en) | Audio encoding and decoding with intra frames and adaptive forward error correction | |
CA2984573C (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
KR20200050940A (ko) | 멀티 레이트 스피치와 오디오 코덱을 위한 프레임 손실 은닉 방법 및 장치 | |
CA2984050C (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
Atti et al. | Improved error resilience for VOLTE and VOIP with 3GPP EVS channel aware coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7245856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |