RU2488899C1 - Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования - Google Patents

Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования Download PDF

Info

Publication number
RU2488899C1
RU2488899C1 RU2012101259/08A RU2012101259A RU2488899C1 RU 2488899 C1 RU2488899 C1 RU 2488899C1 RU 2012101259/08 A RU2012101259/08 A RU 2012101259/08A RU 2012101259 A RU2012101259 A RU 2012101259A RU 2488899 C1 RU2488899 C1 RU 2488899C1
Authority
RU
Russia
Prior art keywords
frame
mdct
frequency
frequencies
mdst
Prior art date
Application number
RU2012101259/08A
Other languages
English (en)
Inventor
Мин ВУ
Чжибинь ЛИНЬ
Ке ПЕН
Чжен ДЕН
Цзин ЛУ
Сяоцзюнь ЦЮ
Цзяли ЛИ
Гуомин ЧЕНЬ
Хао ЮАНЬ
Кайвень ЛЮ
Original Assignee
ЗетТиИ Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЗетТиИ Корпорейшн filed Critical ЗетТиИ Корпорейшн
Application granted granted Critical
Publication of RU2488899C1 publication Critical patent/RU2488899C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Предлагается способ компенсации потери кадров звукового сигнала в области MDCT, включающий: шаг а, на котором, когда текущий потерянный кадр является Р-ым кадром, получают набор предсказываемых частот, для каждой частоты в этом наборе используют фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра и используют предсказанную фазу и амплитуду для получения коэффициентов MDCT Р-го кадра, соответствующих каждой частоте; шаг b, на котором для частот вне набора предсказываемых частот используют коэффициенты MDCT множества кадров перед Р-ым кадром для вычисления значений коэффициентов MDCT Р-го кадра на этих частотах; шаг с, на котором выполняют обратное модифицированное дискретное косинусное преобразование (IMDCT) для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра. Предлагается также компенсатор потери кадров. Изобретение имеет преимущества отсутствия задержки, малого объема вычислений, малого объема пространства памяти и простоты реализации. Технический результат - увеличение эффективности компенсации потери кадров звукового сигнала. 2 н. и 22 з.п. ф-лы, 8 ил.

Description

Область техники
Изобретение относится к области декодирования звуковых сигналов и, в частности, к компенсатору и способу компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования (Modified Discrete Cosine Transform, MDCT), с низкой сложностью и без временных задержек.
Уровень техники
В сетевых коммуникациях широко применяется технология пакетной передачи. По сети передается различная информация, такая как речь, звуковые сигналы или другие данные, после кодирования с использованием технологии пакетной передачи, такой как голосовая связь по протоколу Интернета (Voice over Internet Protocol, VoIP) и т.п. Потеря информации кадра речи и звукового сигнала в результате ограничения пропускной способности передающего конца и в результате того, что кадр информации пакета не приходит в буферную зону приемного конца в пределах назначенного времени задержки, или в результате перегрузки сети и т.п., вызывает быстрое ухудшение качества синтезированной речи и звуковых сигналов на декодирующем конце, поэтому на декодирующем конце необходимо использовать технологии для компенсации потери данных кадра. Компенсатор потери кадров представляет технологию, которая уменьшает ухудшение качества речевых и звуковых сигналов вследствие потери кадров. В настоящее время имеется много технологий для компенсации потери кадров, но большинство из них предназначены для компенсации потери кадров речи, и только немногие соответствующие технологии пригодны для компенсации потери кадров звукового сигнала.
Самым простым из известных способов компенсации потери кадров звукового сигнала является способ повторения сигнала MDCT последнего кадра или замена заглушением. Хотя способ прост в реализации и не имеет задержек, результат компенсации средний. Другие способы компенсации, такие как технология оценки фазы и амплитуды данных с пропусками (Gapped Data Amplitude and Phase Estimation, GAPES), преобразовывают коэффициент MDCT в коэффициент оконного дискретного преобразования Фурье (Discrete Short-Time Fourier Transform, DSTFT). Но эти способы характеризуются высокой сложностью и требуют большие объемы памяти. Организация Проекта сотрудничества по созданию системы третьего поколения (Third Generation Partnership Project, 3GPP) предложила осуществлять компенсацию потери кадров звукового сигнала с помощью технологии внесения шума с формированем спектра, которая дает хороший результат компенсации для шумоподобного сигнала, но худший результат компенсации для звукового сигнала с множеством гармоник.
В общем, большинство известных технологий компенсации потери кадров звукового сигнала не дают явных результатов или имеют высокую сложность вычисления и чрезмерно большое время задержки.
Сущность изобретения
Техническая задача, решаемая в настоящем изобретении, заключается в предоставлении компенсатора и способа компенсации потери кадров звукового сигнала в области MDCT, при этом предлагаемое изобретение обеспечивает хорошие результаты компенсации, низкую вычислительную сложность и отсутствие задержки.
Для решения указанной выше задачи предлагается способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, включающий:
шаг а, на котором, когда текущий потерянный кадр является Р-ым кадром, получают набор предсказываемых частот, для каждой частоты в наборе предсказываемых частот используют фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области модифицированного дискретного косинусного преобразования - модифицированного дискретного синусного преобразования (MDCT-MDST) для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST и используют предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой частоте, при этом (Р-1)-й кадр предшествует Р-му кадру;
шаг b, на котором для любой частоты в кадре вне набора предсказываемых частот используют коэффициенты MDCT множества кадров перед Р-ым кадром для вычисления коэффициента MDCT Р-го кадра на этой частоте;
шаг с, на котором выполняют обратное модифицированное дискретное косинусное преобразование (IMDCT) для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.
Упомянутый способ может характеризоваться тем, что он также включает перед шагом а, при обнаружении того, что текущий кадр потерян, определение типа текущего потерянного кадра и выполнение шага а, если текущий потерянный кадр является кадром с множеством гармоник.
Упомянутый способ может характеризоваться тем, что шаг определения типа текущего потерянного кадра включает:
вычисление равномерности спектра каждого из K кадров перед текущим потерянным кадром; если число кадров, равномерность спектра которых меньше порогового значения, является меньшим или равным K0 в K кадрах, то текущий потерянный кадр является кадром без множества гармоник; если число кадров, равномерность спектра которых меньше порогового значения, больше K0, то текущий потерянный кадр является кадром с множеством гармоник, при этом K0≤K, где K0, K - натуральные числа.
Упомянутый способ может характеризоваться тем, что при получении набора предсказываемых частот на шаге а используют комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-ым кадром для получения набора Sc предсказываемых частот или непосредственно помещают все частоты в кадре в набор SC предсказываемых частот.
Упомянутый способ может характеризоваться тем, что шаг использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-ым кадром для получения набора SC предсказываемых частот включает:
назначение упомянутого множества кадров перед Р-ым кадром как L1 кадров, вычисление мощности каждой частоты в L1 кадрах, получение L1 наборов S1,…,SL1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число частот в каждом наборе составляет N1,…,NL1, соответственно;
выбор набора Si из L1 наборов S1,…,SL1, для каждой частоты mj, j=1…Ni, с пиковым значением в наборе Si, определение, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот mj, mj±1,…,mj±k,
если да, помещение всех частот mj, mj±1,…,mj±k в набор SC частот;
если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями, то помещение всех частот в кадре в набор SC частот,
где k - неотрицательное целое число.
Упомянутый способ может характеризоваться тем, что упомянутая частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.
Упомянутый способ может характеризоваться тем, что если L1 кадров включают (Р-1)-й кадр, то мощность каждой частоты в (Р-1)-ом кадре вычисляют следующим образом:
| ν ^ р 1 ( m ) | 2 = [ c р 1 ( m ) ] 2 + [ с р 1 ( m + 1 ) с р 1 ( m 1 ) ] 2
Figure 00000001
, где | ν ^ р 1 ( m ) | 2
Figure 00000002
- мощность частоты т в (Р-1)-ом кадре, ср-1(m) - коэффициент MDCT частоты т в (Р-1)-ом кадре, ср-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-ом кадре, cp-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-ом кадре.
Упомянутый способ может характеризоваться тем, что шаг предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST на шаге а включает: использование для каждой предсказываемой частоты фаз L2 кадров перед (Р-1)-ым кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST и
получение амплитуды Р-го кадра на упомянутой частоте в области MDCT-MDST согласно амплитуде одного из L2 кадров на упомянутой частоте в области MDCT-MDST, при этом L2>1.
Упомянутый способ может характеризоваться тем, что, когда L2=2, используют t1-й кадр и t2-й кадр для представления двух кадров, соответственно, и предсказывают фазу Р-го кадра в области MDCT-MDST согласно следующей формуле:
ϕ ^ p ( m ) = ϕ t 1 ( m ) + p t 1 t 1 t 2 [ ϕ t 1 ( m ) ϕ t 2 ( m ) ]
Figure 00000003
,
где ϕ ^ р ( m )
Figure 00000004
- предсказанное значение фазы Р-го кадра в области MDCT-MDST на частоте m, φt1(m) - фаза t1-го кадра на частоте т в области MDCT-MDST и φt2(m) - фаза f2-го кадра на частоте m в области MDCT-MDST.
Упомянутый способ может характеризоваться тем, что, когда L2>2, для каждой предсказываемой частоты выполняют линейную аппроксимацию фаз L2 кадров перед (Р-1)-ым кадром на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.
Упомянутый способ может характеризоваться тем, что на шаге а получают набор предсказываемых частот путем использования комплексных сигналов в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициента MDCT (Р-1)-го кадра и для каждой частоты в наборе SC частот предсказывают фазу и амплитуду Р-го кадра в области MDCT-MDST путем использования фаз и амплитуд (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST.
Упомянутый способ может характеризоваться тем, что на шаге b в качестве коэффициента MDCT Р-го кадра используют половину коэффициента MDCT (Р-1)-го кадра.
Предлагается также компенсатор потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, содержащий модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, в котором
модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы, когда текущий потерянный кадр является Р-ым кадром, получать набор предсказываемых частот и для каждой частоты в наборе предсказываемых частот использовать фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой упомянутой частоте и передавать коэффициент MDCT во второй модуль компенсации, при этом (Р-1)-й кадр предшествует Р-му кадру;
второй модуль компенсации сконфигурирован так, чтобы для любой частоты вне набора предсказываемых частот в кадре использовать коэффициенты MDCT множества кадров перед Р-ым кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте и передавать коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT;
модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.
Упомянутый компенсатор потери кадров может характеризоваться тем, что он также включает модуль определения типа кадра, который сконфигурирован так, чтобы при обнаружении потери кадра определять тип текущего потерянного кадра и подавать команду модулю компенсации потери кадров с множеством гармоник на выполнение компенсации, если текущий потерянный кадр является кадром с множеством гармоник.
Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль определения типа кадра сконфигурирован для определения типа текущего потерянного кадра путем вычисления равномерности спектра каждого кадра из K кадров перед текущим потерянным кадром; при этом если число кадров, равномерность спектра которых меньше порогового значения, меньше K0 в K кадрах, то текущий потерянный кадр является кадром без множества гармоник; а если число кадров, равномерность спектра которых меньше порогового значения, больше K0, то текущий потерянный кадр является кадром с множеством гармоник, при этом K0≤K, где K0, K - натуральные числа.
Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль компенсации потери кадров с множеством гармоник содержит блок генерации набора частот, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации набора частот использовать комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-ым кадром для получения набора SC предсказываемых частот или непосредственно помещать все частоты в кадре в набор SC предсказываемых частот.
Упомянутый компенсатор потери кадров может характеризоваться тем, что блок генерации набора частот сконфигурирован для использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-ым кадром для получения набора SC предсказываемых частот путем
назначения множества кадров перед Р-ым кадром как L1 кадров, вычисления мощности каждой частоты в L1 кадрах, получения L1 наборов S1,…,SL1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число соответствующих частот в каждом наборе составляет N1,…,NL1, соответственно;
выбора набора Si из L1 наборов S1,…SL1, для каждой частоты mj, j=1…Ni с пиковым значением в наборе Si, определения, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот mj, mj±1,…,mj±k, если да, помещения всех частот mj, mj±1,…,mj±k в набор SC частот;
если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями для каждой частоты mj, j=1…Ni с пиковым значением в наборе Si, помещения всех частот в кадре в набор SC частот, где k - неотрицательное целое число.
Упомянутый компенсатор потери кадров может характеризоваться тем, что частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.
Упомянутый компенсатор потери кадров может характеризоваться тем, что блок генерации набора частот сконфигурирован так, чтобы, когда L1 кадров включают (Р-1)-й кадр, вычислять мощность каждой частоты в (Р-1)-ом кадре следующим образом:
| ν ^ р 1 ( m ) | 2 = [ с р 1 ( m ) ] 2 + [ с р 1 ( m + 1 ) с р 1 ( m 1 ) ] 2
Figure 00000005
, где | ν ^ р 1 ( m ) | 2
Figure 00000006
- мощность частоты m в (Р-1)-ом кадре, ср-1(m) - коэффициент MDCT частоты m в (Р-1)-ом кадре, cp-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-ом кадре, cp-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-ом кадре.
Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль компенсации потери кадров с множеством гармоник также содержит блок генерации коэффициентов, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации коэффициентов использовать фазы и амплитуды L2 кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды каждой частоты, принадлежащей набору предсказываемых частот в Р-ом кадре, использовать предсказанную фазу и амплитуду Р-го кадра для получения коэффициента MDCT Р-го кадра, соответствующего каждой частоте, и передавать коэффициент MDCT во второй модуль компенсации, при этом L2>1;
блок генерации коэффициентов содержит субблок предсказания фазы и субблок предсказания амплитуды, причем
субблок предсказания фазы сконфигурирован так, чтобы для предсказываемой частоты использовать фазы L2 кадров на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST,
субблок предсказания амплитуды сконфигурирован так, чтобы получать амплитуду Р-го кадра на упомянутой частоте в области MDCT-MDST из амплитуды одного из L2 кадров на упомянутой частоте в области MDCT-MDST.
Упомянутый компенсатор потери кадров может характеризоваться тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2=2, предсказывать фазу Р-го кадра в области MDCT-MDST согласно следующей формуле:
ϕ ^ p ( m ) = ϕ t 1 ( m ) + p t 1 t 1 t 2 [ ϕ t 1 ( m ) ϕ t 2 ( m ) ]
Figure 00000007
,
где t1-й кадр и t2-й кадр представляют два кадра перед (Р-1)-ым кадром, ϕ ^ р ( m )
Figure 00000008
- предсказываемое значение фазы Р-го кадра на частоте m в области MDCT-MDST, φt1(m) - фаза t1-го кадра на частоте т в области MDCT-MDST и φt2(m) - фаза f2-го кадра на частоте m в области MDCT-MDST.
Упомянутый компенсатор потери кадров может характеризоваться тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2>2, предсказывать фазу Р-го кадра в области MDCT-MDST путем выполнения для предсказываемой частоты линейной аппроксимации фаз выбранных L2 кадров на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.
Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы использовать комплексные сигналы в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициенты MDCT (Р-1)-го кадра для получения набора предсказываемых частот и использовать фазы и амплитуды (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST для каждой частоты в наборе частот.
Упомянутый компенсатор потери кадров может характеризоваться тем, что второй модуль компенсации сконфигурирован так, чтобы использовать половину значения коэффициента MDCT (Р-1)-го кадра в качестве значения коэффициента MDCT Р-го кадра на частоте вне набора предсказываемых частот.
Посредством предлагаемых в настоящем изобретении компенсатора и способа компенсации потери кадров звукового сигнала в области MDCT для случая без множества гармоник коэффициент MDCT текущего потерянного кадра получают путем использования значений коэффициента MDCT множества кадров перед текущим потерянным кадром, а для случая с множеством гармоник коэффициент MDCT текущего потерянного кадра получают с помощью характеристики текущего потерянного кадра в области MDCT-MDST. По сравнению с известным уровнем техники изобретение имеет преимущества отсутствия задержки, малого объема вычисления, малого объема пространства памяти, простой реализации и т.д.
Краткое описание чертежей
На фиг.1 показана схема последовательности кадров, используемая в настоящем изобретении.
На фиг.2 показана блок-схема способа компенсации потери кадров звукового сигнала в области MDCT согласно настоящему изобретению.
На фиг.3 показана блок-схема для определения кадра с множеством гармоник/кадра без множества гармоник согласно настоящему изобретению.
На фиг.4 показана блок-схема способа компенсации потери кадров с множеством гармоник согласно настоящему изобретению.
На фиг.5 показана блок-схема способа вычисления коэффициента MDCT для компенсации потери кадров с множеством гармоник согласно примеру 1 изобретения.
На фиг.6 показана структурная схема компенсатора потери кадров звукового сигнала в области MDCT согласно настоящему изобретению.
На фиг.7 показана структурная схема компенсатора потери кадров звукового сигнала в области MDCT в другом примере изобретения.
На фиг.8 показана структурная схема компенсатора потери кадров звукового сигнала в области MDCT в еще одном примере изобретения.
Предпочтительные формы осуществления изобретения
Основная идея изобретения состоит в следующем: предсказывают фазу и амплитуду в области MDCT-MDST для текущего потерянного кадра с помощью использования линейности фазы гармонического сигнала в области MDCT-MDST и информации множества кадров перед текущим потерянным кадром и таким образом получают коэффициент MDCT для текущего потерянного кадра, согласно которому затем получают сигнал во временной области для текущего потерянного кадра.
Предлагается способ компенсации потери кадров звукового сигнала в области MDCT, показанный на фиг.2 и включающий:
Шаг S1, на котором, при обнаружении того, что пакет данных текущего кадра потерян, на декодирующем конце обозначают текущий кадр как текущий потерянный кадр, определяют тип текущего потерянного кадра и осуществляют переход к шагу S2, если текущий потерянный кадр является кадром без множества гармоник, или, в противном случае, переход к шагу S3;
при этом операция определения типа текущего потерянного кадра, которую выполняют согласно коэффициентам MDCT К кадров перед текущим потерянным кадром, как показано на фиг.3, включает:
1а) вычисление равномерности спектра каждого кадра из К кадров перед текущим потерянным кадром и определение того, что кадр состоит главным образом из множества гармоник и является кадром стационарного сигнала с множеством гармоник, если равномерность спектра меньше заранее заданного порога;
1b) если число кадров стационарного сигнала с множеством гармоник в К кадрах меньше или равно K0 кадрам, считают, что текущий потерянный кадр является кадром без множества гармоник, или, в противном случае, текущий потерянный кадр является кадром с множеством гармоник (таким как музыкальный кадр), при этом K0≤K, где K0 и K - заранее заданные значения.
Изобретение не ограничено использованием показанного на фиг.3 способа определения типа текущего потерянного кадра, и для определения также могут использоваться другие способы, например, без ограничения этим, коэффициент перехода через ноль (zero-pass ratio).
Шаг S2. Если определяют, что текущий потерянный кадр является кадром без множества гармоник, то используют значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициентов MDCT текущего потерянного кадра для каждой частоты в кадре, затем осуществляют переход к шагу S4.
Например, в качестве значения коэффициента MDCT текущего потерянного кадра используют половину или другие отношения значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру.
Шаг S3. Если определяют, что текущий потерянный кадр является кадром с множеством гармоник, то посредством оценки получают значение коэффициента МОСТ текущего потерянного кадра с использованием алгоритма компенсации потери кадров с множеством гармоник без задержки, который показан на фиг.4 и, в частности, включает:
3а) когда потерян Р-й кадр, то есть текущий потерянный кадр является Р-ым кадром, взятие L1 кадров перед Р-ым кадром.
Если L1 кадров включают (Р-1)-й кадр, используют алгоритм быстрого модифицированного дискретного синусного преобразования (Fast Modified Discrete Sine Transform, FMDST) для получения коэффициентов MDST L1-1 кадров из L1 кадров за исключением (Р-1)-го кадра согласно коэффициентам MDCT, полученным посредством декодирования кадров перед текущим потерянным кадром. Для каждого кадра в L1-1 кадрах комплексный сигнал в области MDCT-MDST каждого кадра включает коэффициент MDST и коэффициент MDCT кадра, где коэффициент MDCT - параметр вещественной части, а коэффициент MDST - параметр мнимой части.
Если L1 кадров не содержат (Р-1)-й кадр, используют алгоритм FMDST для получения коэффициентов MDST L1 кадров согласно коэффициентам MDCT, полученным посредством декодирования кадров перед текущим потерянным кадром. Для каждого кадра в L1 кадрах комплексный сигнал в области MDCT-MDST каждого кадра включает коэффициент MDST и коэффициент MDCT кадра, где коэффициент MDCT - параметр вещественной части, а коэффициент MDST - параметр мнимой части.
При этом способ вычисления коэффициента MDST включает:
выполнение обратного преобразования MDCT для получения сигнала во временной области для (Р-2)-го кадра согласно коэффициентам MDCT (Р-1)-го кадра и (Р-2)-го кадра и выполнение обратного преобразования MDCT для получения сигнала во временной области для (Р-3)-го кадра согласно коэффициентам MDCT (Р-2)-го кадра и (Р-3)-го кадра и т.д.;
использование алгоритма FMDST для получения коэффициента MDST (Р-2)-го кадра согласно сигналам во временной области для (Р-2)-го кадра и (Р-3)-го кадра и использование алгоритма FMDST для получения коэффициента MDST (Р-3)-го кадра согласно сигналам во временной области для (Р-3)-го кадра и (Р-4)-го кадра и т.д.
Последовательность Р-го кадра, (Р-1)-го кадра и других кадров показана на фиг.1.
3b) Нахождение набора частот с пиковыми значениями для каждого кадра в упомянутых L1 кадрах.
Если L1 кадров содержат (Р-1)-й кадр, то
для (Р-1)-го кадра вычисляют мощность каждой частоты в (Р-1)-ом кадре согласно коэффициенту MDCT (Р-1)-го кадра и получают набор, включающий множество предыдущих частот, имеющих самую большую мощность;
для каждого другого кадра, кроме (Р-1)-го кадра, вычисляют мощность каждой частоты в кадре согласно комплексному сигналу кадра в области MDCT-MDST и получают набор, включающий множество предыдущих частот, имеющих самую большую мощность; при этом частота с пиковым значением относится к частоте, мощность сигнала на которой больше мощности сигнала на двух соседних с ней частотах.
Если L1 кадров не содержат (Р-1)-й кадр, то
для каждого кадра в L1 кадрах набор, включающий множество предыдущих частот, имеющих самые большие значения мощности, получают согласно комплексному сигналу кадра в области MDCT-MDST,
при этом число частот в L1 наборах может быть одинаковым или различным.
Наборы L1 также могут быть получены другими способами, например, для каждого кадра берут набор, включающий частоты с пиковыми значениями, мощности которых больше установленного порога, при этом порог для каждого кадра может быть одинаковым или различным.
3с) Если L1>1, и L1 наборов частот обозначены как S1,…,SL1, и число соответствующих частот в наборах составляет N1,…,NL1, выбирают набор Si и для каждой частоты mj (j=1…Ni) с пиковыми значениями в наборе Si определяют, принадлежит ли какая-либо частота среди частот mj, mj±1,…,mj±K (K - неотрицательное целое число, обычно K=0 или 1) одновременно всем другим наборам частот с пиковыми значениями, если да, помещают все частоты mj, mj±1,…,mj±k в набор SC частот.
Если среди частот mj, mj±1,…mj±К для каждой частоты mj (j=1…Ni) с пиковым значением в наборе Si нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями, все частоты в кадре непосредственно помещают в набор SC частот.
Если L1=1, и набор частот обозначен как S1, а соответствующее число частот равно N1, для каждой частоты mi (i=1…N1) с пиковым значением в наборе S1 частот с пиковыми значениями все частоты mi, mi±1,…mi±K (K - неотрицательное целое число, которое обычно выбирается как K=0 или 1) помещают в набор SC частот.
Вышеупомянутые разделы шагов 3а, 3b и 3с также можно не выполнять и непосредственно помещать все частоты в кадре в набор SC частот.
3d) Берут L2 (L2>1) кадров перед (Р-1)-ым кадром, вычисляют и получают комплексные сигналы L2 кадров в области MDCT-MDST (кокретный способ вычисления такой же, как на шаге 3а). Для каждой частоты в наборе SC частот получают фазу текущего потерянного кадра в области MDCT-MDST, используя фазы L2 кадров в области MDCT-MDST, и получают амплитуду текущего потерянного кадра в области MDCT-MDST, используя амплитуды L2 кадров в области MDCT-MDST, и затем получают коэффициент MDCT текущего потерянного кадра, соответствующий каждой частоте, согласно фазе и амплитуде текущего потерянного кадра.
Если L2=2, то для всех частот в наборе SC частот используют фазы двух выбранных кадров на каждой предсказываемой частоте, чтобы выполнить линейную экстраполяцию для получения фазы комплексного сигнала в области MDCT-MDST для текущего потерянного кадра на этой частоте; получают амплитуду комплексного сигнала в области MDCT-MDST для текущего потерянного кадра на упомянутой частоте из амплитуды в области MDCT-MDST одного из двух кадров на этой частоте, то есть используют амплитуду в области MDCT-MDST одного из двух кадров на данной частоте в качестве амплитуды в области MDCT-MDST для текущего потерянного кадра на этой частоте.
Один из способов линейной экстраполяции заключается в следующем.
Если L2=2, f1-и кадр и t2-й кадр используют для представления двух кадров, соответственно, фазу Р-го кадра в области MDCT-MDST предсказывают для предсказываемой частоты т следующим образом: ϕ ^ p ( m ) = ϕ t 1 ( m ) + p t 1 t 1 t 2 [ ϕ t 1 ( m ) ϕ t 2 ( m ) ]
Figure 00000009
, где ϕ ^ р ( m )
Figure 00000010
- предсказываемое значение фазы Р-го кадра в области MDCT-MDST на частоте m, φt1(m) - фаза t1-го кадра в области MDCT-MDST на частоте m и φt2(m) - фаза t2-го кадра в области MDCT-MDST на частоте m.
Если L2>2, то для всех частот в наборе SC используют фазы в области MDCT-MDST для L2 кадров на каждой предсказываемой частоте, чтобы выполнить линейную аппроксимацию для получения фазы комплексного сигнала в области MDCT-MDST для текущего потерянного кадра на упомянутой частоте; получают амплитуду комплексного сигнала в области MDCT-MDST текущего потерянного кадра на упомянутой частоте из амплитуды в области MDCT-MDST одного из двух кадров на этой частоте, то есть используют амплитуду в области MDCT-MDST одного из двух кадров на упомянутой частоте в качестве амплитуды в области MDCT-MDST текущего потерянного кадра на этой частоте.
3е) Для частоты вне набора SC частот вычисляют значения коэффициентов MDCT Р-го кадра, используя значения коэффициентов MDCT множества кадров перед Р-ым кадром. Например, в качестве значения коэффициента MDCT текущего потерянного кадра используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру.
В другом примере изобретения на шаге S3 или перед шагом 3а выполняют шаг использования значений коэффициентов MDCT множества кадров перед текущим потерянным кадром, чтобы вычислить значение коэффициента MDCT текущего потерянного кадра для каждой частоты в кадре, и затем выполняют шаги 3а, 3b, 3с и 3d, а шаг 3е пропускают для перехода к шагу S4.
Могут быть выполнены и другие изменения, например, шаг 3е может быть выполнен после шага 3с и перед шагом S4, то есть только после того, как получен набор SC частот.
Шаг S4. Выполняют преобразование IMDCT (обратное преобразование MDCT) для коэффициентов MDCT текущего потерянного кадра на всех частотах, чтобы получить сигнал во временной области для текущего потерянного кадра.
Приведенный пример может быть изменен следующим образом: сначала выполняют начальную компенсацию, то есть вычисляют значение коэффициента MDCT Р-го кадра, используя значения коэффициентов MDCT множества кадров перед Р-ым кадром, затем определяют тип текущего потерянного кадра и выполняют различные шаги согласно типу текущего потерянного кадра; непосредственно выполняют шаг S4, если кадр является кадром без множества гармоник, а если кадр является кадром с множеством гармоник, выполняют на шаге S3 шаги 3а, 3b, 3с и 3d и тогда пропускают шаг 3е, чтобы непосредственно выполнить шаг S4.
Далее изобретение будет пояснено на двух конкретных примерах.
Пример 1
Шаг 110. При обнаружении потери пакета данных текущего кадра декодирующий конец определяет, является ли текущий кадр (то есть текущий потерянный кадр) кадром с множеством гармоник (например, музыкальный кадр, включающий различные гармоники), и выполняет шаг 120, если текущий кадр является кадром без множества гармоник, или, в противном случае, выполняет шаг 130.
Конкретный способ оценки включает
вычисление равномерности спектра 10 кадров перед текущим потерянным кадром, при этом, если равномерность спектра меньше 0,1, считают, что кадр является кадром стационарного сигнала с множеством гармоник; если более 8 кадров в 10 кадрах перед потерянным кадром являются кадрами стационарного сигнала с множеством гармоник, считают, что текущий потерянный кадр является кадром с множеством гармоник, в противном случае считают, что текущий потерянный кадр является кадром без множества гармоник. Способ вычисления равномерности спектра состоит в следующем:
равномерность спектра i-го кадра SFMi определяют как отношение среднего геометрического к среднему арифметическому амплитуды сигнала в области преобразования сигнала i-го кадра:
S F M i = G i A i ,                                                                                     ( 1 )
Figure 00000011
где G i = ( m = 0 M 1 | c i ( m ) | ) 1 M
Figure 00000012
- среднее геометрическое амплитуды сигнала i-го кадра, A i = 1 M m = 0 M 1 | c i ( m ) |
Figure 00000013
- среднее арифметическое амплитуды сигнала i-го кадра, ci(m) - коэффициент MDCT i-го кадра на частоте m, и М - длина кадра сигнала в области MDCT.
Шаг 120. Если определяют, что текущий потерянный кадр является кадром без множества гармоник, в качестве значения коэффициента MDCT текущего потерянного кадра для каждой частоты в кадре используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру, то есть
c р ( m ) = 0,5 * c р 1 ( m ) ,                                                                             ( 2 )
Figure 00000014
где m=0, 1, 2, 3…М-1,
затем выполняют шаг 140.
Шаг 130. Если определяют, что текущий потерянный кадр является кадром с множеством гармоник, коэффициент MDCT текущего потерянного кадра получают с использованием алгоритма компенсации потери кадров с множеством гармоник без задержки и выполняют шаг 140.
Конкретный способ использования алгоритма компенсации потери кадров с множеством гармоник без задержки для получения коэффициента MDCT текущего потерянного кадра показан на фиг.5 и заключается в следующем:
если пакет данных Р-го кадра потерян, сначала в качестве значения коэффициента MDCT Р-го кадра на упомянутой частоте для всех частот в кадре используют половину значения коэффициента MDCT (Р-1)-го кадра на упомянутой частоте, как указано в формуле (2);
затем используют алгоритм FMDST, чтобы получить коэффициенты MDST sP-2(m) и sP-3(m) (Р-2)-го кадра и (Р-3)-го кадра согласно коэффициентам MDCT, которые получены посредством декодирования кадров перед текущим потерянным кадром. Полученные коэффициенты MDST (Р-2)-го кадра и (Р-3)-го кадра и коэффициенты MDCT (P-2)-го кадра и (Р-3)-го кадра сР-2(m) и сР-3(m) составляют комплексные сигналы в области MDCT-MDST:
ν p 2 ( m ) = c р 2 ( m ) + j s р 2 ( m ) ,                                                                ( 3 )
Figure 00000015
ν р 3 ( m ) = c р 3 ( m ) + j s р 3 ( m ) ,                                                                  ( 4 )
Figure 00000016
где j - символ мнимого числа;
вычисляют мощность каждой частоты в (Р-2)-ом кадре и (Р-3)-ом кадре, составляют наборы mp-2, mp-3 частот, беря первые 10 частот с пиковыми значениями, имеющих самую большую мощность соответственно в (Р-2)-ом кадре и (Р-3)-ом кадре (если число частот с пиковыми значениями в каком-либо кадре меньше 10, берут все частоты с пиковыми значениями в этом кадре);
оценивают мощность каждой частоты в (Р-1)-ом кадре согласно коэффициенту MDCT (Р-1)-го кадра:
| ν ^ р 1 ( m ) | 2 = [ c р 1 ( m ) ] 2 + [ c р 1 ( m + 1 ) c р 1 ( m 1 ) ] 2 ,                                     ( 5 )
Figure 00000017
где | ν ^ р 1 ( m ) | 2
Figure 00000018
- мощность (Р-1)-го кадра на частоте m, cp-1(m+1) - коэффициент MDCT (Р-1)-го кадра на частоте m+1, и далее аналогично;
получают посредством вычисления первые 10 частот m i р 1
Figure 00000019
, i=1…10 с пиковыми значениями, имеющих самую большую мощность в (Р-1)-ом кадре, при этом, если число частот с пиковыми значениями в каком-либо кадре меньше 10, берут все частоты m i р 1
Figure 00000020
, i=1…Np-1 с пиковыми значениями в кадре;
для каждой частоты m i р 1
Figure 00000021
определяют, принадлежат ли какая-либо из частот m i р 1
Figure 00000022
, m i р 1 ± 1
Figure 00000023
(частоты вблизи частоты с пиковым значением добавляют к набору частот с пиковыми значениями (Р-1)-го кадра, поскольку их мощность также может быть очень большой) наборам mp-2, mp-3 одновременно, если да, получают фазу и амплитуду комплексного сигнала в области MDCT-MDST для Р-го кадра на частотах m i р 1
Figure 00000024
, m i р 1 ± 1
Figure 00000025
, (следующее вычисление выполняют для всех трех частот m i р 1
Figure 00000026
, m i р 1 ± 1
Figure 00000027
при условии, что одна из частот m i р 1
Figure 00000028
, m i р 1 ± 1
Figure 00000029
принадлежит наборам mp-2, mp-3 одновременно) согласно следующим формулам (6)-(11):
ϕ р 2 ( m ) = ν р 2 ( m ) ,                                                                                    ( 6 )
Figure 00000030
ϕ р 3 ( m ) = ν р 3 ( m ) ,                                                                                 ( 7 )
Figure 00000031
А р 2 ( m ) = | ν р 2 ( m ) | ,                                                                                  ( 8 )
Figure 00000032
А р 3 ( m ) = | ν р 3 ( m ) | ,                                                                                  ( 9 )
Figure 00000033
φ ^ р ( m ) = φ р 2 ( m ) + 2 [ φ р 2 ( m ) φ р 3 ( m ) ] ,                                                   ( 10 )
Figure 00000034
А ^ р ( m ) = А р 2 ( m ) ,                                                                                    ( 11 )
Figure 00000035
где φ, A - фаза и амплитуда, соответственно, ϕ ^ р ( m )
Figure 00000036
- фаза Р-го кадра на частоте m, ϕ ^ р 2 ( m )
Figure 00000037
- фаза (Р-2)-го кадра на частоте m, ϕ ^ р 3 ( m )
Figure 00000038
- фаза (Р-3)-го кадра на частоте m, А ^ р ( m )
Figure 00000039
- амплитуда Р-го кадра на частоте m и А ^ р 2 ( m )
Figure 00000040
- амплитуда (Р-2)-го кадра на частоте m, и далее аналогично;
соответственно, коэффициент MDCT Р-го кадра на частоте m, получаемый посредством компенсации, определяется выражением
c ^ р ( m ) = А ^ р ( m ) cos [ ϕ ^ р ( m ) ] .                                                                           ( 12 )
Figure 00000041
Если нет частоты из всех частот m i р 1
Figure 00000042
, m i р 1 ± 1
Figure 00000043
, принадлежащей наборам mp-2, mp-3 одновременно, оценивают коэффициенты MDCT для всех частот текущего потерянного кадра по формулам (6)-(12).
Операцию вычисления предсказываемых частот также можно не выполнять и непосредственно оценивать коэффициенты MDCT по формулам (6)-(12) для всех частот в текущем потерянном кадре.
Шаг 140. Выполняют преобразование IMDCT для коэффициентов MDCT текущего потерянного кадра на всех частотах, чтобы получить сигнал во временной области для текущего потерянного кадра.
Пример 2
Шаг 210. При обнаружении потери пакета данных текущего кадра декодирующий конец определяет, является ли текущий кадр (то есть текущий потерянный кадр) кадром с множеством гармоник (например, музыкальным кадром, включающим различные гармоники), и выполняет шаг 220, если текущий кадр является кадром без множества гармоник, или, в противном случае, выполняет шаг 230.
Конкретный способ определения, является ли текущий потерянный кадр кадром с множеством гармоник, состоит в следующем:
вычисляют равномерность спектра 10 кадров перед текущим потерянным кадром и для каждого кадра полагают, что кадр является кадром стационарного сигнала с множеством гармоник, если равномерность спектра меньше 0,1; если более 8 кадров в 10 кадрах перед потерянным кадром являются кадрами стационарного сигнала с множеством гармоник, считают, что текущий потерянный кадр является кадром с множеством гармоник, в противном случае считают, что текущий потерянный кадр является кадром без множества гармоник. Способ вычисления равномерности спектра состоит в следующем:
равномерность спектра i-го кадра SFMi определяют как отношение среднего геометрического к среднему арифметическому амплитуды сигнала в области преобразования сигнала i-го кадра:
S F M i = G i A i ,                                                                                               ( 13 )
Figure 00000044
где G i = ( m = 0 M 1 | c i ( m ) | ) 1 M
Figure 00000045
- среднее геометрическое амплитуды сигнала i-го кадра, A i = 1 M m = 0 M 1 | c i ( m ) |
Figure 00000046
- среднее арифметическое амплитуды сигнала i-го кадра, ci(m) - коэффициент MDCT i-го кадра на частоте m, и М - длина кадра сигнала в области MDCT.
Шаг 220. Если определяют, что текущий потерянный кадр является кадром без множества гармоник, то в качестве значения коэффициента MDCT текущего потерянного кадра для каждой частоты в кадре используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру, то есть
c р ( m ) = 0,5 * c р 1 ( m ) ,                                                                                  ( 14 )
Figure 00000047
где m=0, 1, 2, 3…M-1,
затем выполняют шаг 240.
Шаг 230. Если определяют, что текущий потерянный кадр является кадром с множеством гармоник, то коэффициент MDCT текущего потерянного кадра получают с использованием алгоритма компенсации потери кадров с множеством гармоник без задержки и выполняют шаг 240.
Конкретный способ использования алгоритма компенсации потери кадров с множеством гармоник без задержки для получения коэффициента MDCT текущего потерянного кадра заключается в следующем: когда пакет данных Р-го кадра потерян, то используют алгоритм FMDST, чтобы получить коэффициенты MDST sP-2(m), sP-3(m) и sP-4(m) (Р-2)-го кадра, (Р-3)-го кадра и (Р-4)-го кадра согласно коэффициентам MDCT, которые получены посредством декодирования кадров перед текущим потерянным кадром. Полученные коэффициенты MDST (Р-2)-го кадра, (Р-3)-го кадра и (Р-4)-го кадра и коэффициенты MDCT (Р-2)-го кадра, (Р-3)-го кадра и (Р-4)-го сР-2(m), cP-3(m) и cP-4(m) составляют комплексные сигналы в области MDCT-MDST:
ν р 2 ( m ) = c р 2 ( m ) + j s р 2 ( m ) ,                                                                 ( 15 )
Figure 00000048
ν р 3 ( m ) = c р 3 ( m ) + j s р 3 ( m ) ,                                                                 ( 16 )
Figure 00000049
ν р 4 ( m ) = c р 4 ( m ) + j s р 4 ( m ) ,                                                                   ( 17 )
Figure 00000050
где j - символ мнимого числа.
Вычисляют мощность каждой частоты в (Р-2)-ом кадре, (Р-3)-ом кадре и (Р-4)-ом кадре | ν р 2 ( m ) | 2
Figure 00000051
, | ν р 3 ( m ) | 2
Figure 00000052
, | ν р 4 ( m ) | 2
Figure 00000053
, составляют наборы mp-2, mp-3, mp-4 частот, беря первые 10 частот с пиковыми значениями, имеющие самую большую мощность соответственно в (Р-2)-ом кадре, (Р-3)-ом кадре и (Р-4)-ом кадре (если число частот с пиковыми значениями в каком-либо кадре меньше 10, берут все частоты с пиковыми значениями в кадре).
Для каждой частоты m i р 4
Figure 00000054
в наборе mp-4 частот определяют, принадлежат ли какие-либо из частот m i р 4
Figure 00000055
, m i р 4 ± 1
Figure 00000056
(частоты вблизи частоты с пиковым значением добавляют к набору частот с пиковыми значениями Р-4-го кадра, поскольку их мощность также может быть очень большой) наборам mp-2, mp-3 одновременно, и, если да, получают фазу и амплитуду комплексного сигнала в области MDCT-MDST для Р-го кадра на частотах m i р 1
Figure 00000057
, m i р 1 ± 1
Figure 00000058
, (следующее вычисление выполняют для всех трех частот m i р 1
Figure 00000059
, m i р 1 ± 1
Figure 00000060
при условии, что одна из частот m i р 1
Figure 00000061
, m i р 1 ± 1
Figure 00000062
одновременно принадлежит наборам mp-2, mp-3) согласно следующим формулам (18)-(27):
ϕ р 2 ( m ) = ν р 2 ( m ) ,                                                                             ( 18 )
Figure 00000063
ϕ р 3 ( m ) = ν р 3 ( m ) ,                                                                             ( 19 )
Figure 00000064
ϕ р 4 ( m ) = ν р 4 ( m ) ,                                                                            ( 20 )
Figure 00000065
А р 2 ( m ) = | ν р 2 ( m ) | ,                                                                             ( 21 )
Figure 00000066
А р 3 ( m ) = | ν р 3 ( m ) | ,                                                                             ( 22 )
Figure 00000067
А р 4 ( m ) = | ν р 4 ( m ) | ,                                                                             ( 23 )
Figure 00000068
А ^ р ( m ) = А р 2 ( m ) ,                                                                                 ( 24 )
Figure 00000069
где φ, А - фаза и амплитуда, соответственно, ϕ ^ р ( m )
Figure 00000070
- фаза Р-го кадра на частоте m, ϕ ^ р 2 ( m )
Figure 00000071
- фаза (Р-2)-го кадра на частоте m, ϕ ^ р 3 ( m )
Figure 00000072
- фаза (Р-3)-го кадра на частоте m, А ^ р ( m )
Figure 00000073
- амплитуда Р-го кадра на частоте m и А ^ р 2 ( m )
Figure 00000074
- амплитуда (Р-2)-го кадра на частоте m, и далее аналогично;
для вычисления функции линейной аппроксимации фаз различных кадров на одной и той же частоте используют метод наименьших квадратов
ϕ ( m ) = а 0 + а 1 х ,                                                                                      ( 25 )
Figure 00000075
где х - порядковый номер кадра, а0, а1 - коэффициенты функции линейной аппроксимации, которые необходимо вычислить.
Коэффициенты а0, а1 получают из следующей системы формул согласно способу измерения ошибки аппроксимации с использованием критерия наименьших квадратов
[ 3 k = 2 4 p k k = 2 4 p k k = 2 4 ( p k ) 2 ] [ а 0 а 1 ] = [ k = 2 4 ϕ p k ( m ) k = 2 4 ( p k ) ϕ p k ( m ) ] .                                  ( 26 )
Figure 00000076
В других примерах также может измеряться ошибка аппроксимации, и могут оцениваться коэффициенты аппроксимации с использованием других критериев помимо критерия наименьших квадратов. Фаза Р-го кадра на частоте m тогда может оцениваться согласно полученным коэффициентам а0, а1 как
ϕ ^ р ( m ) = а 0 + а 1 р .                                                                                          ( 27 )
Figure 00000077
Соответственно, коэффициент MDCT Р-го кадра на частоте m, получаемый посредством компенсации, равен
c ^ р ( m ) = А ^ р ( m ) cos [ ϕ ^ р ( m ) ] .                                                                     ( 28 )
Figure 00000078
Если какая-либо частота из всех частот m i р 4
Figure 00000079
, m i р 4 ± 1
Figure 00000080
не принадлежит наборам mp-2, mp-3 одновременно, то SC используют для обозначения набора, включающего все частоты, которые скомпенсированы согласно формулам (18)-(28), и в качестве значения коэффициента MDCT текущего потерянного кадра для частоты, которая находится вне набора SC частот в кадре используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру.
Если нет частоты среди всех частот m i р 4
Figure 00000081
, m i р 4 ± 1
Figure 00000082
, принадлежащей наборам mp-2, mp-3 одновременно, то коэффициенты MDCT оценивают для всех частот текущего потерянного кадра по формулам (18)-(28).
Операцию вычисления предсказываемых частот также можно не выполнять и непосредственно оценивать коэффициенты MDCT по формулам (18)-(28) для всех частот в текущем потерянном кадре.
Шаг 240. Выполняют преобразование IMDCT для коэффициентов MDCT текущего потерянного кадра на всех частотах, чтобы получить сигнал во временной области для текущего потерянного кадра.
Также предлагается компенсатор потери кадров звукового сигнала в области MDCT, содержащий модуль определения типа кадра, модуль компенсации потери кадров без множества гармоник, модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, как показано на фиг.6, при этом
модуль определения типа кадра сконфигурирован так, чтобы при обнаружении того, что текущий кадр потерян, определять тип текущего потерянного кадра и подавать модулю компенсации потери кадров без множества гармоник команду на компенсацию, если текущий потерянный кадр является кадром без множества гармоник; подавать модулю компенсации потери кадров с множеством гармоник команду на компенсацию, если текущий потерянный кадр является кадром с множеством гармоник; конкретный способ определения типа текущего потерянного кадра описан ранее и поэтому здесь не приводится;
модуль компенсации потери кадров без множества гармоник сконфигурирован так, чтобы для всех частот в кадре использовать значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициента MDCT текущего потерянного кадра и передавать коэффициент MDCT в модуль IMDCT;
модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы, когда текущий потерянный кадр является Р-ым кадром, получать набор предсказываемых частот и для каждой частоты в наборе предсказываемых частот использовать фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области MDCT-MDST, чтобы предсказывать фазу и амплитуду Р-го кадра в области MDCT-MDST, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой частоте и передавать коэффициент MDCT во второй модуль компенсации, причем (Р-1)-й кадр является кадром, непосредственно предшествующим Р-му кадру;
модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы использовать комплексные сигналы в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициент MDCT (Р-1)-го кадра для получения набора предсказываемых частот и использовать фазы и амплитуды (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST для каждой частоты в наборе частот.
При получении набора предсказываемых частот модуль компенсации потери кадров с множеством гармоник использует комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-ым кадром для получения набора предсказываемых частот или непосредственного помещения всех частот в кадре в набор частот.
Второй модуль компенсации сконфигурирован так, чтобы для частоты вне набора предсказываемых частот в кадре использовать значения коэффициентов MDCT множества кадров перед Р-ым кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте, передавать коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT; кроме того, второй модуль компенсации использует в качестве значения коэффициента MDCT Р-го кадра на частоте вне набора предсказываемых частот половину значения коэффициента MDCT (Р-1)-го кадра.
Модуль компенсации потери кадров с множеством гармоник также содержит блок генерации набора частот и блок генерации коэффициентов, причем
блок генерации набора частот сконфигурирован для генерации набора SC предсказываемых частот;
блок генерации коэффициентов сконфигурирован так, чтобы использовать фазы и амплитуды L2 кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды каждой частоты, принадлежащей набору Sc частот в Р-ом кадре, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой соответствующей частоте и передавать коэффициент MDCT во второй модуль компенсации, причем L2>1.
Блок генерации набора частот сконфигурирован так, чтобы генерировать набор SC предсказываемых частот путем назначения множества кадров перед Р-ым кадром как L1 кадров, вычисления мощности каждой частоты в L1 кадрах и получения наборов S1,…,SL1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число частот, соответствующих каждому набору, составляет N1,…,NL1, соответственно;
выбора набора Si из L1 наборов S1,…,SL1, определения, имеется ли частота среди частот mj, mj±1,…,mj±k, принадлежащая всем другим наборам частот с пиковыми значениями одновременно, для каждой частоты mj, j=1…Ni с пиковым значением в наборе Si, если да, то помещение всех частот mj, mj±1,…,mj±k в набор SC частот;
если нет частоты среди частот mj, mj±1,…,mj±k, принадлежащей всем другим наборам частот с пиковыми значениями одновременно для каждой частоты mj, j=1…Ni с пиковым значением в наборе Si, помещение всех частот в кадре в набор SC частот;
где k - неотрицательное целое число. Частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.
Когда (Р-1)-й кадр входит в состав L1 кадров, блок генерации набора частот вычисляет мощность каждой частоты в (Р-1)-ом кадре следующим образом:
| ν ^ р 1 ( m ) | 2 = [ c р 1 ( m ) ] 2 + [ c р 1 ( m + 1 ) c р 1 ( m 1 ) ] 2
Figure 00000083
, где | ν ^ р 1 ( m ) | 2
Figure 00000084
- мощность частоты m в (Р-1)-ом кадре, ср-1(m) - коэффициент MDCT частоты m в (Р-1)-ом кадре, cp-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-ом кадре, ср-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-ом кадре.
Блок генерации коэффициентов также содержит субблок предсказания фазы и субблок предсказания амплитуды, при этом
субблок предсказания фазы сконфигурирован так, чтобы для предсказываемой частоты использовать фазы Z-2 кадров в области MDCT-MDST на упомянутой частоте для выполнения линейной экстраполяции или линейной аппроксимации, чтобы получить фазу Р-го кадра в области MDCT-MDST на упомянутой частоте;
субблок предсказания амплитуды сконфигурирован так, чтобы получать амплитуду Р-го кадра в области MDCT-MDST на упомянутой частоте из амплитуды одного из L2 кадров в области MDCT-MDST на упомянутой частоте.
Если L2=2, то t1-й кадр и t2-й кадр используют для представления двух кадров соответственно, и субблок предсказания фазы предсказывает фазу Р-го кадра в области MDCT-MDST для предсказываемой частоты m следующим образом: ϕ ^ р ( m ) = ϕ t 1 ( m ) + p t 1 t 1 t 2 [ ϕ t 1 ( m ) ϕ t 2 ( m ) ]
Figure 00000085
, где ϕ ^ р ( m )
Figure 00000086
- предсказываемое значение фазы Р-го кадра в области MDCT-MDST на упомянутой частоте m, φt1(m) - фаза t1-го кадра в области MDCT-MDST на частоте m, и φt2(m) - фаза t2-го кадра в области MDCT-MDST на частоте m.
Если L2>2, субблок предсказания фазы предсказывает фазу Р-го кадра в области MDCT-MDST путем выполнения для предсказываемой частоты линейной аппроксимации фаз выбранных L2 кадров в области MDCT-MDST на упомянутой частоте для получения фазы Р-го кадра в области MDCT-MDST на этой частоте.
Модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.
Компенсатор потери кадров звукового сигнала в области MDCT, показанный на фиг.6, может быть изменен так, как показано на фиг.7, и может содержать модуль определения типа кадра, модуль компенсации потери кадров без множества гармоник, модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, при этом второй модуль компенсации соединен с модулем определения типа кадра и модулем компенсации потери кадров с множеством гармоник, а модуль компенсации потери кадров с множеством гармоник соединен с модулем IMDCT, причем
второй модуль компенсации сконфигурирован так, чтобы для всех частот в кадре использовать значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициента MDCT текущего потерянного кадра и передавать коэффициент MDCT в модуль компенсации потери кадров с множеством гармоник;
модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы получать набор предсказываемых частот и получать коэффициент MDCT Р-го кадра на каждой частоте в наборе предсказываемых частот, при этом конкретный способ является таким же, что и у модуля компенсации потери кадров с множеством гармоник, показанного на фиг.6; для каждой частоты вне набора предсказываемых частот используют коэффициент MDCT, полученный от второго модуля компенсации в качестве коэффициента MDCT Р-го кадра на упомянутой частоте и передают коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT.
Функции других модулей аналогичны функциям модулей, показанных на фиг.6, и поэтому здесь не приводятся.
На фиг.8 показана другая структурная схема компенсатора потери кадров звукового сигнала в области MDCT согласно настоящему изобретению, в которой компенсатор потери кадров звукового сигнала в области MDCT включает модуль компенсации потери кадров без множества гармоник, модуль определения типа кадра, модуль компенсации потери кадров с множеством гармоник и модуль IMDCT, при этом
модуль компенсации потери кадров без множества гармоник сконфигурирован так, чтобы при обнаружении потерянного кадра использовать значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициента MDCT текущего потерянного кадра для всех частот в кадре и передавать коэффициент MDCT в модуль определения типа кадра;
модуль определения типа кадра сконфигурирован так, чтобы определять тип текущего потерянного кадра, и если текущий потерянный кадр является кадром без множества гармоник, то передавать в модуль IMDCT коэффициент MDCT, принятый от модуля компенсации потери кадров без множества гармоник; если текущий потерянный кадр является кадром с множеством гармоник, то передавать коэффициент MDCT в модуль компенсации потери кадров с множеством гармоник; при этом конкретный способ определения типа текущего потерянного кадра описан выше и поэтому здесь не приводится.
Модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы получать набор предсказываемых частот и коэффициент MDCT Р-го кадра на каждой частоте в наборе предсказываемых частот; при этом конкретный способ является таким же, что и у модуля компенсации потери кадров с множеством гармоник, показанного на фиг.6; для каждой частоты вне набора предсказываемых частот используют коэффициент MDCT, полученный от модуля определения типа кадра, в качестве коэффициента MDCT Р-го кадра на упомянутой частоте и передают коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT;
модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT текущего потерянного кадра на всех частотах для получения сигнала во временной области для Р-го кадра.
Способ компенсации и компенсатор потери кадров звукового сигнала, раскрытые в изобретении, могут быть применены для решения задачи компенсации потери кадров звукового сигнала при двусторонней связи в реальном времени, такой как радиосвязь, видеоконференции по протоколу Интернета, а также в области предоставления широковещательных услуг в реальном времени, например, в телевидении по протоколу Интернета (Internet Protocol Television, IPTV), при передаче потоковой мультимедийной информации в системах мобильной связи, в мобильном телевидении и других областях для улучшения защиты от ошибок передаваемого битового потока. Изобретение позволяет хорошо устранять ухудшения качества речи, вызываемые потерей пакета во время передачи по сети звуковых и речевых сигналов, посредством операции компенсации, улучшает комфорт и качество звуковых и речевых сигналов после потери пакета и сильно влияет на восприятие звучания.
Промышленная применимость
По сравнению с известным уровнем техники компенсатор и способ компенсации потери кадров звукового сигнала в области MDCT согласно настоящему изобретению имеют преимущества отсутствия задержки, малого объема вычислений, малого объема пространства памяти, простоты реализации и т.д.

Claims (24)

1. Способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, включающий:
шаг а, на котором, когда текущий потерянный кадр является Р-м кадром, получают набор предсказываемых частот, для каждой частоты в наборе предсказываемых частот используют фазы и амплитуды множества кадров перед (Р-1)-м кадром в области модифицированного дискретного косинусного преобразования - модифицированного дискретного синусного преобразования (MDCT-MDST) для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST и используют предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой частоте, при этом (Р-1)-й кадр предшествует Р-му кадру;
шаг b, на котором для любой частоты в кадре вне набора предсказываемых частот используют коэффициенты MDCT множества кадров перед Р-м кадром для вычисления коэффициента MDCT Р-го кадра на этой частоте;
шаг с, на котором выполняют обратное модифицированное дискретное косинусное преобразование (IMDCT) для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.
2. Способ по п.1, отличающийся тем, что перед шагом а способ также включает, при обнаружении того, что текущий кадр потерян, определение типа текущего потерянного кадра и выполнение шага а, если текущий потерянный кадр является кадром с множеством гармоник.
3. Способ по п.2, отличающийся тем, что шаг определения типа текущего потерянного кадра включает:
вычисление равномерности спектра каждого из К кадров перед текущим потерянным кадром; при этом если число кадров, равномерность спектра которых меньше порогового значения, является меньшим или равным К0 в К кадрах, то текущий потерянный кадр является кадром без множества гармоник, и если число кадров, равномерность спектра которых меньше порогового значения, больше К0, то текущий потерянный кадр является кадром с множеством гармоник, при этом К0<К, где К0, К - натуральные числа.
4. Способ по п.1, отличающийся тем, что шаг получения набора предсказываемых частот на шаге а включает:
использование комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора SC предсказываемых частот или непосредственное помещение всех частот в кадре в набор SC предсказываемых частот.
5. Способ по п.4, отличающийся тем, что шаг использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора SC предсказываемых частот включает:
назначение упомянутого множества кадров перед Р-м кадром как L1 кадров, вычисление мощности каждой частоты в L1 кадрах, получение L1 наборов S1,…, SL1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число частот в каждом наборе составляет N1,…, NL1 соответственно;
выбор набора Si из L1 наборов S1,…, SL1 для каждой частоты mj, j=1,…,Ni с пиковым значением в наборе Si, определение, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот mj, mj±1,…, mj±k,
если да, помещение всех частот mj, mj±1,…, mj±k в набор SC частот;
если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями, то помещение всех частот в кадре в набор SC частот,
где k - неотрицательное целое число.
6. Способ по п.5, отличающийся тем, что упомянутая частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.
7. Способ по п.5, отличающийся тем, что если L1 кадров включают (Р-1)-й кадр, то мощность каждой частоты в (Р-1)-м кадре вычисляют следующим образом
| ν ^ р 1 ( m ) | 2 = [ c р 1 ( m ) ] 2 + [ с р 1 ( m + 1 ) с р 1 ( m 1 ) ] 2
Figure 00000087
, где | ν ^ р 1 ( m ) | 2
Figure 00000088
- мощность частоты m в (Р-1)-м кадре, cp-1(m) - коэффициент MDCT частоты m в (Р-1)-м кадре, cp-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-м кадре, cp-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-м кадре.
8. Способ по любому из пп.1-7, отличающийся тем, что шаг предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST на шаге а включает: использование для каждой предсказываемой частоты фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST и
получение амплитуды Р-го кадра на упомянутой частоте в области MDCT-MDST согласно амплитуде одного из L2 кадров на упомянутой частоте в области MDCT-MDST, при этом L2>1.
9. Способ по п.8, отличающийся тем, что если L2=2, то шаг использования фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST включает:
получение фазы φp(m) Р-го кадра в области MDCT-MDST согласно следующей формуле
ϕ ^ p ( m ) = ϕ t 1 ( m ) + p t 1 t 1 t 2 [ ϕ t 1 ( m ) ϕ t 2 ( m ) ]
Figure 00000089
,
где t1-й кадр и t2-й кадр представляют два кадра перед (Р-1)-м кадром, m - предсказываемая частота, φt1(m) - фаза t1-го кадра на частоте m в области MDCT-MDST и φt2(m) - фаза t2-го кадра на частоте m в области MDCT-MDST.
10. Способ по п.8, отличающийся тем, что если L2>2, то шаг использования фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST включает:
для каждой предсказываемой частоты выполнение линейной аппроксимации фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.
11. Способ по п.4, отличающийся тем, что шаг использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора SC предсказываемых частот включает: использование комплексных сигналов в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициентов MDCT (P-1)-го кадра для получения набора SC предсказываемых частот;
при этом шаг использования фаз и амплитуд множества кадров перед (Р-1)-м кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST включает:
для каждой частоты в наборе SC частот использование фаз и амплитуд (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST.
12. Способ по любому из пп.1-7, отличающийся тем, что шаг использования коэффициентов MDCT множества кадров перед Р-м кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте включает:
использование половины коэффициента MDCT (P-1)-го кадра в качестве коэффициента MDCT Р-го кадра.
13. Компенсатор потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, содержащий модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, при этом
модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы, когда текущий потерянный кадр является Р-м кадром, получать набор предсказываемых частот, для каждой частоты в наборе предсказываемых частот использовать фазы и амплитуды множества кадров перед (Р-1)-м кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой упомянутой частоте и передавать коэффициент MDCT во второй модуль компенсации, при этом (Р-1)-й кадр предшествует Р-му кадру;
второй модуль компенсации сконфигурирован так, чтобы для любой частоты вне набора предсказываемых частот в кадре использовать коэффициенты MDCT множества кадров перед Р-м кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте и передавать коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT;
модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.
14. Компенсатор потери кадров по п.13, также включающий модуль определения типа кадра, который сконфигурирован так, чтобы при обнаружении потери кадра определять тип текущего потерянного кадра и подавать команду модулю компенсации потери кадров с множеством гармоник на выполнение компенсации, если текущий потерянный кадр является кадром с множеством гармоник.
15. Компенсатор потери кадров по п.14, отличающийся тем, что модуль определения типа кадра сконфигурирован для определения типа текущего потерянного кадра путем вычисления равномерности спектра каждого кадра из К кадров перед текущим потерянным кадром; при этом если число кадров, равномерность спектра которых меньше порогового значения, меньше К0 в К кадрах, то текущий потерянный кадр является кадром без множества гармоник; а если число кадров, равномерность спектра которых меньше порогового значения, больше К0, то текущий потерянный кадр является кадром с множеством гармоник, при этом К0≤К, где К0, К - натуральные числа.
16. Компенсатор потери кадров по п.13, отличающийся тем, что модуль компенсации потери кадров с множеством гармоник содержит блок генерации набора частот, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации набора частот использовать комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-м кадром для получения набора SC предсказываемых частот или непосредственно помещать все частоты в кадре в набор SC предсказываемых частот.
17. Компенсатор потери кадров по п.16, отличающийся тем, что блок генерации набора частот сконфигурирован для использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора SC предсказываемых частот путем
назначения множества кадров перед Р-м кадром как L1 кадров, вычисления мощности каждой частоты в L1 кадрах, получения L1 наборов S1,…, SL1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число соответствующих частот в каждом наборе составляет N1,…, NL1 соответственно;
выбора набора Si из L1 наборов S1,…, SL1 для каждой частоты mj, j=1,…,Ni с пиковым значением в наборе Si, определения, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот mj, mj±1,…, mj±k, если да, помещения всех частот mj, mj±1,…, mj±k в набор SC частот;
если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями для каждой частоты mj, j=1,…,N; с пиковым значением в наборе Si, помещения всех частот в кадре в набор SC частот, где k - неотрицательное целое число.
18. Компенсатор потери кадров по п.17, отличающийся тем, что частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.
19. Компенсатор потери кадров по п.17, отличающийся тем, что блок генерации набора частот сконфигурирован так, чтобы, когда L1 кадров включают (Р-1)-й кадр, вычислять мощность каждой частоты в (Р-1)-м кадре следующим образом
| ν ^ р 1 ( m ) | 2 = [ c р 1 ( m ) ] 2 + [ с р 1 ( m + 1 ) с р 1 ( m 1 ) ] 2
Figure 00000087
, где | ν ^ р 1 ( m ) | 2
Figure 00000088
- мощность частоты m в (Р-1)-м кадре, cp-1(m) - коэффициент MDCT частоты m в (Р-1)-м кадре, cp-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-м кадре, cp-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-м кадре.
20. Компенсатор потери кадров по любому из пп.13-19, отличающийся тем, что
модуль компенсации потери кадров с множеством гармоник также содержит блок генерации коэффициентов, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации коэффициентов использовать фазы и амплитуды L2 кадров перед (Р-1)-м кадром в области MDCT-MDST для предсказания фазы и амплитуды каждой частоты, принадлежащей набору предсказываемых частот в Р-м кадре, использовать предсказанную фазу и амплитуду Р-го кадра для получения коэффициента MDCT P-го кадра, соответствующего каждой частоте, и передавать коэффициент MDCT во второй модуль компенсации, при этом L2>1;
блок генерации коэффициентов содержит субблок предсказания фазы и субблок предсказания амплитуды, причем
субблок предсказания фазы сконфигурирован так, чтобы для предсказываемой частоты использовать фазы L2 кадров на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST,
субблок предсказания амплитуды сконфигурирован так, чтобы получать амплитуду Р-го кадра на упомянутой частоте в области MDCT-MDST из амплитуды одного из L2 кадров на упомянутой частоте в области MDCT-MDST.
21. Компенсатор потери кадров по п.20, отличающийся тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2=2, предсказывать фазу Р-го кадра в области MDCT-MDST согласно следующей формуле
ϕ ^ p ( m ) = ϕ t 1 ( m ) + p t 1 t 1 t 2 [ ϕ t 1 ( m ) ϕ t 2 ( m ) ]
Figure 00000089
,
где t1-й кадр и t2-й кадр представляют два кадра перед (Р-1)-м кадром, m - предсказываемая частота, ϕ ^ р ( m )
Figure 00000090
- предсказываемое значение фазы Р-го кадра на частоте m в области MDCT-MDST, φt1(m) - фаза t1-го кадра на частоте m в области MDCT-MDST и φt2(m) - фаза t2-го кадра на частоте m в области MDCT-MDST.
22. Компенсатор потери кадров по п.20, отличающийся тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2>2, предсказывать фазу Р-го кадра в области MDCT-MDST путем выполнения для предсказываемой частоты линейной аппроксимации фаз выбранных L2 кадров на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.
23. Компенсатор потери кадров по п.16, отличающийся тем, что модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы использовать комплексные сигналы в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициенты MDCT (P-1)-го кадра для получения набора предсказываемых частот и использовать фазы и амплитуды (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST для каждой частоты в наборе частот.
24. Компенсатор потери кадров по любому из пп.13-19, отличающийся тем, что второй модуль компенсации сконфигурирован так, чтобы использовать половину значения коэффициента MDCT (P-1)-го кадра в качестве значения коэффициента MDCT Р-го кадра на частоте вне набора предсказываемых частот.
RU2012101259/08A 2009-07-16 2010-02-25 Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования RU2488899C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910158577.4A CN101958119B (zh) 2009-07-16 2009-07-16 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
CN200910158577.4 2009-07-16
PCT/CN2010/070740 WO2011006369A1 (zh) 2009-07-16 2010-02-25 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法

Publications (1)

Publication Number Publication Date
RU2488899C1 true RU2488899C1 (ru) 2013-07-27

Family

ID=43448911

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012101259/08A RU2488899C1 (ru) 2009-07-16 2010-02-25 Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования

Country Status (8)

Country Link
US (1) US8731910B2 (ru)
EP (1) EP2442304B1 (ru)
JP (1) JP5400963B2 (ru)
CN (1) CN101958119B (ru)
BR (1) BR112012000871A2 (ru)
HK (1) HK1165076A1 (ru)
RU (1) RU2488899C1 (ru)
WO (1) WO2011006369A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068578B2 (en) 2013-07-16 2018-09-04 Huawei Technologies Co., Ltd. Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient
RU2666471C2 (ru) * 2014-06-25 2018-09-07 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для обработки потери кадра

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2574168B9 (en) 2010-05-21 2016-10-05 Incyte Holdings Corporation Topical formulation for a jak inhibitor
EP3503098B1 (en) 2011-02-14 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
TWI483245B (zh) 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
EP2676268B1 (en) 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a decoded audio signal in a spectral domain
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
AU2012217215B2 (en) 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
EP2772910B1 (en) * 2011-10-24 2019-06-19 ZTE Corporation Frame loss compensation method and apparatus for voice frame signal
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
CN103854649B (zh) * 2012-11-29 2018-08-28 中兴通讯股份有限公司 一种变换域的丢帧补偿方法及装置
WO2014202770A1 (en) * 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
CN107818789B (zh) * 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
PT3285255T (pt) 2013-10-31 2019-08-02 Fraunhofer Ges Forschung Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
PL3336840T3 (pl) 2013-10-31 2020-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu
CN107004417B (zh) 2014-12-09 2021-05-07 杜比国际公司 Mdct域错误掩盖
US9978400B2 (en) * 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
CN111383643B (zh) * 2018-12-28 2023-07-04 南京中感微电子有限公司 一种音频丢包隐藏方法、装置及蓝牙接收机
CN111883147B (zh) * 2020-07-23 2024-05-07 北京达佳互联信息技术有限公司 音频数据处理方法、装置、计算机设备及存储介质
CN113838477A (zh) * 2021-09-13 2021-12-24 阿波罗智联(北京)科技有限公司 音频数据包的丢包恢复方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007698A1 (fr) * 2006-07-12 2008-01-17 Panasonic Corporation Procédé de compensation des pertes de blocs, appareil de codage audio et appareil de décodage audio
RU2325707C2 (ru) * 2002-05-31 2008-05-27 Войсэйдж Корпорейшн Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания
US7407832B2 (en) * 2005-09-12 2008-08-05 Oki Electric Industry Co., Ltd. Method for manufacturing semiconductor package
CN101308660A (zh) * 2008-07-07 2008-11-19 浙江大学 一种音频压缩流的解码端错误恢复方法
CN101471073A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 一种基于频域的丢包补偿方法、装置和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
JP4536621B2 (ja) * 2005-08-10 2010-09-01 株式会社エヌ・ティ・ティ・ドコモ 復号装置、および復号方法
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR100792209B1 (ko) * 2005-12-07 2008-01-08 한국전자통신연구원 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
PT2109098T (pt) * 2006-10-25 2020-12-18 Fraunhofer Ges Forschung Aparelho e método para gerar amostras de áudio de domínio de tempo
JP2008261904A (ja) * 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
WO2009088257A2 (ko) * 2008-01-09 2009-07-16 Lg Electronics Inc. 프레임 타입 식별 방법 및 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2325707C2 (ru) * 2002-05-31 2008-05-27 Войсэйдж Корпорейшн Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания
US7407832B2 (en) * 2005-09-12 2008-08-05 Oki Electric Industry Co., Ltd. Method for manufacturing semiconductor package
WO2008007698A1 (fr) * 2006-07-12 2008-01-17 Panasonic Corporation Procédé de compensation des pertes de blocs, appareil de codage audio et appareil de décodage audio
CN101471073A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 一种基于频域的丢包补偿方法、装置和系统
CN101308660A (zh) * 2008-07-07 2008-11-19 浙江大学 一种音频压缩流的解码端错误恢复方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068578B2 (en) 2013-07-16 2018-09-04 Huawei Technologies Co., Ltd. Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient
US10614817B2 (en) 2013-07-16 2020-04-07 Huawei Technologies Co., Ltd. Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient
RU2666471C2 (ru) * 2014-06-25 2018-09-07 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для обработки потери кадра
US10311885B2 (en) 2014-06-25 2019-06-04 Huawei Technologies Co., Ltd. Method and apparatus for recovering lost frames
US10529351B2 (en) 2014-06-25 2020-01-07 Huawei Technologies Co., Ltd. Method and apparatus for recovering lost frames

Also Published As

Publication number Publication date
WO2011006369A1 (zh) 2011-01-20
EP2442304A1 (en) 2012-04-18
EP2442304A4 (en) 2015-03-25
US20120109659A1 (en) 2012-05-03
EP2442304B1 (en) 2016-05-11
US8731910B2 (en) 2014-05-20
JP5400963B2 (ja) 2014-01-29
JP2012533094A (ja) 2012-12-20
HK1165076A1 (zh) 2012-09-28
CN101958119B (zh) 2012-02-29
BR112012000871A2 (pt) 2017-08-08
CN101958119A (zh) 2011-01-26

Similar Documents

Publication Publication Date Title
RU2488899C1 (ru) Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования
US11862181B2 (en) Support for generation of comfort noise, and generation of comfort noise
KR101667865B1 (ko) 음성 주파수 신호 처리 방법 및 장치
KR100788706B1 (ko) 광대역 음성 신호의 부호화/복호화 방법
JP4485123B2 (ja) 複数チャネル信号の符号化及び復号化
JP4320033B2 (ja) 音声パケット送信方法、音声パケット送信装置、および音声パケット送信プログラムとそれを記録した記録媒体
JP2019508737A (ja) 複数のハイバンドオーディオ信号のチャネル間符号化および復号
RU2008114382A (ru) Кодер с преобразованием и способ кодирования с преобразованием
JP2016526703A (ja) オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステム
TWI828479B (zh) 用於立體聲解碼之立體聲參數
JP4812230B2 (ja) 複数チャネル信号の符号化及び復号化
TW200838176A (en) Signal-to-noise ratio (SNR) determination in the time domain
JP2004509367A (ja) 複数チャネル信号の符号化及び復号化
RU2491656C2 (ru) Устройство декодирования звукового сигнала и способ регулирования баланса устройства декодирования звукового сигнала
KR20200051620A (ko) 프레임간 시간 시프트 편차들에 대한 채널 조정 방법의 선택
US9093068B2 (en) Method and apparatus for processing an audio signal
US20230402043A1 (en) Noise suppression logic in error concealment unit using noise-to-signal ratio
RU2432624C1 (ru) Способ уменьшения объема данных при широкополосном кодировании речевого сигнала
WO2014101404A1 (zh) 信号带宽扩展方法和用户设备

Legal Events

Date Code Title Description
TK4A Correction to the publication in the bulletin (patent)

Free format text: AMENDMENT TO CHAPTER -FG4A- IN JOURNAL: 21-2013 FOR TAG: (57)