RU2579926C1 - Способ, устройство и система для обработки аудиоданных - Google Patents

Способ, устройство и система для обработки аудиоданных Download PDF

Info

Publication number
RU2579926C1
RU2579926C1 RU2014131387/08A RU2014131387A RU2579926C1 RU 2579926 C1 RU2579926 C1 RU 2579926C1 RU 2014131387/08 A RU2014131387/08 A RU 2014131387/08A RU 2014131387 A RU2014131387 A RU 2014131387A RU 2579926 C1 RU2579926 C1 RU 2579926C1
Authority
RU
Russia
Prior art keywords
frequency band
noise
sid
parameter
frame
Prior art date
Application number
RU2014131387/08A
Other languages
English (en)
Inventor
Чжэ ВАН
Original Assignee
Хуавэй Текнолоджиз Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Хуавэй Текнолоджиз Ко., Лтд. filed Critical Хуавэй Текнолоджиз Ко., Лтд.
Application granted granted Critical
Publication of RU2579926C1 publication Critical patent/RU2579926C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)

Abstract

Изобретение относится к средствам для обработки аудиоданных и к области техники связи. Технический результат заключается в повышении эффективности кодирования. Способ включает в себя: получение шумового кадра аудиосигнала и разложение текущего шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и кодирование и передачу шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование и передачу шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи. Согласно настоящему изобретению различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, вычислительная нагрузка и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, могут помогать достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования. 4 н. и 40 з.п. ф-лы, 9 ил.

Description

[0001] Настоящее изобретение относится к области техники связи и, в частности, к способу, устройству и системе для обработки аудиоданных.
УРОВЕНЬ ТЕХНИКИ
[0002] В области цифровой связи существуют строгие требования к приложениям для передачи речи, изображений, аудио и видео, таким как вызовы с мобильного телефона, аудио/видеоконференц-связь, широковещательное телевидение и мультимедийные развлечения. Речь оцифровывается и затем передается из одного терминала в другой терминал через сеть речевой связи. В данном документе терминалы могут представлять собой мобильные телефоны, цифровые телефонные терминалы или речевые терминалы либо любые другие типы. Примеры цифровых телефонных терминалов представляют собой VoIP-телефоны или ISDN-телефоны, компьютеры и телефоны на основе кабельной связи. Чтобы сокращать ресурсы, занимаемые в процессе сохранения или передачи аудиосигналов, отправляющая сторона выполняет обработку сжатия для аудиосигналов перед передачей аудиосигналов в приемную сторону, и приемная сторона выполняет обработку распаковки, чтобы восстанавливать аудиосигналы и воспроизводить аудиосигналы.
[0003] В речевой связи речь включается только приблизительно 40% времени, а в другое время имеется только молчание или фоновый шум. Чтобы экономить полосы пропускания передачи и не допускать необязательного потребления полос пропускания в период молчания или фонового шума, развивается технология DTX/CNG (на основе системы прерывистой передачи/формирования комфортного шума). Если упрощать, DTX/CNG означает не кодирование кадров шума непрерывно, а выполнение кодирования только один раз за интервал в несколько кадров в период шума/молчания согласно политике, причем скорость передачи кодированных битов, в общем, гораздо ниже скорости передачи битов при речевом кадровом кодировании. Шумовой кадр, кодированный на такой низкой скорости, упоминается как "SID (кадр дескриптора вставки молчания)". Декодер восстанавливает непрерывные фоновые шумовые кадры на стороне декодирования согласно прерывисто принимаемым SID. Такой непрерывно восстановленный фоновый шум не является высококачественным воспроизведением фонового шума стороны кодирования, а нацелен на то, чтобы не допускать результирующего ухудшения качества при прослушивании в максимально возможной степени, так что пользователь чувствует себя комфортно при прослушивании шума. Восстановленный фоновый шум упоминается как "CN (комфортный шум)", а способ для восстановления CN на стороне декодирования упоминается как "формирование комфортного шума".
[0004] В предшествующем уровне техники ITU-T G.718 является новым стандартным широкополосным кодеком, который включает в себя широкополосную DTX/CNG-систему. Система может отправлять SID согласно фиксированному интервалу, а также может адаптивно регулировать интервал отправки SID согласно оцененному уровню шума. SID-кадр G.718 включает в себя 16 ISP-параметров и параметров энергии возбуждения. Эта группа параметров ISP (спектральной пары иммитанса) представляет спектральную огибающую для полосы пропускания всей широкой полосы частот, и энергия возбуждения получается посредством аналитического фильтра, представленного посредством этой группы ISP-параметров. На стороне декодирования G.718 оценивает, согласно ISP-параметрам, полученным посредством декодирования SID в CNG-состоянии, LPC-коэффициент, требуемый для CNG, оценивает, согласно параметрам энергии возбуждения, полученным посредством декодирования SID-кадра, энергию возбуждения, требуемую для CNG, и использует отрегулированный по усилению белый шум для того, чтобы возбуждать синтезирующий CNG-фильтр, чтобы получать восстановленный CN.
[0005] Тем не менее, для сверхширокополосной спектральной огибающей полоса пропускания сверхширокой полосы частот является чрезвычайно широкой; когда предшествующий уровень техники расширяется на сверхширокополосную DTX/CNG-систему, более интенсивные вычислительные нагрузки должны использоваться, и большее число битов должно быть использовано для того, чтобы вычислять и кодировать еще десяток ISP-параметров, поскольку полная сверхширокополосная спектральная огибающая должна быть кодирована для SID. Поскольку сигналы полосы высоких частот шума (которая означает частотный диапазон выше широкой полосы частот в данном документе), в общем, не являются перцепционно чувствительными при прослушивании, используемые вычислительные нагрузки и биты, потребляемые для этой части сигналов, не являются экономически эффективными, в силу этого снижая эффективность кодирования кодека.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0006] Чтобы разрешать проблему при сверхширокополосном кодировании и передаче, варианты осуществления настоящего изобретения предоставляют способ, устройство и систему для обработки аудиоданных. Технические решения заключаются в следующем:
[0007] Согласно одному аспекту способ для обработки аудиоданных предоставляется и включает в себя:
- получение шумового кадра аудиосигнала и разложение шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- кодирование сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и передачу кодированного шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передачу кодированного шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0008] Согласно одному аспекту, способ для обработки аудиоданных предоставляется и включает в себя:
- получение, посредством декодера, кадра SID дескриптора вставки молчания и определение того, включает ли SID в себя параметр полосы низких частот и/или параметр полосы высоких частот;
- когда SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;
- когда SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и
- когда SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получение третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0009] Согласно другому аспекту, устройство для кодирования аудиоданных предоставляется и включает в себя:
- модуль получения, сконфигурированный с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- передающий модуль, сконфигурированный с возможностью кодировать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0010] Согласно другому аспекту, устройство для декодирования аудиоданных предоставляется и включает в себя:
- модуль получения, сконфигурированный с возможностью получать кадр SID дескриптора вставки молчания и определять то, SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот;
- первый модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;
- второй модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и
- третий модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0011] Согласно другому аспекту, система для обработки аудиоданных предоставляется и включает в себя вышеприведенное устройство для кодирования аудиоданных и вышеприведенное устройство для декодирования аудиоданных.
[0012] Технические решения, предоставляемые посредством вариантов осуществления настоящего изобретения, обеспечивают следующие преимущества. Текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи; декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; и различные способы декодирования шума используются согласно различным результатам определения. Таким образом, различные способы обработки кодирования и декодирования используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, могут помогать достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0013] Чтобы более понятно описывать технические решения в вариантах осуществления настоящего изобретения, далее кратко представлены прилагаемые чертежи, требуемые для описания вариантов осуществления. Очевидно, что прилагаемые чертежи в последующем описании показывают только некоторые варианты осуществления настоящего изобретения, и специалисты в данной области техники по-прежнему могут получать другие чертежи из этих прилагаемых чертежей без творческих усилий.
[0014] Фиг. 1 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 1 осуществления настоящего изобретения;
[0015] Фиг. 2 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 2 осуществления настоящего изобретения;
[0016] Фиг. 3 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 3 осуществления настоящего изобретения;
[0017] Фиг. 4 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 4 осуществления настоящего изобретения;
[0018] Фиг. 5 является принципиальной схемой устройства для кодирования аудиоданных согласно варианту 6 осуществления настоящего изобретения;
[0019] Фиг. 6 является принципиальной схемой другого устройства для кодирования аудиоданных согласно варианту 6 осуществления настоящего изобретения;
[0020] Фиг. 7 является принципиальной схемой устройства для декодирования аудиоданных согласно варианту 7 осуществления настоящего изобретения;
[0021] Фиг. 8 является принципиальной схемой другого устройства для декодирования аудиоданных согласно варианту 7 осуществления настоящего изобретения; и
[0022] Фиг. 9 является принципиальной схемой системы для обработки аудиоданных согласно варианту 8 осуществления настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0023] Чтобы делать цели, технические решения и преимущества настоящего изобретения более понятными, далее подробно описываются варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.
Вариант 1 осуществления
[0024] Ссылаясь на Фиг. 1, этот вариант осуществления предоставляет способ для обработки аудиоданных, причем способ включает в себя следующее:
[0025] 101. Получение шумового кадра аудиосигнала и разложение шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.
[0026] 102. Кодирование и передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0027] В этом варианте осуществления первый SID включает в себя параметр полосы низких частот шумового кадра, а второй SID включает в себя параметр полосы низких частот или параметр полосы высоких частот шумового кадра.
[0028] Необязательно, в этом варианте осуществления кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:
- определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0029] Определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, включает в себя:
- получение спектра шумового сигнала полосы высоких частот, разделение спектра, по меньшей мере, на две подполосы частот, и если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определение того, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определение того, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
[0030] Необязательно, в этом варианте осуществления кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:
- формирование отклонения согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и
- определение того, достигает или нет отклонение предварительно установленного порогового значения; если да, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0031] Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0032] Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0033] В этом варианте осуществления формирование отклонения согласно первому отношению и второму отношению включает в себя:
- отдельное вычисление логарифмического значения первого отношения и логарифмического значения второго отношения; и
- вычисление абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
[0034] Необязательно, в этом варианте осуществления кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:
- определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодирование SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.
[0035] Средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.
[0036] В этом варианте осуществления условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.
[0037] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 2 осуществления
[0038] Ссылаясь на Фиг. 2, этот вариант осуществления предоставляет способ для обработки аудиоданных, причем способ включает в себя следующее:
[0039] 201. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот или параметр полосы высоких частот.
[0040] 202. Если SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.
[0041] 203. Если SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.
[0042] 204. Если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получение третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0043] Необязательно, в этом варианте осуществления, если SID включает в себя параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно включает в себя:
- если декодер находится в первом состоянии формирования CNG комфортного шума, переход, посредством декодера, во второе CNG-состояние.
[0044] Необязательно, в этом варианте осуществления, если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, способ дополнительно включает в себя:
- если декодер находится во втором CNG-состоянии, переход, посредством декодера, в первое CNG-состояние.
[0045] Необязательно, в этом варианте осуществления определение того, SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот, включает в себя:
- если число битов SID меньше предварительно установленного первого порогового значения, определение того, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определение того, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определение того, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот; или
- если SID включает в себя первый идентификатор, определение того, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определение того, что SID включает в себя параметр полосы низких частот; и если SID включает в себя третий идентификатор, определение того, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.
[0046] В этом варианте осуществления локальное формирование шумового параметра полосы высоких частот включает в себя:
- отдельное получение средневзвешенной энергии шумового сигнала полосы высоких частот и коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- получение шумового сигнала полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0047] Необязательно, в этом варианте осуществления получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- получение энергии сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;
- вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;
- получение, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- выполнение взвешенного усреднения для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0048] Необязательно, в этом варианте осуществления вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, включает в себя:
- вычисление отношения мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или
- вычисление отношения средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.
[0049] Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.
[0050] Необязательно, в этом варианте осуществления получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- выбор сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и
- получение, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или
- выбор сигналов полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и
- получение, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0051] Необязательно, в этом варианте осуществления получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- распределение M коэффициентов ISF (спектральной частоты иммитанса) или ISP-коэффициентов, или коэффициентов LSF (частоты спектральной линии), или коэффициентов LSP (пары спектральных линий) в частотном диапазоне, соответствующем сигналу полосы высоких частот;
- выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, где M и N являются натуральными числами; и
- получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0052] Необязательно, в этом варианте осуществления получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;
- выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и
- получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0053] Необязательно, в этом варианте осуществления перед получением первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно включает в себя:
- когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножение шумовых сигналов полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и
- соответственно, получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот включает в себя:
- получение четвертого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
[0054] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 3 осуществления
[0055] Этот вариант осуществления предоставляет способ для обработки аудиоданных. На стороне кодирования, независимо от спектра CNG-шума полосы низких частот или спектра CNG-шума полосы высоких частот, в общем, гармоническая структура теряется, и, следовательно, в сигнале полосы высоких частот CNG перцепционно эффективной при прослушивании является, главным образом, энергия сигнала полосы высоких частот CNG, а не спектральная структура сигнала полосы высоких частот CNG. Следовательно, при DTX-передаче сверхширокополосного сигнала, во многих случаях, необязательно передавать спектр сигнала полосы высоких частот в SID; вместо этого, надлежащий способ может быть использован для того, чтобы создавать спектр полосы высоких частот локально на стороне декодирования. Локально созданный спектр полосы высоких частот не должен вызывать очевидное перцепционное искажение. Таким образом, вычислительные нагрузки и биты для вычисления и кодирования спектра полосы высоких частот экономятся на стороне кодирования. Между тем, для других шумовых сигналов гармоническая структура может существовать в сигнале полосы высоких частот, и создание спектра полосы высоких частот локально только на стороне декодирования может вызывать проблему ухудшения перцепционного качества при переключении между CNG-сегментом и речевым сегментом. Следовательно, для такого шума спектральный параметр должен быть передан в SID. Можно видеть, что DTX/CNG-система, которая учитывает как эффективность, так и качество, должна допускать адаптивный выбор кодировать или выбор не кодировать спектральный параметр полосы высоких частот в SID на стороне кодирования согласно признаку полосы высоких частот фонового шума и восстановление CNG-кадра на стороне декодирования посредством использования различных способов декодирования согласно различным типам SID. В этом варианте осуществления способ для обработки аудиоданных предоставляется и включает в себя следующее: спектр полосы высоких частот шума анализируется и классифицируется; декодер вслепую создает спектр сигнала полосы высоких частот; когда SID не включает в себя параметр энергии полосы высоких частот, декодер оценивает энергию сигналов полосы высоких частот; и декодер переключается между различными CNG-модулями, и т.д. Ссылаясь на Фиг. 3, в частности, способ для обработки аудиоданных на стороне кодера согласно этому варианту осуществления включает в себя:
[0056] 301. Кодер получает шумовой кадр аудиосигнала и раскладывает шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.
[0057] В этом варианте осуществления вследствие различных правил кодирования кодера, кодер получает шумовой кадр аудиосигнала, и шумовой кадр может представлять собой текущий шумовой кадр или может представлять собой шумовой кадр, буферизованный на стороне кодера, что не ограничено конкретным образом в этом варианте осуществления. В этом варианте осуществления сверхширокополосные входные аудиосигналы, дискретизированные при 32 кГц, используются в качестве примера. Кодер сначала выполняет обработку кадрирования для входных аудиосигналов, например, 20 мс (или 640 точек дискретизации) используется в качестве кадра. Для текущего кадра (в этом варианте осуществления текущий кадр означает текущий кадр, который должен быть кодирован) кодер сначала выполняет фильтрацию верхних частот. В общем, полоса пропускания означает частоты выше 50 Гц. Фильтрованный по верхним частотам текущий кадр раскладывается на сигнал s0 полосы низких частот и сигнал s1 полосы высоких частот посредством аналитического фильтра на основе квадратурного зеркального фильтра QMF (квадратурного зеркального фильтра). Сигнал s0 полосы низких частот дискретизируется при 16 кГц и представляет спектр 0-8 кГц текущего кадра. Сигнал s1 полосы высоких частот также дискретизируется при 16 кГц и представляет спектр 8-16 кГц текущего кадра. Когда VAD (детектор речевой активности) указывает, что текущий кадр представляет собой кадр приоритетного сигнала, т.е. кадр речевого сигнала, кодер выполняет кодирование речи для текущего кадра. В этом варианте осуществления то, что кодер кодирует кодированный речевой кадр, относится к объему предшествующего уровня техники, и подробности не описываются повторно в этом варианте осуществления. VAD указывает, что кодер переходит в рабочее DTX-состояние, когда текущий кадр представляет собой шумовой кадр. В этом варианте осуществления шумовой кадр означает либо фоновый шумовой кадр, либо кадр молчания.
[0058] В этом варианте осуществления в рабочем DTX-состоянии DTX-контроллер определяет, согласно политике отправки SID, то, следует или нет кодировать и отправлять SID сигнала полосы низких частот текущего кадра. В этом варианте осуществления политика для отправки SID сигнала полосы низких частот заключается в следующем: (1) отправка SID в первом шумовом кадре после кодированного речевого кадра и задание флага flagSID отправки SID равным 1; (2) в период шума, отправка SID-кадра в N-ном кадре после каждого SID-кадра и задание flagSID равным 1 в кадре, где N является целым числом, превышающим 1, и внешне вводится в кодер; и (3) в период шума, невыполнение отправки SID в других кадрах и задание flagSID равным 0. В этом варианте осуществления политика для отправки SID сигнала полосы низких частот является аналогичной политике предшествующего уровня техники и не описывается подробно в настоящем изобретении.
[0059] 302. Определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному условию кодирования и передачи; если да, выполнение этапа 304; если нет, выполнение этапа 303.
[0060] В этом варианте осуществления определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному условию кодирования и передачи, включает в себя: определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан. Определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, включает в себя: получение спектра шумового сигнала полосы высоких частот, разделение спектра, по меньшей мере, на две подполосы частот и, если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определение того, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определение того, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
[0061] В этом варианте осуществления в рабочем DTX-состоянии кодер выполняет спектральный анализ для сигнала s1 полосы высоких частот текущего шумового кадра, чтобы определять то, имеет или нет s1 явную спектральную структуру, т.е. предварительно установленную спектральную структуру. Конкретный способ в этом варианте осуществления заключается в следующем: понижающая дискретизация до 12,8 кГц выполняется для s1, и 256-точечное FFT (быстрое преобразование Фурье) выполняется для сигнала после понижающей дискретизации, чтобы получать спектр C(i), где i=0,…, 127. C(i) разделяется на четыре подполосы частот равной ширины, и вычисляется энергия E(i) каждой подполосы частот. Каждая подполоса частот представляет собой любую вышеупомянутую первую подполосу частот.
Figure 00000001
, где i=0,…, 3, l(i) и h(i), соответственно, представляет верхнюю границу и нижнюю границу i-ой подполосы частот, l(i)={0, 32, 64, 96} и h(i)={31, 63, 95, 127}. Проверяется то, удовлетворяется или нет следующее условие:
E ( i ) E ( j ) j > i
Figure 00000002
(1),
где E(j) представляет собой вторую вышеупомянутую подполосу частот. Если удовлетворяется вышеприведенная формула (1), т.е., если энергия любой первой подполосы частот в подполосах частот не меньше энергии второй подполосы частот в подполосах частот, считается, что сигнал полосы высоких частот не имеет явной спектральной структуры; в противном случае, сигнал полосы высоких частот имеет явную спектральную структуру. Если сигнал полосы высоких частот имеет явную спектральную структуру, DTX-политика отправляет параметр полосы высоких частот. В этом варианте осуществления, если флаг flaghb отправки параметров полосы высоких частот не равен 1, flaghb=1 задается в следующий раз, когда flagSID=1; в противном случае, flaghb=0.
[0062] В этом варианте осуществления, когда удовлетворяется условие отправки SID, то, необходимо или нет кодировать и передавать сигнал полосы высоких частот текущего шумового кадра, может быть определено посредством использования спектральной структуры сигнала полосы высоких частот текущего шумового кадра, и определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, и удовлетворяет или нет шумовой сигнал полосы низких частот условию отправки SID, используется в качестве первого условия определения. Необязательно, в этом варианте осуществления определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному кодированию и условию отправки, включает в себя: формирование отклонения согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определение того, достигает или нет отклонение предварительно установленного порогового значения; если да, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан. Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что: первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и, соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что: второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром. Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что: первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и, соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что: второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром. В этом варианте осуществления предпочтительно формирование отклонения согласно первому отношению и второму отношению включает в себя: отдельное вычисление логарифмического значения первого отношения и логарифмическое значение второго отношения; и вычисление абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
[0063] В частности, в этом варианте осуществления определение того, достигает или нет отклонение предварительно установленного порогового значения, может быть реализовано следующим образом:
[0064] В рабочем DTX-состоянии кодер отдельно вычисляет логарифмические энергии e1 и e0 сигнала s1 полосы высоких частот и сигнала s0 полосы низких частот текущего кадра.
e x = 10 log 10 ( s x ( i ) 2 ) x = 0 ,1 i = 0,1,...,319
Figure 00000003
(2)
[0065] Долговременные скользящие средние e1a и e0a для e1 и e0 на стороне кодирования обновляются:
e x a = e x a ( 1 ) + α s i g n [ e x a e x a ( 1 ) ] M I N [ | e x a e x a ( 1 ) | , 3 ] x = 0, 1
Figure 00000004
(3),
где sign[.] представляет знаковую функцию, MIN[.] представляет минимальную функцию, |.| представляет функцию абсолютного значения, форма x(-1) представляет значение предыдущего кадра x, и α=0,1 является коэффициентом отсутствия последействия, который определяет то, является скорость обновления высокой или низкой. Предыдущий кадр представляет собой SID, который отправлен в прошлый раз перед текущим шумовым кадром, и включает в себя шумовой параметр полосы высоких частот. В этом варианте осуществления абсолютная величина обновления e1a и e0a ограничивается. Если варьирование энергии между ex текущего шумового кадра и exa предыдущего кадра превышает 3 дБ, exa текущего кадра обновляется на 3 дБ. Когда кодер переходит в рабочее DTX-состояние в первый раз, exa инициализируется в качестве ex текущего кадра. Кодер проверяет то, достигает или нет степени отклонение между отношением (а именно, первым отношением) энергии сигнала полосы высоких частот к энергии сигнала полосы низких частот текущего шумового кадра и отношением (вторым отношением) энергии полосы высоких частот к энергии полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз, т.е. проверяет то, удовлетворяется или нет следующее условие:
| ( e 0 a e 1 a ) ( e 0 a e 1 a ) | > 4.5
Figure 00000005
(4),
где
Figure 00000006
и
Figure 00000007
, соответственно, представляют логарифмическую энергию полосы высоких частот и логарифмическую энергию полосы низких частот в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. Если удовлетворяется вышеприведенная формула (4), шумовой сигнал полосы высоких частот должен быть кодирован и передан. Если флаг отправки параметров полосы высоких частот flaghb=0, задается flaghb=1.
[0066] В этом варианте осуществления долговременное усреднение перемещения представляет собой один тип средневзвешенного вычисления, что не ограничено конкретным образом в этом варианте осуществления.
[0067] В этом варианте осуществления определение того, достигает или нет отклонение предварительно установленного порогового значения, может быть использовано в качестве второго условия определения. В конкретном процессе реализации, чтобы определять то, должен или нет шумовой сигнал полосы высоких частот быть кодирован и передан, просто должно определяться первое условие определения или второе условие определения, что не ограничено конкретным образом в этом варианте осуществления.
[0068] В этом варианте осуществления второе условие определения является необязательным. Цель выполнения этого этапа состоит в том, чтобы помогать стороне декодирования в локальной оценке энергии шума полосы высоких частот согласно энергии полосы низких частот шума и отношению энергии полосы высоких частот шума к энергии полосы низких частот шума в момент, когда SID, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. В частности, если отклонение не вычисляется на стороне кодирования, речевой кадр с минимальной энергией сигналов полосы высоких частот может быть получен на стороне декодирования из речевых кадров в пределах периода времени перед текущим шумовым кадром, и энергия текущего шума полосы высоких частот оценивается локально согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах периода времени перед текущим шумовым кадром. Например, энергия сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах периода времени перед текущим шумовым кадром выбирается в качестве энергии текущего шума полосы высоких частот. Альтернативно, сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, выбираются из речевых кадров в пределах предварительно установленного периода времени перед SID; и средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, получается согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров. Конкретные ограничения не накладываются в этом варианте осуществления.
[0069] 303. Передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи.
[0070] В этом варианте осуществления предпочтительно передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи включает в себя: в рабочем DTX-состоянии кодер выполняет линейный прогнозный анализ 16-ого порядка для сигнала s0 полосы низких частот текущего шумового кадра и получает 16 коэффициентов lpc(i) линейного прогнозирования, где i=0, 1,…, 15. LPC-коэффициенты преобразуются в ISP-коэффициенты, чтобы получать 16 ISP-коэффициентов isp(i), где i=0, 1,…, 15, и ISP-коэффициенты буферизуются. Если SID кодируется в текущем кадре, т.е. flagSID=1, выполняется поиск среднего ISP-коэффициента в буферизованных ISP-коэффициентах N кадров предыстории, включающих в себя текущий кадр. Способ заключается в следующем: во-первых, вычисление расстояния δ от ISP-коэффициента каждого кадра до ISP-коэффициента другого кадра:
δ k = j = 0 N + 1 i = 0 15 ( l s p ( k ) ( i ) l s p ( j ) ( i ) ) 2 j k , k = 0, 1,..., N + 1
Figure 00000008
(5);
затем, выбор ISP-коэффициента кадра с наименьшим δ в качестве ISP-коэффициента ispSID(i), который должен быть кодирован, где i=0,…, 15; преобразование ispSID(i) в ISF-коэффициент isfSID(i), квантование isfSID(i), получение и инкапсулирование группы квантованных индексов idxISF в SID; локальное декодирование idxISF; получение декодированного ISF-коэффициента isf′(i), где i=0,…, 15; преобразование isf′(i) в ISP-коэффициент isp′(i), где i=0,…, 15, буферизация isp′(i); для каждого шумового кадра, обновление долговременного скользящего среднего декодированных ISP-коэффициентов стороны кодирования посредством использования буферизованного isp′(i):
i s p a ( i ) = α i s p a ( 1 ) ( i ) + ( 1 α ) i s p ' ( i ) i = 0,1,...15
Figure 00000009
(6),
где предпочтительно α=0,9, и ispa(i) инициализируется в качестве isp′(i) первого SID; преобразование ispa(i) в LPC-коэффициент lpca(i), получение аналитического фильтра A(Z); фильтрация сигнала s0 полосы низких частот каждого шумового кадра посредством A(Z), чтобы получать остаточный сигнал r(i), где i=0, 1,…, 319, и вычисление логарифмической остаточной энергии er:
Figure 00000010
e r = log 2 ( i = 0 319 r ( i ) 2 ) i = 0,1,...319
Figure 00000011
(7).
[0071] В этом варианте осуществления er буферизуется. Когда flagSID текущего шумового кадра равен 1, средневзвешенная логарифмическая энергия eSID вычисляется согласно буферизованному er M кадров предыстории, включающих в себя текущий шумовой кадр:
Figure 00000012
, где w1(k) является группой M-мерных положительных коэффициентов, и их сумма меньше 1. Квантуется eSID, и получается квантованный индекс idxe.
[0072] В этом варианте осуществления в рабочем DTX-состоянии, когда flagSID=1, если flaghb=0, только параметр полосы низких частот кодируется и отправляется в SID-кадре, и в этом случае SID-кадр формируется из idxISF и idxe и упоминается как "небольшой SID-кадр" для удобства.
[0073] В этом варианте осуществления политика для кодирования и передачи шумового сигнала полосы низких частот является аналогичной политике для кодирования и передачи шумового широкополосного сигнала в предшествующем уровне техники. Только краткое введение предоставляется в этом варианте осуществления. Конкретный процесс реализации не описывается подробно в этом варианте осуществления. В этом варианте осуществления шумовой сигнал полосы высоких частот текущего шумового кадра не должен быть кодирован, и кодируется только шумовой сигнал полосы низких частот. Следовательно, вычислительная нагрузка уменьшается на стороне кодирования, и передаваемые биты экономятся.
[0074] 304. Передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи.
[0075] В этом варианте осуществления, если flaghb=1, помимо того, что параметр полосы низких частот должен быть кодирован, параметр полосы высоких частот также должен быть кодирован в SID. Кодирование параметра полосы низких частот шума полосы низких частот является идентичным режиму кодирования на этапе 303, и подробности не описываются повторно в этом варианте осуществления. В этом варианте осуществления предпочтительно способ для кодирования параметра полосы высоких частот заключается в следующем: только тогда, когда кодер находится в рабочем DTX-состоянии, и flagSID=1, кодер выполняет линейный прогнозный анализ 10-го порядка для сигнала s1 полосы высоких частот текущего кадра и получает 10 коэффициентов lpc(i) линейного прогнозирования, где i=0, 1,…, 9; lpc(i) взвешивается:
l p c w ( i ) = w 2 ( i ) l p c ( i ) i = 0,1,...9
Figure 00000013
(8),
и получается взвешенный LPC-коэффициент lpcw(i), где w2(i) представляет группу 9-мерных весовых коэффициентов, которые меньше или равны 1; lpcw(i) преобразуется в LSP-коэффициент, чтобы получать 10 LSP-коэффициентов lspw(i), где i=0, 1,…, 9, и долговременное скользящее среднее lspw(i) стороны кодирования обновляется согласно lspw(i).
l s p a ( i ) = α l s p a ( 1 ) ( i ) + ( 1 α ) l s p w ( i ) i = 0,1,...9
Figure 00000014
(9),
где предпочтительно α=0,9, и lspa(i) инициализируется в качестве lspw(i) текущего кадра каждый раз, когда flaghb изменяется с 0 на 1. Когда SID должен включать в себя параметры полосы высоких частот, квантуется lspa(i), и получается группа квантованных индексов idxLSP. Квантуется долговременное скользящее среднее e1a логарифмических энергий сигналов полосы высоких частот на стороне кодирования, и получается квантованный индекс idxE. В этом случае SID формируется из idxISF, idxe, idxLSP и idxE. В этом варианте осуществления SID, сформированный из idxISF, idxe, idxLSP и idxE, упоминается как "большой SID".
[0076] Необязательно, lspa(i) также может быть обновлен непрерывно в рабочем DTX-состоянии. Иными словами, независимо от того, равно значение flaghb 1 или 0, lspa(i) обновляется. В частности, способ для обновления lspa(i), когда flaghb=0, является идентичным вышеприведенному способу, когда flaghb=1, и подробности не описываются повторно в этом варианте осуществления.
[0077] В этом варианте осуществления принцип политики для кодирования шумового сигнала полосы высоких частот является аналогичным принципу политики для кодирования шумового сигнала полосы низких частот. Только краткое введение предоставляется в этом варианте осуществления. Конкретный процесс реализации не описывается подробно в этом варианте осуществления.
[0078] В этом варианте осуществления, когда удовлетворяется условие для кодирования и передачи шумового сигнала полосы высоких частот, кодирование и передача шумового сигнала полосы высоких частот всегда выполняются одновременно с кодированием и передачей шумового сигнала полосы низких частот. Тем не менее, необязательно кодирование и передача шумового сигнала полосы высоких частот также могут не выполняться одновременно с кодированием и передачей шумового сигнала полосы низких частот. Иными словами, когда отправляется SID, может быть предусмотрено три возможных случая: (1) только сигнал полосы низких частот текущего шумового кадра кодируется и передается; (2) только сигнал полосы высоких частот текущего шумового кадра кодируется и передается; и (3) сигнал полосы низких частот и сигнал полосы высоких частот текущего шумового кадра кодируются и передаются одновременно, и в этом случае условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID. Три случая отправки SID не ограничены конкретным образом в этом варианте осуществления.
[0079] В этом варианте осуществления этапы 302-304 представляют собой, в частности, этапы кодирования и передачи шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирования и передачи шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0080] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 4 осуществления
[0081] Этот вариант осуществления предоставляет способ для обработки аудиоданных. По сравнению с обработкой шумового сигнала на стороне кодера, сторона декодера может определять, согласно принимаемому потоку битов, то, представляет собой текущий кадр кодированный речевой кадр либо SID- или NO_DATA-кадр. NO_DATA-кадр представляет собой кадр, указывающий, что сторона кодирования не кодирует и отправляет SID в период шума. Когда текущий кадр представляет собой SID, декодер дополнительно может определять, согласно числу битов SID, то, включает SID в себя параметр полосы низких частот и/или полосы высоких частот. Необязательно, декодер также может определять, согласно конкретному идентификатору, вставленному в SID, то, включает SID в себя параметр полосы низких частот и/или полосы высоких частот. Это требует добавления дополнительного бита идентификатора, когда кодируется SID. Например, когда первый идентификатор вставляется в SID, он идентифицирует то, что SID включает в себя только параметр полосы высоких частот; когда вставляется второй идентификатор, он идентифицирует то, что SID включает в себя только параметр полосы низких частот, а когда вставляется третий идентификатор, он идентифицирует то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот. Если текущий кадр представляет собой кодированный речевой кадр, декодер декодирует речевой кадр. Процесс конкретной обработки является аналогичным процессу предшествующего уровня техники и не описывается подробно в этом варианте осуществления. Когда текущий кадр представляет собой SID- или NO_DATA-кадр, декодер выбирает, согласно конкретному рабочему состоянию CNG, соответствующий способ, чтобы восстанавливать CN-кадр. В этом варианте осуществления CNG имеет два рабочих состояния: CNG-состояние полудекодирования, соответствующее небольшому SID-кадру, а именно, первое CNG-состояние, и CNG-состояние полного декодирования, соответствующее большому SID-кадру, а именно, второе CNG-состояние. В CNG-состоянии полного декодирования декодер восстанавливает CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования большого SID-кадра. В CNG-состоянии полудекодирования, декодер восстанавливает CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования небольшого SID-кадра, и локально оцененному шумовому параметру полосы высоких частот. Когда текущий кадр на стороне декодирования представляет собой большой SID-кадр, если флаг flagCNG рабочего CNG-состояния равен 0 (что указывает CNG-состояние полудекодирования), флаг flagCNG рабочего CNG-состояния задается равным 1 (что указывает CNG-состояние полного декодирования); в противном случае исходное состояние остается неизменным. Аналогично, когда текущий кадр на стороне декодирования представляет собой небольшой SID-кадр, если флаг flagCNG рабочего CNG-состояния равен 1, флаг flagCNG рабочего CNG-состояния задается равным 0; в противном случае исходное состояние остается неизменным. Ссылаясь на Фиг. 4, в частности, этот вариант осуществления предоставляет способ для обработки аудиоданных на стороне декодера, причем способ включает в себя следующее:
[0082] 401. Декодер получает SID, и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0083] В этом варианте осуществления после приема кодированного кадра, отправленного посредством стороны кодера, сторона декодера сначала определяет тип речевого кадра, так что различные способы декодирования, соответственно, используются согласно различным типам речевых кадров. В частности, если число битов SID меньше предварительно установленного первого порогового значения, определяется то, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определяется то, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определяется то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот. Альтернативно, если SID включает в себя первый идентификатор, определяется то, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определяется то, что SID включает в себя параметр полосы низких частот; или если SID включает в себя третий идентификатор, определяется то, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.
[0084] В этом варианте осуществления, если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, SID декодируется, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и третий CN-кадр получается согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. В частности, декодер декодирует SID, чтобы получать декодированную логарифмическую энергию eD возбуждения полосы низких частот, ISF-коэффициент isfd(i) полосы низких частот, логарифмическую энергию ED полосы высоких частот и LSP-коэффициент lspd(i) полосы высоких частот; isfd(i) преобразуется ISP-коэффициент ispd(i), и eD и ED преобразуются в энергии ed и Ed, где
Figure 00000015
и
Figure 00000016
, и затем буферизуются ispd(i), ed, lspd(i) и Ed.
[0085] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии и flagCNG=1, независимо от того, представляет собой или нет текущий кадр SID- или NO_DATA-кадр, буферизованные ispd(i), ed, lspd(i) и Ed используются для того, чтобы обновлять долговременное скользящее среднее каждого из буферизованных ispd(i), ed, lspd(i) и Ed на стороне декодирования:
i s p C N ( i ) = α i s p C N ( 1 ) ( i ) + ( 1 α ) i s p d ( i ) i = 0,1,...15 l s p C N ( i ) = β l s p C N ( 1 ) ( i ) + ( 1 β ) l s p d ( i ) i = 0,1,...9 e C N = β e C N ( 1 ) + ( 1 β ) e d E C N = β E C N ( 1 ) + ( 1 β ) E d
Figure 00000017
, (10)
где α=0,9, и β=0,7. ECN буферизуется в буфер E1old энергии полосы высоких частот. Случайная небольшая энергия добавляется на основе eCN, и получается конечная энергия e′CN возбуждения, используемая для того, чтобы восстанавливать сигнал шума полосы низких частот:
Figure 00000018
, где RND представляет случайное число в диапазоне [-32767, 32767]. В этом варианте осуществления формируется 320-точечная последовательность exc0(i) белых шумов, где i=0, 1,…, 319; e′CN используется для того, чтобы выполнять регулировку усиления для exc0(i), чтобы получать exc′0(i), т.е. exc0(i) умножается на коэффициент G0 усиления, так что энергия exc′0(i) равна e′CN, где
Figure 00000019
; ispCN(i) преобразуется в LPC-коэффициент, чтобы получать синтезирующий фильтр 1/A0(Z), отрегулированное по усилению возбуждение exc′0(i) используется для того, чтобы возбуждать фильтр 1/A(Z), чтобы получать CN-сигнал s′0 полосы низких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, и энергия s′0 вычисляется и буферизуется в буфер E0old энергии полосы низких частот.
[0086] В этом варианте осуществления обработка шумового сигнала полосы высоких частот на стороне декодирования является аналогичной обработке шумового сигнала полосы низких частот. Формируется другая 320-точечная последовательность exc1(i) белых шумов, где i=0, 1,…, 319, lspCN(i) преобразуется в LPC-коэффициент, чтобы получать синтезирующий фильтр 1/A1(Z), и exc1(i) используется для того, чтобы возбуждать фильтр 1/A1(Z), чтобы получать неотрегулированный по усилению CN-сигнал s~1(i) полосы высоких частот; s~1(i) умножается на коэффициенты усиления G1 и G2, где G2=0,8, и получается CN-сигнал s′1 полосы высоких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, где
Figure 00000020
. В этом варианте осуществления цель G2 состоит в том, чтобы выполнять подавление энергии для восстановленного шумового сигнала в некоторой степени.
[0087] В этом варианте осуществления на стороне декодера s′0 и s′1 проходят через синтезирующий QMF-фильтр и в завершение получается первый CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.
[0088] 402. Если SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.
[0089] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии, и flagCNG=0, независимо от того, представляет собой или нет текущий кадр SID- или NO_DATA-кадр, CN-сигнал s′0 полосы низких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, получается согласно идентичному способу, который используется, когда flagCNG=1, а именно, способу на этапе 402, который дополнительно не описывается в этом варианте осуществления.
[0090] В этом варианте осуществления сигнал полосы высоких частот первого CN-кадра по-прежнему получается посредством использования способа возбуждения синтезирующего фильтра посредством использования белого шума, за исключением того, что энергия сигнала полосы высоких частот первого CN-кадра и коэффициент синтезирующей фильтрации получаются посредством выполнения локальной оценки. В этом варианте осуществления локальное формирование шумового параметра полосы высоких частот включает в себя: отдельное получение средневзвешенной энергии шумового сигнала полосы высоких частот и коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и получение шумового сигнала полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0091] В этом варианте осуществления предпочтительно получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение энергии сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования; вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; получение, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; и выполнение взвешенного усреднения для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра. Необязательно, вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, включает в себя: вычисление отношения мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или вычисление отношения средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение. Мгновенная энергия представляет собой энергию, полученную посредством декодирования. Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.
[0092] В частности, в этом варианте осуществления получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано посредством использования следующего способа:
- получение энергии E0 сигнала полосы низких частот первого CN-кадра s′0 согласно шумовому параметру полосы низких частот, полученному посредством декодирования; оценка, согласно энергии E1old сигнала полосы высоких частот и E0old сигнала полосы низких частот предыдущего CN-кадра в CNG-состоянии полного декодирования и E0, энергии E~1 шумового сигнала полосы высоких частот в момент, соответствующий SID, где
Figure 00000021
; и обновление долговременного скользящего среднего ECN энергий CN-сигналов полосы высоких частот на стороне декодирования посредством использования E~1:
Figure 00000022
, где коэффициент λ является переменной, когда E~1>ECN, λ=0,98; в противном случае, λ=0,9, причем λ=0,98 является первой скоростью, а λ=0,9 является второй скоростью.
[0093] В этом варианте осуществления, если отклонение не вычисляется на стороне кодирования, необязательно, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: выбор сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и получение, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; или выбор сигналов полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получение, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0094] В этом варианте осуществления предпочтительно получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: распределение M коэффициентов спектральной частоты ISF иммитанса или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, и N может быть переменным; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0095] В частности, в этом варианте осуществления получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано посредством использования следующего способа:
[0096] Девять ISF-коэффициентов isfext(i) равномерно распределяются в полосе частот в -16 кГц, соответствующей ISF-коэффициентам isfd(14) полосы низких частот, где i=0, 1,…, 8:
i s f e x t ( i ) = i s f d ( 14 ) + 0.1 ( i + 1 ) ( 16000 i s f d ( 14 ) ) i = 0,1,...8
Figure 00000023
(11),
isfext(i) преобразуется в полосу частот 0-8 кГц, и получается isf′ext(i):
i s f e x t ' ( i ) = i s f e x t ( i ) 8000 i = 0,1,...8
Figure 00000024
(12),
isf′ext(i) рандомизируется посредством использования группы 9-мерных коэффициентов R(i) рандомизации, где i=0, 1,…, 8, и получается рандомизированный ISF-коэффициент isf1(i):
i s f 1 ( i ) = R ( i ) ( i s f e x t ' ( 1 ) i s f e x t ' ( 0 ) ) + i s f e x t ' ( i ) i = 0,1,...8
Figure 00000025
(13),
где R(i) получается согласно следующей формуле (14):
R ( i ) = α R ( 1 ) ( i ) + ( 1 α ) R t ( i ) i = 0,1,...8
Figure 00000026
(14),
где α=0,8, и Rt(i) упоминается как "целевой коэффициент рандомизации" и получается согласно следующей формуле:
R t ( i ) = { 1 + 0.1 R N D ( i ) mod ( c n t , 10 ) = 0 R t ( 1 ) ( i ) mod ( c n t , 10 ) 0 i = 0,1,...8
Figure 00000027
(15).
[0097] В вышеприведенной формуле (15) RND представляет группу 9-мерных последовательностей случайных чисел, и случайные числа в каждой размерности отличаются друг от друга, и все попадают в диапазон [-1, 1]; cnt является счетчиком кадров. В рабочем CNG-состоянии, когда flagCNG=0, для каждого SID-кадра или NO_DATA-кадра 1 прибавляется к счетчику. mod(cnt, 10) представляет cnt mod 10. В другом варианте осуществления, когда вычисляется Rt(i), 10 в mod(cnt, 10) также может быть переменной, например:
R t ( i ) = { 1 + 0.1 R N D ( i ) mod ( c n t , N ) = 0 R t ( 1 ) ( i ) mod ( c n t , N ) 0 i = 0,1,...8 N = { 10 + 5 R N D mod ( c n t , N ( 1 ) ) = 0 N ( 1 ) mod ( c n t , N ( 1 ) ) 0
Figure 00000028
(16),
где RND представляет случайное число в диапазоне [-1, 1], что не ограничено конкретным образом в этом варианте осуществления.
[0098] В этом варианте осуществления ISF-коэффициент isfd(15) полосы низких частот используется в качестве isf1(9) и синтезируется с рандомизированным ISF-коэффициентом isf1(i), где i=0, 1,…, 8, чтобы формировать ISF-коэффициент фильтрации 10-го порядка, который затем преобразуется в LPC-коэффициент lpc1(i), где i=0, 1,…, 9; lpc1(i) умножается на группу 10-мерных весовых коэффициентов W(i)={0,6699, 0,5862, 0,5129, 0,4488, 0,3927, 0,3436, 0,3007, 0,2631, 0,2302, 0,2014}, и получается взвешенный LPC-коэффициент lpc~1(i), т.е. оценивается синтезирующий фильтр 1/A~1(Z).
[0099] В этом варианте осуществления формируется 320-точечная последовательность exc2(i) белых шумов, где i=0, 1,…, 319, и exc2(i) используется для того, чтобы возбуждать фильтр 1/A~1(Z), чтобы получать неотрегулированный по усилению CN-сигнал s~1(i) полосы высоких частот; s~1(i) умножается на коэффициенты усиления G3 и G4, G4=0,6, и получается CN-сигнал s′1 полосы высоких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, где
Figure 00000029
.
[0100] Если текущий кадр представляет собой SID, необходимо преобразовывать lpc~1(i) в LSP-коэффициент lsp~1(i) и использовать lsp~1(i), чтобы обновлять долговременное скользящее среднее LSP-коэффициентов сигналов полосы высоких частот CN-кадров, буферизованных на стороне декодирования:
l s p C N ( i ) = β l s p C N ( 1 ) ( i ) + ( 1 β ) l s p 1 ~ ( i ) i = 0,1,...9
Figure 00000030
(17),
где β=0,7.
[0101] В этом варианте осуществления необязательное получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID. Конкретные ограничения не накладываются в этом варианте осуществления.
[0102] В этом варианте осуществления, после того как получаются параметр полосы низких частот и параметр полосы высоких частот, s′0 и s′1 проходят через синтезирующий QMF-фильтр, и в завершение получается первый CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.
[0103] Дополнительно, в этом варианте осуществления необязательно, до того, как первый CN-кадр получается согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, может быть дополнительно оптимизирован локально сформированный шумовой параметр полосы высоких частот, так что может получаться более преимущественный комфортный шум. Конкретный этап оптимизации включает в себя: когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножение шумовых сигналов полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и, соответственно, получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот включает в себя: получение четвертого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
[0104] В этом варианте осуществления, когда кадр перед текущим SID представляет собой кодированный речевой кадр, и энергия Esp сигнала полосы высоких частот кодированного речевого кадра ниже энергии Es1 s′1, необходимо сглаживать энергии сигналов полосы высоких частот текущего SID и последующих нескольких SID (50 кадров в этом варианте осуществления). Конкретный способ сглаживания заключается в следующем: умножение s′1 текущего кадра на усиление Gs, чтобы получать сглаженный s′1s.
Figure 00000031
, где cnt является счетчиком кадров, 1 прибавляется к счетчику для каждого кадра, начиная с первого CN-кадра после кодированного речевого кадра, и
Figure 00000032
представляет собой энергию сглаженного сигнала полосы высоких частот предыдущего кадра и инициализируется в качестве Esp, когда cnt=1. Процесс сглаживания выполняется только максимум для 50 кадров. В этот период, если
Figure 00000032
превышает Es1, завершается процесс сглаживания. Необязательно,
Figure 00000032
и Es1 также могут представлять энергии только части кадров, что не ограничено конкретным образом в этом варианте осуществления. В этом варианте осуществления s′0 и s′1 (или s′1s) проходят через синтезирующий QMF-фильтр, и в завершение получается CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.
[0105] 403. Если SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.
[0106] В этом варианте осуществления, если SID включает в себя параметр полосы высоких частот, SID декодируется, чтобы получать параметр полосы высоких частот, и шумовой параметр полосы низких частот формируется локально, и второй CN-кадр получается согласно параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот. Способ для декодирования параметра полосы высоких частот является идентичным способу на этапе 401, и подробности не описываются повторно в этом варианте осуществления. Способ для локального формирования параметра полосы низких частот является идентичным способу для локального формирования широкополосного параметра, и подробности не описываются повторно в этом варианте осуществления.
[0107] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче. Помимо этого, до того, как второй CN-кадр получается согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, может быть дополнительно оптимизирован локально сформированный шумовой параметр полосы высоких частот, так что может получаться более преимущественный комфортный шум. В силу этого, дополнительно оптимизируется производительность декодера.
Вариант 5 осуществления
[0108] Этот вариант осуществления предоставляет способ для обработки аудиоданных. Идентично способу для обработки аудиоданных в варианте 2 осуществления сторона кодера получает шумовой кадр аудиосигнала и раскладывает шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот. Тем не менее, необязательно, определение того, удовлетворяет или нет сигнал полосы высоких частот шумового кадра предварительно установленному условию кодирования и передачи, включает в себя: определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодирование SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для отправки второго SID и отправку SID; а если нет, определение того, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан. Средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром. В этом варианте осуществления определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию, используется в качестве третьего условия для определении того, следует или нет кодировать и передавать шумовой сигнал полосы высоких частот.
[0109] В этом варианте осуществления, необязательно, то, следует или нет кодировать и передавать шумовой сигнал полосы высоких частот, также может быть определено посредством использования второго условия определения, что не ограничено конкретным образом в этом варианте осуществления.
[0110] В этом варианте осуществления DTX определяет то, следует или нет кодировать и передавать параметр полосы высоких частот, т.е. задание flaghb может определяться посредством использования следующих условий: (1) удовлетворяется или нет третье условие определения; если да, задание flaghb равным 0; в противном случае, задание flaghb равным 1; и (2) удовлетворяется или нет второе условие определения; если нет, задание flaghb равным 0; и если да, задание flaghb равным 1.
[0111] В этом варианте осуществления конкретный способ для реализации третьего условия определения может заключаться в следующем: кодер получает LSP-коэффициент lsp(i) 10-го порядка шумового сигнала s1 полосы высоких частот текущего шумового кадра, где i=0,…, 9, и необязательно коэффициент также может представлять собой LSF- или ISF-, или ISP-коэффициент, что не ограничено конкретным образом в этом варианте осуществления. LSP- или LSF-, или ISF-, или ISP-коэффициент является только различным способом представления в различной области, но все они представляют коэффициент синтезирующей фильтрации, что не ограничено конкретным образом в этом варианте осуществления; lsp(i) используется для того, чтобы обновлять его скользящее среднее:
l s p a ( i ) = α l s p a ( i ) + ( 1 α ) l s p ( i ) i = 0,...9
Figure 00000033
(18),
где lspa(i) является долговременным скользящим средним lsp(i). Вычисляется спектральное искажение между текущим lspa(i) и lspa(i) в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз:
Figure 00000034
, где Dlsp представляет спектральное искажение, а
Figure 00000035
представляет lspa(i) в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. Если Dlsp меньше определенного порогового значения, задается flaghb=0; в противном случае, задается flaghb=1.
[0112] В этом варианте осуществления способ работы для кодирования параметра полосы низких частот и/или параметра полосы высоких частот посредством кодера при необходимости по существу является идентичным способу работы в варианте 3 осуществления, и подробности не описываются повторно в этом варианте осуществления.
[0113] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии и flagCNG=0, необходимо локально формировать шумовой сигнал полосы высоких частот. Способ для получения средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, является идентичным способу в варианте 4 осуществления, и подробности не описываются повторно в этом варианте осуществления. Тем не менее, в этом варианте осуществления предпочтительно получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID. В частности, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано следующим образом:
[0114] При условии lsp′(i)=lspCN(i), где i=0,…, 9, lspCN(i) является долговременным скользящим средним LSP-коэффициентов сигналов полосы высоких частот CN-кадров, которые локально буферизуются на стороне декодирования. Обработка рандомизации выполняется для lsp′(i) посредством использования идентичного способа из варианта 4 осуществления, и получается lsp1(i):
{ l s p 1 ( 0 ) = R ( 0 ) ( 1 l s p 1 ( 0 ) ) + l s p ' ( 0 ) l s p 1 ( i ) = R ( i ) ( l s p ' ( i ) l s p ' ( i 1 ) ) + l s p ' ( i ) i = 1,...9
Figure 00000036
(19).
[0115] lsp1(i) преобразуется в LPC-коэффициент lpc1(i), и синтезирующий фильтр 1/A~1(Z) получается после взвешивания с w(i) посредством использования идентичного способа из варианта 4 осуществления. В этом варианте осуществления формируется 320-точечная последовательность exc2(i) белых шумов, где i=0, 1,…, 319, и exc2(i) используется для того, чтобы возбуждать фильтр 1/A~1(Z), чтобы получать неотрегулированный по усилению CN-сигнал s~1(i) полосы высоких частот; s~1(i) умножается на коэффициент G3 усиления, и получается сигнал s′1 полосы высоких частот CN-кадра, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц. В этом варианте осуществления, когда текущий кадр представляет собой SID, lsp1(i), полученный посредством использования этого способа, не используется для того, чтобы обновлять долговременное скользящее среднее LSP-коэффициентов сигналов полосы высоких частот CN-кадров, которые буферизуются на стороне декодирования.
[0116] В этом варианте осуществления, когда кодер кодирует большой SID-кадр, когда долговременное скользящее среднее e1a логарифмических энергий сигналов полосы высоких частот квантуется на стороне кодирования, квантование выполняется после того, как e1a ослабляется (т.е. после того, как значение вычитается). Следовательно, в этом случае, при декодировании необязательно умножать s~1(i) на G2 или G4 в варианте 4 осуществления. Другие этапы стороны декодирования в этом варианте осуществления являются аналогичными этапам в вышеприведенном варианте осуществления, и подробности не описываются повторно в этом варианте осуществления.
[0117] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 6 осуществления
[0118] Ссылаясь на Фиг. 5, этот вариант осуществления предоставляет устройство для кодирования аудиоданных, причем устройство включает в себя: модуль 501 получения и передающий модуль 502.
[0119] Модуль 501 получения сконфигурирован с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.
[0120] Передающий модуль 502 сконфигурирован с возможностью кодировать и передавать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать и передавать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0121] В этом варианте осуществления первый SID включает в себя параметр полосы низких частот шумового кадра, а второй SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот шумового кадра.
[0122] Необязательно, ссылаясь на Фиг. 6, передающий модуль 502 включает в себя:
- первый передающий блок 502a, сконфигурированный с возможностью определять то, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодировать идентификатор шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0123] В этом варианте осуществления первый передающий блок 502a включает в себя:
- первый субблок определения, сконфигурированный с возможностью получать спектр шумового сигнала полосы высоких частот, разделять спектр, по меньшей мере, на две подполосы частот, и если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определять то, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определять то, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
[0124] Ссылаясь на Фиг. 6, необязательно, передающий модуль 502 включает в себя:
- второй передающий блок 502b, сконфигурированный с возможностью формировать отклонение согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определять то, достигает или нет отклонение предварительно установленного порогового значения; если да, кодировать SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0125] Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0126] Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0127] Необязательно, в этом варианте осуществления второй передающий блок 502b включает в себя:
- субблок вычисления, сконфигурированный с возможностью отдельно вычислять логарифмическое значение первого отношения и логарифмическое значение второго отношения; и вычислять абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
[0128] Ссылаясь на Фиг. 6, необязательно, в этом варианте осуществления передающий модуль 502 включает в себя:
- третий передающий блок 502c, сконфигурированный с возможностью определять то, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодировать SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для отправки второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.
[0129] В этом варианте осуществления, необязательно, средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.
[0130] Необязательно, в этом варианте осуществления условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.
[0131] Вариант осуществления устройства, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 7 осуществления
[0132] Ссылаясь на Фиг. 7, этот вариант осуществления предоставляет устройство для декодирования аудиоданных, причем устройство включает в себя: модуль 601 получения, первый модуль 602 декодирования, второй модуль 603 декодирования и третий модуль 604 декодирования.
[0133] Модуль 601 получения сконфигурирован с возможностью определять то, включает принимаемый текущий кадр SID дескриптора вставки молчания в себя параметр полосы низких частот или параметр полосы высоких частот.
[0134] Первый модуль 602 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.
[0135] Второй модуль 603 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.
[0136] Третий модуль 604 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0137] Необязательно, в этом варианте осуществления первый модуль 602 декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, если декодер находится в первом состоянии формирования CNG комфортного шума, переходить во второе CNG-состояние.
[0138] Необязательно, в этом варианте осуществления третий модуль 604 декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, если декодер находится во втором CNG-состоянии, переходить в первое CNG-состояние.
[0139] Необязательно, модуль 601 получения включает в себя:
- первый блок определения, сконфигурированный с возможностью: если число битов SID меньше предварительно установленного первого порогового значения, определять то, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определять то, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определять то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот; или
- второй блок определения, сконфигурированный с возможностью: если SID включает в себя первый идентификатор, определять то, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определять то, что SID включает в себя параметр полосы низких частот; и если SID включает в себя третий идентификатор, определять то, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.
[0140] В этом варианте осуществления первый модуль 602 декодирования включает в себя:
- первый блок получения, сконфигурированный с возможностью отдельно получать средневзвешенную энергию шумового сигнала полосы высоких частот и коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- второй блок получения, сконфигурированный с возможностью получать шумовой сигнал полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0141] Необязательно, первый блок получения включает в себя:
- первый субблок получения, сконфигурированный с возможностью получать энергию сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;
- субблок вычисления, сконфигурированный с возможностью вычислять отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;
- второй субблок получения, сконфигурированный с возможностью получать, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергию шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- третий субблок получения, сконфигурированный с возможностью осуществлять взвешенное усреднение для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0142] Субблок вычисления, в частности, сконфигурирован с возможностью:
- вычислять отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или
- вычислять отношение средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.
[0143] Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.
[0144] Необязательно, первый блок получения включает в себя:
- первый субблок выбора, сконфигурированный с возможностью выбирать сигнал полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID и получать, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или
- второй субблок выбора, сконфигурированный с возможностью выбирать сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получать, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0145] Необязательно, первый блок получения включает в себя:
- субблок распределения, сконфигурированный с возможностью распределять M коэффициентов спектральной частоты ISF иммитанса, или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот;
- первый субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, где M и N являются натуральными числами; и
- четвертый субблок получения, сконфигурированный с возможностью получать, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0146] Необязательно, первый блок получения включает в себя:
- пятый субблок получения, сконфигурированный с возможностью получать M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;
- второй субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и
- шестой субблок получения, сконфигурированный с возможностью получать, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0147] Ссылаясь на Фиг. 8, необязательно, устройство дополнительно включает в себя:
- модуль 605 оптимизации, сконфигурированный с возможностью: до того, как первый модуль 602 декодирования получает первый CN-кадр, когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножать шумовые сигналы полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот.
[0148] Соответственно, первый модуль 602 декодирования, в частности, сконфигурирован с возможностью получать четвертый CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
[0149] Вариант осуществления устройства, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 8 осуществления
[0150] Ссылаясь на Фиг. 9, этот вариант осуществления предоставляет систему для обработки аудиоданных, причем система включает в себя вышеприведенное устройство 500 для кодирования аудиоданных и вышеприведенное устройство 600 для декодирования аудиоданных.
[0151] Технические решения, предоставляемые посредством вариантов осуществления настоящего изобретения, обеспечивают следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
[0152] Устройство и система, предоставляемые посредством вариантов осуществления, в частности, могут применять концепцию, идентичную концепции в качестве вариантов осуществления способа. Конкретный процесс реализации устройства и системы описан подробно в вариантах осуществления способа, и подробности не описываются повторно в данном документе.
[0153] Способ и устройство для обработки аудиоданных в вышеприведенных вариантах осуществления могут применяться к аудиокодеру или к аудиодекодеру. Аудиокодеки могут широко применяться к различным электронным устройствам, таким как мобильный телефон, беспроводное устройство, персональное цифровое устройство (PDA), карманный или портативный компьютер, приемное GPS-устройство или навигационное устройство, камера, аудио/видеопроигрыватель, записывающая видеокамера, записывающее видеоустройство и устройство наблюдения. В общем, такое электронное устройство включает в себя аудиокодер или аудиодекодер. Аудиокодер или декодер может быть непосредственно реализован посредством использования цифровой схемы либо кристалла, например, DSP (процессор цифровых сигналов), либо реализован посредством использования программного кода, чтобы управлять процессором с возможностью выполнять процедуру в программном коде.
[0154] Специалисты в данной области техники могут понимать, что все или часть этапов вариантов осуществления могут быть реализованы посредством аппаратных средств или программы, инструктирующей релевантным аппаратным средствам. Программа может сохраняться на машиночитаемом носителе хранения данных. Носитель хранения данных может включать в себя: постоянное запоминающее устройство, магнитный диск или оптический диск.
[0155] Вышеприведенное описание представляет собой просто примерные варианты осуществления настоящего изобретения и не имеет намерение ограничивать настоящее изобретение. Все модификации, эквивалентные замены и улучшения, выполняемые без отступления от сущности и принципа настоящего изобретения, должны попадать в объем охраны настоящего изобретения.

Claims (44)

1. Способ для обработки аудиоданных, при этом способ содержит этапы, на которых:
- получают шумовой кадр аудиосигнала и раскладывают шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- кодируют шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передают кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодируют шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передают кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, при этом политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
2. Способ по п. 1, в котором первый SID содержит параметр полосы низких частот шумового кадра, а второй SID содержит параметр полосы низких частот или параметр полосы высоких частот шумового кадра.
3. Способ по п. 1, в котором кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передача кодированного шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи содержит этап, на котором:
- определяют то, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодируют SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправляют SID; а если нет, определяют то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
4. Способ по п. 3, в котором определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, содержит этап, на котором:
- получают спектр шумового сигнала полосы высоких частот, разделяют спектр, по меньшей мере, на две подполосы частот и, когда средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, при этом полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определяют то, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае определяют то, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
5. Способ по п. 1, в котором кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передача кодированного шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи содержит этапы, на которых:
- формируют отклонение согласно первому отношению и второму отношению, при этом первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра и второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и
- определяют то, достигает или нет отклонение предварительно установленного порогового значения; если да, кодируют SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправляют SID; а если нет, определяют то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
6. Способ по п. 5, в котором: то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, содержит то, что:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и
- то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, содержит то, что:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; или
- то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, содержит то, что:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и
- то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, содержит то, что:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
7. Способ по п. 5, в котором формирование отклонения согласно первому отношению и второму отношению содержит этапы, на которых:
- отдельно вычисляют логарифмическое значение первого отношения и логарифмическое значение второго отношения; и
- вычисляют абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
8. Способ по п. 1, в котором кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи содержит этап, на котором:
- определяют то, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром предварительно установленному условию; если да, кодируют SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для кодирования второго SID и отправляют SID; а если нет, определяют то, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.
9. Способ по п. 8, в котором средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром содержит: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.
10. Способ по п. 3, в котором условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно содержит: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.
11. Способ для обработки аудиоданных, при этом способ содержит этапы, на которых:
- получают посредством декодера кадр SID дескриптора вставки молчания и определяют то, содержит SID параметр полосы низких частот или параметр полосы высоких частот;
- когда SID содержит параметр полосы низких частот, декодируют SID, чтобы получать шумовой параметр полосы низких частот, локально формируют шумовой параметр полосы высоких частот и получают первый кадр комфортного шума (CN) согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;
- когда SID содержит параметр полосы высоких частот, декодируют SID, чтобы получать шумовой параметр полосы высоких частот, локально формируют шумовой параметр полосы низких частот и получают второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и
- когда SID содержит параметр полосы высоких частот и параметр полосы низких частот, декодируют SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получают третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
12. Способ по п. 11, в котором, когда SID содержит параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно содержит этап, на котором:
- когда декодер находится в первом состоянии формирования CNG комфортного шума, переходят посредством декодера во второе CNG-состояние.
13. Способ по п. 11, в котором, когда SID содержит параметр полосы высоких частот и параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, способ дополнительно содержит этап, на котором:
- когда декодер находится во втором CNG-состоянии, переходят посредством декодера в первое CNG-состояние.
14. Способ по п. 11, в котором определение того, SID содержит параметр полосы низких частот и/или параметр полосы высоких частот, содержит этапы, на которых:
- когда число битов SID меньше предварительно установленного первого порогового значения, определяют то, что SID содержит параметр полосы высоких частот; когда число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определяют то, что SID содержит параметр полосы низких частот; и когда число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определяют то, что SID содержит параметр полосы высоких частот и параметр полосы низких частот; или
- когда SID содержит первый идентификатор, определяют то, что SID содержит параметр полосы высоких частот; когда SID содержит второй идентификатор, определяют то, что SID содержит параметр полосы низких частот; и когда SID содержит третий идентификатор, определяют то, что SID содержит параметр полосы низких частот и параметр полосы высоких частот.
15. Способ по п. 11, в котором локальное формирование шумового параметра полосы высоких частот содержит этапы, на которых:
- отдельно получают средневзвешенную энергию шумового сигнала полосы высоких частот и коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- получают шумовой сигнал полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
16. Способ по п. 15, в котором получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, содержит этапы, на которых:
- получают энергию сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;
- вычисляют отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;
- получают согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению энергию шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- выполняют взвешенное усреднение для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, при этом средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
17. Способ по п. 16, в котором вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, содержит этапы, на которых:
- вычисляют отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или
- вычисляют отношение средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.
18. Способ по п. 16, в котором: когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, при этом первая скорость превышает вторую скорость.
19. Способ по п. 15, в котором получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, содержит этапы, на которых:
- выбирают сигнал полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и
- получают согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, при этом средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или
- выбирают сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и
- получают согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, при этом средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
20. Способ по п. 15, в котором получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, содержит этапы, на которых:
- распределяют M коэффициентов спектральной частоты (ISF) иммитанса, или коэффициентов спектральной пары (ISP) иммитанса, или коэффициентов частоты (LSF) спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот;
- выполняют обработку рандомизации для M коэффициентов, при этом признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, при этом целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, при этом M и N являются натуральными числами; и
- получают согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
21. Способ по п. 15, в котором получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, содержит этапы, на которых:
- получают M ISF-коэффициентов, или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;
- выполняют обработку рандомизации для M коэффициентов, при этом признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, при этом целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и
- получают согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
22. Способ по п. 15, в котором перед получением первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот способ дополнительно содержит этап, на котором:
- когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, когда средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножают шумовые сигналы полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и
- получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот содержит этап, на котором:
- получают четвертый CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
23. Устройство для кодирования аудиоданных, при этом устройство содержит:
- модуль получения, сконфигурированный с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- передающий модуль, сконфигурированный с возможностью кодировать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, при этом политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
24. Устройство по п. 23, в котором первый SID содержит параметр полосы низких частот шумового кадра, а второй SID содержит параметр полосы низких частот или параметр полосы высоких частот шумового кадра.
25. Устройство по п. 23, в котором передающий модуль содержит:
- первый передающий блок, сконфигурированный с возможностью определять то, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодировать SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
26. Устройство по п. 25, в котором первый передающий блок содержит:
- первый субблок определения, сконфигурированный с возможностью получать спектр шумового сигнала полосы высоких частот, разделять спектр, по меньшей мере, на две подполосы частот и, когда средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, при этом полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определять то, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае определять то, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
27. Устройство по п. 23, в котором передающий модуль содержит:
- второй передающий блок, сконфигурированный с возможностью формировать отклонение согласно первому отношению и второму отношению, при этом первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра и второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определять то, достигает или нет отклонение предварительно установленного порогового значения; если да, кодировать SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять кодированный SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
28. Устройство по п. 27, в котором: то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, содержит то, что:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и
- то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, содержит то, что:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; или
- то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, содержит то, что:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и
- то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, содержит то, что:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
29. Устройство по п. 27, в котором второй передающий блок содержит:
- субблок вычисления, сконфигурированный с возможностью отдельно вычислять логарифмическое значение первого отношения и логарифмическое значение второго отношения и вычислять абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
30. Устройство по п. 23, в котором первый передающий модуль содержит:
- третий передающий блок, сконфигурированный с возможностью определять то, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром предварительно установленному условию; если да, кодировать SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для кодирования второго SID и отправлять кодированный SID; а если нет, определять то, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.
31. Устройство по п. 30, в котором средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром содержит: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.
32. Устройство по п. 25, в котором условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно содержит: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.
33. Устройство для декодирования аудиоданных, при этом устройство содержит:
- модуль получения, сконфигурированный с возможностью получать кадр SID дескриптора вставки молчания и определять то, SID содержит параметр полосы низких частот или параметр полосы высоких частот;
- первый модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, содержит параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума (CN) согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;
- второй модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, содержит параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и
- третий модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, содержит параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
34. Устройство по п. 32, в котором первый модуль декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, когда устройство находится в первом состоянии формирования CNG комфортного шума, переходить во второе CNG-состояние.
35. Устройство по п. 32, в котором третий модуль декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, когда устройство находится во втором CNG-состоянии, переходить в первое CNG-состояние.
36. Устройство по п. 33, в котором модуль получения содержит:
- первый блок определения, сконфигурированный с возможностью: когда число битов SID меньше предварительно установленного первого порогового значения, определять то, что SID содержит параметр полосы высоких частот; когда число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определять то, что SID содержит параметр полосы низких частот; и когда число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определять то, что SID содержит параметр полосы высоких частот и параметр полосы низких частот; или
- второй блок определения, сконфигурированный с возможностью: когда SID содержит первый идентификатор, определять то, что SID содержит параметр полосы высоких частот; когда SID содержит второй идентификатор, определять то, что SID содержит параметр полосы низких частот; и когда SID содержит третий идентификатор, определять то, что SID содержит параметр полосы низких частот и параметр полосы высоких частот.
37. Устройство по п. 33, в котором первый модуль декодирования содержит:
- первый блок получения, сконфигурированный с возможностью отдельно получать средневзвешенную энергию шумового сигнала полосы высоких частот и коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- второй блок получения, сконфигурированный с возможностью получать шумовой сигнал полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
38. Устройство по п. 37, в котором первый блок получения содержит:
- первый субблок получения, сконфигурированный с возможностью получать энергию сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;
- субблок вычисления, сконфигурированный с возможностью вычислять отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;
- второй субблок получения, сконфигурированный с возможностью получать согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению энергию шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- третий субблок получения, сконфигурированный с возможностью осуществлять взвешенное усреднение для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, при этом средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
39. Устройство по п. 38, в котором субблок вычисления, в частности, сконфигурирован с возможностью:
- вычислять отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или
- вычислять отношение средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.
40. Устройство по п. 38, в котором, когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, при этом первая скорость превышает вторую скорость.
41. Устройство по п. 37, в котором первый блок получения содержит:
- первый субблок выбора, сконфигурированный с возможностью выбирать сигнал полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID и получать согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, при этом средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или
- второй субблок выбора, сконфигурированный с возможностью выбирать сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получать согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, при этом средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
42. Устройство по п. 37, в котором первый блок получения содержит:
- субблок распределения, сконфигурированный с возможностью распределять M коэффициентов спектральной частоты ISF иммитанса, или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот;
- первый субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, при этом признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, при этом целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, при этом M и N являются натуральными числами; и
- четвертый субблок получения, сконфигурированный с возможностью получать согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
43. Устройство по п. 37, в котором первый блок получения содержит:
- пятый субблок получения, сконфигурированный с возможностью получать M ISF-коэффициентов, или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;
- второй субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, при этом признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, при этом целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и
- шестой субблок получения, сконфигурированный с возможностью получать согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
44. Устройство по п. 37, при этом устройство дополнительно содержит:
- модуль оптимизации, сконфигурированный с возможностью: до того, как первый модуль декодирования получает первый CN-кадр, когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, когда средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножать шумовые сигналы полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; при этом
- первый модуль декодирования, в частности, сконфигурирован с возможностью получать четвертый CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
RU2014131387/08A 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных RU2579926C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110455836.7 2011-12-30
CN201110455836.7A CN103187065B (zh) 2011-12-30 2011-12-30 音频数据的处理方法、装置和系统
PCT/CN2012/087812 WO2013097764A1 (zh) 2011-12-30 2012-12-28 音频数据的处理方法、装置和系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2016100179A Division RU2617926C1 (ru) 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных

Publications (1)

Publication Number Publication Date
RU2579926C1 true RU2579926C1 (ru) 2016-04-10

Family

ID=48678198

Family Applications (3)

Application Number Title Priority Date Filing Date
RU2016100179A RU2617926C1 (ru) 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных
RU2014131387/08A RU2579926C1 (ru) 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных
RU2017113357A RU2641464C1 (ru) 2011-12-30 2017-04-18 Способ, устройство и система для обработки аудиоданных

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2016100179A RU2617926C1 (ru) 2011-12-30 2012-12-28 Способ, устройство и система для обработки аудиоданных

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2017113357A RU2641464C1 (ru) 2011-12-30 2017-04-18 Способ, устройство и система для обработки аудиоданных

Country Status (18)

Country Link
US (6) US9406304B2 (ru)
EP (1) EP2793227B1 (ru)
JP (2) JP6072068B2 (ru)
KR (2) KR101770237B1 (ru)
CN (1) CN103187065B (ru)
AU (1) AU2012361423B2 (ru)
BR (1) BR112014016153B1 (ru)
CA (3) CA3059322C (ru)
ES (1) ES2610783T3 (ru)
HK (1) HK1199543A1 (ru)
IN (1) IN2014KN01436A (ru)
MX (1) MX338445B (ru)
MY (1) MY173976A (ru)
PT (1) PT2793227T (ru)
RU (3) RU2617926C1 (ru)
SG (2) SG11201403686SA (ru)
WO (1) WO2013097764A1 (ru)
ZA (2) ZA201404996B (ru)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
CN106169297B (zh) * 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
US9136763B2 (en) * 2013-06-18 2015-09-15 Intersil Americas LLC Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode
PL3128513T3 (pl) * 2014-03-31 2019-11-29 Fraunhofer Ges Forschung Koder, dekoder, sposób kodowania, sposób dekodowania i program
US10163453B2 (en) 2014-10-24 2018-12-25 Staton Techiya, Llc Robust voice activity detector system for use with an earphone
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
CN105681512B (zh) * 2016-02-25 2019-02-01 Oppo广东移动通信有限公司 一种降低语音通话功耗的方法及装置
CN105721656B (zh) * 2016-03-17 2018-10-12 北京小米移动软件有限公司 背景噪声生成方法及装置
EP3334079B1 (en) * 2016-12-12 2019-06-19 Kyynel Oy Versatile channel selection procedure for wireless network
US10540983B2 (en) * 2017-06-01 2020-01-21 Sorenson Ip Holdings, Llc Detecting and reducing feedback
US10504538B2 (en) * 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
GB2595891A (en) * 2020-06-10 2021-12-15 Nokia Technologies Oy Adapting multi-source inputs for constant rate encoding
CN113571072B (zh) * 2021-09-26 2021-12-14 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2251750C2 (ru) * 1998-11-23 2005-05-10 Телефонактиеболагет Лм Эрикссон (Пабл) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале
CN101087319A (zh) * 2006-06-05 2007-12-12 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩系统
CN101246688A (zh) * 2007-02-14 2008-08-20 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
CN101320563A (zh) * 2007-06-05 2008-12-10 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103065B1 (en) * 1998-10-30 2006-09-05 Broadcom Corporation Data packet fragmentation in a cable modem system
CA2351571C (en) * 1998-11-24 2008-07-22 Telefonaktiebolaget Lm Ericsson Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems
US6549587B1 (en) * 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6526139B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated noise injection in a voice processing system
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US7920697B2 (en) 1999-12-09 2011-04-05 Broadcom Corp. Interaction between echo canceller and packet voice processing
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6691805B2 (en) 2001-08-27 2004-02-17 Halliburton Energy Services, Inc. Electrically conductive oil-based mud
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
FR2859566B1 (fr) * 2003-09-05 2010-11-05 Eads Telecom Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
JP4572123B2 (ja) * 2005-02-28 2010-10-27 日本電気株式会社 音源供給装置及び音源供給方法
US7809559B2 (en) * 2006-07-24 2010-10-05 Motorola, Inc. Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP2008139447A (ja) * 2006-11-30 2008-06-19 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
BRPI0818927A2 (pt) * 2007-11-02 2015-06-16 Huawei Tech Co Ltd Método e aparelho para a decodificação de áudio
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
WO2011103924A1 (en) * 2010-02-25 2011-09-01 Telefonaktiebolaget L M Ericsson (Publ) Switching off dtx for music
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system
JP2012215198A (ja) * 2011-03-31 2012-11-08 Showa Corp 回転構造体
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
CA2894625C (en) * 2012-12-21 2017-11-07 Anthony LOMBARD Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2251750C2 (ru) * 1998-11-23 2005-05-10 Телефонактиеболагет Лм Эрикссон (Пабл) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале
CN101087319A (zh) * 2006-06-05 2007-12-12 华为技术有限公司 一种发送和接收背景噪声的方法和装置及静音压缩系统
CN101246688A (zh) * 2007-02-14 2008-08-20 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
CN101320563A (zh) * 2007-06-05 2008-12-10 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备

Also Published As

Publication number Publication date
PT2793227T (pt) 2016-12-29
WO2013097764A1 (zh) 2013-07-04
KR20170002704A (ko) 2017-01-06
CA3059322C (en) 2023-01-10
US10529345B2 (en) 2020-01-07
US20180137869A1 (en) 2018-05-17
EP2793227A4 (en) 2015-03-18
MY173976A (en) 2020-03-02
KR101693280B1 (ko) 2017-01-05
US12100406B2 (en) 2024-09-24
BR112014016153A2 (pt) 2017-06-13
US11183197B2 (en) 2021-11-23
US20160300578A1 (en) 2016-10-13
US20140316774A1 (en) 2014-10-23
HK1199543A1 (en) 2015-07-03
KR20140109456A (ko) 2014-09-15
CA2861916C (en) 2019-11-19
CN103187065A (zh) 2013-07-03
CA3059322A1 (en) 2013-07-04
CA3181066A1 (en) 2013-07-04
AU2012361423A1 (en) 2014-07-31
AU2012361423B2 (en) 2016-01-28
RU2641464C1 (ru) 2018-01-17
JP2015507764A (ja) 2015-03-12
ZA201600247B (en) 2016-03-30
KR101770237B1 (ko) 2017-08-22
US9892738B2 (en) 2018-02-13
US9406304B2 (en) 2016-08-02
IN2014KN01436A (ru) 2015-10-23
ES2610783T3 (es) 2017-05-03
ZA201404996B (en) 2016-06-29
CN103187065B (zh) 2015-12-16
SG10201609338SA (en) 2016-12-29
JP2017062512A (ja) 2017-03-30
BR112014016153B1 (pt) 2021-01-12
MX2014007968A (es) 2015-01-26
EP2793227A1 (en) 2014-10-22
JP6462653B2 (ja) 2019-01-30
US20220044692A1 (en) 2022-02-10
MX338445B (es) 2016-04-15
US20230352035A1 (en) 2023-11-02
US11727946B2 (en) 2023-08-15
RU2617926C1 (ru) 2017-04-28
JP6072068B2 (ja) 2017-02-01
EP2793227B1 (en) 2016-10-26
BR112014016153A8 (pt) 2017-07-04
CA2861916A1 (en) 2013-07-04
SG11201403686SA (en) 2014-10-30
US20200098378A1 (en) 2020-03-26

Similar Documents

Publication Publication Date Title
RU2641464C1 (ru) Способ, устройство и система для обработки аудиоданных
US8473301B2 (en) Method and apparatus for audio decoding
CN108831501B (zh) 用于带宽扩展的高频编码/高频解码方法和设备
JP6779966B2 (ja) 先進量子化器
KR101698371B1 (ko) 디지털 오디오 신호들의 개선된 코딩/디코딩
JP6061121B2 (ja) オーディオ符号化装置、オーディオ符号化方法、およびプログラム
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
US20190198033A1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
CN115171709B (zh) 语音编码、解码方法、装置、计算机设备和存储介质
EP2229675A1 (en) Apparatus and method of enhancing quality of speech codec