RU2617926C1 - Способ, устройство и система для обработки аудиоданных - Google Patents
Способ, устройство и система для обработки аудиоданных Download PDFInfo
- Publication number
- RU2617926C1 RU2617926C1 RU2016100179A RU2016100179A RU2617926C1 RU 2617926 C1 RU2617926 C1 RU 2617926C1 RU 2016100179 A RU2016100179 A RU 2016100179A RU 2016100179 A RU2016100179 A RU 2016100179A RU 2617926 C1 RU2617926 C1 RU 2617926C1
- Authority
- RU
- Russia
- Prior art keywords
- noise
- frequency band
- frame
- sid
- energy
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000012545 processing Methods 0.000 title claims abstract description 48
- 230000005540 biological transmission Effects 0.000 claims abstract description 109
- 230000007246 mechanism Effects 0.000 claims abstract description 71
- 230000005236 sound signal Effects 0.000 claims abstract description 22
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000000344 soap Substances 0.000 claims 1
- 238000003672 processing method Methods 0.000 abstract description 10
- 238000004891 communication Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 description 49
- 238000001914 filtration Methods 0.000 description 33
- 230000002194 synthesizing effect Effects 0.000 description 25
- 238000001228 spectrum Methods 0.000 description 21
- 238000003780 insertion Methods 0.000 description 13
- 230000037431 insertion Effects 0.000 description 13
- 230000007774 longterm Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 7
- 230000005284 excitation Effects 0.000 description 7
- 238000009499 grossing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010021403 Illusion Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
Abstract
Изобретение относится к средствам для обработки аудиоданных и к области техники связи. Технический результат заключается в повышении эффективности кодирования. Способ включает в себя: получение шумового кадра аудиосигнала и разложение текущего шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и кодирование и передачу шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование и передачу шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи. Согласно настоящему изобретению различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, вычислительная нагрузка и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, могут помогать достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования. 2 н. и 6 з.п. ф-лы, 9 ил.
Description
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0001] Настоящее изобретение относится к области техники связи, в частности к способу, устройству и системе для обработки аудиоданных.
УРОВЕНЬ ТЕХНИКИ
[0002] В области цифровой связи существуют строгие требования к приложениям для передачи речи, изображений, аудио и видео, таким как вызовы с мобильного телефона, аудио/видеоконференц-связь, широковещательное телевидение и мультимедийные развлечения. Речь оцифровывается и затем передается из одного терминала в другой терминал через сеть речевой связи. В данном документе терминалы могут представлять собой мобильные телефоны, цифровые телефонные терминалы или речевые терминалы либо любые другие типы. Примеры цифровых телефонных терминалов представляют собой VoIP-телефоны или ISDN-телефоны, компьютеры и телефоны на основе кабельной связи. Чтобы сокращать ресурсы, занимаемые в процессе сохранения или передачи аудиосигналов, отправляющая сторона выполняет обработку сжатия для аудиосигналов перед передачей аудиосигналов в приемную сторону и приемная сторона выполняет обработку распаковки, чтобы восстанавливать аудиосигналы и воспроизводить аудиосигналы.
[0003] В речевой связи речь включается только приблизительно 40% времени, а в другое время имеется только молчание или фоновый шум. Чтобы экономить полосы пропускания передачи и не допускать необязательного потребления полос пропускания в период молчания или фонового шума, развивается технология DTX/CNG (на основе системы прерывистой передачи/формирования комфортного шума). Если упрощать, DTX/CNG означает не кодирование кадров шума непрерывно, а выполнение кодирования только один раз за интервал в несколько кадров в период шума/молчания согласно политике, причем скорость передачи кодированных битов, в общем, гораздо ниже скорости передачи битов при речевом кадровом кодировании. Шумовой кадр, кодированный на такой низкой скорости, упоминается как "SID (кадр дескриптора вставки молчания)". Декодер восстанавливает непрерывные фоновые шумовые кадры на стороне декодирования согласно прерывисто принимаемым SID. Такой непрерывно восстановленный фоновый шум не является высококачественным воспроизведением фонового шума стороны кодирования, а нацелен на то, чтобы не допускать результирующего ухудшения качества при прослушивании в максимально возможной степени, так что пользователь чувствует себя комфортно при прослушивании шума. Восстановленный фоновый шум упоминается как "CN (комфортный шум)", а способ для восстановления CN на стороне декодирования упоминается как "формирование комфортного шума".
[0004] В предшествующем уровне техники ITU-T G.718 является новым стандартным широкополосным кодеком, который включает в себя широкополосную DTX/CNG-систему. Система может отправлять SID согласно фиксированному интервалу, а также может адаптивно регулировать интервал отправки SID согласно оцененному уровню шума. SID-кадр G.718 включает в себя 16 ISP-параметров и параметров энергии возбуждения. Эта группа параметров ISP (спектральной пары иммитанса) представляет спектральную огибающую для полосы пропускания всей широкой полосы частот, и энергия возбуждения получается посредством аналитического фильтра, представленного посредством этой группы ISP-параметров. На стороне декодирования G.718 оценивает, согласно ISP-параметрам, полученным посредством декодирования SID в CNG-состоянии, LPC-коэффициент, требуемый для CNG, оценивает, согласно параметрам энергии возбуждения, полученным посредством декодирования SID-кадра, энергию возбуждения, требуемую для CNG, и использует отрегулированный по усилению белый шум для того, чтобы возбуждать синтезирующий CNG-фильтр, чтобы получать восстановленный CN.
[0005] Тем не менее, для сверхширокополосной спектральной огибающей полоса пропускания сверхширокой полосы частот является чрезвычайно широкой; когда предшествующий уровень техники расширяется на сверхширокополосную DTX/CNG-систему, более интенсивные вычислительные нагрузки должны использоваться, и большее число битов должно быть использовано для того, чтобы вычислять и кодировать еще десяток ISP-параметров, поскольку полная сверхширокополосная спектральная огибающая должна быть кодирована для SID. Поскольку сигналы полосы высоких частот шума (которая означает частотный диапазон выше широкой полосы частот в данном документе), в общем, не являются перцепционно чувствительными при прослушивании, используемые вычислительные нагрузки и биты, потребляемые для этой части сигналов, не являются экономически эффективными, в силу этого снижая эффективность кодирования кодека.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0006] Чтобы разрешать проблему при сверхширокополосном кодировании и передаче, варианты осуществления настоящего изобретения предоставляют способ, устройство и систему для обработки аудиоданных. Технические решения заключаются в следующем.
[0007] Согласно одному аспекту, способ для обработки аудиоданных предоставляется и включает в себя:
- получение шумового кадра аудиосигнала и разложение шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- кодирование сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и передачу кодированного шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передачу кодированного шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0008] Согласно одному аспекту, способ для обработки аудиоданных предоставляется и включает в себя:
- получение, посредством декодера, кадра SID дескриптора вставки молчания и определение того, включает ли SID в себя параметр полосы низких частот и/или параметр полосы высоких частот;
- когда SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;
- когда SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и
- когда SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получение третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0009] Согласно другому аспекту, устройство для кодирования аудиоданных предоставляется и включает в себя:
- модуль получения, сконфигурированный с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- передающий модуль, сконфигурированный с возможностью кодировать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0010] Согласно другому аспекту, устройство для декодирования аудиоданных предоставляется и включает в себя:
- модуль получения, сконфигурированный с возможностью получать кадр SID дескриптора вставки молчания и определять то, SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот;
- первый модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;
- второй модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и
- третий модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0011] Согласно другому аспекту, система для обработки аудиоданных предоставляется и включает в себя вышеприведенное устройство для кодирования аудиоданных и вышеприведенное устройство для декодирования аудиоданных.
[0012] Технические решения, предоставляемые посредством вариантов осуществления настоящего изобретения, обеспечивают следующие преимущества. Текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи; декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; и различные способы декодирования шума используются согласно различным результатам определения. Таким образом, различные способы обработки кодирования и декодирования используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, могут помогать достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0013] Чтобы более понятно описывать технические решения в вариантах осуществления настоящего изобретения, далее кратко представлены прилагаемые чертежи, требуемые для описания вариантов осуществления. Очевидно, что прилагаемые чертежи в последующем описании показывают только некоторые варианты осуществления настоящего изобретения, и специалисты в данной области техники по-прежнему могут получать другие чертежи из этих прилагаемых чертежей без творческих усилий.
[0014] Фиг.1 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 1 осуществления настоящего изобретения;
[0015] фиг.2 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 2 осуществления настоящего изобретения;
[0016] фиг.3 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 3 осуществления настоящего изобретения;
[0017] фиг.4 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 4 осуществления настоящего изобретения;
[0018] фиг.5 является принципиальной схемой устройства для кодирования аудиоданных согласно варианту 6 осуществления настоящего изобретения;
[0019] фиг.6 является принципиальной схемой другого устройства для кодирования аудиоданных согласно варианту 6 осуществления настоящего изобретения;
[0020] фиг.7 является принципиальной схемой устройства для декодирования аудиоданных согласно варианту 7 осуществления настоящего изобретения;
[0021] фиг.8 является принципиальной схемой другого устройства для декодирования аудиоданных согласно варианту 7 осуществления настоящего изобретения; и
[0022] фиг.9 является принципиальной схемой системы для обработки аудиоданных согласно варианту 8 осуществления настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0023] Чтобы делать цели, технические решения и преимущества настоящего изобретения более понятными, далее подробно описываются варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.
Вариант 1 осуществления
[0024] Ссылаясь на фиг.1, этот вариант осуществления предоставляет способ для обработки аудиоданных, причем способ включает в себя следующее.
[0025] 101. Получение шумового кадра аудиосигнала и разложение шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.
[0026] 102. Кодирование и передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0027] В этом варианте осуществления первый SID включает в себя параметр полосы низких частот шумового кадра, а второй SID включает в себя параметр полосы низких частот или параметр полосы высоких частот шумового кадра.
[0028] Необязательно, в этом варианте осуществления, кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:
- определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0029] Определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, включает в себя:
- получение спектра шумового сигнала полосы высоких частот, разделение спектра по меньшей мере на две подполосы частот, если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определение того, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определение того, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
[0030] Необязательно, в этом варианте осуществления кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:
- формирование отклонения согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и
- определение того, достигает или нет отклонение предварительно установленного порогового значения; если да, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0031] Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0032] Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0033] В этом варианте осуществления формирование отклонения согласно первому отношению и второму отношению включает в себя:
- отдельное вычисление логарифмического значения первого отношения и логарифмического значения второго отношения; и
- вычисление абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
[0034] Необязательно, в этом варианте осуществления, кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:
- определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодирование SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.
[0035] Средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.
[0036] В этом варианте осуществления условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.
[0037] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 2 осуществления
[0038] Ссылаясь на фиг.2, этот вариант осуществления предоставляет способ для обработки аудиоданных, причем способ включает в себя следующее.
[0039] 201. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот или параметр полосы высоких частот.
[0040] 202. Если SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.
[0041] 203. Если SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.
[0042] 204. Если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получение третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0043] Необязательно, в этом варианте осуществления, если SID включает в себя параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно включает в себя:
- если декодер находится в первом состоянии формирования CNG комфортного шума, переход, посредством декодера, во второе CNG-состояние.
[0044] Необязательно, в этом варианте осуществления, если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, способ дополнительно включает в себя:
- если декодер находится во втором CNG-состоянии, переход, посредством декодера, в первое CNG-состояние.
[0045] Необязательно, в этом варианте осуществления, определение того, SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот, включает в себя:
- если число битов SID меньше предварительно установленного первого порогового значения, определение того, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определение того, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определение того, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот; или
- если SID включает в себя первый идентификатор, определение того, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определение того, что SID включает в себя параметр полосы низких частот; и если SID включает в себя третий идентификатор, определение того, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.
[0046] В этом варианте осуществления локальное формирование шумового параметра полосы высоких частот включает в себя:
- отдельное получение средневзвешенной энергии шумового сигнала полосы высоких частот и коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- получение шумового сигнала полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0047] Необязательно, в этом варианте осуществления, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- получение энергии сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;
- вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;
- получение, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- выполнение взвешенного усреднения для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0048] Необязательно, в этом варианте осуществления, вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, включает в себя:
- вычисление отношения мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или
- вычисление отношения средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.
[0049] Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.
[0050] Необязательно, в этом варианте осуществления, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- выбор сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и
- получение, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или
- выбор сигналов полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и
- получение, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0051] Необязательно, в этом варианте осуществления, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- распределение M коэффициентов ISF (спектральной частоты иммитанса) или ISP-коэффициентов, или коэффициентов LSF (частоты спектральной линии), или коэффициентов LSP (пары спектральных линий) в частотном диапазоне, соответствующем сигналу полосы высоких частот;
- выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, где M и N являются натуральными числами; и
- получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0052] Необязательно, в этом варианте осуществления, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:
- получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;
- выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и
- получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0053] Необязательно, в этом варианте осуществления, перед получением первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно включает в себя:
- когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножение шумовых сигналов полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и
- соответственно, получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот включает в себя:
- получение четвертого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
[0054] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 3 осуществления
[0055] Этот вариант осуществления предоставляет способ для обработки аудиоданных. На стороне кодирования, независимо от спектра CNG-шума полосы низких частот или спектра CNG-шума полосы высоких частот, в общем, гармоническая структура теряется, и, следовательно, в сигнале полосы высоких частот CNG перцепционно эффективной при прослушивании является, главным образом, энергия сигнала полосы высоких частот CNG, а не спектральная структура сигнала полосы высоких частот CNG. Следовательно, при DTX-передаче сверхширокополосного сигнала, во многих случаях, необязательно передавать спектр сигнала полосы высоких частот в SID; вместо этого, надлежащий способ может быть использован для того, чтобы создавать спектр полосы высоких частот локально на стороне декодирования. Локально созданный спектр полосы высоких частот не должен вызывать очевидное перцепционное искажение. Таким образом, вычислительные нагрузки и биты для вычисления и кодирования спектра полосы высоких частот экономятся на стороне кодирования. Между тем, для других шумовых сигналов гармоническая структура может существовать в сигнале полосы высоких частот, и создание спектра полосы высоких частот локально только на стороне декодирования может вызывать проблему ухудшения перцепционного качества при переключении между CNG-сегментом и речевым сегментом. Следовательно, для такого шума спектральный параметр должен быть передан в SID. Можно видеть, что DTX/CNG-система, которая учитывает как эффективность, так и качество, должна допускать адаптивный выбор кодировать или выбор не кодировать спектральный параметр полосы высоких частот в SID на стороне кодирования согласно признаку полосы высоких частот фонового шума и восстановление CNG-кадра на стороне декодирования посредством использования различных способов декодирования согласно различным типам SID. В этом варианте осуществления способ для обработки аудиоданных предоставляется и включает в себя следующее: спектр полосы высоких частот шума анализируется и классифицируется; декодер вслепую создает спектр сигнала полосы высоких частот; когда SID не включает в себя параметр энергии полосы высоких частот, декодер оценивает энергию сигналов полосы высоких частот; и декодер переключается между различными CNG-модулями, и т.д. Ссылаясь на фиг.3, в частности, способ для обработки аудиоданных на стороне кодера согласно этому варианту осуществления включает в себя:
[0056] 301. Кодер получает шумовой кадр аудиосигнала и раскладывает шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.
[0057] В этом варианте осуществления, вследствие различных правил кодирования кодера, кодер получает шумовой кадр аудиосигнала, и шумовой кадр может представлять собой текущий шумовой кадр или может представлять собой шумовой кадр, буферизованный на стороне кодера, что не ограничено конкретным образом в этом варианте осуществления. В этом варианте осуществления сверхширокополосные входные аудиосигналы, дискретизированные при 32 кГц, используются в качестве примера. Кодер сначала выполняет обработку кадрирования для входных аудиосигналов, например, 20 мс (или 640 точек дискретизации) используется в качестве кадра. Для текущего кадра (в этом варианте осуществления текущий кадр означает текущий кадр, который должен быть кодирован) кодер сначала выполняет фильтрацию верхних частот. В общем, полоса пропускания означает частоты выше 50 Гц. Фильтрованный по верхним частотам текущий кадр раскладывается на сигнал s0 полосы низких частот и сигнал s1 полосы высоких частот посредством аналитического фильтра на основе квадратурного зеркального фильтра QMF (квадратурного зеркального фильтра). Сигнал s0 полосы низких частот дискретизируется при 16 кГц и представляет спектр 0-8 кГц текущего кадра. Сигнал s1 полосы высоких частот также дискретизируется при 16 кГц и представляет спектр 8-16 кГц текущего кадра. Когда VAD (детектор речевой активности) указывает, что текущий кадр представляет собой кадр приоритетного сигнала, т.е. кадр речевого сигнала, кодер выполняет кодирование речи для текущего кадра. В этом варианте осуществления то, что кодер кодирует кодированный речевой кадр, относится к объему предшествующего уровня техники, и подробности не описываются повторно в этом варианте осуществления. VAD указывает, что кодер переходит в рабочее DTX-состояние, когда текущий кадр представляет собой шумовой кадр. В этом варианте осуществления шумовой кадр означает либо фоновый шумовой кадр, либо кадр молчания.
[0058] В этом варианте осуществления, в рабочем DTX-состоянии, DTX-контроллер определяет, согласно политике отправки SID, то следует или нет кодировать и отправлять SID сигнала полосы низких частот текущего кадра. В этом варианте осуществления политика для отправки SID сигнала полосы низких частот заключается в следующем: (1) отправка SID в первом шумовом кадре после кодированного речевого кадра и задание флага flagSID отправки SID равным 1; (2) в период шума, отправка SID-кадра в N-ном кадре после каждого SID-кадра и задание flagSID равным 1 в кадре, где N является целым числом, превышающим 1, и внешне вводится в кодер; и (3) в период шума, невыполнение отправки SID в других кадрах и задание flagSID равным 0. В этом варианте осуществления политика для отправки SID сигнала полосы низких частот является аналогичной политике предшествующего уровня техники и не описывается подробно в настоящем изобретении.
[0059] 302. Определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному условию кодирования и передачи; если да, выполнение этапа 304; если нет, выполнение этапа 303.
[0060] В этом варианте осуществления, определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному условию кодирования и передачи, включает в себя: определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан. Определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, включает в себя: получение спектра шумового сигнала полосы высоких частот, разделение спектра по меньшей мере на две подполосы частот, если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определение того, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определение того, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
[0061] В этом варианте осуществления, в рабочем DTX-состоянии, кодер выполняет спектральный анализ для сигнала s1 полосы высоких частот текущего шумового кадра, чтобы определять то, имеет или нет s1 явную спектральную структуру, т.е. предварительно установленную спектральную структуру. Конкретный способ в этом варианте осуществления заключается в следующем: понижающая дискретизация до 12,8 кГц выполняется для s1, и 256-точечное FFT (быстрое преобразование Фурье) выполняется для сигнала после понижающей дискретизации, чтобы получать спектр C(i), где i=0, ..., 127. C(i) разделяется на четыре подполосы частот равной ширины, и вычисляется энергия E(i) каждой подполосы частот. Каждая подполоса частот представляет собой любую вышеупомянутую первую подполосу частот. , где i=0, ..., 3, l(i) и h(i), соответственно, представляет верхнюю границу и нижнюю границу i-ой подполосы частот, l(i)={0, 32, 64, 96} и h(i)={31, 63, 95, 127}. Проверяется то, удовлетворяется или нет следующее условие:
где E(j) представляет собой вторую вышеупомянутую подполосу частот. Если удовлетворяется вышеприведенная формула (1), т.е. если энергия любой первой подполосы частот в подполосах частот не меньше энергии второй подполосы частот в подполосах частот, считается, что сигнал полосы высоких частот не имеет явной спектральной структуры; в противном случае, сигнал полосы высоких частот имеет явную спектральную структуру. Если сигнал полосы высоких частот имеет явную спектральную структуру, DTX-политика отправляет параметр полосы высоких частот. В этом варианте осуществления, если флаг flaghb отправки параметров полосы высоких частот не равен 1, flaghb=1 задается в следующий раз, когда flagSID=1; в противном случае, flaghb=0.
[0062] В этом варианте осуществления, когда удовлетворяется условие отправки SID, то необходимо или нет кодировать и передавать сигнал полосы высоких частот текущего шумового кадра, может быть определено посредством использования спектральной структуры сигнала полосы высоких частот текущего шумового кадра, и определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, и удовлетворяет или нет шумовой сигнал полосы низких частот условию отправки SID, используется в качестве первого условия определения. Необязательно, в этом варианте осуществления, определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному кодированию и условию отправки, включает в себя: формирование отклонения согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определение того, достигает или нет отклонение предварительно установленного порогового значения; если да, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан. Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя: первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и, соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя: второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром. Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя: первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и, соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя: второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром. В этом варианте осуществления предпочтительно формирование отклонения согласно первому отношению и второму отношению включает в себя: отдельное вычисление логарифмического значения первого отношения и логарифмическое значение второго отношения; и вычисление абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
[0063] В частности, в этом варианте осуществления, определение того, достигает или нет отклонение предварительно установленного порогового значения, может быть реализовано следующим образом:
[0064] В рабочем DTX-состоянии кодер отдельно вычисляет логарифмические энергии e1 и e0 сигнала s1 полосы высоких частот и сигнала s0 полосы низких частот текущего кадра.
[0065] Долговременные скользящие средние e1a и e0a для e1 и e0 на стороне кодирования обновляются:
где sign[.] представляет знаковую функцию, MIN[.] представляет минимальную функцию, |.| представляет функцию абсолютного значения, форма x(-1) представляет значение предыдущего кадра x, и α=0,1 является коэффициентом отсутствия последействия, который определяет то, является скорость обновления высокой или низкой. Предыдущий кадр представляет собой SID, который отправлен в прошлый раз перед текущим шумовым кадром, и включает в себя шумовой параметр полосы высоких частот. В этом варианте осуществления абсолютная величина обновления e1a и e0a ограничивается. Если варьирование энергии между ex текущего шумового кадра и exa предыдущего кадра превышает 3 дБ, exa текущего кадра обновляется на 3 дБ. Когда кодер переходит в рабочее DTX-состояние в первый раз, exa инициализируется в качестве ex текущего кадра. Кодер проверяет то, достигает или нет степени отклонение между отношением (а именно, первым отношением) энергии сигнала полосы высоких частот к энергии сигнала полосы низких частот текущего шумового кадра и отношением (вторым отношением) энергии полосы высоких частот к энергии полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз, т.е. проверяет то, удовлетворяется или нет следующее условие:
где и , соответственно, представляют логарифмическую энергию полосы высоких частот и логарифмическую энергию полосы низких частот в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. Если удовлетворяется вышеприведенная формула (4), шумовой сигнал полосы высоких частот должен быть кодирован и передан. Если флаг отправки параметров полосы высоких частот flaghb=0, задается flaghb=1.
[0066] В этом варианте осуществления долговременное усреднение перемещения представляет собой один тип средневзвешенного вычисления, что не ограничено конкретным образом в этом варианте осуществления.
[0067] В этом варианте осуществления, определение того, достигает или нет отклонение предварительно установленного порогового значения, может быть использовано в качестве второго условия определения. В конкретном процессе реализации, чтобы определять то, должен или нет шумовой сигнал полосы высоких частот быть кодирован и передан, просто должно определяться первое условие определения или второе условие определения, что не ограничено конкретным образом в этом варианте осуществления.
[0068] В этом варианте осуществления второе условие определения является необязательным. Цель выполнения этого этапа состоит в том, чтобы помогать стороне декодирования в локальной оценке энергии шума полосы высоких частот согласно энергии полосы низких частот шума и отношению энергии полосы высоких частот шума к энергии полосы низких частот шума в момент, когда SID, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. В частности, если отклонение не вычисляется на стороне кодирования, речевой кадр с минимальной энергией сигналов полосы высоких частот может быть получен на стороне декодирования из речевых кадров в пределах периода времени перед текущим шумовым кадром, и энергия текущего шума полосы высоких частот оценивается локально согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах периода времени перед текущим шумовым кадром. Например, энергия сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах периода времени перед текущим шумовым кадром выбирается в качестве энергии текущего шума полосы высоких частот. Альтернативно, сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, выбираются из речевых кадров в пределах предварительно установленного периода времени перед SID; и средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, получается согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров. Конкретные ограничения не накладываются в этом варианте осуществления.
[0069] 303. Передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи.
[0070] В этом варианте осуществления предпочтительно передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи включает в себя: в рабочем DTX-состоянии кодер выполняет линейный прогнозный анализ 16-ого порядка для сигнала s0 полосы низких частот текущего шумового кадра и получает 16 коэффициентов lpc(i) линейного прогнозирования, где i=0, 1, ..., 15. LPC-коэффициенты преобразуются в ISP-коэффициенты, чтобы получать 16 ISP-коэффициентов isp(i), где i=0, 1, ..., 15, и ISP-коэффициенты буферизуются. Если SID кодируется в текущем кадре, т.е. flagSID=1, выполняется поиск среднего ISP-коэффициента в буферизованных ISP-коэффициентах N кадров предыстории, включающих в себя текущий кадр. Способ заключается в следующем: во-первых, вычисление расстояния δ от ISP-коэффициента каждого кадра до ISP-коэффициента другого кадра:
затем, выбор ISP-коэффициента кадра с наименьшим δ в качестве ISP-коэффициента ispSID(i), который должен быть кодирован, где i=0, ..., 15; преобразование ispSID(i) в ISF-коэффициент isfSID(i), квантование isfSID(i), получение и инкапсулирование группы квантованных индексов idxISF в SID; локальное декодирование idxISF; получение декодированного ISF-коэффициента isf'(i), где i=0, ..., 15; преобразование isf'(i) в ISP-коэффициент isp'(i), где i=0, ..., 15, буферизация isp'(i); для каждого шумового кадра, обновление долговременного скользящего среднего декодированных ISP-коэффициентов стороны кодирования посредством использования буферизованного isp'(i):
где предпочтительно α=0,9, и ispa(i) инициализируется в качестве isp'(i) первого SID; преобразование ispa(i) в LPC-коэффициент lpca(i), получение аналитического фильтра A(Z); фильтрация сигнала s0 полосы низких частот каждого шумового кадра посредством A(Z), чтобы получать остаточный сигнал r(i), где i=0, 1, ..., 319, и вычисление логарифмической остаточной энергии er:
[0071] В этом варианте осуществления er буферизуется. Когда flagSID текущего шумового кадра равен 1, средневзвешенная логарифмическая энергия eSID вычисляется согласно буферизованному er M кадров предыстории, включающих в себя текущий шумовой кадр: ,
где w1(k) является группой M-мерных положительных коэффициентов, и их сумма меньше 1. Квантуется eSID, и получается квантованный индекс idxe.
[0072] В этом варианте осуществления, в рабочем DTX-состоянии, когда flagSID=1, если flaghb=0, только параметр полосы низких частот кодируется и отправляется в SID-кадре, и в этом случае SID-кадр формируется из idxISF и idxe и упоминается как "небольшой SID-кадр" для удобства.
[0073] В этом варианте осуществления политика для кодирования и передачи шумового сигнала полосы низких частот является аналогичной политике для кодирования и передачи шумового широкополосного сигнала в предшествующем уровне техники. Только краткое введение предоставляется в этом варианте осуществления. Конкретный процесс реализации не описывается подробно в этом варианте осуществления. В этом варианте осуществления шумовой сигнал полосы высоких частот текущего шумового кадра не должен быть кодирован, и кодируется только шумовой сигнал полосы низких частот. Следовательно, вычислительная нагрузка уменьшается на стороне кодирования, и передаваемые биты экономятся.
[0074] 304. Передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи.
[0075] В этом варианте осуществления, если flaghb=1, помимо того, что параметр полосы низких частот должен быть кодирован, параметр полосы высоких частот также должен быть кодирован в SID. Кодирование параметра полосы низких частот шума полосы низких частот является идентичным режиму кодирования на этапе 303, и подробности не описываются повторно в этом варианте осуществления. В этом варианте осуществления предпочтительно способ для кодирования параметра полосы высоких частот заключается в следующем: только тогда, когда кодер находится в рабочем DTX-состоянии, и flagSID=1, кодер выполняет линейный прогнозный анализ 10-го порядка для сигнала s1 полосы высоких частот текущего кадра и получает 10 коэффициентов lpc(i) линейного прогнозирования, где i=0, 1, ..., 9; lpc(i) взвешивается:
и получается взвешенный LPC-коэффициент lpcw(i), где w2(i) представляет группу 9-мерных весовых коэффициентов, которые меньше или равны 1; lpcw(i) преобразуется в LSP-коэффициент, чтобы получать 10 LSP-коэффициентов lspw(i), где i=0, 1, ..., 9, и долговременное скользящее среднее lspw(i) стороны кодирования обновляется согласно lspw(i).
где предпочтительно α=0,9, и lspa(i) инициализируется в качестве lspw(i) текущего кадра каждый раз, когда flaghb изменяется с 0 на 1. Когда SID должен включать в себя параметры полосы высоких частот, квантуется lspa(i), и получается группа квантованных индексов idxLSP. Квантуется долговременное скользящее среднее e1a логарифмических энергий сигналов полосы высоких частот на стороне кодирования, и получается квантованный индекс idxE. В этом случае SID формируется из idxISF, idxe, idxLSP и idxE. В этом варианте осуществления SID, сформированный из idxISF, idxe, idxLSP и idxE, упоминается как "большой SID".
[0076] Необязательно, lspa(i) также может быть обновлен непрерывно в рабочем DTX-состоянии. Иными словами, независимо от того, равно значение flaghb 1 или 0, lspa(i) обновляется. В частности, способ для обновления lspa(i), когда flaghb=0, является идентичным вышеприведенному способу, когда flaghb=1, и подробности не описываются повторно в этом варианте осуществления.
[0077] В этом варианте осуществления принцип политики для кодирования шумового сигнала полосы высоких частот является аналогичным принципу политики для кодирования шумового сигнала полосы низких частот. Только краткое введение предоставляется в этом варианте осуществления. Конкретный процесс реализации не описывается подробно в этом варианте осуществления.
[0078] В этом варианте осуществления, когда удовлетворяется условие для кодирования и передачи шумового сигнала полосы высоких частот, кодирование и передача шумового сигнала полосы высоких частот всегда выполняются одновременно с кодированием и передачей шумового сигнала полосы низких частот. Тем не менее, необязательно кодирование и передача шумового сигнала полосы высоких частот также могут не выполняться одновременно с кодированием и передачей шумового сигнала полосы низких частот. Иными словами, когда отправляется SID, может быть предусмотрено три возможных случая: (1) только сигнал полосы низких частот текущего шумового кадра кодируется и передается; (2) только сигнал полосы высоких частот текущего шумового кадра кодируется и передается; и (3) сигнал полосы низких частот и сигнал полосы высоких частот текущего шумового кадра кодируются и передаются одновременно, и в этом случае условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID. Три случая отправки SID не ограничены конкретным образом в этом варианте осуществления.
[0079] В этом варианте осуществления этапы 302-304 представляют собой, в частности, этапы кодирования и передачи шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирования и передачи шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0080] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 4 осуществления
[0081] Этот вариант осуществления предоставляет способ для обработки аудиоданных. По сравнению с обработкой шумового сигнала на стороне кодера, сторона декодера может определять, согласно принимаемому потоку битов, то представляет собой текущий кадр кодированный речевой кадр либо SID- или NO_DATA-кадр. NO_DATA-кадр представляет собой кадр, указывающий, что сторона кодирования не кодирует и отправляет SID в период шума. Когда текущий кадр представляет собой SID, декодер дополнительно может определять, согласно числу битов SID, то включает SID в себя параметр полосы низких частот и/или полосы высоких частот. Необязательно, декодер также может определять, согласно конкретному идентификатору, вставленному в SID, то включает SID в себя параметр полосы низких частот и/или полосы высоких частот. Это требует добавления дополнительного бита идентификатора, когда кодируется SID. Например, когда первый идентификатор вставляется в SID, он идентифицирует то, что SID включает в себя только параметр полосы высоких частот; когда вставляется второй идентификатор, он идентифицирует то, что SID включает в себя только параметр полосы низких частот, а когда вставляется третий идентификатор, он идентифицирует то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот. Если текущий кадр представляет собой кодированный речевой кадр, декодер декодирует речевой кадр. Процесс конкретной обработки является аналогичным процессу предшествующего уровня техники и не описывается подробно в этом варианте осуществления. Когда текущий кадр представляет собой SID- или NO_DATA-кадр, декодер выбирает, согласно конкретному рабочему состоянию CNG, соответствующий способ, чтобы восстанавливать CN-кадр. В этом варианте осуществления CNG имеет два рабочих состояния: CNG-состояние полудекодирования, соответствующее небольшому SID-кадру, а именно первое CNG-состояние, и CNG-состояние полного декодирования, соответствующее большому SID-кадру, а именно второе CNG-состояние. В CNG-состоянии полного декодирования декодер восстанавливает CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования большого SID-кадра. В CNG-состоянии полудекодирования, декодер восстанавливает CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования небольшого SID-кадра, и локально оцененному шумовому параметру полосы высоких частот. Когда текущий кадр на стороне декодирования представляет собой большой SID-кадр, если флаг flagCNG рабочего CNG-состояния равен 0 (что указывает CNG-состояние полудекодирования), флаг flagCNG рабочего CNG-состояния задается равным 1 (что указывает CNG-состояние полного декодирования); в противном случае исходное состояние остается неизменным. Аналогично, когда текущий кадр на стороне декодирования представляет собой небольшой SID-кадр, если флаг flagCNG рабочего CNG-состояния равен 1, флаг flagCNG рабочего CNG-состояния задается равным 0; в противном случае исходное состояние остается неизменным. Ссылаясь на фиг.4, в частности, этот вариант осуществления предоставляет способ для обработки аудиоданных на стороне декодера, причем способ включает в себя следующее.
[0082] 401. Декодер получает SID, и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0083] В этом варианте осуществления, после приема кодированного кадра, отправленного посредством стороны кодера, сторона декодера сначала определяет тип речевого кадра, так что различные способы декодирования, соответственно, используются согласно различным типам речевых кадров. В частности, если число битов SID меньше предварительно установленного первого порогового значения, определяется то, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определяется то, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определяется то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот. Альтернативно, если SID включает в себя первый идентификатор, определяется то, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определяется то, что SID включает в себя параметр полосы низких частот; или если SID включает в себя третий идентификатор, определяется то, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.
[0084] В этом варианте осуществления, если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, SID декодируется, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и третий CN-кадр получается согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. В частности, декодер декодирует SID, чтобы получать декодированную логарифмическую энергию eD возбуждения полосы низких частот, ISF-коэффициент isfd(i) полосы низких частот, логарифмическую энергию ED полосы высоких частот и LSP-коэффициент lspd(i) полосы высоких частот; isfd(i) преобразуется ISP-коэффициент ispd(i), и eD и ED преобразуются в энергии ed и Ed, где и , и затем буферизуются ispd(i), ed, lspd(i) и Ed.
[0085] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии и flagCNG=1, независимо от того, представляет собой или нет текущий кадр SID- или NO_DATA-кадр, буферизованные ispd(i), ed, lspd(i) и Ed используются для того, чтобы обновлять долговременное скользящее среднее каждого из буферизованных ispd(i), ed, lspd(i) и Ed на стороне декодирования:
где α=0,9, и β=0,7. ECN буферизуется в буфер E1old энергии полосы высоких частот. Случайная небольшая энергия добавляется на основе eCN, и получается конечная энергия e'CN возбуждения, используемая для того, чтобы восстанавливать сигнал шума полосы низких частот: , где RND представляет случайное число в диапазоне [-32767, 32767]. В этом варианте осуществления формируется 320-точечная последовательность exc0(i) белых шумов, где i=0, 1, ..., 319; e'CN используется для того, чтобы выполнять регулировку усиления для exc0(i), чтобы получать exc'0(i), т.е. exc0(i) умножается на коэффициент G0 усиления, так что энергия exc'0(i) равна e'CN, где ; ispCN(i) преобразуется в LPC-коэффициент, чтобы получать синтезирующий фильтр 1/A0(Z), отрегулированное по усилению возбуждение exc'0(i) используется для того, чтобы возбуждать фильтр 1/A(Z), чтобы получать CN-сигнал s'0 полосы низких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, и энергия s'0 вычисляется и буферизуется в буфер E0old энергии полосы низких частот.
[0086] В этом варианте осуществления обработка шумового сигнала полосы высоких частот на стороне декодирования является аналогичной обработке шумового сигнала полосы низких частот. Формируется другая 320-точечная последовательность exc1(i) белых шумов, где i=0, 1, ..., 319, lspCN(i) преобразуется в LPC-коэффициент, чтобы получать синтезирующий фильтр 1/A1(Z), и exc1(i) используется для того, чтобы возбуждать фильтр 1/A1(Z), чтобы получать неотрегулированный по усилению CN-сигнал s~ 1(i) полосы высоких частот; s~ 1(i) умножается на коэффициенты усиления G1 и G2, где G2=0,8, и получается CN-сигнал s'1 полосы высоких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, где . В этом варианте осуществления цель G2 состоит в том, чтобы выполнять подавление энергии для восстановленного шумового сигнала в некоторой степени.
[0087] В этом варианте осуществления, на стороне декодера, s'0 и s'1 проходят через синтезирующий QMF-фильтр, и в завершение получается первый CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.
[0088] 402. Если SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.
[0089] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии, и flagCNG=0, независимо от того, представляет собой или нет текущий кадр SID- или NO_DATA-кадр, CN-сигнал s'0 полосы низких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, получается согласно идентичному способу, который используется, когда flagCNG=1, а именно способу на этапе 402, который дополнительно не описывается в этом варианте осуществления.
[0090] В этом варианте осуществления сигнал полосы высоких частот первого CN-кадра по-прежнему получается посредством использования способа возбуждения синтезирующего фильтра посредством использования белого шума, за исключением того, что энергия сигнала полосы высоких частот первого CN-кадра и коэффициент синтезирующей фильтрации получаются посредством выполнения локальной оценки. В этом варианте осуществления локальное формирование шумового параметра полосы высоких частот включает в себя: отдельное получение средневзвешенной энергии шумового сигнала полосы высоких частот и коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и получение шумового сигнала полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0091] В этом варианте осуществления предпочтительно получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение энергии сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования; вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; получение, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; и выполнение взвешенного усреднения для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра. Необязательно, вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, включает в себя: вычисление отношения мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или вычисление отношения средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение. Мгновенная энергия представляет собой энергию, полученную посредством декодирования. Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.
[0092] В частности, в этом варианте осуществления, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано посредством использования следующего способа:
- получение энергии E0 сигнала полосы низких частот первого CN-кадра s'0 согласно шумовому параметру полосы низких частот, полученному посредством декодирования; оценка, согласно энергии E1old сигнала полосы высоких частот и E0old сигнала полосы низких частот предыдущего CN-кадра в CNG-состоянии полного декодирования и E0, энергии E~ 1 шумового сигнала полосы высоких частот в момент, соответствующий SID, где ; и обновление долговременного скользящего среднего ECN энергий CN-сигналов полосы высоких частот на стороне декодирования посредством использования E~ 1: , где коэффициент λ является переменной, когда E~ 1>ECN, λ=0,98; в противном случае, λ=0,9, причем λ=0,98 является первой скоростью, а λ=0,9 является второй скоростью.
[0093] В этом варианте осуществления, если отклонение не вычисляется на стороне кодирования, необязательно, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: выбор сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и получение, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; или выбор сигналов полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получение, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0094] В этом варианте осуществления предпочтительно получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: распределение M коэффициентов спектральной частоты ISF иммитанса или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, и N может быть переменным; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0095] В частности, в этом варианте осуществления, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано посредством использования следующего способа.
[0096] Девять ISF-коэффициентов isfext(i) равномерно распределяются в полосе частот в -16 кГц, соответствующей ISF-коэффициентам isfd(14) полосы низких частот, где i=0, 1, ..., 8:
isfext(i) преобразуется в полосу частот 0-8 кГц, и получается isf'ext(i):
isf'ext(i) рандомизируется посредством использования группы 9-мерных коэффициентов R(i) рандомизации, где i=0, 1, ..., 8, и получается рандомизированный ISF-коэффициент isf1(i):
где R(i) получается согласно следующей формуле (14):
где α=0,8, и Rt(i) упоминается как "целевой коэффициент рандомизации" и получается согласно следующей формуле:
[0097] В вышеприведенной формуле (15) RND представляет группу 9-мерных последовательностей случайных чисел, и случайные числа в каждой размерности отличаются друг от друга, и все попадают в диапазон [-1, 1]; cnt является счетчиком кадров. В рабочем CNG-состоянии, когда flagCNG=0, для каждого SID-кадра или NO_DATA-кадра 1 прибавляется к счетчику. mod(cnt, 10) представляет cnt mod 10. В другом варианте осуществления, когда вычисляется Rt(i), 10 в mod(cnt, 10) также может быть переменной, например:
где RND представляет случайное число в диапазоне [-1, 1], что не ограничено конкретным образом в этом варианте осуществления.
[0098] В этом варианте осуществления ISF-коэффициент isfd(15) полосы низких частот используется в качестве isf1(9) и синтезируется с рандомизированным ISF-коэффициентом isf1(i), где i=0, 1, ..., 8, чтобы формировать ISF-коэффициент фильтрации 10-го порядка, который затем преобразуется в LPC-коэффициент lpc1(i), где i=0, 1, ..., 9; lpc1(i) умножается на группу 10-мерных весовых коэффициентов W(i)={0,6699, 0,5862, 0,5129, 0,4488, 0,3927, 0,3436, 0,3007, 0,2631, 0,2302, 0,2014}, и получается взвешенный LPC-коэффициент lpc~ 1(i), т.е. оценивается синтезирующий фильтр 1/A~ 1(Z).
[0099] В этом варианте осуществления формируется 320-точечная последовательность exc2(i) белых шумов, где i=0, 1, ..., 319, и exc2(i) используется для того, чтобы возбуждать фильтр 1/A~ 1(Z), чтобы получать неотрегулированный по усилению CN-сигнал s~ 1(i) полосы высоких частот; s~ 1(i) умножается на коэффициенты усиления G3 и G4, G4=0,6, и получается CN-сигнал s'1 полосы высоких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, где .
[0100] Если текущий кадр представляет собой SID, необходимо преобразовывать lpc~ 1(i) в LSP-коэффициент lsp~ 1(i) и использовать lsp~ 1(i), чтобы обновлять долговременное скользящее среднее LSP-коэффициентов сигналов полосы высоких частот CN-кадров, буферизованных на стороне декодирования:
где β=0,7.
[0101] В этом варианте осуществления необязательное получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID. Конкретные ограничения не накладываются в этом варианте осуществления.
[0102] В этом варианте осуществления, после того как получаются параметр полосы низких частот и параметр полосы высоких частот, s'0 и s'1 проходят через синтезирующий QMF-фильтр, и в завершение получается первый CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.
[0103] Дополнительно, в этом варианте осуществления, необязательно, до того, как первый CN-кадр получается согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, может быть дополнительно оптимизирован локально сформированный шумовой параметр полосы высоких частот, так что может получаться более преимущественный комфортный шум. Конкретный этап оптимизации включает в себя: когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножение шумовых сигналов полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и, соответственно, получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот включает в себя: получение четвертого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
[0104] В этом варианте осуществления, когда кадр перед текущим SID представляет собой кодированный речевой кадр, и энергия Esp сигнала полосы высоких частот кодированного речевого кадра ниже энергии Es'1 s'1, необходимо сглаживать энергии сигналов полосы высоких частот текущего SID и последующих нескольких SID (50 кадров в этом варианте осуществления). Конкретный способ сглаживания заключается в следующем: умножение s'1 текущего кадра на усиление Gs, чтобы получать сглаженный s'1s. , где cnt является счетчиком кадров, 1 прибавляется к счетчику для каждого кадра, начиная с первого CN-кадра после кодированного речевого кадра, и представляет собой энергию сглаженного сигнала полосы высоких частот предыдущего кадра и инициализируется в качестве Esp, когда cnt=1. Процесс сглаживания выполняется только максимум для 50 кадров. В этот период, если превышает Es'1, завершается процесс сглаживания. Необязательно, и Es'1 также могут представлять энергии только части кадров, что не ограничено конкретным образом в этом варианте осуществления. В этом варианте осуществления s'0 и s'1 (или s'1s) проходят через синтезирующий QMF-фильтр, и в завершение получается CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.
[0105] 403. Если SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.
[0106] В этом варианте осуществления, если SID включает в себя параметр полосы высоких частот, SID декодируется, чтобы получать параметр полосы высоких частот, и шумовой параметр полосы низких частот формируется локально, и второй CN-кадр получается согласно параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот. Способ для декодирования параметра полосы высоких частот является идентичным способу на этапе 401, и подробности не описываются повторно в этом варианте осуществления. Способ для локального формирования параметра полосы низких частот является идентичным способу для локального формирования широкополосного параметра, и подробности не описываются повторно в этом варианте осуществления.
[0107] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче. Помимо этого, до того, как второй CN-кадр получается согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, может быть дополнительно оптимизирован локально сформированный шумовой параметр полосы высоких частот, так что может получаться более преимущественный комфортный шум. В силу этого, дополнительно оптимизируется производительность декодера.
Вариант 5 осуществления
[0108] Этот вариант осуществления предоставляет способ для обработки аудиоданных. Идентично способу для обработки аудиоданных в варианте 2 осуществления, сторона кодера получает шумовой кадр аудиосигнала и раскладывает шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот. Тем не менее, необязательно, определение того, удовлетворяет или нет сигнал полосы высоких частот шумового кадра предварительно установленному условию кодирования и передачи, включает в себя: определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодирование SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для отправки второго SID и отправку SID; а если нет, определение того, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан. Средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром. В этом варианте осуществления определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию, используется в качестве третьего условия для определении того, следует или нет кодировать и передавать шумовой сигнал полосы высоких частот.
[0109] В этом варианте осуществления, необязательно, то, следует или нет кодировать и передавать шумовой сигнал полосы высоких частот, также может быть определено посредством использования второго условия определения, что не ограничено конкретным образом в этом варианте осуществления.
[0110] В этом варианте осуществления DTX определяет то, следует или нет кодировать и передавать параметр полосы высоких частот, т.е. задание flaghb может определяться посредством использования следующих условий: (1) удовлетворяется или нет третье условие определения; если да, задание flaghb равным 0; в противном случае, задание flaghb равным 1; и (2) удовлетворяется или нет второе условие определения; если нет, задание flaghb равным 0; и если да, задание flaghb равным 1.
[0111] В этом варианте осуществления конкретный способ для реализации третьего условия определения может заключаться в следующем: кодер получает LSP-коэффициент lsp(i) 10-го порядка шумового сигнала s1 полосы высоких частот текущего шумового кадра, где i=0, ..., 9, и необязательно коэффициент также может представлять собой LSF- или ISF-, или ISP-коэффициент, что не ограничено конкретным образом в этом варианте осуществления. LSP- или LSF-, или ISF-, или ISP-коэффициент является только различным способом представления в различной области, но все они представляют коэффициент синтезирующей фильтрации, что не ограничено конкретным образом в этом варианте осуществления; lsp(i) используется для того, чтобы обновлять его скользящее среднее:
где lspa(i) является долговременным скользящим средним lsp(i). Вычисляется спектральное искажение между текущим lspa(i) и lspa(i) в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз: , где Dlsp представляет спектральное искажение, а представляет lspa(i) в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. Если Dlsp меньше определенного порогового значения, задается flaghb=0; в противном случае, задается flaghb=1.
[0112] В этом варианте осуществления способ работы для кодирования параметра полосы низких частот и/или параметра полосы высоких частот посредством кодера при необходимости по существу является идентичным способу работы в варианте 3 осуществления, и подробности не описываются повторно в этом варианте осуществления.
[0113] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии и flagCNG=0, необходимо локально формировать шумовой сигнал полосы высоких частот. Способ для получения средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, является идентичным способу в варианте 4 осуществления, и подробности не описываются повторно в этом варианте осуществления. Тем не менее, в этом варианте осуществления предпочтительно получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID. В частности, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано следующим образом:
[0114] При условии lsp'(i)=lspCN(i), где i=0, ..., 9, lspCN(i) является долговременным скользящим средним LSP-коэффициентов сигналов полосы высоких частот CN-кадров, которые локально буферизуются на стороне декодирования. Обработка рандомизации выполняется для lsp'(i) посредством использования идентичного способа из варианта 4 осуществления, и получается lsp1(i):
[0115] lsp1(i) преобразуется в LPC-коэффициент lpc1(i), и синтезирующий фильтр 1/A~ 1(Z) получается после взвешивания с w(i) посредством использования идентичного способа из варианта 4 осуществления. В этом варианте осуществления формируется 320-точечная последовательность exc2(i) белых шумов, где i=0, 1, ..., 319, и exc2(i) используется для того, чтобы возбуждать фильтр 1/A~ 1(Z), чтобы получать неотрегулированный по усилению CN-сигнал s~ 1(i) полосы высоких частот; s~ 1(i) умножается на коэффициент G3 усиления, и получается сигнал s'1 полосы высоких частот CN-кадра, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц. В этом варианте осуществления, когда текущий кадр представляет собой SID, lsp1(i), полученный посредством использования этого способа, не используется для того, чтобы обновлять долговременное скользящее среднее LSP-коэффициентов сигналов полосы высоких частот CN-кадров, которые буферизуются на стороне декодирования.
[0116] В этом варианте осуществления, когда кодер кодирует большой SID-кадр, когда долговременное скользящее среднее e1a логарифмических энергий сигналов полосы высоких частот квантуется на стороне кодирования, квантование выполняется после того, как e1a ослабляется (т.е. после того, как значение вычитается). Следовательно, в этом случае, при декодировании необязательно умножать s~ 1(i) на G2 или G4 в варианте 4 осуществления. Другие этапы стороны декодирования в этом варианте осуществления являются аналогичными этапам в вышеприведенном варианте осуществления, и подробности не описываются повторно в этом варианте осуществления.
[0117] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 6 осуществления
[0118] Ссылаясь на фиг.5, этот вариант осуществления предоставляет устройство для кодирования аудиоданных, причем устройство включает в себя: модуль 501 получения и передающий модуль 502.
[0119] Модуль 501 получения сконфигурирован с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.
[0120] Передающий модуль 502 сконфигурирован с возможностью кодировать и передавать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать и передавать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.
[0121] В этом варианте осуществления первый SID включает в себя параметр полосы низких частот шумового кадра, а второй SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот шумового кадра.
[0122] Необязательно, ссылаясь на фиг.6, передающий модуль 502 включает в себя:
- первый передающий блок 502a, сконфигурированный с возможностью определять то, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодировать идентификатор шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0123] В этом варианте осуществления первый передающий блок 502a включает в себя:
- первый субблок определения, сконфигурированный с возможностью получать спектр шумового сигнала полосы высоких частот, разделять спектр по меньшей мере на две подполосы частот, и если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определять то, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определять то, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.
[0124] Ссылаясь на фиг.6, необязательно, передающий модуль 502 включает в себя:
- второй передающий блок 502b, сконфигурированный с возможностью формировать отклонение согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определять, достигает или нет отклонение предварительно установленного порогового значения; если да, кодировать SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.
[0125] Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0126] Альтернативно, то что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и
- соответственно, то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.
[0127] Необязательно, в этом варианте осуществления второй передающий блок 502b включает:
- субблок вычисления, сконфигурированный с возможностью отдельно вычислять логарифмическое значение первого отношения и логарифмическое значение второго отношения; и вычислять абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.
[0128] Ссылаясь на фиг.6, необязательно, в этом варианте осуществления передающий модуль 502 включает:
- третий передающий блок 502c, сконфигурированный с возможностью определять то, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодировать SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для отправки второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.
[0129] В этом варианте осуществления, необязательно, средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.
[0130] Необязательно, в этом варианте осуществления, условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.
[0131] Вариант осуществления устройства, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 7 осуществления
[0132] Ссылаясь на фиг.7, этот вариант осуществления предоставляет устройство для декодирования аудиоданных, причем устройство включает: модуль 601 получения, первый модуль 602 декодирования, второй модуль 603 декодирования и третий модуль 604 декодирования.
[0133] Модуль 601 получения сконфигурирован с возможностью определять то, включает принимаемый текущий кадр SID дескриптора вставки молчания в себя параметр полосы низких частот или параметр полосы высоких частот.
[0134] Первый модуль 602 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.
[0135] Второй модуль 603 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.
[0136] Третий модуль 604 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.
[0137] Необязательно, в этом варианте осуществления первый модуль 602 декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, если декодер находится в первом состоянии формирования CNG комфортного шума, переходить во второе CNG-состояние.
[0138] Необязательно, в этом варианте осуществления третий модуль 604 декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, если декодер находится во втором CNG-состоянии, переходить в первое CNG-состояние.
[0139] Необязательно, модуль 601 получения включает в себя:
- первый блок определения, сконфигурированный с возможностью: если число битов SID меньше предварительно установленного первого порогового значения, определять то, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определять то, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определять то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот; или
- второй блок определения, сконфигурированный с возможностью: если SID включает в себя первый идентификатор, определять то, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определять то, что SID включает в себя параметр полосы низких частот; и если SID включает в себя третий идентификатор, определять то, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.
[0140] В этом варианте осуществления первый модуль 602 декодирования включает в себя:
- первый блок получения, сконфигурированный с возможностью отдельно получать средневзвешенную энергию шумового сигнала полосы высоких частот и коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- второй блок получения, сконфигурированный с возможностью получать шумовой сигнал полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0141] Необязательно, первый блок получения включает:
- первый субблок получения, сконфигурированный с возможностью получать энергию сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;
- субблок вычисления, сконфигурированный с возможностью вычислять отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;
- второй субблок получения, сконфигурированный с возможностью получать, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергию шумового сигнала полосы высоких частот в момент, соответствующий SID; и
- третий субблок получения, сконфигурированный с возможностью осуществлять взвешенное усреднение для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0142] Субблок вычисления, в частности, сконфигурирован с возможностью:
- вычислять отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или
- вычислять отношение средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.
[0143] Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.
[0144] Необязательно, первый блок получения включает в себя:
- первый субблок выбора, сконфигурированный с возможностью выбирать сигнал полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID и получать, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или
- второй субблок выбора, сконфигурированный с возможностью выбирать сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получать, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.
[0145] Необязательно, первый блок получения включает в себя:
- субблок распределения, сконфигурированный с возможностью распределять M коэффициентов спектральной частоты ISF иммитанса, или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот;
- первый субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, где M и N являются натуральными числами; и
- четвертый субблок получения, сконфигурированный с возможностью получать, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0146] Необязательно, первый блок получения включает в себя:
- пятый субблок получения, сконфигурированный с возможностью получать M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;
- второй субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и
- шестой субблок получения, сконфигурированный с возможностью получать, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.
[0147] Ссылаясь на фиг.8, необязательно, устройство дополнительно включает в себя:
- модуль 605 оптимизации, сконфигурированный с возможностью: до того, как первый модуль 602 декодирования получает первый CN-кадр, когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножать шумовые сигналы полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот.
[0148] Соответственно, первый модуль 602 декодирования, в частности, сконфигурирован с возможностью получать четвертый CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.
[0149] Вариант осуществления устройства, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
Вариант 8 осуществления
[0150] Ссылаясь на фиг.9, этот вариант осуществления предоставляет систему для обработки аудиоданных, причем система включает в себя вышеприведенное устройство 500 для кодирования аудиоданных и вышеприведенное устройство 600 для декодирования аудиоданных.
[0151] Технические решения, предоставляемые посредством вариантов осуществления настоящего изобретения, обеспечивают следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.
[0152] Устройство и система, предоставляемые посредством вариантов осуществления, в частности, могут применять концепцию, идентичную концепции в качестве вариантов осуществления способа. Конкретный процесс реализации устройства и системы описан подробно в вариантах осуществления способа, и подробности не описываются повторно в данном документе.
[0153] Способ и устройство для обработки аудиоданных в вышеприведенных вариантах осуществления могут применяться к аудиокодеру или к аудиодекодеру. Аудиокодеки могут широко применяться к различным электронным устройствам, таким как мобильный телефон, беспроводное устройство, персональное цифровое устройство (PDA), карманный или портативный компьютер, приемное GPS-устройство или навигационное устройство, камера, аудио/видеопроигрыватель, записывающая видеокамера, записывающее видеоустройство и устройство наблюдения. В общем, такое электронное устройство включает в себя аудиокодер или аудиодекодер. Аудиокодер или декодер может быть непосредственно реализован посредством использования цифровой схемы либо кристалла, например, DSP (процессор цифровых сигналов), либо реализован посредством использования программного кода, чтобы управлять процессором с возможностью выполнять процедуру в программном коде.
[0154] Специалисты в данной области техники могут понимать, что все или часть этапов вариантов осуществления могут быть реализованы посредством аппаратных средств или программы, инструктирующей релевантным аппаратным средствам. Программа может сохраняться на машиночитаемом носителе хранения данных. Носитель хранения данных может включать: постоянное запоминающее устройство, магнитный диск или оптический диск.
[0155] Вышеприведенное описание представляет собой просто примерные варианты осуществления настоящего изобретения и не имеет намерение ограничивать настоящее изобретение. Все модификации, эквивалентные замены и улучшения, выполняемые без отступления от сущности и принципа настоящего изобретения, должны попадать в объем охраны настоящего изобретения.
Claims (45)
1. Способ для обработки аудиоданных, при этом способ содержит этапы, на которых:
- получают шумовой кадр аудиосигнала и раскладывают шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- кодируют шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передают кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодируют шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передают кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, при этом политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи;
при этом кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передача кодированного шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи содержит этапы, на которых:
- формируют значение степени отклонения согласно первому отношению и второму отношению, при этом первое отношение представляет собой отношение энергии шумового сигнала полосы низких частот шумового кадра к энергии шумового сигнала полосы высоких частот шумового кадра и второе отношение представляет собой отношение энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, к энергии шумового сигнала полосы высоких частот в этот момент; и
- определяют, достигает или нет значение степени отклонения предварительно установленного порогового значения; если значение степени отклонения достигает предварительно установленного порогового значения, кодируют SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправляют SID; а если значение степени отклонения не достигает предварительно установленного порогового значения, определяют то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан;
при этом первое отношение представляет собой отношение энергии шумового сигнала полосы низких частот шумового кадра к энергии шумового сигнала полосы высоких частот, содержит то, что:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы низких частот шумового кадра к мгновенной энергии шумового сигнала полосы высоких частот шумового кадра; и
- второе отношение представляет собой отношение энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, к энергии шумового сигнала полосы высоких частот в этот момент, содержит то, что:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы низких частот в этот момент к мгновенной энергии шумового сигнала полосы высоких частот в этот момент; или
- то, что первое отношение представляет собой отношение энергии шумового сигнала полосы низких частот кадра к энергии шумового сигнала полосы высоких частот шумового кадра, содержит то, что:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до упомянутого шумового кадра к средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до упомянутого шумового кадра; и
- то, что второе отношение представляет собой отношение энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, к энергии шумового сигнала полосы высоких частот в этот момент, содержит то, что:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы низких частот шумового кадра в этот момент и шумового кадра до упомянутого шумового кадра в этот момент к средневзвешенной энергии сигналов полосы высоких частот в этот момент и шумового кадра до упомянутого шумового кадра в этот момент.
2. Способ по п.1, в котором первый SID содержит параметр полосы низких частот шумового кадра, а второй SID содержит параметр полосы низких частот или параметр полосы высоких частот шумового кадра.
3. Способ по п.1 или 2, в котором формирование значения степени отклонения согласно первому отношению и второму отношению содержит этапы, на которых:
- отдельно вычисляют логарифмическое значение первого отношения и логарифмическое значение второго отношения; и
- вычисляют абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать значение степени отклонения.
4. Способ по п.3, в котором логарифмическое значение первого отношения рассчитывается следующим образом:
рассчитывают логарифмическое значение средневзвешенной энергии сигналов полосы высоких частот шумового кадра и шумового кадра до упомянутого шумового кадра и логарифмическое значение средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до упомянутого шумового кадра; и
получают логарифмическое значение первого отношения путем расчета разности между логарифмическим значением средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до упомянутого шумового кадра и логарифмическим значением средневзвешенной энергии сигналов полосы высоких частот шумового кадра и шумового кадра до упомянутого шумового кадра;
при этом логарифмическое значение второго отношения рассчитывается следующим образом:
рассчитывают логарифмическое значение средневзвешенной энергии сигналов полосы высоких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент и логарифмическое значение средневзвешенной энергии сигналов полосы низких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент; и
получают логарифмическое значение второго отношения путем расчета разности между логарифмическим значением средневзвешенной энергии сигналов полосы высоких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент и логарифмическим значением средневзвешенной энергии сигналов полосы низких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент.
5. Устройство для кодирования аудиоданных, при этом устройство содержит:
- модуль получения, сконфигурированный с возможностью получать шумовой кадр аудиосигнала и раскладывать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и
- передающий модуль, сконфигурированный с возможностью кодировать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи, и кодировать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, при этом политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи;
при этом передающий модуль содержит:
второй передающий модуль, сконфигурированный с возможностью формировать значение степени отклонения согласно первому отношению и второму отношению, при этом первое отношение представляет собой отношение энергии шумового сигнала полосы низких частот шумового кадра к энергии шумового сигнала полосы высоких частот шумового кадра, и второе отношение представляет собой отношение энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, к энергии шумового сигнала полосы высоких частот в этот момент; и определять, достигает или нет значение степени отклонения предварительно установленного порогового значения; если значение степени отклонения достигает предварительно установленного порогового значения, кодируют SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправляют SID; а если значение степени отклонения не достигает предварительно установленного порогового значения, определяют то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан;
при этом первое отношение представляет собой отношение энергии шумового сигнала полосы низких частот шумового кадра к энергии шумового сигнала полосы высоких частот, содержит:
- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы низких частот шумового кадра к мгновенной энергии шумового сигнала полосы высоких частот шумового кадра; и
- а второе отношение представляет собой отношение энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, к энергии шумового сигнала полосы высоких частот в этот момент, содержит:
- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы низких частот в этот момент к мгновенной энергии шумового сигнала полосы высоких частот в этот момент; или
- первое отношение представляет собой отношение энергии шумового сигнала полосы низких частот кадра к энергии шумового сигнала полосы высоких частот шумового кадра, содержит:
- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до упомянутого шумового кадра к средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до упомянутого шумового кадра; и
- а второе отношение представляет собой отношение энергии шумового сигнала полосы низких частот в момент, когда SID, содержащий шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, к энергии шумового сигнала полосы высоких частот в этот момент, содержит:
- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы низких частот шумового кадра в этот момент и шумового кадра до упомянутого шумового кадра в этот момент к средневзвешенной энергии сигналов полосы высоких частот в этот момент и шумового кадра до упомянутого шумового кадра в этот момент.
6. Устройство по п.5, в котором первый SID содержит параметр полосы низких частот шумового кадра, а второй SID содержит параметр полосы низких частот или параметр полосы высоких частот шумового кадра.
7. Устройство по п.5 или 6, в котором второй передающий модуль содержит субблок вычисления, сконфигурированный с возможностью отдельно вычислять логарифмическое значение первого отношения и логарифмическое значение второго отношения; и вычислять абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получить значение степени отклонения.
8. Устройство по п.7, в котором логарифмическое значение первого отношения рассчитывается следующим образом:
рассчитывают логарифмическое значение средневзвешенной энергии сигналов полосы высоких частот шумового кадра и шумового кадра до упомянутого шумового кадра и логарифмическое значение средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до упомянутого шумового кадра; и
получают логарифмическое значение первого отношения путем расчета разности между логарифмическим значением средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до упомянутого шумового кадра и логарифмическим значением средневзвешенной энергии сигналов полосы высоких частот шумового кадра и шумового кадра до упомянутого шумового кадра;
при этом логарифмическое значение второго отношения рассчитывается следующим образом:
рассчитывают логарифмическое значение средневзвешенной энергии сигналов полосы высоких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент и логарифмическое значение средневзвешенной энергии сигналов полосы низких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент; и
получают логарифмическое значение второго отношения путем расчета разности между логарифмическим значением средневзвешенной энергии сигналов полосы высоких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент и логарифмическим значением средневзвешенной энергии сигналов полосы низких частот шумового кадра в данный момент и шумового кадра до упомянутого шумового кадра в данный момент.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110455836.7A CN103187065B (zh) | 2011-12-30 | 2011-12-30 | 音频数据的处理方法、装置和系统 |
CN201110455836.7 | 2011-12-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014131387/08A Division RU2579926C1 (ru) | 2011-12-30 | 2012-12-28 | Способ, устройство и система для обработки аудиоданных |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017113357A Division RU2641464C1 (ru) | 2011-12-30 | 2017-04-18 | Способ, устройство и система для обработки аудиоданных |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2617926C1 true RU2617926C1 (ru) | 2017-04-28 |
Family
ID=48678198
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016100179A RU2617926C1 (ru) | 2011-12-30 | 2012-12-28 | Способ, устройство и система для обработки аудиоданных |
RU2014131387/08A RU2579926C1 (ru) | 2011-12-30 | 2012-12-28 | Способ, устройство и система для обработки аудиоданных |
RU2017113357A RU2641464C1 (ru) | 2011-12-30 | 2017-04-18 | Способ, устройство и система для обработки аудиоданных |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014131387/08A RU2579926C1 (ru) | 2011-12-30 | 2012-12-28 | Способ, устройство и система для обработки аудиоданных |
RU2017113357A RU2641464C1 (ru) | 2011-12-30 | 2017-04-18 | Способ, устройство и система для обработки аудиоданных |
Country Status (18)
Country | Link |
---|---|
US (6) | US9406304B2 (ru) |
EP (1) | EP2793227B1 (ru) |
JP (2) | JP6072068B2 (ru) |
KR (2) | KR101770237B1 (ru) |
CN (1) | CN103187065B (ru) |
AU (1) | AU2012361423B2 (ru) |
BR (1) | BR112014016153B1 (ru) |
CA (3) | CA3059322C (ru) |
ES (1) | ES2610783T3 (ru) |
HK (1) | HK1199543A1 (ru) |
IN (1) | IN2014KN01436A (ru) |
MX (1) | MX338445B (ru) |
MY (1) | MY173976A (ru) |
PT (1) | PT2793227T (ru) |
RU (3) | RU2617926C1 (ru) |
SG (2) | SG10201609338SA (ru) |
WO (1) | WO2013097764A1 (ru) |
ZA (2) | ZA201404996B (ru) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
CN104217723B (zh) * | 2013-05-30 | 2016-11-09 | 华为技术有限公司 | 信号编码方法及设备 |
US9136763B2 (en) * | 2013-06-18 | 2015-09-15 | Intersil Americas LLC | Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode |
KR102121642B1 (ko) * | 2014-03-31 | 2020-06-10 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램 |
US10163453B2 (en) | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
GB2532041B (en) | 2014-11-06 | 2019-05-29 | Imagination Tech Ltd | Comfort noise generation |
CN105681512B (zh) * | 2016-02-25 | 2019-02-01 | Oppo广东移动通信有限公司 | 一种降低语音通话功耗的方法及装置 |
CN105721656B (zh) * | 2016-03-17 | 2018-10-12 | 北京小米移动软件有限公司 | 背景噪声生成方法及装置 |
ES2745018T3 (es) | 2016-12-12 | 2020-02-27 | Kyynel Oy | Procedimiento versátil de selección de canal para red inalámbrica |
US10504538B2 (en) * | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
US10540983B2 (en) * | 2017-06-01 | 2020-01-21 | Sorenson Ip Holdings, Llc | Detecting and reducing feedback |
GB2595891A (en) * | 2020-06-10 | 2021-12-15 | Nokia Technologies Oy | Adapting multi-source inputs for constant rate encoding |
CN113571072B (zh) * | 2021-09-26 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 一种语音编码方法、装置、设备、存储介质及产品 |
CN117711434B (zh) * | 2023-12-20 | 2024-10-22 | 书行科技(北京)有限公司 | 音频处理方法及装置、电子设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2251750C2 (ru) * | 1998-11-23 | 2005-05-10 | Телефонактиеболагет Лм Эрикссон (Пабл) | Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале |
CN101087319A (zh) * | 2006-06-05 | 2007-12-12 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
US20080195383A1 (en) * | 2007-02-14 | 2008-08-14 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
CN101246688A (zh) * | 2007-02-14 | 2008-08-20 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
CN101320563A (zh) * | 2007-06-05 | 2008-12-10 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
US20110228946A1 (en) * | 2010-03-22 | 2011-09-22 | Dsp Group Ltd. | Comfort noise generation method and system |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7103065B1 (en) * | 1998-10-30 | 2006-09-05 | Broadcom Corporation | Data packet fragmentation in a cable modem system |
EP1715712B1 (en) * | 1998-11-24 | 2009-03-25 | Telefonaktiebolaget LM Ericsson (publ) | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
US6549587B1 (en) * | 1999-09-20 | 2003-04-15 | Broadcom Corporation | Voice and data exchange over a packet based network with timing recovery |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
WO2001033814A1 (en) * | 1999-11-03 | 2001-05-10 | Tellabs Operations, Inc. | Integrated voice processing system for packet networks |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US7920697B2 (en) | 1999-12-09 | 2011-04-05 | Broadcom Corp. | Interaction between echo canceller and packet voice processing |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6691085B1 (en) | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
US6691805B2 (en) | 2001-08-27 | 2004-02-17 | Halliburton Energy Services, Inc. | Electrically conductive oil-based mud |
US7319703B2 (en) * | 2001-09-04 | 2008-01-15 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
FR2859566B1 (fr) * | 2003-09-05 | 2010-11-05 | Eads Telecom | Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre |
JP4572123B2 (ja) * | 2005-02-28 | 2010-10-27 | 日本電気株式会社 | 音源供給装置及び音源供給方法 |
US7809559B2 (en) * | 2006-07-24 | 2010-10-05 | Motorola, Inc. | Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution |
US8725499B2 (en) | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
JP2008139447A (ja) * | 2006-11-30 | 2008-06-19 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号装置 |
BRPI0818927A2 (pt) * | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
DE102008009719A1 (de) | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
DE102008009718A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN101483495B (zh) * | 2008-03-20 | 2012-02-15 | 华为技术有限公司 | 一种背景噪声生成方法以及噪声处理装置 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
WO2011103924A1 (en) * | 2010-02-25 | 2011-09-01 | Telefonaktiebolaget L M Ericsson (Publ) | Switching off dtx for music |
JP2012215198A (ja) * | 2011-03-31 | 2012-11-08 | Showa Corp | 回転構造体 |
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
KR101690899B1 (ko) * | 2012-12-21 | 2016-12-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성 |
-
2011
- 2011-12-30 CN CN201110455836.7A patent/CN103187065B/zh active Active
-
2012
- 2012-12-28 SG SG10201609338SA patent/SG10201609338SA/en unknown
- 2012-12-28 PT PT128613775T patent/PT2793227T/pt unknown
- 2012-12-28 EP EP12861377.5A patent/EP2793227B1/en active Active
- 2012-12-28 CA CA3059322A patent/CA3059322C/en active Active
- 2012-12-28 AU AU2012361423A patent/AU2012361423B2/en active Active
- 2012-12-28 RU RU2016100179A patent/RU2617926C1/ru active
- 2012-12-28 MY MYPI2014001949A patent/MY173976A/en unknown
- 2012-12-28 KR KR1020167036611A patent/KR101770237B1/ko active IP Right Grant
- 2012-12-28 WO PCT/CN2012/087812 patent/WO2013097764A1/zh active Application Filing
- 2012-12-28 RU RU2014131387/08A patent/RU2579926C1/ru active
- 2012-12-28 BR BR112014016153-4A patent/BR112014016153B1/pt active IP Right Grant
- 2012-12-28 ES ES12861377.5T patent/ES2610783T3/es active Active
- 2012-12-28 KR KR1020147020836A patent/KR101693280B1/ko active Application Filing
- 2012-12-28 CA CA3181066A patent/CA3181066A1/en active Pending
- 2012-12-28 CA CA2861916A patent/CA2861916C/en active Active
- 2012-12-28 MX MX2014007968A patent/MX338445B/es active IP Right Grant
- 2012-12-28 SG SG11201403686SA patent/SG11201403686SA/en unknown
- 2012-12-28 JP JP2014549344A patent/JP6072068B2/ja active Active
-
2014
- 2014-06-30 US US14/318,899 patent/US9406304B2/en active Active
- 2014-07-08 IN IN1436KON2014 patent/IN2014KN01436A/en unknown
- 2014-07-08 ZA ZA2014/04996A patent/ZA201404996B/en unknown
- 2014-12-31 HK HK14113112.0A patent/HK1199543A1/xx unknown
-
2016
- 2016-01-12 ZA ZA2016/00247A patent/ZA201600247B/en unknown
- 2016-06-21 US US15/188,518 patent/US9892738B2/en active Active
- 2016-12-27 JP JP2016252612A patent/JP6462653B2/ja active Active
-
2017
- 2017-04-18 RU RU2017113357A patent/RU2641464C1/ru active
-
2018
- 2018-01-11 US US15/867,977 patent/US10529345B2/en active Active
-
2019
- 2019-11-27 US US16/697,822 patent/US11183197B2/en active Active
-
2021
- 2021-10-21 US US17/507,200 patent/US11727946B2/en active Active
-
2023
- 2023-06-29 US US18/344,445 patent/US12100406B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2251750C2 (ru) * | 1998-11-23 | 2005-05-10 | Телефонактиеболагет Лм Эрикссон (Пабл) | Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале |
CN101087319A (zh) * | 2006-06-05 | 2007-12-12 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
US20080195383A1 (en) * | 2007-02-14 | 2008-08-14 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
CN101246688A (zh) * | 2007-02-14 | 2008-08-20 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
CN101320563A (zh) * | 2007-06-05 | 2008-12-10 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
US20110228946A1 (en) * | 2010-03-22 | 2011-09-22 | Dsp Group Ltd. | Comfort noise generation method and system |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2641464C1 (ru) | Способ, устройство и система для обработки аудиоданных | |
US10559313B2 (en) | Speech/audio signal processing method and apparatus | |
RU2449386C2 (ru) | Способ и устройство для аудиодекодирования | |
CN108831501B (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
JP5203929B2 (ja) | スペクトルエンベロープ表示のベクトル量子化方法及び装置 | |
JP6779966B2 (ja) | 先進量子化器 | |
RU2740359C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
KR101698371B1 (ko) | 디지털 오디오 신호들의 개선된 코딩/디코딩 | |
WO2023197809A1 (zh) | 一种高频音频信号的编解码方法和相关装置 | |
US7813922B2 (en) | Audio quantization |