RU2618919C2 - Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа - Google Patents

Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа Download PDF

Info

Publication number
RU2618919C2
RU2618919C2 RU2015136788A RU2015136788A RU2618919C2 RU 2618919 C2 RU2618919 C2 RU 2618919C2 RU 2015136788 A RU2015136788 A RU 2015136788A RU 2015136788 A RU2015136788 A RU 2015136788A RU 2618919 C2 RU2618919 C2 RU 2618919C2
Authority
RU
Russia
Prior art keywords
spectrum
audio signal
code
slope
codebook
Prior art date
Application number
RU2015136788A
Other languages
English (en)
Other versions
RU2015136788A (ru
Inventor
Гийом ФУКС
Том БЕКСТРЕМ
Ральф ГАЙГЕР
Вольфганг ЕГЕРС
Эммануэль РАВЕЛЛИ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015136788A publication Critical patent/RU2015136788A/ru
Application granted granted Critical
Publication of RU2618919C2 publication Critical patent/RU2618919C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

Изобретение относится к области аудиокодирования, и более конкретно к области синтезирования аудиосигнала. Технический результат – улучшение синтезирования аудиосигнала как на низких, так и на более высоких скоростях передачи путем использования наклона спектра аудиосигнала при синтезировании сигнала для улучшения достижимой эффективности кодирования и, следовательно, повышения качества воспроизводимого сигнала. В данном изобретении описываются способ и устройство для синтезирования аудиосигнала, а также аудиодекодер. Технический результат достигается за счет того, что наклон спектра применяется к коду кодировочной книги, используемому для синтезирования текущего кадра аудиосигнала. Наклон спектра основан на наклоне спектра текущего кадра аудиосигнала. 5 н. и 22 з.п. ф-лы, 5 ил.

Description

Настоящее изобретение относится к области аудиокодирования, и более конкретно к области синтезирования аудиосигнала. Варианты осуществления относятся к кодированию речи, в частности к способу кодирования речи, называемому линейным предсказанием с мультикодовым управлением (CELP). Варианты осуществления предлагают подход для адаптивной компенсации наклона в формировании кодов CELP в инновационной или фиксированной кодировочной книге.
Схема кодирования CELP широко используется в речевой коммуникации и является эффективным способом кодирования речи. CELP синтезирует аудиосигнал путем передачи линейному прогнозирующему фильтру (например, синтезирующему фильтру линейного прогнозирующего кодирования (LPC) 1/A(z)) суммы двух возбуждений. Одно возбуждение поступает из декодированного прошлого, которое называется адаптивной кодировочной книгой, а другая составляющая поступает из фиксированной или инновационной кодировочной книги, которая заполняется фиксированными кодами. Одна из проблем схемы кодирования CELP заключается в том, что при низких скоростях передачи инновационная кодировочная книга недостаточно заполняется для того, чтобы эффективно моделировать микроструктуру речи, так что качество восприятия ухудшается и синтезируемый выходной сигнал звучит с шумами.
Для смягчения артефактов кодирования уже были предложены различные решения, которые описываются в ссылке [1] и в ссылке [2]. В этих ссылках коды инновационной кодировочной книги адаптивно и спектрально формируются путем улучшения областей спектра, соответствующих формантам текущего кадра аудиосигнала. Положения и формы формант могут быть выведены непосредственно из коэффициентов LPC, которые являются коэффициентами, доступными как в кодер, так и в декодере. Улучшение формант кодов c(n) инновационной кодировочной книги выполняется с помощью простой операции фильтрования:
QUOTE
Figure 00000001
Figure 00000001
.
В этом процессе фильтрования fe(n) является импульсной характеристикой фильтра, имеющей следующую передаточную функцию:
Figure 00000002
,
где w1 и w2 являются двумя весовыми константами, подчеркивающими более или менее формантную структуру передаточной функции Fe(z). Получаемые сформированные коды инновационной кодировочной книги наследуют одну характеристику речевого сигнала, и синтезируемый сигнал звучит с меньшими шумами.
В схеме кодирования CELP также к кодам инновационной кодировочной книги обычно добавляется наклон спектра, что делается путем фильтрования кодов из инновационной кодировочной книги следующим образом:
QUOTE
Figure 00000003
Figure 00000003
.
Коэффициент β относится к вокализованности предыдущего аудиокадра, и вокализованность может быть оценено из энергетической составляющей из адаптивной кодировочной книги. Например, если предыдущий кадр вокализован, то ожидается, что текущий кадр также будет вокализован, и что коды будут иметь больше энергии на низких частотах, то есть спектр имеет отрицательный наклон.
Задачей настоящего изобретения является предложить улучшенный подход для синтезирования аудиосигнала.
Эта задача решается устройством в соответствии с п. 1 формулы изобретения, а также способом в соответствии с п. 19 формулы изобретения.
Настоящее изобретение предлагает устройство для синтезирования аудиосигнала, которое включает в себя обрабатывающий блок, выполненный с возможностью применения наклона спектра к коду кодировочной книги, используемому для синтезирования текущего кадра аудиосигнала, причем наклон спектра основан на наклоне спектра текущего кадра аудиосигнала.
Настоящее изобретение предлагает способ для синтезирования аудиосигнала, включающий в себя применение наклона спектра к коду кодировочной книги, используемому для синтезирования текущего кадра аудиосигнала, причем наклон спектра определяется на основе наклона спектра текущего кадра аудиосигнала.
Авторы настоящей патентной заявки выяснили, что синтезирование аудиосигнала может быть дополнительно улучшено как на низких, так и на более высоких скоростях передачи путем использования природы наклона спектра аудиосигнала при синтезировании сигнала для улучшения достижимой эффективности кодирования. В соответствии с вариантами осуществления настоящее изобретение предлагает кодирование речи, например с использованием метода кодирования речи CELP, которое обеспечивает улучшение эффективности кодирования метода CELP, улучшая тем самым воспринимаемое качество декодируемого или синтезируемого сигнала. Подход в соответствии с настоящим изобретением основан на открытии авторов, что это усовершенствование может быть достигнуто путем адаптирования наклона спектра кодов кодировочной книги, например кодов инновационной кодировочной книги CELP, как функции наклона спектра обрабатываемого в настоящий момент фактического входного сигнала. Подход в соответствии с настоящим изобретением является предпочтительным, так как в дополнение к улучшенной эффективности кодирования, при низких скоростях передачи, где инновационная кодировочная книга заполняется недостаточно для того, чтобы эффективно моделировать микроструктуру речи, он также обеспечивает дополнительное улучшение формант. При более высоких скоростях передачи, при которых инновационная кодировочная книга заполняется в достаточной степени, применение подхода в соответствии с настоящим изобретением будет улучшать эффективность кодирования. Более конкретно, при более высоких скоростях передачи улучшение формант может не понадобиться, поскольку инновационная кодировочная книга является достаточно большой для того, чтобы смоделировать должным образом микроструктуру речи, и дальнейшее улучшение формант сделает звучание синтезированного сигнала слишком синтетическим. Однако оптимальные коды не являются спектрально плоскими, и добавление наклона спектра будет улучшать эффективность кодирования. В соответствии с вариантами осуществления оптимальный наклон для применения к кодам инновационной кодировочной книги оценивается более точно, более конкретно он коррелируется с наклоном текущего кадра входного сигнала.
Таким образом, технический результат настоящего изобретения заключается в улучшении синтезирования аудиосигнала как на низких, так и на более высоких скоростях передачи путем использования наклона спектра аудиосигнала при синтезировании сигнала для улучшения достижимой эффективности кодирования, и тем самым воспринимаемого качества сигнала.
В соответствии с вариантами осуществления наклон спектра текущего кадра аудиосигнала определяется на основе огибающей спектра для текущего кадра аудиосигнала, в котором огибающая спектра может определяться коэффициентами LPC. Этот вариант осуществления является предпочтительным, поскольку он обеспечивает определение наклона спектра текущего кадра на основе информации, легко доступной как для кодера, так и для декодера, а именно коэффициентов LPC.
В соответствии с дополнительными вариантами осуществления наклон спектра текущего кадра аудиосигнала, основываясь на коэффициентах LPC, может быть определен на основе усеченной бесконечной импульсной характеристики синтезирующего фильтра LPC. В соответствии с вариантами осуществления это усечение может определяться размером инновационной кодировочной книги, то есть количеством кодов в инновационной кодировочной книге. Этот подход является предпочтительным, поскольку он позволяет напрямую связать определение наклона спектра с фактическим размером инновационной кодировочной книги.
В соответствии с дополнительными вариантами осуществления бесконечная импульсная характеристика может быть характеристикой синтезирующего фильтра LPC, имеющего невзвешенную передаточную функцию или взвешенную передаточную функцию. Использование невзвешенной передаточной функции позволяет упростить определение наклона спектра, в то время как использование взвешенной передаточной функции является предпочтительным, поскольку оно позволяет приблизить наклон спектра к оптимальному наклону.
В соответствии с вариантами осуществления определенный наклон спектра применяется к соответствующему коду путем фильтрования кода из кодировочной книги на основе передаточной функции, которая включает в себя наклон спектра. Этот вариант осуществления является предпочтительным, поскольку улучшение может быть достигнуто с помощью простого процесса фильтрации.
В соответствии с еще одним вариантом осуществления наклон спектра текущего кадра может быть скомбинирован с коэффициентом, относящимся к вокализованности предыдущего кадра аудиосигнала, например путем фильтрации кода из кодировочной книги на основе передаточной функции, включающей в себя наклон спектра и этот коэффициент. Этот подход является предпочтительным, поскольку он обеспечивает возможность получения еще более лучшей оценки оптимального наклона.
Настоящее изобретение предлагает аудиодекодер, включающий в себя устройство для синтезирования аудиосигнала в соответствии с настоящим изобретением.
Настоящее изобретение предлагает аудиодекодер для декодирования аудиосигнала, в котором аудиодекодер выполнен с возможностью применения наклона спектра к коду кодировочной книги, используемому для синтезирования текущего кадра аудиосигнала, причем наклон спектра основан на наклоне спектра текущего кадра аудиосигнала.
Настоящее изобретение предлагает кодер для кодирования аудиосигнала, в котором аудиокодер выполнен с возможностью определения из наклона спектра текущего кадра аудиосигнала наклона спектра для кода кодировочной книги, представляющего текущий кадр аудиосигнала.
Настоящее изобретение предлагает систему, включающую в себя аудиодекодер в соответствии с настоящим изобретением и аудиокодер в соответствии с настоящим изобретением.
Настоящее изобретение предлагает энергонезависимый компьютерный носитель, хранящий инструкции, которые при их выполнении на компьютере выполняют способ в соответствии с настоящим изобретением для синтезирования аудиосигнала.
Варианты осуществления настоящего изобретения описаны более подробно со ссылками на сопроводительные чертежи, на которых показано:
Фиг. 1 - схематическое представление устройства в соответствии с настоящим изобретением для синтезирования аудиосигнала в соответствии с первым вариантом осуществления;
Фиг. 2 - упрощенная блок-схема синтезатора сигнала в соответствии со вторым вариантом осуществления настоящего изобретения, который работает на основе схемы CELP;
Фиг. 3 - упрощенная блок-схема синтезатора сигнала в соответствии с дополнительным вариантом осуществления настоящего изобретения, опять же применяющего схему кодирования CELP, включающую вокализованность предыдущего кадра;
Фиг. 4 - один вариант осуществления декодера, например речевого декодера, работающего в соответствии с настоящим изобретением; и
Фиг. 5 - один вариант осуществления кодера, например речевого кодера, работающего в соответствии с настоящим изобретением.
Далее описываются варианты осуществления подхода в соответствии с настоящим изобретением. Следует отметить, что в последующем описании одинаковые элементы/этапы обозначаются одинаковыми ссылочными обозначениями.
Фиг. 1 показывает схематическое представление устройства в соответствии с настоящим изобретением для синтезирования аудиосигнала в соответствии с первым вариантом осуществления. Устройство 100 получает на входе 102 закодированный сигнал, например закодированный аудиосигнал, такой как речевой сигнал. Для того чтобы декодировать аудиосигнал, устройство 100 включает в себя кодировочную книгу 104, включающую в себя множество кодов. Для того чтобы синтезировать сигнал при обработке текущего кадра на основе закодированного сигнала, полученного на входе 102, подходящий код или кодовая комбинация выбирается из кодировочной книги 104 и подается на синтезатор или синтезирующий фильтр 106. В соответствии с настоящим изобретением устройство включает в себя обрабатывающий блок 108, который на основе наклона спектра текущего кадра аудиосигнала, то есть кадра аудиосигнала, в настоящий момент обрабатываемого устройством 100, определяет наклон спектра, который будет применен к коду с(n), прочитанному из кодировочной книги 104, как это схематично представлено ссылочной цифрой 110. Модифицированный код с(n)*γ применяется к синтезирующему фильтру 106, который генерирует на основе модифицированного кода синтезированный сигнал, который подается на выход 112 устройства 100. Обрабатывающий блок 108 может определять наклон спектра на основе огибающей спектра для текущего кадра, например, коэффициентов фильтра для синтезирующего фильтра 106, которые являются доступными в устройстве 100.
В соответствии с дополнительными вариантами осуществления будет описана адаптивная компенсация наклона для формирования кодов инновационной кодировочной книги CELP. Фиг. 2 показывает упрощенную блок-схему синтезатора 200 сигнала в соответствии со вторым вариантом осуществления настоящего изобретения, который работает на основе схемы CELP. В соответствии со схемой CELP, синтезатор 200 включает в себя фиксированную или инновационную кодировочную книгу 202 и адаптивную кодировочную книгу 204. В зависимости от кодируемого сигнала для текущего кадра, который в настоящий момент обрабатывается синтезатором 200, код выводится из соответствующих кодировочных книг 202 и 204. Синтезатор 200 включает в себя сумматор или объединитель 206 для комбинирования кодов, полученных из соответствующих кодировочных книг 202 и 204. Выход сумматора 206 соединяется с синтезирующим фильтром 208 LPC для того, чтобы синтезировать фактический аудиосигнал и вывести его на выходе 210. В соответствии с вариантами осуществления синтезатор 200 может включать в себя первый усилитель 212 для умножения составляющей фиксированной кодировочной книги 202 на желаемый кодовый коэффициент усиления. Кроме того, второй усилитель 214 может быть предусмотрен для увеличения составляющей адаптивной кодировочной книги 204 в соответствии с коэффициентом усиления высоты тона, поскольку составляющая адаптивной кодировочной книги моделирует высоту речи. В соответствии с другим вариантом осуществления также может быть предусмотрено хранилище 216 для коэффициентов LPC, такое как память и т.п., для хранения коэффициентов LPC, которые доступны в декодере, включая синтезатор 200. Коэффициенты LPC передаются к синтезирующему фильтру 208 для обеспечения желаемой синтезирующей фильтрации LPC.
Синтезатор 200 включает в себя фильтр 218, который располагается между фиксированной кодировочной книгой 202 и первым усилителем 212. Фильтр 218 получает из памяти 216 коэффициенты LPC для текущего кадра. Посредством структуры в соответствии с настоящим изобретением наклон аудиокадра, который в настоящий момент обрабатывается, восстанавливается из уже переданных коэффициентов LPC, которые хранятся в памяти 216. В соответствии с вариантом осуществления, проиллюстрированным на Фиг. 2, предполагается, что fs(n) является импульсной характеристикой синтезирующего фильтра 208 LPC, имеющего передаточную функцию
Figure 00000004
и наклон определяется фильтром 218 следующим образом:
Figure 00000005
где N является размером усечения бесконечной импульсной характеристики fs(n). В соответствии с одним вариантом осуществления значение N равно размеру инновационной кодировочной книги, то есть N равно количеству кодов или кодовых комбинаций, хранящихся в инновационной кодировочной книге. Наклон спектра в соответствии с вариантом осуществления, проиллюстрированным на Фиг. 2, применяется к коду с(n), получаемому из фиксированной кодировочной книги 202 с помощью операции фильтрации, обеспечиваемой в фильтре 218. Операция фильтрации определяется следующим образом:
Figure 00000006
где ft1(n) представляет собой импульсную характеристику следующей передаточной функции:
Figure 00000007
Вариант осуществления, проиллюстрированный на Фиг. 2, является предпочтительным, поскольку он позволяет улучшить качество восприятия декодированного сигнала путем улучшения эффективности кодирования. Улучшение эффективности кодирования достигается путем фильтрации кодовой комбинации или кода, получаемого из фиксированной кодировочной книги 202, передаточной функцией, включающей в себя наклон спектра, который определяется на основе импульсной характеристики передаточной функции синтезирующего фильтра 208 LPC.
В соответствии с третьим вариантом осуществления для дальнейшего улучшения наклона спектра, чтобы он был ближе к оптимальному наклону, то есть ближе к фактическому наклону текущего кадра входного сигнала, синтезирующий фильтр 208 LPC имеет следующую передаточную функцию:
Figure 00000008
где w1=0,8 и w2=0,9. В этом случае наклон спектра определяется следующим образом:
Figure 00000009
Весовые константы w1 и w2 используются для того, чтобы управлять динамикой огибающей спектра. Например, если w1=0 и w2=1, то Fe(z) достаточно близко следует за истинной огибающей сигнала. Результирующий наклон спектра γ будет показывать высокую динамику и может колебаться слишком сильно. Это может быть решением для очень низких скоростей передачи, при которых в кодировочной книге отсутствует структура наклона. Однако было выявлено, что для восприятия лучше вывести наклон спектра γ из гладкой версии огибающей спектра. Было найдено, что хорошее сглаживание достигается с вышеупомянутыми величинами w1=0,8 и w2=0,9, которые дают хороший компромисс для большого спектра скоростей передачи. В соответствии с вариантами осуществления w1 и w2 являются зависимыми от скорости передачи. При очень высоких скоростях, если кодировочная книга является достаточно большой и в состоянии смоделировать любые спектральные наклоны γ, можно выключить влияние наклона спектра γ путем задания w1=w2=1.
По сравнению со вторым вариантом осуществления, который приводит к наклону, имеющему более крутое падение, чем оптимальный наклон, третий вариант осуществления, использующий «взвешенную» передаточную функцию, обеспечивает наклон, который является более близким к фактическому наклону текущего кадра.
Фиг. 3 показывает дополнительную упрощенную блок-схему синтезатора 200' сигнала в соответствии с четвертым вариантом осуществления настоящего изобретения, также применяющим схему кодирования CELP. По сравнению с вариантами осуществления, описанными со ссылками на Фиг. 2, вариант осуществления, изображенный на Фиг. 3, дополнительно применяет вышеупомянутый фактор, относящийся к вокализованности предыдущего кадра. Как показано на Фиг. 3, структура синтезатора 200' является по существу той же самой, что и структура синтезатора 200, изображенного на Фиг. 2, за исключением того, что дополнительно предусмотрен блок оценки 220 вокализованности, который получает выходной сигнал усилителя 214 и комбинированные составляющие от инновационной и адаптивной кодировочных книг, выводимые сумматором 206. Блок оценки вокализованности выводит сигнал на фильтр 280, так что код или кодовая комбинация, полученная из инновационной кодировочной книги 202, модифицируется на основе определенного наклона (см. Фиг. 2 и приведенное выше описание), комбинированного с фактором вокализованности. Более конкретно, в соответствии с вариантом осуществления, проиллюстрированным на Фиг. 3, определенный наклон спектра комбинируется с коэффициентом β, который относится к вокализованности предыдущего кадра. Подход, описанный со ссылкой на Фиг. 3, является предпочтительным, поскольку он позволяет получить даже лучшую оценку наклона, который будет применен к кодовой комбинации, по сравнению с вариантами осуществления, описанными со ссылками на Фиг. 1 и 2. Модификация кода или формирование кода снова могут быть рассмотрены как операция фильтрации, использующая следующую передаточную функцию:
Figure 00000010
где а и b являются константами. В предпочтительном варианте осуществления а=0,5 и b=0,25. Коэффициент β может быть выведен из вокализованности предыдущего кадра следующим образом:
вокализованность = (энергия(составляющая адаптивной кодировочной книги) - энергия(составляющая фиксированной кодировочной книги))/энергия(сумма составляющих),
и фактический коэффициент β может быть определен следующим образом:
β=константа⋅(1+вокализованность).
Константы а и b применяются для управления смесью наклона голоса β и наклона спектра γ. Как уже было упомянуто выше относительно весовых констант w1 и w2, для низких и средних скоростей передачи, может быть уместным формировать кодировочную книгу путем усиления низких частот или высоких частот на основе наклона спектра γ. Также было установлено, что чем больше вокализован сигнал, тем лучше усиливать высокие частоты. Константы а и b могут использоваться для того, чтобы нормализовать коэффициенты наклона β и γ и взвесить их силу для желаемого объединения этих двух эффектов. В соответствии с вариантами осуществления константы а и b могут быть найдены опытным путем с помощью оценивания воспринимаемого качества. Это обеспечивает примерно одинаковую силу обоим коэффициентам: γ находится в диапазоне между -1 и 1, так что b⋅γ находится в диапазоне между -0,25 и 0,25, и β находится в диапазоне между 0 и 0,5, так что α⋅β находится в диапазоне между 0 и 0,25. Как и весовые константы w1 и w2, константы а и b также могут быть сделаны зависимыми от скорости передачи.
В соответствии с четвертым вариантом осуществления аудиосинтез, показанный на Фиг. 3, является таким, что составляющая адаптивной кодировочной книги умножается на коэффициент усиления, называемый коэффициентом усиления высоты тона, поскольку эта составляющая моделирует высоту тона речи. Инновационный код сначала фильтруется с помощью Ft2(z) для того, чтобы добавить наклон спектра к коду, причем наклон, как описано выше, коррелирует с наклоном текущего кадра синтезируемого сигнала. Выход фильтра 218 умножается на кодовый коэффициент усиления, и эти две составляющие, умноженная составляющая адаптивной кодировочной книги и умноженная модифицированная составляющая инновационной кодировочной книги суммируются сумматором 206 перед фильтрацией синтезирующим фильтром для генерирования синтезированного выходного сигнала на выходе 210.
Фиг. 4 показывает один вариант осуществления декодера, например речевого декодера, работающего в соответствии с настоящим изобретением. Декодер 300 включает в себя синтезатор 100, 200, 200' в соответствии с одним из вышеописанных вариантов осуществления. Декодер имеет вход 302, получающий закодированный сигнал, который обрабатывается декодером и синтезатором для того, чтобы сгенерировать на выходе 304 декодера 300 декодированный сигнал.
Фиг. 5 показывает один вариант осуществления кодера, например речевого кодера, работающего в соответствии с настоящим изобретением. Кодер 400 включает в себя обрабатывающий блок 402 для кодирования аудиосигнала. Далее обрабатывающий блок определяет из наклона спектра текущего кадра аудиосигнала (например, из коэффициентов LPC, доступных в кодере) информацию, представляющую наклон спектра для кода кодировочной книги в декодере, представляющего текущий кадр аудиосигнала. Эта информация может быть передана вместе с закодированным аудиосигналом декодеру, где она может быть применена при синтезировании аудиосигнала. Наклон спектра может быть определен в кодере способом, описанным выше со ссылками на Фиг. 1-3, и он может быть применен в декодере, как описано выше со ссылками на Фиг. 1-3. Таким образом, варианты осуществления настоящего изобретения предлагают вышеупомянутый кодераудиокодер, показанный на Фиг. 5, вместе с аудиодекодером для декодирования аудиосигнала, причем аудиодекодер не обязательно должен определять наклон спектра, вместо этого он выполнен с возможностью применять наклон спектра, полученный от кодера, к коду кодировочной книги, используемому для синтезирования текущего кадра аудиосигнала. Например, декодер может иметь синтезатор, такой как показанный на Фиг. 1-3, за исключением того, что обрабатывающий блок 108 или фильтр 218 получают наклон, вычисленный и переданный кодером. Полученный наклон может быть сохранен, например, в памяти 216 или в другом хранилище.
Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапы способа или особенности этапы способа. Аналогично, аспекты, описанные в контексте этапы способа также, представляют описание соответствующего блока или узла или особенности соответствующего устройства. Некоторые или все этапы способа могут быть выполнены с помощью (или с использованием) аппаратного устройства, такого как, например, микропроцессор, программируемый компьютер или электронная схема. В некоторых вариантах осуществления один или более из наиболее важных этапов способа могут быть выполнены таким устройством.
В зависимости от определенных требований реализации варианты осуществления настоящего изобретения могут быть осуществлены в технических средствах или в программном обеспечении. Реализация может быть выполнена с использованием энергонезависимого носителя, такого как носитель цифровых данных, например гибкий диск, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-память, имеющего записанные на нем электронносчитываемые управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой вычислительной системой таким образом, чтобы выполнялся соответствующий способ. Следовательно, носитель цифровых данных может быть машиночитаемым.
Некоторые варианты осуществления в соответствии с настоящим изобретением включают в себя носитель информации, имеющий записанные на нем электронносчитываемые управляющие сигналы, которые способны взаимодействовать с программируемой вычислительной системой таким образом, чтобы выполнялся один из описанных в настоящем документе способов.
В целом варианты осуществления настоящего изобретения могут быть осуществлены как компьютерный программный продукт с программным кодом программы, использующимся для выполнения одного из способов, когда этот компьютерный программный продукт выполняется на компьютере. Программный код может быть, например, сохранен на машиночитаемом носителе.
Другие варианты осуществления включают в себя компьютерную программу для выполнения одного из способов, описанных в настоящем документе, сохраненную на машиночитаемом носителе.
Другими словами, один вариант осуществления способа в соответствии с настоящим изобретением является, следовательно, компьютерной программой, имеющей программный код для выполнения одного из описанных в настоящем документе способов, когда эта компьютерная программа выполняется на компьютере.
Дополнительный вариант осуществления способа в соответствии с настоящим изобретением является, следовательно, носителем информации (или носителем цифровых данных, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из описанных в настоящем документе способов. Носитель информации, носитель цифровых данных или машиночитаемый носитель являются обычно материальными и/или энергонезависимыми.
Дополнительный вариант осуществления способа по настоящему изобретению является, следовательно, потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из описанных в настоящем документе способов. Поток данных или последовательность сигналов могут, например, быть выполнены с возможностью передачи через соединение передачи данных, например, через Интернет.
Дополнительный вариант осуществления включает в себя средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или запрограммированное для выполнения одного из описанных в настоящем документе способов.
Дополнительный вариант осуществления включает в себя компьютер с установленной на нем компьютерной программой для выполнения одного из описанных в настоящем документе способов.
Дополнительный вариант осуществления в соответствии с настоящим изобретением включает в себя устройство или систему, выполненную с возможностью передачи приемнику (например, электронно или оптически) компьютерной программы для выполнения одного из описанных в настоящем документе способов. Приемник может быть, например, компьютером, мобильным устройством, запоминающим устройством и т.п. Устройство или система могут, например, включать в себя файловый сервер для передачи компьютерной программы приемнику.
В некоторых вариантах осуществления программируемое логическое устройство (например, логическая микросхема, программируемая в условиях эксплуатации) может использоваться для выполнения некоторой или всей функциональности описанных в настоящем документе способов. В некоторых вариантах осуществления логическая микросхема, программируемая в условиях эксплуатации может взаимодействовать с микропроцессором для того, чтобы выполнить один из описанных в настоящем документе способов. Обычно способы предпочтительно выполняются с использованием технических средств.
Вышеописанные варианты осуществления предназначены лишь для иллюстрации принципов настоящего изобретения. Подразумевается, что модификации и вариации описанных в настоящем документе компоновок деталей будут очевидны для специалистов в данной области техники. Следовательно, предполагается, что настоящее изобретение ограничено только областью охвата прилагаемой формулы изобретения, а не конкретными деталями, представленными путем описания и объяснения вариантов осуществления в настоящем документе.
Ссылки
[1] Рекомендации ITU-T G.718: «Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s».
[2] Патент US 6678651 B2, «Short-Term Enhancement in CELP Speech Coding».

Claims (74)

1. Устройство для синтезирования аудиосигнала, включающее в себя обрабатывающий блок (108, 110, 218), выполненный с возможностью применения наклона спектра к коду кодировочной книги (104, 202), используемый для синтезирования текущего кадра аудиосигнала,
в котором наклон спектра основан на наклоне спектра текущего кадра аудиосигнала,
причем устройство выполнено с возможностью определения наклона спектра текущего кадра аудиосигнала на основе информации об огибающей спектра для текущего кадра аудиосигнала, и
причем обрабатывающий блок (108, 110, 218) выполнен с возможностью применения наклона спектра путем фильтрации кода из кодировочной книги (104, 202) на основе передаточной функции, моделирующей наклон спектра.
2. Устройство по п. 1, в котором информация об огибающей спектра определяется коэффициентами LPC и в котором наклон спектра текущего кадра аудиосигнала определяется следующим образом:
Figure 00000011
где ƒs (n) - бесконечная импульсная характеристика синтезирующего фильтра (106, 208) LPC, имеющего передаточную функцию
Figure 00000012
и
N - размер усечения бесконечной импульсной характеристики ƒs (n).
3. Устройство по п. 1, в котором информация об огибающей спектра определяется коэффициентами LPC и в котором наклон спектра текущего кадра аудиосигнала определяется следующим образом:
Figure 00000013
где ƒе (n) - бесконечная импульсная характеристика синтезирующего фильтра (106, 208) LPC, имеющего передаточную функцию
Figure 00000014
N - размер усечения бесконечной импульсной характеристики ƒs (n), и
w1, w2 представляют собой весовые константы для определения формантной структуры передаточной функции Fe (z).
4. Устройство по п. 2, в котором N равно количеству кодов в кодировочной книге (104, 202).
5. Устройство по п. 1, в котором передаточная функция, включающая в себя наклон спектра, определяется следующим образом:
Figure 00000015
где γ - наклон спектра.
6. Устройство по п. 1, в котором обрабатывающий блок (108, 110, 218) дополнительно выполнен с возможностью объединения определенного наклона спектра текущего кадра аудиосигнала с коэффициентом, относящимся к вокализованности предыдущего кадра аудиосигнала.
7. Устройство по п. 6, в котором коэффициент, относящийся к вокализованности предыдущего кадра аудиосигнала, определяется следующим образом:
β = константа⋅(1+вокализованность),
где вокализованность = (энергия(составляющая адаптивной кодировочной книги) - энергия(составляющая фиксированной кодировочной книги))/энергия(сумма составляющих).
8. Устройство по п. 6, в котором обрабатывающий блок (108, 110, 218) выполнен с возможностью применения наклона спектра путем фильтрации кода из кодировочной книги (104, 202) на основе передаточной функции, включающей в себя наклон спектра, и коэффициента, относящегося к вокализованности предыдущего кадра аудиосигнала.
9. Устройство по п. 8, в котором передаточная функция, включающая в себя наклон спектра, определяется следующим образом:
Figure 00000016
где а и b - константы.
10. Устройство по п. 1, в котором аудиосигнал является речевым сигналом, в котором обрабатывающий блок для применения наклона спектра включает в себя фильтр (218) и в котором устройство дополнительно включает в себя:
адаптивную кодировочную книгу (204), фиксированную кодировочную книгу (202),
фильтр (218), связанный с фиксированной кодировочной книгой (202) и выполненный с возможностью применять определенный наклон спектра к коду фиксированной кодировочной книги (202) для получения фильтрованного кода фиксированной кодировочной книги (202),
сумматор (206), связанный с адаптивной кодировочной книгой (204) и с фильтром (218) и выполненный с возможностью объединения кода из адаптивной кодировочной книги (204) и фильтрованного кода фиксированной кодировочной книги (202) для получения комбинированного кода, и
синтезирующий фильтр (208) LPC, связанный с сумматором (206).
11. Устройство по п. 10, дополнительно включающее в себя:
усилитель (214) высоты тона, находящийся между адаптивной кодировочной книгой (204) и сумматором (206), причем усилитель (214) высоты тона выполнен с возможностью умножения кода из адаптивной кодировочной книги (204) на коэффициент усиления высоты тона, и
кодовый усилитель (212), находящийся между фильтром (218) и сумматором (206), причем кодовый усилитель (212) выполнен с возможностью умножения фильтрованного кода фиксированной кодировочной книги (202) на кодовый коэффициент усиления.
12. Устройство по п. 10, дополнительно включающее в себя:
блок оценки (220) вокализованности, связанный с адаптивной кодировочной книгой (204) и с сумматором (206) и выполненный с возможностью вывода коэффициента, относящегося к вокализованности предыдущего кадра аудиосигнала, на фильтр (218), и
хранилище (216), выполненное с возможностью хранения коэффициентов LPC, описывающих информацию об огибающей спектра для текущего кадра аудиосигнала, причем хранилище (216) связано с фильтром (218).
13. Аудиодекодер, включающий в себя устройство для синтезирования аудиосигнала по п. 1.
14. Система синтезирования аудиосигнала, включающая в себя:
аудиодекодер по п. 13, и
аудиокодер, выполненный с возможностью определения из наклона спектра текущего кадра аудиосигнала наклона спектра для кода кодировочной книги (104, 202), представляющего текущий кадр аудиосигнала.
15. Способ для синтезирования аудиосигнала, включающий в себя:
применение наклона спектра к коду кодировочной книги (104, 202), используемому для синтезирования текущего кадра аудиосигнала,
в котором наклон спектра определяют на основе наклона спектра текущего кадра аудиосигнала,
в котором наклон спектра текущего кадра аудиосигнала определяется на основе информации об огибающей спектра для текущего кадра аудиосигнала, и
в котором применение наклона спектра включает в себя фильтрование кода из кодировочной книги (104, 202) на основе передаточной функции, моделирующей наклон спектра.
16. Способ по п. 15, в котором информацию об огибающей спектра определяют коэффициентами LPC, и в котором наклон спектра текущего кадра аудиосигнала определяют следующим образом:
Figure 00000017
где ƒs(n) - бесконечная импульсная характеристика синтезирующего фильтра (106, 208) LPC, имеющего передаточную функцию
Figure 00000018
, и
N - размер усечения бесконечной импульсной характеристики ƒs (n).
17. Способ по п. 15, в котором информацию об огибающей спектра определяют коэффициентами LPC, и в котором наклон спектра текущего кадра аудиосигнала определяют следующим образом:
Figure 00000019
где ƒe (n) - бесконечная импульсная характеристика синтезирующего фильтра (106, 208) LPC, имеющего передаточную функцию
Figure 00000020
N - размер усечения бесконечной импульсной характеристики ƒs (n), и
w1, w2 - весовые константы для определения формантной структуры передаточной функции Fe(z).
18. Способ по п. 16, в котором N равно количеству кодов в кодировочной книге (104, 202).
19. Способ по п. 15, в котором передаточную функцию, включающую в себя наклон спектра, определяют следующим образом:
Figure 00000021
где γ - наклон спектра.
20. Способ по п. 15, дополнительно включающий в себя объединение определенного наклона спектра текущего кадра аудиосигнала с коэффициентом, относящимся к вокализованности предыдущего кадра аудиосигнала.
21. Способ по п. 20, в котором коэффициент, относящийся к вокализованности предыдущего кадра аудиосигнала, определяют следующим образом:
β = константа ⋅ (1 + вокализованность),
где вокализованность = (энергия(составляющая адаптивной кодировочной книги) - энергия(составляющая фиксированной кодировочной книги))/энергия(сумма составляющих).
22. Способ по п. 20, в котором применение наклона спектра включает в себя фильтрацию кода из кодировочной книги (104, 202) на основе передаточной функции, включающей в себя наклон спектра, и коэффициента, относящегося к вокализованности в предыдущем кадре аудиосигнала.
23. Способ по п. 22, в котором передаточная функция, включающая в себя наклон спектра, определяют следующим образом:
Figure 00000022
где а и b - константы.
24. Способ по п. 15, в котором аудиосигнал является речевым сигналом и в котором синтезирование аудиосигнала включает в себя для кадра аудиосигнала
применение определенного наклона спектра к коду фиксированной кодировочной книги (202) для получения фильтрованного кода фиксированной кодировочной книги (202),
объединение кода из адаптивной кодировочной книги (204) и фильтрованного кода фиксированной кодировочной книги (202) для получения комбинированного кода и
фильтрацию комбинированного кода синтезирующим фильтром (208) LPC.
25. Способ по п. 24, дополнительно включающий в себя умножение кода из адаптивной кодировочной книги (204) на коэффициент усиления высоты тона, а также умножение фильтрованного кода фиксированной кодировочной книги (202) на кодовый коэффициент усиления.
26. Способ по п. 24, дополнительно включающий в себя
генерирование на основе кода из адаптивной кодировочной книги (204) и комбинированного кода коэффициента, относящегося к вокализованности предыдущего кадра аудиосигнала, и
сохранение коэффициентов LPC, описывающих информацию об огибающей спектра для текущего кадра аудиосигнала.
27. Энергонезависимый компьютерный носитель, хранящий инструкции, которые при их выполнении на компьютере выполняют способ для синтезирования аудиосигнала по п. 15.
RU2015136788A 2013-01-29 2014-01-28 Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа RU2618919C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758098P 2013-01-29 2013-01-29
US61/758,098 2013-01-29
PCT/EP2014/051592 WO2014118156A1 (en) 2013-01-29 2014-01-28 Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program

Publications (2)

Publication Number Publication Date
RU2015136788A RU2015136788A (ru) 2017-03-06
RU2618919C2 true RU2618919C2 (ru) 2017-05-12

Family

ID=50033504

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015136788A RU2618919C2 (ru) 2013-01-29 2014-01-28 Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа

Country Status (20)

Country Link
US (3) US10431232B2 (ru)
EP (1) EP2951819B1 (ru)
JP (1) JP6082126B2 (ru)
KR (1) KR101737254B1 (ru)
CN (1) CN105009210B (ru)
AR (1) AR094683A1 (ru)
AU (1) AU2014211524B2 (ru)
BR (1) BR112015018023B1 (ru)
CA (1) CA2899059C (ru)
ES (1) ES2626977T3 (ru)
HK (1) HK1217564A1 (ru)
MX (1) MX347316B (ru)
MY (1) MY183444A (ru)
PL (1) PL2951819T3 (ru)
PT (1) PT2951819T (ru)
RU (1) RU2618919C2 (ru)
SG (1) SG11201505903UA (ru)
TW (1) TWI544481B (ru)
WO (1) WO2014118156A1 (ru)
ZA (1) ZA201506318B (ru)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915234A (en) * 1995-08-23 1999-06-22 Oki Electric Industry Co., Ltd. Method and apparatus for CELP coding an audio signal while distinguishing speech periods and non-speech periods
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US6678652B2 (en) * 1998-10-13 2004-01-13 Victor Company Of Japan, Ltd. Audio signal processing apparatus
WO2011048094A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec and celp coding adapted therefore
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
JP2012042984A (ja) * 2011-12-02 2012-03-01 Panasonic Corp Celp型音声復号化装置およびcelp型音声復号化方法
RU2469422C2 (ru) * 2007-10-25 2012-12-10 Моторола Мобилити, Инк. Способ и устройство для формирования уровня улучшения в системе кодирования звука

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6242748B1 (en) 1999-08-10 2001-06-05 Edax, Inc. Methods and apparatus for mounting an X-ray detecting unit to an electron microscope
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6996523B1 (en) 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
CN1320966C (zh) 2002-05-20 2007-06-13 松下电器产业株式会社 清洗方法及清洗装置
US20060089836A1 (en) * 2004-10-21 2006-04-27 Motorola, Inc. System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization
US7475103B2 (en) 2005-03-17 2009-01-06 Qualcomm Incorporated Efficient check node message transform approximation for LDPC decoder
RU2376657C2 (ru) * 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
EP1722360B1 (en) 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
US8788276B2 (en) * 2008-07-11 2014-07-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
EP2559028B1 (en) * 2010-04-14 2015-09-16 VoiceAge Corporation Flexible and scalable combined innovation codebook for use in celp coder and decoder
SG185606A1 (en) * 2010-05-25 2012-12-28 Nokia Corp A bandwidth extender
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US9706314B2 (en) * 2010-11-29 2017-07-11 Wisconsin Alumni Research Foundation System and method for selective enhancement of speech signals
BR112015017748B1 (pt) * 2013-01-29 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Preenchimento de ruído na codificação de áudio de transformada perceptual
EP3054446B1 (en) * 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
MX347080B (es) * 2013-01-29 2017-04-11 Fraunhofer Ges Forschung Llenado con ruido sin informacion secundaria para celp (para codificadores tipo celp).
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
RU2644123C2 (ru) * 2013-10-18 2018-02-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
EP3058568B1 (en) * 2013-10-18 2021-01-13 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9672843B2 (en) * 2014-05-29 2017-06-06 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
US9373342B2 (en) * 2014-06-23 2016-06-21 Nuance Communications, Inc. System and method for speech enhancement on compressed speech
CN106228991B (zh) * 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915234A (en) * 1995-08-23 1999-06-22 Oki Electric Industry Co., Ltd. Method and apparatus for CELP coding an audio signal while distinguishing speech periods and non-speech periods
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6678652B2 (en) * 1998-10-13 2004-01-13 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US7092889B2 (en) * 1998-10-13 2006-08-15 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
RU2469422C2 (ru) * 2007-10-25 2012-12-10 Моторола Мобилити, Инк. Способ и устройство для формирования уровня улучшения в системе кодирования звука
WO2011048094A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec and celp coding adapted therefore
JP2012042984A (ja) * 2011-12-02 2012-03-01 Panasonic Corp Celp型音声復号化装置およびcelp型音声復号化方法

Also Published As

Publication number Publication date
CN105009210B (zh) 2018-04-10
US20220293114A1 (en) 2022-09-15
EP2951819A1 (en) 2015-12-09
EP2951819B1 (en) 2017-03-01
WO2014118156A1 (en) 2014-08-07
SG11201505903UA (en) 2015-08-28
TW201435862A (zh) 2014-09-16
PL2951819T3 (pl) 2017-08-31
CA2899059A1 (en) 2014-08-07
US10431232B2 (en) 2019-10-01
JP2016509694A (ja) 2016-03-31
MY183444A (en) 2021-02-18
AU2014211524A1 (en) 2015-09-17
CN105009210A (zh) 2015-10-28
RU2015136788A (ru) 2017-03-06
US20190378528A1 (en) 2019-12-12
MX347316B (es) 2017-04-21
US11373664B2 (en) 2022-06-28
BR112015018023B1 (pt) 2022-06-07
ES2626977T3 (es) 2017-07-26
US20150332694A1 (en) 2015-11-19
TWI544481B (zh) 2016-08-01
BR112015018023A2 (ru) 2017-08-22
KR20150112028A (ko) 2015-10-06
HK1217564A1 (zh) 2017-01-13
JP6082126B2 (ja) 2017-02-15
KR101737254B1 (ko) 2017-05-17
AR094683A1 (es) 2015-08-19
CA2899059C (en) 2018-05-15
PT2951819T (pt) 2017-06-06
AU2014211524B2 (en) 2016-07-07
MX2015009749A (es) 2015-11-06
ZA201506318B (en) 2016-07-27

Similar Documents

Publication Publication Date Title
EP1899962B1 (en) Audio codec post-filter
US8069040B2 (en) Systems, methods, and apparatus for quantization of spectral envelope representation
RU2660605C2 (ru) Концепция заполнения шумом
US7490036B2 (en) Adaptive equalizer for a coded speech signal
US10909997B2 (en) Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US10607619B2 (en) Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US20220293114A1 (en) Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
RU2707144C2 (ru) Аудиокодер и способ для кодирования аудиосигнала
JP6001451B2 (ja) 符号化装置及び符号化方法