RU2792658C1 - Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио - Google Patents

Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио Download PDF

Info

Publication number
RU2792658C1
RU2792658C1 RU2022118821A RU2022118821A RU2792658C1 RU 2792658 C1 RU2792658 C1 RU 2792658C1 RU 2022118821 A RU2022118821 A RU 2022118821A RU 2022118821 A RU2022118821 A RU 2022118821A RU 2792658 C1 RU2792658 C1 RU 2792658C1
Authority
RU
Russia
Prior art keywords
audio
side information
encoding
signal
decoding
Prior art date
Application number
RU2022118821A
Other languages
English (en)
Inventor
Кимитака ЦУЦУМИ
Кей КИКУИРИ
Ацуси ЯМАГУТИ
Original Assignee
Нтт Докомо, Инк.
Filing date
Publication date
Application filed by Нтт Докомо, Инк. filed Critical Нтт Докомо, Инк.
Application granted granted Critical
Publication of RU2792658C1 publication Critical patent/RU2792658C1/ru

Links

Images

Abstract

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в обеспечении восстановления качества звучания без увеличения алгоритмической задержки, когда происходит потеря пакета при кодировании аудио. Технический результат достигается за счет кодирования побочной информации, при котором вычисляют побочную информацию из прогнозного сигнала, причем побочная информация предназначена для вычисления предсказанного значения аудиопараметра во время декодирования, при этом, когда определено, что побочная информация доступна в соответствии с индексом, представляющим характеристики целевого кадра кодирования, информацию, представляющую, что побочная информация доступна, включают в индекс побочной информации, при этом на этапе кодирования побочной информации индекс побочной информации и побочную информацию используют в качестве кодов побочной информации в аудиопакете для целевого кадра кодирования. 3 н. и 3 з.п. ф-лы, 43 ил.

Description

Область техники
[0001] Настоящее изобретение связано с маскированием ошибок для передачи аудиопакетов по IP-сети или сети мобильной связи и более конкретно, связано с устройством кодирования аудио, способом кодирования аудио, программой кодирования аудио, устройством декодирования аудио, способом декодирования аудио и программой декодирования аудио для высокоточного генерирования сигнала маскирования потери пакета для реализации маскирования ошибок.
Уровень техники
[0002] При передаче аудио и акустических сигналов (которые в дальнейшем в этом документе вместе упоминаются как "аудиосигнал") по IP-сети или сети мобильной связи аудиосигнал кодируется в аудиопакеты с регулярными временными интервалами и передается по сети связи. На стороне приема аудиопакеты принимаются по сети связи и декодируются в декодированный аудиосигнал сервером, MCU (блок управления многоточечной связью), терминалом или подобным.
[0003] Аудиосигнал, в общем, получается в цифровом формате. В частности, он измеряется и собирается как последовательность цифр, число которых является таким же, как частота взятия отсчетов в секунду. Каждый элемент последовательности называется "отсчетом". При кодировании аудио каждый раз, когда некоторое предопределенное число отсчетов аудиосигнала собирается во встроенном буфере, в буфере кодируется аудиосигнал. Вышеописанное задаваемое число отсчетов называется "длиной кадра" и набор с таким же числом отсчетов как длина кадра называется "кадром". Например, при частоте взятия отсчетов 32 кГц, когда длина кадра равна 20 мс, длина кадра равна 640 отсчетам. Следует отметить, что длина буфера может быть более чем один кадр.
[0004] При передаче аудиопакетов по сети связи может возникать явление (так называемая "потеря пакета"), когда некоторые из аудиопакетов теряются, или может возникать ошибка в части информации, записанной в аудиопакетах, из-за перегрузки в сети связи или подобном. В таком случае, аудиопакеты не могут быть декодированы корректно на стороне приема и поэтому, желаемый декодированный аудиосигнал не может быть получен. Дополнительно, декодированный аудиосигнал, соответствующий аудиопакету, где произошла потеря пакета, обнаруживается как шум, который значительно ухудшает субъективное качество для человека, который слушает это аудио.
[0005] Для того, чтобы преодолевать вышеописанные недостатки, технология маскирования потери пакета используется в качестве способа для интерполирования части аудио/акустического сигнала, который потерян вследствие потери пакета. Есть два типа технологии маскирования потери пакета: "технология маскирования потери пакета без использования побочной (дополнительной) информации", где маскирование потери пакета выполняется только на стороне приема, и "технология маскирования потери пакета с использованием побочной информации", где параметры, которые помогают маскировать потерю пакета, получаются на стороне передачи и передаются на сторону приема, где маскирование потери пакета выполняется с использованием принятых параметров на стороне приема.
[0006] "Технология маскирования потери пакета без использования побочной информации" генерирует аудиосигнал, соответствующий части, где произошла потеря пакета, посредством копирования декодированного аудиосигнала, содержащегося в некотором пакете, который был корректно принят в прошлом, на основе “основной тон за основным тоном”, и затем умножения его на некоторый предопределенный коэффициент ослабления, например, как описано в непатентной литературе 1. Поскольку "технология маскирования потери пакета без использования побочной информации" основывается на предположении, что свойства части аудио, где произошла потеря пакета, аналогичны свойствам аудио непосредственно перед возникновением потери, эффект маскирования не может быть получен в достаточной степени, когда часть аудио, где произошла потеря пакета, имеет свойства, отличные от аудио непосредственно перед возникновением потери или когда возникает внезапное изменение питания.
[0007] С другой стороны, "технология маскирования потери пакета с использованием побочной информации" включает в себя подход, который кодирует параметры, требуемые для маскирования потери пакета на стороне передачи, и передает их для использования при маскировании потери пакета на сторону приема, как описано в патентной литературе 1. В патентной литературе 1 аудио кодируется двумя способами кодирования: основное кодирование и резервное кодирование. Резервное кодирование кодирует кадр непосредственно перед кадром, который должен быть закодирован посредством основного кодирования, с меньшим битрейтом, чем основное кодирование (см. Фиг. 1 (a)). Например, N-й пакет содержит аудиокод, полученный посредством кодирования N-го кадра посредством главного кодирования, и код побочной информации, полученный посредством кодирования (N-1)-го кадра посредством резервного кодирования.
[0008] Сторона приема ожидает поступления двух или более пакетов следующих один за другим во времени и затем декодирует более ранний во времени пакет и получает декодированный аудиосигнал. Например, для получения сигнала, соответствующего N-му кадру, сторона приема ожидает поступления (N+1)-го пакета и затем выполняет декодирование. В случае, когда N-й пакет и (N+1)-й пакет приняты корректно, аудиосигнал N-го кадра получается посредством декодирования аудиокода, содержащегося в N-ом пакете (см. Фиг. 1(b)). С другой стороны, в случае, когда произошла потеря пакета (когда получен (N+1)-й пакет при условии, что потерян N-й пакет), аудиосигнал N-го кадра может быть получен посредством декодирования кода побочной информации, содержащегося в (N+1)-м пакете (см. Фиг. 1(c)).
[0009] Согласно способу из патентной литературы 1 после поступления пакета, который должен быть декодирован, для выполнения декодирования необходимо ожидать, пока не поступит один или более пакет, и алгоритмическая задержка увеличивается на один пакет или более. Соответственно, в способе из патентной литературы 1, несмотря на то, что качество звучания (качество аудио) может быть улучшено посредством маскирования потери пакета, увеличивается алгоритмическая задержка, что вызывает ухудшение качества голосовой связи.
[0010] Дополнительно, в случае применения вышеописанной технологии маскирования потери пакета к кодированию CELP (линейное предсказание с кодовым возбуждением), возникает другая проблема, обусловленная характеристиками операции CELP. Поскольку CELP является моделью аудио на основе линейного предсказания и способно кодировать аудиосигнал с высокой точностью и с высокой степенью сжатия, оно используется во многих международных стандартах.
[0011] В CELP аудиосигнал синтезируется посредством фильтрации сигнала e(n) возбуждения с использованием полюсного фильтра синтеза. В частности, аудиосигнал s(n) синтезируется согласно следующему уравнению:
Figure 00000001
где a(i) является коэффициентом линейного предсказания (коэффициентом LP) и значение, такое как, например, P=16, используется в качестве степени.
[0012] Сигнал возбуждения собирается в буфере, называемом адаптивная кодовая книга. При синтезировании аудио для нового кадра сигнал возбуждения вновь генерируется посредством сложения вектора адаптивной кодовой книги, считываемого из адаптивной кодовой книги, и вектора фиксированной кодовой книги, представляющего изменение сигнала возбуждения с течением времени на основе информации о положении, называемой запаздыванием основного тона. Вновь сгенерированный сигнал возбуждения собирается в адаптивной кодовой книге и также фильтруется полюсным фильтром синтеза, и посредством этого синтезируется декодированный сигнал.
[0013] При CELP коэффициент LP вычисляется для всех кадров. При вычислении коэффициента LP требуется прогнозный сигнал на приблизительно 10 мс. В частности, в дополнение к кадру, который должен быть закодирован, прогнозный сигнал собирается в буфере, и затем выполняются вычисление коэффициента LP и последующая обработка (см. Фиг. 2). Каждый кадр разделяется приблизительно на четыре подкадра и обработка, например вышеописанное вычисление запаздывания основного тона, вычисление вектора адаптивной кодовой книги, вычисление вектора фиксированной кодовой книги и обновление адаптивной кодовой книги выполняются в каждом подкадре. При обработке каждого подкадра коэффициент LP также интерполируется, так что коэффициент меняется от подкадра к подкадру. Дополнительно, для квантования и интерполяции коэффициент LP кодируется после его преобразования в параметр ISP (пары спектральных иммитансов) и параметр ISF (частоты спектральных иммитансов), которые являются эквивалентным представлением(-ями) коэффициента(-ов) LP. Процедура для взаимного преобразования коэффициента(-ов) LP и параметра ISP и параметра ISF описывается в непатентной литературе 2.
[0014] При кодировании с CELP кодирование и декодирование выполняются на основе предположения, что как сторона кодирования, так и сторона декодирования имеют адаптивные кодовые книги, и эти адаптивные кодовые книги всегда синхронизированы друг с другом. Несмотря на то, что адаптивная кодовая книга на стороне кодирования и адаптивная кодовая книга на стороне декодирования синхронизированы при условиях, что пакеты приняты корректно и корректно осуществлено декодирование, как только произошла потеря пакета, синхронизация адаптивных кодовых книг не может быть достигнута.
[0015] Например, если значение, которое используется в качестве запаздывания основного тона, отличается между стороной кодирования и стороной декодирования, между векторами адаптивной кодовой книги возникает запаздывание во времени (временная задержка). Поскольку адаптивная кодовая книга обновляется этими векторами адаптивной кодовой книги, даже если следующий кадр принят корректно, вектор адаптивной кодовой книги, вычисленный на стороне кодирования, и вектор адаптивной кодовой книги, вычисленный на стороне декодирования, не совпадут, и синхронизация адаптивных кодовых книг не восстановится. Вследствие такой несовместимости (противоречивости) адаптивных кодовых книг происходит ухудшение качества звучания для нескольких кадров после кадра, где произошла потеря пакета.
[0016] Более передовая технология маскирования потери пакета при кодировании с CELP описана в патентной литературе 2. Согласно патентной литературе 2 индекс кодовой книги переходного режима передается вместо запаздывания основного тона или усиления (коэффициента усиления) адаптивной кодовой книги в некотором конкретном кадре, который в значительной степени поврежден потерей пакета. Технология патентной литературы 2 концентрирует внимание на переходном кадре (переход от аудиосегмента без звука к аудиосегменту со звуком или переход между двумя гласными звуками) как на кадре, который в значительной степени поврежден потерей пакета. Посредством генерирования сигнала возбуждения с использованием кодовой книги переходного режима в этом переходном кадре, можно генерировать сигнал возбуждения, который не зависит от прошлой адаптивной кодовой книги, и посредством этого можно осуществить восстановление от несовместимости адаптивных кодовых книг вследствие прошлой потери пакета.
[0017] Однако, поскольку способ из патентной литературы 2 не использует кодовую книгу переходного кадра в кадре, в котором, например, продолжается долгий гласный звук, не представляется возможным осуществить восстановление от несовместимости адаптивных кодовых книг в таком кадре. Дополнительно, в случае, когда потерян пакет, содержащий кодовую книгу переходного кадра, потеря пакета повреждает кадры после потери. Аналогичная ситуация возникает, когда теряется пакет, следующий после пакета, содержащего кодовую книгу переходного кадра.
[0018] Несмотря на то, что можно применять кодовую книгу, такую как кодовая книга переходного кадра, которая не зависит от прошлых кадров, ко всем кадрам, поскольку значительно ухудшается эффективность кодирования, при этих условиях не представляется возможным достичь низкого битрейта и высокого качества звучания.
Список ссылок
Патентная литература
[0019] Патентная литература 1: публикация нерассмотренной заявки на патент Японии № 2003-533916
Патентная литература 2: публикация нерассмотренной заявки на патент Японии № 2010-507818
Непатентная литература
[0020] Непатентная литература 1: ITU-T G.711 Приложение I
Непатентная литература 2: 3GPP TS26-191
Непатентная литература 3: 3GPP TS26-190
Непатентная литература 4: ITU-T G.718
Сущность изобретения
Техническая проблема
[0021] С использованием способа из патентной литературы 1, после поступления пакета, который должен быть декодирован, декодирование не начинается до поступления следующего пакета. Таким образом, несмотря на то, что качество звучания улучшается посредством маскирования потери пакета, увеличивается алгоритмическая задержка, которая вызывает ухудшение качества голосовой связи.
[0022] В случае потери пакета при кодировании с CELP, ухудшение качества звучания происходит вследствие несовместимости адаптивных кодовых книг между блоком кодирования и блоком декодирования. Несмотря на то, что способ, который описан в патентной литературе 2, может позволить осуществить восстановление от несовместимости адаптивных кодовых книг, способ не является достаточным, чтобы позволить осуществить восстановление, когда потерян кадр, отличный от кадра, находящегося непосредственно перед переходным кадром.
[0023] Настоящее изобретение сделано для решения вышеуказанных проблем и таким образом, целью настоящего изобретения является обеспечение устройства кодирования аудио, способа кодирования аудио, программы кодирования аудио, устройства декодирования аудио, способа декодирования аудио и программы декодирования аудио, которые восстанавливают качество звучания без увеличения алгоритмической задержки в случае потери пакета при кодировании аудио.
Решение проблемы
[0024] Для достижения вышеуказанный цели согласно одному аспекту настоящего изобретения обеспечено устройство кодирования аудио для кодирования аудиосигнала, которое включает в себя блок кодирования аудио, сконфигурированный с возможностью кодирования аудиосигнала, и блок кодирования побочной (дополнительной) информации, сконфигурированный с возможностью вычисления побочной информации из прогнозного сигнала и кодирования побочной информации.
[0025] Побочная информация может быть связана с запаздыванием основного тона в прогнозном сигнале, связана с усилением основного тона в прогнозном сигнале или связана с запаздыванием основного тона и усилением основного тона в прогнозном сигнале. Дополнительно, побочная информация может содержать информацию, связанную с доступностью побочной информации.
[0026] Блок кодирования побочной информации может вычислять побочную информацию для части прогнозного сигнала и кодировать побочную информацию, а также генерировать сигнал маскирования, и устройство кодирования аудио может дополнительно включать в себя блок кодирования сигнала ошибки, сконфигурированный с возможностью кодирования сигнала ошибки между входным аудиосигналом и сигналом маскирования, выводимым из блока кодирования побочной информации, и главный блок кодирования, сконфигурированный с возможностью кодирования входного аудиосигнала.
[0027] Дополнительно согласно одному аспекту настоящего изобретения обеспечено устройство декодирования аудио для декодирования аудиокода и вывода аудиосигнала, которое включает в себя буфер аудиокода, сконфигурированный с возможностью обнаружения потери пакета на основе состояния приема аудиопакета, блок декодирования аудиопараметров, сконфигурированный с возможностью декодирования аудиокода, когда аудиопакет принят корректно, блок декодирования побочной информации, сконфигурированный с возможностью декодирования кода побочной информации, когда аудиопакет принят корректно, блок сбора побочной информации, сконфигурированный с возможностью сбора побочной информации, получаемой посредством декодирования кода побочной информации, блок обработки отсутствующих аудиопараметров, сконфигурированный с возможностью вывода аудиопараметра, когда обнаружена потеря аудиопакета, и блок синтеза аудио, сконфигурированный с возможностью синтезирования декодированного аудио из аудиопараметра.
[0028] Побочная информация может быть связана с запаздыванием основного тона в прогнозном сигнале, связана с усилением основного тона в прогнозном сигнале или связана с запаздыванием основного тона и усилением основного тона в прогнозном сигнале. Дополнительно, побочная информация может содержать информацию, связанную с доступностью побочной информации.
[0029] Блок декодирования побочной информации может декодировать код побочной информации и выводить побочную информацию, и может дополнительно выводить сигнал маскирования, связанный с прогнозной частью посредством использования побочной информации, и устройство декодирования аудио может дополнительно включать в себя блок декодирования ошибок, сконфигурированный с возможностью декодирования кода, связанного с сигналом ошибки между аудиосигналом и сигналом маскирования, главный блок декодирования, сконфигурированный с возможностью декодирования кода, связанного с аудиосигналом, и блок сбора сигналов маскирования, сконфигурированный с возможностью сбора сигнала маскирования, выводимого из блока декодирования побочной информации.
[0030] Когда аудиопакет принят корректно, часть декодированного сигнала может быть сгенерирована посредством сложения сигнала маскирования, считываемого из блока сбора сигналов маскирования, и декодированного сигнала ошибки, выводимого из блока декодирования ошибок, и блок сбора сигналов маскирования может быть обновлен сигналом маскирования, выводимым из блока декодирования побочной информации.
[0031] Когда обнаружена потеря аудиопакета, сигнал маскирования, считываемый из блока сбора сигналов маскирования, может быть использован в качестве части или целого декодированного сигнала.
[0032] Когда обнаружена потеря аудиопакета, декодированный сигнал может быть сгенерирован посредством использования аудиопараметра, предсказываемого блоком обработки отсутствующих аудиопараметров, и блок сбора сигналов маскирования может быть обновлен посредством использования части декодированного сигнала.
[0033] Когда обнаружена потеря аудиопакета, блок обработки отсутствующих аудиопараметров может использовать побочную информацию, считываемую из блока сбора побочной информации, в качестве части предсказываемого значения аудиопараметра.
[0034] Когда обнаружена потеря аудиопакета, блок синтеза аудио может корректировать вектор адаптивной кодовой книги, который является одним из аудиопараметров, посредством использования побочной информации, считываемой из блока сбора побочной информации.
[0035] Способ кодирования аудио согласно одному аспекту настоящего изобретения является способом кодирования аудио посредством устройства кодирования аудио для кодирования аудиосигнала, который включает в себя этап кодирования аудио, на котором кодируют аудиосигнал, и этап кодирования побочной информации, на котором вычисляют побочную информацию из прогнозного сигнала и кодируют побочную информацию.
[0036] Способ декодирования аудио согласно одному аспекту настоящего изобретения является способом декодирования аудио посредством устройства декодирования аудио для декодирования аудиокода и вывода аудиосигнала, который включает в себя этап буферизации аудиокода, на котором обнаруживают потерю пакета на основе состояния приема аудиопакета, этап декодирования аудиопараметров, на котором декодируют аудиокод, когда аудиопакет принят корректно, этап декодирования побочной информации, на котором декодируют код побочной информации, когда аудиопакет принят корректно, этап сбора побочной информации, на котором собирают побочную информацию, получаемую посредством декодирования кода побочной информации, этап обработки отсутствующих аудиопараметров, на котором выводят аудиопараметр, когда обнаружена потеря аудиопакета, и этап синтеза аудио, на котором синтезируют декодированное аудио из аудиопараметра.
[0037] Программа кодирования аудио согласно одному аспекту настоящего изобретения побуждает компьютер функционировать в качестве блока кодирования аудио для кодирования аудиосигнала и блока кодирования побочной информации для вычисления побочной информации из прогнозного сигнала и кодирования побочной информации.
[0038] Программа декодирования аудио согласно одному аспекту настоящего изобретения побуждает компьютер функционировать в качестве буфера аудиокода для обнаружения потери пакета на основе состояния приема аудиопакета, блока декодирования аудиопараметров для декодирования аудиокода, когда аудиопакет принят корректно, блока декодирования побочной информации для декодирования кода побочной информации, когда аудиопакет принят корректно, блока сбора побочной информации для сбора побочной информацию, получаемой посредством декодирования кода побочной информации, блока обработки отсутствующих аудиопараметров для вывода аудиопараметра, когда обнаружена потеря аудиопакета, и блока синтеза аудио для синтезирования декодированного аудио из аудиопараметра.
Полезные эффекты изобретения
[0039] Можно восстанавливать качество звучания без увеличения алгоритмической задержки в случае потери пакета при кодировании аудио. Конкретно, при кодировании с CELP, можно сократить ухудшение адаптивной кодовой книги, которое возникает, когда происходит потеря пакета, и посредством этого улучшить качество звучания в случае потери пакета.
Краткое описание чертежей
[0040] Фиг. 1 представляет собой вид, показывающий временную взаимосвязь между пакетами и декодированным сигналом согласно связанной области техники, описанной в патентной литературе 1.
Фиг. 2 представляет собой вид, показывающий временную взаимосвязь между целевым сигналом анализа LP и прогнозным сигналом при кодировании с CELP.
Фиг. 3 представляет собой вид, показывающий временную взаимосвязь между пакетами и декодированным сигналом согласно варианту осуществления настоящего изобретения.
Фиг. 4 представляет собой вид, показывающий пример функциональной конфигурации устройства передачи аудиосигнала в примере 1 (первый пример) настоящего изобретения.
Фиг. 5 представляет собой вид, показывающий пример функциональной конфигурации устройства приема аудиосигнала в примере 1 настоящего изобретения.
Фиг. 6 представляет собой вид, показывающий процедуру устройства передачи аудиосигнала в примере 1 настоящего изобретения.
Фиг. 7 представляет собой вид, показывающий процедуру устройства приема аудиосигнала в примере 1 настоящего изобретения.
Фиг. 8 представляет собой вид, показывающий пример функциональной конфигурации блока кодирования побочной информации в примере 1 настоящего изобретения.
Фиг. 9 представляет собой вид, показывающий процедуру блока кодирования побочной информации в примере 1 настоящего изобретения.
Фиг. 10 представляет собой вид, показывающий процедуру блока вычисления коэффициента LP в примере 1 настоящего изобретения.
Фиг. 11 представляет собой вид, показывающий процедуру блока вычисления целевого сигнала в примере 1 настоящего изобретения.
Фиг. 12 представляет собой вид, показывающий пример функциональной конфигурации блока обработки отсутствующих аудиопараметров в примере 1 настоящего изобретения.
Фиг. 13 представляет собой вид, показывающий процедуру предсказания аудиопараметра в примере 1 настоящего изобретения.
Фиг. 14 представляет собой вид, показывающий процедуру блока синтеза вектора возбуждения в альтернативном примере 1-1 примера 1 настоящего изобретения.
Фиг. 15 представляет собой вид, показывающий пример функциональной конфигурации блока синтеза аудио в примере 1 настоящего изобретения.
Фиг. 16 представляет собой вид, показывающий процедуру блока синтеза аудио в примере 1 настоящего изобретения.
Фиг. 17 представляет собой вид, показывающий пример функциональной конфигурации блока кодирования побочной информации (когда в состав включен блок определения вывода побочной информации) в альтернативном примере 1-2 примера 1 настоящего изобретения.
Фиг. 18 представляет собой вид, показывающий процедуру блока кодирования побочной информации (когда в состав включен блок определения вывода побочной информации) в альтернативном примере 1-2 примера 1 настоящего изобретения.
Фиг. 19 представляет собой вид, показывающий процедуру предсказания аудиопараметра в альтернативном примере 1-2 примера 1 настоящего изобретения.
Фиг. 20 представляет собой вид, показывающий пример функциональной конфигурации устройства передачи аудиосигнала в примере 2 настоящего изобретения.
Фиг. 21 представляет собой вид, показывающий пример функциональной конфигурации главного блока кодирования в примере 2 настоящего изобретения.
Фиг. 22 представляет собой вид, показывающий процедуру устройства передачи аудиосигнала в примере 2 настоящего изобретения.
Фиг. 23 представляет собой вид, показывающий пример функциональной конфигурации устройства приема аудиосигнала в примере 2 настоящего изобретения.
Фиг. 24 представляет собой вид, показывающий процедуру устройства приема аудиосигнала в примере 2 настоящего изобретения.
Фиг. 25 представляет собой вид, показывающий пример функциональной конфигурации блока синтеза аудио в примере 2 настоящего изобретения.
Фиг. 26 представляет собой вид, показывающий пример функциональной конфигурации блока декодирования аудиопараметров в примере 2 настоящего изобретения.
Фиг. 27 представляет собой вид, показывающий пример функциональной конфигурации блока кодирования побочной информации в примере 3 настоящего изобретения.
Фиг. 28 представляет собой вид, показывающий процедуру блока кодирования побочной информации в примере 3 настоящего изобретения.
Фиг. 29 представляет собой вид, показывающий процедуру блока выбора запаздывания основного тона в примере 3 настоящего изобретения.
Фиг. 30 представляет собой вид, показывающий процедуру блока декодирования побочной информации в примере 3 настоящего изобретения.
Фиг. 31 представляет собой вид, показывающий конфигурацию программы кодирования аудио и носителя данных согласно варианту осуществления настоящего изобретения.
Фиг. 32 представляет собой вид, показывающий конфигурацию программы декодирования аудио и носителя данных согласно варианту осуществления настоящего изобретения.
Фиг. 33 представляет собой вид, показывающий пример функциональной конфигурации блока кодирования побочной информации в примере 4 настоящего изобретения.
Фиг. 34 представляет собой вид, показывающий процедуру блока кодирования побочной информации в примере 4 настоящего изобретения.
Фиг. 35 представляет собой вид, показывающий процедуру блока предсказания запаздывания основного тона в примере 4 настоящего изобретения.
Фиг. 36 представляет собой другой вид, показывающий процедуру блока предсказания запаздывания основного тона в примере 4 настоящего изобретения.
Фиг. 37 представляет собой другой вид, показывающий процедуру блока предсказания запаздывания основного тона в примере 4 настоящего изобретения.
Фиг. 38 представляет собой вид, показывающий процедуру блока вычисления адаптивной кодовой книги в примере 4 настоящего изобретения.
Фиг. 39 представляет собой вид, показывающий пример функциональной конфигурации блока кодирования побочной информации в примере 5 настоящего изобретения.
Фиг. 40 представляет собой вид, показывающий процедуру блока кодирования запаздывания основного тона в примере 5 настоящего изобретения.
Фиг. 41 представляет собой вид, показывающий процедуру блока декодирования побочной информации в примере 5 настоящего изобретения.
Фиг. 42 представляет собой вид, показывающий процедуру блока предсказания запаздывания основного тона в примере 5 настоящего изобретения.
Фиг. 43 представляет собой вид, показывающий процедуру блока вычисления адаптивной кодовой книги в примере 5 настоящего изобретения.
Описание вариантов осуществления
[0041] Варианты осуществления настоящего изобретения описываются в дальнейшем в этом документе со ссылкой на приложенные чертежи. Следует отметить, что где возможно, одинаковые элементы обозначаются одинаковыми позиционными обозначениями и их избыточное описание пропущено.
[0042] Вариант осуществления настоящего изобретения относится к кодеру и декодеру, которые реализуют "технологию маскирования потери пакета с использованием побочной информации", которая кодирует и передает побочную информацию, вычисленную на стороне кодера, для использования при маскировании потери пакета на стороне декодера.
[0043] В вариантах осуществления настоящего изобретения побочная информация, которая используется для маскирования потери пакета, содержится в предыдущем (предшествующем) пакете. Фиг. 3 показывает временную взаимосвязь между аудиокодом и кодом побочной информации, содержащемся в пакете. Как проиллюстрировано на Фиг. 3, побочная информации в вариантах осуществления настоящего изобретения представляет собой параметры (запаздывание основного тона, усиление адаптивной кодовой книги и другие), которые вычисляются для прогнозного сигнала при кодировании с CELP.
[0044] Поскольку побочная информация содержится в предыдущем пакете, можно выполнять декодирование без ожидания пакета, который поступает после пакета, который должен быть декодирован. Дополнительно, когда обнаружена потеря пакета, поскольку побочная информация для кадра, который должен быть замаскирован, получается из предыдущего пакета, можно реализовывать высокоточное маскирование потери пакета без ожидания следующего пакета.
[0045] В дополнение, посредством передачи параметров для кодирования с CELP в прогнозном сигнале в качестве побочной информации, можно устранять несовместимость адаптивных кодовых книг даже в случае потери пакета.
[0046] Варианты осуществления настоящего изобретения могут быть составлены из устройства передачи аудиосигнала (устройство кодирования аудио) и устройства приема аудиосигнала (устройство декодирования аудио). Пример функциональной конфигурации устройства передачи аудиосигнала показан на Фиг. 4 и примерная процедура упомянутого устройство показана на Фиг. 6. Дополнительно, один пример функциональной конфигурации устройства приема аудиосигнала показан на Фиг. 5 и примерная процедура упомянутого устройства показана на Фиг. 7.
[0047] Как показано на Фиг. 4, устройство передачи аудиосигнала включает в себя блок 111 кодирования аудио и блок 112 кодирования побочной информации. Как показано на Фиг. 5, устройство приема аудиосигнала включает в себя буфер 121 аудиокода, блок 122 декодирования аудиопараметров, блок 123 обработки отсутствующих аудиопараметров, блок 124 синтеза аудио, блок 125 декодирования побочной информации и блок 126 сбора побочной информации.
[0048] Устройство передачи аудиосигнала кодирует аудиосигнал для каждого кадра и может передавать аудиосигнал посредством примерной процедуры, показанной на Фиг. 6.
[0049] Блок 111 кодирования аудио может вычислять аудиопараметры для кадра, который должен быть закодирован, и выводить аудиокод (этап S131 на Фиг. 6).
[0050] Блок 112 кодирования побочной информации может вычислять аудиопараметры для прогнозного сигнала и выводить код побочной информации (этап S132 на Фиг. 6).
[0051] Определяется, закончился ли аудиосигнал, и вышеуказанные этапы могут повторяться до тех пор, пока не закончится аудиосигнал (этап S133 на Фиг. 6).
[0052] Устройство приема аудиосигнала декодирует принятый аудиопакет и выводит аудиосигнал посредством примерной процедуры, показанной на Фиг. 7.
[0053] Буфер 121 аудиокода ожидает поступления аудиопакета и собирает аудиокод. Когда аудиопакет поступил корректно, обработка переключается на блок 122 декодирования аудиопараметров. С другой стороны, когда аудиопакет не поступил корректно, обработка переключается на блок 123 обработки отсутствующих аудиопараметров (этап S141 на Фиг. 7).
[0054] <Когда аудиопакет принят корректно>
Блок 122 декодирования аудиопараметров декодирует аудиокод и выводит аудиопараметры (этап S142 на Фиг. 7).
[0055] Блок 125 декодирования побочной информации декодирует код побочной информации и выводит побочную информацию. Выводимая побочная информация отправляется в блок 126 сбора побочной информации (этап S143 на Фиг. 7).
[0056] Блок 124 синтеза аудио синтезирует аудиосигнал из аудиопараметров, выводимых из блока 122 декодирования аудиопараметров, и выводит синтезированный аудиосигнал (этап S144 на Фиг. 7).
[0057] Блок 123 обработки отсутствующих аудиопараметров собирает аудиопараметры, выводимые из блока 122 декодирования аудиопараметров, на случай потери пакета (этап S145 на Фиг. 7).
[0058] Буфер 121 аудиокода определяет, завершена ли передача аудиопакетов, и когда передача аудиопакетов завершена, останавливает обработку. Пока продолжается передача аудиопакетов, повторяются вышеуказанные этапы с S141 по S146 (этап S147 на Фиг. 7).
[0059] <Когда аудиопакет потерян>
Блок 123 обработки отсутствующих аудиопараметров считывает побочную информации из блока 126 сбора побочной информации и осуществляет предсказание для параметра(-ов), не содержащихся в побочной информации, и посредством этого выводит аудиопараметры (этап S146 на Фиг. 7).
[0060] Блок 124 синтеза аудио синтезирует аудиосигнал из аудиопараметров, выводимых из блока 123 обработки отсутствующих аудиопараметров, и выводит синтезированный аудиосигнал (этап S144 на Фиг. 7).
[0061] Блок 123 обработки отсутствующих аудиопараметров собирает аудиопараметры, выводимые из блока 123 обработки отсутствующих аудиопараметров, на случай потери пакета (этап S145 на Фиг. 7).
[0062] Буфер 121 аудиокода определяет, завершена ли передача аудиопакетов, и когда передача аудиопакетов завершена, останавливает обработку. Пока продолжается передача аудиопакетов, повторяются вышеуказанные этапы с S141 по S146 (этап S147 на Фиг. 7).
[0063] [Пример 1]
В этом примере случая, в котором запаздывание основного тона передается в качестве побочной информации, запаздывание основного тона может быть использовано для генерирования сигнала маскирования потери пакета на стороне декодирования.
[0064] Пример функциональной конфигурации устройства передачи аудиосигнала показан на Фиг. 4 и пример функциональной конфигурации устройства приема аудиосигнала показан на Фиг. 5. Пример процедуры устройства передачи аудиосигнала показан на Фиг. 6 и пример процедуры устройства приема аудиосигнала показан на Фиг. 7.
[0065] <Сторона передачи>
В устройстве передачи аудиосигнала входной аудиосигнал отправляется в блок 111 кодирования аудио.
[0066] Блок 111 кодирования аудио кодирует кадр, который должен быть закодирован, посредством кодирования с CELP (этап 131 на Фиг. 6). Для получения более подробной информации о кодировании с CELP, в качестве примера используется способ, описанный в непатентной литературе 3. Подробности процедуры кодирования с CELP пропущены. Следует отметить, что при кодировании с CELP локальное декодирование выполняется на стороне кодирования. Локальное декодирование предназначено для декодирования аудиокода также на стороне кодирования и получения параметров (параметра ISP и соответствующего параметра ISF, запаздывания основного тона, параметра долгосрочного предсказания, адаптивной кодовой книги, усиления адаптивной кодовой книги, усиления фиксированной кодовой книги, вектора фиксированной кодовой книги и так далее), требуемых для синтеза аудио. Параметры, получаемые локальным декодированием, включают в себя: по меньшей мере один или оба из параметра ISP и параметра ISF, запаздывание основного тона и адаптивную кодовую книгу, которые отправляются в блок 112 кодирования побочной информации. В случае, когда кодирование аудио, описанное в непатентной литературе 4, используется в блоке 111 кодирования аудио, индекс, представляющий характеристики кадра, который должен быть закодирован, также может быть отправлен в блок 112 кодирования побочной информации. В вариантах осуществления, кодирование, отличное от кодирования с CELP, может быть использовано в блоке 111 кодирования аудио. В вариантах осуществления с использованием другого кодирования, по меньшей мере один или оба из параметра ISP и параметра ISF, запаздывание основного тона и адаптивная кодовая книга могут быть отдельно вычислены из входного сигнала или декодированного сигнала, полученного локальным декодированием, и отправлены в блок 112 кодирования побочной информации.
[0067] Блок 112 кодирования побочной информации вычисляет код побочной информации с использованием параметров, вычисленных блоком 111 кодирования аудио, и прогнозного сигнала (этап 132 на Фиг. 6). Как показано в пример с Фиг. 8, блок 112 кодирования побочной информации включает в себя блок 151 вычисления коэффициента LP, блок 152 вычисления целевого сигнала, блок 153 вычисления запаздывания основного тона, блок 154 вычисления адаптивной кодовой книги, блок 155 синтеза вектора возбуждения, буфер 156 адаптивных кодовых книг, фильтр 157 синтеза и блок 158 кодирования запаздывания основного тона. Примерная процедура в блоке кодирования побочной информации показана на Фиг. 9.
[0068] Блок 151 вычисления коэффициента LP вычисляет коэффициент LP с использованием параметра ISF, вычисляемого блоком 111 кодирования аудио, и параметра ISF, вычисляемого в прошлых нескольких кадрах (этап 161 на Фиг. 9). Процедура блока 151 вычисления коэффициента LP показана на Фиг. 10.
[0069] Сначала, буфер обновляется с использованием параметра ISF, получаемого из блока 111 кодирования аудио (этап 171 на Фиг. 10). Затем вычисляется параметр ISF
Figure 00000002
в прогнозном сигнале. Параметр ISF
Figure 00000002
вычисляется следующим уравнением (этап 172 на Фиг. 10).
Figure 00000003
где
Figure 00000004
является параметром ISF, сохраненным в буфере, который предназначен для кадра, которому предшествует j-число кадров. Дополнительно
Figure 00000005
является параметром ISF во время периода речи, который вычисляется заранее посредством обучения или подобным. β является константой и может быть значением, например, таким как 0,75, хотя не ограничивается им. Дополнительно α также является константой и может быть значением, например, таким как 0,9, хотя не ограничивается им.
Figure 00000005
, α и β могут меняться посредством индекса, представляющего характеристики кадра, который должен быть закодирован, как при маскировании ISF, описанном, например, в непатентной литературе 4.
[0070] В дополнение, значения i расположены так, что
Figure 00000002
удовлетворяет
Figure 00000006
, и значения
Figure 00000002
могут быть скорректированы так, чтобы смежное
Figure 00000002
не располагалось слишком близко. В качестве процедуры для корректировки значения
Figure 00000002
, может быть использована, например, непатентная литература 4 (уравнение 151) (этап 173 на Фиг. 10).
[0071] После этого, параметр ISF
Figure 00000002
преобразуется в параметр ISP и интерполяция может быть выполнена для каждого подкадра. В качестве способа вычисления параметра ISP из параметра ISF может быть использован способ, описанный в разделе 6.4.4 в непатентной литературе 4, и в качестве способа интерполяции может быть использована процедура, описанная в разделе 6.8.3 в непатентной литературе 4 (этап 174 на Фиг. 10).
[0072] Затем параметр ISP для каждого подкадра преобразуется в коэффициент LP
Figure 00000007
. Число подкадров, содержащихся в прогнозном сигнале, равно
Figure 00000008
Для преобразования из параметра ISP в коэффициент LP может быть использована процедура, описанная в разделе 6.4.5 в непатентной литературе 4 (этап 175 на Фиг. 10).
[0073] Блок 152 вычисления целевого сигнала вычисляет целевой сигнал x(n) и импульсную характеристику h(n) посредством использования коэффициента LP
Figure 00000009
(этап 162 на Фиг. 9). Как описано в разделе 6.8.4.1.3 в непатентной литературе 4, целевой сигнал получается посредством применения перцептивного взвешивающего фильтра к остаточному сигналу линейного предсказания (Фиг. 11).
[0074] Сначала остаточный сигнал r(n) из прогнозного сигнала
Figure 00000010
вычисляется с использованием коэффициента LP согласно следующему уравнению (этап 181 на Фиг. 11).
Figure 00000011
[0075] Следует отметить, что
Figure 00000012
указывает число отсчетов подкадра, и L указывает число отсчетов кадра, который должен быть закодирован
Figure 00000013
. Затем удовлетворяется
Figure 00000014
.
[0076] В дополнение, целевой сигнал
Figure 00000015
вычисляется следующими уравнениями (этап 182 на Фиг. 11).
Figure 00000016
Figure 00000017
где перцептивный взвешивающий фильтр ϒ=0,68. Значение перцептивного взвешивающего фильтра может быть некоторым другим значением согласно методике расчета кодирования аудио.
[0077] Затем импульсная характеристика
Figure 00000018
вычисляется следующими уравнениями (этап 183 на Фиг. 11).
Figure 00000019
[0078] Блок 153 вычисления запаздывания основного тона вычисляет запаздывание основного тона для каждого подкадра посредством вычисления k, которое максимизирует следующее уравнение (этап 163 на Фиг. 9). Следует отметить, что для того, чтобы сократить количество вычислений, вышеописанные вычисление целевого сигнала (этап 182 на Фиг. 11) и вычисление импульсной характеристики (этап 183 на Фиг. 11) могут быть пропущены, и остаточный сигнал может быть использован в качестве целевого сигнала.
Figure 00000020
Следует отметить, что
Figure 00000021
получается посредством свертки импульсной характеристики с остатком линейного предсказания. Int(i) указывает интерполяционный фильтр. Детали интерполяционного фильтра являются такими, как описаны в разделе 6.8.4.1.4.1 в непатентной литературе 4. Как само собой разумеющееся
Figure 00000022
может быть применено без использования интерполяционного фильтра.
[0079] Несмотря на то, что запаздывание основного тона может быть вычислено как целое число вышеописанным способом вычисления, точность запаздывания основного тона может быть увеличена до точности после десятичной запятой посредством интерполяции вышеуказанного Tk.
Для подробностей процедуры для вычисления запаздывания основного тона после десятичной запятой посредством интерполяции, может быть использован способ обработки, описанный в разделе 6.8.4.1.4.1 в непатентной литературе 4.
[0080] Блок 154 вычисления адаптивной кодовой книги вычисляет вектор
Figure 00000023
адаптивной кодовой книги и параметр долгосрочного предсказания из запаздывания Tp основного тона и адаптивной кодовой книги u(n), сохраненной в буфере 156 адаптивных кодовых книг, согласно следующему уравнению (этап 164 на Фиг. 9).
Figure 00000024
Для подробностей процедуры для вычисления долгосрочного параметра может быть использован способ, описанный в разделе 5.7 в непатентной литературе 3.
[0081] Блок 155 синтеза вектора возбуждения умножает вектор
Figure 00000023
адаптивной кодовой книги на некоторое предопределенное усиление
Figure 00000025
адаптивной кодовой книги и выводит вектор сигнала возбуждения согласно следующему уравнению (этап 165 на Фиг. 9).
Figure 00000026
Несмотря на то, что значение усиления
Figure 00000027
адаптивной кодовой книги может быть 1,0 или подобным, например, может быть использовано значение, заранее полученное обучением, или оно может быть изменено индексом, представляющим характеристики кадра, который должен быть закодирован.
[0082] Затем состояние адаптивной кодовой книги u(n), сохраненной в буфере 156 адаптивных кодовых книг, обновляется посредством вектора сигнала возбуждения согласно следующим уравнениям (этап 166 на Фиг. 9).
Figure 00000028
[0083] Фильтр 157 синтеза синтезирует декодированный сигнал согласно следующему уравнению посредством обратной фильтрации линейного предсказания с использованием вектора сигнала возбуждения в качестве источника возбуждения (этап 167 на Фиг. 9).
Figure 00000029
[0084] Вышеописанные этапы с 162 по 167 на Фиг. 9 повторяются для каждого подкадра до конца прогнозного сигнала (этап 168 на Фиг. 9).
[0085] Блок 158 кодирования запаздывания основного тона кодирует запаздывание
Figure 00000030
основного тона, которое вычисляется в прогнозном сигнале (этап 169 на Фиг. 9). Число подкадров, содержащихся в прогнозном сигнале, равно
Figure 00000031
.
[0086] Кодирование может быть выполнено способом, например, таким как один из следующих способов, хотя любой способ может быть использован для кодирования.
1. Способ, который выполняет двоичное кодирование, скалярное квантование, векторное квантование или арифметическое кодирование над частью или всем запаздыванием
Figure 00000030
основного тона и передает результат.
2. Способ, который выполняет двоичное кодирование, скалярное квантование, векторное квантование или арифметическое кодирование над частью или всей разностью
Figure 00000032
из запаздывания основного тона предыдущего подкадра и передает результат, где
Figure 00000033
является запаздыванием основного тона последнего подкадра в кадре, который должен быть закодирован.
3. Способ, который выполняет векторное квантование или арифметическое кодирование либо над частью, либо над всем запаздыванием
Figure 00000030
основного тона, и частью или всем запаздыванием основного тона, вычисленным для кадра, который должен быть закодирован, и передает результат.
4. Способ, который выбирает один из некоторого числа предопределенных способов интерполяции на основе части или всего запаздывания
Figure 00000030
основного тона и передает индекс, указывающий выбранный способ интерполяции. В это время запаздывание основного тона множества подкадров, используемых для синтеза аудио в прошлом, также может быть использовано для выбора способа интерполяции.
[0087] Для скалярного квантования и векторного квантования может быть использована кодовая книга, определяемая эмпирически, или кодовая книга, вычисляемая заранее посредством обучения. Дополнительно, способ, который выполняет кодирование после добавления значения смещения к вышеуказанному запаздыванию основного тона, также может быть включен в объем варианта осуществления настоящего изобретения как само собой разумеющееся.
[0088] <Сторона декодирования>
Как показано на Фиг. 5, пример устройства приема аудиосигнала включает в себя буфер 121 аудиокода, блок 122 декодирования аудиопараметров, блок 123 обработки отсутствующих аудиопараметров, блок 124 синтеза аудио, блок 125 декодирования побочной информации и блок 126 сбора побочной информации. Процедура устройства приема аудиосигнала является такой, как показана в примере с Фиг. 7.
[0089] Буфер 121 аудиокода определяет, принят ли пакет корректно или нет. Когда буфер 121 аудиокода определяет, что пакет принят корректно, обработка переключается на блок 122 декодирования аудиопараметров и блок 125 декодирования побочной информации. С другой стороны, когда буфер 121 аудиокода определяет, что пакет принят некорректно, обработка переключается на блок 123 обработки отсутствующих аудиопараметров (этап 141 на Фиг. 7).
[0090] <Когда пакет принят корректно>
Блок 122 декодирования аудиопараметров декодирует принятый аудиокод и вычисляет аудиопараметры, требуемые для синтезирования аудио для кадра, который должен быть закодирован (параметр ISP и соответствующий параметр ISF, запаздывание основного тона, параметр долгосрочного предсказания, адаптивную кодовую книгу, усиление адаптивной кодовой книги, усиление фиксированной кодовой книги, вектор фиксированной кодовой книги и так далее) (этап 142 на Фиг. 7).
[0091] Блок 125 декодирования побочной информации декодирует код побочной информации, вычисляет запаздывание
Figure 00000034
основного тона и сохраняет его в блоке 126 сбора побочной информации. Блок 125 декодирования побочной информации декодирует код побочной информации посредством использования способа декодирования, соответствующего способу кодирования, используемому на стороне кодирования (этап 143 на Фиг. 7).
[0092] Блок 124 синтеза аудио синтезирует аудиосигнал, соответствующий кадру, который должен быть закодирован, на основе параметров, выводимых из блока 122 декодирования аудиопараметров (этап 144 на Фиг. 7). Пример функциональной конфигурации блока 124 синтеза аудио показан на Фиг. 15 и примерная процедура блока 124 синтеза аудио показана на Фиг. 16. Следует отметить, что хотя блок 123 обработки отсутствующих аудиопараметров проиллюстрирован показывающим поток сигнала, блок 123 обработки отсутствующих аудиопараметров не включен в функциональную конфигурацию блока 124 синтеза аудио.
[0093] Блок 1121 вычисления коэффициента LP преобразует параметр ISF в параметр ISP и затем выполняет интерполяционную обработку и посредством этого получает коэффициент ISP для каждого подкадра. Блок 1121 вычисления коэффициента LP затем преобразует коэффициент ISP в коэффициент линейного предсказания (коэффициент LP) и посредством этого получает коэффициент LP для каждого подкадра (этап 11301 на Фиг. 16). Для интерполяции коэффициента ISP и коэффициента ISP-LP может быть использован способ, описанный, например, в разделе 6.4.5 в непатентной литературе 4. Процедура преобразования параметра не является существенной частью варианта осуществления настоящего изобретения и таким образом не описывается подробно.
[0094] Блок 1123 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги посредством использования запаздывания основного тона, параметра долгосрочного предсказания и адаптивной кодовой книги 1122 (этап 11302 на Фиг. 16). Вектор
Figure 00000035
адаптивной кодовой книги вычисляется из запаздывания
Figure 00000036
основного тона и адаптивной кодовой книги u(n) согласно следующему уравнению.
Figure 00000037
Вектор адаптивной кодовой книги вычисляется посредством интерполирования адаптивной кодовой книги u(n) с использованием фильтра FIR Int(i). Длина адаптивной кодовой книги равна
Figure 00000038
. Фильтр Int(i), который используется для интерполирования, является таким же, как интерполяционный фильтр из
Figure 00000039
Он является фильтром FIR с некоторой предопределенной длиной 2l+1.
Figure 00000040
является числом отсчетов подкадра. Нет необходимости использовать фильтр для интерполирования, несмотря на то, что на стороне кодера фильтр используется для интерполирования.
[0095] Блок 1123 вычисления адаптивной кодовой книги осуществляет фильтрацию в отношении вектора адаптивной кодовой книги согласно значению параметра долгосрочного предсказания (этап 11303 на Фиг. 16). Когда параметр долгосрочного предсказания имеет значение, указывающее активирование фильтрации, фильтрация выполняется в отношении вектора адаптивной кодовой книги посредством следующего уравнения.
v`(n)=0,18v`(n-1)+0,64v`(n)+0,18v`(n+1) Уравнение 21
[0096] С другой стороны, когда параметр долгосрочного предсказания имеет значение, указывающее, что отсутствует необходимость в фильтрации, фильтрация не выполняется и устанавливается
Figure 00000041
.
[0097] Блок 1124 синтеза вектора возбуждения умножает вектор адаптивной кодовой книги на усиление
Figure 00000042
адаптивной кодовой книги (этап 11304 на Фиг. 16). Дополнительно, блок 1124 синтеза вектора возбуждения умножает вектор c(n) фиксированной кодовой книги на усиление
Figure 00000043
фиксированной кодовой книги (этап 11305 на Фиг. 16). Кроме того, блок 1124 синтеза вектора возбуждения складывает вместе вектор адаптивной кодовой книги и вектор фиксированной кодовой книги и выводит вектор сигнала возбуждения (этап 11306 на Фиг. 16).
Figure 00000044
[0098] Постфильтр 1125 выполняет постобработку, такую как улучшение основного тона, устранение шума и улучшение низких частот, например, над вектором сигнала возбуждения. Подробности способов, таких как улучшение основного тона, устранение шума и улучшение низких частот описаны в разделе 6.1 в непатентной литературе 3. Обработка в постфильтре не связана в значительной степени с существенной частью варианта осуществления настоящего изобретения и таким образом не описывается подробно (этап 11307 на Фиг. 16).
[0099] Адаптивная кодовая книга 1122 обновляет состояние посредством вектора сигнала возбуждения согласно следующим уравнениям (этап 11308 на Фиг. 16).
Figure 00000045
[0100] Фильтр 1126 синтеза синтезирует декодированный сигнал согласно следующему уравнению посредством обратной фильтрации линейного предсказания с использованием вектора сигнала возбуждения в качестве источника возбуждения (этап 11309 на Фиг. 16).
Figure 00000046
[0101] Перцептивный обратный взвешивающий фильтр 1127 применяет перцептивный обратный взвешивающий фильтр к декодированному сигналу согласно следующему уравнению (этап 11310 на Фиг. 16).
Figure 00000047
Значение β типично равно 0,68 или подобному, хотя не ограничивается этим значением.
[0102] Блок 123 обработки отсутствующих аудиопараметров сохраняет аудиопараметры (параметр ISF, запаздывание основного тона, усиление адаптивной кодовой книги, усиление фиксированной кодовой книги), используемые в блоке 124 синтеза аудио в буфер (этап 145 на Фиг. 7).
[0103] <Когда обнаружена потеря пакета>
Блок 123 обработки отсутствующих аудиопараметров считывает запаздывание
Figure 00000048
основного тона из блока 126 сбора побочной информации и предсказывает аудиопараметры. Пример функциональной конфигурации блока 123 обработки отсутствующих аудиопараметров показан в примере с Фиг. 12 и примерная процедура предсказания аудиопараметров показана на Фиг. 13.
[0104] Блок 191 предсказания ISF вычисляет параметр ISF с использованием параметра ISF для предыдущего кадра и параметра ISF, вычисляемого для прошлых нескольких кадров (этап 1101 на Фиг. 13). Процедура блока 191 предсказания ISF показана на Фиг. 10.
[0105] Сначала буфер обновляется с использованием параметра ISF из непосредственно предшествующего кадра (этап 171 на Фиг. 10). Далее параметр ISF
Figure 00000049
вычисляется согласно следующему уравнению (этап 172 на Фиг. 10).
Figure 00000050
где
Figure 00000051
является параметром ISF, сохраненным в буфере, который предназначен для кадра, которому предшествует j-число кадров. Дополнительно
Figure 00000052
, α и β являются такими же значениями, как значения, используемые на стороне кодирования.
[0106] В дополнение значения i расположены так, что
Figure 00000053
удовлетворяет
Figure 00000054
и значения
Figure 00000053
скорректированы так, чтобы смежное
Figure 00000053
не располагалось слишком близко. В качестве примерной процедуры для корректировки значения
Figure 00000053
может быть использована непатентная литература 4 (уравнение 151) (этап 173 на Фиг. 10).
[0107] Блок 192 предсказания запаздывания основного тона декодирует код побочной информации из блока 126 сбора побочной информации и посредством этого получает запаздывание
Figure 00000055
основного тона. Дополнительно посредством использования запаздывания
Figure 00000056
основного тона, использованного для прошлого декодирования, блок 192 предсказания запаздывания основного тона выводит запаздывание
Figure 00000057
основного тона. Число подкадров, содержащихся в одном кадре, равно M и число запаздываний основного тона, содержащихся в побочной информации, равно
Figure 00000058
. Для предсказания запаздывания
Figure 00000057
основного тона может быть использована процедура, описанная, например, в разделе 7.11.1.3 в непатентной литературе 4 (этап 1102 на Фиг. 13).
[0108] Блок 193 предсказания усиления адаптивной кодовой книги выводит усиление
Figure 00000059
адаптивной кодовой книги посредством использования некоторого предопределенного усиления
Figure 00000060
адаптивной кодовой книги и усиления
Figure 00000061
адаптивной кодовой книги, использованного при прошлом декодировании. Число подкадров, содержащихся в одном кадре, равно M и число запаздываний основного тона, содержащихся в побочной информации, равно
Figure 00000058
. Для предсказания усиления
Figure 00000062
адаптивной кодовой книги может быть использована процедура, описанная, например, в разделе 7.11.2.5.3 в непатентной литературе 4 (этап 1103 на Фиг. 13).
[0109] Блок 194 предсказания усиления фиксированной кодовой книги выводит усиление
Figure 00000063
фиксированной кодовой книги посредством использования усиления
Figure 00000064
фиксированной кодовой книги, использованного при прошлом декодировании. Число подкадров, содержащихся в одном кадре, равно M. Для предсказания усиления
Figure 00000063
фиксированной кодовой книги может быть использована процедура, описанная в разделе 7.11.2.6 в непатентной литературе 4, например (этап 1104 на Фиг. 13).
[0110] Блок 195 генерирования шумовых сигналов выводит вектор шума, такого как белый шум, с длиной L (этап 1105 на Фиг. 13). Длина одного кадра равна L.
[0111] Блок 124 синтеза аудио синтезирует декодированный сигнал на основе аудиопараметров, выведенных из блока 123 обработки отсутствующих аудиопараметров (этап 144 на Фиг. 7). Операция блока 124 синтеза аудио является такой же как операция блока синтеза аудио <Когда аудиопакет принят корректно> и не описывается подробно еще раз (этап 144 на Фиг. 7).
[0112] Блок 123 обработки отсутствующих аудиопараметров сохраняет аудиопараметры (параметр ISF, запаздывание основного тона, усиление адаптивной кодовой книги, усиление фиксированной кодовой книги), используемые в блоке 124 синтеза аудио в буфер (этап 145 на Фиг. 7).
[0113] Хотя случай кодирования и передачи побочной информации для всех подкадров, содержащихся в прогнозном сигнале, описывается в вышеуказанном примере, может быть использована конфигурация, которая передает только побочную информацию для некоторого конкретного подкадра.
[0114] [Альтернативный пример 1-1]
В качестве альтернативного примера ранее рассмотренного примера 1, в дальнейшем в этом документе описывается пример, который добавляет усиление основного тона к побочной информации. Различием между альтернативным примером 1-1 и примером 1 является только операция блока 155 синтеза вектора возбуждения и поэтому описание других частей пропущено.
[0115] <Сторона кодирования>
Процедура блока 155 синтеза вектора возбуждения показана в примере с Фиг. 14.
[0116] Усиление
Figure 00000065
адаптивной кодовой книги вычисляется из вектора
Figure 00000066
адаптивной кодовой книги и целевого сигнала x(n), согласно следующему уравнению (этап 1111 на Фиг. 14).
Figure 00000067
где
Figure 00000068
является сигналом
Figure 00000069
, который получается посредством свертки импульсной характеристики с вектором адаптивной кодовой книги.
[0117] Вычисленное усиление адаптивной кодовой книги кодируется и содержится в коде побочной информации (этап 1112 на Фиг. 14). Для кодирования может быть использовано скалярное квантование с использованием кодовой книги, полученной заранее посредством обучения, несмотря на то, что любая другая методика также может быть использована для кодирования.
[0118] Посредством умножения вектора адаптивной кодовой книги на усиление
Figure 00000070
адаптивной кодовой книги, полученное посредством декодирования кода, вычисленного при кодировании усиления адаптивной кодовой книги, вектор возбуждения вычисляется согласно следующему уравнению (этап 1113 на Фиг. 14).
Figure 00000071
[0119] <Сторона декодирования>
Блок 155 синтеза вектора возбуждения умножает вектор
Figure 00000072
адаптивной кодовой книги на усиление
Figure 00000070
адаптивной кодовой книги, полученное посредством декодирования кода побочной информации, и выводит вектор сигнала возбуждения согласно следующему уравнению (этап 165 на Фиг. 9).
Figure 00000073
[0120] [Альтернативный пример 1-2]
В качестве альтернативного примера для примера 1, в дальнейшем в этом документе описывается пример, который добавляет флаг для определения использования побочной информации к побочной информации.
[0121] <Сторона кодирования>
Пример функциональной конфигурации блока кодирования побочной информации показан на Фиг. 17 и процедура блока кодирования побочной информации показана в примере с Фиг. 18. Отличием от примера 1 является только блок 1128 определения вывода побочной информации (этап 1131 на Фиг. 18) и поэтому описание других частей пропущено.
[0122] Блок 1128 определения вывода побочной информации вычисляет сегментное отношение сигнал - шум (SNR) декодированного сигнала и прогнозного сигнала согласно следующему уравнению и только, когда сегментное SNR превышает некоторый порог, устанавливает значение флага на "ВКЛ" и добавляет его к побочной информации.
Figure 00000074
С другой стороны, когда сегментное SNR не превышает порог, блок 1128 определения вывода побочной информации устанавливает значение флага на "ВЫКЛ" и добавляет его к побочной информации (этап 1131 на Фиг. 18). Следует отметить, что количество битов побочной информации может быть сокращено посредством добавления побочной информации, такой как запаздывание основного тона и усиление основного тона, к флагу и передачи добавленной побочной информации только когда значение флага - "ВКЛ", и передачи только значения флага, когда значение флага - "ВЫКЛ".
[0123] <Сторона декодирования>
Блок декодирования побочной информации декодирует флаг, содержащийся в коде побочной информации. Когда значением флага является "ВКЛ", блок обработки отсутствующих аудиопараметров вычисляет декодированный сигнал с помощью процедуры такой же, как в примере 1. С другой стороны, когда значением флага является "ВЫКЛ", он вычисляет декодированный сигнал с помощью технологии маскирования потери пакета без использования побочной информации (этап 1151 на Фиг. 19).
[0124] [Пример 2]
В этом примере также используется декодированное аудио части прогнозного сигнала, когда пакет принят корректно. В целях этого обсуждения, число подкадров, содержащихся в одном кадре, равно M подкадров и длина прогнозного сигнала составляет
Figure 00000075
подкадра (подкадров).
[0125] <Сторона кодирования>
Как показано в примере с Фиг. 20, устройство передачи аудиосигнала включает в себя главный блок 211 кодирования, блок 212 кодирования побочной информации, блок 213 сбора сигналов маскирования и блок 214 кодирования сигнала ошибки. Процедура устройства передачи аудиосигнала показана на Фиг. 22.
[0126] Блок 214 кодирования сигнала ошибки считывает сигнал маскирования для одного подкадра из блока 213 сбора сигналов маскирования, вычитает его из аудиосигнала и посредством этого вычисляет сигнал ошибки (этап 221 на Фиг. 22).
[0127] Блок 214 кодирования сигнала ошибки кодирует сигнал ошибки. В качестве некоторой конкретной примерной процедуры может быть использована AVQ, описанная в разделе 6.8.4.1.5 в непатентной литературе 4. При кодировании сигнала ошибки выполняется локальное декодирование и выводится декодированный сигнал ошибки (этап 222 на Фиг. 22).
[0128] Посредством добавления декодированного сигнала ошибки к сигналу маскирования, выводится декодированный сигнал для одного подкадра (этап 223 на Фиг. 22).
[0129] Вышеуказанные этапы с 221 по 223 повторяются для
Figure 00000075
подкадров до конца сигнал маскирования.
[0130] Примерная функциональная конфигурация главного блока 211 кодирования показана на Фиг. 21. Главный блок 211 кодирования включает в себя блок 2011 кодирования ISF, блок 2012 вычисления целевого сигнала, блок 2013 вычисления запаздывания основного тона, блок 2014 вычисления адаптивной кодовой книги, блок 2015 вычисления фиксированной кодовой книги, блок 2016 вычисления усиления, блок 2017 вычисления вектора возбуждения, фильтр 2018 синтеза и буфер 2019 адаптивных кодовых книг.
[0131] Блок 2011 кодирования ISF получает коэффициент LP посредством применения способа Левинсона-Дарбина к кадру, который должен быть закодирован, и прогнозному сигналу. Блок 2011 кодирования ISF затем преобразует коэффициент LP в параметр ISF и кодирует параметр ISF. Блок 2011 кодирования ISF затем декодирует код и получает декодированный параметр ISF. В конечном счете, блок 2011 кодирования ISF интерполирует декодированный параметр ISF и получает декодированный коэффициент LP для каждого подкадра. Процедуры способа Левинсона-Дарбина и преобразование из коэффициента LP в параметр ISF являются такими же, как в примере 1. Дополнительно, для кодирования параметра ISF может быть использована процедура, описанная, например, в разделе 6.8.2 в непатентной литературе 4. Индекс, полученный посредством кодирования параметра ISF, декодированного параметра ISF и декодированного коэффициента LP (который получается посредством преобразования декодированного параметра ISF в коэффициент LP) может быть получен блоком 2011 кодирования ISF (этап 224 на Фиг. 22).
[0132] Подробная процедура блока 2012 вычисления целевого сигнала является такой же, как на этапе 162 на Фиг. 9 в примере 1 (этап 225 на Фиг. 22).
[0133] Блок 2013 вычисления запаздывания основного тона относится к буферу адаптивной кодовой книги и вычисляет запаздывание основного тона и параметр долгосрочного предсказания посредством использования целевого сигнала. Подробная процедура вычисления запаздывания основного тона и параметра долгосрочного предсказания является такой же, как в примере 1 (этап 226 на Фиг. 22).
[0134] Блок 2014 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги посредством использования запаздывания основного тона и параметра долгосрочного предсказания, вычисляемого блоком 2013 вычисления запаздывания основного тона. Подробная процедура блока 2014 вычисления адаптивной кодовой книги является такой же, как в примере 1 (этап 227 на Фиг. 22).
[0135] Блок 2015 вычисления фиксированной кодовой книги вычисляет вектор фиксированной кодовой книги и индекс, получаемый посредством кодирования вектора фиксированной кодовой книги, посредством использования целевого сигнала и вектора адаптивной кодовой книги. Подробная процедура является такой же, как процедура AVQ, используемая в блоке 214 кодирования сигнала ошибки (этап 228 на Фиг. 22).
[0136] Блок 2016 вычисления усиления вычисляет усиление адаптивной кодовой книги, усиление фиксированной кодовой книги и индекс, получаемый посредством кодирования этих двух усилений с использованием целевого сигнала, вектора адаптивной кодовой книги и вектора фиксированной кодовой книги. Подробная процедура, которая может быть использована, описана, например, в разделе 6.8.4.1.6 в непатентной литературе 4 (этап 229 на Фиг. 22).
[0137] Блок 2017 вычисления вектора возбуждения вычисляет вектор возбуждения посредством сложения вектора адаптивной кодовой книги и вектора фиксированной кодовой книги, к которым применяется усиление. Подробная процедура является такой же, как в примере 1. Затем, блок 2017 вычисления вектора возбуждения обновляет состояние буфера 2019 адаптивных кодовых книг посредством использования вектора возбуждения. Подробная процедура является такой же, как в примере 1 (этап 2210 на Фиг. 22).
[0138] Фильтр 2018 синтеза синтезирует декодированный сигнал посредством использования декодированного коэффициента LP и вектора возбуждения (этап 2211 на Фиг. 22).
[0139] Вышеуказанные этапы с 224 по 2211 повторяются для подкадров
Figure 00000076
до конца кадра, который должен быть закодирован.
[0140] Блок 212 кодирования побочной информации вычисляет побочную информацию для подкадра
Figure 00000075
прогнозного сигнала. Конкретная процедура является такой же, как в примере 1 (этап 2212 на Фиг. 22).
[0141] В дополнение к процедуре из примера 1, декодированный сигнал, выводимый фильтром 157 синтеза блока 212 кодирования побочной информации собирается в блоке 213 сбора сигналов маскирования в примере 2 (этап 2213 на Фиг. 22).
[0142] <Блок декодирования>
Как показано на Фиг. 23, пример устройства приема аудиосигнала включает в себя буфер 231 аудиокода, блок 232 декодирования аудиопараметров, блок 233 обработки отсутствующих аудиопараметров, блок 234 синтеза аудио, блок 235 декодирования побочной информации, блок 236 сбора побочной информации, блок 237 декодирования сигнала ошибки и блок 238 сбора сигналов маскирования. Примерная процедура устройства приема аудиосигнала показана на Фиг. 24. Примерная функциональная конфигурация блока 234 синтеза аудио показана на Фиг. 25.
[0143] Буфер 231 аудиокода определяет, принят ли пакет корректно или нет. Когда буфер 231 аудиокода определяет, что пакет принят корректно, обработка переключается на блок 232 декодирования аудиопараметров, блок 235 декодирования побочной информации и блок 237 декодирования сигнала ошибки. С другой стороны, когда буфер 231 аудиокода определяет, что пакет принят некорректно, обработка переключается на блок 233 обработки отсутствующих аудиопараметров (этап 241 на Фиг. 24).
[0144] <Когда пакет принят корректно>
Блок 237 декодирования сигнала ошибки декодирует код сигнала ошибки и получает декодированный сигнал ошибки. В качестве конкретной примерной процедуры, может быть использован способ декодирования, соответствующий способу, используемому на стороне кодирования, такому как AVQ, описанному в разделе 7.1.2.1.2 в непатентной литературе 4 (этап 242 на Фиг. 24).
[0145] Блок 2318 синтеза прогнозного вектора возбуждения считывает сигнал маскирования для одного подкадра из блока 238 сбора сигналов маскирования и добавляет сигнал маскирования к декодированному сигналу ошибки и посредством этого выводит декодированный сигнал для одного подкадра (этап 243 на Фиг. 24).
[0146] Вышеуказанные этапы с 241 по 243 повторяются для подкадров
Figure 00000075
до окончания сигнала маскирования.
[0147] Блок 232 декодирования аудиопараметров включает в себя блок 2211 декодирования ISF, блок 2212 декодирования запаздывания основного тона, блок 2213 декодирования усиления и блок 2214 декодирования фиксированной кодовой книги. Пример функциональной конфигурации блока 232 декодирования аудиопараметров показан на Фиг. 26.
[0148] Блок 2211 декодирования ISF декодирует код ISF и преобразует его в коэффициент LP и посредством этого получает декодированный коэффициент LP. Например, используется процедура, описанная в разделе 7.1.1 в непатентной литературе 4 (этап 244 на Фиг. 24).
[0149] Блок 2212 декодирования запаздывания основного тона декодирует код запаздывания основного тона и получает запаздывание основного тона и параметр долгосрочного предсказания (этап 245 на Фиг. 24).
[0150] Блок 2213 декодирования усиления декодирует код усиления и получает усиление адаптивной кодовой книги и усиление фиксированной кодовой книги. Примерная подробная процедура описана в разделе 7.1.2.1.3 в непатентной литературе 4 (этап 246 на Фиг. 24).
[0151] Блок 2313 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги посредством использования запаздывания основного тона и параметра долгосрочного предсказания. Подробная процедура блока 2313 вычисления адаптивной кодовой книги описана в примере 1 (этап 247 на Фиг. 24).
[0152] Блок 2214 декодирования фиксированной кодовой книги декодирует код фиксированной кодовой книги и вычисляет вектор фиксированной кодовой книги. Подробная процедура описана в разделе 7.1.2.1.2 в непатентной литературе 4 (этап 248 на Фиг. 24).
[0153] Блок 2314 синтеза вектора возбуждения вычисляет вектор возбуждения посредством сложения вектора адаптивной кодовой книги и вектора фиксированной кодовой книги, к которым применяется усиление. Дополнительно, блок вычисления вектора возбуждения обновляет буфер адаптивных кодовых книг посредством использования вектора возбуждения (этап 249 на Фиг. 24). Подробная процедура является такой же, как в примере 1.
[0154] Фильтр 2316 синтеза синтезирует декодированный сигнал посредством использования декодированного коэффициента LP и вектора возбуждения (этап 2410 на Фиг. 24). Подробная процедура является такой же, как в примере 1.
[0155] Вышеуказанные этапы с 244 по 2410 повторяются для подкадров
Figure 00000076
до конца кадра, который должен быть закодирован.
[0156] Функциональная конфигурация блока 235 декодирования побочной информации является такой же, как в примере 1. Блок 235 декодирования побочной информации декодирует код побочной информации и вычисляет запаздывание основного тона (этап 2411 на Фиг. 24).
[0157] Функциональная конфигурация блока 233 обработки отсутствующих аудиопараметров является такой же, как в примере 1.
Блок 191 предсказания ISF предсказывает параметр ISF с использованием параметра ISF для предыдущего кадра и преобразует предсказанный параметр ISF в коэффициент LP. Процедура является такой же, как на этапах 172, 173, и 174 примера 1, показанного на Фиг. 10 (этап 2412 на Фиг. 24).
[0158] Блок 2313 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги посредством использования запаздывания основного тона, выводимого из блока 235 декодирования побочной информации, и адаптивной кодовой книги 2312 (этап 2413 на Фиг. 24). Процедура является такой же, как на этапах 11301 и 11302 на Фиг. 16.
[0159] Блок 193 предсказания усиления адаптивной кодовой книги выводит усиление адаптивной кодовой книги. Конкретная процедура является такой же, как на этапе 1103 на Фиг. 13 (этап 2414 на Фиг. 24).
[0160] Блок 194 предсказания усиления фиксированной кодовой книги выводит усиление фиксированной кодовой книги. Конкретная процедура является такой же, как на этапе 1104 на Фиг. 13 (этап 2415 на Фиг. 24).
[0161] Блок 195 генерирования шумовых сигналов выводит шум, такой как белый шум, в качестве вектора фиксированной кодовой книги. Процедура является такой же, как на этапе 1105 на Фиг. 13 (этап 2416 на Фиг. 24).
[0162] Блок 2314 синтеза вектора возбуждения применяет усиление к каждому из вектора адаптивной кодовой книги и вектора фиксированной кодовой книги и складывает их вместе и посредством этого вычисляет вектор возбуждения. Дополнительно, блок 2314 синтеза вектора возбуждения обновляет буфер адаптивных кодовых книг с использованием вектора возбуждения (этап 2417 на Фиг. 24).
[0163] Фильтр 2316 синтеза вычисляет декодированный сигнал с использованием вышеописанного коэффициента LP и вектора возбуждения. Фильтр 2316 синтеза затем обновляет блок 238 сбора сигналов маскирования с использованием вычисленного декодированного сигнала (этап 2418 на Фиг. 24).
[0164] Вышеуказанные этапы повторяются для подкадров
Figure 00000075
и декодированный сигнал выводится в качестве аудиосигнала.
[0165] <Когда пакет потерян>
Сигнал маскирования для одного подкадра считывается из блока сбора сигналов маскирования и используется в качестве декодированного сигнала (этап 2419 на Фиг. 24).
[0166] Вышеуказанное повторяется для подкадров
Figure 00000075
.
[0167] Блок 191 предсказания ISF предсказывает параметр ISF (этап 2420 на Фиг. 24). В качестве процедуры может быть использован этап 1101 на Фиг. 13.
[0168] Блок 192 предсказания запаздывания основного тона выводит предсказанное запаздывание основного тона посредством использования запаздывания основного тона, используемого при прошлом декодировании (этап 2421 на Фиг. 24). Процедура, используемая для предсказания, является такой же, как на этапе 1102 на Фиг. 13.
[0169] Операции блока 193 предсказания усиления адаптивной кодовой книги, блока 194 предсказания усиления фиксированной кодовой книги, блока 195 генерирования шумовых сигналов и блока 234 синтеза аудио являются такими же, как в примере 1 (этап 2422 на Фиг. 24).
[0170] Вышеуказанные этапы повторяются для подкадров M и декодированный сигнал для подкадров
Figure 00000076
выводится в качестве аудиосигнала, и блок 238 сбора сигналов маскирования обновляется декодированным сигналом для оставшихся подкадров
Figure 00000075
.
[0171] [Пример 3]
В дальнейшем в этом документе описывается случай с использованием гортанной импульсной синхронизации при вычислении вектора адаптивной кодовой книги.
[0172] <Сторона кодирования>
Функциональная конфигурация устройства передачи аудиосигнала является такой же, как в примере 1. Функциональная конфигурация и процедура различаются только в блоке кодирования побочной информации и поэтому ниже по тексту описывается только операция блока кодирования побочной информации.
[0173] Блок кодирования побочной информации включает в себя блок 311 вычисления коэффициента LP, блок 312 предсказания запаздывания основного тона, блок 313 выбора запаздывания основного тона, блок 314 кодирования запаздывания основного тона и буфер 315 адаптивной кодовой книги. Пример функциональной конфигурации блока кодирования побочной информации показан на Фиг. 27 и примерная процедура блока кодирования побочной информации показана в примере с Фиг. 28.
[0174] Блок 311 вычисления коэффициента LP является таким же, как блок вычисления коэффициента LP в примере 1 и таким образом не будет описываться еще раз (этап 321 на Фиг. 28).
[0175] Блок 312 предсказания запаздывания основного тона вычисляет предсказанное значение
Figure 00000077
запаздывания основного тона с использованием запаздывания основного тона, полученного из блока кодирования аудио (этап 322 на Фиг. 28). Конкретная обработка предсказания является такой же, как предсказание запаздывания
Figure 00000078
основного тона в блоке 192 предсказания запаздывания основного тона в примере 1 (которое является таким же, как на этапе 1102 на Фиг. 13).
[0176] Затем блок 313 выбора запаздывания основного тона определяет запаздывание основного тона, которое должно быть передано, в качестве побочной информации (этап 323 на Фиг. 28). Подробная процедура блока 313 выбора запаздывания основного тона показана в примере с Фиг. 29.
[0177] Сначала, кодовая книга запаздываний основного тона генерируется из предсказанного значения
Figure 00000077
запаздывания основного тона и значения прошлого запаздывания
Figure 00000079
основного тона согласно следующим уравнениям (этап 331 на Фиг. 29).
Figure 00000080
Значение запаздывания основного тона на один подкадр раньше равно
Figure 00000081
. Дополнительно, число индексов кодовой книги равно I.
Figure 00000082
является некоторой предопределенной дискретой и ρ является некоторой предопределенной константой.
[0178] Затем, посредством использования адаптивной кодовой книги и предсказанного значения
Figure 00000077
запаздывания основного тона, исходный вектор
Figure 00000083
возбуждения генерируется согласно следующему уравнению (этап 332 на Фиг. 29).
Figure 00000084
Процедура вычисления исходного вектора возбуждения является такой же, как уравнения (607) и (608) в непатентной литературе 4.
[0179] Затем, гортанная импульсная синхронизация применяется к исходному вектору возбуждения посредством использования всех потенциальных запаздываний
Figure 00000085
основного тона в кодовой книги запаздываний основного тона, чтобы посредством этого сгенерировать потенциальный вектор
Figure 00000086
адаптивной кодовой книги (этап 333 на Фиг. 29). Для гортанной импульсной синхронизации может быть использована такая же процедура, как в случае, описанном в разделе 7.11.2.5 в непатентной литературе 4, где положение импульса не является доступным. Следует отметить, однако, что u(n) в непатентной литературе 4 соответствует
Figure 00000087
в варианте осуществления настоящего изобретения, и экстраполированный основной тон соответствует
Figure 00000088
в варианте осуществления настоящего изобретения, и последний достоверный основной тон (
Figure 00000089
) соответствует
Figure 00000090
в варианте осуществления настоящего изобретения.
[0180] Для потенциального вектора
Figure 00000091
адаптивной кодовой книги вычисляется шкала оценок (этап 334 на Фиг. 29). В случае использования сегментного SNR в качестве шкалы оценок, сигнал синтезируется посредством обратной фильтрации с использованием коэффициента LP и сегментное SNR вычисляется с входным сигналом согласно следующему уравнению.
Figure 00000092
[0181] Вместо выполнения обратной фильтрации сегментное SNR может быть вычислено в области вектора адаптивной кодовой книги посредством использования остаточного сигнала согласно следующему уравнению
Figure 00000093
В этом случае остаточный сигнал r(n) из прогнозного сигнала
Figure 00000094
вычисляется посредством использования коэффициента LP (этап 181 на Фиг. 11).
[0182] Выбирается индекс, соответствующий наибольшей шкале оценок, вычисленной на этапе 334, и вычисляется запаздывание основного тона, соответствующее индексу (этап 335 на Фиг. 29).
Figure 00000095
[0183] <Сторона декодирования>
Функциональная конфигурация устройства приема аудиосигнала является такой же, как в примере 1. Отличиями от примера 1 являются функциональная конфигурация и процедура блока 123 обработки отсутствующих аудиопараметров, блока 125 декодирования побочной информации и блока 126 сбора побочной информации, и только они описываются в этом документе ниже по тексту.
[0184] <Когда пакет принят корректно>
Блок 125 декодирования побочной информации декодирует код побочной информации и вычисляет запаздывание
Figure 00000096
основного тона и сохраняет его в блок 126 сбора побочной информации. Примерная процедура блока 125 декодирования побочной информации показана на Фиг. 30.
[0185] При вычислении запаздывания основного тона блок 312 предсказания запаздывания основного тона вычисляет предсказанное значение
Figure 00000077
запаздывания основного тона посредством использования запаздывания основного тона, полученного из блока декодирования аудио (этап 341 на Фиг. 30). Конкретная обработка предсказания является такой же, как на этапе 322 с Фиг. 28 в примере 3.
[0186] Затем кодовая книга запаздываний основного тона генерируется из предсказанного значения
Figure 00000077
запаздывания основного тона и значения прошлого запаздывания
Figure 00000097
основного тона, согласно следующим уравнениям (этап 342 на Фиг. 30).
Figure 00000098
Процедура является такой же, как на этапе 331 на Фиг. 29. Значение запаздывания основного тона на один подкадр раньше равно
Figure 00000099
. Дополнительно, число индексов кодовой книги равно I.
Figure 00000100
является некоторой предопределенной дискретой и ρ является некоторой предопределенной константой.
[0187] Затем, обращаясь к кодовой книге запаздываний основного тона, запаздывание
Figure 00000101
основного тона, соответствующее индексу idx, передаваемому в качестве части побочной информации, вычисляется и сохраняется в блоке 126 сбора побочной информации (этап 343 на Фиг. 30).
[0188] <Когда обнаружена потеря пакета>
Хотя функциональная конфигурация блока синтеза аудио также является такой же, как в примере 1 (который является таким же, как на Фиг. 15), в этом документе ниже по тексту описывается только блок 1123 вычисления адаптивной кодовой книги, который работает отлично от блока в примере 1.
[0189] Блок 123 обработки отсутствующих аудиопараметров считывает запаздывание основного тона из блока 126 сбора побочной информации и вычисляет предсказанное значение запаздывания основного тона согласно следующему уравнению, и использует вычисленное предсказанное значение запаздывания основного тона вместо вывода блока 192 предсказания запаздывания основного тона.
Figure 00000102
где κ является некоторой предопределенной константой.
[0190] Затем, посредством использования адаптивной кодовой книги и предсказанного значения
Figure 00000077
запаздывания основного тона исходный вектор
Figure 00000103
возбуждения генерируется согласно следующему уравнению (этап 332 на Фиг. 29).
Figure 00000104
[0191] Затем гортанная импульсная синхронизация применяется к исходному вектору возбуждения посредством использования запаздывания
Figure 00000101
основного тона, чтобы посредством этого сгенерировать вектор u(n) адаптивной кодовой книги. Для гортанной импульсной синхронизации используется такая же процедура, как на этапе 333 с Фиг. 29.
[0192] В дальнейшем в этом документе описывается программа 70 кодирования аудио, которая побуждает компьютер исполнять вышеописанную обработку устройством передачи аудиосигналов. Как показано на Фиг. 31, программа 70 кодирования аудио хранится в области 61 хранения программ, сформированной на носителе 60 записи, который вставляется в компьютер и доступен компьютеру или включен в его состав.
[0193] Программа 70 кодирования аудио включает в себя модуль 700 кодирования аудио и модуль 701 кодирования побочной информации. Функции, реализуемые посредством исполнения модуля 700 кодирования аудио и модуля 701 кодирования побочной информации являются такими же, как, соответственно, функции блока 111 кодирования аудио и блока 112 кодирования побочной информации в устройстве передачи аудиосигналов, описанном выше по тексту.
[0194] Следует отметить, что часть или вся программа 70 кодирования аудио может быть передана посредством передающей среды, такой как линия связи, принята и сохранена (в том числе будучи установленной) другим устройством. Дополнительно, каждый модуль программы 70 кодирования аудио может быть установлен не на один компьютер, а на любой из множества компьютеров. В этом случае, вышеописанная обработка программы 70 кодирования аудио выполняется компьютерной системой, составленной из упомянутого множества компьютеров.
[0195] В дальнейшем в этом документе описывается программа 90 декодирования аудио, которая побуждает компьютер исполнять вышеописанную обработку устройством приема аудиосигналов. Как показано на Фиг. 32, программа 90 декодирования аудио хранится в области 81 хранения программ, сформированной на носителе 80 записи, который вставляется в компьютер и доступен компьютеру или включен в его состав.
[0196] Программа 90 декодирования аудио включает в себя модуль 900 буфера аудиокода, модуль 901 декодирования аудиопараметров, модуль 902 декодирования побочной информации, модуль 903 сбора побочной информации, модуль 904 обработки отсутствующих аудиопараметров и модуль 905 синтеза аудио. Функции, реализуемые посредством исполнения модуля 900 буфера аудиокода, модуля 901 декодирования аудиопараметров, модуля 902 декодирования побочной информации, модуля 903 сбора побочной информации, модуля 904 обработки отсутствующих аудиопараметров и модуля 905 синтеза аудио являются такими же, как, соответственно, функция буфера 231 аудиокода, блока 232 декодирования аудиопараметров, блока 235 декодирования побочной информации, блока 236 сбора побочной информации, блока 233 обработки отсутствующих аудиопараметров и блока 234 синтеза аудио, описанных выше по тексту.
[0197] Следует отметить, что часть или вся программа 90 декодирования аудио может быть передана посредством передающей среды, такой как линия связи, принята и сохранена (в том числе будучи установленной) другим устройством. Дополнительно, каждый модуль программы 90 декодирования аудио может быть установлен не на один компьютер, а на любой из множества компьютеров. В этом случае, вышеописанная обработка программы 90 декодирования аудио выполняется компьютерной системой, составленной из упомянутого множества компьютеров.
[0198] [Пример 4]
Пример, который использует побочную информацию для предсказания запаздывания основного тона на стороне декодирования, описывается в дальнейшем в этом документе.
[0199] <Сторона кодирования>
Функциональная конфигурация устройства передачи аудиосигнала является такой же, как в примере 1. Функциональная конфигурация и процедура различаются только в блоке 112 кодирования побочной информации, и поэтому в этом документе ниже по тексту описывается только операция блока 112 кодирования побочной информации.
[0200] Функциональная конфигурация примера блока 112 кодирования побочной информации показана на Фиг. 33 и примерная процедура блока 112 кодирования побочной информации показана на Фиг. 34. Блок 112 кодирования побочной информации включает в себя блок 511 вычисления коэффициента LP, блок 512 вычисления остаточного сигнала, блок 513 вычисления запаздывания основного тона, блок 514 вычисления адаптивной кодовой книги, буфер 515 адаптивных кодовых книг и блок 516 кодирования запаздывания основного тона.
[0201] Блок 511 вычисления коэффициента LP является таким же, как блок 151 вычисления коэффициента LP в примере 1, показанном на Фиг. 8, и таким образом не описывается еще раз.
[0202] Блок 512 вычисления остаточного сигнала вычисляет остаточный сигнал посредством такой же обработки, как на этапе 181 в примере 1, показанном на Фиг. 11.
[0203] Блок 513 вычисления запаздывания основного тона вычисляет запаздывание основного тона для каждого подкадра посредством вычисления k, которое максимизирует следующее уравнение (этап 163 на Фиг. 34). Следует отметить, что u(n) указывает адаптивную кодовую книгу и
Figure 00000105
указывает число отсчетов, содержащихся в одном подкадре.
Figure 00000106
[0204] Блок 514 вычисления адаптивной кодовой книги вычисляет вектор
Figure 00000107
адаптивной кодовой книги из запаздывания
Figure 00000108
основного тона и адаптивной кодовой книги u(n). Длина адаптивной кодовой книги равна
Figure 00000109
(этап 164 на Фиг. 34).
Figure 00000110
[0205] Буфер 515 адаптивных кодовых книг обновляет состояние посредством вектора
Figure 00000111
адаптивной кодовой книги (этап 166 на Фиг. 34).
Figure 00000112
[0206] Блок 516 кодирования запаздывания основного тона является таким же, как в примере 1 и таким образом не описывается еще раз (этап 169 на Фиг. 34).
[0207] <Сторона декодирования>
Устройство приема аудиосигналов включает в себя буфер 121 аудиокода, блок 122 декодирования аудиопараметров, блок 123 обработки отсутствующих аудиопараметров, блок 124 синтеза аудио, блок 125 декодирования побочной информации и блок 126 сбора побочной информации, точно как в примере 1. Процедура устройства приема аудиосигналов показана на Фиг. 7.
[0208] Операция буфера 121 аудиокода является такой же, как в примере 1.
[0209] <Когда пакет принят корректно>
Операция блока 122 декодирования аудиопараметров является такой же, как в примере 1.
[0210] Блок 125 декодирования побочной информации декодирует код побочной информации, вычисляет запаздывание
Figure 00000113
основного тона и сохраняет его в блоке 126 сбора побочной информации. Блок 125 декодирования побочной информации декодирует код побочной информации посредством использования способа декодирования, соответствующего способу кодирования, используемому на стороне кодирования.
[0211] Блок 124 синтеза аудио является таким же, как в примере 1.
[0212] <Когда обнаружена потеря пакета>
Блок 191 предсказания ISF блока 123 обработки отсутствующих аудиопараметров (см. Фиг. 12) вычисляет параметр ISF таким же способом, как в примере 1.
[0213] Примерная процедура блока 192 предсказания запаздывания основного тона показана на Фиг. 35. Блок 192 предсказания запаздывания основного тона считывает код побочной информации из блока 126 сбора побочной информации и получает запаздывание
Figure 00000114
основного тона таким же способом, как в примере 1 (этап 4051 на Фиг. 35). Дополнительно, блок 192 предсказания запаздывания основного тона выводит запаздывание
Figure 00000115
основного тона посредством использования запаздывания
Figure 00000116
основного тона, использованного при прошлом декодировании (этап 4052 на Фиг. 35). Число подкадров, содержащихся в одном кадре, равно M и число запаздываний основного тона, содержащихся в побочной информации, равно
Figure 00000117
. В предсказании запаздывания
Figure 00000118
основного тона, может быть использована процедура, которая описана в непатентной литературе 4 (этап 1102 на Фиг. 13).
[0214] В предсказании запаздывания
Figure 00000119
основного тона, блок 192 предсказания запаздывания основного тона может предсказывать запаздывание
Figure 00000119
основного тона посредством использования запаздывания
Figure 00000120
основного тона, использованного при прошлом декодировании, и запаздывания
Figure 00000121
основного тона. Дополнительно,
Figure 00000122
может быть установлено. Процедура блока предсказания запаздывания основного тона в этом случае является такой, как показана на Фиг. 36.
[0215] Дополнительно, блок 192 предсказания запаздывания основного тона может устанавливать
Figure 00000122
только когда достоверность предсказанного значения запаздывания основного тона является низкой. Процедура блока предсказания запаздывания основного тона в этом случае показана на Фиг. 37. Информация инструкции относительно того, используется ли предсказанное значение или используется запаздывание
Figure 00000123
основного тона, полученное побочной информацией, может быть введена в блок 154 вычисления адаптивной кодовой книги.
[0216] Блок 193 предсказания усиления адаптивной кодовой книги и блок 194 предсказания усиления фиксированной кодовой книги являются такими же, как в примере 1.
[0217] Блок 195 генерирования шумовых сигналов является таким же, как в примере 1.
[0218] Блок 124 синтеза аудио синтезирует, из параметров, выведенных из блока 123 обработки отсутствующих аудиопараметров, аудиосигнал, соответствующий кадру, который должен быть закодирован.
[0219] Блок 1121 вычисления коэффициента LP блока 124 синтеза аудио (см. Фиг. 15) получает коэффициент LP таким же способом, как в примере 1 (этап S11301 на Фиг. 16).
[0220] Блок 1123 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги таким же способом, как в примере 1. Блок 1123 вычисления адаптивной кодовой книги может выполнять фильтрацию в отношении вектора адаптивной кодовой книги или может не выполнять фильтрацию. В частности, вектор адаптивной кодовой книги вычисляется с использованием следующего уравнения. Коэффициентом фильтрации является
Figure 00000124
Figure 00000125
В случае декодирования значения, которое не указывает фильтрацию, устанавливается
Figure 00000126
(этап A вычисления адаптивной кодовой книги).
[0221] Блок 1123 вычисления адаптивной кодовой книги может вычислять вектор адаптивной кодовой книги в следующей процедуре (этап B вычисления адаптивной кодовой книги).
[0222] Исходный вектор адаптивной кодовой книги вычисляется с использованием запаздывания основного тона и адаптивной кодовой книги 1122.
Figure 00000127
Figure 00000128
может быть установлено согласно методике расчета.
[0223] Затем, гортанная импульсная синхронизация применяется к исходному вектору адаптивной кодовой книги. Для гортанной импульсной синхронизации используется такая же процедура, как в случае, где положение импульса не является доступным в разделе 7.11.2.5 в непатентной литературе 4. Следует отметить, однако, что u(n) в непатентной литературе 4 соответствует v(n) в варианте осуществления настоящего изобретения, и экстраполированный основной тон соответствует
Figure 00000129
в варианте осуществления настоящего изобретения, и последний достоверный основной тон
Figure 00000130
соответствует
Figure 00000131
в варианте осуществления настоящего изобретения.
[0224] Дополнительно, в случае, где блок 192 предсказания запаздывания основного тона выводит вышеописанную информацию инструкции для предсказанного значения, когда информация инструкции указывает, что запаздывание основного тона, переданное в качестве побочной информации, не должно быть использовано в качестве предсказанного значения (Нет на этапе 4082 на Фиг. 38), блок 1123 вычисления адаптивной кодовой книги может использовать вышеописанный этап A вычисления адаптивной кодовой книги, и если указывается, что значение основного тона должно быть использовано (Да на этапе 4082 на Фиг. 38), блок 1123 вычисления адаптивной кодовой книги может использовать вышеописанный этап B вычисления адаптивной кодовой книги. Процедура блока 1123 вычисления адаптивной кодовой книги в этом случае показана в примере с Фиг. 38.
[0225] Блок 1124 синтеза вектора возбуждения выводит вектор возбуждения таким же способом, как в примере 1 (этап 11306 на Фиг. 16).
[0226] Постфильтр 1125 выполняет постобработку над сигналом синтеза таким же способом, как в примере 1.
[0227] Адаптивная кодовая книга 1122 обновляет состояние посредством использования вектора сигнала возбуждения таким же способом, как в примере 1 (этап 11308 на Фиг. 16).
[0228] Фильтр 1126 синтеза синтезирует декодированный сигнал таким же способом, как в примере 1 (этап 11309 на Фиг. 16).
[0229] Перцептивный обратный взвешивающий фильтр 1127 применяет перцептивный обратный взвешивающий фильтр таким же способом, как в примере 1.
[0230] Блок 123 обработки отсутствующих аудиопараметров сохраняет аудиопараметры (параметр ISF, запаздывание основного тона, усиление адаптивной кодовой книги, усиление фиксированной кодовой книги), используемые в блоке 124 синтеза аудио, в буфер таким же способом, как в примере 1 (этап 145 на Фиг. 7).
[0231] [Пример 5]
В этом варианте осуществления описывается конфигурация, в которой запаздывание основного тона передается в качестве побочной информации только в некотором конкретном классе кадров и иначе запаздывание основного тона не передается.
[0232] <Сторона передачи>
В устройстве передачи аудиосигнала входной аудиосигнал отправляется в блок 111 кодирования аудио.
[0233] Блок 111 кодирования аудио в этом примере вычисляет индекс, представляющий характеристики кадра, который должен быть закодирован, и передает индекс блоку 112 кодирования побочной информации. Другие операции являются такими же, как в примере 1.
[0234] В блоке 112 кодирования побочной информации, отличие от примеров с 1 по 4 существует только в отношении к блоку 158 кодирования запаздывания основного тона и поэтому операция блока 158 кодирования запаздывания основного тона описывается в этом документе ниже по тексту. Конфигурация блока 112 кодирования побочной информации в примере 5 показана на Фиг. 39.
[0235] Процедура блока 158 кодирования запаздывания основного тона показана в примере с Фиг. 40. Блок 158 кодирования запаздывания основного тона считывает индекс, представляющий характеристики кадра, который должен быть закодирован (этап 5021 на Фиг. 40) и, когда индекс, представляющий характеристики кадра, который должен быть закодирован, равен некоторому предопределенному значению, блок 158 кодирования запаздывания основного тона определяет число битов, которые должны быть назначены побочной информации, в качестве B битов (B>1). С другой стороны, когда индекс, представляющий характеристики кадра, который должен быть закодирован, отличается от некоторого предопределенного значения, блок 158 кодирования запаздывания основного тона определяет число битов, которые должны быть назначены побочной информации, в качестве 1 бита (этап 5022 на Фиг. 40).
[0236] Когда число битов, которые должны быть назначены побочной информации, равно 1 биту (Нет на этапе 5022 на Фиг. 40), значение, указывающее, что не осуществляется передача побочной информации, используется в качестве кода побочной информации и устанавливается в индекс побочной информации (этап 5023 на Фиг. 40).
[0237] С другой стороны, когда число битов, которые должны быть назначены побочной информации, равно B битам (Да на этапе 5022 на Фиг. 40), значение, указывающее передачу побочной информации, устанавливается в индекс побочной информации (этап 5024 на Фиг. 40), и дополнительно код B-1 битов, полученный посредством кодирования запаздывания основного тона способом, описанным в примере 1, добавляется для использования в качестве кода побочной информации (этап 5025 на Фиг. 40).
[0238] <Сторона декодирования>
Устройство приема аудиосигналов включает в себя буфер 121 аудиокода, блок 122 декодирования аудиопараметров, блок 123 обработки отсутствующих аудиопараметров, блок 124 синтеза аудио, блок 125 декодирования побочной информации и блок 126 сбора побочной информации, точно как в примере 1. Процедура устройства приема аудиосигналов является такой, как показана на Фиг. 7.
[0239] Операция буфера 121 аудиокода является такой, как в примере 1.
[0240] <Когда пакет принят корректно>
Операция блока 122 декодирования аудиопараметров является такой же, как в примере 1.
[0241] Процедура блока 125 декодирования побочной информации показана в примере с Фиг. 41. Блок 125 декодирования побочной информации сначала декодирует индекс побочной информации, содержащийся в коде побочной информации (этап 5031 на Фиг. 41). Когда индекс побочной информации указывает отсутствие передачи побочной информации, блок 125 декодирования побочной информации не выполняет никаких дополнительных операций декодирования. Также блок 125 декодирования побочной информации сохраняет значение индекса побочной информации в блоке 126 сбора побочной информации (этап 5032 на Фиг. 41).
[0242] С другой стороны, когда индекс побочной информации указывает передачу побочной информации, блок 125 декодирования побочной информации дополнительно выполняет декодирование B-1 битов и вычисляет запаздывание
Figure 00000132
основного тона и сохраняет вычисленное запаздывание основного тона в блоке 126 сбора побочной информации (этап 5033 на Фиг. 41). Дополнительно, блок 125 декодирования побочной информации сохраняет значение индекса побочной информации в блок 126 сбора побочной информации. Следует отметить, что декодирование побочной информации B-1 битов является такой же операцией, как операция блока 125 декодирования побочной информации в примере 1.
[0243] Блок 124 синтеза аудио является таким же, как в примере 1.
[0244] <Когда обнаружена потеря пакета>
Блок 191 предсказания ISF блока 123 обработки отсутствующих аудиопараметров (см. Фиг. 12) вычисляет параметр ISF таким же способом, как в примере 1.
[0245] Процедура блока 192 предсказания запаздывания основного тона показана в примере с Фиг. 42. Блок 192 предсказания запаздывания основного тона считывает индекс побочной информации из блока 126 сбора побочной информации (этап 5041 на Фиг. 42) и проверяет, является ли он значением, указывающим передачу побочной информации (этап 5042 на Фиг. 42).
[0246] <Когда индекс побочной информации является значением, указывающим передачу побочной информации>
Таким же способом, как в примере 1, код побочной информации считывается из блока 126 сбора побочной информации для получения запаздывания
Figure 00000133
основного тона (этап 5043 на Фиг. 42). Дополнительно, запаздывание
Figure 00000134
основного тона выводится посредством использования запаздывания
Figure 00000135
основного тона, использованного при прошлом декодировании, и
Figure 00000136
полученного в качестве побочной информации (этап 5044 на Фиг. 42). Число подкадров, содержащихся в одном кадре, равно M и число запаздываний основного тона, содержащихся в побочной информации, равно
Figure 00000137
В предсказании запаздывания
Figure 00000138
основного тона, может быть использована процедура, которая описана в непатентной литературе 4 (этап 1102 на Фиг. 13). Дополнительно, может быть установлено
Figure 00000139
[0247] Дополнительно, блок 192 предсказания запаздывания основного тона может устанавливать
Figure 00000140
только, когда достоверность предсказанного значения запаздывания основного тона является низкой, и иначе устанавливать предсказанное значение в
Figure 00000141
(этап 5046 на Фиг. 42). Дополнительно, информация инструкции запаздывания основного тона, указывающая, используется ли предсказанное значение или используется запаздывание
Figure 00000142
основного тона, полученное побочной информацией, может быть введена в блок 1123 вычисления адаптивной кодовой книги.
[0248] <Когда индекс побочной информации является значением, указывающим, что не осуществляется передача побочной информации>
В предсказании запаздывания
Figure 00000143
основного тона, блок 192 предсказания запаздывания основного тона предсказывает запаздывание
Figure 00000144
основного тона посредством использования запаздывания
Figure 00000145
основного тона, использованного при прошлом декодировании (этап 5048 на Фиг. 42).
[0249] Дополнительно, блок 192 предсказания запаздывания основного тона может устанавливать
Figure 00000146
только когда достоверность предсказанного значения запаздывания основного тона является низкой (этап 5049 на Фиг. 42), и блок 192 предсказания запаздывания основного тона может иначе установить предсказанное значение в
Figure 00000147
Дополнительно, информация инструкции запаздывания основного тона, указывающая, используется ли предсказанное значение или используется запаздывание
Figure 00000148
основного тона, использованное при прошлом декодировании, вводится в блок 1123 вычисления адаптивной кодовой книги (этап 5050 на Фиг. 42).
[0250] Блок 193 предсказания усиления адаптивной кодовой книги и блок 194 предсказания усиления фиксированной кодовой книги являются такими же, как в примере 1.
[0251] Блок 195 генерирования шумовых сигналов является таким же, как в примере 1.
[0252] Блок 124 синтеза аудио синтезирует, из параметров, выведенных из блока 123 обработки отсутствующих аудиопараметров, аудиосигнал, который соответствует кадру, который должен быть закодирован.
[0253] Блок 1121 вычисления коэффициента LP блока 124 синтеза аудио (см. Фиг. 15) получает коэффициент LP таким же способом, как в примере 1 (этап S11301 на Фиг. 16).
[0254] Процедура блока 1123 вычисления адаптивной кодовой книги показана в примере с Фиг. 43. Блок 1123 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги таким же способом, как в примере 1. Сначала, посредством обращения к информации инструкции запаздывания основного тона (этап 5051 на Фиг. 43), когда достоверность предсказанного значения является низкой (Да на этапе 5052 на Фиг. 43), вектор адаптивной кодовой книги вычисляется с использованием следующего уравнения (этап 5055 на Фиг. 43). Коэффициентом фильтрации является
Figure 00000149
Figure 00000150
Следует отметить, что
Figure 00000151
может быть установлено согласно методике расчета.
[0255] Посредством обращения к информации инструкции запаздывания основного тона, когда достоверность предсказанного значения является высокой (Нет на этапе 5052 на Фиг. 43), блок 1123 вычисления адаптивной кодовой книги вычисляет вектор адаптивной кодовой книги следующей процедурой.
[0256] Сначала, исходный вектор адаптивной кодовой книги вычисляется с использованием запаздывания основного тона и адаптивной кодовой книги 1122 (этап 5053 на Фиг. 43).
Figure 00000152
Figure 00000153
может быть установлено согласно методике расчета.
[0257] Затем, гортанная импульсная синхронизация применяется к исходному вектору адаптивной кодовой книги. Для гортанной импульсной синхронизации может быть использована такая же процедура, как в случае, когда положение импульса не является доступным в разделе 7.11.2.5 в непатентной литературе 4 (этап 5054 на Фиг. 43). Следует отметить, что однако u(n) в непатентной литературе 4 соответствует v(n) в варианте осуществления настоящего изобретения, экстраполированный основной тон соответствует
Figure 00000154
в варианте осуществления настоящего изобретения, и последний достоверный основной тон
Figure 00000155
соответствует
Figure 00000156
в варианте осуществления настоящего изобретения.
[0258] Блок 1124 синтеза вектора возбуждения выводит вектор сигнала возбуждения таким же способом, как в примере 1 (этап 11306 на Фиг. 16).
[0259] Постфильтр 1125 выполняет постобработку над сигналом синтеза таким же способом, как в примере 1.
[0260] Адаптивная кодовая книга 1122 обновляет состояние с использованием вектора сигнала возбуждения таким же способом, как в примере 1 (этап 11308 на Фиг. 16).
[0261] Фильтр 1126 синтеза синтезирует декодированный сигнал таким же способом, как в примере 1 (этап 11309 на Фиг. 16).
[0262] Перцептивный обратный взвешивающий фильтр 1127 применяет перцептивный обратный взвешивающий фильтр таким же способом, как в примере 1.
[0263] Блок 123 обработки отсутствующих аудиопараметров сохраняет аудиопараметры (параметр ISF, запаздывание основного тона, усиление адаптивной кодовой книги, усиление фиксированной кодовой книги), используемые в блоке 124 синтеза аудио, в буфер таким же способом, как в примере 1 (этап 145 на Фиг. 7).
Список позиционных обозначений
[0264] 60,80...носитель данных, 61, 81...область хранения программ, 70...программа кодирования аудио, 90...программа декодирования аудио, 111...блок кодирования аудио, 112...блок кодирования побочной информации, 121, 231...буфер аудиокода, 122, 232...блок декодирования аудиопараметров, 123, 233...блок обработки отсутствующих аудиопараметров, 124, 234...блок синтеза аудио, 125, 235...блок декодирования побочной информации, 126, 236...блок сбора побочной информации, 151, 511, 1121...блок вычисления коэффициента LP, 152, 2012...блок вычисления целевого сигнала, 153, 513, 2013...блок вычисления запаздывания основного тона, 154, 1123, 514, 2014, 2313...блок вычисления адаптивной кодовой книги, 155, 1124, 2314...блок синтеза вектора возбуждения, 156, 315, 515, 2019...буфер адаптивных кодовых книг, 157, 1126, 2018, 2316...фильтр синтеза, 158, 516...блок кодирования запаздывания основного тона, 191...блок предсказания ISF, 192...блок предсказания запаздывания основного тона, 193...блок предсказания усиления адаптивной кодовой книги, 194...блок предсказания усиления фиксированной кодовой книги, 195...блок генерирования шумовых сигналов, 211...главный блок кодирования, 212...блок кодирования побочной информации, 213, 238...блок сбора сигналов маскирования, 214...блок кодирования сигналов ошибки, 237...блок декодирования сигналов ошибки, 311...блок вычисления коэффициента LP, 312...блок предсказания запаздывания основного тона, 313...блок выбора запаздывания основного тона, 314...блок кодирования запаздывания основного тона, 512...блок вычисления остаточного сигнала, 700...модуль кодирования аудио, 701...модуль кодирования побочной информации, 900...модуль декодирования аудиопараметров, 901...модуль обработки отсутствующих аудиопараметров, 902...модуль синтеза аудио, 903...модуль декодирования побочной информации, 1128...блок определения вывода побочной информации, 1122, 2312...адаптивная кодовая книга, 1125...постфильтр, 1127... перцептивный обратный взвешивающий фильтр, 2011..блок кодирования ISF, 2015...блок вычисления фиксированной кодовой книги, 2016...блок вычисления усиления, 2017...блок вычисления вектора возбуждения, 2211...блок декодирования ISF, 2212...блок декодирования запаздывания основного тона, 2213...блок декодирования усиления, 2214...блок декодирования фиксированной кодовой книги, 2318...блок синтеза прогнозных векторов возбуждения.

Claims (21)

1. Способ кодирования аудио посредством устройства кодирования аудио для кодирования аудиосигнала, содержащий:
этап кодирования аудио, на котором кодируют аудиосигнал; и
этап кодирования побочной информации, на котором вычисляют побочную информацию из прогнозного сигнала, причем побочная информация предназначена для вычисления предсказанного значения аудиопараметра во время декодирования аудиосигнала, и кодируют побочную информацию,
при этом побочную информацию вычисляют на основе коэффициента LSF части прогнозного сигнала, при этом коэффициент LSF части прогнозного сигнала вычисляют с использованием коэффициента LSF, полученного из коэффициента линейного предсказания целевого кадра кодирования,
при этом, когда определено, что побочная информация доступна в соответствии с индексом побочной информации, представляющим характеристики целевого кадра кодирования, информацию, представляющую, что побочная информация доступна, включают в индекс побочной информации,
при этом этап кодирования побочной информации содержит использование индекса побочной информации и побочной информации в качестве кодов побочной информации в аудиопакете для целевого кадра кодирования.
2. Способ кодирования аудио по п. 1, в котором побочная информация указывает запаздывание основного тона, включенное в прогнозный сигнал.
3. Способ кодирования аудио посредством устройства кодирования аудио для кодирования аудиосигнала, содержащий:
этап кодирования аудио, на котором кодируют аудиосигнал; и
этап кодирования побочной информации, на котором вычисляют побочную информацию из прогнозного сигнала, причем побочная информация предназначена для вычисления предсказанного значения аудиопараметра во время декодирования, и кодируют побочную информацию,
при этом побочную информацию вычисляют на основе коэффициента линейного предсказания, вычисленного из части прогнозного сигнала целевого кадра кодирования,
при этом, когда определено, что побочная информация доступна в соответствии с индексом, представляющим характеристики целевого кадра кодирования, информацию, представляющую, что побочная информация доступна, включают в индекс побочной информации, и
при этом на этапе кодирования побочной информации индекс побочной информации и побочную информацию используют в качестве кодов побочной информации в аудиопакете для целевого кадра кодирования.
4. Способ кодирования аудио по п. 3, в котором побочная информация указывает запаздывание основного тона, включенное в прогнозный сигнал.
5. Способ кодирования аудио по п. 3, в котором побочную информацию вычисляют на основе коэффициента LSF части прогнозного сигнала, причем коэффициент LSF части прогнозного сигнала вычисляют с использованием коэффициента LSF, полученного из коэффициента линейного предсказания целевого кадра кодирования.
6. Устройство кодирования аудио для кодирования аудиосигнала, содержащее:
аудиокодер, выполненный с возможностью кодирования аудиосигнала; и
кодер побочной информации, выполненный с возможностью вычисления побочной информации из прогнозного сигнала, причем побочная информация предназначена для вычисления предсказанного значения аудиопараметра во время декодирования, при этом кодер побочной информации дополнительно выполнен с возможностью кодирования побочной информации,
при этом побочная информация вычисляется на основе коэффициента линейного предсказания, вычисленного из части прогнозного сигнала целевого кадра кодирования,
при этом в ответ на то, что побочная информация указана как доступная с помощью индекса, представляющего характеристики целевого кадра кодирования, информация, представляющая, что побочная информация доступна, включается в индекс побочной информации; и
при этом кодер побочной информации дополнительно выполнен с возможностью использования индекса побочной информации и побочной информации в качестве кодов побочной информации в аудиопакете для целевого кадра кодирования.
RU2022118821A 2022-07-11 Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио RU2792658C1 (ru)

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2021133152A Division RU2776261C1 (ru) 2012-11-15 2021-11-16 Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио

Publications (1)

Publication Number Publication Date
RU2792658C1 true RU2792658C1 (ru) 2023-03-22

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050228651A1 (en) * 2004-03-31 2005-10-13 Microsoft Corporation. Robust real-time speech codec
US20050261896A1 (en) * 2002-07-16 2005-11-24 Koninklijke Philips Electronics N.V. Audio coding
US20090132258A1 (en) * 2007-11-20 2009-05-21 Institute For Information Industry Apparatus, server, method, and tangible machine-readable medium thereof for processing and recognizing a sound signal
US20090141790A1 (en) * 2005-06-29 2009-06-04 Matsushita Electric Industrial Co., Ltd. Scalable decoder and disappeared data interpolating method
RU2428748C2 (ru) * 2007-02-13 2011-09-10 Нокиа Корпорейшн Кодирование аудиосигнала

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050261896A1 (en) * 2002-07-16 2005-11-24 Koninklijke Philips Electronics N.V. Audio coding
US20050228651A1 (en) * 2004-03-31 2005-10-13 Microsoft Corporation. Robust real-time speech codec
US20090141790A1 (en) * 2005-06-29 2009-06-04 Matsushita Electric Industrial Co., Ltd. Scalable decoder and disappeared data interpolating method
RU2428748C2 (ru) * 2007-02-13 2011-09-10 Нокиа Корпорейшн Кодирование аудиосигнала
US20090132258A1 (en) * 2007-11-20 2009-05-21 Institute For Information Industry Apparatus, server, method, and tangible machine-readable medium thereof for processing and recognizing a sound signal

Similar Documents

Publication Publication Date Title
RU2760485C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
RU2792658C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
RU2776261C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио