RU2665282C1

RU2665282C1 - Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования

Info

Publication number: RU2665282C1
Application number: RU2017105447A
Authority: RU
Inventors: Эммануэль РАВЕЛЛИ; Мануэль ЯНДЕР; Гжегош ПЕТШИК; Мартин ДИТЦ; Марк ГАЙЕР
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2014-07-28
Filing date: 2015-07-03
Publication date: 2018-08-28
Also published as: KR20220150992A; CA2955674C; EP4235667A2; EP3654333A1; EP2980796A1; JP7202545B2; KR101997006B1; CA3193319A1; PL4030426T3; JP6864382B2; EP4030426A1; BR112017001362A2; US20230335147A1; KR102615475B1; WO2016015950A1; US20170133028A1; HK1259289A1; CA2955674A1; US11869525B2; KR102304326B1

Abstract

Изобретение относится к обработке аудиосигнала, включающего аудиокадры. Технический результат – удаление разрывов между отфильтрованными аудиокадрами без потенциальных искажений в отфильтрованном аудиосигнале. Данный способ позволяет обрабатывать аудиосигнал, удалять разрыв между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, с использованием фильтрации с линейным предсказанием. 5 н. и 9 з.п. ф-лы, 8 ил.

Description

Настоящее изобретение относится к области аудиосигналов, в частности к методу обработки аудиосигнала, включающего в себя совокупность аудиокадров, в которых разрывы между последовательными отфильтрованными аудиокадрами снижаются или устраняются.

В области обработки аудиосигнала аудиосигнал может быть отфильтрован по разным причинам, например, фильтр долгосрочного предсказания может использоваться в устройстве кодирования аудиосигнала для ослабления или даже полного подавления набора гармоник в аудиосигнале.

Аудиосигнал включает множество аудиокадров и кадров, отфильтрованных с использованием фильтра долгосрочного предсказания. Когда рассматриваются два последовательных кадра аудиосигнала, прошедший кадр и текущий кадр, линейный фильтр H(z), имеющий набор параметров c, используется для фильтрации аудиосигнала. В частности, прошедший кадр фильтруется с использованием фильтра H(z) с применением первого набора параметров c₀, который будет формировать так называемый отфильтрованный прошедший кадр. Текущий кадр фильтруется с использованием фильтра H(z) с применением набора параметров c₁, который будет формировать отфильтрованный текущий кадр. На ФИГ. 1 показана структурна схема обработки последовательных кадров аудиосигнала согласно известному подходу. Представляется аудиосигнал 100, включающий в себя множество аудиокадров. Аудиосигнал 100 поступает в блок фильтрации 102, и текущий кадр n аудиосигнала 100 фильтруется. Блок фильтрации, помимо аудиосигнала 100, получает набор параметров фильтра c_n для текущего кадра аудиосигнала. Блок фильтра 102 фильтрует текущий кадр n аудиосигнала и выводит отфильтрованный аудиосигнал 104, включающий в себя последовательно отфильтрованные кадры. На ФИГ. 1 схематически показаны отфильтрованный текущий кадр n, отфильтрованный прошедший кадр n-1 и отфильтрованный второй последний кадр n-2. Отфильтрованные кадры схематически представлены на ФИГ. 1, с соответствующими интервалами для схематического указания разрыва между ними 106a, 106b, которые могут быть включены в процесс фильтрации между отфильтрованными кадрами. Блок фильтрации 102 вызывает фильтрацию кадров аудиосигнала с использованием соответствующих параметров фильтра c₀ и c₁ для прошедшего кадра n-1 и текущего кадра n. В общем случае, блок фильтрации 102 может быть линейным фильтром H(z) и одним примером для такого линейного фильтра H(z) является упомянутый выше фильтр долгосрочного предсказания

H(z)=1 - g⋅z^-T,

где параметрами фильтра являются усиление "g" и временной сдвиг тона "T". В более общем виде, фильтр долгосрочного предсказания может быть описан следующим образом:

H(z)=1 - g⋅A(z)⋅z^-T,

где A(z) является КИХ-фильтром. Фильтр долгосрочного предсказания может использоваться для ослабления или даже для полного подавления набора гармоник в аудиосигнале. Однако, существует высокая вероятность введения разрыва 106a, 106b (см. ФИГ. 1) между отфильтрованным прошедшим кадром n-1 и отфильтрованным текущим кадром n, при использовании такого фильтра долгосрочного предсказания и когда параметры фильтра c₀ прошедшего кадра отличаются от параметров фильтра c₁ текущего кадра. Указанный разрыв может создавать искажения в отфильтрованном аудиосигнале 104, например, "щелчок".

Таким образом, в связи с тем, что вышеописанные проблемы с фильтрацией последовательных кадров, приводят к разрывам, которые, в свою очередь, могут создавать нежелательные искажения, необходим подход, который позволяет удалить возможный разрыв. В данной области техники известны несколько подходов предшествующего уровня, предназначенных для удаления разрыва отфильтрованных кадров аудиосигнала.

В случае если линейный фильтр H(z) является КИХ-фильтром, текущий кадр фильтруется с использованием параметров фильтра c₁ текущего кадра для получения отфильтрованного текущего кадра. Кроме того, начальный фрагмент текущего кадра фильтруется с применением параметров фильтра прошедшего кадра c₀ для получения фрагмента отфильтрованного кадра, и затем над начальным фрагментом отфильтрованного текущего кадра и фрагментом отфильтрованного кадра выполняется операция перекрытия с суммированием или плавное микширование. На ФИГ. 2 показана структурная схема такого традиционного подхода для обработки последовательных аудиокадров с целью удаления разрыва. При сравнении с ФИГ. 1, блок фильтра 102 включает в себя дополнительный блок обработки 108 для выполнения операции перекрытия с суммированием или плавного микширования. В отфильтрованном аудиосигнале 104, не будет присутствовать или будет уменьшенный разрыв между последовательно отфильтрованными кадрами, как это схематично изображено на ФИГ. 2, показывающими последовательно отфильтрованные кадры n, n-1 и n-2 без интервалов, представленных на ФИГ. 1.

В других подходах предшествующего уровня техники, фильтр H(z) может быть фильтром, имеющим рекурсивную часть, например, БИХ-фильтр. В таком случае, подход, как описано ранее по отношению к ФИГ. 2, применяется на последовательной основе. На первом этапе обработка начинается с первого образца начального фрагмента текущего кадра n, фильтруемого с использованием параметров фильтра c₀ прошедшего кадра n-1, получая первый отфильтрованный образец. Образец также фильтруется с использованием параметров фильтра c₁ текущего кадра n, создавая второй отфильтрованный образец. Далее, на основе первого и второго отфильтрованных образцов выполняется операция перекрытия с суммированием или плавного микширования, которая получает соответствующий образец отфильтрованного текущего кадра n. Затем обрабатывается следующий образец и вышеуказанные шаги повторяются вплоть до тех пор, пока не будет обработан последний образец начального фрагмента текущего кадра n. Оставшиеся образцы текущего кадра n фильтруются с использованием параметров фильтра c₁ текущего кадра n.

Примеры упомянутых выше известных подходов для удаления разрыва из последовательно отфильтрованных кадров описываются, например, в US 5012517 A в контексте изменения устройством кодирования, в EP 0732687 A2 в контексте расширителя пропускной способности речи, в US 5999899 A в контексте изменения устройством аудиокодирования или в US 7353168 B2 в контексте постфильтра декодированной речи.

Хотя приведенные выше подходы эффективны для удаления нежелательных разрывов сигнала, поскольку указанные подходы работают на конкретном фрагменте текущего кадра, на начальном фрагменте, чтобы оставаться эффективным, длина фрагмента кадра должна быть достаточно продолжительной, например, в случае, когда длина кадра составляет 20 мс, фрагмент кадра или длина начального фрагмента должна составлять до 5 мс. В некоторых случаях, такой фрагмент может быть слишком длинным, особенно в ситуациях, когда параметры фильтра c₀ прошедшего кадра не достаточно хорошо применимы к текущему кадру, и это может привести к дополнительным искажениям. Одним из примеров является гармонический аудиосигнал с быстро изменяющимся тоном и фильтр долгосрочного предсказания, который конструируется для уменьшения амплитуды гармоник. В таком случае, временной сдвиг тона отличается от одного кадра к другому. Фильтр долгосрочного предсказания с оценкой тона в текущем кадре будет эффективно уменьшать амплитуду гармоник в текущем кадре, но это не приведет к уменьшению амплитуды гармоник, если они используются в другом кадре (например, в начальном фрагменте следующего кадра), где тон аудиосигнала будет отличаться. Это может привести к более плохому результату, за счет уменьшения амплитуды не относящихся к гармоническим компонентов сигнала, вводя искажения в сигнал.

Задачей, лежащей в основе настоящего изобретения, является создание усовершенствованного подхода к удалению разрывов между отфильтрованными аудиокадрами без каких-либо потенциальных искажений в отфильтрованном аудиосигнале.

Эта цель достигается с помощью способа и устройства в соответствии с независимыми пунктами формулы изобретения.

Настоящее изобретение относится к способу обработки аудиосигнала, при этом способ включает в себя удаление разрыва между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала с использованием фильтрации с линейным предсказанием.

Фильтр с линейным предсказанием определен как

где M - порядок фильтра и a_m- коэффициенты фильтра (при a₀=1). Такой вид фильтра также известен, как кодирование с линейным предсказанием (LPC).

Согласно вариантам осуществления изобретения, способ включает в себя фильтрацию текущего кадра аудиосигнала и удаление разрыва путем изменения начального фрагмента отфильтрованного текущего кадра при помощи сигнала, полученного посредством фильтрации с линейным предсказанием заранее заданного сигнала с использованием исходных состояний фильтра с линейным предсказанием, определяемого в зависимости от последней части прошедшего кадра.

Согласно вариантам осуществления изобретения, исходные состояния фильтра с линейным предсказанием определяются в зависимости от последней части неотфильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.

Согласно вариантам осуществления изобретения, способ включает в себя расчет фильтра с линейным предсказанием на отфильтрованном или неотфильтрованном аудиосигнале.

Согласно вариантам осуществления изобретения, расчет фильтра с линейным предсказанием включает в себя расчет фильтра на основе прошедшего или текущего кадра аудиосигнала или на основе последнего отфильтрованного кадра аудиосигнала с использованием алгоритма Левинсона-Дарбина.

Согласно вариантам осуществления изобретения, фильтр с линейным предсказанием включает в себя фильтр с линейным предсказанием аудиокодека.

Согласно вариантам осуществления изобретения, удаление разрыва включает в себя обработку начального фрагмента отфильтрованного текущего кадра, причем начальный фрагмент текущего кадра имеет заранее заданное количество образцов, которое меньше или равно общему количеству образцов в текущем кадре, и обработка начального фрагмента текущего кадра включает в себя вычитание начального фрагмента отклика при отсутствии входного сигнала (ZIR) из начального фрагмента отфильтрованного текущего кадра.

Согласно вариантам осуществления изобретения способ включает в себя фильтрацию текущего кадра аудиосигнала с использованием нерекурсивного фильтра, подобного КИХ-фильтру, для получения отфильтрованного текущего кадра.

Согласно вариантам осуществления изобретения, способ включает в себя обработку неотфильтрованного текущего кадра аудиосигнала на последовательной основе с использованием рекурсивного фильтра, подобного БИХ-фильтру, и в котором обработка образца начального фрагмента текущего кадра включает в себя:

фильтрацию образца с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра для получения отфильтрованного образца и

вычитание соответствующего ZIR-образца из отфильтрованного образца для получения соответствующего образца отфильтрованного текущего кадра.

Согласно вариантам осуществления изобретения фильтрация и вычитание повторяются до обработки последнего образца в начальном фрагменте текущего кадра, и способ дополнительно включает в себя фильтрацию оставшихся образцов в текущем кадре с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра.

Согласно вариантам осуществления изобретения, способ включает в себя формирование ZIR, в котором формирование ZIR включает в себя:

фильтрацию M последних образцов неотфильтрованного прошедшего кадра с использованием фильтра и параметров фильтра, используемых для фильтрации текущего кадра с целью получения первого фрагмента отфильтрованного сигнала, в котором M является порядком фильтра с линейным предсказанием,

вычитание из первого фрагмента отфильтрованного сигнала M последних образцов отфильтрованного прошедшего кадра, отфильтрованного с использованием параметров фильтра прошедшего кадра, для формирования второго фрагмента отфильтрованного сигнала и

формирование ZIR-фильтра с линейным предсказанием путем фильтрации кадра нулевых образцов с использованием фильтра с линейным предсказанием и исходными состояниями, равными второму фрагменту отфильтрованного сигнала.

Согласно вариантам осуществления изобретения способ включает в себя обработку ZIR функцией окна так, что его амплитуда быстро снижается до нуля.

Настоящее изобретение, основанное на открытиях изобретателя в том, что данные проблемы, которые были признаны в традиционных подходах по удалению сигнала разрывов, которые приводят к дополнительному нежелательному искажению, указанному выше, имеются в основном за счет обработки текущего кадра или по меньшей мере его фрагмента в зависимости от параметров фильтра прошедшего кадра. Согласно изобретенному подходу данной методики избегают, а именно, изобретенный подход не фильтрует фрагмент текущего кадра с использованием параметров фильтра прошедшего кадра и, таким образом, позволяет избежать проблем, упомянутых выше. Согласно вариантам осуществления изобретения для удаления разрыва используется LPC-фильтр (фильтр с линейным предсказанием) для удаления разрыва. LPC-фильтр может быть рассчитан по аудиосигналу, и поэтому данных подход является хорошей моделью спектральной формы аудиосигнала таким образом, что при использовании LPC-фильтра, спектральная форма аудиосигнала будет маскировать разрыв. В варианте осуществления изобретения LPC-фильтр может быть рассчитан на основе неотфильтрованного аудиосигнала или на основе аудиосигнала, который отфильтрован линейным фильтром H(z), упомянутым выше. Согласно вариантам осуществления изобретения LPC-фильтр может быть рассчитан с использованием аудиосигнала, например, текущего кадра и/или прошедшего кадра и алгоритма Левинсона-Дарбина. Кроме того, он может быть вычислен только в зависимости от последнего отфильтрованного кадра сигнала с использованием алгоритма Левинсона-Дарбина.

Еще в других вариантах осуществления изобретения, аудиокодек для обработки аудиосигнал может использовать линейный фильтр H(z), а также может использовать LPC-фильтр, квантуемый или нет, например, для формирования шума квантования в кодеке с преобразованием. В таком варианте осуществления изобретения данный имеющийся LPC-фильтр может быть непосредственно использован для сглаживания разрыва без дополнительной сложности, необходимой для расчета нового LPC-фильтра.

В дальнейшем варианты осуществления настоящего изобретения будут описываться со ссылкой на прилагаемые чертежи, на которых:

на ФИГ. 1 изображена структурная схема для обработки последовательных кадров аудиосигнала согласно традиционному подходу,

на ФИГ. 2 изображена структурная схема другого традиционного подхода для обработки последовательных аудиокадров с целью удаления разрыва,

на ФИГ. 3 изображена упрощенная структурная схема системы для передачи аудиосигналов, реализующая изобретенный подход для удаления разрыва между последовательными кадрами аудиосигнала на стороне устройства кодирования и/или на стороне устройства декодирования,

на ФИГ. 4 изображена блок-схема, представляющая изобретенный подход для удаления разрыва между последовательными кадрами аудиосигнала согласно варианту осуществления изобретения,

на ФИГ. 5 изображена схематическая структурная схема для обработки текущего аудиокадра согласно вариантам осуществления настоящего изобретения, устраняющая нежелательное искажение в выходном сигнале, независимо от устранения разрывов,

на ФИГ. 6 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по формированию ZIR,

на. ФИГ. 7 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по обработке отфильтрованного начального фрагмента текущего кадра в случае блока фильтра, включающего в себя рекурсивный фильтр, подобный БИХ-фильтру, и

на ФИГ. 8 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по обработке начального фрагмента отфильтрованного текущего кадра в случае блока фильтра, включающего в себя нерекурсивный фильтр, подобный КИХ-фильтру.

В дальнейшем, варианты осуществления изобретенного подхода будут описаны более подробно, и следует отметить, что элементы на прилагаемых чертежах, имеющие такую же или аналогичную функциональность, обозначаются одинаковыми ссылочными позициями.

На ФИГ. 3 изображена упрощенная структурная схема системы для передачи аудиосигналов, реализующая изобретенный подход на стороне устройства кодирования и/или на стороне устройства декодирования. Система на ФИГ. 3 включает в себя устройство кодирования 200, принимающее на входе 202 аудиосигнал 204. Устройство кодирования включает в себя процессор кодирования 206, принимающий аудиосигнал 204 и формирующий кодированный аудиосигнал, который предоставляется на выходе 208 устройства кодирования. Процессор кодирования может быть запрограммирован или создан для реализации изобретенного подхода с целью обработки полученных последовательных аудиокадров аудиосигнала, чтобы избежать разрывов. В других вариантах осуществления изобретения устройству кодирования нет необходимости быть частью передающей системы, однако, оно может быть автономным устройством, формирующим кодированные аудиосигналы, или быть частью передатчика аудиосигнала. Согласно варианту осуществления изобретения устройство кодирования 200 может содержать антенну 210, чтобы обеспечить беспроводную передачу аудиосигнала, как показано позицией 212. В других вариантах осуществления изобретения устройство кодирования 200 может выводить кодированный аудиосигнал, представленный на выходе 208 с использованием проводной линии связи, как это, например, показано на ссылочной позиции 214.

Система на ФИГ. 3 дополнительно включает в себя устройство декодирования 250, имеющее вход 252, принимающий кодированный аудиосигнал для обработки устройством декодирования 250, например, через проводную линию 214 или через антенну 254. Устройство декодирования 250 включает в себя процессор декодирования 256, обрабатывающий кодированный сигнал и предоставляющий декодированный аудиосигнал 258 на выходе 260. Процессор декодирования 256 может быть реализован для работы согласно изобретенному подходу на последовательности кадров, которые отфильтрованы таким образом, что избегается появление разрывов. В других вариантах осуществления изобретения устройству декодирования нет необходимости быть частью передающей системы, скорее, оно может быть автономным устройством для декодирования кодированных аудиосигналов, или оно может быть частью приемника аудиосигнала.

В дальнейшем, варианты осуществления изобретенного подхода, которые могут быть реализованы в по меньшей мере одном процессоре кодирования 206 и процессоре декодирования 256 будут описаны более подробно. На ФИГ. 4 изображена блок-схема обработки текущего кадра аудиосигнала согласно варианту осуществления изобретенного подхода. Будет описываться обработка текущего кадра и предполагается, что прошедший кадр уже обработан с использованием такой же техники, что описывается ниже. Согласно настоящему изобретению, на шаге S100a принимается текущий кадр аудиосигнала. Текущий кадр фильтруется на шаге S102, например, таким образом, как описано выше со ссылкой на ФИГ. 1 и 2 (см. блок фильтра 102). Согласно изобретенному подходу разрыв между отфильтрованным прошедшим кадром n-1 и отфильтрованным текущим кадром n (см. ФИГ. 1 или 2) будет удален с использованием фильтрации с линейным предсказанием, как указывается на шаге S104. В соответствии с вариантом осуществления изобретения фильтр с линейным предсказанием может быть определен как

где M - порядок фильтра и a_m - коэффициенты фильтра (при a₀=1). Такой вид фильтра также известен, как кодирование с линейным предсказанием (LPC). Согласно вариантам осуществления изобретения отфильтрованный текущий кадр обрабатывается с применением фильтрации с линейным предсказанием для по меньшей мере части отфильтрованного текущего кадра. Разрыв может быть удален путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного фильтрацией с линейным предсказанием заранее заданного сигнала с использованием исходных состояний линейного фильтра кодирования с предсказанием, определенных в зависимости от последней части прошедшего кадра. Исходные состояния линейного фильтра кодирования с предсказанием могут быть определены в зависимости от последней части прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для текущего кадра. Изобретенный подход предпочтителен, поскольку он не требует фильтрации текущего кадра аудиосигнала с использованием коэффициента фильтр, который используется для прошедшего кадра и, таким образом, позволяет избежать проблем, которые возникают из-за несоответствия параметров фильтра для текущего кадра и для прошедшего кадра, поскольку они наблюдались в подходах предшествующего уровня техники, описанных выше со ссылкой на ФИГ. 2.

На ФИГ. 5 изображена схематическая структурная схема для обработки текущего аудиокадра аудиосигнала согласно вариантам осуществления настоящего изобретения, позволяющая избежать нежелательного искажения в выходном сигнале, несмотря на удаление разрывов. На ФИГ. 5 используются такие же ссылочные позиции, как на ФИГ. 1 и 2. Принимается текущий кадр n аудиосигнала 100, каждый кадр аудиосигнала 100 имеет множество образцов. Текущий кадр n аудиосигнала 100 обрабатывается блоком фильтра 102. По сравнению с подходами предыдущего уровня техники, представленными на ФИГ. 1 и 2, согласно вариантам осуществления изобретения, как описано со ссылкой на ФИГ. 5, отфильтрованный текущий кадр дополнительно обрабатывается в зависимости от ZIR-образцов, как схематически показано блоком 110. Согласно варианту осуществления изобретения, в зависимости от прошедшего кадра n-1 и в зависимости от LPC-фильтра, вырабатываются ZIR-образцы, как схематически показано блоком 112.

Функциональность блоков обработки 110 и 112 теперь будет описана более подробно. На ФИГ. 6 изображена блок-схема, представляющая функциональность блока обработки 112 по формированию ZIR-образцов. Как уже упоминалось выше, кадры аудиосигнала 100 фильтруются с использованием линейного фильтра H(z) с применением параметров фильтра с, выбранных или определенных для соответствующего кадра. Фильтр H(z) может быть рекурсивным фильтром, например, БИХ-фильтром, или он может быть нерекурсивным фильтром, например, КИХ-фильтром. В блоке обработки 112 используется LPC-фильтр, который может квантоваться или не квантоваться. LPC-фильтр имеет порядок M и может быть либо подсчитан по фильтрованному или нефильтрованному аудиосигналу, или может быть LPC-фильтром, который также используется в аудиокодеке. На первом шаге S200 M (M=порядку LPC-фильтра) последних образцов прошедшего кадра n-1 фильтруются фильтром H(z), однако, с использованием параметров фильтра или коэффициентов c₁ текущего кадра n. Шаг S200 таким образом создает первый фрагмент отфильтрованного сигнала. На шаге S202 M последних образцов отфильтрованного прошедшего кадра n-1 (M последних образцов прошедшего кадра отфильтрованы с использованием параметров фильтра или коэффициентов c₀ прошедшего кадра n-1) вычитаются из первого фрагмента отфильтрованного сигнала, представленного шагом S200, создавая тем самым второй фрагмент отфильтрованного сигнала. На шаге S204 применяется LPC-фильтр, имеющий порядок M, в частности, формируется отклик при отсутствии входного сигнала (ZIR) LPC-фильтра на шаге S204 путем фильтрации кадра нулевых образцов, причем исходные состояния фильтра равны второму фрагменту отфильтрованных сигналов, формируя тем самым ZIR. Согласно вариантам осуществления изобретения, ZIR может быть обработан функцией окна, так что его амплитуда быстро уменьшается до нуля.

ZIR, как описано выше со ссылкой на ФИГ. 5, применяется в блоке обработки 110, функциональность которого описывается со ссылкой на блок-схему на ФИГ. 7 для случая использования в качестве линейного фильтра H(z), рекурсивного фильтра, подобного БИХ-фильтру. Согласно варианту осуществления изобретения, описанному выше со ссылкой на ФИГ. 5, для удаления разрывов между текущим кадром и прошедшим кадром, избегая нежелательных искажений, фильтрация текущего кадра n включает в себя обработку (фильтрацию) текущего кадра n на последовательной основе, в которой образцы начального фрагмента обрабатываются согласно изобретенному подходу. Если говорить более конкретно, обрабатывается M образцов начального фрагмента текущего кадра n, и на первом шаге S300 переменные m устанавливаются на 0. На следующем шаге S302, образец m текущего кадра n фильтруется с использованием фильтра H(z) и коэффициентов фильтра или параметров c₁ для текущего кадра n. Таким образом, в отличие от традиционных подходов, текущий кадр, согласно изобретенному подходу, не фильтруется с использованием коэффициентов от прошедшего кадра, но только с коэффициентами от текущего кадра, что, как следствие, помогает избежать нежелательного искажения, которое имеется в традиционных подходах, несмотря на то, что разрывы удаляются. Шаг S302 получает отфильтрованный образец m, и на шаге S304 ZIR-образец, соответствующий образцу m, вычитается из отфильтрованного образца m, получая соответствующий образец отфильтрованного текущего кадра n. На шаге S306 определяется, будет ли обрабатывается последний образец M начального фрагмента текущего кадра n. В случае, когда не все M образцы начальных фрагментов обработаны, переменная m увеличивается, и шаги способа с S302 по S306 повторяются для следующего образца текущего кадра n. После того, как все M образцы начальных фрагментов будут обработаны, на шаге S308 оставшиеся образцы текущего кадра n фильтруются с применением параметров фильтра текущего кадра c₁, предоставляя тем самым отфильтрованный текущий кадр n, обработанный согласно изобретенному подходу, избегая нежелательного искажения при удалении разрывов между последовательными кадрами.

Согласно другому варианту осуществления изобретения, линейный фильтр H(z) является нерекурсивным фильтром, подобным КИХ-фильтру и ZIR, как описано выше со ссылкой на ФИГ. 5, применяется в блоке обработки 110. Функциональность данного варианта осуществления изобретения описывается со ссылкой на блок-схему на ФИГ. 8. Текущий кадр n, на шаге S400, фильтруется с использованием фильтра H(z) с применением коэффициентов фильтра или параметров c₁ для текущего кадра. Таким образом, в отличие от традиционных подходов, текущий кадр, согласно изобретенному подходу, не фильтруется с использованием коэффициентов от прошедшего кадра, но используются только коэффициенты из текущего кадра, которые, как следствие, помогают избежать нежелательного искажения, которое имеется при традиционных подходах, несмотря на то, что разрывы удаляются. На шаге S402 начальный фрагмент ZIR вычитается из соответствующего начального фрагмента отфильтрованного текущего кадра, предоставляя тем самым отфильтрованный текущий кадр n, имеющий начальный фрагмент, отфильтрованный/обработанный согласно изобретенному подходу, и оставшуюся часть, только отфильтрованную с использованием коэффициентов фильтра или параметров c₁ для текущего кадра, избегая тем самым нежелательного искажения при удалении разрывов между последовательными кадрами.

Изобретенный подход может быть применен в тех ситуациях, которые описаны выше, при фильтрации аудиосигнала. Согласно вариантам осуществления изобретения изобретенный подход также может быть применен на стороне устройства декодирования, например, при использовании выходного фильтра аудиокодека для снижения уровня шума кодирования между гармониками сигнала. Для обработки аудиокадров в устройства декодирования, выходной фильтр, согласно варианту осуществления изобретения, может быть следующим:

H(z)=(1 - B(z))/(1 - A(z)⋅z^-T),

где B(z) и A(z) являются двумя КИХ-фильтрами, и параметры фильтра H(z) являются коэффициентами КИХ-фильтров B(z) и A(z), и T обозначает временной сдвиг тона. При таком сценарии, фильтр также может ввести разрыв между двумя отфильтрованными кадрами, например, когда параметры фильтра последнего кадра c₀ отличаются от параметров фильтра текущего кадра c_1, и такой разрыв может создавать искажение в отфильтрованном аудиосигнале 104, например, "щелчок". Указанный разрыв удаляется путем обработки отфильтрованного текущего кадра, как описано выше.

Хотя некоторые аспекты описанной концепции были описаны в контексте устройства, то ясно, что данные аспекты также представляют собой описание соответствующего способа, в котором блок или устройство соответствует шагу способа или характеристике шага способа. Аналогично, аспекты, описанные в контексте шага способа, также представляют собой описание соответствующего блока, или элемента, или характеристику соответствующего устройства.

В зависимости от конкретных требований к реализации, варианты осуществления изобретения могут быть реализованы аппаратными средствами или программными средствами. Реализация может быть выполнена с использованием цифрового носителя информации, например, гибкого магнитного диска, DVD, Blue-Ray, CD, ПЗУ, ППЗУ, ЭППЗУ, ЭСППЗУ или флэш-памяти, имеющего электронночитаемый управляющий сигнал, хранимый на нем, который взаимодействует (или способен взаимодействовать) с программируемой компьютерной системой, таким образом, чтобы выполнялся соответствующий способ. Таким образом, цифровой носитель информации может быть машиночитаемым.

Некоторые варианты осуществления изобретения в соответствии с изобретением включают в себя носитель данных, имеющий электронночитаемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в настоящем документе.

Как правило, варианты осуществления настоящего изобретения могут быть реализованы в качестве компьютерного программного продукта с программным кодом, причем программный код для оперативного выполнения одного из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления изобретения включают в себя компьютерную программу для выполнения одного из способов, описанных в настоящем документе, хранящуюся на машиночитаемом носителе.

Другими словами, вариант осуществления изобретения по изобретенному способу является, таким образом, компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в настоящем документе, при выполнении компьютерной программы на компьютере.

Еще один вариант осуществления изобретенных способов является, таким образом, носителем данных (или цифровым носителем информации, или машиночитаемым носителем), включающим в себя записанную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.

Еще один вариант осуществления изобретенного способа является, таким образом, поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов может, например, быть сконфигурирована для передачи через соединение для передачи данных, например, через Интернет.

Еще один вариант осуществления изобретения включает в себя средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное для или приспособленное для выполнения одного из способов, описанных в настоящем документе.

Еще один вариант осуществления изобретения включает в себя компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.

В некоторых вариантах осуществления изобретения программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в настоящем документе. В некоторых вариантах осуществления изобретения программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем документе. Как правило, способы предпочтительно выполняются любым аппаратным устройством.

Описанные выше варианты осуществления изобретения являются лишь иллюстративными для принципов настоящего изобретения. Понятно, что модификации и вариации устройств и элементов, описанных в настоящем документе, будут очевидны для специалистов в данной области техники. Намерение, таким образом, должно быть ограничено только объемом приложенной формулы изобретения, а не конкретными деталями, представленными посредством описания и объяснения вариантов осуществления изобретения в настоящем документе.

Claims

1. Способ обработки аудиосигнала (100), включающий в себя:

использование фильтрации с линейным предсказанием для удаления (S102, S104, S300-S308, S400-S402) разрыва (106a, 106b) между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, причем способ включает в себя фильтрацию текущего кадра аудиосигнала и удаление разрыва путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного путем фильтрации с линейным предсказанием заранее заданного сигнала с исходными состояниями фильтра с линейным предсказанием, определенным в зависимости от последней части неотфильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.

2. Способ по п. 1, дополнительно включающий в себя расчет фильтра с линейным предсказанием отфильтрованного или неотфильтрованного аудиосигнала (100).

3. Способ по п. 2, в котором расчет фильтра с линейным предсказанием включает в себя расчет фильтра на основе прошедшего и/или текущего кадра аудиосигнала (100) или на основе последнего отфильтрованного кадра аудиосигнала (100) с использованием алгоритма Левинсона-Дарбина.

4. Способ по п. 1, в котором фильтр с линейным предсказанием включает в себя фильтр с линейным предсказанием аудиокодека.

5. Способ по п. 1, в котором удаление разрыва включает в себя обработку начального фрагмента отфильтрованного текущего кадра, причем начальный фрагмент текущего кадра имеет заранее заданное количество образцов, меньшее или равное общему числу образцов в текущем кадре, и обработка начального фрагмента текущего кадра включает в себя вычитание (S304, S402) начального фрагмента отклика при отсутствии входного сигнала (ZIR) из начального фрагмента отфильтрованного текущего кадра.

6. Способ по п. 5, включающий в себя фильтрацию (S400) текущего кадра аудиосигнала с использованием нерекурсивного фильтра, подобного КИХ-фильтру, для получения отфильтрованного текущего кадра.

7. Способ по п. 5, включающий в себя обработку неотфильтрованного текущего кадра аудиосигнала выборочным путем с использованием рекурсивного фильтра, подобного БИХ-фильтру, и причем обработка образца начального фрагмента текущего кадра включает в себя:

фильтрацию (S302) образца с применением рекурсивного фильтра с использованием параметров фильтра текущего кадра для получения отфильтрованного образца и

вычитание (S304) соответствующего ZIR-образца из отфильтрованного образа для получения соответствующего образца отфильтрованного текущего кадра.

8. Способ по п. 7, в котором фильтрацию (S302) и вычитание (S304) повторяют до тех пор, пока не будет обработан последний образец в начальном фрагменте текущего кадра, и способ дополнительно включает в себя фильтрацию (S306) оставшихся образцов в текущем кадре с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра.

9. Способ по п. 5, включающий в себя формирование ZIR, причем формирование ZIR включает в себя:

фильтрацию (S200) M последних образцов неотфильтрованного прошедшего кадра с использованием фильтра и параметров фильтра, используемых для фильтрации текущего кадра с целью получения первого фрагмента отфильтрованного сигнала, причем M представляет собой порядок фильтра с линейным предсказанием,

вычитание (S202) из первого фрагмента отфильтрованного сигнала M последних образцов отфильтрованного прошедшего кадра, отфильтрованного с использованием параметров фильтра прошедшего кадра, для формирования второго фрагмента отфильтрованного сигнала и

формирование (S204) ZIR фильтра с линейным предсказанием путем фильтрации кадра нулевых образцов кадра с использованием фильтра с линейным предсказанием и исходными состояниями, равными второму фрагменту отфильтрованного сигнала.

10. Способ по п. 9, включающий в себя обработку ZIR функцией окна, при которой его амплитуда быстрее уменьшается к нулю.

11.Машиночитаемый носитель информации, содержащий сохраненные на нем команды, которые при исполнении на компьютере выполняют способ по одному из пп. 1 - 10.

12. Устройство для обработки аудиосигнала (100), содержащее:

процессор (102, 110, 112), сконфигурированный для использования фильтрации с линейным предсказанием для удаления разрыва между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, причем процессор (102, 110, 112) сконфигурирован для фильтрации текущего кадра аудиосигнала и удаления разрыва путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного фильтрацией с линейным предсказанием заранее заданного сигнала с начальными состояниями фильтра с линейным предсказанием, определенными в зависимости от последней части нефильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.

13. Устройство аудиодекодирования (250), содержащее устройство по п. 12.

14. Устройство аудиокодирования (200), содержащее устройство по п. 12.