RU2665282C1 - Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования - Google Patents

Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования Download PDF

Info

Publication number
RU2665282C1
RU2665282C1 RU2017105447A RU2017105447A RU2665282C1 RU 2665282 C1 RU2665282 C1 RU 2665282C1 RU 2017105447 A RU2017105447 A RU 2017105447A RU 2017105447 A RU2017105447 A RU 2017105447A RU 2665282 C1 RU2665282 C1 RU 2665282C1
Authority
RU
Russia
Prior art keywords
filter
filtered
current frame
frame
audio signal
Prior art date
Application number
RU2017105447A
Other languages
English (en)
Inventor
Эммануэль РАВЕЛЛИ
Мануэль ЯНДЕР
Гжегош ПЕТШИК
Мартин ДИТЦ
Марк ГАЙЕР
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Application granted granted Critical
Publication of RU2665282C1 publication Critical patent/RU2665282C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/038Cross-faders therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/10Means associated with receiver for limiting or suppressing noise or interference
    • H04B1/1027Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Stereophonic System (AREA)

Abstract

Изобретение относится к обработке аудиосигнала, включающего аудиокадры. Технический результат – удаление разрывов между отфильтрованными аудиокадрами без потенциальных искажений в отфильтрованном аудиосигнале. Данный способ позволяет обрабатывать аудиосигнал, удалять разрыв между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, с использованием фильтрации с линейным предсказанием. 5 н. и 9 з.п. ф-лы, 8 ил.

Description

Настоящее изобретение относится к области аудиосигналов, в частности к методу обработки аудиосигнала, включающего в себя совокупность аудиокадров, в которых разрывы между последовательными отфильтрованными аудиокадрами снижаются или устраняются.
В области обработки аудиосигнала аудиосигнал может быть отфильтрован по разным причинам, например, фильтр долгосрочного предсказания может использоваться в устройстве кодирования аудиосигнала для ослабления или даже полного подавления набора гармоник в аудиосигнале.
Аудиосигнал включает множество аудиокадров и кадров, отфильтрованных с использованием фильтра долгосрочного предсказания. Когда рассматриваются два последовательных кадра аудиосигнала, прошедший кадр и текущий кадр, линейный фильтр H(z), имеющий набор параметров c, используется для фильтрации аудиосигнала. В частности, прошедший кадр фильтруется с использованием фильтра H(z) с применением первого набора параметров c0, который будет формировать так называемый отфильтрованный прошедший кадр. Текущий кадр фильтруется с использованием фильтра H(z) с применением набора параметров c1, который будет формировать отфильтрованный текущий кадр. На ФИГ. 1 показана структурна схема обработки последовательных кадров аудиосигнала согласно известному подходу. Представляется аудиосигнал 100, включающий в себя множество аудиокадров. Аудиосигнал 100 поступает в блок фильтрации 102, и текущий кадр n аудиосигнала 100 фильтруется. Блок фильтрации, помимо аудиосигнала 100, получает набор параметров фильтра cn для текущего кадра аудиосигнала. Блок фильтра 102 фильтрует текущий кадр n аудиосигнала и выводит отфильтрованный аудиосигнал 104, включающий в себя последовательно отфильтрованные кадры. На ФИГ. 1 схематически показаны отфильтрованный текущий кадр n, отфильтрованный прошедший кадр n-1 и отфильтрованный второй последний кадр n-2. Отфильтрованные кадры схематически представлены на ФИГ. 1, с соответствующими интервалами для схематического указания разрыва между ними 106a, 106b, которые могут быть включены в процесс фильтрации между отфильтрованными кадрами. Блок фильтрации 102 вызывает фильтрацию кадров аудиосигнала с использованием соответствующих параметров фильтра c0 и c1 для прошедшего кадра n-1 и текущего кадра n. В общем случае, блок фильтрации 102 может быть линейным фильтром H(z) и одним примером для такого линейного фильтра H(z) является упомянутый выше фильтр долгосрочного предсказания
H(z)=1 - g⋅z-T,
где параметрами фильтра являются усиление "g" и временной сдвиг тона "T". В более общем виде, фильтр долгосрочного предсказания может быть описан следующим образом:
H(z)=1 - g⋅A(z)⋅z-T,
где A(z) является КИХ-фильтром. Фильтр долгосрочного предсказания может использоваться для ослабления или даже для полного подавления набора гармоник в аудиосигнале. Однако, существует высокая вероятность введения разрыва 106a, 106b (см. ФИГ. 1) между отфильтрованным прошедшим кадром n-1 и отфильтрованным текущим кадром n, при использовании такого фильтра долгосрочного предсказания и когда параметры фильтра c0 прошедшего кадра отличаются от параметров фильтра c1 текущего кадра. Указанный разрыв может создавать искажения в отфильтрованном аудиосигнале 104, например, "щелчок".
Таким образом, в связи с тем, что вышеописанные проблемы с фильтрацией последовательных кадров, приводят к разрывам, которые, в свою очередь, могут создавать нежелательные искажения, необходим подход, который позволяет удалить возможный разрыв. В данной области техники известны несколько подходов предшествующего уровня, предназначенных для удаления разрыва отфильтрованных кадров аудиосигнала.
В случае если линейный фильтр H(z) является КИХ-фильтром, текущий кадр фильтруется с использованием параметров фильтра c1 текущего кадра для получения отфильтрованного текущего кадра. Кроме того, начальный фрагмент текущего кадра фильтруется с применением параметров фильтра прошедшего кадра c0 для получения фрагмента отфильтрованного кадра, и затем над начальным фрагментом отфильтрованного текущего кадра и фрагментом отфильтрованного кадра выполняется операция перекрытия с суммированием или плавное микширование. На ФИГ. 2 показана структурная схема такого традиционного подхода для обработки последовательных аудиокадров с целью удаления разрыва. При сравнении с ФИГ. 1, блок фильтра 102 включает в себя дополнительный блок обработки 108 для выполнения операции перекрытия с суммированием или плавного микширования. В отфильтрованном аудиосигнале 104, не будет присутствовать или будет уменьшенный разрыв между последовательно отфильтрованными кадрами, как это схематично изображено на ФИГ. 2, показывающими последовательно отфильтрованные кадры n, n-1 и n-2 без интервалов, представленных на ФИГ. 1.
В других подходах предшествующего уровня техники, фильтр H(z) может быть фильтром, имеющим рекурсивную часть, например, БИХ-фильтр. В таком случае, подход, как описано ранее по отношению к ФИГ. 2, применяется на последовательной основе. На первом этапе обработка начинается с первого образца начального фрагмента текущего кадра n, фильтруемого с использованием параметров фильтра c0 прошедшего кадра n-1, получая первый отфильтрованный образец. Образец также фильтруется с использованием параметров фильтра c1 текущего кадра n, создавая второй отфильтрованный образец. Далее, на основе первого и второго отфильтрованных образцов выполняется операция перекрытия с суммированием или плавного микширования, которая получает соответствующий образец отфильтрованного текущего кадра n. Затем обрабатывается следующий образец и вышеуказанные шаги повторяются вплоть до тех пор, пока не будет обработан последний образец начального фрагмента текущего кадра n. Оставшиеся образцы текущего кадра n фильтруются с использованием параметров фильтра c1 текущего кадра n.
Примеры упомянутых выше известных подходов для удаления разрыва из последовательно отфильтрованных кадров описываются, например, в US 5012517 A в контексте изменения устройством кодирования, в EP 0732687 A2 в контексте расширителя пропускной способности речи, в US 5999899 A в контексте изменения устройством аудиокодирования или в US 7353168 B2 в контексте постфильтра декодированной речи.
Хотя приведенные выше подходы эффективны для удаления нежелательных разрывов сигнала, поскольку указанные подходы работают на конкретном фрагменте текущего кадра, на начальном фрагменте, чтобы оставаться эффективным, длина фрагмента кадра должна быть достаточно продолжительной, например, в случае, когда длина кадра составляет 20 мс, фрагмент кадра или длина начального фрагмента должна составлять до 5 мс. В некоторых случаях, такой фрагмент может быть слишком длинным, особенно в ситуациях, когда параметры фильтра c0 прошедшего кадра не достаточно хорошо применимы к текущему кадру, и это может привести к дополнительным искажениям. Одним из примеров является гармонический аудиосигнал с быстро изменяющимся тоном и фильтр долгосрочного предсказания, который конструируется для уменьшения амплитуды гармоник. В таком случае, временной сдвиг тона отличается от одного кадра к другому. Фильтр долгосрочного предсказания с оценкой тона в текущем кадре будет эффективно уменьшать амплитуду гармоник в текущем кадре, но это не приведет к уменьшению амплитуды гармоник, если они используются в другом кадре (например, в начальном фрагменте следующего кадра), где тон аудиосигнала будет отличаться. Это может привести к более плохому результату, за счет уменьшения амплитуды не относящихся к гармоническим компонентов сигнала, вводя искажения в сигнал.
Задачей, лежащей в основе настоящего изобретения, является создание усовершенствованного подхода к удалению разрывов между отфильтрованными аудиокадрами без каких-либо потенциальных искажений в отфильтрованном аудиосигнале.
Эта цель достигается с помощью способа и устройства в соответствии с независимыми пунктами формулы изобретения.
Настоящее изобретение относится к способу обработки аудиосигнала, при этом способ включает в себя удаление разрыва между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала с использованием фильтрации с линейным предсказанием.
Фильтр с линейным предсказанием определен как
Figure 00000001
где M - порядок фильтра и am- коэффициенты фильтра (при a0=1). Такой вид фильтра также известен, как кодирование с линейным предсказанием (LPC).
Согласно вариантам осуществления изобретения, способ включает в себя фильтрацию текущего кадра аудиосигнала и удаление разрыва путем изменения начального фрагмента отфильтрованного текущего кадра при помощи сигнала, полученного посредством фильтрации с линейным предсказанием заранее заданного сигнала с использованием исходных состояний фильтра с линейным предсказанием, определяемого в зависимости от последней части прошедшего кадра.
Согласно вариантам осуществления изобретения, исходные состояния фильтра с линейным предсказанием определяются в зависимости от последней части неотфильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.
Согласно вариантам осуществления изобретения, способ включает в себя расчет фильтра с линейным предсказанием на отфильтрованном или неотфильтрованном аудиосигнале.
Согласно вариантам осуществления изобретения, расчет фильтра с линейным предсказанием включает в себя расчет фильтра на основе прошедшего или текущего кадра аудиосигнала или на основе последнего отфильтрованного кадра аудиосигнала с использованием алгоритма Левинсона-Дарбина.
Согласно вариантам осуществления изобретения, фильтр с линейным предсказанием включает в себя фильтр с линейным предсказанием аудиокодека.
Согласно вариантам осуществления изобретения, удаление разрыва включает в себя обработку начального фрагмента отфильтрованного текущего кадра, причем начальный фрагмент текущего кадра имеет заранее заданное количество образцов, которое меньше или равно общему количеству образцов в текущем кадре, и обработка начального фрагмента текущего кадра включает в себя вычитание начального фрагмента отклика при отсутствии входного сигнала (ZIR) из начального фрагмента отфильтрованного текущего кадра.
Согласно вариантам осуществления изобретения способ включает в себя фильтрацию текущего кадра аудиосигнала с использованием нерекурсивного фильтра, подобного КИХ-фильтру, для получения отфильтрованного текущего кадра.
Согласно вариантам осуществления изобретения, способ включает в себя обработку неотфильтрованного текущего кадра аудиосигнала на последовательной основе с использованием рекурсивного фильтра, подобного БИХ-фильтру, и в котором обработка образца начального фрагмента текущего кадра включает в себя:
фильтрацию образца с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра для получения отфильтрованного образца и
вычитание соответствующего ZIR-образца из отфильтрованного образца для получения соответствующего образца отфильтрованного текущего кадра.
Согласно вариантам осуществления изобретения фильтрация и вычитание повторяются до обработки последнего образца в начальном фрагменте текущего кадра, и способ дополнительно включает в себя фильтрацию оставшихся образцов в текущем кадре с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра.
Согласно вариантам осуществления изобретения, способ включает в себя формирование ZIR, в котором формирование ZIR включает в себя:
фильтрацию M последних образцов неотфильтрованного прошедшего кадра с использованием фильтра и параметров фильтра, используемых для фильтрации текущего кадра с целью получения первого фрагмента отфильтрованного сигнала, в котором M является порядком фильтра с линейным предсказанием,
вычитание из первого фрагмента отфильтрованного сигнала M последних образцов отфильтрованного прошедшего кадра, отфильтрованного с использованием параметров фильтра прошедшего кадра, для формирования второго фрагмента отфильтрованного сигнала и
формирование ZIR-фильтра с линейным предсказанием путем фильтрации кадра нулевых образцов с использованием фильтра с линейным предсказанием и исходными состояниями, равными второму фрагменту отфильтрованного сигнала.
Согласно вариантам осуществления изобретения способ включает в себя обработку ZIR функцией окна так, что его амплитуда быстро снижается до нуля.
Настоящее изобретение, основанное на открытиях изобретателя в том, что данные проблемы, которые были признаны в традиционных подходах по удалению сигнала разрывов, которые приводят к дополнительному нежелательному искажению, указанному выше, имеются в основном за счет обработки текущего кадра или по меньшей мере его фрагмента в зависимости от параметров фильтра прошедшего кадра. Согласно изобретенному подходу данной методики избегают, а именно, изобретенный подход не фильтрует фрагмент текущего кадра с использованием параметров фильтра прошедшего кадра и, таким образом, позволяет избежать проблем, упомянутых выше. Согласно вариантам осуществления изобретения для удаления разрыва используется LPC-фильтр (фильтр с линейным предсказанием) для удаления разрыва. LPC-фильтр может быть рассчитан по аудиосигналу, и поэтому данных подход является хорошей моделью спектральной формы аудиосигнала таким образом, что при использовании LPC-фильтра, спектральная форма аудиосигнала будет маскировать разрыв. В варианте осуществления изобретения LPC-фильтр может быть рассчитан на основе неотфильтрованного аудиосигнала или на основе аудиосигнала, который отфильтрован линейным фильтром H(z), упомянутым выше. Согласно вариантам осуществления изобретения LPC-фильтр может быть рассчитан с использованием аудиосигнала, например, текущего кадра и/или прошедшего кадра и алгоритма Левинсона-Дарбина. Кроме того, он может быть вычислен только в зависимости от последнего отфильтрованного кадра сигнала с использованием алгоритма Левинсона-Дарбина.
Еще в других вариантах осуществления изобретения, аудиокодек для обработки аудиосигнал может использовать линейный фильтр H(z), а также может использовать LPC-фильтр, квантуемый или нет, например, для формирования шума квантования в кодеке с преобразованием. В таком варианте осуществления изобретения данный имеющийся LPC-фильтр может быть непосредственно использован для сглаживания разрыва без дополнительной сложности, необходимой для расчета нового LPC-фильтра.
В дальнейшем варианты осуществления настоящего изобретения будут описываться со ссылкой на прилагаемые чертежи, на которых:
на ФИГ. 1 изображена структурная схема для обработки последовательных кадров аудиосигнала согласно традиционному подходу,
на ФИГ. 2 изображена структурная схема другого традиционного подхода для обработки последовательных аудиокадров с целью удаления разрыва,
на ФИГ. 3 изображена упрощенная структурная схема системы для передачи аудиосигналов, реализующая изобретенный подход для удаления разрыва между последовательными кадрами аудиосигнала на стороне устройства кодирования и/или на стороне устройства декодирования,
на ФИГ. 4 изображена блок-схема, представляющая изобретенный подход для удаления разрыва между последовательными кадрами аудиосигнала согласно варианту осуществления изобретения,
на ФИГ. 5 изображена схематическая структурная схема для обработки текущего аудиокадра согласно вариантам осуществления настоящего изобретения, устраняющая нежелательное искажение в выходном сигнале, независимо от устранения разрывов,
на ФИГ. 6 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по формированию ZIR,
на. ФИГ. 7 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по обработке отфильтрованного начального фрагмента текущего кадра в случае блока фильтра, включающего в себя рекурсивный фильтр, подобный БИХ-фильтру, и
на ФИГ. 8 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по обработке начального фрагмента отфильтрованного текущего кадра в случае блока фильтра, включающего в себя нерекурсивный фильтр, подобный КИХ-фильтру.
В дальнейшем, варианты осуществления изобретенного подхода будут описаны более подробно, и следует отметить, что элементы на прилагаемых чертежах, имеющие такую же или аналогичную функциональность, обозначаются одинаковыми ссылочными позициями.
На ФИГ. 3 изображена упрощенная структурная схема системы для передачи аудиосигналов, реализующая изобретенный подход на стороне устройства кодирования и/или на стороне устройства декодирования. Система на ФИГ. 3 включает в себя устройство кодирования 200, принимающее на входе 202 аудиосигнал 204. Устройство кодирования включает в себя процессор кодирования 206, принимающий аудиосигнал 204 и формирующий кодированный аудиосигнал, который предоставляется на выходе 208 устройства кодирования. Процессор кодирования может быть запрограммирован или создан для реализации изобретенного подхода с целью обработки полученных последовательных аудиокадров аудиосигнала, чтобы избежать разрывов. В других вариантах осуществления изобретения устройству кодирования нет необходимости быть частью передающей системы, однако, оно может быть автономным устройством, формирующим кодированные аудиосигналы, или быть частью передатчика аудиосигнала. Согласно варианту осуществления изобретения устройство кодирования 200 может содержать антенну 210, чтобы обеспечить беспроводную передачу аудиосигнала, как показано позицией 212. В других вариантах осуществления изобретения устройство кодирования 200 может выводить кодированный аудиосигнал, представленный на выходе 208 с использованием проводной линии связи, как это, например, показано на ссылочной позиции 214.
Система на ФИГ. 3 дополнительно включает в себя устройство декодирования 250, имеющее вход 252, принимающий кодированный аудиосигнал для обработки устройством декодирования 250, например, через проводную линию 214 или через антенну 254. Устройство декодирования 250 включает в себя процессор декодирования 256, обрабатывающий кодированный сигнал и предоставляющий декодированный аудиосигнал 258 на выходе 260. Процессор декодирования 256 может быть реализован для работы согласно изобретенному подходу на последовательности кадров, которые отфильтрованы таким образом, что избегается появление разрывов. В других вариантах осуществления изобретения устройству декодирования нет необходимости быть частью передающей системы, скорее, оно может быть автономным устройством для декодирования кодированных аудиосигналов, или оно может быть частью приемника аудиосигнала.
В дальнейшем, варианты осуществления изобретенного подхода, которые могут быть реализованы в по меньшей мере одном процессоре кодирования 206 и процессоре декодирования 256 будут описаны более подробно. На ФИГ. 4 изображена блок-схема обработки текущего кадра аудиосигнала согласно варианту осуществления изобретенного подхода. Будет описываться обработка текущего кадра и предполагается, что прошедший кадр уже обработан с использованием такой же техники, что описывается ниже. Согласно настоящему изобретению, на шаге S100a принимается текущий кадр аудиосигнала. Текущий кадр фильтруется на шаге S102, например, таким образом, как описано выше со ссылкой на ФИГ. 1 и 2 (см. блок фильтра 102). Согласно изобретенному подходу разрыв между отфильтрованным прошедшим кадром n-1 и отфильтрованным текущим кадром n (см. ФИГ. 1 или 2) будет удален с использованием фильтрации с линейным предсказанием, как указывается на шаге S104. В соответствии с вариантом осуществления изобретения фильтр с линейным предсказанием может быть определен как
Figure 00000001
где M - порядок фильтра и am - коэффициенты фильтра (при a0=1). Такой вид фильтра также известен, как кодирование с линейным предсказанием (LPC). Согласно вариантам осуществления изобретения отфильтрованный текущий кадр обрабатывается с применением фильтрации с линейным предсказанием для по меньшей мере части отфильтрованного текущего кадра. Разрыв может быть удален путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного фильтрацией с линейным предсказанием заранее заданного сигнала с использованием исходных состояний линейного фильтра кодирования с предсказанием, определенных в зависимости от последней части прошедшего кадра. Исходные состояния линейного фильтра кодирования с предсказанием могут быть определены в зависимости от последней части прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для текущего кадра. Изобретенный подход предпочтителен, поскольку он не требует фильтрации текущего кадра аудиосигнала с использованием коэффициента фильтр, который используется для прошедшего кадра и, таким образом, позволяет избежать проблем, которые возникают из-за несоответствия параметров фильтра для текущего кадра и для прошедшего кадра, поскольку они наблюдались в подходах предшествующего уровня техники, описанных выше со ссылкой на ФИГ. 2.
На ФИГ. 5 изображена схематическая структурная схема для обработки текущего аудиокадра аудиосигнала согласно вариантам осуществления настоящего изобретения, позволяющая избежать нежелательного искажения в выходном сигнале, несмотря на удаление разрывов. На ФИГ. 5 используются такие же ссылочные позиции, как на ФИГ. 1 и 2. Принимается текущий кадр n аудиосигнала 100, каждый кадр аудиосигнала 100 имеет множество образцов. Текущий кадр n аудиосигнала 100 обрабатывается блоком фильтра 102. По сравнению с подходами предыдущего уровня техники, представленными на ФИГ. 1 и 2, согласно вариантам осуществления изобретения, как описано со ссылкой на ФИГ. 5, отфильтрованный текущий кадр дополнительно обрабатывается в зависимости от ZIR-образцов, как схематически показано блоком 110. Согласно варианту осуществления изобретения, в зависимости от прошедшего кадра n-1 и в зависимости от LPC-фильтра, вырабатываются ZIR-образцы, как схематически показано блоком 112.
Функциональность блоков обработки 110 и 112 теперь будет описана более подробно. На ФИГ. 6 изображена блок-схема, представляющая функциональность блока обработки 112 по формированию ZIR-образцов. Как уже упоминалось выше, кадры аудиосигнала 100 фильтруются с использованием линейного фильтра H(z) с применением параметров фильтра с, выбранных или определенных для соответствующего кадра. Фильтр H(z) может быть рекурсивным фильтром, например, БИХ-фильтром, или он может быть нерекурсивным фильтром, например, КИХ-фильтром. В блоке обработки 112 используется LPC-фильтр, который может квантоваться или не квантоваться. LPC-фильтр имеет порядок M и может быть либо подсчитан по фильтрованному или нефильтрованному аудиосигналу, или может быть LPC-фильтром, который также используется в аудиокодеке. На первом шаге S200 M (M=порядку LPC-фильтра) последних образцов прошедшего кадра n-1 фильтруются фильтром H(z), однако, с использованием параметров фильтра или коэффициентов c1 текущего кадра n. Шаг S200 таким образом создает первый фрагмент отфильтрованного сигнала. На шаге S202 M последних образцов отфильтрованного прошедшего кадра n-1 (M последних образцов прошедшего кадра отфильтрованы с использованием параметров фильтра или коэффициентов c0 прошедшего кадра n-1) вычитаются из первого фрагмента отфильтрованного сигнала, представленного шагом S200, создавая тем самым второй фрагмент отфильтрованного сигнала. На шаге S204 применяется LPC-фильтр, имеющий порядок M, в частности, формируется отклик при отсутствии входного сигнала (ZIR) LPC-фильтра на шаге S204 путем фильтрации кадра нулевых образцов, причем исходные состояния фильтра равны второму фрагменту отфильтрованных сигналов, формируя тем самым ZIR. Согласно вариантам осуществления изобретения, ZIR может быть обработан функцией окна, так что его амплитуда быстро уменьшается до нуля.
ZIR, как описано выше со ссылкой на ФИГ. 5, применяется в блоке обработки 110, функциональность которого описывается со ссылкой на блок-схему на ФИГ. 7 для случая использования в качестве линейного фильтра H(z), рекурсивного фильтра, подобного БИХ-фильтру. Согласно варианту осуществления изобретения, описанному выше со ссылкой на ФИГ. 5, для удаления разрывов между текущим кадром и прошедшим кадром, избегая нежелательных искажений, фильтрация текущего кадра n включает в себя обработку (фильтрацию) текущего кадра n на последовательной основе, в которой образцы начального фрагмента обрабатываются согласно изобретенному подходу. Если говорить более конкретно, обрабатывается M образцов начального фрагмента текущего кадра n, и на первом шаге S300 переменные m устанавливаются на 0. На следующем шаге S302, образец m текущего кадра n фильтруется с использованием фильтра H(z) и коэффициентов фильтра или параметров c1 для текущего кадра n. Таким образом, в отличие от традиционных подходов, текущий кадр, согласно изобретенному подходу, не фильтруется с использованием коэффициентов от прошедшего кадра, но только с коэффициентами от текущего кадра, что, как следствие, помогает избежать нежелательного искажения, которое имеется в традиционных подходах, несмотря на то, что разрывы удаляются. Шаг S302 получает отфильтрованный образец m, и на шаге S304 ZIR-образец, соответствующий образцу m, вычитается из отфильтрованного образца m, получая соответствующий образец отфильтрованного текущего кадра n. На шаге S306 определяется, будет ли обрабатывается последний образец M начального фрагмента текущего кадра n. В случае, когда не все M образцы начальных фрагментов обработаны, переменная m увеличивается, и шаги способа с S302 по S306 повторяются для следующего образца текущего кадра n. После того, как все M образцы начальных фрагментов будут обработаны, на шаге S308 оставшиеся образцы текущего кадра n фильтруются с применением параметров фильтра текущего кадра c1, предоставляя тем самым отфильтрованный текущий кадр n, обработанный согласно изобретенному подходу, избегая нежелательного искажения при удалении разрывов между последовательными кадрами.
Согласно другому варианту осуществления изобретения, линейный фильтр H(z) является нерекурсивным фильтром, подобным КИХ-фильтру и ZIR, как описано выше со ссылкой на ФИГ. 5, применяется в блоке обработки 110. Функциональность данного варианта осуществления изобретения описывается со ссылкой на блок-схему на ФИГ. 8. Текущий кадр n, на шаге S400, фильтруется с использованием фильтра H(z) с применением коэффициентов фильтра или параметров c1 для текущего кадра. Таким образом, в отличие от традиционных подходов, текущий кадр, согласно изобретенному подходу, не фильтруется с использованием коэффициентов от прошедшего кадра, но используются только коэффициенты из текущего кадра, которые, как следствие, помогают избежать нежелательного искажения, которое имеется при традиционных подходах, несмотря на то, что разрывы удаляются. На шаге S402 начальный фрагмент ZIR вычитается из соответствующего начального фрагмента отфильтрованного текущего кадра, предоставляя тем самым отфильтрованный текущий кадр n, имеющий начальный фрагмент, отфильтрованный/обработанный согласно изобретенному подходу, и оставшуюся часть, только отфильтрованную с использованием коэффициентов фильтра или параметров c1 для текущего кадра, избегая тем самым нежелательного искажения при удалении разрывов между последовательными кадрами.
Изобретенный подход может быть применен в тех ситуациях, которые описаны выше, при фильтрации аудиосигнала. Согласно вариантам осуществления изобретения изобретенный подход также может быть применен на стороне устройства декодирования, например, при использовании выходного фильтра аудиокодека для снижения уровня шума кодирования между гармониками сигнала. Для обработки аудиокадров в устройства декодирования, выходной фильтр, согласно варианту осуществления изобретения, может быть следующим:
H(z)=(1 - B(z))/(1 - A(z)⋅z-T),
где B(z) и A(z) являются двумя КИХ-фильтрами, и параметры фильтра H(z) являются коэффициентами КИХ-фильтров B(z) и A(z), и T обозначает временной сдвиг тона. При таком сценарии, фильтр также может ввести разрыв между двумя отфильтрованными кадрами, например, когда параметры фильтра последнего кадра c0 отличаются от параметров фильтра текущего кадра c1, и такой разрыв может создавать искажение в отфильтрованном аудиосигнале 104, например, "щелчок". Указанный разрыв удаляется путем обработки отфильтрованного текущего кадра, как описано выше.
Хотя некоторые аспекты описанной концепции были описаны в контексте устройства, то ясно, что данные аспекты также представляют собой описание соответствующего способа, в котором блок или устройство соответствует шагу способа или характеристике шага способа. Аналогично, аспекты, описанные в контексте шага способа, также представляют собой описание соответствующего блока, или элемента, или характеристику соответствующего устройства.
В зависимости от конкретных требований к реализации, варианты осуществления изобретения могут быть реализованы аппаратными средствами или программными средствами. Реализация может быть выполнена с использованием цифрового носителя информации, например, гибкого магнитного диска, DVD, Blue-Ray, CD, ПЗУ, ППЗУ, ЭППЗУ, ЭСППЗУ или флэш-памяти, имеющего электронночитаемый управляющий сигнал, хранимый на нем, который взаимодействует (или способен взаимодействовать) с программируемой компьютерной системой, таким образом, чтобы выполнялся соответствующий способ. Таким образом, цифровой носитель информации может быть машиночитаемым.
Некоторые варианты осуществления изобретения в соответствии с изобретением включают в себя носитель данных, имеющий электронночитаемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в настоящем документе.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы в качестве компьютерного программного продукта с программным кодом, причем программный код для оперативного выполнения одного из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, храниться на машиночитаемом носителе.
Другие варианты осуществления изобретения включают в себя компьютерную программу для выполнения одного из способов, описанных в настоящем документе, хранящуюся на машиночитаемом носителе.
Другими словами, вариант осуществления изобретения по изобретенному способу является, таким образом, компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в настоящем документе, при выполнении компьютерной программы на компьютере.
Еще один вариант осуществления изобретенных способов является, таким образом, носителем данных (или цифровым носителем информации, или машиночитаемым носителем), включающим в себя записанную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.
Еще один вариант осуществления изобретенного способа является, таким образом, поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов может, например, быть сконфигурирована для передачи через соединение для передачи данных, например, через Интернет.
Еще один вариант осуществления изобретения включает в себя средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное для или приспособленное для выполнения одного из способов, описанных в настоящем документе.
Еще один вариант осуществления изобретения включает в себя компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.
В некоторых вариантах осуществления изобретения программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в настоящем документе. В некоторых вариантах осуществления изобретения программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем документе. Как правило, способы предпочтительно выполняются любым аппаратным устройством.
Описанные выше варианты осуществления изобретения являются лишь иллюстративными для принципов настоящего изобретения. Понятно, что модификации и вариации устройств и элементов, описанных в настоящем документе, будут очевидны для специалистов в данной области техники. Намерение, таким образом, должно быть ограничено только объемом приложенной формулы изобретения, а не конкретными деталями, представленными посредством описания и объяснения вариантов осуществления изобретения в настоящем документе.

Claims (21)

1. Способ обработки аудиосигнала (100), включающий в себя:
использование фильтрации с линейным предсказанием для удаления (S102, S104, S300-S308, S400-S402) разрыва (106a, 106b) между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, причем способ включает в себя фильтрацию текущего кадра аудиосигнала и удаление разрыва путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного путем фильтрации с линейным предсказанием заранее заданного сигнала с исходными состояниями фильтра с линейным предсказанием, определенным в зависимости от последней части неотфильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.
2. Способ по п. 1, дополнительно включающий в себя расчет фильтра с линейным предсказанием отфильтрованного или неотфильтрованного аудиосигнала (100).
3. Способ по п. 2, в котором расчет фильтра с линейным предсказанием включает в себя расчет фильтра на основе прошедшего и/или текущего кадра аудиосигнала (100) или на основе последнего отфильтрованного кадра аудиосигнала (100) с использованием алгоритма Левинсона-Дарбина.
4. Способ по п. 1, в котором фильтр с линейным предсказанием включает в себя фильтр с линейным предсказанием аудиокодека.
5. Способ по п. 1, в котором удаление разрыва включает в себя обработку начального фрагмента отфильтрованного текущего кадра, причем начальный фрагмент текущего кадра имеет заранее заданное количество образцов, меньшее или равное общему числу образцов в текущем кадре, и обработка начального фрагмента текущего кадра включает в себя вычитание (S304, S402) начального фрагмента отклика при отсутствии входного сигнала (ZIR) из начального фрагмента отфильтрованного текущего кадра.
6. Способ по п. 5, включающий в себя фильтрацию (S400) текущего кадра аудиосигнала с использованием нерекурсивного фильтра, подобного КИХ-фильтру, для получения отфильтрованного текущего кадра.
7. Способ по п. 5, включающий в себя обработку неотфильтрованного текущего кадра аудиосигнала выборочным путем с использованием рекурсивного фильтра, подобного БИХ-фильтру, и причем обработка образца начального фрагмента текущего кадра включает в себя:
фильтрацию (S302) образца с применением рекурсивного фильтра с использованием параметров фильтра текущего кадра для получения отфильтрованного образца и
вычитание (S304) соответствующего ZIR-образца из отфильтрованного образа для получения соответствующего образца отфильтрованного текущего кадра.
8. Способ по п. 7, в котором фильтрацию (S302) и вычитание (S304) повторяют до тех пор, пока не будет обработан последний образец в начальном фрагменте текущего кадра, и способ дополнительно включает в себя фильтрацию (S306) оставшихся образцов в текущем кадре с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра.
9. Способ по п. 5, включающий в себя формирование ZIR, причем формирование ZIR включает в себя:
фильтрацию (S200) M последних образцов неотфильтрованного прошедшего кадра с использованием фильтра и параметров фильтра, используемых для фильтрации текущего кадра с целью получения первого фрагмента отфильтрованного сигнала, причем M представляет собой порядок фильтра с линейным предсказанием,
вычитание (S202) из первого фрагмента отфильтрованного сигнала M последних образцов отфильтрованного прошедшего кадра, отфильтрованного с использованием параметров фильтра прошедшего кадра, для формирования второго фрагмента отфильтрованного сигнала и
формирование (S204) ZIR фильтра с линейным предсказанием путем фильтрации кадра нулевых образцов кадра с использованием фильтра с линейным предсказанием и исходными состояниями, равными второму фрагменту отфильтрованного сигнала.
10. Способ по п. 9, включающий в себя обработку ZIR функцией окна, при которой его амплитуда быстрее уменьшается к нулю.
11.Машиночитаемый носитель информации, содержащий сохраненные на нем команды, которые при исполнении на компьютере выполняют способ по одному из пп. 1 - 10.
12. Устройство для обработки аудиосигнала (100), содержащее:
процессор (102, 110, 112), сконфигурированный для использования фильтрации с линейным предсказанием для удаления разрыва между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, причем процессор (102, 110, 112) сконфигурирован для фильтрации текущего кадра аудиосигнала и удаления разрыва путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного фильтрацией с линейным предсказанием заранее заданного сигнала с начальными состояниями фильтра с линейным предсказанием, определенными в зависимости от последней части нефильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.
13. Устройство аудиодекодирования (250), содержащее устройство по п. 12.
14. Устройство аудиокодирования (200), содержащее устройство по п. 12.
RU2017105447A 2014-07-28 2015-07-03 Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования RU2665282C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14178821.6 2014-07-28
EP14178821.6A EP2980796A1 (en) 2014-07-28 2014-07-28 Method and apparatus for processing an audio signal, audio decoder, and audio encoder
PCT/EP2015/065219 WO2016015950A1 (en) 2014-07-28 2015-07-03 Method and apparatus for precessing an audio signal, audio decoder, and audio encoder

Publications (1)

Publication Number Publication Date
RU2665282C1 true RU2665282C1 (ru) 2018-08-28

Family

ID=51224879

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017105447A RU2665282C1 (ru) 2014-07-28 2015-07-03 Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования

Country Status (18)

Country Link
US (5) US20170133028A1 (ru)
EP (6) EP2980796A1 (ru)
JP (4) JP6503051B2 (ru)
KR (5) KR102615475B1 (ru)
CN (2) CN113012704B (ru)
AR (1) AR101287A1 (ru)
AU (1) AU2015295709B2 (ru)
CA (6) CA3193302A1 (ru)
ES (4) ES2960422T3 (ru)
HK (1) HK1259289A1 (ru)
MX (1) MX362737B (ru)
MY (1) MY179016A (ru)
PL (4) PL3654333T3 (ru)
PT (3) PT3407351T (ru)
RU (1) RU2665282C1 (ru)
SG (1) SG11201700684YA (ru)
TW (1) TWI595480B (ru)
WO (1) WO2016015950A1 (ru)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
CN117040487B (zh) * 2023-10-08 2024-01-02 武汉海微科技有限公司 音频信号处理的滤波方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2183034C2 (ru) * 1994-02-16 2002-05-27 Квэлкомм Инкорпорейтед Вокодерная интегральная схема прикладной ориентации
RU2199157C2 (ru) * 1997-03-03 2003-02-20 Телефонактиеболагет Лм Эрикссон (Пабл) Способ последующей обработки с высокой разрешающей способностью для речевого декодера
WO2007138511A1 (en) * 2006-05-30 2007-12-06 Koninklijke Philips Electronics N.V. Linear predictive coding of an audio signal
US7353168B2 (en) * 2001-10-03 2008-04-01 Broadcom Corporation Method and apparatus to eliminate discontinuities in adaptively filtered signals
US20090083047A1 (en) * 2007-09-25 2009-03-26 Apple Inc. Zero-gap playback using predictive mixing
EP2144171A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2011085483A1 (en) * 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering
US8000969B2 (en) * 2006-12-19 2011-08-16 Nuance Communications, Inc. Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges
RU2498419C2 (ru) * 2008-07-11 2013-11-10 Фраунхофер-Гезелльшафт цур Фёердерунг дер ангевандтен Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5012517A (en) 1989-04-18 1991-04-30 Pacific Communication Science, Inc. Adaptive transform coder having long term predictor
ES2225321T3 (es) * 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
GB2326572A (en) 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
WO2004047305A1 (ja) 2002-11-21 2004-06-03 Nippon Telegraph And Telephone Corporation ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
JP4606264B2 (ja) * 2005-07-19 2011-01-05 三洋電機株式会社 ノイズキャンセラ
CN101197134A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 消除编码模式切换影响的方法和装置以及解码方法和装置
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
CN101527138B (zh) 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
ES2796493T3 (es) * 2008-03-20 2020-11-27 Fraunhofer Ges Forschung Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio
RU2492530C2 (ru) * 2008-07-11 2013-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
CN101355692B (zh) * 2008-07-30 2013-03-20 浙江大学 一种实时跟踪运动目标区域的智能监控装置
CA2763793C (en) * 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
KR101734948B1 (ko) * 2009-10-09 2017-05-12 삼성전자주식회사 파워 헤드룸 보고, 자원 할당 및 전력 제어 방법
JP5247937B2 (ja) * 2009-10-20 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号符号器、オーディオ信号復号器、エイリアシング消去を用いたオーディオ信号の符号化又は復号化方法
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CA2804548C (en) * 2010-07-08 2016-06-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Coder using forward aliasing cancellation
CN101976566B (zh) * 2010-07-09 2012-05-02 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
US8738385B2 (en) * 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN102368385B (zh) * 2011-09-07 2013-08-14 中科开元信息技术(北京)有限公司 后向块自适应Golomb-Rice编解码方法及装置
US9043201B2 (en) * 2012-01-03 2015-05-26 Google Technology Holdings LLC Method and apparatus for processing audio frames to transition between different codecs
JP6126006B2 (ja) * 2012-05-11 2017-05-10 パナソニック株式会社 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2183034C2 (ru) * 1994-02-16 2002-05-27 Квэлкомм Инкорпорейтед Вокодерная интегральная схема прикладной ориентации
RU2199157C2 (ru) * 1997-03-03 2003-02-20 Телефонактиеболагет Лм Эрикссон (Пабл) Способ последующей обработки с высокой разрешающей способностью для речевого декодера
US7353168B2 (en) * 2001-10-03 2008-04-01 Broadcom Corporation Method and apparatus to eliminate discontinuities in adaptively filtered signals
WO2007138511A1 (en) * 2006-05-30 2007-12-06 Koninklijke Philips Electronics N.V. Linear predictive coding of an audio signal
US8000969B2 (en) * 2006-12-19 2011-08-16 Nuance Communications, Inc. Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges
US20090083047A1 (en) * 2007-09-25 2009-03-26 Apple Inc. Zero-gap playback using predictive mixing
EP2144171A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
RU2498419C2 (ru) * 2008-07-11 2013-11-10 Фраунхофер-Гезелльшафт цур Фёердерунг дер ангевандтен Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2011085483A1 (en) * 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering

Also Published As

Publication number Publication date
KR20220150992A (ko) 2022-11-11
CA2955674C (en) 2023-08-15
EP4235667A2 (en) 2023-08-30
EP3654333A1 (en) 2020-05-20
EP2980796A1 (en) 2016-02-03
JP7202545B2 (ja) 2023-01-12
KR101997006B1 (ko) 2019-07-08
CA3193319A1 (en) 2016-02-04
PL4030426T3 (pl) 2024-02-12
JP6864382B2 (ja) 2021-04-28
EP4030426A1 (en) 2022-07-20
BR112017001362A2 (pt) 2017-11-21
US20230335147A1 (en) 2023-10-19
KR102615475B1 (ko) 2023-12-19
WO2016015950A1 (en) 2016-02-04
US20170133028A1 (en) 2017-05-11
HK1259289A1 (zh) 2019-11-29
CA2955674A1 (en) 2016-02-04
US11869525B2 (en) 2024-01-09
KR102304326B1 (ko) 2021-09-23
JP6503051B2 (ja) 2019-04-17
JP7509859B2 (ja) 2024-07-02
CA3193309A1 (en) 2016-02-04
CN113012704A (zh) 2021-06-22
JP2017522606A (ja) 2017-08-10
MY179016A (en) 2020-10-26
JP2019164348A (ja) 2019-09-26
US12033648B2 (en) 2024-07-09
CA3193306A1 (en) 2016-02-04
EP3654333B1 (en) 2022-03-09
MX362737B (es) 2019-02-06
SG11201700684YA (en) 2017-02-27
KR102459857B1 (ko) 2022-10-27
PL3407351T3 (pl) 2020-06-29
PL3175452T3 (pl) 2019-01-31
PL3654333T3 (pl) 2022-07-04
ES2914632T3 (es) 2022-06-14
CA3193302A1 (en) 2016-02-04
CN106575507B (zh) 2021-02-02
ES2685984T3 (es) 2018-10-15
CN113012704B (zh) 2024-02-09
KR20170036084A (ko) 2017-03-31
CA3193316A1 (en) 2016-02-04
EP4030426C0 (en) 2023-08-16
AU2015295709B2 (en) 2017-12-21
JP2023036651A (ja) 2023-03-14
US20220148609A1 (en) 2022-05-12
KR20210118224A (ko) 2021-09-29
EP3175452A1 (en) 2017-06-07
EP3407351A1 (en) 2018-11-28
AR101287A1 (es) 2016-12-07
ES2773690T3 (es) 2020-07-14
TW201606754A (zh) 2016-02-16
PT3654333T (pt) 2022-05-19
CN106575507A (zh) 2017-04-19
EP4235667A3 (en) 2023-09-13
US20220157328A1 (en) 2022-05-19
PT3407351T (pt) 2020-03-31
US20240135943A1 (en) 2024-04-25
EP3175452B1 (en) 2018-07-11
MX2017001245A (es) 2017-07-07
EP3407351B1 (en) 2020-01-01
AU2015295709A1 (en) 2017-03-16
KR20190080982A (ko) 2019-07-08
PT3175452T (pt) 2018-10-22
JP2021107932A (ja) 2021-07-29
ES2960422T3 (es) 2024-03-04
KR20230173744A (ko) 2023-12-27
US12014746B2 (en) 2024-06-18
TWI595480B (zh) 2017-08-11
EP4030426B1 (en) 2023-08-16

Similar Documents

Publication Publication Date Title
RU2665282C1 (ru) Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования