RU2665282C1 - Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования - Google Patents
Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования Download PDFInfo
- Publication number
- RU2665282C1 RU2665282C1 RU2017105447A RU2017105447A RU2665282C1 RU 2665282 C1 RU2665282 C1 RU 2665282C1 RU 2017105447 A RU2017105447 A RU 2017105447A RU 2017105447 A RU2017105447 A RU 2017105447A RU 2665282 C1 RU2665282 C1 RU 2665282C1
- Authority
- RU
- Russia
- Prior art keywords
- filter
- filtered
- current frame
- frame
- audio signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012545 processing Methods 0.000 title claims abstract description 42
- 230000005236 sound signal Effects 0.000 claims abstract description 78
- 238000001914 filtration Methods 0.000 claims abstract description 36
- 239000012634 fragment Substances 0.000 claims description 55
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract 1
- 238000013459 approach Methods 0.000 description 39
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 8
- 230000007774 longterm Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
- H04B1/1027—Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Stereophonic System (AREA)
Abstract
Изобретение относится к обработке аудиосигнала, включающего аудиокадры. Технический результат – удаление разрывов между отфильтрованными аудиокадрами без потенциальных искажений в отфильтрованном аудиосигнале. Данный способ позволяет обрабатывать аудиосигнал, удалять разрыв между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, с использованием фильтрации с линейным предсказанием. 5 н. и 9 з.п. ф-лы, 8 ил.
Description
Настоящее изобретение относится к области аудиосигналов, в частности к методу обработки аудиосигнала, включающего в себя совокупность аудиокадров, в которых разрывы между последовательными отфильтрованными аудиокадрами снижаются или устраняются.
В области обработки аудиосигнала аудиосигнал может быть отфильтрован по разным причинам, например, фильтр долгосрочного предсказания может использоваться в устройстве кодирования аудиосигнала для ослабления или даже полного подавления набора гармоник в аудиосигнале.
Аудиосигнал включает множество аудиокадров и кадров, отфильтрованных с использованием фильтра долгосрочного предсказания. Когда рассматриваются два последовательных кадра аудиосигнала, прошедший кадр и текущий кадр, линейный фильтр H(z), имеющий набор параметров c, используется для фильтрации аудиосигнала. В частности, прошедший кадр фильтруется с использованием фильтра H(z) с применением первого набора параметров c0, который будет формировать так называемый отфильтрованный прошедший кадр. Текущий кадр фильтруется с использованием фильтра H(z) с применением набора параметров c1, который будет формировать отфильтрованный текущий кадр. На ФИГ. 1 показана структурна схема обработки последовательных кадров аудиосигнала согласно известному подходу. Представляется аудиосигнал 100, включающий в себя множество аудиокадров. Аудиосигнал 100 поступает в блок фильтрации 102, и текущий кадр n аудиосигнала 100 фильтруется. Блок фильтрации, помимо аудиосигнала 100, получает набор параметров фильтра cn для текущего кадра аудиосигнала. Блок фильтра 102 фильтрует текущий кадр n аудиосигнала и выводит отфильтрованный аудиосигнал 104, включающий в себя последовательно отфильтрованные кадры. На ФИГ. 1 схематически показаны отфильтрованный текущий кадр n, отфильтрованный прошедший кадр n-1 и отфильтрованный второй последний кадр n-2. Отфильтрованные кадры схематически представлены на ФИГ. 1, с соответствующими интервалами для схематического указания разрыва между ними 106a, 106b, которые могут быть включены в процесс фильтрации между отфильтрованными кадрами. Блок фильтрации 102 вызывает фильтрацию кадров аудиосигнала с использованием соответствующих параметров фильтра c0 и c1 для прошедшего кадра n-1 и текущего кадра n. В общем случае, блок фильтрации 102 может быть линейным фильтром H(z) и одним примером для такого линейного фильтра H(z) является упомянутый выше фильтр долгосрочного предсказания
H(z)=1 - g⋅z-T,
где параметрами фильтра являются усиление "g" и временной сдвиг тона "T". В более общем виде, фильтр долгосрочного предсказания может быть описан следующим образом:
H(z)=1 - g⋅A(z)⋅z-T,
где A(z) является КИХ-фильтром. Фильтр долгосрочного предсказания может использоваться для ослабления или даже для полного подавления набора гармоник в аудиосигнале. Однако, существует высокая вероятность введения разрыва 106a, 106b (см. ФИГ. 1) между отфильтрованным прошедшим кадром n-1 и отфильтрованным текущим кадром n, при использовании такого фильтра долгосрочного предсказания и когда параметры фильтра c0 прошедшего кадра отличаются от параметров фильтра c1 текущего кадра. Указанный разрыв может создавать искажения в отфильтрованном аудиосигнале 104, например, "щелчок".
Таким образом, в связи с тем, что вышеописанные проблемы с фильтрацией последовательных кадров, приводят к разрывам, которые, в свою очередь, могут создавать нежелательные искажения, необходим подход, который позволяет удалить возможный разрыв. В данной области техники известны несколько подходов предшествующего уровня, предназначенных для удаления разрыва отфильтрованных кадров аудиосигнала.
В случае если линейный фильтр H(z) является КИХ-фильтром, текущий кадр фильтруется с использованием параметров фильтра c1 текущего кадра для получения отфильтрованного текущего кадра. Кроме того, начальный фрагмент текущего кадра фильтруется с применением параметров фильтра прошедшего кадра c0 для получения фрагмента отфильтрованного кадра, и затем над начальным фрагментом отфильтрованного текущего кадра и фрагментом отфильтрованного кадра выполняется операция перекрытия с суммированием или плавное микширование. На ФИГ. 2 показана структурная схема такого традиционного подхода для обработки последовательных аудиокадров с целью удаления разрыва. При сравнении с ФИГ. 1, блок фильтра 102 включает в себя дополнительный блок обработки 108 для выполнения операции перекрытия с суммированием или плавного микширования. В отфильтрованном аудиосигнале 104, не будет присутствовать или будет уменьшенный разрыв между последовательно отфильтрованными кадрами, как это схематично изображено на ФИГ. 2, показывающими последовательно отфильтрованные кадры n, n-1 и n-2 без интервалов, представленных на ФИГ. 1.
В других подходах предшествующего уровня техники, фильтр H(z) может быть фильтром, имеющим рекурсивную часть, например, БИХ-фильтр. В таком случае, подход, как описано ранее по отношению к ФИГ. 2, применяется на последовательной основе. На первом этапе обработка начинается с первого образца начального фрагмента текущего кадра n, фильтруемого с использованием параметров фильтра c0 прошедшего кадра n-1, получая первый отфильтрованный образец. Образец также фильтруется с использованием параметров фильтра c1 текущего кадра n, создавая второй отфильтрованный образец. Далее, на основе первого и второго отфильтрованных образцов выполняется операция перекрытия с суммированием или плавного микширования, которая получает соответствующий образец отфильтрованного текущего кадра n. Затем обрабатывается следующий образец и вышеуказанные шаги повторяются вплоть до тех пор, пока не будет обработан последний образец начального фрагмента текущего кадра n. Оставшиеся образцы текущего кадра n фильтруются с использованием параметров фильтра c1 текущего кадра n.
Примеры упомянутых выше известных подходов для удаления разрыва из последовательно отфильтрованных кадров описываются, например, в US 5012517 A в контексте изменения устройством кодирования, в EP 0732687 A2 в контексте расширителя пропускной способности речи, в US 5999899 A в контексте изменения устройством аудиокодирования или в US 7353168 B2 в контексте постфильтра декодированной речи.
Хотя приведенные выше подходы эффективны для удаления нежелательных разрывов сигнала, поскольку указанные подходы работают на конкретном фрагменте текущего кадра, на начальном фрагменте, чтобы оставаться эффективным, длина фрагмента кадра должна быть достаточно продолжительной, например, в случае, когда длина кадра составляет 20 мс, фрагмент кадра или длина начального фрагмента должна составлять до 5 мс. В некоторых случаях, такой фрагмент может быть слишком длинным, особенно в ситуациях, когда параметры фильтра c0 прошедшего кадра не достаточно хорошо применимы к текущему кадру, и это может привести к дополнительным искажениям. Одним из примеров является гармонический аудиосигнал с быстро изменяющимся тоном и фильтр долгосрочного предсказания, который конструируется для уменьшения амплитуды гармоник. В таком случае, временной сдвиг тона отличается от одного кадра к другому. Фильтр долгосрочного предсказания с оценкой тона в текущем кадре будет эффективно уменьшать амплитуду гармоник в текущем кадре, но это не приведет к уменьшению амплитуды гармоник, если они используются в другом кадре (например, в начальном фрагменте следующего кадра), где тон аудиосигнала будет отличаться. Это может привести к более плохому результату, за счет уменьшения амплитуды не относящихся к гармоническим компонентов сигнала, вводя искажения в сигнал.
Задачей, лежащей в основе настоящего изобретения, является создание усовершенствованного подхода к удалению разрывов между отфильтрованными аудиокадрами без каких-либо потенциальных искажений в отфильтрованном аудиосигнале.
Эта цель достигается с помощью способа и устройства в соответствии с независимыми пунктами формулы изобретения.
Настоящее изобретение относится к способу обработки аудиосигнала, при этом способ включает в себя удаление разрыва между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала с использованием фильтрации с линейным предсказанием.
Фильтр с линейным предсказанием определен как
где M - порядок фильтра и am- коэффициенты фильтра (при a0=1). Такой вид фильтра также известен, как кодирование с линейным предсказанием (LPC).
Согласно вариантам осуществления изобретения, способ включает в себя фильтрацию текущего кадра аудиосигнала и удаление разрыва путем изменения начального фрагмента отфильтрованного текущего кадра при помощи сигнала, полученного посредством фильтрации с линейным предсказанием заранее заданного сигнала с использованием исходных состояний фильтра с линейным предсказанием, определяемого в зависимости от последней части прошедшего кадра.
Согласно вариантам осуществления изобретения, исходные состояния фильтра с линейным предсказанием определяются в зависимости от последней части неотфильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.
Согласно вариантам осуществления изобретения, способ включает в себя расчет фильтра с линейным предсказанием на отфильтрованном или неотфильтрованном аудиосигнале.
Согласно вариантам осуществления изобретения, расчет фильтра с линейным предсказанием включает в себя расчет фильтра на основе прошедшего или текущего кадра аудиосигнала или на основе последнего отфильтрованного кадра аудиосигнала с использованием алгоритма Левинсона-Дарбина.
Согласно вариантам осуществления изобретения, фильтр с линейным предсказанием включает в себя фильтр с линейным предсказанием аудиокодека.
Согласно вариантам осуществления изобретения, удаление разрыва включает в себя обработку начального фрагмента отфильтрованного текущего кадра, причем начальный фрагмент текущего кадра имеет заранее заданное количество образцов, которое меньше или равно общему количеству образцов в текущем кадре, и обработка начального фрагмента текущего кадра включает в себя вычитание начального фрагмента отклика при отсутствии входного сигнала (ZIR) из начального фрагмента отфильтрованного текущего кадра.
Согласно вариантам осуществления изобретения способ включает в себя фильтрацию текущего кадра аудиосигнала с использованием нерекурсивного фильтра, подобного КИХ-фильтру, для получения отфильтрованного текущего кадра.
Согласно вариантам осуществления изобретения, способ включает в себя обработку неотфильтрованного текущего кадра аудиосигнала на последовательной основе с использованием рекурсивного фильтра, подобного БИХ-фильтру, и в котором обработка образца начального фрагмента текущего кадра включает в себя:
фильтрацию образца с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра для получения отфильтрованного образца и
вычитание соответствующего ZIR-образца из отфильтрованного образца для получения соответствующего образца отфильтрованного текущего кадра.
Согласно вариантам осуществления изобретения фильтрация и вычитание повторяются до обработки последнего образца в начальном фрагменте текущего кадра, и способ дополнительно включает в себя фильтрацию оставшихся образцов в текущем кадре с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра.
Согласно вариантам осуществления изобретения, способ включает в себя формирование ZIR, в котором формирование ZIR включает в себя:
фильтрацию M последних образцов неотфильтрованного прошедшего кадра с использованием фильтра и параметров фильтра, используемых для фильтрации текущего кадра с целью получения первого фрагмента отфильтрованного сигнала, в котором M является порядком фильтра с линейным предсказанием,
вычитание из первого фрагмента отфильтрованного сигнала M последних образцов отфильтрованного прошедшего кадра, отфильтрованного с использованием параметров фильтра прошедшего кадра, для формирования второго фрагмента отфильтрованного сигнала и
формирование ZIR-фильтра с линейным предсказанием путем фильтрации кадра нулевых образцов с использованием фильтра с линейным предсказанием и исходными состояниями, равными второму фрагменту отфильтрованного сигнала.
Согласно вариантам осуществления изобретения способ включает в себя обработку ZIR функцией окна так, что его амплитуда быстро снижается до нуля.
Настоящее изобретение, основанное на открытиях изобретателя в том, что данные проблемы, которые были признаны в традиционных подходах по удалению сигнала разрывов, которые приводят к дополнительному нежелательному искажению, указанному выше, имеются в основном за счет обработки текущего кадра или по меньшей мере его фрагмента в зависимости от параметров фильтра прошедшего кадра. Согласно изобретенному подходу данной методики избегают, а именно, изобретенный подход не фильтрует фрагмент текущего кадра с использованием параметров фильтра прошедшего кадра и, таким образом, позволяет избежать проблем, упомянутых выше. Согласно вариантам осуществления изобретения для удаления разрыва используется LPC-фильтр (фильтр с линейным предсказанием) для удаления разрыва. LPC-фильтр может быть рассчитан по аудиосигналу, и поэтому данных подход является хорошей моделью спектральной формы аудиосигнала таким образом, что при использовании LPC-фильтра, спектральная форма аудиосигнала будет маскировать разрыв. В варианте осуществления изобретения LPC-фильтр может быть рассчитан на основе неотфильтрованного аудиосигнала или на основе аудиосигнала, который отфильтрован линейным фильтром H(z), упомянутым выше. Согласно вариантам осуществления изобретения LPC-фильтр может быть рассчитан с использованием аудиосигнала, например, текущего кадра и/или прошедшего кадра и алгоритма Левинсона-Дарбина. Кроме того, он может быть вычислен только в зависимости от последнего отфильтрованного кадра сигнала с использованием алгоритма Левинсона-Дарбина.
Еще в других вариантах осуществления изобретения, аудиокодек для обработки аудиосигнал может использовать линейный фильтр H(z), а также может использовать LPC-фильтр, квантуемый или нет, например, для формирования шума квантования в кодеке с преобразованием. В таком варианте осуществления изобретения данный имеющийся LPC-фильтр может быть непосредственно использован для сглаживания разрыва без дополнительной сложности, необходимой для расчета нового LPC-фильтра.
В дальнейшем варианты осуществления настоящего изобретения будут описываться со ссылкой на прилагаемые чертежи, на которых:
на ФИГ. 1 изображена структурная схема для обработки последовательных кадров аудиосигнала согласно традиционному подходу,
на ФИГ. 2 изображена структурная схема другого традиционного подхода для обработки последовательных аудиокадров с целью удаления разрыва,
на ФИГ. 3 изображена упрощенная структурная схема системы для передачи аудиосигналов, реализующая изобретенный подход для удаления разрыва между последовательными кадрами аудиосигнала на стороне устройства кодирования и/или на стороне устройства декодирования,
на ФИГ. 4 изображена блок-схема, представляющая изобретенный подход для удаления разрыва между последовательными кадрами аудиосигнала согласно варианту осуществления изобретения,
на ФИГ. 5 изображена схематическая структурная схема для обработки текущего аудиокадра согласно вариантам осуществления настоящего изобретения, устраняющая нежелательное искажение в выходном сигнале, независимо от устранения разрывов,
на ФИГ. 6 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по формированию ZIR,
на. ФИГ. 7 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по обработке отфильтрованного начального фрагмента текущего кадра в случае блока фильтра, включающего в себя рекурсивный фильтр, подобный БИХ-фильтру, и
на ФИГ. 8 изображена блок-схема, представляющая функциональность блока на ФИГ. 5 по обработке начального фрагмента отфильтрованного текущего кадра в случае блока фильтра, включающего в себя нерекурсивный фильтр, подобный КИХ-фильтру.
В дальнейшем, варианты осуществления изобретенного подхода будут описаны более подробно, и следует отметить, что элементы на прилагаемых чертежах, имеющие такую же или аналогичную функциональность, обозначаются одинаковыми ссылочными позициями.
На ФИГ. 3 изображена упрощенная структурная схема системы для передачи аудиосигналов, реализующая изобретенный подход на стороне устройства кодирования и/или на стороне устройства декодирования. Система на ФИГ. 3 включает в себя устройство кодирования 200, принимающее на входе 202 аудиосигнал 204. Устройство кодирования включает в себя процессор кодирования 206, принимающий аудиосигнал 204 и формирующий кодированный аудиосигнал, который предоставляется на выходе 208 устройства кодирования. Процессор кодирования может быть запрограммирован или создан для реализации изобретенного подхода с целью обработки полученных последовательных аудиокадров аудиосигнала, чтобы избежать разрывов. В других вариантах осуществления изобретения устройству кодирования нет необходимости быть частью передающей системы, однако, оно может быть автономным устройством, формирующим кодированные аудиосигналы, или быть частью передатчика аудиосигнала. Согласно варианту осуществления изобретения устройство кодирования 200 может содержать антенну 210, чтобы обеспечить беспроводную передачу аудиосигнала, как показано позицией 212. В других вариантах осуществления изобретения устройство кодирования 200 может выводить кодированный аудиосигнал, представленный на выходе 208 с использованием проводной линии связи, как это, например, показано на ссылочной позиции 214.
Система на ФИГ. 3 дополнительно включает в себя устройство декодирования 250, имеющее вход 252, принимающий кодированный аудиосигнал для обработки устройством декодирования 250, например, через проводную линию 214 или через антенну 254. Устройство декодирования 250 включает в себя процессор декодирования 256, обрабатывающий кодированный сигнал и предоставляющий декодированный аудиосигнал 258 на выходе 260. Процессор декодирования 256 может быть реализован для работы согласно изобретенному подходу на последовательности кадров, которые отфильтрованы таким образом, что избегается появление разрывов. В других вариантах осуществления изобретения устройству декодирования нет необходимости быть частью передающей системы, скорее, оно может быть автономным устройством для декодирования кодированных аудиосигналов, или оно может быть частью приемника аудиосигнала.
В дальнейшем, варианты осуществления изобретенного подхода, которые могут быть реализованы в по меньшей мере одном процессоре кодирования 206 и процессоре декодирования 256 будут описаны более подробно. На ФИГ. 4 изображена блок-схема обработки текущего кадра аудиосигнала согласно варианту осуществления изобретенного подхода. Будет описываться обработка текущего кадра и предполагается, что прошедший кадр уже обработан с использованием такой же техники, что описывается ниже. Согласно настоящему изобретению, на шаге S100a принимается текущий кадр аудиосигнала. Текущий кадр фильтруется на шаге S102, например, таким образом, как описано выше со ссылкой на ФИГ. 1 и 2 (см. блок фильтра 102). Согласно изобретенному подходу разрыв между отфильтрованным прошедшим кадром n-1 и отфильтрованным текущим кадром n (см. ФИГ. 1 или 2) будет удален с использованием фильтрации с линейным предсказанием, как указывается на шаге S104. В соответствии с вариантом осуществления изобретения фильтр с линейным предсказанием может быть определен как
где M - порядок фильтра и am - коэффициенты фильтра (при a0=1). Такой вид фильтра также известен, как кодирование с линейным предсказанием (LPC). Согласно вариантам осуществления изобретения отфильтрованный текущий кадр обрабатывается с применением фильтрации с линейным предсказанием для по меньшей мере части отфильтрованного текущего кадра. Разрыв может быть удален путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного фильтрацией с линейным предсказанием заранее заданного сигнала с использованием исходных состояний линейного фильтра кодирования с предсказанием, определенных в зависимости от последней части прошедшего кадра. Исходные состояния линейного фильтра кодирования с предсказанием могут быть определены в зависимости от последней части прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для текущего кадра. Изобретенный подход предпочтителен, поскольку он не требует фильтрации текущего кадра аудиосигнала с использованием коэффициента фильтр, который используется для прошедшего кадра и, таким образом, позволяет избежать проблем, которые возникают из-за несоответствия параметров фильтра для текущего кадра и для прошедшего кадра, поскольку они наблюдались в подходах предшествующего уровня техники, описанных выше со ссылкой на ФИГ. 2.
На ФИГ. 5 изображена схематическая структурная схема для обработки текущего аудиокадра аудиосигнала согласно вариантам осуществления настоящего изобретения, позволяющая избежать нежелательного искажения в выходном сигнале, несмотря на удаление разрывов. На ФИГ. 5 используются такие же ссылочные позиции, как на ФИГ. 1 и 2. Принимается текущий кадр n аудиосигнала 100, каждый кадр аудиосигнала 100 имеет множество образцов. Текущий кадр n аудиосигнала 100 обрабатывается блоком фильтра 102. По сравнению с подходами предыдущего уровня техники, представленными на ФИГ. 1 и 2, согласно вариантам осуществления изобретения, как описано со ссылкой на ФИГ. 5, отфильтрованный текущий кадр дополнительно обрабатывается в зависимости от ZIR-образцов, как схематически показано блоком 110. Согласно варианту осуществления изобретения, в зависимости от прошедшего кадра n-1 и в зависимости от LPC-фильтра, вырабатываются ZIR-образцы, как схематически показано блоком 112.
Функциональность блоков обработки 110 и 112 теперь будет описана более подробно. На ФИГ. 6 изображена блок-схема, представляющая функциональность блока обработки 112 по формированию ZIR-образцов. Как уже упоминалось выше, кадры аудиосигнала 100 фильтруются с использованием линейного фильтра H(z) с применением параметров фильтра с, выбранных или определенных для соответствующего кадра. Фильтр H(z) может быть рекурсивным фильтром, например, БИХ-фильтром, или он может быть нерекурсивным фильтром, например, КИХ-фильтром. В блоке обработки 112 используется LPC-фильтр, который может квантоваться или не квантоваться. LPC-фильтр имеет порядок M и может быть либо подсчитан по фильтрованному или нефильтрованному аудиосигналу, или может быть LPC-фильтром, который также используется в аудиокодеке. На первом шаге S200 M (M=порядку LPC-фильтра) последних образцов прошедшего кадра n-1 фильтруются фильтром H(z), однако, с использованием параметров фильтра или коэффициентов c1 текущего кадра n. Шаг S200 таким образом создает первый фрагмент отфильтрованного сигнала. На шаге S202 M последних образцов отфильтрованного прошедшего кадра n-1 (M последних образцов прошедшего кадра отфильтрованы с использованием параметров фильтра или коэффициентов c0 прошедшего кадра n-1) вычитаются из первого фрагмента отфильтрованного сигнала, представленного шагом S200, создавая тем самым второй фрагмент отфильтрованного сигнала. На шаге S204 применяется LPC-фильтр, имеющий порядок M, в частности, формируется отклик при отсутствии входного сигнала (ZIR) LPC-фильтра на шаге S204 путем фильтрации кадра нулевых образцов, причем исходные состояния фильтра равны второму фрагменту отфильтрованных сигналов, формируя тем самым ZIR. Согласно вариантам осуществления изобретения, ZIR может быть обработан функцией окна, так что его амплитуда быстро уменьшается до нуля.
ZIR, как описано выше со ссылкой на ФИГ. 5, применяется в блоке обработки 110, функциональность которого описывается со ссылкой на блок-схему на ФИГ. 7 для случая использования в качестве линейного фильтра H(z), рекурсивного фильтра, подобного БИХ-фильтру. Согласно варианту осуществления изобретения, описанному выше со ссылкой на ФИГ. 5, для удаления разрывов между текущим кадром и прошедшим кадром, избегая нежелательных искажений, фильтрация текущего кадра n включает в себя обработку (фильтрацию) текущего кадра n на последовательной основе, в которой образцы начального фрагмента обрабатываются согласно изобретенному подходу. Если говорить более конкретно, обрабатывается M образцов начального фрагмента текущего кадра n, и на первом шаге S300 переменные m устанавливаются на 0. На следующем шаге S302, образец m текущего кадра n фильтруется с использованием фильтра H(z) и коэффициентов фильтра или параметров c1 для текущего кадра n. Таким образом, в отличие от традиционных подходов, текущий кадр, согласно изобретенному подходу, не фильтруется с использованием коэффициентов от прошедшего кадра, но только с коэффициентами от текущего кадра, что, как следствие, помогает избежать нежелательного искажения, которое имеется в традиционных подходах, несмотря на то, что разрывы удаляются. Шаг S302 получает отфильтрованный образец m, и на шаге S304 ZIR-образец, соответствующий образцу m, вычитается из отфильтрованного образца m, получая соответствующий образец отфильтрованного текущего кадра n. На шаге S306 определяется, будет ли обрабатывается последний образец M начального фрагмента текущего кадра n. В случае, когда не все M образцы начальных фрагментов обработаны, переменная m увеличивается, и шаги способа с S302 по S306 повторяются для следующего образца текущего кадра n. После того, как все M образцы начальных фрагментов будут обработаны, на шаге S308 оставшиеся образцы текущего кадра n фильтруются с применением параметров фильтра текущего кадра c1, предоставляя тем самым отфильтрованный текущий кадр n, обработанный согласно изобретенному подходу, избегая нежелательного искажения при удалении разрывов между последовательными кадрами.
Согласно другому варианту осуществления изобретения, линейный фильтр H(z) является нерекурсивным фильтром, подобным КИХ-фильтру и ZIR, как описано выше со ссылкой на ФИГ. 5, применяется в блоке обработки 110. Функциональность данного варианта осуществления изобретения описывается со ссылкой на блок-схему на ФИГ. 8. Текущий кадр n, на шаге S400, фильтруется с использованием фильтра H(z) с применением коэффициентов фильтра или параметров c1 для текущего кадра. Таким образом, в отличие от традиционных подходов, текущий кадр, согласно изобретенному подходу, не фильтруется с использованием коэффициентов от прошедшего кадра, но используются только коэффициенты из текущего кадра, которые, как следствие, помогают избежать нежелательного искажения, которое имеется при традиционных подходах, несмотря на то, что разрывы удаляются. На шаге S402 начальный фрагмент ZIR вычитается из соответствующего начального фрагмента отфильтрованного текущего кадра, предоставляя тем самым отфильтрованный текущий кадр n, имеющий начальный фрагмент, отфильтрованный/обработанный согласно изобретенному подходу, и оставшуюся часть, только отфильтрованную с использованием коэффициентов фильтра или параметров c1 для текущего кадра, избегая тем самым нежелательного искажения при удалении разрывов между последовательными кадрами.
Изобретенный подход может быть применен в тех ситуациях, которые описаны выше, при фильтрации аудиосигнала. Согласно вариантам осуществления изобретения изобретенный подход также может быть применен на стороне устройства декодирования, например, при использовании выходного фильтра аудиокодека для снижения уровня шума кодирования между гармониками сигнала. Для обработки аудиокадров в устройства декодирования, выходной фильтр, согласно варианту осуществления изобретения, может быть следующим:
H(z)=(1 - B(z))/(1 - A(z)⋅z-T),
где B(z) и A(z) являются двумя КИХ-фильтрами, и параметры фильтра H(z) являются коэффициентами КИХ-фильтров B(z) и A(z), и T обозначает временной сдвиг тона. При таком сценарии, фильтр также может ввести разрыв между двумя отфильтрованными кадрами, например, когда параметры фильтра последнего кадра c0 отличаются от параметров фильтра текущего кадра c1, и такой разрыв может создавать искажение в отфильтрованном аудиосигнале 104, например, "щелчок". Указанный разрыв удаляется путем обработки отфильтрованного текущего кадра, как описано выше.
Хотя некоторые аспекты описанной концепции были описаны в контексте устройства, то ясно, что данные аспекты также представляют собой описание соответствующего способа, в котором блок или устройство соответствует шагу способа или характеристике шага способа. Аналогично, аспекты, описанные в контексте шага способа, также представляют собой описание соответствующего блока, или элемента, или характеристику соответствующего устройства.
В зависимости от конкретных требований к реализации, варианты осуществления изобретения могут быть реализованы аппаратными средствами или программными средствами. Реализация может быть выполнена с использованием цифрового носителя информации, например, гибкого магнитного диска, DVD, Blue-Ray, CD, ПЗУ, ППЗУ, ЭППЗУ, ЭСППЗУ или флэш-памяти, имеющего электронночитаемый управляющий сигнал, хранимый на нем, который взаимодействует (или способен взаимодействовать) с программируемой компьютерной системой, таким образом, чтобы выполнялся соответствующий способ. Таким образом, цифровой носитель информации может быть машиночитаемым.
Некоторые варианты осуществления изобретения в соответствии с изобретением включают в себя носитель данных, имеющий электронночитаемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в настоящем документе.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы в качестве компьютерного программного продукта с программным кодом, причем программный код для оперативного выполнения одного из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, храниться на машиночитаемом носителе.
Другие варианты осуществления изобретения включают в себя компьютерную программу для выполнения одного из способов, описанных в настоящем документе, хранящуюся на машиночитаемом носителе.
Другими словами, вариант осуществления изобретения по изобретенному способу является, таким образом, компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в настоящем документе, при выполнении компьютерной программы на компьютере.
Еще один вариант осуществления изобретенных способов является, таким образом, носителем данных (или цифровым носителем информации, или машиночитаемым носителем), включающим в себя записанную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.
Еще один вариант осуществления изобретенного способа является, таким образом, поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов может, например, быть сконфигурирована для передачи через соединение для передачи данных, например, через Интернет.
Еще один вариант осуществления изобретения включает в себя средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное для или приспособленное для выполнения одного из способов, описанных в настоящем документе.
Еще один вариант осуществления изобретения включает в себя компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.
В некоторых вариантах осуществления изобретения программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в настоящем документе. В некоторых вариантах осуществления изобретения программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем документе. Как правило, способы предпочтительно выполняются любым аппаратным устройством.
Описанные выше варианты осуществления изобретения являются лишь иллюстративными для принципов настоящего изобретения. Понятно, что модификации и вариации устройств и элементов, описанных в настоящем документе, будут очевидны для специалистов в данной области техники. Намерение, таким образом, должно быть ограничено только объемом приложенной формулы изобретения, а не конкретными деталями, представленными посредством описания и объяснения вариантов осуществления изобретения в настоящем документе.
Claims (21)
1. Способ обработки аудиосигнала (100), включающий в себя:
использование фильтрации с линейным предсказанием для удаления (S102, S104, S300-S308, S400-S402) разрыва (106a, 106b) между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, причем способ включает в себя фильтрацию текущего кадра аудиосигнала и удаление разрыва путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного путем фильтрации с линейным предсказанием заранее заданного сигнала с исходными состояниями фильтра с линейным предсказанием, определенным в зависимости от последней части неотфильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.
2. Способ по п. 1, дополнительно включающий в себя расчет фильтра с линейным предсказанием отфильтрованного или неотфильтрованного аудиосигнала (100).
3. Способ по п. 2, в котором расчет фильтра с линейным предсказанием включает в себя расчет фильтра на основе прошедшего и/или текущего кадра аудиосигнала (100) или на основе последнего отфильтрованного кадра аудиосигнала (100) с использованием алгоритма Левинсона-Дарбина.
4. Способ по п. 1, в котором фильтр с линейным предсказанием включает в себя фильтр с линейным предсказанием аудиокодека.
5. Способ по п. 1, в котором удаление разрыва включает в себя обработку начального фрагмента отфильтрованного текущего кадра, причем начальный фрагмент текущего кадра имеет заранее заданное количество образцов, меньшее или равное общему числу образцов в текущем кадре, и обработка начального фрагмента текущего кадра включает в себя вычитание (S304, S402) начального фрагмента отклика при отсутствии входного сигнала (ZIR) из начального фрагмента отфильтрованного текущего кадра.
6. Способ по п. 5, включающий в себя фильтрацию (S400) текущего кадра аудиосигнала с использованием нерекурсивного фильтра, подобного КИХ-фильтру, для получения отфильтрованного текущего кадра.
7. Способ по п. 5, включающий в себя обработку неотфильтрованного текущего кадра аудиосигнала выборочным путем с использованием рекурсивного фильтра, подобного БИХ-фильтру, и причем обработка образца начального фрагмента текущего кадра включает в себя:
фильтрацию (S302) образца с применением рекурсивного фильтра с использованием параметров фильтра текущего кадра для получения отфильтрованного образца и
вычитание (S304) соответствующего ZIR-образца из отфильтрованного образа для получения соответствующего образца отфильтрованного текущего кадра.
8. Способ по п. 7, в котором фильтрацию (S302) и вычитание (S304) повторяют до тех пор, пока не будет обработан последний образец в начальном фрагменте текущего кадра, и способ дополнительно включает в себя фильтрацию (S306) оставшихся образцов в текущем кадре с использованием рекурсивного фильтра с применением параметров фильтра текущего кадра.
9. Способ по п. 5, включающий в себя формирование ZIR, причем формирование ZIR включает в себя:
фильтрацию (S200) M последних образцов неотфильтрованного прошедшего кадра с использованием фильтра и параметров фильтра, используемых для фильтрации текущего кадра с целью получения первого фрагмента отфильтрованного сигнала, причем M представляет собой порядок фильтра с линейным предсказанием,
вычитание (S202) из первого фрагмента отфильтрованного сигнала M последних образцов отфильтрованного прошедшего кадра, отфильтрованного с использованием параметров фильтра прошедшего кадра, для формирования второго фрагмента отфильтрованного сигнала и
формирование (S204) ZIR фильтра с линейным предсказанием путем фильтрации кадра нулевых образцов кадра с использованием фильтра с линейным предсказанием и исходными состояниями, равными второму фрагменту отфильтрованного сигнала.
10. Способ по п. 9, включающий в себя обработку ZIR функцией окна, при которой его амплитуда быстрее уменьшается к нулю.
11.Машиночитаемый носитель информации, содержащий сохраненные на нем команды, которые при исполнении на компьютере выполняют способ по одному из пп. 1 - 10.
12. Устройство для обработки аудиосигнала (100), содержащее:
процессор (102, 110, 112), сконфигурированный для использования фильтрации с линейным предсказанием для удаления разрыва между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, причем процессор (102, 110, 112) сконфигурирован для фильтрации текущего кадра аудиосигнала и удаления разрыва путем изменения начального фрагмента отфильтрованного текущего кадра с помощью сигнала, полученного фильтрацией с линейным предсказанием заранее заданного сигнала с начальными состояниями фильтра с линейным предсказанием, определенными в зависимости от последней части нефильтрованного прошедшего кадра, отфильтрованного с использованием набора параметров фильтра для фильтрации текущего кадра.
13. Устройство аудиодекодирования (250), содержащее устройство по п. 12.
14. Устройство аудиокодирования (200), содержащее устройство по п. 12.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178821.6 | 2014-07-28 | ||
EP14178821.6A EP2980796A1 (en) | 2014-07-28 | 2014-07-28 | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
PCT/EP2015/065219 WO2016015950A1 (en) | 2014-07-28 | 2015-07-03 | Method and apparatus for precessing an audio signal, audio decoder, and audio encoder |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2665282C1 true RU2665282C1 (ru) | 2018-08-28 |
Family
ID=51224879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017105447A RU2665282C1 (ru) | 2014-07-28 | 2015-07-03 | Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования |
Country Status (18)
Country | Link |
---|---|
US (5) | US20170133028A1 (ru) |
EP (6) | EP2980796A1 (ru) |
JP (4) | JP6503051B2 (ru) |
KR (5) | KR102615475B1 (ru) |
CN (2) | CN113012704B (ru) |
AR (1) | AR101287A1 (ru) |
AU (1) | AU2015295709B2 (ru) |
CA (6) | CA3193302A1 (ru) |
ES (4) | ES2960422T3 (ru) |
HK (1) | HK1259289A1 (ru) |
MX (1) | MX362737B (ru) |
MY (1) | MY179016A (ru) |
PL (4) | PL3654333T3 (ru) |
PT (3) | PT3407351T (ru) |
RU (1) | RU2665282C1 (ru) |
SG (1) | SG11201700684YA (ru) |
TW (1) | TWI595480B (ru) |
WO (1) | WO2016015950A1 (ru) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980796A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
CN117040487B (zh) * | 2023-10-08 | 2024-01-02 | 武汉海微科技有限公司 | 音频信号处理的滤波方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2183034C2 (ru) * | 1994-02-16 | 2002-05-27 | Квэлкомм Инкорпорейтед | Вокодерная интегральная схема прикладной ориентации |
RU2199157C2 (ru) * | 1997-03-03 | 2003-02-20 | Телефонактиеболагет Лм Эрикссон (Пабл) | Способ последующей обработки с высокой разрешающей способностью для речевого декодера |
WO2007138511A1 (en) * | 2006-05-30 | 2007-12-06 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US20090083047A1 (en) * | 2007-09-25 | 2009-03-26 | Apple Inc. | Zero-gap playback using predictive mixing |
EP2144171A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
US8000969B2 (en) * | 2006-12-19 | 2011-08-16 | Nuance Communications, Inc. | Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges |
RU2498419C2 (ru) * | 2008-07-11 | 2013-11-10 | Фраунхофер-Гезелльшафт цур Фёердерунг дер ангевандтен | Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
ES2225321T3 (es) * | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
WO2004047305A1 (ja) | 2002-11-21 | 2004-06-03 | Nippon Telegraph And Telephone Corporation | ディジタル信号処理方法、その処理器、そのプログラム、及びそのプログラムを格納した記録媒体 |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
JP4606264B2 (ja) * | 2005-07-19 | 2011-01-05 | 三洋電機株式会社 | ノイズキャンセラ |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
CN101527138B (zh) | 2008-03-05 | 2011-12-28 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
ES2796493T3 (es) * | 2008-03-20 | 2020-11-27 | Fraunhofer Ges Forschung | Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio |
RU2492530C2 (ru) * | 2008-07-11 | 2013-09-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
CN101355692B (zh) * | 2008-07-30 | 2013-03-20 | 浙江大学 | 一种实时跟踪运动目标区域的智能监控装置 |
CA2763793C (en) * | 2009-06-23 | 2017-05-09 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
KR101734948B1 (ko) * | 2009-10-09 | 2017-05-12 | 삼성전자주식회사 | 파워 헤드룸 보고, 자원 할당 및 전력 제어 방법 |
JP5247937B2 (ja) * | 2009-10-20 | 2013-07-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号符号器、オーディオ信号復号器、エイリアシング消去を用いたオーディオ信号の符号化又は復号化方法 |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CA2804548C (en) * | 2010-07-08 | 2016-06-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coder using forward aliasing cancellation |
CN101976566B (zh) * | 2010-07-09 | 2012-05-02 | 瑞声声学科技(深圳)有限公司 | 语音增强方法及应用该方法的装置 |
US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
CN102368385B (zh) * | 2011-09-07 | 2013-08-14 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
JP6126006B2 (ja) * | 2012-05-11 | 2017-05-10 | パナソニック株式会社 | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
-
2014
- 2014-07-28 EP EP14178821.6A patent/EP2980796A1/en not_active Withdrawn
-
2015
- 2015-07-03 CA CA3193302A patent/CA3193302A1/en active Pending
- 2015-07-03 RU RU2017105447A patent/RU2665282C1/ru active
- 2015-07-03 PL PL19209351T patent/PL3654333T3/pl unknown
- 2015-07-03 CA CA3193306A patent/CA3193306A1/en active Pending
- 2015-07-03 KR KR1020227036973A patent/KR102615475B1/ko active IP Right Grant
- 2015-07-03 KR KR1020217029645A patent/KR102459857B1/ko active IP Right Grant
- 2015-07-03 EP EP23179786.1A patent/EP4235667A3/en active Pending
- 2015-07-03 PL PL18182785T patent/PL3407351T3/pl unknown
- 2015-07-03 CA CA3193309A patent/CA3193309A1/en active Pending
- 2015-07-03 EP EP19209351.6A patent/EP3654333B1/en active Active
- 2015-07-03 CN CN202110100360.9A patent/CN113012704B/zh active Active
- 2015-07-03 MY MYPI2017000131A patent/MY179016A/en unknown
- 2015-07-03 CA CA3193319A patent/CA3193319A1/en active Pending
- 2015-07-03 MX MX2017001245A patent/MX362737B/es active IP Right Grant
- 2015-07-03 CN CN201580040572.5A patent/CN106575507B/zh active Active
- 2015-07-03 PL PL22160064.6T patent/PL4030426T3/pl unknown
- 2015-07-03 PT PT181827858T patent/PT3407351T/pt unknown
- 2015-07-03 PT PT192093516T patent/PT3654333T/pt unknown
- 2015-07-03 PL PL15732290T patent/PL3175452T3/pl unknown
- 2015-07-03 WO PCT/EP2015/065219 patent/WO2016015950A1/en active Application Filing
- 2015-07-03 CA CA2955674A patent/CA2955674C/en active Active
- 2015-07-03 SG SG11201700684YA patent/SG11201700684YA/en unknown
- 2015-07-03 EP EP22160064.6A patent/EP4030426B1/en active Active
- 2015-07-03 ES ES22160064T patent/ES2960422T3/es active Active
- 2015-07-03 KR KR1020197018895A patent/KR102304326B1/ko active IP Right Grant
- 2015-07-03 PT PT15732290T patent/PT3175452T/pt unknown
- 2015-07-03 EP EP15732290.0A patent/EP3175452B1/en active Active
- 2015-07-03 ES ES15732290.0T patent/ES2685984T3/es active Active
- 2015-07-03 KR KR1020177005450A patent/KR101997006B1/ko active IP Right Grant
- 2015-07-03 KR KR1020237043141A patent/KR20230173744A/ko active Application Filing
- 2015-07-03 CA CA3193316A patent/CA3193316A1/en active Pending
- 2015-07-03 ES ES19209351T patent/ES2914632T3/es active Active
- 2015-07-03 JP JP2017504689A patent/JP6503051B2/ja active Active
- 2015-07-03 EP EP18182785.8A patent/EP3407351B1/en active Active
- 2015-07-03 ES ES18182785T patent/ES2773690T3/es active Active
- 2015-07-03 AU AU2015295709A patent/AU2015295709B2/en active Active
- 2015-07-13 TW TW104122578A patent/TWI595480B/zh active
- 2015-07-23 AR ARP150102337A patent/AR101287A1/es active IP Right Grant
-
2017
- 2017-01-23 US US15/412,920 patent/US20170133028A1/en active Granted
-
2019
- 2019-01-30 HK HK19101650.8A patent/HK1259289A1/zh unknown
- 2019-03-22 JP JP2019054137A patent/JP6864382B2/ja active Active
-
2021
- 2021-03-26 JP JP2021052578A patent/JP7202545B2/ja active Active
-
2022
- 2022-01-20 US US17/580,578 patent/US12014746B2/en active Active
- 2022-02-03 US US17/592,423 patent/US11869525B2/en active Active
- 2022-12-08 JP JP2022196100A patent/JP7509859B2/ja active Active
-
2023
- 2023-06-22 US US18/339,915 patent/US12033648B2/en active Active
- 2023-12-12 US US18/537,655 patent/US20240135943A1/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2183034C2 (ru) * | 1994-02-16 | 2002-05-27 | Квэлкомм Инкорпорейтед | Вокодерная интегральная схема прикладной ориентации |
RU2199157C2 (ru) * | 1997-03-03 | 2003-02-20 | Телефонактиеболагет Лм Эрикссон (Пабл) | Способ последующей обработки с высокой разрешающей способностью для речевого декодера |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
WO2007138511A1 (en) * | 2006-05-30 | 2007-12-06 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
US8000969B2 (en) * | 2006-12-19 | 2011-08-16 | Nuance Communications, Inc. | Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges |
US20090083047A1 (en) * | 2007-09-25 | 2009-03-26 | Apple Inc. | Zero-gap playback using predictive mixing |
EP2144171A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
RU2498419C2 (ru) * | 2008-07-11 | 2013-11-10 | Фраунхофер-Гезелльшафт цур Фёердерунг дер ангевандтен | Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2665282C1 (ru) | Способ и устройство для обработки аудиосигнала, устройство аудиодекодирования и устройство аудиокодирования |