RU2020123720A - Способы, устройство и системы для улучшения фильтра декорреляции унифицированного декодирования и кодирования речи и звука - Google Patents

Способы, устройство и системы для улучшения фильтра декорреляции унифицированного декодирования и кодирования речи и звука Download PDF

Info

Publication number
RU2020123720A
RU2020123720A RU2020123720A RU2020123720A RU2020123720A RU 2020123720 A RU2020123720 A RU 2020123720A RU 2020123720 A RU2020123720 A RU 2020123720A RU 2020123720 A RU2020123720 A RU 2020123720A RU 2020123720 A RU2020123720 A RU 2020123720A
Authority
RU
Russia
Prior art keywords
filter
filter coefficients
input signal
paragraphs
decorrelation
Prior art date
Application number
RU2020123720A
Other languages
English (en)
Other versions
RU2776394C2 (ru
Inventor
Раджат КУМАР
Рамеш КАТУРИ
Сакет САТУВАЛЛИ
Решма РАИ
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Publication of RU2020123720A publication Critical patent/RU2020123720A/ru
Application granted granted Critical
Publication of RU2776394C2 publication Critical patent/RU2776394C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (53)

1. Устройство для декодирования закодированного потока унифицированного кодирования речи и звука, устройство содержит:
базовый декодер для декодирования закодированного потока унифицированного кодирования речи и звука;
причем базовый декодер включает в себя блок повышающего микширования, выполненный с возможностью выполнять повышающее микширование из моносигнала в стереосигнал;
причем блок повышающего микширования включает в себя блок декоррелятора D, выполненный с возможностью применять фильтр декорреляции к входному сигналу; и
причем блок декоррелятора выполнен с возможностью определять коэффициенты фильтра для фильтра декорреляции посредством ссылки на предварительно вычисленные значения.
2. Устройство по п. 1, в котором коэффициенты фильтра для фильтра декорреляции предварительно вычислены автономно и сохранены в одной или более поисковых таблицах.
3. Устройство по п. 2, в котором отдельная поисковая таблица обеспечена для каждого из множества ненакладывающихся диапазонов частотных полос.
4. Устройство по любому из пп. 1-3, в котором определение коэффициентов фильтра включает в себя запрос предварительно вычисленных значений для коэффициентов фильтра из одной или более поисковых таблиц во время декодирования.
5. Устройство по любому из пп. 1-4, в котором базовый декодер содержит функциональный блок MPEG Surround, который включает в себя блок повышающего микширования.
6. Устройство по любому из пп. 1-5, в котором входной сигнал является моносигналом;
причем блок повышающего микширования дополнительно включает в себя модуль микширования для применения матрицы микширования для микширования входного сигнала с выходными данными блока декоррелятора;
причем блок декоррелятора включает в себя:
блок разделения для отделения транзиентного компонента входного сигнала от не транзиентного компонента входного сигнала;
блок всечастотного декоррелятора, выполненный с возможностью применять фильтр декорреляции к нетранзиентному компоненту входного сигнала;
блок транзиентного декоррелятора, выполненный с возможностью обрабатывать транзиентный компонент входного сигнала; и
блок объединения сигнала для объединения выходных данных блока всечастотного декоррелятора и выходных данных блока транзиентного декоррелятора; и
причем блок всечастотного декоррелятора выполнен с возможностью определять коэффициенты фильтра для фильтра декорреляции посредством ссылки на предварительно вычисленные значения.
7. Устройство по любому из пп. 1-6, в котором фильтр декорреляции включает в себя зависимую от частоты предварительную задержку, за которой следуют всечастотные секции, и в котором коэффициенты фильтра определены для всечастотных секций.
8. Устройство по любому из пп. 1-7, в котором блок повышающего микширования является блоком OTT, который может выполнять повышающее микширование из моносигнала в стереосигнал.
9. Устройство для кодирования аудиосигнала в поток унифицированного кодирования речи и звука, устройство содержит:
базовый кодер для кодирования потока унифицированного кодирования речи и звука;
причем базовый кодер выполнен с возможностью автономно определять коэффициенты фильтра для фильтра декорреляции для использования в блоке повышающего микширования декодера для декодирования потока унифицированного кодирования речи и звука.
10. Устройство по п. 9, в котором коэффициенты фильтра для фильтра декорреляции определены на основе одного или более коэффициентов решетки.
11. Устройство по п. 9 или 10, в котором коэффициенты фильтра для фильтра декорреляции предварительно вычислены автономно и сохранены в одной или более поисковых таблицах.
12. Устройство по п. 11, в котором отдельная поисковая таблица сформирована для каждого из множества ненакладывающихся диапазонов частотных полос.
13. Устройство по любому из пп. 9-12, в котором определение коэффициентов фильтра в декодере включает в себя запрос предварительно вычисленных значений для коэффициентов фильтра из одной или более поисковых таблиц во время декодирования.
14. Способ декодирования закодированного потока унифицированного кодирования речи и звука, способ содержит этап, на котором:
декодируют закодированный поток унифицированного кодирования речи и звука;
причем декодирование включает в себя повышающее микширование из моносигнала в стереосигнал;
причем повышающее микширование из моносигнала в стереосигнал включает в себя применение фильтра декорреляции к входному сигналу; и
причем применение фильтра декорреляции включает в себя определение коэффициентов фильтра для фильтра декорреляции посредством ссылки на предварительно вычисленные значения.
15. Способ по п. 14, в котором коэффициенты фильтра для фильтра декорреляции предварительно вычислены автономно и сохранены в одной или более поисковых таблицах.
16. Способ по п. 15, в котором отдельная поисковая таблица обеспечена для каждого из множества ненакладывающихся диапазонов частотных полос.
17. Способ по любому из пп. 14-16, в котором определение коэффициентов фильтра включает в себя запрос предварительно вычисленных значений для коэффициентов фильтра из одной или более поисковых таблиц во время декодирования.
18. Способ по любому из пп. 14-17, в котором декодирование закодированного потока унифицированного кодирования речи и звука включает в себя применение обработки посредством функционального блока MPEG Surround, который включает в себя блок повышающего микширования.
19. Способ по любому из пп. 14-18, в котором входной сигнал является моносигналом;
причем повышающее микширование из моносигнала в стереосигнал дополнительно включает в себя применение матрицы микширования для микширования входного сигнала с его декоррелированной версией, декоррелированная версия получается посредством применения фильтра декорреляции к входному сигналу;
причем применение фильтра декорреляции включает в себя этапы, на которых:
отделяют транзиентный компонент входного сигнала от не транзиентного компонента входного сигнала;
применяют фильтр декорреляции к нетранзиентному компоненту входного сигнала посредством блока всечастотного декоррелятора;
обрабатывают транзиентный компонент входного сигнала посредством блока транзиентного декоррелятора; и
объединяют выходные данные блока всечастотного декоррелятора и выходные данные блока транзиентного декоррелятора; и
причем коэффициенты фильтра для фильтра декорреляции определяются посредством ссылки на предварительно вычисленные значения.
20. Способ по любому из пп. 14-19, в котором фильтр декорреляции включает в себя зависимую от частоты предварительную задержку, за которой следуют всечастотные секции, и в котором коэффициенты фильтра определены для всечастотных секций.
21. Способ кодирования аудиосигнала в поток унифицированного кодирования речи и звука, способ содержит этап, на котором:
кодируют поток унифицированного кодирования речи и звука;
причем кодирование включает в себя автономное определение коэффициентов фильтра для фильтра декорреляции для использования в блоке повышающего микширования декодера для декодирования закодированного потока унифицированного кодирования речи и звука.
22. Способ по п. 21, в котором коэффициенты фильтра для фильтра декорреляции определены на основе одного или более коэффициентов решетки.
23. Способ по п. 21 или 22, в котором коэффициенты фильтра для фильтра декорреляции предварительно вычислены автономно и сохранены в одной или более поисковых таблицах.
24. Способ по п. 23, в котором отдельная поисковая таблица сформирована для каждого из множества ненакладывающихся диапазонов частотных полос.
25. Способ по любому из пп. 21-24, в котором определение коэффициентов фильтра в декодере включает в себя доступ к предварительно вычисленным значениям для коэффициентов фильтра из одной или более поисковых таблиц во время декодирования.
26. Носитель информации, содержащий программу, выполненную с возможностью исполнения на процессоре и выполнения этапов способа по любому из пп. 14-20 при ее выполнении на вычислительном устройстве.
27. Носитель информации, содержащий программу, выполненную с возможностью исполнения на процессоре и выполнения этапов способа по любому из пп. 21-25 при ее выполнении на вычислительном устройстве.
RU2020123720A 2017-12-19 2018-12-19 Способы, устройство и системы для улучшения фильтра декорреляции унифицированного декодирования и кодирования речи и звука RU2776394C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
IN201741045577 2017-12-19
IN201741045577 2017-12-19
US201862665728P 2018-05-02 2018-05-02
US62/665,728 2018-05-02
PCT/EP2018/085939 WO2019121981A1 (en) 2017-12-19 2018-12-19 Methods, apparatus and systems for unified speech and audio decoding and encoding decorrelation filter improvements

Publications (2)

Publication Number Publication Date
RU2020123720A true RU2020123720A (ru) 2022-01-20
RU2776394C2 RU2776394C2 (ru) 2022-07-19

Family

ID=

Also Published As

Publication number Publication date
WO2019121981A1 (en) 2019-06-27
EP3729424A1 (en) 2020-10-28
JP7326286B2 (ja) 2023-08-15
KR20200099559A (ko) 2020-08-24
TW201928947A (zh) 2019-07-16
JP2021508083A (ja) 2021-02-25
BR112020012655A2 (pt) 2020-12-01
US11482233B2 (en) 2022-10-25
US20200380997A1 (en) 2020-12-03
TWI812658B (zh) 2023-08-21
CN111670472A (zh) 2020-09-15

Similar Documents

Publication Publication Date Title
EP2873072B1 (en) Methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
KR101218777B1 (ko) 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
TWI485699B (zh) 音訊信號訊框中事件槽位的編碼與解碼技術
RU2659497C2 (ru) Управляемое модулем рендеринга пространственное повышающее микширование
US8036904B2 (en) Audio encoder and method for scalable multi-channel audio coding, and an audio decoder and method for decoding said scalable multi-channel audio coding
RU2010152580A (ru) Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер
US20210166708A1 (en) Methods and devices for encoding and/or decoding immersive audio signals
RU2010137467A (ru) Кодирование и декодирование звука
CN107077861B (zh) 音频编码器和解码器
JP6520937B2 (ja) オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
RU2020123720A (ru) Способы, устройство и системы для улучшения фильтра декорреляции унифицированного декодирования и кодирования речи и звука
JP6564068B2 (ja) 符号化されたオーディオ信号を処理するための装置および方法
CN108028988B (zh) 处理低复杂度格式转换的内部声道的设备和方法
Cho et al. Implementation of an object audio system based on MPEG-4 audio lossless coding on DSP
JP2024503186A (ja) マルチチャネル・コーデックにおける空間ノイズ充填