RU2017113711A - Аудиокодировщик и декодер - Google Patents

Аудиокодировщик и декодер Download PDF

Info

Publication number
RU2017113711A
RU2017113711A RU2017113711A RU2017113711A RU2017113711A RU 2017113711 A RU2017113711 A RU 2017113711A RU 2017113711 A RU2017113711 A RU 2017113711A RU 2017113711 A RU2017113711 A RU 2017113711A RU 2017113711 A RU2017113711 A RU 2017113711A
Authority
RU
Russia
Prior art keywords
dialogue
downmix signals
audio objects
reconstruction
data
Prior art date
Application number
RU2017113711A
Other languages
English (en)
Other versions
RU2696952C2 (ru
RU2017113711A3 (ru
Inventor
Йерун КОППЕНС
Ларс ВИЛЛЕМОЕС
Тони ХИРВОНЕН
Кристофер ЧОЭРЛИНГ
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2017113711A publication Critical patent/RU2017113711A/ru
Publication of RU2017113711A3 publication Critical patent/RU2017113711A3/ru
Application granted granted Critical
Publication of RU2696952C2 publication Critical patent/RU2696952C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (55)

1. Способ усиления диалога в декодере аудиосистемы, включающий этапы, на которых
получают множество сигналов понижающего микширования, при этом сигналы понижающего микширования являются результатом понижающего микширования множества аудиообъектов, содержащего по меньшей мере один объект, представляющий собой диалог,
получают дополнительную информацию, указывающую на коэффициенты, позволяющие реконструкцию множества аудиообъектов из множества сигналов понижающего микширования,
получают данные, определяющие, какой из множества аудиообъектов представляет собой диалог,
изменяют коэффициенты, используя параметр усиления и данные, определяющие, какой из множества аудиообъектов представляет собой диалог, и
реконструируют по меньшей мере указанный по меньшей мере один объект, представляющий собой диалог с применением измененных коэффициентов.
2. Способ по п. 1, отличающийся тем, что на этапе изменения коэффициентов с применением параметра усиления умножают коэффициенты, позволяющие реконструкцию по меньшей мере одного объекта с параметром усиления, представляющего собой диалог.
3. Способ по любому из пп. 1-2, дополнительно включающий этап, на котором рассчитывают коэффициенты, позволяющие реконструкцию множества аудиообъектов из множества сигналов понижающего микширования из дополнительной информации.
4. Способ по любому из пп. 1-2, отличающийся тем, что на этапе реконструкции по меньшей мере указанного по меньшей мере одного объекта, представляющего собой диалог, осуществляют реконструкцию по меньшей мере только одного объекта представляющего собой диалог.
5. Способ по п. 4, отличающийся тем, что на этапе реконструкции по меньшей мере только одного объекта, представляющего собой диалог, не осуществляют декорреляцию сигналов понижающего микширования.
6. Способ по п. 4, дополнительно включающий этап, на котором объединяют реконструированный по меньшей мере один объект, представляющий собой диалог, с сигналами понижающего микширования как по меньшей мере один отдельный сигнал.
7. Способ по п. 6, дополнительно включающий этапы, на которых
получают данные с пространственной информацией, соответствующие пространственным положениям множества сигналов понижающего микширования и по меньшей мере одного объекта, представляющего собой диалог, и
интерпретируют множество сигналов понижающего микширования и по меньшей мере один реконструированный объект, представляющий собой диалог, на основании данных пространственной информации.
8. Способ по п. 4, дополнительно включающий этап, на котором объединяют сигналы понижающего микширования и по меньшей мере один реконструированный объект, представляющий собой диалог, используя информацию, описывающую микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования кодировщиком аудиосистемы.
9. Способ по п. 8, дополнительно включающий этапы, на которых: интерпретируют комбинацию сигналов понижающего микширования и по меньшей мере один реконструированный объект, представляющий собой диалог.
10. Способ по п. 8, дополнительно включающий этап, на котором получают информацию, описывающую микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования кодировщиком аудиосистемы.
11. Способ по п. 10, отличающийся тем, что полученную информацию, описывающую микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования, кодируют посредством энтропийного кодирования.
12. Способ по п. 8, дополнительно включающий этапы, на которых
получают данные с пространственной информацией, соответствующей пространственным положениям множества сигналов понижающего микширования и по меньшей мере одного объекта, представляющего собой диалог, и
рассчитывают информацию описывающую микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования кодировщиком аудиосистемы на основании данных пространственной информации.
13. Способ по п. 12, отличающийся тем, что на этапе расчета применяют функцию, которая размечает пространственное положение по меньшей мере одного объекта, представляющего собой диалог, в пространственные положения множества сигналов понижающего микширования.
14. Способ по п. 13, отличающийся тем, что функция является алгоритмом 3D панорамирования.
15. Способ по п. 1 или 2, отличающийся тем, что на этапе реконструкции по меньшей мере указанного по меньшей мере одного объекта, представляющего собой диалог, осуществляют реконструкцию множества аудиообъектов.
16. Способ по п. 15, дополнительно включающий этапы, на которых
получают данные пространственной информации, соответствующие пространственным положениям множества аудиообъектов, и
интерпретируют множество реконструированных аудиообъектов на основании данных пространственной информации.
17. Компьютерный программный продукт, содержащий машиночитаемый носитель с командами для осуществления способа по любому из пп. 1-16.
18. Декодер усиления диалога в аудиосистеме, содержащий
ступень получения, выполненную с возможностью
получения множества сигналов понижающего микширования, при этом сигналы понижающего микширования являются результатом понижающего микширования множества аудиообъектов, содержащего по меньшей мере один объект, представляющий собой диалог,
получения дополнительной информации, указывающей на коэффициенты, позволяющие реконструкцию множества аудиообъектов из множества сигналов понижающего микширования, и
получения данных, определяющих, какой из множества аудиообъектов представляет собой диалог,
ступень изменения, выполненную с возможностью:
изменения коэффициентов с применением параметра усиления и данных, определяющих, какой из множества аудиообъектов представляет собой диалог,
ступень реконструкции, выполненную с возможностью:
реконструкции по меньшей мере указанного по меньшей мере одного объекта, представляющего собой диалог с применением измененных коэффициентов.
19. Способ кодирования множества аудиообъектов, содержащего по меньшей мере один объект, представляющий собой диалог, включающий этапы, на которых
определяют множество сигналов понижающего микширования, являющегося результатом понижающего микширования множества аудиообъектов, содержащего по меньшей мере один объект, представляющий собой диалог,
определяют дополнительную информацию, указывающую на коэффициенты, позволяющие реконструкцию множества аудиообъектов из множества сигналов понижающего микширования,
определяют данные, определяющие, какой из множества аудиообъектов представляет собой диалог, и
формируют поток данных, содержащий множество сигналов понижающего микширования, дополнительную информацию и данные, определяющие, какой из множества аудиообъектов представляет собой диалог.
20. Способ по п. 19, дополнительно включающий этапы, на которых определяют пространственную информацию, соответствующую пространственному положению множества сигналов понижающего микширования и по меньшей мере одного объекта, представляющего собой диалог, и включают указанную пространственную информацию в поток данных.
21. Способ по п. 19 или 20, в котором на этапе определения множества сигналов понижающего микширования дополнительно определяют информацию, описывающую микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования, при этом способ дополнительно включает этап, на котором включают информацию, описывающую микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования в потоке данных.
22. Способ по п. 21, отличающийся тем, что определенная информация описывающая микширование по меньшей мере одного объекта, представляющего собой диалог, во множество сигналов понижающего микширования, кодируется с применением энтропийного кодирования.
23. Способ по любому из пп. 19-20, дополнительно включающий этапы, на которых
определяют пространственную информацию, соответствующую пространственным положениям множества аудиообъектов, и
включают пространственную информацию, соответствующую пространственным положениям множества аудиообъектов в потоке данных.
24. Компьютерный программный продукт, содержащий машиночитаемый носитель с командами для осуществления способа по любому из пп. 19-23.
25. Кодировщик для кодирования множества аудиообъектов, содержащего по меньшей мере один объект, представляющий собой диалог, причем кодировщик содержит
ступень понижающего микширования, выполненную с возможностью
определения множества сигналов понижающего микширования, являющегося результатом понижающего микширования множества аудиообъектов, содержащего по меньшей мере один объект, представляющий собой диалог,
определения дополнительной информации, указывающей коэффициенты, позволяющие реконструкцию множества аудиообъектов из множества сигналов понижающего микширования, и
ступень кодирования, выполненную с возможностью:
формирования потока данных, содержащего множество сигналов понижающего микширования и дополнительную информацию, причем поток данных дополнительно содержит данные, определяющие, какой из множества аудиообъектов, представляет собой диалог.
RU2017113711A 2014-10-01 2015-10-01 Аудиокодировщик и декодер RU2696952C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462058157P 2014-10-01 2014-10-01
US62/058,157 2014-10-01
PCT/EP2015/072666 WO2016050899A1 (en) 2014-10-01 2015-10-01 Audio encoder and decoder

Publications (3)

Publication Number Publication Date
RU2017113711A true RU2017113711A (ru) 2018-11-07
RU2017113711A3 RU2017113711A3 (ru) 2019-04-19
RU2696952C2 RU2696952C2 (ru) 2019-08-07

Family

ID=54238446

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017113711A RU2696952C2 (ru) 2014-10-01 2015-10-01 Аудиокодировщик и декодер

Country Status (8)

Country Link
US (1) US10163446B2 (ru)
EP (1) EP3201916B1 (ru)
JP (1) JP6732739B2 (ru)
KR (2) KR102482162B1 (ru)
CN (1) CN107077861B (ru)
ES (1) ES2709117T3 (ru)
RU (1) RU2696952C2 (ru)
WO (1) WO2016050899A1 (ru)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160315722A1 (en) * 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10249312B2 (en) 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
US9961475B2 (en) * 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from object-based audio to HOA
EP3662470B1 (en) 2017-08-01 2021-03-24 Dolby Laboratories Licensing Corporation Audio object classification based on location metadata
EP3444820B1 (en) * 2017-08-17 2024-02-07 Dolby International AB Speech/dialog enhancement controlled by pupillometry
WO2020212390A1 (en) * 2019-04-15 2020-10-22 Dolby International Ab Dialogue enhancement in audio codec
US11710491B2 (en) * 2021-04-20 2023-07-25 Tencent America LLC Method and apparatus for space of interest of audio scene

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870480A (en) 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US7415120B1 (en) * 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
CA2328353A1 (en) * 1998-04-14 1999-10-21 Hearing Enhancement Company, Llc User adjustable volume control that accommodates hearing
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US7283965B1 (en) 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
BRPI0605857A (pt) * 2005-04-19 2007-12-18 Coding Tech Ab quantização dependente de energia para a codificação eficiente de parámetros de áudio espacial
CN101258538B (zh) * 2005-05-26 2013-06-12 Lg电子株式会社 将音频信号编解码的方法
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
JP4823030B2 (ja) * 2006-11-27 2011-11-24 株式会社ソニー・コンピュータエンタテインメント 音声処理装置および音声処理方法
ATE474312T1 (de) 2007-02-12 2010-07-15 Dolby Lab Licensing Corp Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer
EP2111616B1 (en) * 2007-02-14 2011-09-28 LG Electronics Inc. Method and apparatus for encoding an audio signal
US8195454B2 (en) 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
HUE041323T2 (hu) * 2007-08-27 2019-05-28 Ericsson Telefon Ab L M Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését
US20090226152A1 (en) 2008-03-10 2009-09-10 Hanes Brett E Method for media playback optimization
MY159890A (en) * 2008-04-18 2017-02-15 Dolby Laboratories Licensing Corp Method and apparatus for maintaining speech audibiliy in multi-channel audio with minimal impact on surround experience
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
BRPI0924076B1 (pt) 2009-05-12 2021-09-21 Huawei Device (Shenzhen) Co., Ltd. Sistema de telepresença e método de telepresença
KR101598654B1 (ko) 2009-09-14 2016-02-29 디티에스 엘엘씨 적응적 음성 가해성 처리 시스템
KR101490725B1 (ko) 2010-03-23 2015-02-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 비디오 디스플레이 장치, 오디오-비디오 시스템, 음향 재생을 위한 방법 및 로컬라이즈된 지각적 오디오를 위한 음향 재생 시스템
CN103026406B (zh) * 2010-09-28 2014-10-08 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
WO2012094335A1 (en) 2011-01-04 2012-07-12 Srs Labs, Inc. Immersive audio rendering system
TWI543642B (zh) 2011-07-01 2016-07-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2839461A4 (en) * 2012-04-19 2015-12-16 Nokia Technologies Oy AUDIO SCENE APPARATUS
US8825188B2 (en) * 2012-06-04 2014-09-02 Troy Christopher Stone Methods and systems for identifying content types
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
JP6186436B2 (ja) 2012-08-31 2017-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション 個々に指定可能なドライバへの上方混合されたコンテンツの反射されたおよび直接的なレンダリング
CN107454511B (zh) 2012-08-31 2024-04-05 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器
US9826328B2 (en) 2012-08-31 2017-11-21 Dolby Laboratories Licensing Corporation System for rendering and playback of object based audio in various listening environments
US9805725B2 (en) 2012-12-21 2017-10-31 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
US9559651B2 (en) * 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
BR112016004299B1 (pt) 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
EP2879131A1 (en) * 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
WO2015186535A1 (ja) * 2014-06-06 2015-12-10 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム

Also Published As

Publication number Publication date
KR20170063657A (ko) 2017-06-08
CN107077861A (zh) 2017-08-18
CN107077861B (zh) 2020-12-18
KR20220066996A (ko) 2022-05-24
KR102482162B1 (ko) 2022-12-29
RU2696952C2 (ru) 2019-08-07
JP6732739B2 (ja) 2020-07-29
EP3201916B1 (en) 2018-12-05
US10163446B2 (en) 2018-12-25
ES2709117T3 (es) 2019-04-15
US20170249945A1 (en) 2017-08-31
RU2017113711A3 (ru) 2019-04-19
WO2016050899A1 (en) 2016-04-07
BR112017006278A2 (pt) 2017-12-12
JP2017535153A (ja) 2017-11-24
EP3201916A1 (en) 2017-08-09

Similar Documents

Publication Publication Date Title
RU2017113711A (ru) Аудиокодировщик и декодер
AR123836A2 (es) Codificador de audio para la codificación de una señal de múltiples canales, un decodificador de audio para la decodificación de una señal de audio codificada, métodos y medios de almacenamiento no transitorio
RU2015104074A (ru) Кодирование и декодирование аудиосигналов
RU2014122111A (ru) Кодирование и декодирование аудиообъектов
JP2015527609A5 (ru)
KR102109159B1 (ko) 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
MY192540A (en) Audio encoder and decoder using a frequency domain processor, a time domain processor, and a cross processor for continuous initialization
MY195412A (en) Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods, Computer Program and Encoded Audio Representation Using a Decorrelation of Rendered Audio Signals
JP2015194666A5 (ru)
RU2016119563A (ru) Параметрическая реконструкция аудиосигналов
AR096257A1 (es) Separación de objeto de audio de señal de mezcla usando resoluciones de tiempo / frecuencia específicas del objeto
MY176406A (en) Encoder, decoder, system and method employing a residual concept for parametric audio object coding
MY190204A (en) Rendering of multichannel audio using interpolated matrices
MY172752A (en) Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
MX2015004205A (es) Codificador, descodificador y métodos para codificación espacial de objetos de audio de multiresolución retrocompatible.
RU2017117896A (ru) Кодирование и декодирование аудиосигналов
CY1121917T1 (el) Παραμετρικη μειξη ακουστικων σηματων
RU2015104055A (ru) Устройство и способы для адаптации аудиоинформации при пространственном кодировании аудиообъектов
MX2015009170A (es) Aparato y metodo para la codificacion de objetos de audio espacial que emplea objetos ocultos para la manipulacion de mezclas de señales.
JP2017536756A5 (ru)
RU2017114642A (ru) Параметрическое кодирование и декодирование многоканальных аудиосигналов
RU2017106641A (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
MX2015016789A (es) Aparato y metodo para codificacion, procesamiento y decodificacion de la envolvente de la señal de audio mediante division de la envolvente de la señal de audio, mediante el uso de cuantificacion de distribucion y codificacion.
TH171319A (th) ตัวถอดรหัสสำหรับการสร้างสัญญาณเสียงที่ได้รับการปรับปรุงความถี่ วิธีการของการ ถอดรหัสตัวเข้ารหัสสำหรับการสร้างสัญญาณที่ได้รับการเข้ารหัส และวิธีการของการ เข้ารหัสที่ใช้สารสนเทศข้างเคียงการเลือกบีบอัด