RU2016106975A - Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием - Google Patents

Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием Download PDF

Info

Publication number
RU2016106975A
RU2016106975A RU2016106975A RU2016106975A RU2016106975A RU 2016106975 A RU2016106975 A RU 2016106975A RU 2016106975 A RU2016106975 A RU 2016106975A RU 2016106975 A RU2016106975 A RU 2016106975A RU 2016106975 A RU2016106975 A RU 2016106975A
Authority
RU
Russia
Prior art keywords
audio
speech
channels
representation
content
Prior art date
Application number
RU2016106975A
Other languages
English (en)
Other versions
RU2639952C2 (ru
Inventor
Йерун КОППЕНС
Ханнес МУЕШ
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн, Долби Интернешнл Аб filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of RU2016106975A publication Critical patent/RU2016106975A/ru
Application granted granted Critical
Publication of RU2639952C2 publication Critical patent/RU2639952C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (43)

1. Способ, включающий:
прием микшированного звукового содержимого в исходном представлении звуковых каналов, которое распределено по множеству звуковых каналов исходного представления звуковых каналов, при этом микшированное звуковое содержимое содержит микширование речевого содержимого и неречевого звукового содержимого;
преобразование одной или более частей микшированного звукового содержимого, которые распределены по двум или более каналам, отличным от средних/побочных (отличным от M/S), во множестве звуковых каналов исходного представления звуковых каналов, в одну или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов, которые распределены по одному или более каналам представления M/S звуковых каналов, при этом представление M/S звуковых каналов содержит по меньшей мере средний канал и побочный канал, при этом средний канал представляет собой взвешенную или невзвешенную сумму двух каналов исходного представления звуковых каналов, и при этом побочный канал представляет взвешенную или невзвешенную разность двух каналов исходного представления звуковых каналов;
определение метаданных для усиления речи одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов; и генерирование звукового сигнала, который содержит микшированное звуковое содержимое и метаданные для усиления речи одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов; при этом способ выполняют посредством одного или более вычислительных устройств.
2. Способ по п. 1, отличающийся тем, что микшированное звуковое содержимое находится в представлении звуковых каналов, отличных от M/S.
3. Способ по любому из предыдущих пунктов, отличающийся тем, что дополнительно включает:
генерирование версии речевого содержимого в представлении M/S звуковых каналов, отделенной от микшированного звукового содержимого; и вывод звукового сигнала, кодированного с использованием версии речевого содержимого в представлении M/S звуковых каналов.
4. Способ по п. 3, отличающийся тем, что дополнительно включает:
генерирование данных, указывающих на смешивание, указывающих на конкретное количественное сочетание первого и второго типов усиления речи, подлежащего генерированию принимающим аудиодекодером, при этом первый тип усиления речи представляет собой усиление речи на основе версии речевого содержимого в представлении M/S звуковых каналов, и при этом второй тип усиления речи представляет собой усиление речи с параметрическим кодированием на основе восстановленной версии речевого содержимого в представлении M/S звуковых каналов; и вывод звукового сигнала, кодированного с использованием данных, указывающих на смешивание.
5. Способ по п. 4, отличающийся тем, что по меньшей мере часть метаданных для усиления речи позволяет принимающему аудиодекодеру восстанавливать восстановленную версию речевого содержимого в M/S представлении из микшированного звукового содержимого в исходном представлении звуковых каналов.
6. Способ по п. 4, отличающийся тем, что данные, указывающие на смешивание, генерируются на основе по меньшей мере частично одного или более значений SNR для одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов, при этом одно или более значений SNR представляют одно или более отношений мощности речевого содержимого и неречевого звукового содержимого одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов или отношений мощности речевого содержимого и общего звукового содержимого одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов.
7. Способ по п. 4, отличающийся тем, что конкретное количественное сочетание первого и второго типов усиления речи определяется моделью слухового маскирования, в которой первый тип усиления речи представляет наибольшую относительную величину усиления речи во множестве сочетаний усилений речи во множестве сочетаний первого и второго типов усиления речи, которая гарантирует, что шум кодирования не будет нежелательно слышимым в выходной звуковой программе с усиленной речью.
8. Способ по п. 1, отличающийся тем, что по меньшей мере часть метаданных для усиления речи позволяет принимающему аудиодекодеру восстанавливать версию речевого содержимого в M/S представлении из микшированного звукового содержимого в исходном представлении звуковых каналов.
9. Способ по п. 1, отличающийся тем, что метаданные для усиления речи содержат метаданные, относящиеся к одной или более операциям усиления речи в представлении M/S звуковых каналов на основе версии речевого содержимого или операциям усиления речи с параметрическим кодированием в представлении M/S звуковых каналов.
10. Способ по п. 1, отличающийся тем, что исходное представление звуковых каналов содержит звуковые каналы, относящиеся к динамикам объемного звучания.
11. Способ по п. 1, отличающийся тем, что два или более каналов, отличных от M/S, исходного представления звуковых каналов содержат два или более центральных каналов, левых каналов или правых каналов; и при этом один или более M/S каналов представления M/S звуковых каналов содержат один или более средних каналов или побочных каналов.
12. Способ по п. 1, отличающийся тем, что метаданные для усиления речи содержат один набор метаданных усиления речи, относящихся к среднему каналу представления M/S звуковых каналов.
13. Способ по п. 1, отличающийся тем, что дополнительно включает предотвращение кодирования одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов в качестве части звукового сигнала.
14. Способ по п. 1, отличающийся тем, что метаданные для усиления речи представляют собой часть всех аудиометаданных, кодированных в звуковом сигнале.
15. Способ по п. 1, отличающийся тем, что аудиометаданные, кодированные в звуковом сигнале, содержат поле данных для указания наличия метаданных для усиления речи.
16. Способ по п. 1, отличающийся тем, что звуковой сигнал является частью аудиовизуального сигнала.
17. Способ, включающий:
прием звукового сигнала, который содержит микшированное звуковое содержимое в исходном представлении звуковых каналов и метаданные для усиления речи, при этом микшированное звуковое содержимое имеет микширование речевого содержимого и неречевого звукового содержимого; преобразование одной или более частей микшированного звукового содержимого, которые распределены по двум или более каналам, отличным от M/S, во множестве звуковых каналов исходного представления звуковых каналов, в одну или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов, которые распределены по одному или более M/S каналам представления M/S звуковых каналов, при этом представление M/S звуковых каналов содержит по меньшей мере средний канал и побочный канал, при этом средний канал представляет собой взвешенную или невзвешенную сумму двух каналов исходного представления звуковых каналов, и при этом побочный канал представляет собой взвешенную или невзвешенную разность двух каналов исходного представления звуковых каналов; выполнение одной или более операций усиления речи на основе метаданных усиления речи в отношении одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов для генерирования одной или более частей усиленного речевого содержимого в M/S представлении; объединение одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов с одной или более частями улучшенного речевого содержимого в M/S представлении для генерирования одной или более частей микшированного звукового содержимого с усиленной речью в M/S представлении;
при этом способ выполняют посредством одного или более вычислительных устройств.
18. Способ по п. 17, отличающийся тем, что этапы преобразования, выполнения и объединения реализуют в одной операции, которую выполняют в отношении одной или более частей микшированного звукового содержимого, которые распределяются по двум или более каналам, отличным от M/S, во множестве звуковых каналов исходного представления звуковых каналов.
19. Способ по любому из пп. 17-18, отличающийся тем, что дополнительно включает обратное преобразование одной или более частей микшированного звукового содержимого с усиленной речью в M/S представлении в одну или более частей микшированного звукового содержимого с усиленной речью в исходном представлении звуковых каналов.
20. Способ по п. 17, отличающийся тем, что дополнительно включает:
извлечение версии речевого содержимого в представлении M/S звуковых каналов, отделенной от микшированного звукового содержимого из звукового сигнала; и выполнение одной или более операций усиления речи на основе по меньшей мере части метаданных для усиления речи в отношении одной или более частей версии речевого содержимого в представлении M/S звуковых каналов для генерирования одной или более вторых частей усиленного речевого содержимого в представлении M/S звуковых каналов.
21. Способ по п. 20, отличающийся тем, что дополнительно включает: определение данных, указывающих на смешивание, для усиления речи;
генерирование на основе данных, указывающих на смешивание, для усиления речи конкретного количественного сочетания двух типов усиления речи, при этом первый тип усиления речи основан на версии речевого содержимого в представлении M/S звуковых каналов, и второй тип усиления речи представляет собой усиление речи с параметрическим кодированием на основе восстановленной версии речевого содержимого в представлении M/S звуковых каналов.
22. Способ по п. 21, отличающийся тем, что данные, указывающие на смешивание, генерируются одним из следующего: расположенным выше по потоку аудиокодером, который генерирует звуковой сигнал, или принимающим аудиодекодером, который принимает звуковой сигнал, на основе по меньшей мере частично одного или более значений SNR для одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов, при этом одно или более значений SNR представляют одно или более отношений мощности речевого содержимого и неречевого звукового содержимого одной или более частей преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов или отношений мощности речевого содержимого и общего звукового содержимого одной или более частей одного из следующего: преобразованного микшированного звукового содержимого в представлении M/S звуковых каналов или микшированного звукового содержимого в исходном представлении звуковых каналов.
23. Способ по любому из пп. 21-22, отличающийся тем, что конкретное количественное сочетание двух типов усиления речи определяется моделью слухового маскирования, как произведено одним из следующего: расположенным выше по потоку аудиокодером, который генерирует звуковой сигнал, или принимающим аудиодекодером, который принимает звуковой сигнал, в котором первый тип усиления речи представляет наибольшую относительную величину усиления речи во множестве сочетаний усилений речи во множестве сочетаний первого и второго типов усиления речи, которая гарантирует, что шум кодирования не будет нежелательно слышимым в выходной звуковой программе с усиленной речью.
24. Способ по п. 17, отличающийся тем, что по меньшей мере часть метаданных для усиления речи позволяет принимающему аудиодекодеру восстанавливать версию речевого содержимого в M/S представлении из микшированного звукового содержимого в исходном представлении звуковых каналов.
25. Способ по п. 17, отличающийся тем, что метаданные для усиления речи содержат метаданные, относящиеся к одной или более операциям усиления речи в представлении M/S звуковых каналов на основе версии речевого содержимого или операциям усиления речи с параметрическим кодированием в представлении M/S звуковых каналов.
26. Способ по п. 17, отличающийся тем, что исходное представление звуковых каналов содержит звуковые каналы, относящиеся к динамикам объемного звучания.
27. Способ по п. 17, отличающийся тем, что два или более каналов, отличных от M/S, исходного представления звуковых каналов содержат один или более центральных каналов, левых каналов или правых каналов; и, при этом один или более M/S каналов представления M/S звуковых каналов содержат один или более средних каналов или побочных каналов.
28. Способ по п. 17, отличающийся тем, что метаданные для усиления речи содержат один набор метаданных усиления речи, относящихся к среднему каналу представления M/S звуковых каналов.
29. Способ по п. 17, отличающийся тем, что метаданные для усиления речи представляют собой часть всех аудиометаданных, кодированных в звуковом сигнале.
30. Способ по п. 17, отличающийся тем, что аудиометаданные, кодированные в звуковом сигнале, содержат поле данных для указания наличия метаданных для усиления речи.
31. Способ по п. 17, отличающийся тем, что звуковой сигнал является частью аудиовизуального сигнала.
32. Система обработки медиаданных, выполненная с возможностью выполнения любого из способов по пп. 1-31.
33. Устройство, содержащее процессор и выполненное с возможностью выполнения любого из способов по пп. 1-31.
34. Постоянный машиночитаемый носитель данных, содержащий программные команды, которые при исполнении одним или более процессорами приводят к выполнению любого из способов по пп. 1-31.
RU2016106975A 2013-08-28 2014-08-27 Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием RU2639952C2 (ru)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361870933P 2013-08-28 2013-08-28
US61/870,933 2013-08-28
US201361895959P 2013-10-25 2013-10-25
US61/895,959 2013-10-25
US201361908664P 2013-11-25 2013-11-25
US61/908,664 2013-11-25
PCT/US2014/052962 WO2015031505A1 (en) 2013-08-28 2014-08-27 Hybrid waveform-coded and parametric-coded speech enhancement

Publications (2)

Publication Number Publication Date
RU2016106975A true RU2016106975A (ru) 2017-08-29
RU2639952C2 RU2639952C2 (ru) 2017-12-25

Family

ID=51535558

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016106975A RU2639952C2 (ru) 2013-08-28 2014-08-27 Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием

Country Status (9)

Country Link
US (2) US10141004B2 (ru)
EP (2) EP3039675B1 (ru)
JP (1) JP6001814B1 (ru)
KR (1) KR101790641B1 (ru)
CN (2) CN105493182B (ru)
BR (2) BR112016004299B1 (ru)
ES (1) ES2700246T3 (ru)
RU (1) RU2639952C2 (ru)
WO (1) WO2015031505A1 (ru)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2979948C (en) 2012-10-05 2019-10-22 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. An apparatus for encoding a speech signal employing acelp in the autocorrelation domain
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN107077861B (zh) 2014-10-01 2020-12-18 杜比国际公司 音频编码器和解码器
US10375496B2 (en) 2016-01-29 2019-08-06 Dolby Laboratories Licensing Corporation Binaural dialogue enhancement
US10535360B1 (en) * 2017-05-25 2020-01-14 Tp Lab, Inc. Phone stand using a plurality of directional speakers
GB2563635A (en) * 2017-06-21 2018-12-26 Nokia Technologies Oy Recording and rendering audio signals
USD885366S1 (en) 2017-12-27 2020-05-26 Yandex Europe Ag Speaker device
RU2707149C2 (ru) * 2017-12-27 2019-11-22 Общество С Ограниченной Ответственностью "Яндекс" Устройство и способ модифицирования вывода аудиосигнала устройства
CN110060696B (zh) * 2018-01-19 2021-06-15 腾讯科技(深圳)有限公司 混音方法及装置、终端及可读存储介质
CN112470219B (zh) * 2018-07-25 2024-08-02 杜比实验室特许公司 压缩机目标曲线以避免增强噪声
US10547927B1 (en) * 2018-07-27 2020-01-28 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices
CN112639968B (zh) * 2018-08-30 2024-10-01 杜比国际公司 用于控制对经低比特率编码的音频的增强的方法和装置
JP7051749B2 (ja) * 2019-06-03 2022-04-11 株式会社東芝 信号処理装置、信号処理システム、信号処理方法、およびプログラム
USD947152S1 (en) 2019-09-10 2022-03-29 Yandex Europe Ag Speaker device
JP7677325B2 (ja) * 2020-04-01 2025-05-15 ソニーグループ株式会社 信号処理装置および方法、並びにプログラム
US20220270626A1 (en) * 2021-02-22 2022-08-25 Tencent America LLC Method and apparatus in audio processing
GB2619731A (en) * 2022-06-14 2023-12-20 Nokia Technologies Oy Speech enhancement
US20250038833A1 (en) * 2023-07-28 2025-01-30 Hughes Network Systems, Llc Multi-band hybrid satellite communication systems and methods

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US20050065786A1 (en) * 2003-09-23 2005-03-24 Jacek Stachurski Hybrid speech coding and system
CN1116737C (zh) * 1998-04-14 2003-07-30 听觉增强有限公司 用户可调节的适应听力的音量控制
US7415120B1 (en) * 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
US6928169B1 (en) * 1998-12-24 2005-08-09 Bose Corporation Audio signal processing
AR024353A1 (es) * 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
JP2001245237A (ja) 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7010482B2 (en) * 2000-03-17 2006-03-07 The Regents Of The University Of California REW parametric vector quantization and dual-predictive SEW vector quantization for waveform interpolative coding
US20040096065A1 (en) * 2000-05-26 2004-05-20 Vaudrey Michael A. Voice-to-remaining audio (VRA) interactive center channel downmix
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
FI114770B (fi) * 2001-05-21 2004-12-15 Nokia Corp Matkaviestimen äänidatan kontrollointi solukkojärjestelmässä
KR100400226B1 (ko) 2001-10-15 2003-10-01 삼성전자주식회사 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
US7231344B2 (en) 2002-10-29 2007-06-12 Ntt Docomo, Inc. Method and apparatus for gradient-descent based window optimization for linear prediction analysis
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
US7251337B2 (en) * 2003-04-24 2007-07-31 Dolby Laboratories Licensing Corporation Volume control in movie theaters
US7565286B2 (en) * 2003-07-17 2009-07-21 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada Method for recovery of lost speech data
JP2004004952A (ja) * 2003-07-30 2004-01-08 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法
DE10344638A1 (de) * 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene
WO2005024780A2 (en) * 2003-09-05 2005-03-17 Grody Stephen D Methods and apparatus for providing services using speech recognition
US20050065787A1 (en) * 2003-09-23 2005-03-24 Jacek Stachurski Hybrid speech coding and system
US20050091041A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US7523032B2 (en) * 2003-12-19 2009-04-21 Nokia Corporation Speech coding method, device, coding module, system and software program product for pre-processing the phase structure of a to be encoded speech signal to match the phase structure of the decoded signal
JP5069909B2 (ja) * 2004-01-20 2012-11-07 ドルビー ラボラトリーズ ライセンシング コーポレイション ブロック系列化に基づくオーディオコーディング
GB0410321D0 (en) * 2004-05-08 2004-06-09 Univ Surrey Data transmission
US20050256702A1 (en) * 2004-05-13 2005-11-17 Ittiam Systems (P) Ltd. Algebraic codebook search implementation on processors with multiple data paths
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
WO2006075269A1 (en) * 2005-01-11 2006-07-20 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US20060217970A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for noise reduction
US20060217969A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for echo suppression
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
US20060217971A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US20060215683A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for voice quality enhancement
US20060217988A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for adaptive level control
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
MX2007012185A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Metodo y aparato para cuantificacion de vector de una representacion de envoltura espectral.
EP1875463B1 (en) * 2005-04-22 2018-10-17 Qualcomm Incorporated Systems, methods, and apparatus for gain factor smoothing
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
JP5009910B2 (ja) * 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US7853539B2 (en) * 2005-09-28 2010-12-14 Honda Motor Co., Ltd. Discriminating speech and non-speech with regularized least squares
GB2432765B (en) * 2005-11-26 2008-04-30 Wolfson Microelectronics Plc Audio device
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7716048B2 (en) * 2006-01-25 2010-05-11 Nice Systems, Ltd. Method and apparatus for segmentation of audio interactions
WO2007093726A2 (fr) * 2006-02-14 2007-08-23 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
KR101364979B1 (ko) * 2006-02-24 2014-02-20 오렌지 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈
US20090299755A1 (en) * 2006-03-20 2009-12-03 France Telecom Method for Post-Processing a Signal in an Audio Decoder
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
US7606716B2 (en) * 2006-07-07 2009-10-20 Srs Labs, Inc. Systems and methods for multi-dialog surround audio
JP5513887B2 (ja) * 2006-09-14 2014-06-04 コーニンクレッカ フィリップス エヌ ヴェ 多チャネル信号のためのスイートスポット操作
JP5270557B2 (ja) * 2006-10-16 2013-08-21 ドルビー・インターナショナル・アクチボラゲット 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
JP4569618B2 (ja) * 2006-11-10 2010-10-27 ソニー株式会社 エコーキャンセラ及び通話音声処理装置
DE102007017254B4 (de) * 2006-11-16 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Kodieren und Dekodieren
BRPI0710935A2 (pt) * 2006-11-24 2012-02-14 Lg Electronics Inc método para codificar e decodificação de sinal de áudio orientado a objeto e aparelhagem para o mesmo
US8352257B2 (en) 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
EP2118892B1 (en) 2007-02-12 2010-07-14 Dolby Laboratories Licensing Corporation Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
JP5530720B2 (ja) 2007-02-26 2014-06-25 ドルビー ラボラトリーズ ライセンシング コーポレイション エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体
US7853450B2 (en) * 2007-03-30 2010-12-14 Alcatel-Lucent Usa Inc. Digital voice enhancement
US9191740B2 (en) * 2007-05-04 2015-11-17 Personics Holdings, Llc Method and apparatus for in-ear canal sound suppression
JP2008283385A (ja) * 2007-05-09 2008-11-20 Toshiba Corp 雑音抑制装置
JP2008301427A (ja) 2007-06-04 2008-12-11 Onkyo Corp マルチチャンネル音声再生装置
US8644970B2 (en) * 2007-06-08 2014-02-04 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
ATE514163T1 (de) * 2007-09-12 2011-07-15 Dolby Lab Licensing Corp Spracherweiterung
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
WO2009049671A1 (en) * 2007-10-16 2009-04-23 Nokia Corporation Scalable coding with partial eror protection
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
TWI351683B (en) * 2008-01-16 2011-11-01 Mstar Semiconductor Inc Speech enhancement device and method for the same
JP5058844B2 (ja) 2008-02-18 2012-10-24 シャープ株式会社 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
KR101178114B1 (ko) * 2008-03-04 2012-08-30 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 복수의 입력 데이터 스트림을 믹싱하기 위한 장치
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
UA101974C2 (ru) * 2008-04-18 2013-05-27 Долби Леборетериз Лайсенсинг Корпорейшн Способ и устройство для поддержки восприятия языка во многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
JP4327886B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
WO2009151578A2 (en) 2008-06-09 2009-12-17 The Board Of Trustees Of The University Of Illinois Method and apparatus for blind signal recovery in noisy, reverberant environments
KR101381513B1 (ko) * 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
CN102113314B (zh) * 2008-07-29 2013-08-07 Lg电子株式会社 用于处理音频信号的方法和设备
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
CN102265647B (zh) * 2008-12-22 2015-05-20 皇家飞利浦电子股份有限公司 通过发送效果处理生成输出信号
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
WO2010105926A2 (en) * 2009-03-17 2010-09-23 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
KR20120006060A (ko) * 2009-04-21 2012-01-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 합성
JP5678048B2 (ja) * 2009-06-24 2015-02-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム
JP4621792B2 (ja) * 2009-06-30 2011-01-26 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
WO2011025532A1 (en) * 2009-08-24 2011-03-03 NovaSpeech, LLC System and method for speech synthesis using frequency splicing
WO2011026247A1 (en) * 2009-09-04 2011-03-10 Svox Ag Speech enhancement techniques on the power spectrum
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
TWI459828B (zh) 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
EP2372700A1 (en) * 2010-03-11 2011-10-05 Oticon A/S A speech intelligibility predictor and applications thereof
IL286761B (en) * 2010-04-09 2022-09-01 Dolby Int Ab An uplink mixer is active in predictive or non-predictive mode
PL3779981T3 (pl) * 2010-04-13 2023-10-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio lub wideo, dekoder audio lub wideo i powiązane sposoby przetwarzania wielokanałowych sygnałów audio lub wideo z wykorzystaniem zmiennego kierunku predykcji
EP2559032B1 (en) * 2010-04-16 2019-01-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
US20120215529A1 (en) * 2010-04-30 2012-08-23 Indian Institute Of Science Speech Enhancement
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
KR101696632B1 (ko) * 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
JP4837123B1 (ja) * 2010-07-28 2011-12-14 株式会社東芝 音質制御装置及び音質制御方法
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
BR112012031656A2 (pt) * 2010-08-25 2016-11-08 Asahi Chemical Ind dispositivo, e método de separação de fontes sonoras, e, programa
KR20130108281A (ko) * 2010-09-10 2013-10-02 파나소닉 주식회사 부호화 장치 및 부호화 방법
DK2649813T3 (en) * 2010-12-08 2017-09-04 Widex As HEARING AND A PROCEDURE FOR IMPROVED SOUND RENDERING
US9462387B2 (en) * 2011-01-05 2016-10-04 Koninklijke Philips N.V. Audio system and method of operation therefor
US20120300960A1 (en) * 2011-05-27 2012-11-29 Graeme Gordon Mackay Digital signal routing circuit
EP2727383B1 (en) * 2011-07-01 2021-04-28 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
EP2544466A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
EP2772914A4 (en) * 2011-10-28 2015-07-15 Panasonic Corp DECODER FOR HYBRID SOUND SIGNALS, COORDINATORS FOR HYBRID SOUND SIGNALS, DECODING PROCEDURE FOR SOUND SIGNALS AND CODING SIGNALING PROCESSES
JP6096789B2 (ja) * 2011-11-01 2017-03-15 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオオブジェクトのエンコーディング及びデコーディング
US20130136282A1 (en) * 2011-11-30 2013-05-30 David McClain System and Method for Spectral Personalization of Sound
US9263040B2 (en) * 2012-01-17 2016-02-16 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance speech recognition
US9418674B2 (en) * 2012-01-17 2016-08-16 GM Global Technology Operations LLC Method and system for using vehicle sound information to enhance audio prompting
US9934780B2 (en) * 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
BR112014017457A8 (pt) * 2012-01-19 2017-07-04 Koninklijke Philips Nv aparelho de transmissão de áudio espacial; aparelho de codificação de áudio espacial; método de geração de sinais de saída de áudio espacial; e método de codificação de áudio espacial
US20130211846A1 (en) * 2012-02-14 2013-08-15 Motorola Mobility, Inc. All-pass filter phase linearization of elliptic filters in signal decimation and interpolation for an audio codec
KR101662680B1 (ko) * 2012-02-14 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치
EP2849180B1 (en) * 2012-05-11 2020-01-01 Panasonic Corporation Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal
EP2864911A1 (en) 2012-06-22 2015-04-29 Université Pierre et Marie Curie (Paris 6) Method for automated assistance to design nonlinear analog circuit with transient solver
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9094742B2 (en) * 2012-07-24 2015-07-28 Fox Filmed Entertainment Event drivable N X M programmably interconnecting sound mixing device and method for use thereof
US9031836B2 (en) * 2012-08-08 2015-05-12 Avaya Inc. Method and apparatus for automatic communications system intelligibility testing and optimization
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US8824710B2 (en) * 2012-10-12 2014-09-02 Cochlear Limited Automated sound processor
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
US9344826B2 (en) * 2013-03-04 2016-05-17 Nokia Technologies Oy Method and apparatus for communicating with audio signals having corresponding spatial characteristics
ES2688134T3 (es) * 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
BR112015025080B1 (pt) * 2013-04-05 2021-12-21 Dolby International Ab Método de decodificação e decodificador para decodificar dois sinais de áudio, método de codificação e codificador para codificar dois sinais de áudio, e meio legível não transitório
EP2830056A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
EP2882203A1 (en) * 2013-12-06 2015-06-10 Oticon A/s Hearing aid device for hands free communication
US9293143B2 (en) * 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection

Also Published As

Publication number Publication date
BR112016004299B1 (pt) 2022-05-17
KR101790641B1 (ko) 2017-10-26
CN110890101A (zh) 2020-03-17
EP3503095A1 (en) 2019-06-26
EP3039675B1 (en) 2018-10-03
JP6001814B1 (ja) 2016-10-05
BR122020017207B1 (pt) 2022-12-06
US20190057713A1 (en) 2019-02-21
RU2639952C2 (ru) 2017-12-25
CN105493182B (zh) 2020-01-21
JP2016534377A (ja) 2016-11-04
US20160225387A1 (en) 2016-08-04
CN110890101B (zh) 2024-01-12
KR20160037219A (ko) 2016-04-05
US10607629B2 (en) 2020-03-31
EP3039675A1 (en) 2016-07-06
HK1222470A1 (zh) 2017-06-30
ES2700246T3 (es) 2019-02-14
US10141004B2 (en) 2018-11-27
WO2015031505A1 (en) 2015-03-05
CN105493182A (zh) 2016-04-13
BR112016004299A2 (ru) 2017-08-01

Similar Documents

Publication Publication Date Title
RU2016106975A (ru) Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
CN103493128B (zh) 用于执行多信道音频信号的适应性下混和上混的方法及设备
US10311880B2 (en) System for perceived enhancement and restoration of compressed audio signals
RU2015147158A (ru) Система обработки аудио
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
KR101935183B1 (ko) 멀티-채널 오디오 신호 내의 음성 성분을 향상시키는 신호 처리 장치
TWI833562B (zh) 應用動態範圍壓縮至高階保真立體音響信號之方法和裝置
RU2013131774A (ru) Устройство и способ для разложения входного сигнала с использованием понижающего микшера
RU2015107578A (ru) Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов
RU2012144366A (ru) Стереофоническое кодирование на основе mdct с комплексным предсказанием
FI3891734T3 (fi) Laite, menetelmä ja tietokoneohjelma koodausta, dekoodausta, kohtauksen prosessointia ja muita proseduureja varten liittyen dirac-pohjaiseen spatiaaliseen audiokoodaukseen käyttäen diffuusiokompensointia
EP2698789A3 (en) Audio decoder and decoding method using efficient downmixing
DE602008001787D1 (de) Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer
US20080208600A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
RU2016113712A (ru) Способы и устройства для объединенного многоканального кодирования
CN103262160B (zh) 用于对多通道音频信号进行缩混的方法和设备
MX2015014189A (es) Aparato y metodo para escalado de señales centrales y mejora estereofonica basada en relacion señal a mezcla a dos canales.
EA201790753A1 (ru) Параметрическое микширование звуковых сигналов
CN114005454B (zh) 实现低复杂度格式转换的内部声道处理方法和装置
CN101297352B (zh) 用于编码和解码音频信号的装置及其方法
RU2016105686A (ru) Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов
JP2016536856A (ja) 二つ以上の基本信号からのマルチチャンネル信号の導出
MX348811B (es) Aparato y metodo para la codificacion de objetos de audio espacial que emplea objetos ocultos para la manipulacion de mezclas de señales.
Gunawan et al. Investigation of various algorithms on multichannel audio compression
CN101243488B (zh) 用于编码和解码音频信号的装置及其方法