RU2012128313A - Микширование входящих информационных потоков - Google Patents

Микширование входящих информационных потоков Download PDF

Info

Publication number
RU2012128313A
RU2012128313A RU2012128313/08A RU2012128313A RU2012128313A RU 2012128313 A RU2012128313 A RU 2012128313A RU 2012128313/08 A RU2012128313/08 A RU 2012128313/08A RU 2012128313 A RU2012128313 A RU 2012128313A RU 2012128313 A RU2012128313 A RU 2012128313A
Authority
RU
Russia
Prior art keywords
information
spectral
frame
output
spectral component
Prior art date
Application number
RU2012128313/08A
Other languages
English (en)
Other versions
RU2562395C2 (ru
Inventor
Маркус ШНЕЛЛ
Манфред ЛУТЦКИЙ
Маркус МУЛТРУС
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Publication of RU2012128313A publication Critical patent/RU2012128313A/ru
Application granted granted Critical
Publication of RU2562395C2 publication Critical patent/RU2562395C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding

Abstract

1. Устройство (500) для микширования множества входящих информационных данных, в которых каждый из входящих информационных потоков (510) содержит фрейм аудио данных в спектральной области, фрейм (540) входящего информационного потока (510), содержащий спектральную информацию для множества спектральных компонентов, устройство содержит (500) блок обработки данных (520), предназначенный для сравнения фреймов множества входящих информационных потоков (510), на основе психо акустической модели, с учетом внутриканального маскирования, при этом блок обработки данных (520) предназначен на основе сравнения определить для спектрального компонента выходящего формата данных (550) выходящего информационного потока (530) один конкретный входящий информационный поток (510) из множества входящих информационных потоков (510); и из которого блок обработки данных (520) дополнительно предназначен генерировать выходящий информационный поток путем копирования, по крайней мере, части информации соответствующего спектрального компонента фрейма (540) определенного входящего информационного потока (510), чтобы описать спектральный компонент выходящего фрейма (550) выходящего информационного потока (530).2. Устройство (500) по п.1, в котором блок обработки данных (520) выполнен таким образом, что сравнение фреймов множества входящих информационных потоков (510) основано на, по крайней мере, двух частях спектральной информации, относящейся к одному и тому же спектральному компоненту фреймов (540) двух различных входящих информационных потоков (510).3. Устройство (500) по п.1, в котором устройство (500) выполнено таким образом, что любой спектральный компонент из множества сп�

Claims (11)

1. Устройство (500) для микширования множества входящих информационных данных, в которых каждый из входящих информационных потоков (510) содержит фрейм аудио данных в спектральной области, фрейм (540) входящего информационного потока (510), содержащий спектральную информацию для множества спектральных компонентов, устройство содержит (500) блок обработки данных (520), предназначенный для сравнения фреймов множества входящих информационных потоков (510), на основе психо акустической модели, с учетом внутриканального маскирования, при этом блок обработки данных (520) предназначен на основе сравнения определить для спектрального компонента выходящего формата данных (550) выходящего информационного потока (530) один конкретный входящий информационный поток (510) из множества входящих информационных потоков (510); и из которого блок обработки данных (520) дополнительно предназначен генерировать выходящий информационный поток путем копирования, по крайней мере, части информации соответствующего спектрального компонента фрейма (540) определенного входящего информационного потока (510), чтобы описать спектральный компонент выходящего фрейма (550) выходящего информационного потока (530).
2. Устройство (500) по п.1, в котором блок обработки данных (520) выполнен таким образом, что сравнение фреймов множества входящих информационных потоков (510) основано на, по крайней мере, двух частях спектральной информации, относящейся к одному и тому же спектральному компоненту фреймов (540) двух различных входящих информационных потоков (510).
3. Устройство (500) по п.1, в котором устройство (500) выполнено таким образом, что любой спектральный компонент из множества спектральных компонентов соответствует частоте или полосе частот.
4. Устройство (500) по п.1, в котором блок обработки данных (520) выполнен таким образом, что генерирование выходящего информационного потока предполагает копирование, по крайней мере, части информации соответствующего спектрального компонента только с фрейма определенного входящего потока (510), чтобы описать спектральный компонент выходящего фрейма (550) выходящего информационного потока (530).
5. Устройство (500) по п.1, в котором блок обработки данных (520) выполнен таким образом, что генерирование выходящего информационного потока предполагает копирование аудиоданных в спектральной области соответствующего спектрального компонента из фрейма определенного входящего информационного потока (510).
6. Устройство (500) по п.1, в котором входящие информационные потоки (510) из множества входящих информационных потоков (510), каждый включают, с учетом времени, последовательность фреймов аудиоданных в спектральной области, и в котором блок обработки данных (520) выполнен таким образом, что сравнение фреймов (540) основано только на фреймах, соответствующих общему временному индексу в последовательности фреймов.
7. Устройство (500) по любому из предшествующих пунктов, в котором блок обработки данных (520) выполнен таким образом, что генерирование выходящего информационного потока (530) сохраняет дистрибуцию уровней квантования по сравнению с дистрибуцией уровней квантования, по крайней мере, части информации соответствующего спектрального компонента фрейма определенного входящего потока (510).
8. Устройство (500) по п.1, в котором, по крайней мере, часть информации соответствующего спектрального компонента включает информацию, касающуюся уровней квантования, параметр вытеснения персептивных шумов (PNS), параметр временного вытеснения шумов (TNS) или параметр расщепления (деления) спектральной полосы (SBR).
9. Устройство (500) по п.1, в котором блок обработки (520), в котором блок обработки данных (520) дополнительно предназначен для определения на основании сравнения только одного входящего информационного потока (510) из множества входящих информационных потоков (510) для каждого из разных спектральных компонентов, и в котором блок обработки данных (520) дополнительно предназначен генерировать выходящий информационный поток путем копирования, по крайней мере, части информации соответствующего спектрального компонента фрейма (550) входящего информационного потока (530) таким образом, что выходящий фрейм выходящего информационного потока (530) копирует, по крайней мере, часть спектральной информации соответствующих спектральных компонентов из различных компонентов множества входящих информационных потоков, или в котором блок обработки данных (520) дополнительно предназначен выполнять определение на основе сравнения так, чтобы определить только один входящий информационный поток (510) из множества входящих информационных потоков (510) для первого спектрального компонента и определить не доминирующий входящий информационный поток для второго спектрального компонента, и в котором блок обработки данных (520) дополнительно предназначен генерировать выходящий информационный поток путем копирования, по крайней мере, части спектральной информации соответствующего спектрального компонента фрейма (540) определенного входящего информационного потока (510) для первых спектральных компонентов так, чтобы описать первый спектральный компонент выходящего фрейма (550) выходящего информационного потока (530) так, чтобы выходящий фрейм выходящего информационного потока (530) копировал, по крайней мере, часть информации первого спектрального компонента из определенного входящего информационного потока, и путем микширования второго спектрального компонента множества входящих информационных потоков в спектральной области для того, чтобы описать второй спектральный компонент выходящего фрейма (550) выходящего информационного потока (530).
10. Способ для микширования множества входящих информационных потоков (510), в котором каждый из входящих информационных потоки (510) содержит фрейм аудиоданных (540) в спектральной области, фрейм (540) входящих данных входящего информационного потока (510), включающего множество спектральных компонентов, способ включает сравнение фреймов (540) множества входящих информационных потоков (510) на основе психо-акустической модели, с учетом внутриканального маскирования; определение, на основе сравнения, для спектрального компонента выходящего фрейма (550) выходящего информационного потока (530), одного конкретного входящего информационного потока (510) из множества входящих информационных потоков (510); и генерирование выходящего информационного потока (530) путем копирования, по крайней мере, части информации соответствующего спектрального компонента фрейма определенного входящего информационного потока, (510) чтобы описать спектральный компонент фрейма входящего информационного потока (530).
11. Машиночитаемый носитель информации с записанным на нем кодом компьютерной программы для выполнения, при работе блока обработки данных, способа микширования множества входящих информационных потоков (510) по п.10.
RU2012128313/08A 2008-03-04 2009-03-04 Микширование входящих информационных потоков RU2562395C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US3359008P 2008-03-04 2008-03-04
US61/033590 2008-03-04

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2010136357/08A Division RU2488896C2 (ru) 2008-03-04 2009-03-04 Микширование входящих информационных потоков и генерация выходящего информационного потока

Publications (2)

Publication Number Publication Date
RU2012128313A true RU2012128313A (ru) 2014-01-10
RU2562395C2 RU2562395C2 (ru) 2015-09-10

Family

ID=41053617

Family Applications (3)

Application Number Title Priority Date Filing Date
RU2010136357/08A RU2488896C2 (ru) 2008-03-04 2009-03-04 Микширование входящих информационных потоков и генерация выходящего информационного потока
RU2012128313/08A RU2562395C2 (ru) 2008-03-04 2009-03-04 Микширование входящих информационных потоков
RU2010136360/08A RU2473140C2 (ru) 2008-03-04 2009-03-04 Устройство для микширования множества входных данных

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2010136357/08A RU2488896C2 (ru) 2008-03-04 2009-03-04 Микширование входящих информационных потоков и генерация выходящего информационного потока

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2010136360/08A RU2473140C2 (ru) 2008-03-04 2009-03-04 Устройство для микширования множества входных данных

Country Status (15)

Country Link
US (2) US8290783B2 (ru)
EP (3) EP2250641B1 (ru)
JP (3) JP5536674B2 (ru)
KR (3) KR101178114B1 (ru)
CN (3) CN102016985B (ru)
AT (1) ATE528747T1 (ru)
AU (2) AU2009221443B2 (ru)
BR (2) BRPI0906079B1 (ru)
CA (2) CA2716926C (ru)
ES (3) ES2753899T3 (ru)
HK (1) HK1149838A1 (ru)
MX (1) MX2010009666A (ru)
PL (1) PL2250641T3 (ru)
RU (3) RU2488896C2 (ru)
WO (2) WO2009109374A2 (ru)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101479011B1 (ko) * 2008-12-17 2015-01-13 삼성전자주식회사 다중 대역 스케쥴링 방법 및 이를 이용한 방송 서비스 시스템
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
WO2010125802A1 (ja) * 2009-04-30 2010-11-04 パナソニック株式会社 デジタル音声通信制御装置及び方法
JP5645951B2 (ja) * 2009-11-20 2014-12-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
BR112012014856B1 (pt) 2009-12-16 2022-10-18 Dolby International Ab Método para fundir conjuntos de fonte de parâmetros de sbr a conjuntos-alvo de parâmetros de sbr, meio de armazenamento não transitório e unidade de fusão de parâmetros de sbr
US20110197740A1 (en) * 2010-02-16 2011-08-18 Chang Donald C D Novel Karaoke and Multi-Channel Data Recording / Transmission Techniques via Wavefront Multiplexing and Demultiplexing
TR201901336T4 (tr) 2010-04-09 2019-02-21 Dolby Int Ab Mdct-tabanlı karmaşık tahmin stereo kodlama.
ES2953084T3 (es) * 2010-04-13 2023-11-08 Fraunhofer Ges Forschung Decodificador de audio para procesar audio estéreo usando una dirección de predicción variable
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP5957446B2 (ja) * 2010-06-02 2016-07-27 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 音響処理システム及び方法
CN102568481B (zh) * 2010-12-21 2014-11-26 富士通株式会社 用于实现aqmf处理的方法、和用于实现sqmf处理的方法
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
AU2012217158B2 (en) * 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
WO2012110448A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
SG192746A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for processing a decoded audio signal in a spectral domain
JP5633431B2 (ja) * 2011-03-02 2014-12-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US8891775B2 (en) 2011-05-09 2014-11-18 Dolby International Ab Method and encoder for processing a digital stereo audio signal
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
CN103918029B (zh) * 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
US8615394B1 (en) * 2012-01-27 2013-12-24 Audience, Inc. Restoration of noise-reduced speech
EP2828855B1 (en) 2012-03-23 2016-04-27 Dolby Laboratories Licensing Corporation Determining a harmonicity measure for voice processing
CN103325384A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 谐度估计、音频分类、音调确定及噪声估计
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
WO2014068817A1 (ja) * 2012-10-31 2014-05-08 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号装置
KR101998712B1 (ko) 2013-03-25 2019-10-02 삼성디스플레이 주식회사 표시장치, 표시장치를 위한 데이터 처리 장치 및 그 방법
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US9553601B2 (en) * 2013-08-21 2017-01-24 Keysight Technologies, Inc. Conversion of analog signal into multiple time-domain data streams corresponding to different portions of frequency spectrum and recombination of those streams into single-time domain stream
BR112016004299B1 (pt) * 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
JP6224850B2 (ja) 2014-02-28 2017-11-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 会議における変化盲を使った知覚的連続性
JP6243770B2 (ja) * 2014-03-25 2017-12-06 日本放送協会 チャンネル数変換装置
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
US10015006B2 (en) 2014-11-05 2018-07-03 Georgia Tech Research Corporation Systems and methods for measuring side-channel signals for instruction-level events
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
CN104735512A (zh) * 2015-03-24 2015-06-24 无锡天脉聚源传媒科技有限公司 一种同步音频数据的方法、设备及系统
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
CN105261373B (zh) * 2015-09-16 2019-01-08 深圳广晟信源技术有限公司 用于带宽扩展编码的自适应栅格构造方法和装置
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
MX2018008886A (es) * 2016-01-22 2018-11-09 Fraunhofer Ges Zur Foerderung Der Angewandten Forscng E V Aparato y metodo para estereo mdct m/s con ild global con decision medio/lado mejorada.
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US10824629B2 (en) 2016-04-01 2020-11-03 Wavefront, Inc. Query implementation using synthetic time series
US10896179B2 (en) * 2016-04-01 2021-01-19 Wavefront, Inc. High fidelity combination of data
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
EP3246923A1 (en) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
US20180302454A1 (en) * 2017-04-05 2018-10-18 Interlock Concepts Inc. Audio visual integration device
IT201700040732A1 (it) * 2017-04-12 2018-10-12 Inst Rundfunktechnik Gmbh Verfahren und vorrichtung zum mischen von n informationssignalen
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
CN109559736B (zh) * 2018-12-05 2022-03-08 中国计量大学 一种基于对抗网络的电影演员自动配音方法
US11283853B2 (en) * 2019-04-19 2022-03-22 EMC IP Holding Company LLC Generating a data stream with configurable commonality
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
CN111402907B (zh) * 2020-03-13 2023-04-18 大连理工大学 一种基于g.722.1的多描述语音编码方法
US11662975B2 (en) * 2020-10-06 2023-05-30 Tencent America LLC Method and apparatus for teleconference
CN113468656B (zh) * 2021-05-25 2023-04-14 北京临近空间飞行器系统工程研究所 基于pns计算流场的高速边界层转捩快速预示方法和系统

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0513860T3 (da) * 1989-01-27 1997-08-18 Dolby Lab Licensing Corp Adaptiv biallokering for audiokoder og -dekoder
US5463424A (en) 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3173482B2 (ja) * 1998-11-16 2001-06-04 日本ビクター株式会社 記録媒体、及びそれに記録された音声データの音声復号化装置
JP3344574B2 (ja) * 1998-11-16 2002-11-11 日本ビクター株式会社 記録媒体、音声復号装置
JP3344575B2 (ja) * 1998-11-16 2002-11-11 日本ビクター株式会社 記録媒体、音声復号装置
JP3344572B2 (ja) * 1998-11-16 2002-11-11 日本ビクター株式会社 記録媒体、音声復号装置
JP3387084B2 (ja) * 1998-11-16 2003-03-17 日本ビクター株式会社 記録媒体、音声復号装置
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
BR0304231A (pt) * 2002-04-10 2004-07-27 Koninkl Philips Electronics Nv Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
RU2325046C2 (ru) * 2002-07-16 2008-05-20 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US8311809B2 (en) * 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
US7349436B2 (en) 2003-09-30 2008-03-25 Intel Corporation Systems and methods for high-throughput wideband wireless local area network communications
WO2005043511A1 (en) * 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
JP2007524124A (ja) * 2004-02-16 2007-08-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ トランスコーダ及びそのための符号変換方法
US8423372B2 (en) 2004-08-26 2013-04-16 Sisvel International S.A. Processing of encoded signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP2006197391A (ja) * 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
KR100791846B1 (ko) * 2006-06-21 2008-01-07 주식회사 대우일렉트로닉스 오디오 복호기
JP5134623B2 (ja) * 2006-07-07 2013-01-30 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 複数のパラメータ的に符号化された音源を合成するための概念
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
JP2008219549A (ja) * 2007-03-06 2008-09-18 Nec Corp 信号処理の方法、装置、及びプログラム
US7983916B2 (en) * 2007-07-03 2011-07-19 General Motors Llc Sampling rate independent speech recognition
WO2009051401A2 (en) * 2007-10-15 2009-04-23 Lg Electronics Inc. A method and an apparatus for processing a signal
JP5086366B2 (ja) * 2007-10-26 2012-11-28 パナソニック株式会社 会議端末装置、中継装置、および会議システム

Also Published As

Publication number Publication date
JP2011513780A (ja) 2011-04-28
WO2009109374A2 (en) 2009-09-11
RU2562395C2 (ru) 2015-09-10
JP2013190803A (ja) 2013-09-26
ES2753899T3 (es) 2020-04-14
CA2717196A1 (en) 2009-09-11
BRPI0906079B1 (pt) 2020-12-29
CN102016985A (zh) 2011-04-13
BRPI0906079A2 (pt) 2015-10-06
CN102016983B (zh) 2013-08-14
KR20120039748A (ko) 2012-04-25
WO2009109374A3 (en) 2010-04-01
CN102016985B (zh) 2014-04-02
JP2011518342A (ja) 2011-06-23
CN102016983A (zh) 2011-04-13
PL2250641T3 (pl) 2012-03-30
HK1149838A1 (en) 2011-10-14
ES2374496T3 (es) 2012-02-17
WO2009109373A3 (en) 2010-03-04
EP2378518B1 (en) 2018-01-24
KR20100125382A (ko) 2010-11-30
US20090228285A1 (en) 2009-09-10
ES2665766T3 (es) 2018-04-27
KR101178114B1 (ko) 2012-08-30
ATE528747T1 (de) 2011-10-15
US8290783B2 (en) 2012-10-16
EP2378518A2 (en) 2011-10-19
EP2250641A2 (en) 2010-11-17
CA2717196C (en) 2016-08-16
RU2488896C2 (ru) 2013-07-27
AU2009221443A1 (en) 2009-09-11
EP2250641B1 (en) 2011-10-12
KR20100125377A (ko) 2010-11-30
RU2010136360A (ru) 2012-03-10
JP5654632B2 (ja) 2015-01-14
CA2716926A1 (en) 2009-09-11
BRPI0906078A2 (pt) 2015-07-07
KR101253278B1 (ko) 2013-04-11
CA2716926C (en) 2014-08-26
CN102789782B (zh) 2015-10-14
JP5536674B2 (ja) 2014-07-02
JP5302980B2 (ja) 2013-10-02
US20090226010A1 (en) 2009-09-10
CN102789782A (zh) 2012-11-21
AU2009221444B2 (en) 2012-06-14
AU2009221443B2 (en) 2012-01-12
EP2260487B1 (en) 2019-08-21
EP2378518A3 (en) 2012-11-21
KR101192241B1 (ko) 2012-10-17
EP2260487A2 (en) 2010-12-15
RU2010136357A (ru) 2012-03-10
BRPI0906078B1 (pt) 2020-12-29
MX2010009666A (es) 2010-10-15
WO2009109373A2 (en) 2009-09-11
US8116486B2 (en) 2012-02-14
RU2473140C2 (ru) 2013-01-20
AU2009221444A1 (en) 2009-09-11

Similar Documents

Publication Publication Date Title
RU2012128313A (ru) Микширование входящих информационных потоков
JP7012786B2 (ja) 複数のメディア処理ノードによる適応処理
US9418650B2 (en) Training speech recognition using captions
US10410615B2 (en) Audio information processing method and apparatus
US9373334B2 (en) Method and system for generating an audio metadata quality score
TW201250671A (en) Audio codec using noise synthesis during inactive phases
CN103620677A (zh) 音频信号帧中事件时隙位置的编码与译码技术
KR102331279B1 (ko) 부호화 모드 결정방법 및 장치, 오디오 부호화방법 및 장치와, 오디오 복호화방법 및 장치
RU2006130966A (ru) Устройство и способ определения величины шага квантователя
KR20120082738A (ko) 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
JP6812504B2 (ja) 音声符号化方法および関連装置
MX2021006572A (es) Aparato, metodo y programa de computadora para codificacion, decodificacion, procesamiento de escenas y otros procedimientos relacionados con codificacion de audio espacial basada en dirac que utiliza generadores de componentes de bajo, medio y alto orden.
CN101641734A (zh) 对音频信号编码的方法和设备以及对音频信号解码的方法和设备
JP2014509408A (ja) オーディオ符号化方法および装置
CN203134365U (zh) 用于利用响度处理状态元数据处理音频的音频解码器
US20150194163A1 (en) Decoding method, decoding apparatus, program, and recording medium therefor
CN112863480B (zh) 端到端语音合成模型的优化方法及装置,电子设备
EP1943741B1 (en) A device and a method of playing audio clips
WO2011114192A1 (en) Method and apparatus for audio coding
Rose et al. Enhanced accuracy of the tonality measure and control parameter extraction modules in MPEG-4 HE-AAC
Zhan et al. The NeteaseGames System for fake audio generation task of 2023 Audio Deepfake Detection Challenge
Yang et al. Level Ratio Based Inter and Intra Channel Prediction with Application to Stereo Audio Frame Loss Concealment
Wang et al. Enhancing an Offline Transcriber for the Speech Recognition Virtual Kitchen
Dressler et al. Optimizing the Implementation of Dolby Digital Plus in SoC Designs
Ohta et al. Automatic detection of edited parts in inexact transcribed corpora based on alignment between edited transcription and corresponding utterance