RU2018128291A - Оптимизация громкости и динамического диапазона через различные устройства воспроизведения - Google Patents

Оптимизация громкости и динамического диапазона через различные устройства воспроизведения Download PDF

Info

Publication number
RU2018128291A
RU2018128291A RU2018128291A RU2018128291A RU2018128291A RU 2018128291 A RU2018128291 A RU 2018128291A RU 2018128291 A RU2018128291 A RU 2018128291A RU 2018128291 A RU2018128291 A RU 2018128291A RU 2018128291 A RU2018128291 A RU 2018128291A
Authority
RU
Russia
Prior art keywords
dynamic range
audio
range control
group
parameter
Prior art date
Application number
RU2018128291A
Other languages
English (en)
Other versions
RU2018128291A3 (ru
RU2777880C2 (ru
Inventor
Джеффри РАЙДМИЛЛЕР
Скотт Грегори НОРКРОСС
Карл Йонас РЁДЕН
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн, Долби Интернэшнл Аб filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2018128291A publication Critical patent/RU2018128291A/ru
Publication of RU2018128291A3 publication Critical patent/RU2018128291A3/ru
Application granted granted Critical
Publication of RU2777880C2 publication Critical patent/RU2777880C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements

Claims (43)

1. Способ, содержащий этапы, на которых:
принимают, в потоке битов, метаданные, ассоциированные с аудиоданными;
анализируют метаданные в потоке битов, чтобы определять то, присутствует ли в потоке битов параметр управления динамическим диапазоном для первой группы устройств воспроизведения аудио;
в ответ на определение того, что упомянутый параметр присутствует для упомянутой первой группы, используют параметр и аудиоданные для того, чтобы осуществлять рендеринг аудио; и
в ответ на определение того, что параметр управления динамическим диапазоном не присутствует для первой группы, определяют упомянутый параметр на основе типа устройств упомянутой первой группы устройств воспроизведения аудио.
2. Способ по п. 1, в котором использование параметра и аудиоданных для того, чтобы осуществлять рендеринг аудио, содержит этап, на котором передают параметр и аудиоданные в нижележащий модуль, который осуществляет рендеринг аудио для воспроизведения.
3. Способ по п. 1, в котором использование параметра и аудиоданных для того, чтобы осуществлять рендеринг аудио, содержит этап, на котором осуществляют рендеринг аудиоданных на основе параметра и аудиоданных.
4. Способ, содержащий этапы, на которых:
определяют устройство вывода, которое должно осуществлять рендеринг принимаемого аудиопотока;
определяют то, принадлежит или нет устройство вывода первой группе устройств воспроизведения аудио,
принимают, в потоке битов, метаданные, ассоциированные с аудиоданными; и
в ответ на определение того, что устройство вывода принадлежит первой группе устройств воспроизведения аудио,
анализируют метаданные в потоке битов, чтобы определять то, присутствует ли в потоке битов параметр управления динамическим диапазоном для первой группы устройств воспроизведения аудио;
в ответ на определение того, что параметр присутствует для первой группы, используют параметр и аудиоданные для того, чтобы осуществлять рендеринг аудио; и
в ответ на определение того, что параметр управления динамическим диапазоном не присутствует для упомянутой первой группы, анализируют одну или более характеристик упомянутой первой группы устройств воспроизведения аудио для выбора одного из профилей, которые задают по меньшей мере параметр управления динамическим диапазоном для множества устройств воспроизведения аудио, и определяют упомянутый параметр на основе выбранного профиля.
5. Способ по п. 4, в котором этап, на котором определяют то, принадлежит или нет устройство вывода первой группе устройств воспроизведения аудио, содержит этапы, на которых:
принимают индикатор из модуля, соединенного с упомянутым устройством вывода, указывающий идентификационные данные устройства вывода или указывающий идентификационные данные группы устройств, которые включают в себя устройство вывода; и
определяют то, что устройство вывода принадлежит первой группе устройств воспроизведения аудио, на основе принимаемого индикатора.
6. Устройство, содержащее:
интерфейс, выполненный с возможностью принимать поток битов, включающий в себя метаданные, ассоциированные с аудиоданными;
анализатор, соединенный с упомянутым интерфейсом и сконфигурированный с возможностью анализировать метаданные в потоке битов, чтобы определять то, присутствует ли в потоке битов параметр управления динамическим диапазоном для первой группы устройств воспроизведения аудио; и
компонент рендеринга, выполненный с возможностью использовать упомянутые параметры и аудиоданные для того, чтобы осуществлять рендеринг аудио в ответ на определение посредством анализатора того, что параметр управления динамическим диапазоном присутствует для упомянутой первой группы, причем компонент рендеринга дополнительно выполнен с возможностью определять упомянутый параметр на основе типа упомянутой первой группы устройств воспроизведения аудио в ответ на определение посредством анализатора того, что параметры управления динамическим диапазоном не присутствуют для упомянутой первой группы.
7. Устройство по п. 6, в котором компонент рендеринга, использующий параметры и аудиоданные для того, чтобы осуществлять рендеринг аудио, содержит компонент рендеринга, передающий параметр и аудиоданные в нижележащий модуль, который осуществляет рендеринг аудио для воспроизведения.
8. Устройство по п. 7, в котором компонент рендеринга, использующий параметр и аудиоданные для того, чтобы осуществлять рендеринг аудио, содержит компонент рендеринга, осуществляющий рендеринг аудиоданных на основе упомянутого параметра и аудиоданных.
9. Устройство, содержащее:
второй компонент, выполненный с возможностью определять устройство вывода, которое должно осуществлять рендеринг принимаемого аудиопотока и определять то, принадлежит или нет устройство вывода первой группе устройств воспроизведения аудио;
интерфейс, выполненный с возможностью принимать поток битов, включающий в себя метаданные, ассоциированные с аудиоданными; и
анализатор, сконфигурированный с возможностью, в ответ на определение, посредством упомянутого второго компонента, того, что устройство вывода принадлежит упомянутой первой группе устройств воспроизведения аудио, анализировать метаданные в потоке битов, чтобы определять то, присутствует ли в потоке битов параметр управления динамическим диапазоном для первой группы устройств воспроизведения аудио; в ответ на определение того, что параметр управления динамическим диапазоном не присутствует для упомянутой первой группы, анализировать одну или более характеристик упомянутой первой группы устройств воспроизведения аудио для выбора одного из профилей, которые задают по меньшей мере параметр управления динамическим диапазоном для множества устройств воспроизведения аудио, и определять упомянутый параметр на основе выбранного профиля.
10. Устройство по п. 9, дополнительно содержащее интерфейс, выполненный с возможностью принимать индикатор из модуля, соединенного с упомянутым устройством вывода, указывающий идентификационные данные устройства вывода или указывающий идентификационные данные группы устройств, которые включают в себя устройство вывода, и определять то, что устройство вывода принадлежит первой группе устройств воспроизведения аудио, на основе принимаемого индикатора.
11. Способ, содержащий этапы, на которых:
принимают аудиоданные и метаданные, ассоциированные с упомянутыми аудиоданными;
анализируют упомянутые метаданные в потоке битов, чтобы определять то, присутствует ли в упомянутом потоке информация управления динамическим диапазоном, ассоциированная с параметрами управления динамическим диапазоном для первой группы аудиоустройств;
в ответ на определение того, что информация управления динамическим диапазоном присутствует для упомянутой первой группы, определяют информацию управления динамическим диапазоном из упомянутого потока и передают аудиоданные и информацию управления динамическим диапазоном для использования при рендеринге аудио; и
в ответ на определение того, что информация управления динамическим диапазоном не присутствует для упомянутой первой группы, определяют информацию управления динамическим диапазоном, ассоциированную с выходным профилем, который задает по меньшей мере информацию управления динамическим диапазоном для устройства вывода, и передают упомянутую определенную информацию управления динамическим диапазоном для упомянутого выходного профиля для использования при рендеринге аудио.
12. Способ по п. 11, в котором этап определения информации управления динамическим диапазоном содержит этапы, на которых:
определяют параметры управления динамическим диапазоном, и
передача упомянутой определенной информации управления динамическим диапазоном содержит этап, на котором передают упомянутые определенные параметры управления динамическим диапазоном.
13. Способ, содержащий этапы, на которых:
принимают аудиоданные и метаданные, ассоциированные с упомянутыми аудиоданными;
анализируют упомянутые метаданные в потоке битов, чтобы определять то, присутствует ли в упомянутом потоке информация управления динамическим диапазоном, ассоциированная с параметрами управления динамическим диапазоном для первой группы аудиоустройств;
в ответ на определение того, что информация управления динамическим диапазоном присутствует для упомянутой первой группы, определяют информацию управления динамическим диапазоном из упомянутого потока и передают аудиоданные и информацию управления динамическим диапазоном для использования при рендеринге аудио; и
в ответ на определение того, что информация управления динамическим диапазоном не присутствует для упомянутой первой группы, определяют информацию управления динамическим диапазоном, ассоциированную с выходным профилем, который задает по меньшей мере информацию управления динамическим диапазоном для устройства вывода, и передают упомянутую определенную информацию управления динамическим диапазоном для упомянутого выходного профиля для использования при рендеринге аудио.
14. Способ по п. 13, в котором этап определения информации управления динамическим диапазоном содержит этапы, на которых определяют параметры управления динамическим диапазоном, и передача упомянутой определенной информации управления динамическим диапазоном содержит этап, на котором передают упомянутые определенные параметры управления динамическим диапазоном.
RU2018128291A 2013-01-21 2018-08-02 Оптимизация громкости и динамического диапазона через различные устройства воспроизведения RU2777880C2 (ru)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201361754882P 2013-01-21 2013-01-21
US61/754,882 2013-01-21
US201361809250P 2013-04-05 2013-04-05
US61/809,250 2013-04-05
US201361824010P 2013-05-16 2013-05-16
US61/824,010 2013-05-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2017131515A Division RU2665873C1 (ru) 2013-01-21 2014-01-15 Оптимизация громкости и динамического диапазона через различные устройства воспроизведения

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2022121267A Division RU2022121267A (ru) 2013-01-21 2022-08-04 Оптимизация громкости и динамического диапазона через различные устройства воспроизведения

Publications (3)

Publication Number Publication Date
RU2018128291A true RU2018128291A (ru) 2020-02-04
RU2018128291A3 RU2018128291A3 (ru) 2022-02-10
RU2777880C2 RU2777880C2 (ru) 2022-08-11

Family

ID=

Also Published As

Publication number Publication date
BR122020007931B1 (pt) 2022-08-30
KR20170001717A (ko) 2017-01-04
RU2018128291A3 (ru) 2022-02-10
RU2631139C2 (ru) 2017-09-19
HK1213374A1 (zh) 2016-06-30
US20220019404A1 (en) 2022-01-20
JP6680858B2 (ja) 2020-04-15
JP2022166331A (ja) 2022-11-01
KR102473260B1 (ko) 2022-12-05
KR102194120B1 (ko) 2020-12-22
EP2946469B1 (en) 2017-03-15
RU2665873C1 (ru) 2018-09-04
US9841941B2 (en) 2017-12-12
JP2023175019A (ja) 2023-12-08
US20240103801A1 (en) 2024-03-28
JP2016507779A (ja) 2016-03-10
CN104937844B (zh) 2018-08-28
JP2021089444A (ja) 2021-06-10
BR112015017064B1 (pt) 2022-03-22
KR102056589B1 (ko) 2019-12-18
JP7375138B2 (ja) 2023-11-07
JP7133673B2 (ja) 2022-09-08
KR20210145832A (ko) 2021-12-02
US20150363160A1 (en) 2015-12-17
IN2015MN01766A (ru) 2015-08-28
ES2624419T3 (es) 2017-07-14
EP2946469A1 (en) 2015-11-25
KR20200143517A (ko) 2020-12-23
KR102331129B1 (ko) 2021-12-01
JP2019037011A (ja) 2019-03-07
EP3193447A1 (en) 2017-07-19
JP6450415B2 (ja) 2019-01-09
CN104937844A (zh) 2015-09-23
KR20150099586A (ko) 2015-08-31
US11782672B2 (en) 2023-10-10
WO2014113471A1 (en) 2014-07-24
KR20200011578A (ko) 2020-02-03
RU2015135361A (ru) 2017-02-28
US20200364025A1 (en) 2020-11-19
CN109036443A (zh) 2018-12-18
KR20220164802A (ko) 2022-12-13
JP6851523B2 (ja) 2021-03-31
BR112015017064A2 (pt) 2017-07-11
US20180095718A1 (en) 2018-04-05
JP6129348B2 (ja) 2017-05-17
JP2020095290A (ja) 2020-06-18
JP2017120449A (ja) 2017-07-06
US11080010B2 (en) 2021-08-03
CN109003617A (zh) 2018-12-14
CN109036443B (zh) 2023-08-18
KR102016901B1 (ko) 2019-09-02
BR122020007932B1 (pt) 2022-09-27
CN109003617B (zh) 2023-08-15
KR20170001716A (ko) 2017-01-04
US10671339B2 (en) 2020-06-02
KR102071860B1 (ko) 2020-01-31

Similar Documents

Publication Publication Date Title
RU2015135361A (ru) Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
CY1121214T1 (el) Μεθοδος και συσκευη για ιεραρχικη κωδικοποιηση και αποκωδικοποιηση βιντεο με βαση μοναδα δεδομενων, που περιλαμβανει προβλεψη της παραμετρου ποσοτικοποιησης
WO2017196159A3 (en) Method and device for transmitting data
WO2014127055A3 (en) Advanced tools for unified communication data management and analysis
SG10201806103WA (en) Memory device for efficiently determining whether to perform re-training operation and memory system including the same
WO2014080212A3 (en) Test strip and methods and apparatus for reading the same
JP2015070335A5 (ru)
WO2014042446A3 (ko) 무선 통신 시스템에서 특정 리소스에 대한 특정 권한 획득을 요청하기 위한 방법 및 장치
WO2013110083A3 (en) Identification of a data record for communication to a receiver
MX366146B (es) Sistema de determinacion de contextos de emociones.
EP4280485A3 (en) Communication method and apparatus
WO2014018590A3 (en) Method and system for collecting and providing application usage analytics
WO2014113709A3 (en) Searching and determining active area
RU2016105469A (ru) Устройство и способ для улучшенного пространственного кодирования аудиообъектов
MX2016005471A (es) Metodos y dispositivos de notificacion de informacion, de reporte de informacion y de recepcion de datos.
JP2014011539A5 (ru)
RU2015125025A (ru) Способ, устройство и сетевое оборудование для получения информации признака
WO2014152816A3 (en) Systems and methods for lte interference detection
CN103714004A (zh) Jvm在线内存泄露分析方法及系统
MX2016003251A (es) Utilizacion de dispositivos informaticos opticos para determinar analitos desconocidos.
WO2014049417A3 (en) Method and apparatus for determining epdcch-based downlink control information
WO2014018244A3 (en) Intelligence data analysis by hypothesis evaluation
JP2015099468A5 (ja) 振動情報収集方法、振動情報収集装置
WO2015007248A3 (en) Method and apparatus of derivation for a binary partition pattern
RU2015140120A (ru) Устройство связи, способ управления им и программа