RU2017106641A - Устройство и способ кодирования, устройство и способ декодирования и программа - Google Patents

Устройство и способ кодирования, устройство и способ декодирования и программа Download PDF

Info

Publication number
RU2017106641A
RU2017106641A RU2017106641A RU2017106641A RU2017106641A RU 2017106641 A RU2017106641 A RU 2017106641A RU 2017106641 A RU2017106641 A RU 2017106641A RU 2017106641 A RU2017106641 A RU 2017106641A RU 2017106641 A RU2017106641 A RU 2017106641A
Authority
RU
Russia
Prior art keywords
source
dialog
encoded data
additional
sources
Prior art date
Application number
RU2017106641A
Other languages
English (en)
Other versions
RU2017106641A3 (ru
Inventor
Тору ТИНЕН
Мицуюки ХАТАНАКА
Минору ЦУДЗИ
Хироюки ХОНМА
Original Assignee
Сони Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сони Корпорейшн filed Critical Сони Корпорейшн
Publication of RU2017106641A publication Critical patent/RU2017106641A/ru
Publication of RU2017106641A3 publication Critical patent/RU2017106641A3/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (33)

1. Устройство кодирования, содержащее:
блок кодирования канальных источников для кодирования аудиосигналов множества канальных источников, в том числе, диалогового источника, для генерирования кодированных данных;
блок кодирования дополнительного диалогового источника для кодирования аудиосигнала дополнительного диалогового источника, отличного от диалогового источника, для генерирования кодированных данных; и
мультиплексор для мультиплексирования диалоговой информации, содержащей информацию о дополнительном диалоговом источнике, кодированных данных множества канальных источников и кодированных данных дополнительного диалогового источника.
2. Устройство кодирования по п. 1, в котором кодированные данные дополнительного диалогового источника и диалоговой информации хранятся в области данных пользователя в битовом потоке, полученном посредством мультиплексирования.
3. Устройство кодирования по п. 2, в котором областью данных пользователя является DSE, определенный в MPEG AAC или MPEG-D USAC.
4. Устройство кодирования по п. 1, в котором диалоговая информация содержит информацию о диалоговом источнике.
5. Устройство кодирования по п. 4, в котором диалоговая информация содержит информацию, указывающую тип дополнительного диалогового источника, и информацию, указывающую тип диалогового источника.
6. Устройство кодирования по п. 4, в котором диалоговая информация содержит информацию, указывающую канал диалогового источника из числа каналов аудиосигналов множества канальных источников при мультиканальной конфигурации.
7. Устройство кодирования по п. 1, в котором диалоговая информация содержит информацию о коэффициенте усиления для выполнения коррекции коэффициента усиления аудиосигнала дополнительного диалогового источника.
8. Устройство кодирования по п. 1, в котором диалоговая информация содержит информацию о скорректированном коэффициенте усиления для выполнения коррекции коэффициента усиления аудиосигналов множества дополнительных диалоговых источников из числа множества дополнительных диалоговых источников.
9. Способ кодирования, содержащий этапы, на которых:
кодируют аудиосигналы множества канальных источников, в том числе диалогового источника, для генерирования кодированных данных;
кодируют аудиосигнал дополнительного диалогового источника, отличный от диалогового источника, для генерирования кодированных данных; и
мультиплексируют диалоговую информацию, содержащую информацию о дополнительном диалоговом источнике, кодированные данные множества канальных источников, и кодированные данные дополнительного диалогового источника.
10. Программа, вызывающая выполнение компьютером процесса, содержащего этапы, на которых:
кодируют аудиосигналы множества канальных источников, содержащих диалоговый источник для генерирования кодированных данных;
кодируют аудиосигнал дополнительного диалогового источника, отличного от диалогового источника, для генерирования кодированных данных; и
мультиплексируют диалоговую информацию, содержащую информацию о дополнительном диалоговом источнике, кодированные данные множества канальных источников и кодированные данные дополнительного диалогового источника.
11. Устройство декодирования, содержащее:
разделительный блок для разделения кодированного битового потока на кодированные данные множества канальных источников, содержащих диалоговый источник, кодированные данные одного или более дополнительных диалоговых источников, отличных от диалогового источника, и диалоговую информацию, содержащую информацию о дополнительных диалоговых источниках; и
блок декодирования дополнительного диалогового источника для декодирования кодированных данных дополнительного диалогового источника, выбранных из кодированных данных одного или более дополнительных диалоговых источников.
12. Устройство декодирования по п. 11, дополнительно содержащее:
блок декодирования канальных источников, выполненный с возможностью декодирования кодированных данных множества канальных источников.
13. Устройство декодирования по п. 11, дополнительно содержащее:
блок выбора диалога для замены аудиосигнала, полученного декодированием кодированных данных диалогового источника, на аудиосигнал, полученный при декодировании кодированных данных выбранного дополнительного диалогового источника, и его вывода.
14. Устройство декодирования по п. 11, в котором блок декодирования дополнительного диалогового источника выполнен с возможностью декодирования кодированных данных дополнительного диалогового источника, выбранного в ответ на предоставление диалоговой информации.
15. Способ декодирования, содержащий этапы, на которых:
разделяют кодированный битовый поток на кодированные данные множества канальных источников, в том числе диалогового источника, кодированные данные одного или более дополнительных диалоговых источников, отличных от диалогового источника, и диалоговую информацию, содержащую информацию о дополнительных диалоговых источниках; и
декодируют кодированные данные дополнительного диалогового источника, выбранные из числа кодированных данных одного или более дополнительных диалоговых источников.
16. Программа, вызывающая выполнение компьютером процесса, содержащего этапы, на которых:
разделяют кодированный битовый поток на кодированные данные множества канальных источников, в том числе диалогового источника, кодированные данные одного или более дополнительных диалоговых источников, отличных от диалогового источника, и диалоговую информацию, содержащую информацию о дополнительных диалоговых источниках; и
декодируют кодированные данные дополнительного диалогового источника, выбранные из числа кодированных данных одного или более дополнительных диалоговых источников.
RU2017106641A 2014-09-08 2015-08-27 Устройство и способ кодирования, устройство и способ декодирования и программа RU2017106641A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014182548 2014-09-08
JP2014-182548 2014-09-08
PCT/JP2015/074132 WO2016039150A1 (ja) 2014-09-08 2015-08-27 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
RU2017106641A true RU2017106641A (ru) 2018-09-03
RU2017106641A3 RU2017106641A3 (ru) 2019-03-27

Family

ID=55458904

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017106641A RU2017106641A (ru) 2014-09-08 2015-08-27 Устройство и способ кодирования, устройство и способ декодирования и программа

Country Status (6)

Country Link
US (2) US10109285B2 (ru)
EP (1) EP3196877A4 (ru)
JP (1) JP6798312B2 (ru)
CN (1) CN106663435A (ru)
RU (1) RU2017106641A (ru)
WO (1) WO2016039150A1 (ru)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10109285B2 (en) 2014-09-08 2018-10-23 Sony Corporation Coding device and method, decoding device and method, and program
WO2016038876A1 (ja) * 2014-09-08 2016-03-17 日本放送協会 符号化装置、復号化装置及び音声信号処理装置
JP6436573B2 (ja) * 2015-03-27 2018-12-12 シャープ株式会社 受信装置、受信方法、及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09182036A (ja) * 1995-12-25 1997-07-11 Sony Corp データ送信装置およびデータ受信装置
JPH1174868A (ja) * 1996-09-02 1999-03-16 Toshiba Corp 情報伝送方法およびその方法が適用される情報伝送システムにおける符号化装置/復号化装置、並びに符号化・多重化装置/復号化・逆多重化装置
US20060106597A1 (en) * 2002-09-24 2006-05-18 Yaakov Stein System and method for low bit-rate compression of combined speech and music
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
EP1932239A4 (en) * 2005-09-14 2009-02-18 Lg Electronics Inc METHOD AND APPARATUS FOR ENCODING / DECODING
US7606716B2 (en) * 2006-07-07 2009-10-20 Srs Labs, Inc. Systems and methods for multi-dialog surround audio
EP2101318B1 (en) * 2006-12-13 2014-06-04 Panasonic Corporation Encoding device, decoding device and corresponding methods
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2009001874A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
KR101397058B1 (ko) * 2009-11-12 2014-05-20 엘지전자 주식회사 신호 처리 방법 및 이의 장치
JP2012010311A (ja) * 2010-05-26 2012-01-12 Sony Corp 送信装置、送信方法、受信装置、受信方法および送受信システム
JP5652642B2 (ja) * 2010-08-02 2015-01-14 ソニー株式会社 データ生成装置およびデータ生成方法、データ処理装置およびデータ処理方法
CN102985969B (zh) * 2010-12-14 2014-12-10 松下电器(美国)知识产权公司 编码装置、解码装置和编码方法、解码方法
KR20140044283A (ko) * 2011-08-04 2014-04-14 소니 주식회사 송신 장치, 송신 방법 및 수신 장치
JP2013179570A (ja) * 2012-02-03 2013-09-09 Panasonic Corp 再生装置
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
MX339611B (es) * 2013-01-21 2016-05-31 Dolby Laboratories Licensing Corp Codificador y decodificador de audio con metadatos de limite y sonoridad de programa.
JP6174326B2 (ja) * 2013-01-23 2017-08-02 日本放送協会 音響信号作成装置及び音響信号再生装置
WO2014114781A1 (en) * 2013-01-28 2014-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices
US10109285B2 (en) 2014-09-08 2018-10-23 Sony Corporation Coding device and method, decoding device and method, and program

Also Published As

Publication number Publication date
US10109285B2 (en) 2018-10-23
EP3196877A4 (en) 2018-02-28
US20180374490A1 (en) 2018-12-27
JP6798312B2 (ja) 2020-12-09
US10446160B2 (en) 2019-10-15
RU2017106641A3 (ru) 2019-03-27
EP3196877A1 (en) 2017-07-26
WO2016039150A1 (ja) 2016-03-17
CN106663435A (zh) 2017-05-10
US20170309278A1 (en) 2017-10-26
JPWO2016039150A1 (ja) 2017-06-22

Similar Documents

Publication Publication Date Title
AR123837A2 (es) Codificador de audio para la codificación de una señal de múltiples canales, un decodificador de audio para la decodificación de una señal de audio codificada, métodos y programa de computación
MX351577B (es) Aparato y método para realizar un desvanecimiento de un espectro mdct a ruido blanco antes de aplicar fdns.
AR115901A2 (es) Énfasis de bajas frecuencias para codificación basada en lpc (codificación de predicción lineal) en el dominio de frecuencia
US8948891B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal by using semantic information
MY164393A (en) Mdct-based complex prediction stereo coding
TW200746051A (en) Apparatus and method for encoding and decoding signal
JP2015194666A5 (ru)
MX2017016228A (es) Aparato codificador, metodo de codificacion, aparato decodificador, metodo de decodificacion, y programa.
MX2014001871A (es) Dispositivo de codificacion y metodo de codificacion, dispositivo de decodificacion y metodo de decodificacion, y programa.
MX2016000902A (es) Descodificador de audio multicanal, codificacor de audio multicanal, metodos, programa de computadora y representacion de audio codificada usando una decorrelacion de señales de audio renderizadas.
MY160265A (en) Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
EP4297027A3 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
MX352095B (es) Transformación de audio multicanal usando matrices interpoladas.
RU2018115787A (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
MX2019012711A (es) Decodificador y codificador de audio.
US9905232B2 (en) Device and method for encoding and decoding of an audio signal
RU2017117896A (ru) Кодирование и декодирование аудиосигналов
RU2017106641A (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
WO2014124377A3 (en) Audio bitstreams with supplementary data and encoding and decoding of such bitstreams
RU2015104055A (ru) Устройство и способы для адаптации аудиоинформации при пространственном кодировании аудиообъектов
RU2011141451A (ru) Встраивание и извлечение служебных данных
TR201909906T4 (tr) Kodlayıcı, kod çözücü, kodlama metodu, kod çözme metodu, kodlama programı, kod çözme programı ve kayıt ortamı.
RU2009131769A (ru) Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
BR112015030852A2 (pt) método e dispositivo de codificação e decodificação de sinal
RU2018115550A (ru) Устройство декодирования, способ декодирования и программа

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20190718