RU2018115550A - Устройство декодирования, способ декодирования и программа - Google Patents

Устройство декодирования, способ декодирования и программа Download PDF

Info

Publication number
RU2018115550A
RU2018115550A RU2018115550A RU2018115550A RU2018115550A RU 2018115550 A RU2018115550 A RU 2018115550A RU 2018115550 A RU2018115550 A RU 2018115550A RU 2018115550 A RU2018115550 A RU 2018115550A RU 2018115550 A RU2018115550 A RU 2018115550A
Authority
RU
Russia
Prior art keywords
decoding
boundary position
encoded
apply
unit
Prior art date
Application number
RU2018115550A
Other languages
English (en)
Other versions
RU2718418C2 (ru
RU2018115550A3 (ru
Inventor
Мицуюки ХАТАНАКА
Тору ТИНЕН
Минору ЦУДЗИ
Хироюки ХОНМА
Original Assignee
Сони Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сони Корпорейшн filed Critical Сони Корпорейшн
Publication of RU2018115550A publication Critical patent/RU2018115550A/ru
Publication of RU2018115550A3 publication Critical patent/RU2018115550A3/ru
Application granted granted Critical
Publication of RU2718418C2 publication Critical patent/RU2718418C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Claims (30)

1. Устройство декодирования, содержащее:
блок сбора данных, выполненный с возможностью получения множества кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодирован на основе кадров после процесса модифицированного дискретного косинусного преобразования (MDCT);
блок выбора, выполненный с возможностью определения положения границы для переключения вывода множества кодированных битовых аудиопотоков и, в соответствии с положением границы, выборочной подачи одного из множества полученных кодированных битовых аудиопотоков на блок обработки декодирования; и
блок обработки декодирования, выполненный с возможностью применения процесса декодирования, содержащего процесс инверсного модифицированного косинусного преобразования (IMDCT), соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков через посредство блока выбора, при этом
блок обработки декодирования выполнен с возможностью пропускать наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
2. Устройство декодирования по п. 1, дополнительно содержащее:
блок плавного регулирования громкости, выполненный с возможностью применения процесса плавного регулирования громкости к результатам процесса декодирования кадров перед и после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
3. Устройство декодирования по п. 2, в котором:
блок процесса плавного регулирования громкости выполнен с возможностью применения процесса плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применения процесса медленного увеличения громкости к результату процесса декодирования после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
4. Устройство декодирования по п. 2, в котором:
блок процесса плавного регулирования громкости выполнен с возможностью применения процесса плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применения процесса глушения к результату процесса декодирования кадра после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
5. Устройство декодирования по п. 2, в котором:
блок процесса плавного регулирования громкости выполнен с возможностью применения процесса глушения к результату процесса декодирования кадра перед положением границы и применения процесса плавного увеличения громкости к результату процесса декодирования после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
6. Устройство декодирования по п. 2, в котором:
блок выбора выполнен с возможностью определения положения границы на основе флага оптимального положения переключения, добавляемого к каждому кадру и устанавливаемого поставщиком указанного множества кодированных битовых аудиопотоков.
7. Устройство декодирования по п. 6, в котором:
флаг оптимального положения переключения установлен поставщиком кодированных битовых аудиопотоков на основе энергии или контекста исходных данных.
8. Устройство декодирования по п. 2, в котором:
блок выбора выполнен с возможностью определения положения границы на основе информации, связанной с коэффициентом усиления множества кодированных битовых аудиопотоков.
9. Способ декодирования, выполняемый устройством декодирования, причем способ декодирования содержит:
этап сбора данных, на котором получают множество кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодирован на основе кадров после процесса MDCT;
этап определения, на котором определяют положение границы для переключения вывода множества кодированных битовых аудиопотоков;
этап выбора, на котором выборочно подают один из множества полученных кодированных битовых аудиопотоков на этап обработки декодирования в соответствии с положением границы; и
этап обработки декодирования, на котором применяют процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, поданных выборочно, при этом
на этапе обработки декодирования пропускают наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
10. Носитель данных, содержащий программу, вызывающую функционирование компьютера в качестве:
блока сбора данных, выполненного с возможностью получения множества кодированных битовых аудиопотоков, в которых множество фрагментов исходных данных с синхронизированным моментом воспроизведения кодированы на основе кадров после процесса MDCT;
блока выбора, выполненного с возможностью определения положения границы для переключения вывода множества кодированных битовых аудиопотоков и, в соответствии с положением границы, выборочной подачи одного из множества полученных кодированных битовых аудиопотоков на блок обработки декодирования; и
блока обработки декодирования, выполненного с возможностью применения процесса декодирования, содержащего процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков через посредство блока выбора, при этом
блок обработки декодирования выполнен с возможностью пропускать наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
RU2018115550A 2015-11-09 2016-10-26 Устройство декодирования, способ декодирования и программа RU2718418C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015219415 2015-11-09
JP2015-219415 2015-11-09
PCT/JP2016/081699 WO2017082050A1 (ja) 2015-11-09 2016-10-26 デコード装置、デコード方法、およびプログラム

Publications (3)

Publication Number Publication Date
RU2018115550A true RU2018115550A (ru) 2019-10-28
RU2018115550A3 RU2018115550A3 (ru) 2020-01-31
RU2718418C2 RU2718418C2 (ru) 2020-04-02

Family

ID=58695167

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018115550A RU2718418C2 (ru) 2015-11-09 2016-10-26 Устройство декодирования, способ декодирования и программа

Country Status (8)

Country Link
US (1) US10553230B2 (ru)
EP (1) EP3376500B1 (ru)
JP (1) JP6807033B2 (ru)
KR (1) KR20180081504A (ru)
CN (1) CN108352165B (ru)
BR (1) BR112018008874A8 (ru)
RU (1) RU2718418C2 (ru)
WO (1) WO2017082050A1 (ru)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10424311B2 (en) * 2017-01-30 2019-09-24 Cirrus Logic, Inc. Auto-mute audio processing
CN110730408A (zh) * 2019-11-11 2020-01-24 北京达佳互联信息技术有限公司 一种音频参数切换方法、装置、电子设备及存储介质

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE243880T1 (de) * 1993-12-18 2003-07-15 Sony Corp Datenwiedergabegerät und datenaufzeichnungsmedium
JPH08287610A (ja) * 1995-04-18 1996-11-01 Sony Corp オーディオデータの再生装置
JP3761639B2 (ja) 1995-09-29 2006-03-29 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
DE19861167A1 (de) * 1998-08-19 2000-06-15 Christoph Buskies Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten sowie Vorrichtungen zur Bereitstellung koartikulationsgerecht konkatenierter Audiodaten
GB9911737D0 (en) * 1999-05-21 1999-07-21 Philips Electronics Nv Audio signal time scale modification
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
JP2002026738A (ja) * 2000-07-11 2002-01-25 Mitsubishi Electric Corp オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
US7113538B1 (en) * 2000-11-01 2006-09-26 Nortel Networks Limited Time diversity searcher and scheduling method
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7189913B2 (en) * 2003-04-04 2007-03-13 Apple Computer, Inc. Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
US7260035B2 (en) * 2003-06-20 2007-08-21 Matsushita Electric Industrial Co., Ltd. Recording/playback device
US20050149973A1 (en) * 2004-01-06 2005-07-07 Fang Henry Y. Television with application/stream-specifiable language selection
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
SG124307A1 (en) * 2005-01-20 2006-08-30 St Microelectronics Asia Method and system for lost packet concealment in high quality audio streaming applications
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
CN101203907B (zh) * 2005-06-23 2011-09-28 松下电器产业株式会社 音频编码装置、音频解码装置以及音频编码信息传输装置
CN101026725B (zh) * 2005-07-15 2010-09-29 索尼株式会社 再现设备及再现方法
US8010350B2 (en) * 2006-08-03 2011-08-30 Broadcom Corporation Decimated bisectional pitch refinement
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
DE102007028175A1 (de) * 2007-06-20 2009-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Automatisiertes Verfahren zur zeitlichen Segmentierung eines Videos in Szenen unter Berücksichtigung verschiedener Typen von Übergängen zwischen Bildfolgen
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8185384B2 (en) * 2009-04-21 2012-05-22 Cambridge Silicon Radio Limited Signal pitch period estimation
US9992456B2 (en) * 2010-02-24 2018-06-05 Thomson Licensing Dtv Method and apparatus for hypothetical reference decoder conformance error detection
TWI476761B (zh) * 2011-04-08 2015-03-11 Dolby Lab Licensing Corp 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統
US20150309844A1 (en) * 2012-03-06 2015-10-29 Sirius Xm Radio Inc. Systems and Methods for Audio Attribute Mapping
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
US20160071524A1 (en) * 2014-09-09 2016-03-10 Nokia Corporation Audio Modification for Multimedia Reversal
US10614609B2 (en) * 2017-07-19 2020-04-07 Mediatek Inc. Method and apparatus for reduction of artifacts at discontinuous boundaries in coded virtual-reality images

Also Published As

Publication number Publication date
US20180286419A1 (en) 2018-10-04
EP3376500B1 (en) 2019-08-21
BR112018008874A8 (pt) 2019-02-26
US10553230B2 (en) 2020-02-04
RU2718418C2 (ru) 2020-04-02
RU2018115550A3 (ru) 2020-01-31
CN108352165A (zh) 2018-07-31
JP6807033B2 (ja) 2021-01-06
EP3376500A1 (en) 2018-09-19
EP3376500A4 (en) 2018-09-19
JPWO2017082050A1 (ja) 2018-08-30
BR112018008874A2 (pt) 2018-11-06
KR20180081504A (ko) 2018-07-16
WO2017082050A1 (ja) 2017-05-18
CN108352165B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
JP5390197B2 (ja) オーディオ信号の処理方法及び装置
CY1121428T1 (el) Μεθοδος για την επιλεκτικη διασπαση προβλεψης στην κωδικοποιηση βιντεο
US20100014679A1 (en) Multi-channel encoding and decoding method and apparatus
MY193854A (en) Audio decoder with program loudness and boundary metadata
TW200746052A (en) Apparatus and method for encoding and decoding signal
RU2014102989A (ru) Способ кодирования видео с регулированием битовой глубины для преобразования с фиксированной запятой и устройство для него, а также способ декодирования видео и устройство для него
JP2015194666A5 (ru)
MX355257B (es) Aparato y método para lograr conceptos mejorados para tcx ltp.
JP2009527792A5 (ru)
RU2016137197A (ru) Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования, и программа
BRPI0802614A2 (pt) métodos e aparelhos para codificação e decodificação de sinais de áudio baseados em objeto
RU2016118985A (ru) Аудиодекодер, устройство формирования выходных кодированных аудиоданных и способы, позволяющие инициализацию декодера
KR102387162B1 (ko) 다중 채널 오디오 신호 처리 방법, 장치 및 시스템
RU2017143404A (ru) Устройство кодирования, способ кодирования, устройство декодирования, способ декодирования и программа
RU2018115787A (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
ZA202301024B (en) Apparatus, method and computer program for encoding an audio signal or for decoding an encoded audio scene
RU2014106530A (ru) Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа
RU2018115550A (ru) Устройство декодирования, способ декодирования и программа
MX360729B (es) Decodificador de audio, método y programa de computación que utiliza una respuesta de entrada cero para obtener una transición suave.
US9111524B2 (en) Seamless playback of successive multimedia files
RU2017106641A (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
RU2022121267A (ru) Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
RU2019120840A (ru) Аудиокодер и аудиодекодер с метаданными сведений о программе или структуры вложенных потоков
TH170297A (th) การลงรหัสของฉากที่มีเสียง