RU2019132898A - Способ и устройство для обработки сигнала и программа - Google Patents

Способ и устройство для обработки сигнала и программа Download PDF

Info

Publication number
RU2019132898A
RU2019132898A RU2019132898A RU2019132898A RU2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A
Authority
RU
Russia
Prior art keywords
signal processing
priority information
audio object
processing apparatus
generating unit
Prior art date
Application number
RU2019132898A
Other languages
English (en)
Other versions
RU2019132898A3 (ru
Inventor
Юки ЯМАМОТО
Тору ТИНЕН
Минору ЦУДЗИ
Original Assignee
Сони Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сони Корпорейшн filed Critical Сони Корпорейшн
Publication of RU2019132898A publication Critical patent/RU2019132898A/ru
Publication of RU2019132898A3 publication Critical patent/RU2019132898A3/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Claims (20)

1. Устройство для обработки сигнала, содержащее:
блок генерирования информации приоритета, выполненный с возможностью генерировать информацию приоритета об аудио объекте на основании множества элементов, выражающих признак аудио объекта.
2. Устройство для обработки сигнала по п. 1, в котором элемент представляет собой метаданные аудио объекта.
3. Устройство для обработки сигнала по п. 1, в котором элемент является позицией аудио объекта в пространстве.
4. Устройство для обработки сигнала по п. 3, в котором элемент является расстоянием от опорной позиции до аудио объекта в пространстве.
5. Устройство для обработки сигнала по п. 3, в котором элемент представляет собой горизонтальный угол направления, указывающий позицию в горизонтальном направлении аудио объекта в пространстве.
6. Устройство для обработки сигнала по п. 2, в котором блок генерирования информации приоритета генерирует информацию приоритета в соответствии со скоростью перемещения аудио объекта на основе метаданных.
7. Устройство для обработки сигнала по п. 1, в котором элемент является информацией коэффициента усиления, на который умножают аудио сигнал аудио объекта.
8. Устройство для обработки сигнала по п. 7, в котором блок генерирования информации приоритета генерирует информацию приоритета временного блока, подлежащего обработке, на основании разности между информацией коэффициента усиления временного блока, подлежащего обработке, и средним значением информации коэффициента усиления множества временных блоков.
9. Устройство для обработки сигнала по п. 7, в котором блок генерирования информации приоритета генерирует информацию приоритета на основании звукового давления аудио сигнала, умноженный на информацию коэффициента усиления.
10. Устройство для обработки сигнала по п. 1, в котором элемент является информацией распространения.
11. Устройство для обработки сигнала по п. 10, в котором блок генерирования информации приоритета генерирует информацию приоритета в соответствии с площадью области аудио объекта на основании информации распространения.
12. Устройство для обработки сигнала по п. 1, в котором элемент является информацией, указывающей атрибут звука аудио объекта.
13. Устройство для обработки сигнала по п. 1, в котором элемент является аудио сигналом аудио объекта.
14. Устройство для обработки сигнала по п. 13, в котором блок генерирования информации приоритета генерирует информацию приоритета на основании результата процесса обнаружения речевой активности, выполняемый на аудио сигнале.
15. Устройство для обработки сигнала по п. 1, в котором блок генерирования информации приоритета сглаживает сгенерированную информацию приоритета во временном направлении, и обрабатывает сглаженную информацию приоритета в качестве окончательной информации приоритета.
16. Способ обработки сигнала, содержащий:
этап генерирования информации приоритета о аудио объекте на основании множества элементов, выражающих признак аудио объекта.
17. Программа, побуждающая компьютер выполнить процесс, содержащий:
этап генерирования информации приоритета аудио объекта на основании множества элементов, выражающих признак аудио объекта.
RU2019132898A 2017-04-26 2018-04-12 Способ и устройство для обработки сигнала и программа RU2019132898A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017-087208 2017-04-26
JP2017087208 2017-04-26
PCT/JP2018/015352 WO2018198789A1 (ja) 2017-04-26 2018-04-12 信号処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
RU2019132898A true RU2019132898A (ru) 2021-04-19
RU2019132898A3 RU2019132898A3 (ru) 2021-07-22

Family

ID=63918157

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019132898A RU2019132898A (ru) 2017-04-26 2018-04-12 Способ и устройство для обработки сигнала и программа

Country Status (8)

Country Link
US (3) US11574644B2 (ru)
EP (1) EP3618067B1 (ru)
JP (3) JP7160032B2 (ru)
KR (2) KR20190141669A (ru)
CN (2) CN110537220B (ru)
BR (1) BR112019021904A2 (ru)
RU (1) RU2019132898A (ru)
WO (1) WO2018198789A1 (ru)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110537220B (zh) 2017-04-26 2024-04-16 索尼公司 信号处理设备和方法及程序
GB2575510A (en) * 2018-07-13 2020-01-15 Nokia Technologies Oy Spatial augmentation
US11716586B2 (en) * 2018-09-28 2023-08-01 Sony Corporation Information processing device, method, and program
CN113016032A (zh) 2018-11-20 2021-06-22 索尼集团公司 信息处理装置和方法以及程序
JP7236914B2 (ja) * 2019-03-29 2023-03-10 日本放送協会 受信装置、配信サーバ及び受信プログラム
CN114390401A (zh) * 2021-12-14 2022-04-22 广州市迪声音响有限公司 用于音响的多通道数字音频信号实时音效处理方法及系统
WO2024034389A1 (ja) * 2022-08-09 2024-02-15 ソニーグループ株式会社 信号処理装置、信号処理方法、およびプログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7032236B1 (en) * 1998-02-20 2006-04-18 Thomson Licensing Multimedia system for processing program guides and associated multimedia objects
US7079658B2 (en) * 2001-06-14 2006-07-18 Ati Technologies, Inc. System and method for localization of sounds in three-dimensional space
US8718285B2 (en) * 2009-03-26 2014-05-06 Panasonic Corporation Decoding device, coding and decoding device, and decoding method
JP5036797B2 (ja) * 2009-12-11 2012-09-26 株式会社スクウェア・エニックス 発音処理装置、発音処理方法、及び発音処理プログラム
US9165558B2 (en) * 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
EP2936485B1 (en) * 2012-12-21 2017-01-04 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
US9344815B2 (en) * 2013-02-11 2016-05-17 Symphonic Audio Technologies Corp. Method for augmenting hearing
US9338420B2 (en) * 2013-02-15 2016-05-10 Qualcomm Incorporated Video analysis assisted generation of multi-channel audio data
CN105637582B (zh) 2013-10-17 2019-12-31 株式会社索思未来 音频编码装置及音频解码装置
EP3092642B1 (en) 2014-01-09 2018-05-16 Dolby Laboratories Licensing Corporation Spatial error metrics of audio content
CN104882145B (zh) * 2014-02-28 2019-10-29 杜比实验室特许公司 使用音频对象的时间变化的音频对象聚类
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
JP6432180B2 (ja) * 2014-06-26 2018-12-05 ソニー株式会社 復号装置および方法、並びにプログラム
CN111556426B (zh) * 2015-02-06 2022-03-25 杜比实验室特许公司 用于自适应音频的混合型基于优先度的渲染系统和方法
CN111586533B (zh) * 2015-04-08 2023-01-03 杜比实验室特许公司 音频内容的呈现
EP3286929B1 (en) * 2015-04-20 2019-07-31 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
US10567903B2 (en) * 2015-06-24 2020-02-18 Sony Corporation Audio processing apparatus and method, and program
ES2971421T3 (es) * 2015-11-20 2024-06-05 Dolby Laboratories Licensing Corp Renderización mejorada de contenido de audio inmersivo
US10395664B2 (en) * 2016-01-26 2019-08-27 Dolby Laboratories Licensing Corporation Adaptive Quantization
WO2018096599A1 (en) * 2016-11-22 2018-05-31 Sony Mobile Communications Inc. Environment-aware monitoring systems, methods, and computer program products for immersive environments
RU2763785C2 (ru) 2017-04-25 2022-01-11 Сони Корпорейшн Способ и устройство обработки сигнала
CN110537220B (zh) 2017-04-26 2024-04-16 索尼公司 信号处理设备和方法及程序
CN113016032A (zh) * 2018-11-20 2021-06-22 索尼集团公司 信息处理装置和方法以及程序

Also Published As

Publication number Publication date
CN110537220A (zh) 2019-12-03
JP2024075675A (ja) 2024-06-04
EP3618067A4 (en) 2020-05-06
JP2022188258A (ja) 2022-12-20
KR20240042125A (ko) 2024-04-01
US20240153516A1 (en) 2024-05-09
US11900956B2 (en) 2024-02-13
WO2018198789A1 (ja) 2018-11-01
CN110537220B (zh) 2024-04-16
KR20190141669A (ko) 2019-12-24
RU2019132898A3 (ru) 2021-07-22
EP4358085A2 (en) 2024-04-24
BR112019021904A2 (pt) 2020-05-26
JPWO2018198789A1 (ja) 2020-03-05
JP7160032B2 (ja) 2022-10-25
EP3618067A1 (en) 2020-03-04
CN118248153A (zh) 2024-06-25
US20230154477A1 (en) 2023-05-18
US20210118466A1 (en) 2021-04-22
EP3618067B1 (en) 2024-04-10
JP7459913B2 (ja) 2024-04-02
US11574644B2 (en) 2023-02-07

Similar Documents

Publication Publication Date Title
RU2019132898A (ru) Способ и устройство для обработки сигнала и программа
WO2016166763A3 (en) Methods and systems for detecting at least the position of an object in space
EP4328905A3 (en) Recorded media hotword trigger suppression
EP4280210A3 (en) Hotword detection on multiple devices
MX2018004828A (es) Método y aparato para generar una señal de audio filtrada realizando representación de elevación.
JP2021007216A5 (ru)
JP2017527223A5 (ru)
RU2017143920A (ru) Устройство, способ и программа аудиообработки
JP2014510942A5 (ru)
EP2824663A3 (en) Audio processing apparatus
MX2018005090A (es) Aparato, metodo o programa de computadora para generar una descripcion de campo de sonido.
MY190143A (en) Device and method for generating a high-band signal from non-linearly processed sub-ranges
JP2014521987A5 (ru)
JP2016522910A5 (ru)
JP2016533529A5 (ru)
JP2017204673A5 (ru)
JP2015194666A5 (ru)
JP2014137756A5 (ru)
JP2015179243A (ja) オーディオ信号処理装置
MX2017001253A (es) Aparato y metodo para mejorar un sistema mejorador de sonido de senal de audio.
JP2016504087A5 (ru)
MX2022001384A (es) Método, aparato y dispositivo de procesamiento de datos y medio de almacenamiento.
JP2015096921A5 (ru)
WO2016020511A3 (de) Verfahren zur senkung der verständlichkeit von sprachsignalen und trennbauteil zur beeinflussung der schallübertragung
JP2017144521A5 (ru)