RU2019132898A - Способ и устройство для обработки сигнала и программа - Google Patents
Способ и устройство для обработки сигнала и программа Download PDFInfo
- Publication number
- RU2019132898A RU2019132898A RU2019132898A RU2019132898A RU2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A RU 2019132898 A RU2019132898 A RU 2019132898A
- Authority
- RU
- Russia
- Prior art keywords
- signal processing
- priority information
- audio object
- processing apparatus
- generating unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 4
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims 4
- 238000001514 detection method Methods 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Claims (20)
1. Устройство для обработки сигнала, содержащее:
блок генерирования информации приоритета, выполненный с возможностью генерировать информацию приоритета об аудио объекте на основании множества элементов, выражающих признак аудио объекта.
2. Устройство для обработки сигнала по п. 1, в котором элемент представляет собой метаданные аудио объекта.
3. Устройство для обработки сигнала по п. 1, в котором элемент является позицией аудио объекта в пространстве.
4. Устройство для обработки сигнала по п. 3, в котором элемент является расстоянием от опорной позиции до аудио объекта в пространстве.
5. Устройство для обработки сигнала по п. 3, в котором элемент представляет собой горизонтальный угол направления, указывающий позицию в горизонтальном направлении аудио объекта в пространстве.
6. Устройство для обработки сигнала по п. 2, в котором блок генерирования информации приоритета генерирует информацию приоритета в соответствии со скоростью перемещения аудио объекта на основе метаданных.
7. Устройство для обработки сигнала по п. 1, в котором элемент является информацией коэффициента усиления, на который умножают аудио сигнал аудио объекта.
8. Устройство для обработки сигнала по п. 7, в котором блок генерирования информации приоритета генерирует информацию приоритета временного блока, подлежащего обработке, на основании разности между информацией коэффициента усиления временного блока, подлежащего обработке, и средним значением информации коэффициента усиления множества временных блоков.
9. Устройство для обработки сигнала по п. 7, в котором блок генерирования информации приоритета генерирует информацию приоритета на основании звукового давления аудио сигнала, умноженный на информацию коэффициента усиления.
10. Устройство для обработки сигнала по п. 1, в котором элемент является информацией распространения.
11. Устройство для обработки сигнала по п. 10, в котором блок генерирования информации приоритета генерирует информацию приоритета в соответствии с площадью области аудио объекта на основании информации распространения.
12. Устройство для обработки сигнала по п. 1, в котором элемент является информацией, указывающей атрибут звука аудио объекта.
13. Устройство для обработки сигнала по п. 1, в котором элемент является аудио сигналом аудио объекта.
14. Устройство для обработки сигнала по п. 13, в котором блок генерирования информации приоритета генерирует информацию приоритета на основании результата процесса обнаружения речевой активности, выполняемый на аудио сигнале.
15. Устройство для обработки сигнала по п. 1, в котором блок генерирования информации приоритета сглаживает сгенерированную информацию приоритета во временном направлении, и обрабатывает сглаженную информацию приоритета в качестве окончательной информации приоритета.
16. Способ обработки сигнала, содержащий:
этап генерирования информации приоритета о аудио объекте на основании множества элементов, выражающих признак аудио объекта.
17. Программа, побуждающая компьютер выполнить процесс, содержащий:
этап генерирования информации приоритета аудио объекта на основании множества элементов, выражающих признак аудио объекта.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-087208 | 2017-04-26 | ||
JP2017087208 | 2017-04-26 | ||
PCT/JP2018/015352 WO2018198789A1 (ja) | 2017-04-26 | 2018-04-12 | 信号処理装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2019132898A true RU2019132898A (ru) | 2021-04-19 |
RU2019132898A3 RU2019132898A3 (ru) | 2021-07-22 |
Family
ID=63918157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2019132898A RU2019132898A (ru) | 2017-04-26 | 2018-04-12 | Способ и устройство для обработки сигнала и программа |
Country Status (8)
Country | Link |
---|---|
US (3) | US11574644B2 (ru) |
EP (1) | EP3618067B1 (ru) |
JP (3) | JP7160032B2 (ru) |
KR (2) | KR20190141669A (ru) |
CN (2) | CN110537220B (ru) |
BR (1) | BR112019021904A2 (ru) |
RU (1) | RU2019132898A (ru) |
WO (1) | WO2018198789A1 (ru) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110537220B (zh) | 2017-04-26 | 2024-04-16 | 索尼公司 | 信号处理设备和方法及程序 |
GB2575510A (en) * | 2018-07-13 | 2020-01-15 | Nokia Technologies Oy | Spatial augmentation |
US11716586B2 (en) * | 2018-09-28 | 2023-08-01 | Sony Corporation | Information processing device, method, and program |
CN113016032A (zh) | 2018-11-20 | 2021-06-22 | 索尼集团公司 | 信息处理装置和方法以及程序 |
JP7236914B2 (ja) * | 2019-03-29 | 2023-03-10 | 日本放送協会 | 受信装置、配信サーバ及び受信プログラム |
CN114390401A (zh) * | 2021-12-14 | 2022-04-22 | 广州市迪声音响有限公司 | 用于音响的多通道数字音频信号实时音效处理方法及系统 |
WO2024034389A1 (ja) * | 2022-08-09 | 2024-02-15 | ソニーグループ株式会社 | 信号処理装置、信号処理方法、およびプログラム |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7032236B1 (en) * | 1998-02-20 | 2006-04-18 | Thomson Licensing | Multimedia system for processing program guides and associated multimedia objects |
US7079658B2 (en) * | 2001-06-14 | 2006-07-18 | Ati Technologies, Inc. | System and method for localization of sounds in three-dimensional space |
US8718285B2 (en) * | 2009-03-26 | 2014-05-06 | Panasonic Corporation | Decoding device, coding and decoding device, and decoding method |
JP5036797B2 (ja) * | 2009-12-11 | 2012-09-26 | 株式会社スクウェア・エニックス | 発音処理装置、発音処理方法、及び発音処理プログラム |
US9165558B2 (en) * | 2011-03-09 | 2015-10-20 | Dts Llc | System for dynamically creating and rendering audio objects |
EP2936485B1 (en) * | 2012-12-21 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Object clustering for rendering object-based audio content based on perceptual criteria |
US9344815B2 (en) * | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Method for augmenting hearing |
US9338420B2 (en) * | 2013-02-15 | 2016-05-10 | Qualcomm Incorporated | Video analysis assisted generation of multi-channel audio data |
CN105637582B (zh) | 2013-10-17 | 2019-12-31 | 株式会社索思未来 | 音频编码装置及音频解码装置 |
EP3092642B1 (en) | 2014-01-09 | 2018-05-16 | Dolby Laboratories Licensing Corporation | Spatial error metrics of audio content |
CN104882145B (zh) * | 2014-02-28 | 2019-10-29 | 杜比实验室特许公司 | 使用音频对象的时间变化的音频对象聚类 |
US9564136B2 (en) * | 2014-03-06 | 2017-02-07 | Dts, Inc. | Post-encoding bitrate reduction of multiple object audio |
JP6439296B2 (ja) * | 2014-03-24 | 2018-12-19 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP6432180B2 (ja) * | 2014-06-26 | 2018-12-05 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN111556426B (zh) * | 2015-02-06 | 2022-03-25 | 杜比实验室特许公司 | 用于自适应音频的混合型基于优先度的渲染系统和方法 |
CN111586533B (zh) * | 2015-04-08 | 2023-01-03 | 杜比实验室特许公司 | 音频内容的呈现 |
EP3286929B1 (en) * | 2015-04-20 | 2019-07-31 | Dolby Laboratories Licensing Corporation | Processing audio data to compensate for partial hearing loss or an adverse hearing environment |
US10567903B2 (en) * | 2015-06-24 | 2020-02-18 | Sony Corporation | Audio processing apparatus and method, and program |
ES2971421T3 (es) * | 2015-11-20 | 2024-06-05 | Dolby Laboratories Licensing Corp | Renderización mejorada de contenido de audio inmersivo |
US10395664B2 (en) * | 2016-01-26 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Adaptive Quantization |
WO2018096599A1 (en) * | 2016-11-22 | 2018-05-31 | Sony Mobile Communications Inc. | Environment-aware monitoring systems, methods, and computer program products for immersive environments |
RU2763785C2 (ru) | 2017-04-25 | 2022-01-11 | Сони Корпорейшн | Способ и устройство обработки сигнала |
CN110537220B (zh) | 2017-04-26 | 2024-04-16 | 索尼公司 | 信号处理设备和方法及程序 |
CN113016032A (zh) * | 2018-11-20 | 2021-06-22 | 索尼集团公司 | 信息处理装置和方法以及程序 |
-
2018
- 2018-04-12 CN CN201880025687.0A patent/CN110537220B/zh active Active
- 2018-04-12 KR KR1020197030401A patent/KR20190141669A/ko not_active IP Right Cessation
- 2018-04-12 JP JP2019514367A patent/JP7160032B2/ja active Active
- 2018-04-12 CN CN202410360122.5A patent/CN118248153A/zh active Pending
- 2018-04-12 BR BR112019021904-8A patent/BR112019021904A2/pt unknown
- 2018-04-12 EP EP18790825.6A patent/EP3618067B1/en active Active
- 2018-04-12 US US16/606,276 patent/US11574644B2/en active Active
- 2018-04-12 WO PCT/JP2018/015352 patent/WO2018198789A1/ja unknown
- 2018-04-12 RU RU2019132898A patent/RU2019132898A/ru unknown
- 2018-04-12 KR KR1020247008685A patent/KR20240042125A/ko active Search and Examination
-
2022
- 2022-10-13 JP JP2022164511A patent/JP7459913B2/ja active Active
-
2023
- 2023-01-13 US US18/154,187 patent/US11900956B2/en active Active
-
2024
- 2024-01-18 US US18/416,154 patent/US20240153516A1/en active Pending
- 2024-03-19 JP JP2024043562A patent/JP2024075675A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN110537220A (zh) | 2019-12-03 |
JP2024075675A (ja) | 2024-06-04 |
EP3618067A4 (en) | 2020-05-06 |
JP2022188258A (ja) | 2022-12-20 |
KR20240042125A (ko) | 2024-04-01 |
US20240153516A1 (en) | 2024-05-09 |
US11900956B2 (en) | 2024-02-13 |
WO2018198789A1 (ja) | 2018-11-01 |
CN110537220B (zh) | 2024-04-16 |
KR20190141669A (ko) | 2019-12-24 |
RU2019132898A3 (ru) | 2021-07-22 |
EP4358085A2 (en) | 2024-04-24 |
BR112019021904A2 (pt) | 2020-05-26 |
JPWO2018198789A1 (ja) | 2020-03-05 |
JP7160032B2 (ja) | 2022-10-25 |
EP3618067A1 (en) | 2020-03-04 |
CN118248153A (zh) | 2024-06-25 |
US20230154477A1 (en) | 2023-05-18 |
US20210118466A1 (en) | 2021-04-22 |
EP3618067B1 (en) | 2024-04-10 |
JP7459913B2 (ja) | 2024-04-02 |
US11574644B2 (en) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2019132898A (ru) | Способ и устройство для обработки сигнала и программа | |
WO2016166763A3 (en) | Methods and systems for detecting at least the position of an object in space | |
EP4328905A3 (en) | Recorded media hotword trigger suppression | |
EP4280210A3 (en) | Hotword detection on multiple devices | |
MX2018004828A (es) | Método y aparato para generar una señal de audio filtrada realizando representación de elevación. | |
JP2021007216A5 (ru) | ||
JP2017527223A5 (ru) | ||
RU2017143920A (ru) | Устройство, способ и программа аудиообработки | |
JP2014510942A5 (ru) | ||
EP2824663A3 (en) | Audio processing apparatus | |
MX2018005090A (es) | Aparato, metodo o programa de computadora para generar una descripcion de campo de sonido. | |
MY190143A (en) | Device and method for generating a high-band signal from non-linearly processed sub-ranges | |
JP2014521987A5 (ru) | ||
JP2016522910A5 (ru) | ||
JP2016533529A5 (ru) | ||
JP2017204673A5 (ru) | ||
JP2015194666A5 (ru) | ||
JP2014137756A5 (ru) | ||
JP2015179243A (ja) | オーディオ信号処理装置 | |
MX2017001253A (es) | Aparato y metodo para mejorar un sistema mejorador de sonido de senal de audio. | |
JP2016504087A5 (ru) | ||
MX2022001384A (es) | Método, aparato y dispositivo de procesamiento de datos y medio de almacenamiento. | |
JP2015096921A5 (ru) | ||
WO2016020511A3 (de) | Verfahren zur senkung der verständlichkeit von sprachsignalen und trennbauteil zur beeinflussung der schallübertragung | |
JP2017144521A5 (ru) |