RU2019124534A - Звукозапись с использованием формирования диаграммы направленности - Google Patents
Звукозапись с использованием формирования диаграммы направленности Download PDFInfo
- Publication number
- RU2019124534A RU2019124534A RU2019124534A RU2019124534A RU2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A
- Authority
- RU
- Russia
- Prior art keywords
- frequency
- time
- signal
- difference
- sound source
- Prior art date
Links
- 238000010586 diagram Methods 0.000 title claims 2
- 230000015572 biosynthetic process Effects 0.000 title 1
- 238000000638 solvent extraction Methods 0.000 claims 10
- 230000005855 radiation Effects 0.000 claims 4
- 238000004590 computer program Methods 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000005192 partition Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Claims (30)
1. Устройство звукозаписи, содержащее
микрофонную решетку (301);
по меньшей мере первый формирователь (303) диаграммы направленности, выполненный с возможностью формировать звуковой выходной сигнал со сформированной диаграммой направленности и по меньшей мере один шумовой опорный сигнал;
первый преобразователь (309) для формирования первого сигнала в частотной области из частотного преобразования звукового выходного сигнала со сформированной диаграммой направленности, при этом первый сигнал в частотной области представляется значениями время–частотных элементов разбиения;
второй преобразователь (311) для формирования второго сигнала в частотной области из частотного преобразования упомянутого по меньшей мере одного шумового опорного сигнала, при этом второй сигнал в частотной области представляется значениями время–частотных элементов разбиения;
разностный процессор (313), выполненный с возможностью формировать показатели разности время–частотных элементов разбиения, при этом показатель разности время–частотного элемента разбиения для первой частоты указывает разность между первой монотонной функцией нормы значения время–частотного элемента разбиения первого сигнала в частотной области для первой частоты и второй монотонной функцией нормы значения время–частотного элемента разбиения второго сигнала в частотой области для первой частоты;
блок (315) оценки точечного источника звука для формирования оценки точечного источника звука, указывающей, содержит ли звуковой выходной сигнал со сформированной диаграммой направленности точечный источник звука, при этом блок (315) оценки точечного источника звука выполнен с возможностью формировать оценку точечного источника звука в ответ на объединенное значение разности применительно к показателям разности время–частотного элемента разбиения для частот выше порогового значения частоты.
2. Устройство звукозаписи по п.1, в котором блок (315) оценки точечного источника звука выполнен с возможностью выявлять наличие точечного источника звука в звуковом выходном сигнале со сформированной диаграммой направленности в ответ на превышение объединенным значением разности порогового значения.
3. Устройство звукозаписи по п.1, при этом пороговое значение частоты находится не ниже 500 Гц.
4. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью формировать оценку когерентности шума, указывающую корреляцию между амплитудой звукового выходного сигнала со сформированной диаграммой направленности и амплитудой упомянутого по меньшей мере одного шумового опорного сигнала; и по меньшей мере одна из первой монотонной функции и второй монотонной функции зависит от оценки когерентности шума.
5. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью масштабировать норму значения время–частотного элемента разбиения первого сигнала в частотной области для первой частоты относительно нормы значения время–частотного элемента разбиения второго сигнала в частотной области для первой частоты в ответ на оценку когерентности шума.
6. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью формировать показатель разности время–частотного элемента разбиения для момента tk времени на частоте ωl, по существу, в виде
где – значение время–частотного элемента разбиения для звукового выходного сигнала со сформированной диаграммой направленности в момент tk времени на частоте ωl; – значение время–частотного элемента разбиения для упомянутого по меньшей мере одного шумового опорного сигнала в момент tk времени на частоте ωl; – оценка когерентности шума в момент tk времени на частоте ωl; и – расчетный параметр.
7. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью фильтровать по меньшей мере одно из значений время–частотного элемента разбиения звукового выходного сигнала со сформированной диаграммой направленности и значений время–частотного элемента разбиения упомянутого по меньшей мере одного шумового опорного сигнала.
8. Устройство звукозаписи по п.6, в котором фильтр функционирует как в направлении по частоте, так и в направлении по времени.
9. Устройство звукозаписи по п.1, содержащее множество формирователей (705, 709, 711) диаграммы направленности, включающих в себя упомянутый формирователь (705) диаграммы направленности; при этом блок (315) оценки точечного источника звука выполнен с возможностью формировать оценку точечного источника звука для каждого формирователя диаграммы направленности из множества формирователей (705, 709, 711) диаграммы направленности; и дополнительно содержащее адаптер (713) для адаптации по меньшей мере одного из множества формирователей (705, 709, 711) диаграммы направленности в ответ на оценки точечного источника звука.
10. Устройство звукозаписи по п.9, в котором множество формирователей (705, 709, 711) диаграммы направленности содержит первый формирователь (705) диаграммы направленности, выполненный с возможностью формировать звуковой выходной сигнал со сформированной диаграммой направленности и по меньшей мере один шумовой опорный сигнал; и множество ограниченных формирователей (709, 711) диаграммы направленности, которые подсоединены к микрофонной решетке (701) и каждый из которых выполнен с возможностью формировать звуковой выходной сигнал со сформированной ограниченной диаграммой направленности и по меньшей мере один ограниченный шумовой опорный сигнал; при этом устройство звукозаписи дополнительно содержит:
разностный процессор (717) диаграмм направленности для определения показателя разности для по меньшей мере одного из множества ограниченных формирователей (709, 711) диаграммы направленности, при этом показатель разности указывает разность между диаграммами направленности, сформированными первым формирователем (705) диаграммы направленности и по меньшей мере одним из множества ограниченных формирователей (709, 711) диаграммы направленности;
при этом адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности с ограничением, что параметры ограниченной формы диаграммы направленности адаптируются только применительно к ограниченным формирователям диаграммы направленности из множества ограниченных формирователей (709, 711) диаграммы направленности, для которых был определен показатель разности, который удовлетворяет критерию подобия.
11. Устройство по п.10, в котором адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности только для ограниченных формирователей (709, 711) диаграммы направленности, применительно к которым оценка точечного источника звука указывает наличие точечного источника звука в звуковом выходном сигнале со сформированной ограниченной диаграммой направленности.
12. Устройство по п.10, в котором адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности только для ограниченного формирователя (709, 711) диаграммы направленности, применительно к которому оценка точечного источника звука указывает наивысшую вероятность, что звуковой выходной сигнал со сформированной диаграммой направленности содержит точечный источник звука.
13. Устройство по п.10, в котором адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности только для ограниченного формирователя (709, 711) диаграммы направленности, имеющего наибольшее значение оценки точечного источника звука.
14. Способ осуществления звукозаписи с использованием микрофонной решетки (301), содержащий этапы, на которых
посредством, по меньшей мере, первого формирователя (303) диаграммы направленности формируют звуковой выходной сигнал со сформированной диаграммой направленности и по меньшей мере один шумовой опорный сигнал;
посредством первого преобразователя (309) формируют первый сигнал в частотной области из частотного преобразования звукового выходного сигнала со сформированной диаграммой направленности, при этом первый сигнал в частотной области представляется значениями время–частотных элементов разбиения;
посредством второго преобразователя (311) формируют второй сигнал в частотной области из частотного преобразования упомянутого по меньшей мере одного шумового опорного сигнала, при этом второй сигнал в частотной области представляется значениями время–частотных элементов разбиения;
посредством разностного процессора (313) формируют показатели разности время–частотных элементов разбиения, при этом показатель разности время–частотного элемента разбиения для первой частоты указывает разность между первой монотонной функцией нормы значения время–частотного элемента разбиения первого сигнала в частотной области для первой частоты и второй монотонной функцией нормы значения время–частотного элемента разбиения второго сигнала в частотой области для первой частоты;
посредством блока (315) оценки точечного источника звука формируют оценку точечного источника звука, указывающую, содержит ли звуковой выходной сигнал со сформированной диаграммой направленности точечный источник звука, при этом блок (315) оценки точечного источника звука выполнен с возможностью формировать оценку точечного источника звука в ответ на объединенное значение разности применительно к показателям разности время–частотного элемента разбиения для частот выше порогового значения частоты.
15. Компьютерный программный продукт, содержащий средства кода компьютерной программы, приспособленные выполнять все этапы по п.14, когда упомянутая программа исполняется на компьютере.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17150115.8 | 2017-01-03 | ||
EP17150115 | 2017-01-03 | ||
PCT/EP2017/084753 WO2018127450A1 (en) | 2017-01-03 | 2017-12-28 | Audio capture using beamforming |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2019124534A true RU2019124534A (ru) | 2021-02-05 |
RU2019124534A3 RU2019124534A3 (ru) | 2021-04-23 |
RU2758192C2 RU2758192C2 (ru) | 2021-10-26 |
Family
ID=57714511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2019124534A RU2758192C2 (ru) | 2017-01-03 | 2017-12-28 | Звукозапись с использованием формирования диаграммы направленности |
Country Status (7)
Country | Link |
---|---|
US (1) | US10887691B2 (ru) |
EP (1) | EP3566462B1 (ru) |
JP (1) | JP7041157B6 (ru) |
CN (1) | CN110140359B (ru) |
BR (1) | BR112019013548A2 (ru) |
RU (1) | RU2758192C2 (ru) |
WO (1) | WO2018127450A1 (ru) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018127483A1 (en) | 2017-01-03 | 2018-07-12 | Koninklijke Philips N.V. | Audio capture using beamforming |
US11277685B1 (en) * | 2018-11-05 | 2022-03-15 | Amazon Technologies, Inc. | Cascaded adaptive interference cancellation algorithms |
US10582299B1 (en) * | 2018-12-11 | 2020-03-03 | Amazon Technologies, Inc. | Modeling room acoustics using acoustic waves |
US11276397B2 (en) * | 2019-03-01 | 2022-03-15 | DSP Concepts, Inc. | Narrowband direction of arrival for full band beamformer |
CN110364161A (zh) * | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及系统 |
GB2589082A (en) | 2019-11-11 | 2021-05-26 | Nokia Technologies Oy | Audio processing |
CN115136237A (zh) * | 2020-03-06 | 2022-09-30 | 松下电器(美国)知识产权公司 | 行为动作识别方法、行为动作识别装置以及行为动作识别程序 |
CN112881019A (zh) * | 2021-01-18 | 2021-06-01 | 西北工业大学 | 一种用于常规室内实验环境下发动机噪声指向性测量方法 |
US20230328465A1 (en) * | 2022-03-25 | 2023-10-12 | Gn Hearing A/S | Method at a binaural hearing device system and a binaural hearing device system |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01118900A (ja) * | 1987-11-01 | 1989-05-11 | Ricoh Co Ltd | 雑音抑圧装置 |
US7146012B1 (en) | 1997-11-22 | 2006-12-05 | Koninklijke Philips Electronics N.V. | Audio processing arrangement with multiple sources |
WO2004004297A2 (en) | 2002-07-01 | 2004-01-08 | Koninklijke Philips Electronics N.V. | Stationary spectral power dependent audio enhancement system |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
CN101218848B (zh) * | 2005-07-06 | 2011-11-16 | 皇家飞利浦电子股份有限公司 | 用于声束形成的设备和方法 |
JP4225430B2 (ja) * | 2005-08-11 | 2009-02-18 | 旭化成株式会社 | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
US8005238B2 (en) * | 2007-03-22 | 2011-08-23 | Microsoft Corporation | Robust adaptive beamforming with enhanced noise suppression |
EP2088802B1 (en) * | 2008-02-07 | 2013-07-10 | Oticon A/S | Method of estimating weighting function of audio signals in a hearing aid |
JP5777616B2 (ja) * | 2009-07-24 | 2015-09-09 | コーニンクレッカ フィリップス エヌ ヴェ | 音声ビーム形成 |
CN101976565A (zh) * | 2010-07-09 | 2011-02-16 | 瑞声声学科技(深圳)有限公司 | 基于双麦克风语音增强装置及方法 |
US8924204B2 (en) * | 2010-11-12 | 2014-12-30 | Broadcom Corporation | Method and apparatus for wind noise detection and suppression using multiple microphones |
US9264804B2 (en) * | 2010-12-29 | 2016-02-16 | Telefonaktiebolaget L M Ericsson (Publ) | Noise suppressing method and a noise suppressor for applying the noise suppressing method |
CN106068535B (zh) * | 2014-03-17 | 2019-11-05 | 皇家飞利浦有限公司 | 噪声抑制 |
JP2016042613A (ja) | 2014-08-13 | 2016-03-31 | 沖電気工業株式会社 | 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ |
US20160165361A1 (en) * | 2014-12-05 | 2016-06-09 | Knowles Electronics, Llc | Apparatus and method for digital signal processing with microphones |
US20170337932A1 (en) * | 2016-05-19 | 2017-11-23 | Apple Inc. | Beam selection for noise suppression based on separation |
US10482899B2 (en) * | 2016-08-01 | 2019-11-19 | Apple Inc. | Coordination of beamformers for noise estimation and noise suppression |
-
2017
- 2017-12-28 WO PCT/EP2017/084753 patent/WO2018127450A1/en unknown
- 2017-12-28 JP JP2019535905A patent/JP7041157B6/ja active Active
- 2017-12-28 CN CN201780082116.6A patent/CN110140359B/zh active Active
- 2017-12-28 BR BR112019013548-0A patent/BR112019013548A2/pt not_active Application Discontinuation
- 2017-12-28 EP EP17821957.2A patent/EP3566462B1/en active Active
- 2017-12-28 US US16/474,119 patent/US10887691B2/en active Active
- 2017-12-28 RU RU2019124534A patent/RU2758192C2/ru active
Also Published As
Publication number | Publication date |
---|---|
WO2018127450A1 (en) | 2018-07-12 |
JP7041157B6 (ja) | 2022-05-31 |
RU2758192C2 (ru) | 2021-10-26 |
JP7041157B2 (ja) | 2022-03-23 |
US10887691B2 (en) | 2021-01-05 |
EP3566462A1 (en) | 2019-11-13 |
US20190342660A1 (en) | 2019-11-07 |
BR112019013548A2 (pt) | 2020-01-07 |
EP3566462B1 (en) | 2020-08-19 |
CN110140359A (zh) | 2019-08-16 |
JP2020503788A (ja) | 2020-01-30 |
CN110140359B (zh) | 2021-10-29 |
RU2019124534A3 (ru) | 2021-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2019124534A (ru) | Звукозапись с использованием формирования диаграммы направленности | |
RU2019124543A (ru) | Звукозапись с использованием формирования диаграммы направленности | |
US9473849B2 (en) | Sound source direction estimation apparatus, sound source direction estimation method and computer program product | |
RU2019124546A (ru) | Способ и устройство для захвата аудиоинфомации с использованием формирования диаграммы направленности | |
JP5079761B2 (ja) | 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム | |
US9961460B2 (en) | Vibration source estimation device, vibration source estimation method, and vibration source estimation program | |
JP2017503388A5 (ru) | ||
JP6236282B2 (ja) | 異常検出装置、異常検出方法、及びコンピュータ読み取り可能な記憶媒体 | |
RU2014102789A (ru) | Способ и устройство для автоматического обнаружения морских животных | |
JP2009509362A (ja) | 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。 | |
JP6724905B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP2019004465A (ja) | 収音装置、及び収音方法 | |
CN104168232A (zh) | 一种水声信道中多径时延与多普勒频移的测定方法 | |
JP2015118004A (ja) | 音源位置の推定方法、推定装置及び推定プログラム | |
JP6886890B2 (ja) | 減衰時間分析方法、装置、及びプログラム | |
CN106710602B (zh) | 一种声学混响时间估计方法和装置 | |
RU2019124535A (ru) | Захват аудио с использованием формирования диаграммы направленности | |
JP7243531B2 (ja) | 距離推定装置、距離推定方法、および距離推定プログラム | |
Bonnel et al. | Range and depth estimation of bowhead whale calls in the Arctic using a single hydrophone | |
JP2017143459A (ja) | 伝搬遅延特性の測定方法および装置 | |
Saulig et al. | Nonstationary signals information content estimation based on the local Rényi entropy in the time-frequency domain | |
JP6541179B2 (ja) | 信号処理装置 | |
Singh | Comparative study of various time delay estimation schemes using Matlab | |
Chen et al. | Method of spatially correlated wideband ambient noise simulation for underwater acoustic array | |
KR101534781B1 (ko) | 음원 방향 추정 장치 |