RU2019124534A - Звукозапись с использованием формирования диаграммы направленности - Google Patents

Звукозапись с использованием формирования диаграммы направленности Download PDF

Info

Publication number
RU2019124534A
RU2019124534A RU2019124534A RU2019124534A RU2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A RU 2019124534 A RU2019124534 A RU 2019124534A
Authority
RU
Russia
Prior art keywords
frequency
time
signal
difference
sound source
Prior art date
Application number
RU2019124534A
Other languages
English (en)
Other versions
RU2758192C2 (ru
RU2019124534A3 (ru
Inventor
Корнелис Питер ЯНСЕ
Патрик КЕХИХЯН
Original Assignee
Конинклейке Филипс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Н.В. filed Critical Конинклейке Филипс Н.В.
Publication of RU2019124534A publication Critical patent/RU2019124534A/ru
Publication of RU2019124534A3 publication Critical patent/RU2019124534A3/ru
Application granted granted Critical
Publication of RU2758192C2 publication Critical patent/RU2758192C2/ru

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Otolaryngology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Claims (30)

1. Устройство звукозаписи, содержащее
микрофонную решетку (301);
по меньшей мере первый формирователь (303) диаграммы направленности, выполненный с возможностью формировать звуковой выходной сигнал со сформированной диаграммой направленности и по меньшей мере один шумовой опорный сигнал;
первый преобразователь (309) для формирования первого сигнала в частотной области из частотного преобразования звукового выходного сигнала со сформированной диаграммой направленности, при этом первый сигнал в частотной области представляется значениями время–частотных элементов разбиения;
второй преобразователь (311) для формирования второго сигнала в частотной области из частотного преобразования упомянутого по меньшей мере одного шумового опорного сигнала, при этом второй сигнал в частотной области представляется значениями время–частотных элементов разбиения;
разностный процессор (313), выполненный с возможностью формировать показатели разности время–частотных элементов разбиения, при этом показатель разности время–частотного элемента разбиения для первой частоты указывает разность между первой монотонной функцией нормы значения время–частотного элемента разбиения первого сигнала в частотной области для первой частоты и второй монотонной функцией нормы значения время–частотного элемента разбиения второго сигнала в частотой области для первой частоты;
блок (315) оценки точечного источника звука для формирования оценки точечного источника звука, указывающей, содержит ли звуковой выходной сигнал со сформированной диаграммой направленности точечный источник звука, при этом блок (315) оценки точечного источника звука выполнен с возможностью формировать оценку точечного источника звука в ответ на объединенное значение разности применительно к показателям разности время–частотного элемента разбиения для частот выше порогового значения частоты.
2. Устройство звукозаписи по п.1, в котором блок (315) оценки точечного источника звука выполнен с возможностью выявлять наличие точечного источника звука в звуковом выходном сигнале со сформированной диаграммой направленности в ответ на превышение объединенным значением разности порогового значения.
3. Устройство звукозаписи по п.1, при этом пороговое значение частоты находится не ниже 500 Гц.
4. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью формировать оценку когерентности шума, указывающую корреляцию между амплитудой звукового выходного сигнала со сформированной диаграммой направленности и амплитудой упомянутого по меньшей мере одного шумового опорного сигнала; и по меньшей мере одна из первой монотонной функции и второй монотонной функции зависит от оценки когерентности шума.
5. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью масштабировать норму значения время–частотного элемента разбиения первого сигнала в частотной области для первой частоты относительно нормы значения время–частотного элемента разбиения второго сигнала в частотной области для первой частоты в ответ на оценку когерентности шума.
6. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью формировать показатель разности время–частотного элемента разбиения для момента tk времени на частоте ωl, по существу, в виде
Figure 00000001
,
где
Figure 00000002
– значение время–частотного элемента разбиения для звукового выходного сигнала со сформированной диаграммой направленности в момент tk времени на частоте ωl;
Figure 00000003
– значение время–частотного элемента разбиения для упомянутого по меньшей мере одного шумового опорного сигнала в момент tk времени на частоте ωl;
Figure 00000004
– оценка когерентности шума в момент tk времени на частоте ωl; и
Figure 00000005
– расчетный параметр.
7. Устройство звукозаписи по п.1, в котором разностный процессор (313) выполнен с возможностью фильтровать по меньшей мере одно из значений время–частотного элемента разбиения звукового выходного сигнала со сформированной диаграммой направленности и значений время–частотного элемента разбиения упомянутого по меньшей мере одного шумового опорного сигнала.
8. Устройство звукозаписи по п.6, в котором фильтр функционирует как в направлении по частоте, так и в направлении по времени.
9. Устройство звукозаписи по п.1, содержащее множество формирователей (705, 709, 711) диаграммы направленности, включающих в себя упомянутый формирователь (705) диаграммы направленности; при этом блок (315) оценки точечного источника звука выполнен с возможностью формировать оценку точечного источника звука для каждого формирователя диаграммы направленности из множества формирователей (705, 709, 711) диаграммы направленности; и дополнительно содержащее адаптер (713) для адаптации по меньшей мере одного из множества формирователей (705, 709, 711) диаграммы направленности в ответ на оценки точечного источника звука.
10. Устройство звукозаписи по п.9, в котором множество формирователей (705, 709, 711) диаграммы направленности содержит первый формирователь (705) диаграммы направленности, выполненный с возможностью формировать звуковой выходной сигнал со сформированной диаграммой направленности и по меньшей мере один шумовой опорный сигнал; и множество ограниченных формирователей (709, 711) диаграммы направленности, которые подсоединены к микрофонной решетке (701) и каждый из которых выполнен с возможностью формировать звуковой выходной сигнал со сформированной ограниченной диаграммой направленности и по меньшей мере один ограниченный шумовой опорный сигнал; при этом устройство звукозаписи дополнительно содержит:
разностный процессор (717) диаграмм направленности для определения показателя разности для по меньшей мере одного из множества ограниченных формирователей (709, 711) диаграммы направленности, при этом показатель разности указывает разность между диаграммами направленности, сформированными первым формирователем (705) диаграммы направленности и по меньшей мере одним из множества ограниченных формирователей (709, 711) диаграммы направленности;
при этом адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности с ограничением, что параметры ограниченной формы диаграммы направленности адаптируются только применительно к ограниченным формирователям диаграммы направленности из множества ограниченных формирователей (709, 711) диаграммы направленности, для которых был определен показатель разности, который удовлетворяет критерию подобия.
11. Устройство по п.10, в котором адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности только для ограниченных формирователей (709, 711) диаграммы направленности, применительно к которым оценка точечного источника звука указывает наличие точечного источника звука в звуковом выходном сигнале со сформированной ограниченной диаграммой направленности.
12. Устройство по п.10, в котором адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности только для ограниченного формирователя (709, 711) диаграммы направленности, применительно к которому оценка точечного источника звука указывает наивысшую вероятность, что звуковой выходной сигнал со сформированной диаграммой направленности содержит точечный источник звука.
13. Устройство по п.10, в котором адаптер (713) выполнен с возможностью адаптировать параметры ограниченной формы диаграммы направленности только для ограниченного формирователя (709, 711) диаграммы направленности, имеющего наибольшее значение оценки точечного источника звука.
14. Способ осуществления звукозаписи с использованием микрофонной решетки (301), содержащий этапы, на которых
посредством, по меньшей мере, первого формирователя (303) диаграммы направленности формируют звуковой выходной сигнал со сформированной диаграммой направленности и по меньшей мере один шумовой опорный сигнал;
посредством первого преобразователя (309) формируют первый сигнал в частотной области из частотного преобразования звукового выходного сигнала со сформированной диаграммой направленности, при этом первый сигнал в частотной области представляется значениями время–частотных элементов разбиения;
посредством второго преобразователя (311) формируют второй сигнал в частотной области из частотного преобразования упомянутого по меньшей мере одного шумового опорного сигнала, при этом второй сигнал в частотной области представляется значениями время–частотных элементов разбиения;
посредством разностного процессора (313) формируют показатели разности время–частотных элементов разбиения, при этом показатель разности время–частотного элемента разбиения для первой частоты указывает разность между первой монотонной функцией нормы значения время–частотного элемента разбиения первого сигнала в частотной области для первой частоты и второй монотонной функцией нормы значения время–частотного элемента разбиения второго сигнала в частотой области для первой частоты;
посредством блока (315) оценки точечного источника звука формируют оценку точечного источника звука, указывающую, содержит ли звуковой выходной сигнал со сформированной диаграммой направленности точечный источник звука, при этом блок (315) оценки точечного источника звука выполнен с возможностью формировать оценку точечного источника звука в ответ на объединенное значение разности применительно к показателям разности время–частотного элемента разбиения для частот выше порогового значения частоты.
15. Компьютерный программный продукт, содержащий средства кода компьютерной программы, приспособленные выполнять все этапы по п.14, когда упомянутая программа исполняется на компьютере.
RU2019124534A 2017-01-03 2017-12-28 Звукозапись с использованием формирования диаграммы направленности RU2758192C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17150115.8 2017-01-03
EP17150115 2017-01-03
PCT/EP2017/084753 WO2018127450A1 (en) 2017-01-03 2017-12-28 Audio capture using beamforming

Publications (3)

Publication Number Publication Date
RU2019124534A true RU2019124534A (ru) 2021-02-05
RU2019124534A3 RU2019124534A3 (ru) 2021-04-23
RU2758192C2 RU2758192C2 (ru) 2021-10-26

Family

ID=57714511

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019124534A RU2758192C2 (ru) 2017-01-03 2017-12-28 Звукозапись с использованием формирования диаграммы направленности

Country Status (7)

Country Link
US (1) US10887691B2 (ru)
EP (1) EP3566462B1 (ru)
JP (1) JP7041157B6 (ru)
CN (1) CN110140359B (ru)
BR (1) BR112019013548A2 (ru)
RU (1) RU2758192C2 (ru)
WO (1) WO2018127450A1 (ru)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018127483A1 (en) 2017-01-03 2018-07-12 Koninklijke Philips N.V. Audio capture using beamforming
US11277685B1 (en) * 2018-11-05 2022-03-15 Amazon Technologies, Inc. Cascaded adaptive interference cancellation algorithms
US10582299B1 (en) * 2018-12-11 2020-03-03 Amazon Technologies, Inc. Modeling room acoustics using acoustic waves
US11276397B2 (en) * 2019-03-01 2022-03-15 DSP Concepts, Inc. Narrowband direction of arrival for full band beamformer
CN110364161A (zh) * 2019-08-22 2019-10-22 北京小米智能科技有限公司 响应语音信号的方法、电子设备、介质及系统
GB2589082A (en) 2019-11-11 2021-05-26 Nokia Technologies Oy Audio processing
CN115136237A (zh) * 2020-03-06 2022-09-30 松下电器(美国)知识产权公司 行为动作识别方法、行为动作识别装置以及行为动作识别程序
CN112881019A (zh) * 2021-01-18 2021-06-01 西北工业大学 一种用于常规室内实验环境下发动机噪声指向性测量方法
US20230328465A1 (en) * 2022-03-25 2023-10-12 Gn Hearing A/S Method at a binaural hearing device system and a binaural hearing device system

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01118900A (ja) * 1987-11-01 1989-05-11 Ricoh Co Ltd 雑音抑圧装置
US7146012B1 (en) 1997-11-22 2006-12-05 Koninklijke Philips Electronics N.V. Audio processing arrangement with multiple sources
WO2004004297A2 (en) 2002-07-01 2004-01-08 Koninklijke Philips Electronics N.V. Stationary spectral power dependent audio enhancement system
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
CN101218848B (zh) * 2005-07-06 2011-11-16 皇家飞利浦电子股份有限公司 用于声束形成的设备和方法
JP4225430B2 (ja) * 2005-08-11 2009-02-18 旭化成株式会社 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
US8005238B2 (en) * 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
EP2088802B1 (en) * 2008-02-07 2013-07-10 Oticon A/S Method of estimating weighting function of audio signals in a hearing aid
JP5777616B2 (ja) * 2009-07-24 2015-09-09 コーニンクレッカ フィリップス エヌ ヴェ 音声ビーム形成
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
US8924204B2 (en) * 2010-11-12 2014-12-30 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones
US9264804B2 (en) * 2010-12-29 2016-02-16 Telefonaktiebolaget L M Ericsson (Publ) Noise suppressing method and a noise suppressor for applying the noise suppressing method
CN106068535B (zh) * 2014-03-17 2019-11-05 皇家飞利浦有限公司 噪声抑制
JP2016042613A (ja) 2014-08-13 2016-03-31 沖電気工業株式会社 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ
US20160165361A1 (en) * 2014-12-05 2016-06-09 Knowles Electronics, Llc Apparatus and method for digital signal processing with microphones
US20170337932A1 (en) * 2016-05-19 2017-11-23 Apple Inc. Beam selection for noise suppression based on separation
US10482899B2 (en) * 2016-08-01 2019-11-19 Apple Inc. Coordination of beamformers for noise estimation and noise suppression

Also Published As

Publication number Publication date
WO2018127450A1 (en) 2018-07-12
JP7041157B6 (ja) 2022-05-31
RU2758192C2 (ru) 2021-10-26
JP7041157B2 (ja) 2022-03-23
US10887691B2 (en) 2021-01-05
EP3566462A1 (en) 2019-11-13
US20190342660A1 (en) 2019-11-07
BR112019013548A2 (pt) 2020-01-07
EP3566462B1 (en) 2020-08-19
CN110140359A (zh) 2019-08-16
JP2020503788A (ja) 2020-01-30
CN110140359B (zh) 2021-10-29
RU2019124534A3 (ru) 2021-04-23

Similar Documents

Publication Publication Date Title
RU2019124534A (ru) Звукозапись с использованием формирования диаграммы направленности
RU2019124543A (ru) Звукозапись с использованием формирования диаграммы направленности
US9473849B2 (en) Sound source direction estimation apparatus, sound source direction estimation method and computer program product
RU2019124546A (ru) Способ и устройство для захвата аудиоинфомации с использованием формирования диаграммы направленности
JP5079761B2 (ja) 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
US9961460B2 (en) Vibration source estimation device, vibration source estimation method, and vibration source estimation program
JP2017503388A5 (ru)
JP6236282B2 (ja) 異常検出装置、異常検出方法、及びコンピュータ読み取り可能な記憶媒体
RU2014102789A (ru) Способ и устройство для автоматического обнаружения морских животных
JP2009509362A (ja) 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。
JP6724905B2 (ja) 信号処理装置、信号処理方法、およびプログラム
JP2019004465A (ja) 収音装置、及び収音方法
CN104168232A (zh) 一种水声信道中多径时延与多普勒频移的测定方法
JP2015118004A (ja) 音源位置の推定方法、推定装置及び推定プログラム
JP6886890B2 (ja) 減衰時間分析方法、装置、及びプログラム
CN106710602B (zh) 一种声学混响时间估计方法和装置
RU2019124535A (ru) Захват аудио с использованием формирования диаграммы направленности
JP7243531B2 (ja) 距離推定装置、距離推定方法、および距離推定プログラム
Bonnel et al. Range and depth estimation of bowhead whale calls in the Arctic using a single hydrophone
JP2017143459A (ja) 伝搬遅延特性の測定方法および装置
Saulig et al. Nonstationary signals information content estimation based on the local Rényi entropy in the time-frequency domain
JP6541179B2 (ja) 信号処理装置
Singh Comparative study of various time delay estimation schemes using Matlab
Chen et al. Method of spatially correlated wideband ambient noise simulation for underwater acoustic array
KR101534781B1 (ko) 음원 방향 추정 장치