JP2017530396A5 - - Google Patents

Download PDF

Info

Publication number
JP2017530396A5
JP2017530396A5 JP2017512383A JP2017512383A JP2017530396A5 JP 2017530396 A5 JP2017530396 A5 JP 2017530396A5 JP 2017512383 A JP2017512383 A JP 2017512383A JP 2017512383 A JP2017512383 A JP 2017512383A JP 2017530396 A5 JP2017530396 A5 JP 2017530396A5
Authority
JP
Japan
Prior art keywords
output
signal
audio
enhanced
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017512383A
Other languages
English (en)
Other versions
JP6703525B2 (ja
JP2017530396A (ja
Filing date
Publication date
Priority claimed from EP14306947.4A external-priority patent/EP3029671A1/en
Application filed filed Critical
Priority claimed from PCT/EP2015/069417 external-priority patent/WO2016034454A1/en
Publication of JP2017530396A publication Critical patent/JP2017530396A/ja
Publication of JP2017530396A5 publication Critical patent/JP2017530396A5/ja
Application granted granted Critical
Publication of JP6703525B2 publication Critical patent/JP6703525B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

当業者には明らかなように、実装は、例えば記憶又は送信され得る情報を伝えるようにフォーマットされた様々な信号を生成してもよい。情報は、例えば、方法を実行するための命令、又は説明された実装の1つによって生成されたデータを含んでもよい。例えば、信号は、説明された実施形態のビット列を伝えるようにフォーマットされてもよい。かかる信号は、例えば電磁波(例えば、スペクトルの無線周波数部分を用いる)又はベースバンド信号としてフォーマットされてもよい。フォーマットは、例えば、データストリームの符号化及び符号化されたデータストリームでキャリアを変調することを含んでもよい。信号が伝える情報は、例えばアナログ又はデジタル情報であってもよい。信号は、周知のように、様々な異なる有線又は無線リンクを通して送信されてもよい。信号は、プロセッサ可読媒体に記憶されてもよい。
[付記1]
オーディオ信号を処理するための方法であって、前記オーディオ信号が、少なくとも第1のオーディオ源からの第1の信号及び第2のオーディオ源からの第2の信号の混合であり、前記方法が、
第1の方向を指し示す第1のビーム形成器を用いて、前記オーディオ信号を処理して第1の出力を生成すること(330)であって、前記第1の方向が、前記第1のオーディオ源に対応する、ことと、
第2の方向を指し示す第2のビーム形成器を用いて、前記オーディオ信号を処理して第2の出力を生成すること(330)であって、前記第2の方向が、前記第2のオーディオ源に対応する、ことと、
前記第1の出力及び前記第2の出力を処理して、強調された第1の信号を生成すること(340)と、
を含む方法。
[付記2]
前記オーディオ信号に対して音源定位を実行して、前記第1の方向及び前記第2の方向を決定すること(320)を更に含む、付記1に記載の方法。
[付記3]
前記第1の出力と前記第2の出力との間で前記第1の出力が支配的であると決定することを更に含む、付記1に記載の方法。
[付記4]
前記第1の出力が支配的であると決定された場合に、前記強調された第1の信号を生成する前記処理が、基準信号に基づく、付記3に記載の方法。
[付記5]
前記第1の出力が支配的であると決定されない場合に、前記強調された第1の信号を生成する前記処理が、第1の係数によって重み付けされた前記第1の出力に基づく、付記3に記載の方法。
[付記6]
前記第1の出力が支配的であると前記決定することが、
第3の方向を指し示す第3のビーム形成器を用いて、前記オーディオ信号を処理して第3の出力を生成することであって、前記第3の方向が第3のオーディオ源に対応し、前記混合が、前記第3のオーディオ源からの第3の信号を含む、ことと、
前記第2の出力及び前記第3の出力の最大値を決定することと、
前記第1の出力及び前記最大値に応じて、前記第1の出力が支配的であると決定することと、
を含む、付記3に記載の方法。
[付記7]
前記第1の出力及び前記第2の出力に応じた比率を決定することであって、前記強調された第1の信号を生成する処理が、前記比率に応じて実行されることを更に含む、付記1に記載の方法。
[付記8]
前記第1の出力及び前記比率に応じて、前記強調された第1の信号を生成することと、
基準信号及び前記比率に応じて、前記強調された第1の信号を生成することと、
の1つを更に含む、付記7に記載の方法。
[付記9]
前記第1の信号を処理するための要求を受信することと、
前記強調された第1の信号及び前記第2の信号を結合して、出力オーディオを供給することと、
を更に含む、付記1に記載の方法。
[付記10]
オーディオ信号を処理するための機器(200、400、500、600、700)であって、前記オーディオ信号が、少なくとも第1のオーディオ源からの第1の信号及び第2のオーディオ源からの第2の信号の混合であり、前記機器が、
第1の方向を指し示し、且つ前記オーディオ信号を処理して第1の出力を生成するように構成された第1のビーム形成器(220、430、530、630)であって、前記第1の方向が、前記第1のオーディオ源に対応する、第1のビーム形成器(220、430、530、630)と、
第2の方向を指し示し、且つ前記オーディオ信号を処理して第2の出力を生成するように構成された第2のビーム形成器(230、430、532、632)であって、前記第2の方向が、前記第2のオーディオ源に対応する、第2のビーム形成器(230、430、532、632)と、
前記第1の出力及び前記第2の出力に応じて、強調された第1の信号を生成するように構成されたプロセッサ(250、440、540、640)と、
を備える機器(200、400、500、600、700)。
[付記11]
前記オーディオ信号に対して音源定位を実行して、前記第1の方向及び前記第2の方向を決定するように構成された音源定位モジュール(210、420)を更に備える、付記10に記載の機器。
[付記12]
前記プロセッサが、前記第1の出力と前記第2の出力との間で前記第1の出力が支配的であると決定するように更に構成される、付記10に記載の機器。
[付記13]
前記第1の出力が支配的であると決定された場合に、前記プロセッサが、基準信号に基づいて前記強調された第1の信号を生成するように構成される、付記12に記載の機器。
[付記14]
前記第1の出力が支配的であると決定されない場合に、前記プロセッサが、第1の係数によって重み付けされた前記第1の出力に基づいて、前記強調された第1の信号を生成するように構成される、付記12に記載の機器。
[付記15]
付記1〜9のいずれか一項に従って、オーディオ信号を処理するための命令を記憶したコンピュータ可読記憶媒体であって、前記オーディオ信号が、少なくとも第1のオーディオ源からの第1の信号及び第2のオーディオ源からの第2の信号の混合である、コンピュータ可読記憶媒体。

Claims (15)

  1. オーディオ処理機器において実行される、オーディオ信号を処理する方法であって、前記オーディオ信号が、少なくとも2つのオーディオ入力からの入力信号の混合であり、前記方法が、
    少なくとも2つの出力を生成するために、前記オーディオ信号を処理することであって、各出力が、異なる空間方向を指し示すビーム形成器を用いることによって生成される、ことと、
    前記生成された出力間で少なくとも1つの支配的な出力を決定することと、
    第1の強調された信号であって、前記入力信号の線形結合である基準信号に基づいて生成される第1の強調された信号と、
    少なくとも1つの第2の強調された信号であって、前記支配的な出力以外の前記出力の少なくとも1つに基づいて生成される少なくとも1つの第2の強調された信号と
    を生成するために前記出力を処理することと
    を含む方法。
  2. 前記オーディオ信号に対して音源定位を実行することを含む、請求項1に記載の方法。
  3. 前記空間方向は、前記音源定位を考慮する、請求項2に記載の方法。
  4. 前記第2の強調された信号が、第1の係数によって重み付けされた、前記支配的な出力以外の前記少なくとも1つの出力に基づいて生成される、請求項1〜のいずれか一項に記載の方法。
  5. 前記支配的な出力が、前記オーディオ処理機器のカメラが面する方向である空間方向を有するビーム形成器の出力であると仮定される、請求項1〜4のいずれか一項に記載の方法。
  6. 前記出力間の比率を決定することを含み前記第1及び第2の強調された信号が、前記比率に応じて生成される、請求項1〜5のいずれか一項に記載の方法。
  7. 出力オーディオを提供するために、前記第1及び第2の強調された信号を結合することを更に含む、請求項1〜6のいずれか一項に記載の方法。
  8. オーディオ信号を処理する機器であって、前記オーディオ信号が、少なくとも2つのオーディオ入力からの入力信号の混合であり、前記機器が、少なくとも2つのビーム形成器と、
    少なくとも2つの出力を生成するために前記オーディオ信号を処理し、各出力が、異なる空間方向を指し示すビーム形成器の1つを用いることによって生成され、
    前記生成された出力間で少なくとも1つの支配的な出力を決定し、
    ○ 第1の強調された信号であって、前記入力信号の線形結合である基準信号に基づいて生成される第1の強調された信号と、
    ○ 少なくとも1つの第2の強調された信号であって、前記支配的な出力以外の前記出力の少なくとも1つに基づいて生成されている少なくとも1つの第2の強調された信号と
    を生成するために前記出力を処理する
    ように構成された少なくとも1つのプロセッサと
    を備える機器。
  9. 前記オーディオ信号に対して音源定位を実行するように構成された音源定位モジュールを備える、請求項に記載の機器。
  10. 前記空間方向が、前記音源定位を考慮する、請求項9に記載の機器。
  11. 記プロセッサが、第1の係数によって重み付けされた、前記支配的な出力以外の前記少なくとも1つの出力に基づいて、前記第2の強調された信号を生成するように構成されている、請求項8〜10のいずれか一項に記載の機器。
  12. 前記支配的な出力が、前記機器のカメラが面する方向である空間方向を有するビーム形成器の出力であると仮定される、請求項8〜11のいずれか一項に記載の機器。
  13. 前記オーディオ入力を含むオーディオキャプチャ装置を含む、請求項8〜12のいずれか一項に記載の機器。
  14. 前記機器の出力モジュールに出力オーディオを提供するために、前記プロセッサが、前記第1及び第2の強調された信号を結合するように構成されている、請求項8〜13のいずれか一項に記載の機器。
  15. ーディオ信号を処理するための命令を記憶したコンピュータ可読記憶媒体であって、前記オーディオ信号が、少なくとも2つのオーディオ入力からの入力信号の混合であ前記処理が、
    少なくとも2つの出力を生成するために、前記オーディオ信号を処理することであって、各出力が、異なる空間方向を指し示すビーム形成器を用いることによって生成される、ことと、
    前記生成された出力間で少なくとも1つの支配的な出力を決定することと、
    前記出力を処理することであって、
    第1の強調された信号であって、前記入力信号の線形結合である基準信号に基づいて生成される第1の強調された信号と、
    少なくとも1つの第2の強調された信号であって、前記支配的な出力以外の前記出力の少なくとも1つに基づいて生成される少なくとも1つの第2の強調された信号と
    を生成するために前記出力を処理することと、
    を含むコンピュータ可読記憶媒体。
JP2017512383A 2014-09-05 2015-08-25 音源を強調するための方法及び機器 Active JP6703525B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP14306365.9 2014-09-05
EP14306365 2014-09-05
EP14306947.4 2014-12-04
EP14306947.4A EP3029671A1 (en) 2014-12-04 2014-12-04 Method and apparatus for enhancing sound sources
PCT/EP2015/069417 WO2016034454A1 (en) 2014-09-05 2015-08-25 Method and apparatus for enhancing sound sources

Publications (3)

Publication Number Publication Date
JP2017530396A JP2017530396A (ja) 2017-10-12
JP2017530396A5 true JP2017530396A5 (ja) 2018-10-04
JP6703525B2 JP6703525B2 (ja) 2020-06-03

Family

ID=54148464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017512383A Active JP6703525B2 (ja) 2014-09-05 2015-08-25 音源を強調するための方法及び機器

Country Status (7)

Country Link
US (1) US20170287499A1 (ja)
EP (1) EP3189521B1 (ja)
JP (1) JP6703525B2 (ja)
KR (1) KR102470962B1 (ja)
CN (1) CN106716526B (ja)
TW (1) TW201621888A (ja)
WO (1) WO2016034454A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3151534A1 (en) * 2015-09-29 2017-04-05 Thomson Licensing Method of refocusing images captured by a plenoptic camera and audio based refocusing image system
GB2549922A (en) * 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
US10356362B1 (en) 2018-01-16 2019-07-16 Google Llc Controlling focus of audio signals on speaker during videoconference
TWI665661B (zh) * 2018-02-14 2019-07-11 美律實業股份有限公司 音頻處理裝置及音頻處理方法
CN108510987B (zh) * 2018-03-26 2020-10-23 北京小米移动软件有限公司 语音处理方法及装置
CN108831495B (zh) * 2018-06-04 2022-11-29 桂林电子科技大学 一种应用于噪声环境下语音识别的语音增强方法
CN114727193A (zh) * 2018-09-03 2022-07-08 斯纳普公司 声学变焦
CN110503970B (zh) * 2018-11-23 2021-11-23 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
GB2584629A (en) * 2019-05-29 2020-12-16 Nokia Technologies Oy Audio processing
CN110428851B (zh) * 2019-08-21 2022-02-18 浙江大华技术股份有限公司 基于麦克风阵列的波束形成方法和装置、存储介质
US11997474B2 (en) 2019-09-19 2024-05-28 Wave Sciences, LLC Spatial audio array processing system and method
US10735887B1 (en) * 2019-09-19 2020-08-04 Wave Sciences, LLC Spatial audio array processing system and method
WO2021209683A1 (en) * 2020-04-17 2021-10-21 Nokia Technologies Oy Audio processing
US11259112B1 (en) * 2020-09-29 2022-02-22 Harman International Industries, Incorporated Sound modification based on direction of interest
AU2022218336A1 (en) * 2021-02-04 2023-09-07 Neatframe Limited Audio processing
CN113281727B (zh) * 2021-06-02 2021-12-07 中国科学院声学研究所 一种基于水平线列阵的输出增强的波束形成方法及其系统
WO2023234429A1 (ko) * 2022-05-30 2023-12-07 엘지전자 주식회사 인공 지능 기기

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049607A (en) * 1998-09-18 2000-04-11 Lamar Signal Processing Interference canceling method and apparatus
US6931138B2 (en) * 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
US20030161485A1 (en) * 2002-02-27 2003-08-28 Shure Incorporated Multiple beam automatic mixing microphone array processing via speech detection
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
KR100921368B1 (ko) * 2007-10-10 2009-10-14 충남대학교산학협력단 이동형 마이크로폰 어레이를 이용한 소음원 위치 판별정밀도 개선 시스템 및 방법
KR20090037845A (ko) * 2008-12-18 2009-04-16 삼성전자주식회사 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치
KR101456866B1 (ko) * 2007-10-12 2014-11-03 삼성전자주식회사 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
US8223988B2 (en) * 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8401178B2 (en) * 2008-09-30 2013-03-19 Apple Inc. Multiple microphone switching and configuration
US8824699B2 (en) * 2008-12-24 2014-09-02 Nxp B.V. Method of, and apparatus for, planar audio tracking
CN101510426B (zh) * 2009-03-23 2013-03-27 北京中星微电子有限公司 一种噪声消除方法及系统
JP5347902B2 (ja) * 2009-10-22 2013-11-20 ヤマハ株式会社 音響処理装置
JP5105336B2 (ja) * 2009-12-11 2012-12-26 沖電気工業株式会社 音源分離装置、プログラム及び方法
US8583428B2 (en) * 2010-06-15 2013-11-12 Microsoft Corporation Sound source separation using spatial filtering and regularization phases
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
BR112012031656A2 (pt) * 2010-08-25 2016-11-08 Asahi Chemical Ind dispositivo, e método de separação de fontes sonoras, e, programa
US9191738B2 (en) * 2010-12-21 2015-11-17 Nippon Telgraph and Telephone Corporation Sound enhancement method, device, program and recording medium
CN102164328B (zh) * 2010-12-29 2013-12-11 中国科学院声学研究所 一种用于家庭环境的基于传声器阵列的音频输入系统
CN102324237B (zh) * 2011-05-30 2013-01-02 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
US9226088B2 (en) * 2011-06-11 2015-12-29 Clearone Communications, Inc. Methods and apparatuses for multiple configurations of beamforming microphone arrays
US9973848B2 (en) * 2011-06-21 2018-05-15 Amazon Technologies, Inc. Signal-enhancing beamforming in an augmented reality environment
CN102831898B (zh) * 2012-08-31 2013-11-13 厦门大学 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法
US10229697B2 (en) * 2013-03-12 2019-03-12 Google Technology Holdings LLC Apparatus and method for beamforming to obtain voice and noise signals
US20150063589A1 (en) * 2013-08-28 2015-03-05 Csr Technology Inc. Method, apparatus, and manufacture of adaptive null beamforming for a two-microphone array
US9686605B2 (en) * 2014-05-20 2017-06-20 Cisco Technology, Inc. Precise tracking of sound angle of arrival at a microphone array under air temperature variation

Similar Documents

Publication Publication Date Title
JP2017530396A5 (ja)
JP2018527655A5 (ja)
US9318116B2 (en) Acoustic data transmission based on groups of audio receivers
KR101538756B1 (ko) 외부 디바이스의 제어를 위해 음파를 출력하는 모바일 디바이스 및 방법, 그리고 외부 디바이스
RU2011154551A (ru) Устройство для формирования выходного пространственного многоканального аудиосигнала
WO2011104668A3 (en) A video processing system and a method for editing a video asset
JP2019534600A5 (ja)
RU2016105469A (ru) Устройство и способ для улучшенного пространственного кодирования аудиообъектов
EP3975176A3 (en) Apparatus, method and computer program for encoding, scene processing and other procedures related to dirac based spatial audio coding
JP2016144072A5 (ja) 表示及び一時蓄積の処理方法
WO2014187877A3 (de) Mischpult, tonsignalerzeuger, verfahren und computerprogramm zum bereitstellen eines tonsignals
JP2008048093A5 (ja)
CN104883617B (zh) 多屏互动系统及方法
ZA202105927B (en) Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs
EP3622730B1 (en) Spatializing audio data based on analysis of incoming audio data
US10657977B2 (en) Method for processing speech/audio signal and apparatus
WO2019129127A1 (zh) 一种多终端协同播放音频文件的方法及终端
MX2021006565A (es) Aparato, metodo y programa de computadora para codificacion, decodificacion, procesamiento de escenas y otros procedimientos relacionados con codificacion de audio espacial basada en dirac que utiliza compensacion difusa.
WO2016094637A3 (en) Medium access control (mac) header compression
US20170094416A1 (en) User adornable apparatus and system for generating user detectable audio and mechanical vibration signals
GB2446486B (en) Signal processing apparatus
JP2018511213A5 (ja)
WO2018200176A1 (en) Progressive streaming of spatial audio
CL2021003533A1 (es) Métodos, aparatos y sistemas de representación, codificación y descodificación de datos de directividad discreta.
JP2016181776A5 (ja)