JP6591477B2 - 信号処理システム、信号処理方法及び信号処理プログラム - Google Patents
信号処理システム、信号処理方法及び信号処理プログラム Download PDFInfo
- Publication number
- JP6591477B2 JP6591477B2 JP2017055096A JP2017055096A JP6591477B2 JP 6591477 B2 JP6591477 B2 JP 6591477B2 JP 2017055096 A JP2017055096 A JP 2017055096A JP 2017055096 A JP2017055096 A JP 2017055096A JP 6591477 B2 JP6591477 B2 JP 6591477B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signals
- separation
- separated
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 71
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000000926 separation method Methods 0.000 claims description 85
- 238000009826 distribution Methods 0.000 claims description 72
- 238000004364 calculation method Methods 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 24
- 230000001186 cumulative effect Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 7
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 239000013598 vector Substances 0.000 description 33
- 239000011159 matrix material Substances 0.000 description 31
- 238000010586 diagram Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
(第1の実施形態)
図1は、第1の実施形態に係る信号処理システム100−1の構成を示すブロック図である。この信号処理システム100−1は、センサ部101と、音源分離部102と、方向特性分布算出部103と、類似度算出部104と、連結部105とを備える。
第1の実施形態に係る信号処理システムの具体的な処理動作を説明する。
上記センサ部101は、複数チャネルのセンサ(例えばマイクロフォン)を備え、各センサは収録環境において存在する全ての音源から到来する音響信号が重ね合わされた信号を観測する。上記音源分離部102は、センサ部101から観測信号を受け取り、センサのチャネル数と同数の音響信号に分離し、分離信号として出力する。ここで出力される分離信号は、信号同士の分離度が高くなる基準を用いて学習された分離行列を観測信号に乗算することによって得られる。
以上に説明した各処理部(102〜105)は、例えばCPU(Central Processing Unit)などのコンピュータ装置にプログラムを実行させること、すなわちソフトウェアとして実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェアとハードウェアを併用して実現してもよい。以降の実施形態で説明する各処理部についても同様のことが言える。
まず、図1中のセンサ部101について具体的に説明する。
センサ部101が備える各センサは任意の位置に配置することが可能であるが、ある1つのセンサが別の1つのセンサの受信口を塞がないように注意する必要がある。センサの個数Mは2以上とする。なお、M≧3のとき、ある一直線上に音源が並んでいない(音源座標が2次元的に配置されている)場合は、センサも一直線上に並ぶことがないように2次元的に配置すると、後段の音源分離において好適である。一方、M=2のときは、2つの音源を結ぶ線分上にセンサが並んでいる方が好適である。
いま、周波数ω、時刻tにおける音源信号をSω,t、センサ部101で観測された観測信号をXω,tとおく。音源信号Sω,tはK次元のベクトル量であり、各要素には単独の音源信号が含まれているものと考える。一方、観測信号Xω,tはM次元のベクトル量であり(Mはセンサの個数)、その各要素には上記の音源から到来した音波が複数重ね合わされた値が含まれる。このとき、両者は
時不変な系であれば、混合行列A(ω,t) は時間に依存しない量となるが、実際には音源やセンサアレイの位置変化などの音響条件の変化が伴うため、一般的には時変な量である。なお、X及びSは時間領域の信号ではなく、短時間フーリエ変換(STFT;Short Time Fourier Transform)やウェーブレット変換など周波数領域に変換した信号を表す。よって、一般にこれらは複素変数となることに注意する。本実施形態では、例としてSTFTを取り上げる。この場合、上述の観測信号と音源信号との関係式が成り立つように、インパルス応答に対して十分長いフレーム長を設定する必要がある。このため、例えばフレーム長を4096点、シフト長を2048点とする。
また、参照ステアリングベクトルをセンサの位置座標に依存しないものとして準備する形態を考えることもできる。この形態では、センサを任意の位置に配置することが可能になるため、複数のセンサを具備するシステムであれば、どんなものでも実施することが可能となる。
以上の計算を複数の角度θについて行う。本実施形態では、それぞれの音源の到来方向自体を求めることが目的でないので、参照ステアリングベクトルを用意する際の角度の解像度はΔθ=30°とし、それらの個数は0°から330°までの計12個とした。これにより、音源の位置変化が微小である場合は、そのような位置変化に頑健な分布を取得することができる。しかし、角度の解像度は使用目的や使用状況に応じてより細かい、または粗い解像度に変更してもよい。
方向特性分布は、必ずしもステアリングベクトルを乗算することによって求める必要はなく、例えば非特許文献2で提案されているMUSICスペクトルなどを方向特性分布とみなして代用してもよい。しかしながら、本実施形態では、音源の微小な移動を許容する構成を目指しており、少しの角度の差で分布の値が急峻に変化するような分布は好適でないことに注意する。
例えば、現在の処理フレームにおける分離信号の音声らしさ(パワーの大小、スペクトルエントロピーの大小など)に基づき、音声らしさが高い場合には現在の処理フレームで推定されたpT+1の信頼度が高いと仮定してαの値を小さくする、などの実施形態が考えられる。Tは累積フレーム数(このとき、現在の処理フレームの番号はT+1となることに注意)、pt=[pt,1,…,pt,N]はフレーム番号tにおける方向特性分布である。
以上に説明した類似度を全ての出力信号と分離信号との組み合わせについて求め、類似度が最も高くなる組み合わせ(K個の分離信号が得られるので、その組み合わせの総数はK!=K×(K−1)×…×1通り)を選び、その選択結果を切替制御命令として連結部105に送る。ここではKが小さい場合(2や3など)を想定して全ての組み合わせを考慮したが、Kが大きくなるにつれて組み合わせの総数が多くなる問題がある。そこで、Kが大きい場合には、例えばあるチャネルの類似度の値が、音響環境に依存しない閾値を下回った場合、他のチャネルの類似度の計算を省略して組み合わせの候補から除外するなど、より効率的なアルゴリズムを導入してもよい。
最後に、図1中の連結部105について具体的に説明する。この連結部105では、過去に出力された信号のそれぞれの末尾に、音源分離部102で得られた分離信号を、類似度算出部104から送られた切替制御命令に基づいて1つずつ連結する。
図3は、第2の実施形態に係る信号処理システム100−2の構成を示すブロック図である。図3において、図1と同一部分には同一符号を付して示し、重複する説明を省略する。
本実施形態の信号処理システム100−2は、第1の実施形態により出力された信号について、さらにそれらの相対的な位置関係を付与することができる機能を追加したものとして構成され、第1の実施形態の構成を基本に、方向推定部106及び位置関係付与部107が追加されている。
図5は、第4の実施形態に係る信号処理システム100−4の構成を示すブロック図である。図5において、図1と同一部分には同一符号を付して示し、重複する説明を省略する。
本実施形態では、第1の実施形態またはその派生形に対して、音声区間検出(VAD;Voice Activity Detection)の手法を導入することで、目的音声以外の雑音によって累積分布が意図しないものに更新されてしまうことを防ぐ。具体的には、図5に示すように、音源分離部102で得られた複数の分離信号それぞれに対して、音声区間検出部109で音声区間または非音声区間のいずれかを判定し、音声区間であるとみなされたチャネルに対応する累積分布のみを類似度算出部104で更新し、それ以外のチャネルに対応する累積分布は更新を省略する。
(信号処理システムのユースケース)
これまでに説明した信号処理システムの実際の利用例を説明する。
(ユースケース1:VoC(Voice of Customer)収集システム)
例えば第2の実施形態は、店頭販売や窓口業務を行う店員及びその顧客が対話するケースへの応用が考えられる。これらの話者同士がセンサから見た方向に差を付けて位置する(第1の実施形態で述べた角度の解像度以上の角度の差があることが望ましい)という条件と、相対的な位置により話者を識別するという前提知識(例えば、右側に店員、左側に顧客が位置するものと決める)があれば、当該実施形態を用いることで話者ごとに分けて発話を認識することができる。これを使って音声認識システムと統合することで、お客様の声(VoC;Voice of Customer)のみを選択的に収集したり、店員の応対で発した言葉を収集することで接客マニュアルの改善に役立てたりすることが可能となる。
なお、ここでは店員と顧客という2種類の役割を持った人物を想定したが、必ずしも話者の数はそれぞれ1人ずつの計2人に限定されるものではなく、合計で3人以上の話者が登場する場合に応用することもできる。
例えば第2の実施形態は、互いに異なる言語を話す話者同士のコミュニケーションを支援するために複数言語を同時に翻訳するシステムなどに応用できる。話者同士がセンサから見た方向に差を付けて位置するという条件と、相対的な位置により言語を区別するという前提知識(例えば、右側に日本語話者、左側に英語話者が位置するものと決める)があれば、当該実施形態を用いることで話者ごとに分けて発話を認識および翻訳することができる。以上の動作をなるべく少ない遅延時間で実現することにより、相手の言語についての知識が無い場合であってもコミュニケーションをとることが可能になる。
複数の楽器が同時に音を奏でる合奏音を、本システムを用いて分離するという応用も考えられる。楽器ごとに方向の差を付けて空間内に配置し、第1または第2の実施形態またはその派生形態を適用すれば、楽器ごとに分離された信号を複数同時に得ることができる。このシステムは、出力された信号をスピーカやヘッドホン等を通して聴くことで、演奏家や指揮者が楽器ごとの演奏を確認したり、後段に自動採譜システムを連結させることで未知の楽曲を楽器ごとに採譜したりするなどの効果が期待できる。
次に、第1〜第4の実施形態にかかる信号処理システムのハードウェア構成について説明する。この構成は、図6に示すように、CPU(Central Processing Unit)などの制御装置201と、ROM(Read Only Memory)などのプログラム記憶装置202と、RAM(Random Access Memory)などの作業用記憶装置203、各部を接続するバス204、センサ部101からの観測信号の入力、連結信号の出力を行うインターフェース装置205とを備えている。
さらに、図7に示すように、第1〜第4の実施形態に係る信号処理システムで実行されるプログラムを、インターネット等のネットワーク301に接続されたコンピュータ(サーバ)302に格納し、ネットワーク経由で、第1〜第4の実施形態に係る信号処理システムの処理機能を有する通信端末303にダウンロードさせることにより提供するように構成してもよい。また、そのプログラムをネットワーク経由で提供または配布するように構成してもよい。また、ネットワーク経由でコンピュータ302に通信端末303からセンサ出力を送り、分離連結された出力信号を通信端末303が受け取るように、サーバ・クライアント構成で実現することも可能である。
101…センサ部、102…音源分離部、103…方向特性分布算出部、104…類似度算出部、105…連結部、106…方向推定部、107…位置関係付与部、108…通知ボタン、109…音声区間検出部、
201…CPU、202…ROM、203…RAM、204…バス、205…インターフェース装置、
301…ネットワーク、302…コンピュータ、303…通信端末。
Claims (5)
- 複数の信号源の発生信号を観測し受信するセンサ装置と、
フレーム単位ごとに前記センサ装置の受信信号から分離フィルタを推定し、この分離フィルタに基づいて受信信号を分離して複数のチャネルから分離信号を出力する分離装置と、
前記分離フィルタに基づき前記複数のチャネルの分離信号毎に方向特性分布を計算する第1算出装置と、
前記分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれについての方向特性分布を表す累積分布を求め、前記現在のフレームの分離信号の方向特性分布との類似度を算出する第2算出装置と、
前記複数のチャネルの分離信号毎に前記類似度に基づいて前記複数のチャネルの分離信号から選択した一つの信号に連結して出力する連結装置と
を具備する信号処理システム。 - 前記分離装置で推定された分離フィルタに基づいて、前記複数のチャネルの分離信号それぞれについて、対応する信号源からの到来方向を推定する推定装置と、
前記分離装置で得られる複数のチャネルの分離信号それぞれに前記推定装置で推定される到来方向に基づく位置関係の情報を付与する付与装置と
をさらに備える請求項1記載の信号処理システム。 - 前記複数のチャネルの分離信号それぞれについて信号の発生区間、非発生区間を判定する判定装置を備え、
前記第2算出装置は、前記判定装置で発生区間であるとみなされたチャネルに対応する累積分布のみを更新する請求項1記載の信号処理システム。 - 複数の信号源の発生信号を観測して受信信号を取得し、
フレーム単位ごとに前記受信信号から分離フィルタを推定し、この分離フィルタに基づいて前記受信信号を分離して複数のチャネルから分離信号を出力し、
前記分離フィルタに基づき前記複数のチャネルから出力される分離信号毎に方向特性分布を計算し、
前記分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれについての方向特性分布を表す累積分布を求め、前記現在のフレームの分離信号の方向特性分布との類似度を算出し、
前記複数のチャネルの分離信号毎に前記類似度に基づいて前記複数のチャネルの分離信号から選択した一つの信号に連結して出力する信号処理方法。 - 複数の信号源の発生信号を観測した受信信号から前記複数の信号源からの受信信号を分離出力する処理をコンピュータに実行させるための信号処理プログラムであって、
フレーム単位ごとに前記受信信号から分離フィルタを推定し、この分離フィルタに基づいて前記受信信号を分離して複数のチャネルから分離信号を出力する分離ステップと、
前記分離フィルタに基づき前記複数のチャネルの分離信号毎に方向特性分布を算出する第1算出ステップと、
前記分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれの方向特性分布を表す累積分布を求め、前記現在のフレームの分離信号の方向特性分布との類似度を算出する第2算出ステップと、
前記複数のチャネルの分離信号毎に前記類似度に基づいて前記複数のチャネルの分離信号から選択した一つの信号に連結して出力する連結ステップと
を具備する信号処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017055096A JP6591477B2 (ja) | 2017-03-21 | 2017-03-21 | 信号処理システム、信号処理方法及び信号処理プログラム |
CN201710767915.9A CN108630222B (zh) | 2017-03-21 | 2017-08-31 | 信号处理系统以及信号处理方法 |
US15/705,165 US10262678B2 (en) | 2017-03-21 | 2017-09-14 | Signal processing system, signal processing method and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017055096A JP6591477B2 (ja) | 2017-03-21 | 2017-03-21 | 信号処理システム、信号処理方法及び信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018156052A JP2018156052A (ja) | 2018-10-04 |
JP6591477B2 true JP6591477B2 (ja) | 2019-10-16 |
Family
ID=63583547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017055096A Active JP6591477B2 (ja) | 2017-03-21 | 2017-03-21 | 信号処理システム、信号処理方法及び信号処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10262678B2 (ja) |
JP (1) | JP6591477B2 (ja) |
CN (1) | CN108630222B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6472823B2 (ja) | 2017-03-21 | 2019-02-20 | 株式会社東芝 | 信号処理装置、信号処理方法および属性付与装置 |
EP4220639A1 (en) * | 2018-10-26 | 2023-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
CN110111808B (zh) * | 2019-04-30 | 2021-06-15 | 华为技术有限公司 | 音频信号处理方法及相关产品 |
CN112420071B (zh) * | 2020-11-09 | 2022-12-02 | 上海交通大学 | 一种基于恒q变换的复调电子琴音乐音符识方法 |
CN112863537B (zh) * | 2021-01-04 | 2024-06-04 | 北京小米松果电子有限公司 | 一种音频信号处理方法、装置及存储介质 |
CN113077803B (zh) * | 2021-03-16 | 2024-01-23 | 联想(北京)有限公司 | 一种语音处理方法、装置、可读存储介质及电子设备 |
CN113608167B (zh) * | 2021-10-09 | 2022-02-08 | 阿里巴巴达摩院(杭州)科技有限公司 | 声源定位方法、装置及设备 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007215163A (ja) | 2006-01-12 | 2007-08-23 | Kobe Steel Ltd | 音源分離装置,音源分離装置用のプログラム及び音源分離方法 |
JP2008039639A (ja) * | 2006-08-08 | 2008-02-21 | Hioki Ee Corp | 接触式計測用プローブ |
JP5117012B2 (ja) | 2006-08-09 | 2013-01-09 | 株式会社東芝 | 方向探知システム及び信号抽出方法 |
JP4449987B2 (ja) * | 2007-02-15 | 2010-04-14 | ソニー株式会社 | 音声処理装置、音声処理方法およびプログラム |
JP4649437B2 (ja) * | 2007-04-03 | 2011-03-09 | 株式会社東芝 | 信号分離抽出装置 |
GB0720473D0 (en) | 2007-10-19 | 2007-11-28 | Univ Surrey | Accoustic source separation |
CN102138176B (zh) * | 2008-07-11 | 2013-11-06 | 日本电气株式会社 | 信号分析装置、信号控制装置及其方法 |
CN102687536B (zh) * | 2009-10-05 | 2017-03-08 | 哈曼国际工业有限公司 | 用于音频信号的空间提取的系统 |
JP2012184552A (ja) * | 2011-03-03 | 2012-09-27 | Marutaka Kogyo Inc | 解体工法 |
JP6005443B2 (ja) | 2012-08-23 | 2016-10-12 | 株式会社東芝 | 信号処理装置、方法及びプログラム |
JP5911101B2 (ja) | 2012-08-30 | 2016-04-27 | 日本電信電話株式会社 | 音響信号解析装置、方法、及びプログラム |
US9286897B2 (en) * | 2013-09-27 | 2016-03-15 | Amazon Technologies, Inc. | Speech recognizer with multi-directional decoding |
GB2521175A (en) * | 2013-12-11 | 2015-06-17 | Nokia Technologies Oy | Spatial audio processing apparatus |
EP3127115B1 (en) * | 2014-03-31 | 2019-07-17 | Sony Corporation | Method and apparatus for generating audio content |
JP6463904B2 (ja) * | 2014-05-26 | 2019-02-06 | キヤノン株式会社 | 信号処理装置及び音源分離方法及びプログラム |
CN105989852A (zh) * | 2015-02-16 | 2016-10-05 | 杜比实验室特许公司 | 分离音频源 |
JP6501260B2 (ja) * | 2015-08-20 | 2019-04-17 | 本田技研工業株式会社 | 音響処理装置及び音響処理方法 |
-
2017
- 2017-03-21 JP JP2017055096A patent/JP6591477B2/ja active Active
- 2017-08-31 CN CN201710767915.9A patent/CN108630222B/zh active Active
- 2017-09-14 US US15/705,165 patent/US10262678B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108630222B (zh) | 2021-10-08 |
CN108630222A (zh) | 2018-10-09 |
US10262678B2 (en) | 2019-04-16 |
JP2018156052A (ja) | 2018-10-04 |
US20180277140A1 (en) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6591477B2 (ja) | 信号処理システム、信号処理方法及び信号処理プログラム | |
US10901063B2 (en) | Localization algorithm for sound sources with known statistics | |
EP3320692B1 (en) | Spatial audio processing apparatus | |
JP3522954B2 (ja) | マイクロホンアレイ入力型音声認識装置及び方法 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
CN110148422B (zh) | 基于传声器阵列确定声源信息的方法、装置及电子设备 | |
TWI530201B (zh) | 經由自抵達方向估值提取幾何資訊之聲音擷取技術 | |
JP5702685B2 (ja) | 音源方向推定装置及び音源方向推定方法 | |
JP5931661B2 (ja) | 音源方向推定装置、音源方向推定方法、及び音源方向推定プログラム | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
CN111863015A (zh) | 一种音频处理方法、装置、电子设备和可读存储介质 | |
JP2019004465A (ja) | 収音装置、及び収音方法 | |
CN105580074B (zh) | 信号处理系统和方法 | |
JP2018169473A (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP5451562B2 (ja) | 音響処理システム及びこれを用いた機械 | |
JP2017067948A (ja) | 音声処理装置および音声処理方法 | |
JP7266433B2 (ja) | 音源定位装置、音源定位方法、およびプログラム | |
JP3862685B2 (ja) | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム | |
Bai et al. | Acoustic source localization and deconvolution-based separation | |
JP6961545B2 (ja) | 音信号処理装置、音信号処理方法、およびプログラム | |
Gburrek et al. | On source-microphone distance estimation using convolutional recurrent neural networks | |
WO2019235194A1 (ja) | 音響信号分離装置、学習装置、それらの方法、およびプログラム | |
CN108781317B (zh) | 利用线性传感器阵列检测非相关信号分量的方法和装置 | |
JP7000281B2 (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
JP3015516B2 (ja) | 類別認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190918 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6591477 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |