JP2018156052A - 信号処理システム、信号処理方法及び信号処理プログラム - Google Patents

信号処理システム、信号処理方法及び信号処理プログラム Download PDF

Info

Publication number
JP2018156052A
JP2018156052A JP2017055096A JP2017055096A JP2018156052A JP 2018156052 A JP2018156052 A JP 2018156052A JP 2017055096 A JP2017055096 A JP 2017055096A JP 2017055096 A JP2017055096 A JP 2017055096A JP 2018156052 A JP2018156052 A JP 2018156052A
Authority
JP
Japan
Prior art keywords
signal
separation
signals
separated
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017055096A
Other languages
English (en)
Other versions
JP6591477B2 (ja
Inventor
増田 太郎
Taro Masuda
太郎 増田
谷口 徹
Toru Taniguchi
徹 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2017055096A priority Critical patent/JP6591477B2/ja
Priority to CN201710767915.9A priority patent/CN108630222B/zh
Priority to US15/705,165 priority patent/US10262678B2/en
Publication of JP2018156052A publication Critical patent/JP2018156052A/ja
Application granted granted Critical
Publication of JP6591477B2 publication Critical patent/JP6591477B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Otolaryngology (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 同一のチャネルに常に同一の信号源に由来する発生信号を出力し続ける。【解決手段】 実施形態に係る信号処理システムにおいて、センサ装置は、複数の信号源の発生信号を観測して受信信号を取得し、分離装置は、フレーム単位ごとにセンサ装置の受信信号から分離フィルタを推定し、この分離フィルタに基づいて受信信号を分離して複数のチャネルから出力し、第1算出装置は、分離フィルタに基づき複数のチャネルの分離信号毎に方向特性分布を計算し、第2算出装置は、分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれの方向特性分布を表す累積分布を求め、現在のフレームの分離信号の方向特性分布との類似度を算出し、連結装置は、複数のチャネルの分離信号毎に類似度に基づいて複数のチャネルの分離信号から選択した一つの信号に連結して出力する。【選択図】図1

Description

本実施形態は、信号処理システム、信号処理方法及び信号処理プログラムに関する。
従来より、会議システム等の信号処理システムでは、多チャネルの音源を対象として収録した音響信号から任意の音源の音響信号を分離する多チャネル音源分離技術が採用されている。この多チャネル音源分離技術では、一般的に、音源ごとに分離された音響信号同士を比較し、その比較結果に基づいて分離度(独立性など)を高くして、分離すべき音響信号を推定するアルゴリズムが用いられている。このとき、音響環境に依存した閾値を予め設定することで方向特性のピークを検出し、そのピーク検出結果に基づいて分離した音源の音響信号と対応する音源とを連結している。
ところが、実際の運用にあっては、必ずしも1つのチャネルに1つの音源のみの音響信号が適切に集音され続けるとは限らない。なぜならこのことから、例えばある処理フレームにおいて分離された音響信号の中から任意の2つの信号を選択出力する際に、それぞれの出力端(以下、チャネルと呼ぶこともある)に割り振るチャネル番号を入れ替えても、出力される信号同士を比較した分離度を基準とする目的関数の値は変わらないからである。実際に、音源分離のシステムを使い続けると、ある音源の音響信号を出力し続けていたチャネルに、別の音源の音響信号が出力されるように切り替わることが現象として起こる。この現象は、音源分離に失敗したというわけではなく、上述のように出力されるチャネル番号に関する不定性が残っていることに起因する。
特開2008−39693号公報 特開2014−41308号公報
"非同期分散マイクロホンアレイに基づく音響信号処理"、小野順貴、宮部滋樹、牧野昭二、日本音響学会誌70巻7号、pp.391-396, 2014。 "Multiple Emitter Location and Signal Parameter Estimation," Ralph O. Schmidt, IEEE Transactions on Antennas and Propagation, Vol. AP-34, No. 3, March 1986.
"Color Indexing," Michael J. Swain, Dana H. Ballard, International Journal on Computer Vision, 7:1, II-32, 1991.
"A Tutorial on Onset Detection in Music Signals," J.P. Bello ; L. Daudet ; S. Abdallah ; C. Duxbury ; M. Davies ; M.B. Sandler, IEEE Transactions on Speech and Processing, Vol:13, Issue:5, Sept. 2005.
以上のように、従来の多チャネル信号源分離技術に基づく信号処理システムでは、必ずしも1つのチャネルに1つの信号源のみの発生信号が適切に収集され続けるとは限らず、ある信号源の発生信号を出力し続けていたチャネルに、別の信号源の発生信号が出力されるように切り替わることが起こるという課題がある。
本実施形態は上記課題に鑑みなされたもので、多チャネル信号源分離処理において、同一のチャネルに常に同一の信号源に由来する発生信号を出力し続けることのできる信号処理システム、信号処理方法及び信号処理プログラムを提供することを目的とする。
実施形態によれば、センサ装置と、分離装置と、第1算出装置と、第2算出装置と、連結装置とを備える。センサ装置は、複数の信号源の発生信号を観測して受信信号を取得し、分離装置は、フレーム単位ごとにセンサ装置の受信信号から分離フィルタを推定し、この分離フィルタに基づいて受信信号を分離して複数のチャネルから出力し、第1算出装置は、分離フィルタに基づき複数のチャネルの分離信号毎に方向特性分布を計算し、第2算出装置は、分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれの方向特性分布を表す累積分布を求め、現在のフレームの分離信号の方向特性分布との類似度を算出し、連結装置は、複数のチャネルの分離信号毎に類似度に基づいて複数のチャネルの分離信号から選択した一つの信号に連結して出力する。これにより時間的に連続な出力信号を得る。
第1の実施形態に係る信号処理システムの構成を示すブロック図。 第1の実施形態に係る信号処理システムの処理を説明するための座標系を示す概念図。 第2の実施形態に係る信号処理システムの構成を示すブロック図。 第3の実施形態に係る信号処理システムの構成を示すブロック図。 第4の実施形態に係る信号処理システムの構成を示すブロック図。 第1〜第4の実施形態に係る信号処理システムをコンピュータ装置によって実現する構成を示すブロック図。 第1〜第4の実施形態に係る信号処理システムをネットワークシステムによって実現する構成を示すブロック図。
以下、本発明に係る実施形態について、図面を参照して説明する。
(第1の実施形態)
図1は、第1の実施形態に係る信号処理システム100−1の構成を示すブロック図である。この信号処理システム100−1は、センサ部101と、音源分離部102と、方向特性分布算出部103と、類似度算出部104と、連結部105とを備える。
上記センサ部101は、複数のセンサによって観測される観測信号が重ね合わさったものを受信する。上記音源分離部102は、一定時間に基づくフレーム単位ごとに、センサ部101で受信された信号から観測信号同士を分離するフィルタとしての働きを持つ分離行列を推定し、その分離行列に基づいて受信信号から複数の信号を分離し、各分離信号を出力する。上記方向特性分布算出部103は、音源分離部102で推定された分離行列から各分離信号の方向特性分布を算出する。上記類似度算出部104は、現在の処理フレームの方向特性分布と過去に算出された方向特性分布の累積分布との類似度を算出する。上記連結部105は、類似度算出部104で算出された類似度の値に基づいてそれぞれの現在の処理フレームの分離信号を過去の出力信号に連結させる。
第1の実施形態に係る信号処理システム100−1は、音源分離処理によって分離された複数の出力信号から、それぞれの出力信号に対応する音源の到来方向を推定する技術を提案する。この技術は、例えば、分離行列から間接的に求められるステアリングベクトルと、予め用意した複数の方向から信号が到来したと仮定したときの参照ステアリングベクトルとを乗算し、その値の大小で到来方向を判断する。その際、到来方向を音響環境の変化に頑健に求めることは必ずしも容易ではない。
そこで、第1の実施形態に係る信号処理システム100−1では、各分離信号の到来方向を直接求めるのではなく、方向特性分布を使って過去のフレームまでに出力された信号と現在の処理フレームにおける分離信号とを連結させる。このように方向特性分布を使うことで、音響環境の変化に応じた閾値調整が不要になる効果がある。
なお、以下の実施形態では、音波を観測して音響信号を処理する例について言及するが、観測及び処理する信号は必ずしも音響信号に限らず、電波などの他の種類の信号に適用してもよい。
第1の実施形態に係る信号処理システムの具体的な処理動作を説明する。
上記センサ部101は、複数チャネルのセンサ(例えばマイクロフォン)を備え、各センサは収録環境において存在する全ての音源から到来する音響信号が重ね合わされた信号を観測する。上記音源分離部102は、センサ部101から観測信号を受け取り、センサのチャネル数と同数の音響信号に分離し、分離信号として出力する。ここで出力される分離信号は、信号同士の分離度が高くなる基準を用いて学習された分離行列を観測信号に乗算することによって得られる。
上記方向分布算出部103は、音源分離部102で求められた分離行列を利用して、それぞれの分離信号の方向特性分布を計算する。分離行列には、各音源の空間特性情報が含まれているため、その情報を抽出することで、それぞれの分離信号の様々な角度における「その角度から到来したという確信度」を算出することができる。この確信度を方向特性と呼ぶ。この方向特性を広範囲の角度について求めることで得られる分布のことを方向特性分布と呼ぶ。
上記類似度算出部104は、方向特性分布算出部103で求められた方向特性分布を用いて、過去の複数の分離信号から別途算出した方向特性分布との類似度を算出する。過去の複数の分離信号から算出した方向特性分布のことを「累積分布」と呼ぶ。累積分布は、現在の処理フレームよりも前の分離信号の方向特性分布に基づいて算出され、類似度算出部104で保持される。類似度算出部104は、類似度の計算結果から、過去の分離信号の末尾に現在の処理フレームの分離信号を追加するための切替制御命令を連結部105に送る。
上記連結部105では、類似度算出部104から送られる切替制御命令に基づいて、現在の処理フレームの分離信号それぞれを、過去の出力信号いずれか1つの末尾に1つずつ連結させる。
以上に説明した各処理部(102〜105)は、例えばCPU(Central Processing Unit)などのコンピュータ装置にプログラムを実行させること、すなわちソフトウェアとして実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェアとハードウェアを併用して実現してもよい。以降の実施形態で説明する各処理部についても同様のことが言える。
次に、本実施形態についてさらに詳述する。
まず、図1中のセンサ部101について具体的に説明する。
センサ部101が備える各センサは任意の位置に配置することが可能であるが、ある1つのセンサが別の1つのセンサの受信口を塞がないように注意する必要がある。センサの個数Mは2以上とする。なお、M≧3のとき、ある一直線上に音源が並んでいない(音源座標が2次元的に配置されている)場合は、センサも一直線上に並ぶことがないように2次元的に配置すると、後段の音源分離において好適である。一方、M=2のときは、2つの音源を結ぶ線分上にセンサが並んでいる方が好適である。
また、センサ部101ではA/D変換により、アナログ量である音波をデジタル信号に変換する機能も備えているものとし、以下では一定の周期でサンプリングされたデジタル信号を扱うものとする。本実施形態では、例として音声信号の処理に応用することを考え、音声が存在する帯域の大半をカバーできるようにサンプリング周波数を16kHzとするが、用途に応じて変更してもよい。また、センサ間でのサンプリングは、原則として同一クロックによりサンプリングされる必要があるが、例えば非特許文献1のように、非同期のサンプリングによるセンサ間のミスマッチを補償する処理を加えて、同一クロックの観測信号が回復されたもので代替することもできる。
次に、図1中の音源分離部102について具体例に説明する。
いま、周波数ω、時刻tにおける音源信号をSω,t、センサ部101で観測された観測信号をXω,tとおく。音源信号Sω,tはK次元のベクトル量であり、各要素には単独の音源信号が含まれているものと考える。一方、観測信号Xω,tはM次元のベクトル量であり(Mはセンサの個数)、その各要素には上記の音源から到来した音波が複数重ね合わされた値が含まれる。このとき、両者は
Figure 2018156052
という線形の式でモデル化されるものとする。ここで、A(ω,t) は次元が(K×M)の行列である混合行列と呼ばれ、音響信号の空間伝搬の特徴を表す。
時不変な系であれば、混合行列A(ω,t) は時間に依存しない量となるが、実際には音源やセンサアレイの位置変化などの音響条件の変化が伴うため、一般的には時変な量である。なお、X及びSは時間領域の信号ではなく、短時間フーリエ変換(STFT;Short Time Fourier Transform)やウェーブレット変換など周波数領域に変換した信号を表す。よって、一般にこれらは複素変数となることに注意する。本実施形態では、例としてSTFTを取り上げる。この場合、上述の観測信号と音源信号との関係式が成り立つように、インパルス応答に対して十分長いフレーム長を設定する必要がある。このため、例えばフレーム長を4096点、シフト長を2048点とする。
本実施形態では、次に、センサで観測した観測信号Xω,tに対し、元の音源信号を復元するために乗算する分離行列W(ω,t)(次元はK×M)を推定する。この推定は、
Figure 2018156052
で表される。ここで、
Figure 2018156052
は左辺の量が右辺の量で近似できることを表す。(2)式に従って、各処理フレームごとに分離された信号Sを取得することができる。(1)式と(2)式を見比べると分かる通り、混合行列A(ω,t) と分離行列W(ω,t) とは、次式に示すように、互いに疑似的な逆行列(以下、疑似逆行列)の関係になっている。
Figure 2018156052
本実施形態では、混合行列A(ω,t) と分離行列W(ω,t) は正方行列、すなわちK=Mとしているが、擬似逆行列を求めるアルゴリズムなどで代用すること、すなわちK≠Mの実施形態を構成することもできる。上述の通り混合行列A(ω,t) が時変な量であると考えるので、分離行列W(ω,t) も時変な量である。仮に時不変な系とみなせる環境であっても、実時間で本実施形態により出力された信号を利用したい場合は、短い時間間隔で分離行列W(ω,t) を逐次更新していく分離手法が必要となる。
そこで、本実施形態では、特許文献2のオンライン化された独立ベクトル分析法を採用する。但し、空間特性に基づくフィルタリングの働きをする分離フィルタを求める実時間での処理が可能な音源分離アルゴリズムであれば、これに置き換えてもよい。独立ベクトル分析法では、分離行列が、それぞれの分離される信号同士の独立性を高くするように更新される分離法を用いる。この分離法を用いる利点は、事前情報を全く使わずに音源分離を実現できるという点であり、事前に音源の位置やインパルス応答を計測するなどの処理が不要となる。
独立ベクトルによる分析法において、パラメタは全て文献にて推奨されている値を用いる(忘却係数=0.96、形状パラメタ=1.0(音源信号をLaplace分布で近似することに相当)、フィルタ更新繰り返し回数=2)が、これらについても値を変更してもよいものとする。例えば音源信号を時変ガウス分布で近似することなどの変形が考えられる(形状パラメタ=0とすることに相当)。求められた分離行列は、後段の方向特性分布計算部103(図1を参照)で用いる。
次に、図1中の方向特性分布計算部103について具体的に説明する。ここではまず、(3)式に基づいて、分離行列Wを混合行列Aに変換する。これにより求められた混合行列Aの各列ベクトルak=[a1k,…,aMkT(1≦k≦K)をステアリングベクトルと呼ぶ。ここでTは行列の転置を表す。ステアリングベクトルのm番目の要素amk(1≦m≦M)は、k番目の音源からm番目のセンサに発せられた信号の振幅の減衰や位相に関する特徴を含む。例えば、akの要素間の絶対値の比は、k番目の音源が発した信号のセンサ間の振幅比を表し、またそれらの位相の差は音波のセンサ間の位相差に対応する。したがって、ステアリングベクトルに基づいて、センサから見た音源の位置情報を得ることができる。ここでは、事前に様々な角度について求めた参照ステアリングベクトルと、分離行列から求めたステアリングベクトルakとの類似度に基づいた情報を用いる。
次に、前記の参照ステアリングベクトルの算出方法を説明する。ここでは、信号が平面波であると近似した場合のステアリングベクトルの算出法について説明するが、平面波に限らず、例えば球面波としてモデル化した場合に算出されるステアリングベクトルを用いてもよい。また、ここでは位相差の特徴のみを反映したステアリングベクトルを算出する方法について説明するが、これに限らず、例えば振幅差を考慮したステアリングベクトルを算出してもよい。
平面波がM個のセンサに到来したとき、ある信号の到来方位角をθと表すと、位相差のみを考慮したときのステアリングベクトルは理論的には
Figure 2018156052
と計算できる。ここでjは虚数単位、ωは周波数、Mはセンサの数、Tは行列の転置を表す。また、原点に対するm番目のセンサ(1≦m≦M)での遅延時間τmは、以下のように算出できる。
Figure 2018156052
ここでt[℃]は実施環境における空気の温度である。本実施形態ではt=20℃と固定するが、これに限らず実施環境に応じて変更してもよい。また、(5)式の右辺の分母は音速[m/s]を求める計算に相当しているので、事前に他の方法で音速が推定できる場合はその推定値で置き換えてもよい(例:温度計で測定した気温に基づいて推定する、など)。rm T、eθはそれぞれm番目のセンサの座標(3次元のベクトルだが、特定の平面のみを考える場合は2次元としてもよい)、特定の方向θを示す単位ベクトル(大きさが1のベクトル)である。本実施形態では、例として図2に示すようなx−y座標系を考える。この場合は、
Figure 2018156052
となるが、必ずしも座標系の設定はこれに限らず任意に設定できるものとする。
また、参照ステアリングベクトルをセンサの位置座標に依存しないものとして準備する形態を考えることもできる。この形態では、センサを任意の位置に配置することが可能になるため、複数のセンサを具備するシステムであれば、どんなものでも実施することが可能となる。
後述の類似度計算において、(5)式で求められる遅延時間の基準値を予め定めておく必要がある。本実施形態では、以下の(7)式の通り、センサ番号m=1における遅延時間τを基準値とする。
Figure 2018156052
なお、記号「←」は、「右辺の値を用いて左辺の値を更新する」という意味を持つ。
以上の計算を複数の角度θについて行う。本実施形態では、それぞれの音源の到来方向自体を求めることが目的でないので、参照ステアリングベクトルを用意する際の角度の解像度はΔθ=30°とし、それらの個数は0°から330°までの計12個とした。これにより、音源の位置変化が微小である場合は、そのような位置変化に頑健な分布を取得することができる。しかし、角度の解像度は使用目的や使用状況に応じてより細かい、または粗い解像度に変更してもよい。
実際の分離行列から算出されたK個のステアリングベクトルakは、複数の周波数帯をまとめた特徴量とする。この理由は、例えば特定の周波数帯に存在する雑音の影響で音声に関するステアリングベクトルが精度よく求められなかった場合、別の周波数帯でのステアリングベクトルが精度よく推定できていれば、その雑音の影響を低減させることができるからである。この連結処理は必ずしも必要ではなく、後述する類似度を算出する際に、例えばそれぞれの周波数ごとに求めた類似度の中から信頼できるものを取捨選択するような手法に置き換えてもよい。
以上により求められた参照ステアリングベクトルと、実際の分離行列から算出されたステアリングベクトルaとの類似度Sを(8)式に基づき求める。本実施形態では類似度計算においてコサイン類似度を採用したが、これに限らず例えばベクトル間のユークリッド距離を求め、それらの大小関係を逆転させたものなどを類似度と定義してもよい。
Figure 2018156052
類似度Sは非負の実数値であり、Sの値は必ず0≦S(θ)≦1という範囲に収まり、扱いが簡単になる。但し、類似度Sを定義する際に、それらの大小が判定できる実数値になっているのであれば、必ずしも同様の値の範囲に制限する必要はない。
以上の類似度を複数の角度θについて求めてまとめたものpを、現在の処理フレームの分離信号に関する方向特性分布と定義する。
Figure 2018156052
ただし、Nは角度インデックスの総数であり、上述の通り30°おきに0°から330°までを考える場合N=12となる。
方向特性分布は、必ずしもステアリングベクトルを乗算することによって求める必要はなく、例えば非特許文献2で提案されているMUSICスペクトルなどを方向特性分布とみなして代用してもよい。しかしながら、本実施形態では、音源の微小な移動を許容する構成を目指しており、少しの角度の差で分布の値が急峻に変化するような分布は好適でないことに注意する。
以上のようにして求められた方向特性分布は、従来技術においては、その後段で各分離信号の方向を推定するために使われる。一方、本実施形態では、それぞれの分離信号の方向を直接推定することなく、過去の出力信号と現在の処理フレームの分離信号とを連結する。
次に、図1中の類似度算出部104について具体的に説明する。このブロックでは、方向特性分布算出部103によって求められた、分離信号それぞれについての方向特性分布情報に基づき、過去の複数の出力信号の中から現在の処理フレームの分離信号と連結する組み合わせ最適な問題を解くための類似度を計算する。本実施形態では、類似度計算の結果が高くなるような組み合わせを選ぶという方式を採用するが、例えば類似度の代わりに距離を使い、距離計算の結果が小さくなるような組み合わせを選ぶという問題に置き換えてもよい。
次に、現在の処理フレームよりも過去の分離信号についての累積分布の計算方法を説明する。本実施形態では、音源やマイクアレイの移動などを考慮して、過去の処理フレームで推定された方向位特性分布の情報を時間経過とともに忘却していく忘却係数を導入する。すなわち、あるαという正の実数値(0より大きく1より小さい値とする)に対して
Figure 2018156052
と推定する。このαは固定値として設定してもよいし、あるいは方向特性分布以外の情報に基づいて値を時間変化させてもよい。
例えば、現在の処理フレームにおける分離信号の音声らしさ(パワーの大小、スペクトルエントロピーの大小など)に基づき、音声らしさが高い場合には現在の処理フレームで推定されたpT+1の信頼度が高いと仮定してαの値を小さくする、などの実施形態が考えられる。Tは累積フレーム数(このとき、現在の処理フレームの番号はT+1となることに注意)、pt=[pt,1,…,pt,N]はフレーム番号tにおける方向特性分布である。
また、累積分布の算出方法の変形として、処理開始フレームから現在よりも1つ前までの全ての処理フレームにおける方向特性分布pの和を累積分布として用いたり、例えば考慮する過去のフレームの数を限定するなどの手法の変更を行ってもよい。当該の実施形態での累積分布ppast(T)の求め方を式で示すと以下のようになる。
Figure 2018156052
この場合、T個のフレームpの分布を累積したため、ppast(T)=[ppast,1,…,ppast,N]は一般にpT+1よりも大きな値を取る。このままでは、値のスケールが互いに異なるため、類似度計算に適さない。そこで、以下の式のような正規化処理を施す。
Figure 2018156052
Figure 2018156052
これはヒストグラムを正規化するものと同様の計算式になっている(全ての成分の総和が1になる)が、類似度計算に好適な処理であれば、例えば両者のユークリッドノルムを1に正規化する処理や,各成分から最小の成分を引いて最小値を0にする正規化、平均値で引くことで平均を0にする正規化など、他の正規化の手法で置き換えてもよい。
次に、現在の処理フレームから算出した方向特性分布と、過去の処理フレームから算出した累積分布との類似度を計算する手法を説明する。2つの分布p1 =[p11,…,p1N]、ppast =[p21,…,p2N]の間の類似度Iは以下の(14)式で計算できる。
Figure 2018156052
本実施形態では、非特許文献3に記載のヒストグラム交差法を用いたが、他にもカイ二乗距離、Bhattacharyya距離など分布同士の類似度または距離を適切に計算できるものであればどのようなもので代用してもよい。例えば、より単純に、以下の式のようなノルムDなどを距離尺度として用いてもよい。
Figure 2018156052
例えばl=1の場合はL1ノルム(マンハッタン距離),l=2の場合はL2ノルム(ユークリッド距離)として知られる距離である。
以上に説明した類似度を全ての出力信号と分離信号との組み合わせについて求め、類似度が最も高くなる組み合わせ(K個の分離信号が得られるので、その組み合わせの総数はK!=K×(K−1)×…×1通り)を選び、その選択結果を切替制御命令として連結部105に送る。ここではKが小さい場合(2や3など)を想定して全ての組み合わせを考慮したが、Kが大きくなるにつれて組み合わせの総数が多くなる問題がある。そこで、Kが大きい場合には、例えばあるチャネルの類似度の値が、音響環境に依存しない閾値を下回った場合、他のチャネルの類似度の計算を省略して組み合わせの候補から除外するなど、より効率的なアルゴリズムを導入してもよい。
なお、本実施形態で一番初めに処理するフレームにおいては、方向特性分布は前述の累積分布を算出するためのみに使われ、またその場合において後述の連結部105での処理は省略することができる。
最後に、図1中の連結部105について具体的に説明する。この連結部105では、過去に出力された信号のそれぞれの末尾に、音源分離部102で得られた分離信号を、類似度算出部104から送られた切替制御命令に基づいて1つずつ連結する。
但し、連結処理された周波数領域での信号を、例えば逆短時間フーリエ変換(ISTFT;Inverse Short Time Fourier Transform)などを用いて時間領域に逆変換して利用したい場合には、フレーム毎に得られた時間信号をそのまま連結させると不連続性が生じる懸念がある。そこで、例えば重畳加算法(あるフレームの末端部とその次のフレームの先頭部とを一部重複させ、それらの重み付き和として出力信号を表現する)などの手法を用いて、出力信号が滑らかになることを保証するなどの処理を追加する。
(第2の実施形態)
図3は、第2の実施形態に係る信号処理システム100−2の構成を示すブロック図である。図3において、図1と同一部分には同一符号を付して示し、重複する説明を省略する。
本実施形態の信号処理システム100−2は、第1の実施形態により出力された信号について、さらにそれらの相対的な位置関係を付与することができる機能を追加したものとして構成され、第1の実施形態の構成を基本に、方向推定部106及び位置関係付与部107が追加されている。
上記方向推定部106は、音源分離部102で求められた分離行列に基づき、それぞれの分離信号についての位置関係を決定する。すなわち、k番目の分離信号に対応する方位特性分布を
Figure 2018156052
とする。ここで、θnはn番目(1≦n≦N)の参照ステアリングベクトルが代表する角度である。方向推定部106では、これらの方向特性分布の中から、その信号の大まかな到来方向を以下の式により推定する。
Figure 2018156052
(17)式ではpkが最大となる角度インデックスを取得する方式だが、これに限らず例えば、当該角度インデックスおよび隣り合う角度インデックスのpkの和を最大化するようなθを求めるなどの変更を加えてもよい。
以上の(17)式から求められた到来方向の情報は、位置関係付与部107でそれぞれの出力信号に付与される。ここで付与された角度の情報に関して、必ずしもその絶対値そのものを利用するとは限らないことに注意する。例えば第1の実施形態では、参照ステアリングベクトルの角度の解像度をΔθ=30°としていたが、この実施形態はそもそも高精度な方向推定を目指していない。その代わり、相対的に右側または左側に音源が位置している、という情報だけ取得できれば、応用シーンにおいて十分である場合も多い(下記のケース参照)。このため、本実施形態では到来方向の情報を与えることを“位置付与”ではなく“位置関係付与”と呼ぶことで、厳密に角度を推定するシステムと区別している。
また、方向推定において、必ずしも(17)式に基づき角度を推定することに限定せず、分離信号のパワーの大きさを加味するなどの実施例を考えることもできる。例えば、注目する分離信号のパワーが小さい場合は、推定された角度の確信度が低いとみなし、過去の出力信号においてよりパワーの高かった場合の推定角度で代用するなどのアルゴリズムが考えられる。
以上の理由から、方向位推定部106は、図3に示すように、方向特性分布計算部103で得られた方向特性分布情報だけでなく、音源分離部102で得られた分離行列や分離信号の情報を用いている。
(第4の実施形態)
図5は、第4の実施形態に係る信号処理システム100−4の構成を示すブロック図である。図5において、図1と同一部分には同一符号を付して示し、重複する説明を省略する。
本実施形態では、第1の実施形態またはその派生形に対して、音声区間検出(VAD;Voice Activity Detection)の手法を導入することで、目的音声以外の雑音によって累積分布が意図しないものに更新されてしまうことを防ぐ。具体的には、図5に示すように、音源分離部102で得られた複数の分離信号それぞれに対して、音声区間検出部109で音声区間または非音声区間のいずれかを判定し、音声区間であるとみなされたチャネルに対応する累積分布のみを類似度算出部104で更新し、それ以外のチャネルに対応する累積分布は更新を省略する。
なお、ここで説明した実施形態では、音声を集音するために音声区間検出処理を導入したが、それ以外にも例えば楽器の信号を集音するために音符のオンセットを検出する処理(非特許文献4)を導入するなどの変形も可能である。
(信号処理システムのユースケース)
これまでに説明した信号処理システムの実際の利用例を説明する。
(ユースケース1:VoC(Voice of Customer)収集システム)
例えば第2の実施形態は、店頭販売や窓口業務を行う店員及びその顧客が対話するケースへの応用が考えられる。これらの話者同士がセンサから見た方向に差を付けて位置する(第1の実施形態で述べた角度の解像度以上の角度の差があることが望ましい)という条件と、相対的な位置により話者を識別するという前提知識(例えば、右側に店員、左側に顧客が位置するものと決める)があれば、当該実施形態を用いることで話者ごとに分けて発話を認識することができる。これを使って音声認識システムと統合することで、お客様の声(VoC;Voice of Customer)のみを選択的に収集したり、店員の応対で発した言葉を収集することで接客マニュアルの改善に役立てたりすることが可能となる。
なお、出力信号は後段での音声認識にて用いられるので、信号対雑音比(SNR;Signal-to-Noise Ratio)が低くならないように、センサと話者の間の距離は数十cm〜1m程度とすることが望ましい。以下の別のケースにおいても、音声認識システムを用いる場合は同様のことが言える。
音声認識モジュールは当該実施形態のシステムと同じ装置に組み込んで実現してもよいが、特に当該実施形態の装置で計算資源が制限されている場合などでは別の形態で実現する必要がある。その場合には、第2の実施形態などの構成により、出力された音声を通信によって別の音声認識用の装置に送信し、その音声認識用の装置で得られた認識結果を利用する、という実施形態を考えることもできる。
なお、ここでは店員と顧客という2種類の役割を持った人物を想定したが、必ずしも話者の数はそれぞれ1人ずつの計2人に限定されるものではなく、合計で3人以上の話者が登場する場合に応用することもできる。
(ユースケース2:複数言語同時翻訳システム)
例えば第2の実施形態は、互いに異なる言語を話す話者同士のコミュニケーションを支援するために複数言語を同時に翻訳するシステムなどに応用できる。話者同士がセンサから見た方向に差を付けて位置するという条件と、相対的な位置により言語を区別するという前提知識(例えば、右側に日本語話者、左側に英語話者が位置するものと決める)があれば、当該実施形態を用いることで話者ごとに分けて発話を認識および翻訳することができる。以上の動作をなるべく少ない遅延時間で実現することにより、相手の言語についての知識が無い場合であってもコミュニケーションをとることが可能になる。
(ユースケース3:音楽信号分離システム)
複数の楽器が同時に音を奏でる合奏音を、本システムを用いて分離するという応用も考えられる。楽器ごとに方向の差を付けて空間内に配置し、第1または第2の実施形態またはその派生形態を適用すれば、楽器ごとに分離された信号を複数同時に得ることができる。このシステムは、出力された信号をスピーカやヘッドホン等を通して聴くことで、演奏家や指揮者が楽器ごとの演奏を確認したり、後段に自動採譜システムを連結させることで未知の楽曲を楽器ごとに採譜したりするなどの効果が期待できる。
(実施例1)
次に、第1〜第4の実施形態にかかる信号処理システムのハードウェア構成について説明する。この構成は、図6に示すように、CPU(Central Processing Unit)などの制御装置201と、ROM(Read Only Memory)などのプログラム記憶装置202と、RAM(Random Access Memory)などの作業用記憶装置203、各部を接続するバス204、センサ部101からの観測信号の入力、連結信号の出力を行うインターフェース装置205とを備えている。
第1〜第4の実施形態にかかる信号処理システムで実行されるプログラムは、ROM等の記憶装置202に予め組み込まれて提供され、また、インストール可能な形式または実行可能な形式のファイルでCD−ROM等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプロダクトとして提供されるように構成してもよい。
(実施例2)
さらに、図7に示すように、第1〜第4の実施形態に係る信号処理システムで実行されるプログラムを、インターネット等のネットワーク301に接続されたコンピュータ(サーバ)302に格納し、ネットワーク経由で、第1〜第4の実施形態に係る信号処理システムの処理機能を有する通信端末303にダウンロードさせることにより提供するように構成してもよい。また、そのプログラムをネットワーク経由で提供または配布するように構成してもよい。また、ネットワーク経由でコンピュータ302に通信端末303からセンサ出力を送り、分離連結された出力信号を通信端末303が受け取るように、サーバ・クライアント構成で実現することも可能である。
第1〜第4の実施形態に係る信号処理システムで実行されるプログラムは、コンピュータを上述した信号処理システムの各部として機能させうる。このコンピュータは、CPUがコンピュータ読み取り可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
その他、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
100−1,100−2,100−3,100−4…信号処理システム、
101…センサ部、102…音源分離部、103…方向特性分布算出部、104…類似度算出部、105…連結部、106…方向推定部、107…位置関係付与部、108…通知ボタン、109…音声区間検出部、
201…CPU、202…ROM、203…RAM、204…バス、205…インターフェース装置、
301…ネットワーク、302…コンピュータ、303…通信端末。

Claims (5)

  1. 複数の信号源の発生信号を観測し受信するセンサ装置と、
    フレーム単位ごとに前記センサ装置の受信信号から分離フィルタを推定し、この分離フィルタに基づいて受信信号を分離して複数のチャネルから分離信号を出力する分離装置と、
    前記分離フィルタに基づき前記複数のチャネルの分離信号毎に方向特性分布を計算する第1算出装置と、
    前記分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれについての方向特性分布を表す累積分布を求め、前記現在のフレームの分離信号の方向特性分布との類似度を算出する第2算出装置と、
    前記複数のチャネルの分離信号毎に前記類似度に基づいて前記複数のチャネルの分離信号から選択した一つの信号に連結して出力する連結装置と
    を具備する信号処理システム。
  2. 前記分離装置で推定された分離フィルタに基づいて、前記複数のチャネルの分離信号それぞれについて、対応する信号源からの到来方向を推定する推定装置と、
    前記分離装置で得られる複数のチャネルの分離信号それぞれに前記推定装置で推定される到来方向に基づく位置関係の情報を付与する付与装置と
    をさらに備える請求項1記載の信号処理システム。
  3. 前記複数のチャネルの分離信号それぞれについて信号の発生区間、非発生区間を判定する判定装置を備え、
    前記第2算出装置は、前記判定装置で発生区間であるとみなされたチャネルに対応する累積分布のみを更新する請求項1記載の信号処理システム。
  4. 複数の信号源の発生信号を観測して受信信号を取得し、
    フレーム単位ごとに前記受信信号から分離フィルタを推定し、この分離フィルタに基づいて前記受信信号を分離して複数のチャネルから分離信号を出力し、
    前記分離フィルタに基づき前記複数のチャネルから出力される分離信号毎に方向特性分布を計算し、
    前記分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれについての方向特性分布を表す累積分布を求め、前記現在のフレームの分離信号の方向特性分布との類似度を算出し、
    前記複数のチャネルの分離信号毎に前記類似度に基づいて前記複数のチャネルの分離信号から選択した一つの信号に連結して出力する信号処理方法。
  5. 複数の信号源の発生信号を観測した受信信号から前記複数の信号源からの受信信号を分離出力する処理をコンピュータに実行させるための信号処理プログラムであって、
    フレーム単位ごとに前記受信信号から分離フィルタを推定し、この分離フィルタに基づいて前記受信信号を分離して複数のチャネルから分離信号を出力する分離ステップと、
    前記分離フィルタに基づき前記複数のチャネルの分離信号毎に方向特性分布を算出する第1算出ステップと、
    前記分離信号を得た現在のフレームよりも過去のフレームで出力した複数のチャネルの分離信号それぞれの方向特性分布を表す累積分布を求め、前記現在のフレームの分離信号の方向特性分布との類似度を算出する第2算出ステップと、
    前記複数のチャネルの分離信号毎に前記類似度に基づいて前記複数のチャネルの分離信号から選択した一つの信号に連結して出力する連結ステップと
    を具備する信号処理プログラム。
JP2017055096A 2017-03-21 2017-03-21 信号処理システム、信号処理方法及び信号処理プログラム Active JP6591477B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017055096A JP6591477B2 (ja) 2017-03-21 2017-03-21 信号処理システム、信号処理方法及び信号処理プログラム
CN201710767915.9A CN108630222B (zh) 2017-03-21 2017-08-31 信号处理系统以及信号处理方法
US15/705,165 US10262678B2 (en) 2017-03-21 2017-09-14 Signal processing system, signal processing method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017055096A JP6591477B2 (ja) 2017-03-21 2017-03-21 信号処理システム、信号処理方法及び信号処理プログラム

Publications (2)

Publication Number Publication Date
JP2018156052A true JP2018156052A (ja) 2018-10-04
JP6591477B2 JP6591477B2 (ja) 2019-10-16

Family

ID=63583547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017055096A Active JP6591477B2 (ja) 2017-03-21 2017-03-21 信号処理システム、信号処理方法及び信号処理プログラム

Country Status (3)

Country Link
US (1) US10262678B2 (ja)
JP (1) JP6591477B2 (ja)
CN (1) CN108630222B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366706B2 (en) 2017-03-21 2019-07-30 Kabushiki Kaisha Toshiba Signal processing apparatus, signal processing method and labeling apparatus
JP2022505964A (ja) * 2018-10-26 2022-01-14 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 方向性音量マップベースのオーディオ処理

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111808B (zh) * 2019-04-30 2021-06-15 华为技术有限公司 音频信号处理方法及相关产品
CN112420071B (zh) * 2020-11-09 2022-12-02 上海交通大学 一种基于恒q变换的复调电子琴音乐音符识方法
CN112863537A (zh) * 2021-01-04 2021-05-28 北京小米松果电子有限公司 一种音频信号处理方法、装置及存储介质
CN113077803B (zh) * 2021-03-16 2024-01-23 联想(北京)有限公司 一种语音处理方法、装置、可读存储介质及电子设备
CN113608167B (zh) * 2021-10-09 2022-02-08 阿里巴巴达摩院(杭州)科技有限公司 声源定位方法、装置及设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007215163A (ja) 2006-01-12 2007-08-23 Kobe Steel Ltd 音源分離装置,音源分離装置用のプログラム及び音源分離方法
JP2008039639A (ja) * 2006-08-08 2008-02-21 Hioki Ee Corp 接触式計測用プローブ
JP5117012B2 (ja) 2006-08-09 2013-01-09 株式会社東芝 方向探知システム及び信号抽出方法
JP4449987B2 (ja) * 2007-02-15 2010-04-14 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
JP4649437B2 (ja) * 2007-04-03 2011-03-09 株式会社東芝 信号分離抽出装置
GB0720473D0 (en) 2007-10-19 2007-11-28 Univ Surrey Accoustic source separation
US20110112843A1 (en) * 2008-07-11 2011-05-12 Nec Corporation Signal analyzing device, signal control device, and method and program therefor
JP5400225B2 (ja) * 2009-10-05 2014-01-29 ハーマン インターナショナル インダストリーズ インコーポレイテッド オーディオ信号の空間的抽出のためのシステム
JP2012184552A (ja) * 2011-03-03 2012-09-27 Marutaka Kogyo Inc 解体工法
JP6005443B2 (ja) * 2012-08-23 2016-10-12 株式会社東芝 信号処理装置、方法及びプログラム
JP5911101B2 (ja) 2012-08-30 2016-04-27 日本電信電話株式会社 音響信号解析装置、方法、及びプログラム
US9286897B2 (en) * 2013-09-27 2016-03-15 Amazon Technologies, Inc. Speech recognizer with multi-directional decoding
GB2521175A (en) * 2013-12-11 2015-06-17 Nokia Technologies Oy Spatial audio processing apparatus
US10595144B2 (en) * 2014-03-31 2020-03-17 Sony Corporation Method and apparatus for generating audio content
JP6463904B2 (ja) * 2014-05-26 2019-02-06 キヤノン株式会社 信号処理装置及び音源分離方法及びプログラム
CN105989852A (zh) * 2015-02-16 2016-10-05 杜比实验室特许公司 分离音频源
JP6501260B2 (ja) 2015-08-20 2019-04-17 本田技研工業株式会社 音響処理装置及び音響処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10366706B2 (en) 2017-03-21 2019-07-30 Kabushiki Kaisha Toshiba Signal processing apparatus, signal processing method and labeling apparatus
JP2022505964A (ja) * 2018-10-26 2022-01-14 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 方向性音量マップベースのオーディオ処理

Also Published As

Publication number Publication date
US10262678B2 (en) 2019-04-16
CN108630222A (zh) 2018-10-09
US20180277140A1 (en) 2018-09-27
JP6591477B2 (ja) 2019-10-16
CN108630222B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
JP6591477B2 (ja) 信号処理システム、信号処理方法及び信号処理プログラム
US10901063B2 (en) Localization algorithm for sound sources with known statistics
EP3320692B1 (en) Spatial audio processing apparatus
US20170140771A1 (en) Information processing apparatus, information processing method, and computer program product
JP3522954B2 (ja) マイクロホンアレイ入力型音声認識装置及び方法
KR101688354B1 (ko) 신호 소스 분리
TWI530201B (zh) 經由自抵達方向估值提取幾何資訊之聲音擷取技術
JP5229053B2 (ja) 信号処理装置、および信号処理方法、並びにプログラム
JP5702685B2 (ja) 音源方向推定装置及び音源方向推定方法
JP2014219467A (ja) 音信号処理装置、および音信号処理方法、並びにプログラム
CN107644650A (zh) 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
JP2008236077A (ja) 目的音抽出装置,目的音抽出プログラム
JP5123595B2 (ja) 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法
JP2014059180A (ja) 音源方向推定装置、音源方向推定方法、及び音源方向推定プログラム
JP2019004465A (ja) 収音装置、及び収音方法
CN111863015A (zh) 一种音频处理方法、装置、电子设备和可读存储介质
JP2018169473A (ja) 音声処理装置、音声処理方法及びプログラム
JP2020148909A (ja) 信号処理装置、信号処理方法およびプログラム
JP5451562B2 (ja) 音響処理システム及びこれを用いた機械
JP2017067948A (ja) 音声処理装置および音声処理方法
JP2020150490A (ja) 音源定位装置、音源定位方法、およびプログラム
JP3862685B2 (ja) 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
Bai et al. Acoustic source localization and deconvolution-based separation
JP6961545B2 (ja) 音信号処理装置、音信号処理方法、およびプログラム
Gburrek et al. On source-microphone distance estimation using convolutional recurrent neural networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190918

R151 Written notification of patent or utility model registration

Ref document number: 6591477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151