JP5605575B2 - 多チャンネル音響信号処理方法、そのシステム及びプログラム - Google Patents

多チャンネル音響信号処理方法、そのシステム及びプログラム Download PDF

Info

Publication number
JP5605575B2
JP5605575B2 JP2010550500A JP2010550500A JP5605575B2 JP 5605575 B2 JP5605575 B2 JP 5605575B2 JP 2010550500 A JP2010550500 A JP 2010550500A JP 2010550500 A JP2010550500 A JP 2010550500A JP 5605575 B2 JP5605575 B2 JP 5605575B2
Authority
JP
Japan
Prior art keywords
channel
similarity
channels
feature amount
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010550500A
Other languages
English (en)
Other versions
JPWO2010092915A1 (ja
Inventor
剛範 辻川
正 江森
祥史 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010550500A priority Critical patent/JP5605575B2/ja
Publication of JPWO2010092915A1 publication Critical patent/JPWO2010092915A1/ja
Application granted granted Critical
Publication of JP5605575B2 publication Critical patent/JP5605575B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

本発明は、多チャンネル音響信号処理方法、多チャンネル音響信号処理システム及びプログラムに関する。
関連する多チャンネル音響信号処理システムの一例が、特許文献1に記載されている。この装置は、任意に配置された複数のマイクロホンで観測した複数の話者の音声および雑音の混合音響信号から目的外音声、背景雑音を除去することにより目的音声を抽出できるシステムである。また、上記混合音響信号から目的音声を検出できるシステムでもある。
図3は、特許文献1に開示されている雑音除去システムの構成を示すブロック図である。その雑音除去システムにおける混合音響信号から目的音声を検出する箇所について構成および動作を概説する。複数のチャンネルの入力時系列信号を受けて分離する信号分離部101と、信号分離部101から出力される分離信号を受け強度比計算部106からの強度比に基づき雑音を推定する雑音推定部102と、信号分離部101から出力される分離信号と、雑音推定部102で推定された雑音成分と、強度比計算部106の出力を受けて雑音区間/音声区間を検出する雑音区間検出部103とを有する。
特開2005−308771号公報(図1)
上記で説明した特許文献1に記載の雑音除去システムに含まれる、混合音響信号から目的音声を検出する箇所は、任意に配置された複数のマイクロホンで観測した複数の話者の音声および雑音の混合音響信号から目的音声を検出することを意図したものであるが、下記の問題点を有している。
その問題点は、信号分離部1が非効率的であるということである。
その理由は、複数のマイクロホンが任意に配置され、複数のマイクロホンからの信号(マイクロホン信号、図3では入力時系列信号)を用いて、例えば目的音声を検出することを想定すると、マイクロホン信号によっては、信号分離が必要な場合と、不要な場合とがあるためである。すなわち、信号分離部1の後段の処理によって、信号分離が必要な度合いが異なるということである。信号分離が不要なマイクロホン信号が多数となると、信号分離部1は不要な処理に莫大な計算量を費やすことになり、非効率的である。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、多チャンネルの入力信号を効率的に信号分離できる多チャンネル音響信号処理方法、そのシステム及びプログラムを提供することにある。
上記課題を解決する本発明は、多チャンネルの入力信号からチャンネル毎に特徴量を算出し、前記チャンネル毎の特徴量のチャンネル間の類似度を計算し、前記類似度が高い複数のチャンネルを選択し、選択した複数のチャンネルの入力信号を用いて信号を分離することを特徴とする多チャンネル音響信号処理方法である。
上記課題を解決する本発明は、多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出部と、前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算部と、前記類似度が高い複数のチャンネルを選択するチャンネル選択部と、選択した複数のチャンネルの入力信号を用いて信号を分離する信号分離部とを有することを特徴とする多チャンネル音響信号処理システムである。
上記課題を解決する本発明は、多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出処理と、前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算処理と、前記類似度が高い複数のチャンネルを選択するチャンネル選択処理と、選択した複数のチャンネルの入力信号を用いて信号を分離する信号分離処理とを情報処理装置に実行させることを特徴とするプログラムである。
本発明は、信号分離が不要なチャンネルを除くことができ、効率的に信号を分離するという、本発明の目的を達成することができる。
本発明を実施するための最良の形態の構成を示すブロック図である。 本発明を実施するための最良の形態の動作を示す流れ図である。 特許文献1の雑音除去システムの構成を示すブロック図である。
以下、図面を参照して本発明の実施の形態について詳細に説明する。
図1は、本発明の多チャンネル音響信号処理システムの構成例を示すブロック図である。
図1に例示する多チャンネル音響信号処理システムは、入力信号1〜Mをそれぞれ受けてチャンネル毎の特徴量を算出する特徴量算出部1−1〜1−Mと、特徴量を受けてチャンネル間の類似度を計算する類似度計算部2と、チャンネル間の類似度を受けて類似度の高いチャンネルを選択するチャンネル選択部3と、選択された類似度が高いチャンネルの入力信号を受けて信号を分離する信号分離部4−1〜4−Nとを有する。
図2は、本発明の実施の形態に係る多チャンネル音響信号処理システムにおける処理手順を示す流れ図である。
図1および図2を参照して、本実施の形態の多チャンネル音響信号処理システムの詳細について以下に説明する。
入力信号1〜Mをそれぞれx1(t)〜xM(t)とする。ただし、tはサンプル番号である。特徴量算出部1−1〜1−Mでは、入力信号1〜Mから、それぞれ特徴量1〜Mを算出する(ステップS1)。
F1(T) = [f11(T) f12(T) … f1L(T)] … (1-1)
F2(T) = [f21(T) f22(T) … f2L(T)] … (1-2)
.
.
.
FM(T) = [fM1(T) fM2(T) … fML(T)] … (1-M)
ただし、F1(T)〜FM(T)は入力信号1〜Mから算出した特徴量1〜Mである。Tは時間のインデックスであり、複数のサンプルtを1つの区間とし、その時間区間におけるインデックスとしてTを用いてもよい。
数式(1-1)〜(1-M)に示すように、特徴量F1(T)〜FM(T)は、それぞれL次元(Lは1以上の値)の特徴量の要素を持つベクトルとして構成される。特徴量の要素としては、例えば、時間波形(入力信号)、平均パワーなどの統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度(エントロピーを含む)、音素・音節認識結果、音声区間長のようなものが考えられる。
上記の通り、入力信号1〜Mから直接求める特徴量だけでなく、音響モデルというある基準に対するチャンネル毎の値を特徴量とすることも可能である。なお、上記の特徴量は一例であり、その他の特徴量でも良いことはもちろんである。
次に、類似度計算部2は、特徴量1〜Mを受けて、チャンネル間の類似度を計算する(ステップS2)。
類似度の計算方法は、特徴量の要素によって異なる。
相関値は、一般的に類似度を表す指標として適している。また、距離(差分)値は、小さいほど類似度が高いということを表す指標となる。また、特徴量が音素・音節認識結果の場合は、文字列の比較となり、その類似度の計算にはDPマッチングなどを利用することもある。
なお、上記の相関値、距離値などは一例であり、その他の指標で類似度を計算しても良いことはもちろんである。また、全チャンネルの全組み合わせの類似度を計算する必要はなく、Mチャンネルのうちのあるチャンネルを基準とし、そのチャンネルに対する類似度のみを計算してもよい。また、複数の時刻Tを1つの区間として、その時間区間における類似度を計算してもよい。また特徴量に音声区間長が含まれる場合は、音声区間が検出されないチャンネルに対しては、以後の処理を省略することも可能である。
チャンネル選択部3は、類似度計算部2からのチャンネル間の類似度を受けて、類似度が高いチャンネルを選択し、グルーピングする(ステップS3)。
選択方法としては、類似度を閾値と比較して、閾値より高い場合に、それらのチャンネルをグルーピングする、相対的に類似度が高い場合にグルーピングするなど、クラスタリングの手法を用いればよい。その際、複数のグループに選択されるチャンネルがあってもよい、また、どのグループにも選択されないチャンネルがあってもよい。
なお、類似度算出部2とチャンネル選択部3とは、異なる特徴量に対して、類似度を計算、チャンネルを選択、という処理を繰り返すことにより、選択するチャンネルを絞り込むように処理してもよい。
信号分離部4−1〜4−Nは、チャンネル選択部3で選択されたグループ毎に信号分離を行う(ステップS4)。
信号分離は、独立成分分析に基づく手法や、2乗誤差最小化に基づく手法などを用いればよい。各信号分離部の出力は類似度が低いことが期待されるが、異なる信号分離部の出力には類似度が高いものが含まれる可能性がある。その場合には、類似している出力を取捨選択してもよい。
本実施の形態は、全チャンネルで信号分離を行うのではなく、チャンネル間の類似度に基づいて、信号分離を行う単位を小規模にし、また信号分離不要なチャンネルは信号分離部に入力しない。そのため、全チャンネルで信号分離を行う場合に比べて、効率的に信号分離を行うことが可能となる。
以上の如く、本実施の形態は、チャンネル毎に算出された特徴量のチャンネル間の類似度を計算し、類似度が高いチャンネルに対して信号を分離する。このような構成を採用し、信号を分離することにより、信号分離が不要なチャンネルを除くことができるため、効率的に信号を分離するという、本発明の目的を達成することができる。
尚、上述した実施の形態において、特徴量算出部1−1〜1−Mと、類似度計算部2と、チャンネル選択部3と、信号分離部4−1〜4−Nとをハードウェアで構成したが、それらの全部又は一部をプログラムで動作する情報処理装置により構成することもできる。
また、上記の実施の形態の内容は、以下のようにも表現されうる。
[付記1] 多チャンネルの入力信号からチャンネル毎に特徴量を算出し、
前記チャンネル毎の特徴量のチャンネル間の類似度を計算し、
前記類似度が高い複数のチャンネルを選択し、
選択した複数のチャンネルの入力信号を用いて信号を分離する
ことを特徴とする多チャンネル音響信号処理方法。
[付記2] 前記チャンネル毎に算出する特徴量は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを含むことを特徴とする付記1に記載の多チャンネル音響信号処理方法。
[付記3] 前記類似度を表す指標として、相関値、距離値のうち少なくとも1つを含むことを特徴とする付記1又は付記2に記載の多チャンネル音響信号処理方法。
[付記4] 前記チャンネル毎の類似度を計算して類似度が高い複数のチャンネルを選択することを、異なる特徴量を用いて複数回繰り返し、選択するチャンネルを絞ることを特徴とする付記1から付記3のいずれかに記載の多チャンネル音響信号処理方法。
[付記5] 多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出部と、
前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算部と、
前記類似度が高い複数のチャンネルを選択するチャンネル選択部と、
選択した複数のチャンネルの入力信号を用いて信号を分離する信号分離部と
を有することを特徴とする多チャンネル音響信号処理システム。
[付記6] 前記特徴量算出部は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを、特徴量として算出することを特徴とする付記5に記載の多チャンネル音響信号処理システム。
[付記7] 前記類似度計算部は、相関値、距離値のうち少なくとも1つを、前記類似度を表す指標として算出することを特徴とする付記5又は付記6に記載の多チャンネル音響信号処理システム。
[付記8] 前記特徴量算出部は、異なる特徴量の種類でチャンネル毎の異なる特徴量を算出し、
前記類似度計算部は、異なる特徴量を用いて複数回チャンネルの選択を行い、選択するチャンネルを絞り込むことを特徴とする付記5から付記7のいずれかに記載の多チャンネル音響信号処理システム。
[付記9] 多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出処理と、
前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算処理と、
前記類似度が高い複数のチャンネルを選択するチャンネル選択処理と、
選択した複数のチャンネルの入力信号を用いて信号を分離する信号分離処理と
を情報処理装置に実行させることを特徴とするプログラム。
[付記10] 前記特徴量算出処理は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを、特徴量として算出することを特徴とする付記9に記載のプログラム。
[付記11] 前記類似度計算処理は、相関値、距離値のうち少なくとも1つを、前記類似度を表す指標として算出することを特徴とする付記9又は付記10に記載のプログラム。
[付記12] 前記特徴量算出処理と前記類似度計算処理とを、異なる特徴量を用いて複数回繰り返し、
前記チャンネル選択処理は、選択するチャンネルを絞る
ことを特徴とする付記9から付記11のいずれかに記載のプログラム。
以上好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも上記実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
本出願は、2009年2月13日に出願された日本出願特願2009−031111号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明によれば、任意に配置された複数のマイクロホンで観測した複数の話者の音声および雑音の混合音響信号を分離する多チャンネル音響信号処理装置や、多チャンネル音響信号処理装置をコンピュータに実現するためのプログラムといった用途に適用できる。
1−1 入力信号1から特徴量を算出する特徴量算出部
1−2 入力信号2から特徴量を算出する特徴量算出部
1−M 入力信号Mから特徴量を算出する特徴量算出部
2 類似度計算部
3 チャンネル選択部
4−1 グループ1として選択されたチャンネルの信号を分離する信号分離部
4−N グループNとして選択されたチャンネルの信号を分離する信号分離部

Claims (12)

  1. 少なくとも一つのチャンネルに目的信号が含まれる多チャンネルの入力信号からチャンネル毎に特徴量を算出し、
    前記チャンネル毎の特徴量のチャンネル間の類似度を計算し、
    前記類似度が高い複数のチャンネルを選択し、
    選択した複数のチャンネルの入力信号を用いて、前記選択した複数のチャンネルの入力信号に含まれる目的信号を分離する
    ことを特徴とする多チャンネル音響信号処理方法。
  2. 前記チャンネル毎に算出する特徴量は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを含むことを特徴とする請求項1に記載の多チャンネル音響信号処理方法。
  3. 前記類似度を表す指標として、相関値、距離値のうち少なくとも1つを含むことを特徴とする請求項1又は請求項2に記載の多チャンネル音響信号処理方法。
  4. 前記チャンネル毎の類似度を計算して類似度が高い複数のチャンネルを選択することを、異なる特徴量を用いて複数回繰り返し、選択するチャンネルを絞ることを特徴とする請求項1から請求項3のいずれかに記載の多チャンネル音響信号処理方法。
  5. 少なくとも一つのチャンネルに目的信号が含まれる多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出部と、
    前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算部と、
    前記類似度が高い複数のチャンネルを選択するチャンネル選択部と、
    選択した複数のチャンネルの入力信号を用いて、前記選択した複数のチャンネルに含まれる目的信号を分離する信号分離部と
    を有することを特徴とする多チャンネル音響信号処理システム。
  6. 前記特徴量算出部は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを、特徴量として算出することを特徴とする請求項5に記載の多チャンネル音響信号処理システム。
  7. 前記類似度計算部は、相関値、距離値のうち少なくとも1つを、前記類似度を表す指標として算出することを特徴とする請求項5又は請求項6に記載の多チャンネル音響信号処理システム。
  8. 前記特徴量算出部は、異なる特徴量の種類でチャンネル毎の異なる特徴量を算出し、
    前記類似度計算部は、異なる特徴量を用いて複数回チャンネルの選択を行い、選択するチャンネルを絞り込むことを特徴とする請求項5から請求項7のいずれかに記載の多チャンネル音響信号処理システム。
  9. 少なくとも一つのチャンネルに目的信号が含まれる多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出処理と、
    前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算処理と、
    前記類似度が高い複数のチャンネルを選択するチャンネル選択処理と、
    選択した複数のチャンネルの入力信号を用いて、前記選択した複数のチャンネルの入力信号に含まれる目的信号を分離する信号分離処理と
    を情報処理装置に実行させることを特徴とするプログラム。
  10. 前記特徴量算出処理は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを、特徴量として算出することを特徴とする請求項9に記載のプログラム。
  11. 前記類似度計算処理は、相関値、距離値のうち少なくとも1つを、前記類似度を表す指標として算出することを特徴とする請求項9又は請求項10に記載のプログラム。
  12. 前記特徴量算出処理と前記類似度計算処理とを、異なる特徴量を用いて複数回繰り返し、
    前記チャンネル選択処理は、選択するチャンネルを絞る
    ことを特徴とする請求項9から請求項11のいずれかに記載のプログラム。
JP2010550500A 2009-02-13 2010-02-08 多チャンネル音響信号処理方法、そのシステム及びプログラム Active JP5605575B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010550500A JP5605575B2 (ja) 2009-02-13 2010-02-08 多チャンネル音響信号処理方法、そのシステム及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009031111 2009-02-13
JP2009031111 2009-02-13
JP2010550500A JP5605575B2 (ja) 2009-02-13 2010-02-08 多チャンネル音響信号処理方法、そのシステム及びプログラム
PCT/JP2010/051752 WO2010092915A1 (ja) 2009-02-13 2010-02-08 多チャンネル音響信号処理方法、そのシステム及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2010092915A1 JPWO2010092915A1 (ja) 2012-08-16
JP5605575B2 true JP5605575B2 (ja) 2014-10-15

Family

ID=42561757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010550500A Active JP5605575B2 (ja) 2009-02-13 2010-02-08 多チャンネル音響信号処理方法、そのシステム及びプログラム

Country Status (3)

Country Link
US (1) US9064499B2 (ja)
JP (1) JP5605575B2 (ja)
WO (1) WO2010092915A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2996043B1 (fr) * 2012-09-27 2014-10-24 Univ Bordeaux 1 Procede et dispositif pour separer des signaux par filtrage spatial a variance minimum sous contrainte lineaire
JP6367773B2 (ja) * 2015-08-12 2018-08-01 日本電信電話株式会社 音声強調装置、音声強調方法及び音声強調プログラム
JP6601109B2 (ja) * 2015-09-30 2019-11-06 ヤマハ株式会社 楽器類識別装置
US10854209B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Multi-stream audio coding
GB201909133D0 (en) * 2019-06-25 2019-08-07 Nokia Technologies Oy Spatial audio representation and rendering
CN115410584A (zh) * 2021-05-28 2022-11-29 华为技术有限公司 多声道音频信号的编码方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006510069A (ja) * 2002-12-11 2006-03-23 ソフトマックス,インク 改良型独立成分分析を使用する音声処理ためのシステムおよび方法
JP3949150B2 (ja) * 2003-09-02 2007-07-25 日本電信電話株式会社 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体
JP2008092363A (ja) * 2006-10-03 2008-04-17 Sony Corp 信号分離装置及び方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6424960B1 (en) * 1999-10-14 2002-07-23 The Salk Institute For Biological Studies Unsupervised adaptation and classification of multiple classes and sources in blind signal separation
JP3506138B2 (ja) * 2001-07-11 2004-03-15 ヤマハ株式会社 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置
JP3812887B2 (ja) * 2001-12-21 2006-08-23 富士通株式会社 信号処理システムおよび方法
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
JP4543731B2 (ja) 2004-04-16 2010-09-15 日本電気株式会社 雑音除去方法、雑音除去装置とシステム及び雑音除去用プログラム
CN1942932B (zh) * 2005-02-08 2010-07-28 日本电信电话株式会社 信号分离装置和信号分离方法
JP4767247B2 (ja) * 2005-02-25 2011-09-07 パイオニア株式会社 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
US20070135952A1 (en) * 2005-12-06 2007-06-14 Dts, Inc. Audio channel extraction using inter-channel amplitude spectra
DE102006027673A1 (de) * 2006-06-14 2007-12-20 Friedrich-Alexander-Universität Erlangen-Nürnberg Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
US7664643B2 (en) * 2006-08-25 2010-02-16 International Business Machines Corporation System and method for speech separation and multi-talker speech recognition
US8738368B2 (en) * 2006-09-21 2014-05-27 GM Global Technology Operations LLC Speech processing responsive to a determined active communication zone in a vehicle
US20080228470A1 (en) * 2007-02-21 2008-09-18 Atsuo Hiroe Signal separating device, signal separating method, and computer program
US8107321B2 (en) * 2007-06-01 2012-01-31 Technische Universitat Graz And Forschungsholding Tu Graz Gmbh Joint position-pitch estimation of acoustic sources for their tracking and separation
JP4469882B2 (ja) * 2007-08-16 2010-06-02 株式会社東芝 音響信号処理方法及び装置
US8175291B2 (en) * 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
US8130978B2 (en) * 2008-10-15 2012-03-06 Microsoft Corporation Dynamic switching of microphone inputs for identification of a direction of a source of speech sounds

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006510069A (ja) * 2002-12-11 2006-03-23 ソフトマックス,インク 改良型独立成分分析を使用する音声処理ためのシステムおよび方法
JP3949150B2 (ja) * 2003-09-02 2007-07-25 日本電信電話株式会社 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体
JP2008092363A (ja) * 2006-10-03 2008-04-17 Sony Corp 信号分離装置及び方法

Also Published As

Publication number Publication date
US9064499B2 (en) 2015-06-23
US20120029916A1 (en) 2012-02-02
WO2010092915A1 (ja) 2010-08-19
JPWO2010092915A1 (ja) 2012-08-16

Similar Documents

Publication Publication Date Title
JP5605573B2 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
JP5605575B2 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
KR100745976B1 (ko) 음향 모델을 이용한 음성과 비음성의 구분 방법 및 장치
JP5605574B2 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
JP5662276B2 (ja) 音響信号処理装置および音響信号処理方法
US8364483B2 (en) Method for separating source signals and apparatus thereof
US20120103166A1 (en) Signal Processing Device, Signal Processing Method, and Program
CN106098079B (zh) 音频信号的信号提取方法与装置
NZ566782A (en) Neural network classifier for separating audio sources from a monophonic audio signal
KR20190069198A (ko) 다채널 오디오 신호에서 음원을 추출하는 장치 및 그 방법
Tan et al. Evaluation of a Sparse Representation-Based Classifier For Bird Phrase Classification Under Limited Data Conditions.
Xiao et al. Improved source counting and separation for monaural mixture
KR20170124854A (ko) 음성/비음성 구간 검출 장치 및 방법
RU2005104835A (ru) Способ распознавания водяного знака
Zhang et al. Noise-Aware Speech Separation with Contrastive Learning
JP2010038943A (ja) 音響信号処理装置及び方法
CN110534128B (zh) 一种噪音处理方法、装置、设备及存储介质
JP7014682B2 (ja) 音源分離の評価装置および音源分離装置
WO2007036846A2 (en) Method and apparatus for automatic structure analysis of music
KR101069232B1 (ko) 음악 장르 분류 방법 및 장치
Zhang et al. A two phase method for general audio segmentation
Khonglah et al. Indoor/Outdoor Audio Classification Using Foreground Speech Segmentation.
Nguyen et al. Improving mix-and-separate training in audio-visual sound source separation with an object prior
Petridis et al. A multi-class method for detecting audio events in news broadcasts
Maka et al. Detecting the number of speakers in speech mixtures by human and machine

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140812

R150 Certificate of patent or registration of utility model

Ref document number: 5605575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150