JP2005346078A - 2つの調波信号の共通源の判定方法 - Google Patents

2つの調波信号の共通源の判定方法 Download PDF

Info

Publication number
JP2005346078A
JP2005346078A JP2005162480A JP2005162480A JP2005346078A JP 2005346078 A JP2005346078 A JP 2005346078A JP 2005162480 A JP2005162480 A JP 2005162480A JP 2005162480 A JP2005162480 A JP 2005162480A JP 2005346078 A JP2005346078 A JP 2005346078A
Authority
JP
Japan
Prior art keywords
fundamental frequency
signals
frequency
harmonics
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005162480A
Other languages
English (en)
Other versions
JP4790318B2 (ja
Inventor
Frank Joublin
フランク・ジョブリン
Martin Heckmann
マーティン・ヘックマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Research Institute Europe GmbH
Original Assignee
Honda Research Institute Europe GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Research Institute Europe GmbH filed Critical Honda Research Institute Europe GmbH
Publication of JP2005346078A publication Critical patent/JP2005346078A/ja
Application granted granted Critical
Publication of JP4790318B2 publication Critical patent/JP4790318B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

【課題】2つのバンドパス信号が共通の基本周波数の調波であるか否かを判断する方法を提供する。
【解決手段】本発明は、基礎をなすバンドパス・フィルタによってカバーされる周波数の調波関係およびゼロ交差点、極大点、極小点、公差しきい値などのシヌソイド信号の有意点の距離の評価を含む方法を提供する。これら有意ポイントの距離の評価によって、音声信号の場合に音声器官によって導入される周波数依存遅延を補償しながら、検証中の2つの調波の間の同期が検出される。
【選択図】図3

Description

本発明は、2つの周波数コンポーネントが1つの共通の基本周波数(fundamental frequency)から発生しているか否かを判定する手法に関する。この手法は、例えば、基礎をなす基本周波数に基づいてモノラル録音における音源の分離に利用することができる。しかしながら、本発明は、音響の分野に限定されるものではなく、圧力センサの出力信号のような他の信号にも適用することができる。
音響録音を行う場合、しばしば、多数の音源が同時に混在する。それらは、音声信号(speech signal)や(例えば送風機の)ノイズなどの種々の信号である。信号の更なる分析のためには、そのような相互に干渉する信号をまず分離する必要がある。一般的アプリケーションは、音声認識または音響場面分析である。人間聴覚システムにおいて調波信号(harmonic signal)をその基本周波数に基づいて分離することができることはよく知られている(非特許文献1を参照)。音声信号が、一般に多くの音声セグメント、つまり調波セグメントを含んでいることは注目すべき点である。
一般的手法によれば、入力信号がバンドパス・フィルタによって種々の周波数帯域に分割され、後段において、帯域ごとに、時点ごとに、当該帯域が所与の基本周波数から発生しているか否かを示す0と1の範囲の証拠値(evidence value)が計算される(単純な一元的判断は2進法の証拠値を使用するものと解釈することができる)。これによって、基本周波数、周波数帯域および時間という3つの軸を持つ信号の3次元表現が得られる。このようなタイプの表現もまた人間聴覚システムにおいて観察される(非特許文献2を参照)。これらのあらかじめ計算された証拠値に基づいて、共通の基本周波数を有する複数の帯域グループが形成される。このようにして、各グループにおいて、1つの基本周波数から発生し、1つの音源に属する調波信号のみが存在することとなる。このような手段によって、音源の分離を達成することができる。
音源の分離における1つの重要なステップは、2つの調波信号が1つの基本周波数、つまり単一の音源から発生しているか否かの判断である。周知の従来技術手法においては、これは自己相関(auto-correlation)関数を介して実行される(非特許文献3を参照)。各帯域に関して、自己相関が判定され、調波関係にある周波数は遅延ドメインにおけるピークを共有する。ピークは、調波信号の周波数に対応する遅延およびこの遅延の倍数において発生する。
更に、音源分離を解決するための生物学的原理もまた知られている(非特許文献4を参照:)。
A. Bregman, "Auditory Scene Analysis", MIT Press, 1990 G. Langner, H. Schulze, M. Sans, and P. Heil, "The topographic representation of periodicity pitch in the auditory cortex", Proc. of the NATO Adv. Study Inst. on Comp. Hearing, pages 91--97, 1998 G. Hu and D. Wang, "Monaural speech segregation based on pitch tracking and amplitude", IEEE Trans. On Neural Networks, 2004 B. Moore, "An Introduction to the Psychology of Hearing", Fifth Edition, Academic Press, 2003
このような観点から、本発明は、音源から信号(例えば音)を分離するための一層効果的な手法を提供することを目的とする。また、本発明は、2つの調波信号が1つの基本周波数から発生しているか、そして、2つの周波数帯域が単一音源から発生しているか否かを判断するための効果的な方法を提供することを更なる目的とする。
本発明は、従来技術に従った自己相関関数の使用を、入力信号の位相との同期化(synchronization)のような位相ロッキング(phase locking)と呼ばれる手法で置き換える。本発明は、検証信号のゼロ交差(zero crossing)を使用して、位相との同期を得ることを提案する。ゼロ交差は、負から正へまたは正から負へのゼロ交差のいずれかを使用することもできるし、または、その両方を使用することもできる。原理的には、極大点、極小点、または定数値との交点のようなシヌソイド(sinusoidal、正弦波)曲線のその他の点を使用することもできる。
本発明の1つの側面によって、2つのバンドパス信号が共通の基本周波数の調波であるか否かを示す基準である証拠値を判定する方法が提供される。該方法は、基礎をなすバンドパス・フィルタによってカバーされた周波数の調波関係およびゼロ交差点、極大または極小点、公差しきい値などのシヌソイド信号の有意点の距離の評価に基づく。これら有意点の距離の評価が、音声信号の場合に音声器官によって導入される周波数依存遅延を補償しながら、検証中の2つの調波の間の自動同期化(auto synchronization)を実行する。
特に、評価された距離は、0と1の範囲の非線形関数によって証拠値に対応付けされる。
更に、すべての周波数が、基本周波数である可能性のあるすべての信号と比較され、可能なすべての調波は相互に比較される。
本発明の別の側面によって、2つの信号の間の誤応答を除去する方法が提供される。該方法は、異なる調波との応答を生成する可能性のある応答が検出される場合に抑止信号を生成するステップを含み、より低い基本周波数およびその応答がより高い基本周波数を抑止する(例えば、関係f0、4f0は、f0’=2f0、2f0’=4f0を抑止する)。
本発明の更なる側面によれば、調波の証拠値を、有力(dominant)基本周波数と調波関係にある非有力(non-dominant)基本周波数から、有力基本周波数および対応する調波へ移動する方法が提供される。
また、本発明の更なる側面によれば、周波数軸に沿ってメキカンハットフィルタ(Mexican hat filter)を適用することによって、隣接するバンドパス・フィルタ・チャネル間のクロストークを削減する方法が提供される。
更に、本発明の更なる側面によれば、コンピュータ装置での実行時に、上記の方法を実施するように適合されたコンピュータ・ソフトウェア・プログラムが提供される。
更にまた、本発明の更なる側面によれば、基礎をなす基本周波数に基づいてモノラル記録された音源の分離のために上記方法が使用される。
図1は、入力信号11からフィルタ処理された2つの周波数帯域14、15を示す。本発明は、2つの周波数帯域14、15が同一の基本周波数から発生しているか否かを判断する。この場合、周波数帯域14が当該基本周波数を含むこともあり得る。調波だけの間で比較を実施することができるので、比較において実際の基本周波数が存在しなくてもよい。このような特性は、音声信号の場合に見られるように基本周波数を包含しない信号の間の比較を可能にする。
2つの周波数14、15が一つ信号源から発生しているか否かを判断する時、調波関係にあるフィルタ帯域だけが比較される。従って、2つの信号が持つ可能性のある調波の次数は事前にわかっているので、2つの信号14、15(ただし信号14は基本周波数を含むこともあり得る)が同じ基本周波数から発生して否かを判断する場合、下記の3つのパラメータは既知である。
− f0:比較の基礎となる基本周波数、
− fx(x+l)*fo:基本周波数のx番目の高調波になりうる第1の信号14の周波数、
− fy(y+1)*fo:基本周波数のy番目の高調波になりうる第2の信号15の周波数。
例えば音の信号である入力信号11が、2つのバンドパス・フィルタ12、13に供給される。バンドパス12、13の各々は、それぞれ周波数fxおよびfyの近傍の、好ましくは小さい帯域の範囲内の周波数だけを伝送する。その結果としての信号が、検証されるべき調波関係にある2つのフィルタ帯域14、15である。
実際、位相ロッキング(phase locking)と呼ばれる本発明の手法は、入力信号の位相との同期(synchronization)を対象とする。これは、フィルタ帯域14、15の有意点の間の距離を評価することによって達成される。
図2は、本発明にかかわるいくつかの有意点を示す。それらは、例えば、信号14、15の負の値から正の値へのゼロ交差点21および/または正から負へのゼロ交差点22、局所極大点23および/または極小点24、信号14、15の定数cとの低から高への交点25および/または高から低への交点26などである。
本発明によれば、検証対象の2つのフィルタ帯域14、15の有意点、例えば、ゼロ交差点が、同期しているか否かが比較される。これは、例えば、検証すべき2つのフィルタ帯域14、15のゼロ交差点の間の距離を測定することによって達成される。この場合、基本周波数に比較して、より高い調波ほどそれらのゼロ交差は相互に一層近接していることが考慮に入れられる。
図2は、異なる周波数のゼロ交差距離Tzc0、Tzc2を示す。周波数foおよびf2=3f0を有する2つの周波数は、それぞれ、基本周波数および対応する第2の調波とみなされる。信号f2のゼロ交差距離Tzc2は、信号f0のゼロ交差距離Tzc0より3倍小さい。
以下、図3および図4を参照して、2つの信号が1つの信号源から発生しているか否かを判断する本発明の方法を記述する。
図3に示されているように、第1のステップ31において、入力信号11がフィルタリングされ、検証すべき2つの周波数帯域14、15が生成される。
第2のステップ32,33において、2つの信号14、15に関する有意点の距離が測定される。この場合、考慮されるべき連続した有意点の数が、重要なパラメータである。信号14、15の周波数は異なっているので、点の数はそれぞれの信号について適合される。帯域fx=(x+1)f0に関する点の数Nxは、方程式Nx=N0(x+1)に従って当該周波数帯域の潜在的(potential)調波次数を考慮することによって、得られる。ただし、N0およびNxは、距離を測定すべき帯域f0およびfx=(x+1)f0それぞれの有意点の数であり、xは、基本周波数f0に関する周波数帯域fxの潜在的調波次数である。
3番目のステップ36において、測定された距離の差37を計算することによって距離34、35が比較される。計算された差37が所与のしきい値より小さい場合、2つの帯域14、15は同じ基本周波数の調波であると推定される。また、周波数帯域14は基本周波数であり得る。
第4のステップ38において、例えば、計算された差37がガウス関数を介して0から1の範囲の証拠値39に対応付けされる。この証拠値は、2つの周波数帯域14、15が同じ基本周波数の調波であるという事実を反映する。
図4は、本発明に従って2つの調波信号の共通源の証拠値を判定するシステムを示す。フィルタ・バンク(filter bank)41を使用して、入力信号が周波数帯域に選択的にフィルタされる。フィルタ・バンク41の出力から、下方調波14すなわちfx=(x+1)f0および上方調波15すなわちfy=(y+1)f0という2つの調波信号が選択される。
フィルタされた調波14、15の各々は、それぞれゼロ交差検出器43、44および積分器45、46に供給される。ゼロ交差検出器43、44の使用は、測定されるべき有意点がゼロ交差であるという事実に関連している。本発明の他の実施形態は、局所極大点23、極小点24、定数との低から高への交差点25または高から低への交差点26などのような他の有意点を追跡するように適合された検出器を含む。
検出されたゼロ交差点43、44が積分器45、46へ渡され、有意点の距離Nx、Nyそれぞれが測定される。比較器47が積分器45、46の測定出力を比較する。次に、非線形関数48が当該比較に基づいて証拠値39を生成する。非線形関数は、例えば、比較器47の結果を0から1までの範囲の証拠値に対応付けるガウス関数である。
以下に記述する本発明の実施形態においては、測定されるべき有意点はゼロ交差である。
本発明は、測定の基礎として基本周波数の予想される距離を使用することを提案する。2つの周波数帯域14、15に関して、検証すべき信号の調波次数から予想される限りの数のゼロ交差との間の距離(例えば、1つのゼロ交差から開始して2f0に関する次のゼロ交差までの距離)が測定される。検証すべきフィルタ帯域14、15の両方について、これらのゼロ交差の距離が比較される。
2つのゼロ交差測定値の距離に基づいて、2つの信号14、15が同一の基本周波数から発生しているか否かが判断される。差がゼロに近ければ(例えば、所与の下方しきい値より小さければ)、それらは同一の基本周波数から発生していると推量され、従って、証拠値は高い。差が(所与の上方しきい値に比較して)大きければ、それらは同一の基本周波数から発生している可能性は低いと推量され、従って、証拠値は低い。
距離の証拠値への対応付けは、0から1の範囲の非線形関数(例えばガウス関数)によって実施される。基本周波数および対応する調波の共通源が声門励起信号(glottal excitation signal)であるため、基本周波数および調波は相互に同期する。この同期性は、その時点の音声に依存する周波数依存遅延を引き起こす発声器官の影響によって乱される。ゼロ交差の差の追跡は、検証中の2つの調波を自動的に同期させるので、そのような遅延の適合型除去を可能にする。
基礎をなす基本周波数および調波周波数が変化する場合でも、それらすべてが同じように変化し、従って、ゼロ交差の相対的距離は影響を受けないので、2つの信号14、15の対応関係を検出することができる。計算された証拠値は、基本周波数、フィルタ帯域および時間に関する前述の3次元空間に記録される。検証中の信号の各々について、最後に計算された証拠値が、3次元空間の基本周波数軸の予想基本周波数位置および周波数帯域軸の当該信号に対応する周波数帯域位置に追加される。
このようにして、証拠値が基本周波数の1つの周期に関して2つの信号の関係の測定結果を示す。基本周波数の次の周期に関する証拠値の計算の際には、基本周波数の直前の周期に関して使用された最後のゼロ交差から計算が開始される。
従来の手法においては、自己相関を使用する場合、自己相関におけるピークの幅、従って、信号の調波関係の評価の基礎は、信号の周波数に依存する。低い周波数の信号は幅広いピークを持ち、従って、測定は非常に粗い。本発明のアルゴリズムは、測定の解像度がサンプリング・点の距離、従って、サンプリング率にのみ依存する。従って、その精度は、すべての周波数に関して、自己相関を使用する場合と同じかまたはそれより高い。従って、自己相関法とは対照的に、本発明のアルゴリズムは、1つの共通の基本周波数から発生してはいないがたまたま調波関係に近い2つの信号14、15を見分けることができる。
比較の間、実際の基本周波数15および可能な調波14、15は同等に扱われる。これは、一方で基本周波数とその可能な調波との間の比較が実行され、他方で1つの基本周波数の可能な調波の間だけの比較が実行されることを意味する。フィルタ帯域の比較だけを使用する場合、可能な基本周波数値は、信号の分解に使用されたバンドパス・フィルタの中心周波数と区別される。異なった信号源への信号コンポーネントの割り当ても周波数帯域に基づいているので、この方法は本発明のアルゴリズムの有用性を制約するものではない。更に、ゼロ交差の差の実際の値を使用することによって、基本周波数の一層精度の高い評価を達成することができる。
本発明のアルゴリズムの適用に関する上限周波数はサンプリング率によって判定される。ゼロ交差が相互に接近しすぎている場合(検証中の信号の周波数がサンプリング率と比較してあまりにも高い場合)、有意な証拠値を計算することができない。また、ゼロ交差の最小距離の実際の値は入力信号のノイズにも依存する。正から負へまたは負から正へのゼロ交差のいずれかだけを使用する場合の適切なサンプル数は4であり、この場合、上限周波数は、サンプリング周波数の5分の1となる。
一定の範囲(例えば、50-1000Hz)のすべての可能な基本周波数を(サンプリング率によって制限される)すべての調波と比較し、また、すべての調波を相互に比較することによって、1つの所与の信号が所与の基本周波数から発生していることの複数の手がかりが得られる。このような刺激的結果を減殺させるため、そして、1つの調波は1つの基本周波数からのみ発生することができるので、抑止プロセスが提案される。調波4f0がf0から発生していると識別されるとすれば、可能な基本周波数f0’=2f0は抑止入力を受け取る(例えば、抑止入力は、入力された刺激的入力の負である)。このようにして、最も低い周波数を持つ基本周波数が一層可能性のあるものと仮定される。
可能な調波のすべての組み合わせを比較した後、すべての周波数帯域の証拠値を合計することによって、所与の瞬間における最有力の基本周波数が判定される。最有力基本周波数が判定される時、第2の抑止プロセス段階において、最有力でない(すなわち最有力周波数と調波関係にある)基本周波数のすべての証拠値が最有力基本周波数および対応する調波に移動される。最有力でない基本周波数に関するこのような誤った証拠値は、最有力と最有力でない基本周波数との間の調波関係の結果であり、そのため、ゼロ交差の距離測定によって真の基本周波数とそれらを区別することができなくなる。
バンドパス・フィルタを使用して入力信号を分解する時、調波は、その調波の周波数に最も近い中心周波数との応答をフィルタに生成するが、フィルタ選択の限界のため周辺フィルタに一層弱い応答をも生成する。このようなクロストークを抑止するため、隣接したバンドパス信号のエンベロープがフィルタされるような方法で周波数軸に沿ってメキシカンハット・フィルタを適用することが提案される。調波の周波数の変化を乱さないため、すなわち、1つのフィルタ・チャネルから他のフィルタ・チャネルへの調波の主応答の移行を乱さないため、フィルタの中心ピークは、1より広く選択されなければならない。
本発明に従った、入力信号からフィルタされた2つの周波数を取得する方法を示すブロック図である。 本発明に関する周波数帯域の有意点を示すブロック図である。 本発明に従った、2つの周波数コンポーネントが1つの共通基本周波数から生じているか否かを判断するプロセスの流れ図である。 本発明に従った、2つの調波信号の共通信号源の証拠値を判定するシステムのブロック図である。
符号の説明
12、13 バンドパス・フィルタ
14、15 バンドパス信号または調波
21、22 ゼロ交差点
23、24 極大/極小点
25、26 定数との交差点
32、33 距離
39 証拠値

Claims (14)

  1. 2つのバンドパス信号が共通の基本周波数の調波であるか否かを示す尺度である証拠値を判定する方法であって、
    前記方法は、基礎をなすバンドパス・フィルタによってカバーされた周波数の調波関係、およびゼロ交差点、極大点、極小点、公差しきい値などのシヌソイド信号の有意点の距離を評価し、
    前記有意点の距離の評価は、周波数依存遅延を補償しながら、検証中の2つの調波の間の自動同期化を実行する、方法。
  2. 前記評価された距離が、0と1の範囲の非線形関数によって証拠値に対応付けられる、請求項1に記載の方法。
  3. 全ての信号が、基本周波数となりうる全ての信号と比較され、起こりうる全ての調波と相互に比較される、請求項1または請求項2に記載の方法。
  4. 2つの信号の間の誤応答を除去する方法であって、
    該方法が、異なる調波との応答を生成する可能性のある応答が検出される場合抑止信号を生成するステップを含み、
    より低い基本周波数およびその応答が、より高い基本周波数を抑止する、方法。
  5. 調波の証拠値を、有力基本周波数と調波関係にある非有力基本周波数から、該有力基本周波数および対応する調波へ移動させる方法。
  6. 周波数軸に沿ってメキシカンハット・フィルタを適用することによって隣接するバンドパス・フィルタ・チャネル間のクロストークを削減する方法。
  7. コンピュータ装置での実行時に、請求項1乃至請求項6のいずれかに記載の方法を実施するように適合されたコンピュータ・ソフトウェア・プログラム。
  8. 2つのバンドパス信号が共通の基本周波数の調波であるか否かを示す尺度である証拠値を判定するコンピュータ処理手段であって、
    該コンピュータ処理手段が、
    基礎をなすバンドパス・フィルタによってカバーされた周波数の調波関係を評価する手段と、
    ゼロ交差点、極大点、極小点、公差しきい値などの、シヌソイド信号の有意点距離を評価する手段と、
    を含み、
    前記有意点の距離の評価は、周波数依存遅延を補償しながら、検証中の2つの調波の間の自動同期化を実行する、
    コンピュータ処理手段。
  9. 前記評価された距離を0と1の範囲の非線形関数によって証拠値に対応付けする手段を含む、請求項8に記載のコンピュータ処理手段。
  10. 全ての信号を基本周波数となりうる全ての信号と比較し、起こりうる全ての調波を相互に比較する手段を含む、請求項8または請求項9に記載のコンピュータ処理手段。
  11. 請求項4乃至請求項6のいずれかに記載の方法を実施するように設計されたコンピュータ処理手段。
  12. 基礎をなす基本周波数に基づいてモノラル記録された音源の分離のために使用される、請求項1乃至請求項6のいずれかに記載の方法。
  13. 信号源からノイズを分離するために使用される、請求項1乃至請求項6のいずれかに記載の方法。
  14. 信号に共通に存在する種々の信号源から発生する信号コンポーネントを分離するために使用される、請求項1乃至請求項6のいずれかに記載の方法。
JP2005162480A 2004-06-04 2005-06-02 2つの調波信号の共通源の判定方法 Expired - Fee Related JP4790318B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP04013275.5 2004-06-04
EP04013275 2004-06-04
EP04017773.5 2004-07-27
EP04017773A EP1605437B1 (en) 2004-06-04 2004-07-27 Determination of the common origin of two harmonic components

Publications (2)

Publication Number Publication Date
JP2005346078A true JP2005346078A (ja) 2005-12-15
JP4790318B2 JP4790318B2 (ja) 2011-10-12

Family

ID=34925953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005162480A Expired - Fee Related JP4790318B2 (ja) 2004-06-04 2005-06-02 2つの調波信号の共通源の判定方法

Country Status (3)

Country Link
US (1) US7895033B2 (ja)
EP (1) EP1605437B1 (ja)
JP (1) JP4790318B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7497040B2 (ja) 2020-10-15 2024-06-10 東京都公立大学法人 音響信号処理装置、音響信号処理方法及びプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110436B (zh) * 2009-12-28 2012-05-09 中兴通讯股份有限公司 一种基于语音包络特征的标志音识别方法及装置
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
US11723579B2 (en) 2017-09-19 2023-08-15 Neuroenhancement Lab, LLC Method and apparatus for neuroenhancement
US11717686B2 (en) 2017-12-04 2023-08-08 Neuroenhancement Lab, LLC Method and apparatus for neuroenhancement to facilitate learning and performance
WO2019133997A1 (en) 2017-12-31 2019-07-04 Neuroenhancement Lab, LLC System and method for neuroenhancement to enhance emotional response
US11364361B2 (en) 2018-04-20 2022-06-21 Neuroenhancement Lab, LLC System and method for inducing sleep by transplanting mental states
CN113382683A (zh) 2018-09-14 2021-09-10 纽罗因恒思蒙特实验有限责任公司 改善睡眠的系统和方法
US11786694B2 (en) 2019-05-24 2023-10-17 NeuroLight, Inc. Device, method, and app for facilitating sleep

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09307624A (ja) * 1996-05-10 1997-11-28 Sony Corp 信号確認装置、電話装置、信号確認方法
JPH10207455A (ja) * 1996-11-20 1998-08-07 Yamaha Corp 音信号分析装置及び方法
JP2004021224A (ja) * 2002-06-20 2004-01-22 Victor Co Of Japan Ltd デジタル音声処理方法及び装置、並びにコンピュータプログラム
JP2005055612A (ja) * 2003-08-01 2005-03-03 Korg Inc ピッチ検出方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3622706A (en) * 1969-04-29 1971-11-23 Meguer Kalfaian Phonetic sound recognition apparatus for all voices
US3629510A (en) 1969-11-26 1971-12-21 Bell Telephone Labor Inc Error reduction logic network for harmonic measurement system
NL7410763A (nl) * 1974-08-12 1976-02-16 Philips Nv Digitaal transmissiestelsel voor het met een lage pulsfrequentie(bit-rate)overdragen van gespreks- signalen en een zender voor toepassing in zulk een stelsel.
US4091237A (en) 1975-10-06 1978-05-23 Lockheed Missiles & Space Company, Inc. Bi-Phase harmonic histogram pitch extractor
US4640134A (en) * 1984-04-04 1987-02-03 Bio-Dynamics Research & Development Corporation Apparatus and method for analyzing acoustical signals
US4783805A (en) 1984-12-05 1988-11-08 Victor Company Of Japan, Ltd. System for converting a voice signal to a pitch signal
US4905285A (en) 1987-04-03 1990-02-27 American Telephone And Telegraph Company, At&T Bell Laboratories Analysis arrangement based on a model of human neural responses
EP0459362B1 (en) 1990-05-28 1997-01-08 Matsushita Electric Industrial Co., Ltd. Voice signal processor
US5136267A (en) * 1990-12-26 1992-08-04 Audio Precision, Inc. Tunable bandpass filter system and filtering method
US6130949A (en) 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
US6563298B1 (en) 2000-08-15 2003-05-13 Ltx Corporation Separating device response signals from composite signals
US7076433B2 (en) * 2001-01-24 2006-07-11 Honda Giken Kogyo Kabushiki Kaisha Apparatus and program for separating a desired sound from a mixed input sound
US20030084277A1 (en) 2001-07-06 2003-05-01 Dennis Przywara User configurable audio CODEC with hot swappable audio/data communications gateway having audio streaming capability over a network
US7377233B2 (en) 2005-01-11 2008-05-27 Pariff Llc Method and apparatus for the automatic identification of birds by their vocalizations
US20070083365A1 (en) 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09307624A (ja) * 1996-05-10 1997-11-28 Sony Corp 信号確認装置、電話装置、信号確認方法
JPH10207455A (ja) * 1996-11-20 1998-08-07 Yamaha Corp 音信号分析装置及び方法
JP2004021224A (ja) * 2002-06-20 2004-01-22 Victor Co Of Japan Ltd デジタル音声処理方法及び装置、並びにコンピュータプログラム
JP2005055612A (ja) * 2003-08-01 2005-03-03 Korg Inc ピッチ検出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7497040B2 (ja) 2020-10-15 2024-06-10 東京都公立大学法人 音響信号処理装置、音響信号処理方法及びプログラム

Also Published As

Publication number Publication date
US20050278173A1 (en) 2005-12-15
US7895033B2 (en) 2011-02-22
JP4790318B2 (ja) 2011-10-12
EP1605437A1 (en) 2005-12-14
EP1605437B1 (en) 2007-08-29

Similar Documents

Publication Publication Date Title
JP4790318B2 (ja) 2つの調波信号の共通源の判定方法
JP5101316B2 (ja) 基本周波数の高調波及び分数調波の抑制を用いたピッチ抽出
RU2731372C2 (ru) Способ и система для разложения акустического сигнала на звуковые объекты, а также звуковой объект и его использование
KR100880480B1 (ko) 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
US8949118B2 (en) System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise
KR101670313B1 (ko) 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법
JP2009511954A (ja) モノラルオーディオ信号からオーディオソースを分離するためのニューラル・ネットワーク識別器
JP2004528599A (ja) オーディトリーイベントに基づく特徴付けを使ったオーディオの比較
JP4740609B2 (ja) 有声音および無声音の検出装置、並びにその方法
JP4790319B2 (ja) 解決調波および未解決調波の統一処理方法
CN107210029B (zh) 用于处理一连串信号以进行复调音符辨识的方法和装置
Muhammad Extended average magnitude difference function based pitch detection
JP4705480B2 (ja) 高調波信号の基本周波数を求める方法
EP3504708B1 (en) A device and method for classifying an acoustic environment
JP2005292207A (ja) 音楽分析の方法
KR100659884B1 (ko) 음악에서의 비브라토 자동 검출방법
Parikh et al. Harmonicity plays a critical role in DNN based versus in biologically-inspired monaural speech segregation systems
Llerena et al. Pitch detection in pathological voices driven by three tailored classical pitch detection algorithms
Xie et al. Feature extraction based on bandpass filtering for frog call classification
WO2016185757A1 (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
Bartkowiak et al. Hybrid sinusoidal modeling of music with near transparent audio quality
Abraham et al. Cumulative Impulse Strength Based Epoch Extraction from Singing Voice
CN1707610B (zh) 对两个谐波信号的共同起源的确定
Fong Adaptive Pitch Detection employing the use of Fast Fourier Transform and Autocorrelation Function
TWI410958B (zh) 用於處理音訊信號之方法與裝置及相關軟體程式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100930

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101005

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110720

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

LAPS Cancellation because of no payment of annual fees