JP2005049869A - 非定常信号の成分を検出する方法 - Google Patents
非定常信号の成分を検出する方法 Download PDFInfo
- Publication number
- JP2005049869A JP2005049869A JP2004214545A JP2004214545A JP2005049869A JP 2005049869 A JP2005049869 A JP 2005049869A JP 2004214545 A JP2004214545 A JP 2004214545A JP 2004214545 A JP2004214545 A JP 2004214545A JP 2005049869 A JP2005049869 A JP 2005049869A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- matrix
- components
- stationary
- negative matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 30
- 230000002123 temporal effect Effects 0.000 claims abstract description 15
- 230000000007 visual effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000013001 matrix buffer Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000012723 sample buffer Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- IJJWOSAXNHWBPR-HUBLWGQQSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-n-(6-hydrazinyl-6-oxohexyl)pentanamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCCCC(=O)NN)SC[C@@H]21 IJJWOSAXNHWBPR-HUBLWGQQSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000018459 dissociative disease Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005057 finger movement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
【解決手段】取得された非定常信号は、サンプリングおよび変換され、デジタル化されたサンプル121は、ウィンドウ処理される。変換が各フレーム131に適用され、特徴141が生成される。特徴141を使用して、非負行列151が構成される。非負行列151は、異なる時間における非定常信号の特徴を表す列を含む。非負行列151は因子分解され、信号の特徴プロファイル161および時間的プロファイル162が生成される。
【選択図】図2
Description
図1および図2に示すように、本発明は、非定常信号の成分を検出し、成分の間の時間的関係を求めるシステム100および方法200を提供する。
システム100は、センサ110、たとえばマイクロフォン、アナログ/デジタル(A/D)変換器120、サンプルバッファ130、変換器140、行列バッファ150、および因子分解器160を備え、これらは互いに直列接続される。取得された非定常信号111は、A/D変換器120に入力され、A/D変換器120は、サンプル121をサンプルバッファ130に出力する。サンプルは、ウィンドウ処理され、変換器140のためのフレーム131が生成され、変換器140は、特徴141、たとえば、振幅スペクトルを行列バッファ150に出力する。非負行列151が因子分解され(160)、これらもまた非負行列である特徴プロファイル161および時間的プロファイル162が生成される。
ピアノ101により、音響信号102が生成される。音響信号は、たとえば、マイクロフォン110により取得される(210)。取得された信号111は、サンプリングされて変換され(220)、デジタル化されたサンプル121は、ウィンドウ処理される(230)。変換140が各フレーム131に適用され(240)、特徴141が生成される。特徴141を使用して、非負行列151が構成される(250)。行列151は因子分解され(260)、信号102の特徴プロファイル161および時間的プロファイル162になる。
時間可変信号102の一例は、s(t)=g(αt)sin(γt)+g(βt)sin(δt)により表現することができる。ただし、g(・)は、周期2πを有するゲート関数であり、α、β、γ、δは、任意のスカラーであり、αおよびβは、少なくともγおよびδよりも小さい桁を有する。長さのサイズLを有するフレームx(t)131の特徴141は、変換x(t)=|DFT([s(t)・・・s(t+L)])|140により求められる。
図4A〜図4Bに示すように、非負行列F∈RM×Nは、要素から再構成された非負行列における誤差が最小化されるような2つの非負行列W∈RM×R(162)およびH∈RR×N(161)に因子分解される。ただし、R≦Mである。
本発明によるシステムおよび方法が、バッハのフーガ16番ト短調のピアノ録音に適用された。Jarrett著「J. S. Bach, Das Wohltemperierte Klavier, Buch I」ECM Records, CD2, Track 8, 1988を参照願いたい。図5は、1つの音符が二度繰り返されている4つの別個の音符の一小節501を示す。録音は、44100kHzのレートでサンプリングされ、ステレオ信号の左右のチャネルを平均化することによりモノラル信号に変換された。サンプルは、ハニング窓を使用してウィンドウ処理された。4096点の離散フーリエ変換を各フレームに適用して、非負行列の列を生成した。第1の行列が、第1の費用関数を使用してR=4について因子分解された。
本発明は、1D線形音響信号に限定されない。成分は、より高い次元、たとえば2Dを有する非定常信号においても検出することができる。この場合、ピアノ101は、同じままである。信号102は、ここでは視覚信号であり、センサ110は、視覚信号をピクセルに変換するカメラであり、ピクセルは、時間の経過に伴って領域サイズ(X、Y)を有するフレーム131にサンプリングされる。フレームは、検出および相関に特徴付けることが望ましい特徴、たとえば、強度、色、テクスチャ、および動きに応じて、多くの方法で、たとえばラスタ化、FFT、DCT、DFT、フィルタリング等により変換する(140)ことができる。
Claims (8)
- 非定常信号の成分を検出する方法であって、
前記非定常信号を取得することと、
異なる時間における前記非定常信号の特徴を表す列を含む行列として、前記非定常信号の非負行列を構成することと、
前記非負行列を特徴プロファイルおよび時間的プロファイルに因子分解することと
を含む非定常信号の成分を検出する方法。 - 前記非負行列は、M個の時間順に並べられた列を有し、Mは、長さLの信号の場合にM=(L/2+1)のような、前記特徴が累積されるヒストグラムビンの総数である請求項1に記載の方法。
- 前記非負行列は、RM×Nとして表現され、前記時間的プロファイルは、RM×Rとして表現され、前記特徴プロファイルは、RR×Nとして表現される(ただし、R≦Mであり、Rは検出すべき成分の数である)請求項2に記載の方法。
- 前記非定常信号は、音響信号である請求項1に記載の方法。
- 前記非定常信号は、2D視覚信号である請求項1に記載の方法。
- 前記非定常信号は、3D走査信号であり、前記信号のフレームは、ボリュームを表す請求項1に記載の方法。
- 前記成分Rの数は、既知である請求項3に記載の方法。
- 前記成分Rの数は、成分の推定数である請求項3に記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/626,456 US7672834B2 (en) | 2003-07-23 | 2003-07-23 | Method and system for detecting and temporally relating components in non-stationary signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005049869A true JP2005049869A (ja) | 2005-02-24 |
JP4606800B2 JP4606800B2 (ja) | 2011-01-05 |
Family
ID=34080435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004214545A Expired - Fee Related JP4606800B2 (ja) | 2003-07-23 | 2004-07-22 | 非定常信号の成分を検出するシステム、および非定常信号の成分を検出するシステムに用いられる方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7672834B2 (ja) |
JP (1) | JP4606800B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005258440A (ja) * | 2004-03-12 | 2005-09-22 | Mitsubishi Electric Research Laboratories Inc | 別個の信号の成分を分離する方法およびシステム |
JP2010507943A (ja) * | 2006-10-24 | 2010-03-11 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム |
JP2014036601A (ja) * | 2012-08-14 | 2014-02-27 | Institute Of National Colleges Of Technology Japan | セルロースの加水分解方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0421711D0 (en) * | 2004-09-30 | 2004-11-03 | Cambridge Display Tech Ltd | Multi-line addressing methods and apparatus |
GB0428191D0 (en) * | 2004-12-23 | 2005-01-26 | Cambridge Display Tech Ltd | Digital signal processing methods and apparatus |
GB0421712D0 (en) * | 2004-09-30 | 2004-11-03 | Cambridge Display Tech Ltd | Multi-line addressing methods and apparatus |
GB0421710D0 (en) | 2004-09-30 | 2004-11-03 | Cambridge Display Tech Ltd | Multi-line addressing methods and apparatus |
TWI268709B (en) * | 2005-08-26 | 2006-12-11 | Realtek Semiconductor Corp | Digital filtering device and related method |
GB2436390B (en) * | 2006-03-23 | 2011-06-29 | Cambridge Display Tech Ltd | Image processing systems |
GB2436391B (en) * | 2006-03-23 | 2011-03-16 | Cambridge Display Tech Ltd | Image processing systems |
US20080147356A1 (en) * | 2006-12-14 | 2008-06-19 | Leard Frank L | Apparatus and Method for Sensing Inappropriate Operational Behavior by Way of an Array of Acoustical Sensors |
US8015003B2 (en) * | 2007-11-19 | 2011-09-06 | Mitsubishi Electric Research Laboratories, Inc. | Denoising acoustic signals using constrained non-negative matrix factorization |
US20100138010A1 (en) * | 2008-11-28 | 2010-06-03 | Audionamix | Automatic gathering strategy for unsupervised source separation algorithms |
US20100174389A1 (en) * | 2009-01-06 | 2010-07-08 | Audionamix | Automatic audio source separation with joint spectral shape, expansion coefficients and musical state estimation |
US8340943B2 (en) * | 2009-08-28 | 2012-12-25 | Electronics And Telecommunications Research Institute | Method and system for separating musical sound source |
KR20120031854A (ko) * | 2010-09-27 | 2012-04-04 | 한국전자통신연구원 | 시간 및 주파수 특징을 이용하는 음악 음원 분리 장치 및 방법 |
FR2968921B1 (fr) * | 2010-12-15 | 2013-01-11 | Commissariat Energie Atomique | Procede de localisation d'un marqueur optique dans un milieu diffusant |
JP6274872B2 (ja) * | 2014-01-21 | 2018-02-07 | キヤノン株式会社 | 音処理装置、音処理方法 |
CN105304073B (zh) * | 2014-07-09 | 2019-03-12 | 中国科学院声学研究所 | 一种敲击弦乐器的音乐多音符估计方法及系统 |
WO2020041730A1 (en) * | 2018-08-24 | 2020-02-27 | The Trustees Of Dartmouth College | Microcontroller for recording and storing physiological data |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5751899A (en) * | 1994-06-08 | 1998-05-12 | Large; Edward W. | Method and apparatus of analysis of signals from non-stationary processes possessing temporal structure such as music, speech, and other event sequences |
US5966691A (en) * | 1997-04-29 | 1999-10-12 | Matsushita Electric Industrial Co., Ltd. | Message assembler using pseudo randomly chosen words in finite state slots |
US6389377B1 (en) * | 1997-12-01 | 2002-05-14 | The Johns Hopkins University | Methods and apparatus for acoustic transient processing |
US6151414A (en) * | 1998-01-30 | 2000-11-21 | Lucent Technologies Inc. | Method for signal encoding and feature extraction |
US6148284A (en) * | 1998-02-23 | 2000-11-14 | At&T Corporation | Method and apparatus for automatic speech recognition using Markov processes on curves |
US6847737B1 (en) * | 1998-03-13 | 2005-01-25 | University Of Houston System | Methods for performing DAF data filtering and padding |
US6610917B2 (en) * | 1998-05-15 | 2003-08-26 | Lester F. Ludwig | Activity indication, external source, and processing loop provisions for driven vibrating-element environments |
US6691073B1 (en) * | 1998-06-18 | 2004-02-10 | Clarity Technologies Inc. | Adaptive state space signal separation, discrimination and recovery |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US6253162B1 (en) * | 1999-04-07 | 2001-06-26 | Battelle Memorial Institute | Method of identifying features in indexed data |
US6321200B1 (en) * | 1999-07-02 | 2001-11-20 | Mitsubish Electric Research Laboratories, Inc | Method for extracting features from a mixture of signals |
US6434515B1 (en) * | 1999-08-09 | 2002-08-13 | National Instruments Corporation | Signal analyzer system and method for computing a fast Gabor spectrogram |
NL1013500C2 (nl) * | 1999-11-05 | 2001-05-08 | Huq Speech Technologies B V | Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. |
WO2002017538A2 (en) * | 2000-08-18 | 2002-02-28 | The Regents Of The University Of California | Fixed, variable and adaptive bit rate data source encoding (compression) method |
US6961473B1 (en) * | 2000-10-23 | 2005-11-01 | International Business Machines Corporation | Faster transforms using early aborts and precision refinements |
IL145245A0 (en) * | 2001-09-03 | 2002-06-30 | Jtc 2000 Dev Delaware Inc | System and method including vector-matrix multiplication |
US6711528B2 (en) * | 2002-04-22 | 2004-03-23 | Harris Corporation | Blind source separation utilizing a spatial fourth order cumulant matrix pencil |
US6931362B2 (en) * | 2003-03-28 | 2005-08-16 | Harris Corporation | System and method for hybrid minimum mean squared error matrix-pencil separation weights for blind source separation |
US7415392B2 (en) * | 2004-03-12 | 2008-08-19 | Mitsubishi Electric Research Laboratories, Inc. | System for separating multiple sound sources from monophonic input with non-negative matrix factor deconvolution |
-
2003
- 2003-07-23 US US10/626,456 patent/US7672834B2/en not_active Expired - Fee Related
-
2004
- 2004-07-22 JP JP2004214545A patent/JP4606800B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
JPN6010033516, Daniel D. Lee, "Learning the parts of objects by non−negative matrix factorization", Nature, 19991021, 401, 788−791 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005258440A (ja) * | 2004-03-12 | 2005-09-22 | Mitsubishi Electric Research Laboratories Inc | 別個の信号の成分を分離する方法およびシステム |
JP2010507943A (ja) * | 2006-10-24 | 2010-03-11 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム |
JP2014036601A (ja) * | 2012-08-14 | 2014-02-27 | Institute Of National Colleges Of Technology Japan | セルロースの加水分解方法 |
Also Published As
Publication number | Publication date |
---|---|
US7672834B2 (en) | 2010-03-02 |
JP4606800B2 (ja) | 2011-01-05 |
US20050021333A1 (en) | 2005-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4606800B2 (ja) | 非定常信号の成分を検出するシステム、および非定常信号の成分を検出するシステムに用いられる方法 | |
US10019998B2 (en) | Detecting distorted audio signals based on audio fingerprinting | |
JP4810109B2 (ja) | 別個の信号の成分を分離する方法およびシステム | |
Hammer et al. | A seismic‐event spotting system for volcano fast‐response systems | |
EP1941493B1 (en) | Content-based audio comparisons | |
EP0134238A1 (en) | Signal processing and synthesizing method and apparatus | |
US20050102144A1 (en) | Speech synthesis | |
JP2778567B2 (ja) | 信号符号化装置及び方法 | |
WO2007044377A2 (en) | Neural network classifier for seperating audio sources from a monophonic audio signal | |
Smaragdis | Discovering auditory objects through non-negativity constraints | |
CN110428364B (zh) | 帕金森声纹语谱图样本扩充方法、装置及计算机存储介质 | |
CN112750442B (zh) | 一种具有小波变换的朱鹮种群生态体系监测系统及其方法 | |
JP2000194400A (ja) | 雑音の多い音響信号を処理する方法および装置 | |
Erçelebi | Second generation wavelet transform-based pitch period estimation and voiced/unvoiced decision for speech signals | |
JP2019515323A (ja) | スペクトログラムに対する構造テンソルを用いた調波打楽器残差音声分離装置および方法 | |
Monaci et al. | Learning bimodal structure in audio–visual data | |
Goldstein et al. | Guitar Music Transcription from Silent Video. | |
Pilia et al. | Time scaling detection and estimation in audio recordings | |
JP2021071586A (ja) | 音抽出システム及び音抽出方法 | |
Siva Teja et al. | Identification of sloshing noises using convolutional neural network | |
Lancia et al. | Automatic quantitative analysis of ultrasound tongue contours via wavelet-based functional mixed models | |
CN112735442B (zh) | 一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法 | |
Wan et al. | Precise temporal localization of sudden onsets in audio signals using the wavelet approach | |
US9734844B2 (en) | Irregularity detection in music | |
CN116866783B (zh) | 一种智慧教室音频控制系统、方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101005 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101006 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |