JP4041154B2 - 混合音分離装置 - Google Patents
混合音分離装置 Download PDFInfo
- Publication number
- JP4041154B2 JP4041154B2 JP2006522162A JP2006522162A JP4041154B2 JP 4041154 B2 JP4041154 B2 JP 4041154B2 JP 2006522162 A JP2006522162 A JP 2006522162A JP 2006522162 A JP2006522162 A JP 2006522162A JP 4041154 B2 JP4041154 B2 JP 4041154B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- frequency
- local
- frequency information
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 claims description 332
- 238000001228 spectrum Methods 0.000 claims description 32
- 238000000926 separation method Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 25
- 230000002123 temporal effect Effects 0.000 claims description 14
- 239000012491 analyte Substances 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 claims 10
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 48
- 238000007796 conventional method Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000009413 Ratibida columnifera Nutrition 0.000 description 1
- 241000510442 Ratibida peduncularis Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007788 roughening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
中野宏毅、外2名、"ウェーブレットによる信号処理と画像処理"、1999年8月15日、共立出版株式会社、pp.35−39、pp.49−52 中川聖一、"パターン情報処理"、平成11年3月30日、丸善株式会社、pp.14−19
101 マイクロホン
102 周波数分析装置
103,103A 分析波形時間幅決定部
104 分析波形分割部
105,105A 局所周波数情報作成部
106,106A 被分析波形周波数特徴量抽出部
107 音変換部
108 スピーカ
1000 周波数情報作成装置
1001 周波数特徴量分析装置
1002 周波数分解能決定部
S100 混合音
S101 分析波形
S102 局所分析波形
S103 局所周波数情報
S104 周波数特徴量(抽出音のフーリエ係数)
S105 抽出音
S1000 局所周波数情報DB
Claims (10)
- 複数の音から構成される混合音中より特定の音を分離する混合音分離装置であって、
前記混合音中の波形である被分析波形と時間が対応付けられ、かつ、前記被分析波形を分析する周波数の成分を有する分析波形の一部を構成し同一の時空間分解能を有する複数の局所分析波形を用いて、前記局所分析波形と時間が対応する被分析波形の周波数を分析することによって、前記分析する周波数における振幅スペクトルおよび位相スペクトルの少なくとも一方を含む前記局所分析波形に対応する複数の局所周波数情報を求める局所周波数情報作成手段と、
前記複数の局所周波数情報を組とし、当該組と予め定められた特定の音に対する複数の周波数情報の組であって予め記憶された複数の組との間のパターンマッチングを行ない、当該パターンマッチングの結果に基づいて、前記複数の局所周波数情報の組を抽出する特定音周波数特徴量抽出手段と、
前記特定音周波数特徴量抽出手段で抽出された前記組における複数の局所周波数情報の総和を求め、前記局所周波数情報作成手段において前記複数の局所周波数情報を求める際に使用した周波数変換の逆の周波数変換を前記総和に適用することによって前記特定の音の信号を作成する音信号作成手段とを備える
ことを特徴とする混合音分離装置。 - 前記特定音周波数特徴量抽出手段は、前記複数の局所周波数情報を組とし、当該組と予め定められた特定の音に対する複数の周波数情報の組であって予め記憶された複数の組との間の距離を算出し、当該距離が所定の閾値以下の場合に、前記複数の局所周波数情報の組を抽出する
ことを特徴とする請求項1に記載の混合音分離装置。 - 前記特定音周波数特徴量抽出手段は、前記複数の局所周波数情報を組とし、当該組と予め定められた特定の音に対する複数の周波数情報の組であって予め記憶された複数の組との間の類似度を算出し、当該類似度が所定の閾値以上の場合に、前記複数の局所周波数情報の組を抽出する
ことを特徴とする請求項1に記載の混合音分離装置。 - さらに、前記同一の時空間分解能に基づいて、前記分析波形を、時間的に重なることを許して分割して、前記複数の局所分析波形を作成する分析波形分割手段を備える
ことを特徴とする請求項1に記載の混合音分離装置。 - さらに、時空間分解能の入力を受付ける時空間分解能入力受付手段を備え、
前記分析波形分割手段は、入力された前記時空間分解能に基づいて、前記分析波形を分割して、前記複数の局所分析波形を作成する
ことを特徴とする請求項4に記載の混合音分離装置。 - さらに、前記同一の時空間分解能に基づいて、前記分析波形を、時間的に重なることのないように分割して、前記複数の局所分析波形を作成する分析波形分割手段を備える
ことを特徴とする請求項1に記載の混合音分離装置。 - 被分析波形と時間が対応付けられ、かつ、前記被分析波形を分析する周波数の成分を有する分析波形を用いて、前記被分析波形を周波数分析するための周波数情報を作成する局所周波数情報作成装置であって、
前記分析波形の一部を構成し同一の時空間分解能を有する複数の局所分析波形を用いて、前記局所分析波形と時間が対応する被分析波形の周波数を分析することによって、前記分析する周波数における振幅スペクトルおよび位相スペクトルの少なくとも一方を含む前記局所分析波形に対応する複数の局所周波数情報を求める局所周波数情報作成手段と、
前記複数の局所周波数情報を組として、所定の記憶装置に格納する格納手段とを備える
ことを特徴とする局所周波数情報作成装置。 - 被分析波形と時間が対応付けられ、かつ、前記被分析波形を分析する周波数の成分を有する分析波形を用いて、前記被分析波形を周波数分析する装置であって、
前記分析波形の一部を構成し同一の時空間分解能を有する複数の局所分析波形を用いて、前記局所分析波形と時間が対応する被分析波形の周波数を分析することによって、前記分析する周波数における振幅スペクトルおよび位相スペクトルの少なくとも一方を含む前記局所分析波形に対応する複数の局所周波数情報を取得する取得手段と、
前記取得手段が取得した前記複数の局所周波数情報を組とし、当該組と予め定められた特定の音に対する複数の周波数情報の組であって予め記憶された複数の組との間のパターンマッチングを行ない、当該パターンマッチングの結果に基づいて、前記複数の局所周波数情報の組を抽出する被分析波形周波数特徴量抽出手段とを備える
ことを特徴とする周波数特徴量分析装置。 - 複数の音から構成される混合音中より特定の音を分離する混合音分離方法であって、
前記混合音中の波形である被分析波形と時間が対応付けられ、かつ、前記被分析波形を分析する周波数の成分を有する分析波形の一部を構成し同一の時空間分解能を有する複数の局所分析波形を用いて、前記局所分析波形と時間が対応する被分析波形の周波数を分析することによって、前記分析する周波数における振幅スペクトルおよび位相スペクトルの少なくとも一方を含む前記局所分析波形に対応する複数の局所周波数情報を求める局所周波数情報作成ステップと、
前記複数の局所周波数情報を組とし、当該組と予め定められた特定の音に対する複数の周波数情報の組であって予め記憶された複数の組との間のパターンマッチングを行ない、当該パターンマッチングの結果に基づいて、前記複数の局所周波数情報の組を抽出する特定音周波数特徴量抽出ステップと、
前記特定音周波数特徴量抽出ステップで抽出された前記組における複数の局所周波数情報の総和を求め、前記局所周波数情報作成ステップにおいて前記複数の局所周波数情報を求める際に使用した周波数変換の逆の周波数変換を前記総和に適用することによって前記特定の音の信号を作成する音信号作成ステップとを含む
ことを特徴とする混合音分離方法。 - 複数の音から構成される混合音中より特定の音を分離するプログラムであって、
前記混合音中の波形である被分析波形と時間が対応付けられ、かつ、前記被分析波形を分析する周波数の成分を有する分析波形の一部を構成し同一の時空間分解能を有する複数の局所分析波形を用いて、前記局所分析波形と時間が対応する被分析波形の周波数を分析することによって、前記分析する周波数における振幅スペクトルおよび位相スペクトルの少なくとも一方を含む前記局所分析波形に対応する複数の局所周波数情報を求める局所周波数情報作成ステップと、
前記複数の局所周波数情報を組とし、当該組と予め定められた特定の音に対する複数の周波数情報の組であって予め記憶された複数の組との間のパターンマッチングを行ない、当該パターンマッチングの結果に基づいて、前記複数の局所周波数情報の組を抽出する特定音周波数特徴量抽出ステップと、
前記特定音周波数特徴量抽出ステップで抽出された前記組における複数の局所周波数情報の総和を求め、前記局所周波数情報作成ステップにおいて前記複数の局所周波数情報を求める際に使用した周波数変換の逆の周波数変換を前記総和に適用することによって前記特定の音の信号を作成する音信号作成ステップとをコンピュータに実行させる
ことを特徴とするプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005141939 | 2005-05-13 | ||
JP2005141939 | 2005-05-13 | ||
PCT/JP2006/307673 WO2006120829A1 (ja) | 2005-05-13 | 2006-04-11 | 混合音分離装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4041154B2 true JP4041154B2 (ja) | 2008-01-30 |
JPWO2006120829A1 JPWO2006120829A1 (ja) | 2008-12-18 |
Family
ID=37396345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006522162A Active JP4041154B2 (ja) | 2005-05-13 | 2006-04-11 | 混合音分離装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7974420B2 (ja) |
EP (1) | EP1881489B1 (ja) |
JP (1) | JP4041154B2 (ja) |
CN (1) | CN100585701C (ja) |
DE (1) | DE602006018282D1 (ja) |
WO (1) | WO2006120829A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101213589B (zh) * | 2006-01-12 | 2011-04-27 | 松下电器产业株式会社 | 对象声音分析装置和对象声音分析方法 |
US20070299657A1 (en) * | 2006-06-21 | 2007-12-27 | Kang George S | Method and apparatus for monitoring multichannel voice transmissions |
US8219409B2 (en) * | 2008-03-31 | 2012-07-10 | Ecole Polytechnique Federale De Lausanne | Audio wave field encoding |
JP2009270896A (ja) * | 2008-05-02 | 2009-11-19 | Tektronix Japan Ltd | 信号分析装置及び周波数領域データ表示方法 |
JP5654955B2 (ja) * | 2011-07-01 | 2015-01-14 | クラリオン株式会社 | 直接音抽出装置および残響音抽出装置 |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
US8925058B1 (en) * | 2012-03-29 | 2014-12-30 | Emc Corporation | Authentication involving authentication operations which cross reference authentication factors |
RU2712559C9 (ru) | 2013-08-28 | 2020-10-08 | Ионис Фармасьютикалз, Инк. | Модуляция экспрессии прекалликреина (пкк) |
CN103871417A (zh) * | 2014-03-25 | 2014-06-18 | 北京工业大学 | 一种移动手机特定连续语音过滤方法及过滤装置 |
BR112016022855B1 (pt) | 2014-05-01 | 2022-08-02 | Ionis Pharmaceuticals, Inc | Compostos e composições para modular a expressão de pkk e seus usos |
US9350470B1 (en) * | 2015-02-27 | 2016-05-24 | Keysight Technologies, Inc. | Phase slope reference adapted for use in wideband phase spectrum measurements |
JP6696221B2 (ja) * | 2016-02-26 | 2020-05-20 | セイコーエプソン株式会社 | 制御装置、受電装置、電子機器及び電力伝送システム |
CN106128472A (zh) * | 2016-07-12 | 2016-11-16 | 乐视控股(北京)有限公司 | 演唱者声音的处理方法及装置 |
DE112016007146B4 (de) * | 2016-09-20 | 2019-12-24 | Mitsubishi Electric Corporation | Störungsidentifizierungsvorrichtung und Störungsidentifizierungsverfahren |
JP6907859B2 (ja) * | 2017-09-25 | 2021-07-21 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
CN109801644B (zh) | 2018-12-20 | 2021-03-09 | 北京达佳互联信息技术有限公司 | 混合声音信号的分离方法、装置、电子设备和可读介质 |
US11026021B2 (en) | 2019-02-19 | 2021-06-01 | Sony Interactive Entertainment Inc. | Hybrid speaker and converter |
CN110491412B (zh) * | 2019-08-23 | 2022-02-25 | 北京市商汤科技开发有限公司 | 声音分离方法和装置、电子设备 |
KR20220036210A (ko) * | 2020-09-15 | 2022-03-22 | 삼성전자주식회사 | 영상의 음질을 향상시키는 디바이스 및 방법 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4121356C2 (de) * | 1991-06-28 | 1995-01-19 | Siemens Ag | Verfahren und Einrichtung zur Separierung eines Signalgemisches |
US6317703B1 (en) * | 1996-11-12 | 2001-11-13 | International Business Machines Corporation | Separation of a mixture of acoustic sources into its components |
SE521024C2 (sv) * | 1999-03-08 | 2003-09-23 | Ericsson Telefon Ab L M | Metod och anordning för att separera en blandning av källsignaler |
WO2001016935A1 (fr) * | 1999-08-26 | 2001-03-08 | Sony Corporation | Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage |
JP4491700B2 (ja) | 1999-08-26 | 2010-06-30 | ソニー株式会社 | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 |
US6879952B2 (en) * | 2000-04-26 | 2005-04-12 | Microsoft Corporation | Sound source separation using convolutional mixing and a priori sound source knowledge |
JP2002236494A (ja) | 2001-02-09 | 2002-08-23 | Denso Corp | 音声区間判別装置、音声認識装置、プログラム及び記録媒体 |
JP2003061198A (ja) * | 2001-08-10 | 2003-02-28 | Pioneer Electronic Corp | オーディオ再生装置 |
JP2004028640A (ja) * | 2002-06-21 | 2004-01-29 | Sony Corp | スペクトラムアナライザー装置、再生装置、スペクトラム解析方法、プログラム、記録媒体 |
JP3931237B2 (ja) * | 2003-09-08 | 2007-06-13 | 独立行政法人情報通信研究機構 | ブラインド信号分離システム、ブラインド信号分離方法、ブラインド信号分離プログラムおよびその記録媒体 |
US7454333B2 (en) * | 2004-09-13 | 2008-11-18 | Mitsubishi Electric Research Lab, Inc. | Separating multiple audio signals recorded as a single mixed signal |
JP2007034184A (ja) * | 2005-07-29 | 2007-02-08 | Kobe Steel Ltd | 音源分離装置,音源分離プログラム及び音源分離方法 |
US8014536B2 (en) * | 2005-12-02 | 2011-09-06 | Golden Metallic, Inc. | Audio source separation based on flexible pre-trained probabilistic source models |
CN101213589B (zh) * | 2006-01-12 | 2011-04-27 | 松下电器产业株式会社 | 对象声音分析装置和对象声音分析方法 |
JP4672611B2 (ja) * | 2006-07-28 | 2011-04-20 | 株式会社神戸製鋼所 | 音源分離装置、音源分離方法及び音源分離プログラム |
-
2006
- 2006-04-11 WO PCT/JP2006/307673 patent/WO2006120829A1/ja active Application Filing
- 2006-04-11 CN CN200680001027A patent/CN100585701C/zh active Active
- 2006-04-11 EP EP06731620A patent/EP1881489B1/en active Active
- 2006-04-11 US US11/665,265 patent/US7974420B2/en active Active
- 2006-04-11 DE DE602006018282T patent/DE602006018282D1/de active Active
- 2006-04-11 JP JP2006522162A patent/JP4041154B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN101040324A (zh) | 2007-09-19 |
JPWO2006120829A1 (ja) | 2008-12-18 |
EP1881489A4 (en) | 2008-05-28 |
DE602006018282D1 (de) | 2010-12-30 |
WO2006120829A1 (ja) | 2006-11-16 |
EP1881489A1 (en) | 2008-01-23 |
CN100585701C (zh) | 2010-01-27 |
US7974420B2 (en) | 2011-07-05 |
EP1881489B1 (en) | 2010-11-17 |
US20090067647A1 (en) | 2009-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4041154B2 (ja) | 混合音分離装置 | |
JP4065314B2 (ja) | 対象音分析装置、対象音分析方法および対象音分析プログラム | |
Boudraa et al. | Teager–Kaiser energy methods for signal and image analysis: A review | |
JP6027087B2 (ja) | スペクトル挙動の変換を実行する音響信号処理システム及び方法 | |
JP4177755B2 (ja) | 発話特徴抽出システム | |
JP5101316B2 (ja) | 基本周波数の高調波及び分数調波の抑制を用いたピッチ抽出 | |
US8301279B2 (en) | Signal processing apparatus, signal processing method, and program therefor | |
JP2018521366A (ja) | 音響信号をサウンドオブジェクトに分解する方法及びシステム、サウンドオブジェクト及びその利用 | |
JP2014506686A (ja) | 音声信号からの特徴フィンガープリントの抽出及びマッチング方法 | |
WO2008144784A1 (en) | Joint position-pitch estimation of acoustic sources for their tracking and separation | |
JP2005518118A (ja) | 周波数解析のためのフィルタセット | |
US8812310B2 (en) | Environment recognition of audio input | |
EP3504708B1 (en) | A device and method for classifying an acoustic environment | |
Muhammad | Extended average magnitude difference function based pitch detection | |
JP4705480B2 (ja) | 高調波信号の基本周波数を求める方法 | |
Chu et al. | A noise-robust FFT-based auditory spectrum with application in audio classification | |
EP1605437B1 (en) | Determination of the common origin of two harmonic components | |
KR101552660B1 (ko) | 음성구간 검출 장치 및 방법 | |
Muhsina et al. | Signal enhancement of source separation techniques | |
Graf et al. | Low-Complexity Pitch Estimation Based on Phase Differences Between Low-Resolution Spectra. | |
Prasanna Kumar et al. | Supervised and unsupervised separation of convolutive speech mixtures using f 0 and formant frequencies | |
JP3019603B2 (ja) | 音声の基本周波数の抽出装置 | |
JPS6229799B2 (ja) | ||
EP1743324B1 (de) | Vorrichtung und verfahren zum analysieren eines informationssignals | |
JPH1062460A (ja) | 信号分離装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071016 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071108 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4041154 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131116 Year of fee payment: 6 |