JPWO2006090589A1 - 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 - Google Patents
音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JPWO2006090589A1 JPWO2006090589A1 JP2007504661A JP2007504661A JPWO2006090589A1 JP WO2006090589 A1 JPWO2006090589 A1 JP WO2006090589A1 JP 2007504661 A JP2007504661 A JP 2007504661A JP 2007504661 A JP2007504661 A JP 2007504661A JP WO2006090589 A1 JPWO2006090589 A1 JP WO2006090589A1
- Authority
- JP
- Japan
- Prior art keywords
- sound
- localization information
- cluster
- signals
- sound separation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 67
- 230000004807 localization Effects 0.000 claims abstract description 106
- 238000007621 cluster analysis Methods 0.000 claims abstract description 40
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 238000006243 chemical reaction Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 15
- 238000001228 spectrum Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
Description
102 定位情報算出部
103 クラスタ分析部
104 分離部
105 係数決定部
402、403 STFT部
404 レベル差算出部
405 クラスタ分析部
406 重み係数決定部
407、408 再合成部
1101 位相差検出部
図5は、実施例1の音分離方法の処理を示すフローチャートである。まず、分離を行うステレオ信号401を入力する(ステップS501)。次に、STFT部402、403は、その信号を短時間フーリエ変換し(ステップS502)、一定時間毎の周波数データに変換する。このデータは複素数であるが、その絶対値は各周波数のパワーを示している。フーリエ変換の窓幅については2048〜4096サンプル程度が望ましい。次に、このパワーを計算する(ステップS503)。すなわち、このパワーをLチャンネル信号(L信号)とRチャンネル信号(R信号)の両方において計算する。
1 K個の初期クラスタ中心を決める
2 すべてのデータを最も近いクラスタ中心のクラスタに分類する
3 新たにできたクラスタの重心をクラスタ中心とする
4 新たなクラスタ中心がすべて以前と同じであれば終了し、そうでなければ2に戻る
このように、徐々に局所最適解に収束していくアルゴリズムである。
SLitn=Witn(ω)・SLtn(ω)
SRitn=Witn(ω)・SRtn(ω)
SL1tn=W1tn(ω)・SLtn(ω)
SR1tn=W1tn(ω)・SRtn(ω)
SL2tn=W2tn(ω)・SLtn(ω)
SR2tn=W2tn(ω)・SRtn(ω)
となり、これらを逆フーリエ変換し、時間毎につなぐと各音源の信号が抽出される。
図11は、実施例2の音分離装置の機能的構成を示すブロック図である。処理は、図3に示したCPU303が、ROM304に書き込まれたプログラムを読み出すことによって、RAM305をワークエリアとして使用することにより実行する。ハードウェア構成は図3と同じであるが、機能的構成は、図4のレベル差算出部404を位相差検出部1101に置き換え、図11に示したとおりになる。すなわち、音分離装置は、図4に示した実施例1の構成と同じSTFT部402、403、クラスタ分析部405、重み係数決定部406、再合成部407、408に加え、位相差検出部1101から構成される。
Claims (13)
- 複数の音源からの音を表す2つのチャンネルの信号をそれぞれ時間単位で周波数領域に変換する変換手段と、
前記変換手段によって周波数領域に変換された2つのチャンネルの信号の定位情報を求める定位情報算出手段と、
前記定位情報算出手段によって求められた定位情報を複数のクラスタに分類し、それぞれのクラスタの代表値を求めるクラスタ分析手段と、
前記クラスタ分析手段によって求められた代表値および前記定位情報算出手段によって求められた定位情報に基づいた値を時間領域に逆変換して、前記複数の音源に含まれる所定の音源からの音を分離する分離手段と、
を備えることを特徴とする音分離装置。 - 前記クラスタ分析手段によって求められた代表値および前記定位情報算出手段によって求められた定位情報に基づいて、重み係数を求める係数決定手段を備え、
前記分離手段は、前記係数決定手段によって求められた重み係数に基づいた値であって前記クラスタ分析手段によって求められた代表値および前記定位情報算出手段によって求められた定位情報に基づいた値を、逆変換して前記複数の音源に含まれる所定の音源からの音を分離することを特徴とする請求項1に記載の音分離装置。 - 前記分離手段は、前記係数決定手段によって求められた重み係数を、前記変換手段で周波数領域に変換された2つのチャンネルの信号のそれぞれにかけ合わせることによって求められた値を、逆変換して前記複数の音源に含まれる所定の音源からの音を分離することを特徴とする請求項1に記載の音分離装置。
- 前記定位情報算出手段は、前記変換手段によって周波数領域に変換された2つのチャンネルの信号のレベル差を求め、求めたレベル差を定位情報として求めることを特徴とする請求項1に記載の音分離装置。
- 前記2つのチャンネルの信号は、左チャンネルおよび右チャンネルの信号であり、
前記定位情報算出手段は、前記変換手段によって周波数領域に変換された2つのチャンネルの信号の周波数のレベル差を求めることを特徴とする請求項1に記載の音分離装置。 - 前記クラスタ分析手段は、前記レベル差を、あらかじめ求められた初期クラスタ中心によって特定されるクラスタに分類し、分類されたレベル差の集合について重心を求め、求められた重心に前記初期クラスタ中心を修正していくことにより、前記クラスタの代表値を求めることを特徴とする請求項1に記載の音分離装置。
- 前記定位情報算出手段は、前記変換手段によって周波数領域に変換された2つのチャンネルの信号の位相差を求め、求めた位相差を定位情報として求めることを特徴とする請求項1に記載の音分離装置。
- 前記2つのチャンネルの信号は、左チャンネルおよび右チャンネルの信号であり、
前記定位情報算出手段は、前記変換手段によって周波数領域に変換された2つのチャンネルの信号の周波数の位相差を求めることを特徴とする請求項1に記載の音分離装置。 - 前記クラスタ分析手段は、前記位相差を、あらかじめ求められた初期クラスタ中心によって特定されるクラスタに分類し、分類された位相差の集合について重心を求め、求められた重心に前記初期クラスタ中心を修正していくことにより、前記クラスタの代表値を求めることを特徴とする請求項1に記載の音分離装置。
- 前記変換手段は、前記2つの信号を一定時間毎にシフトする窓関数を用いて、時間単位で周波数領域に変換することを特徴とする請求項1〜9のいずれか一つに記載の音分離装置。
- 複数の音源からの音を表す2つのチャンネルの信号をそれぞれ時間単位で周波数領域に変換する変換工程と、
前記変換工程によって周波数領域に変換された2つのチャンネルの信号の定位情報を求める定位情報算出工程と、
前記定位情報算出工程によって求められた定位情報を複数のクラスタに分類し、それぞれのクラスタの代表値を求めるクラスタ分析工程と、
前記クラスタ分析工程によって求められた代表値および前記定位情報算出工程によって求められた定位情報に基づいた値を時間領域に逆変換して、前記複数の音源に含まれる所定の音源からの音を分離する分離工程と、
を含むことを特徴とする音分離方法。 - 請求項11に記載の音分離方法をコンピュータに実行させることを特徴とする音分離プログラム。
- 請求項12に記載の音分離プログラムを記録したことを特徴とするコンピュータに読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007504661A JP4767247B2 (ja) | 2005-02-25 | 2006-02-09 | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005051680 | 2005-02-25 | ||
JP2005051680 | 2005-02-25 | ||
JP2005243461 | 2005-08-24 | ||
JP2005243461 | 2005-08-24 | ||
JP2007504661A JP4767247B2 (ja) | 2005-02-25 | 2006-02-09 | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 |
PCT/JP2006/302221 WO2006090589A1 (ja) | 2005-02-25 | 2006-02-09 | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006090589A1 true JPWO2006090589A1 (ja) | 2008-07-24 |
JP4767247B2 JP4767247B2 (ja) | 2011-09-07 |
Family
ID=36927231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007504661A Expired - Fee Related JP4767247B2 (ja) | 2005-02-25 | 2006-02-09 | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20080262834A1 (ja) |
JP (1) | JP4767247B2 (ja) |
WO (1) | WO2006090589A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018036523A (ja) * | 2016-08-31 | 2018-03-08 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5013822B2 (ja) * | 2006-11-09 | 2012-08-29 | キヤノン株式会社 | 音声処理装置とその制御方法、及び、コンピュータプログラム |
JP4891801B2 (ja) * | 2007-02-20 | 2012-03-07 | 日本電信電話株式会社 | 多信号強調装置、方法、プログラム及びその記録媒体 |
JP5285626B2 (ja) | 2007-03-01 | 2013-09-11 | ジェリー・マハバブ | 音声空間化及び環境シミュレーション |
US8767975B2 (en) * | 2007-06-21 | 2014-07-01 | Bose Corporation | Sound discrimination method and apparatus |
CN101601088B (zh) * | 2007-09-11 | 2012-05-30 | 松下电器产业株式会社 | 声音判断装置、声音检测装置以及声音判断方法 |
US8532802B1 (en) * | 2008-01-18 | 2013-09-10 | Adobe Systems Incorporated | Graphic phase shifter |
US8954323B2 (en) * | 2009-02-13 | 2015-02-10 | Nec Corporation | Method for processing multichannel acoustic signal, system thereof, and program |
US9064499B2 (en) * | 2009-02-13 | 2015-06-23 | Nec Corporation | Method for processing multichannel acoustic signal, system therefor, and program |
JP2011033717A (ja) * | 2009-07-30 | 2011-02-17 | Secom Co Ltd | 雑音抑圧装置 |
JP2011239036A (ja) * | 2010-05-06 | 2011-11-24 | Sharp Corp | 音声信号変換装置、方法、プログラム、及び記録媒体 |
WO2013094135A1 (ja) * | 2011-12-19 | 2013-06-27 | パナソニック株式会社 | 音分離装置、および音分離方法 |
KR101963440B1 (ko) | 2012-06-08 | 2019-03-29 | 삼성전자주식회사 | 복수의 뉴런 회로들을 이용하여 음원의 방향을 추정하는 뉴로모픽 신호 처리 장치 및 그 장치를 이용한 방법 |
EP3392882A1 (en) * | 2017-04-20 | 2018-10-24 | Thomson Licensing | Method for processing an input audio signal and corresponding electronic device, non-transitory computer readable program product and computer readable storage medium |
JP6859235B2 (ja) * | 2017-09-07 | 2021-04-14 | 本田技研工業株式会社 | 音響処理装置、音響処理方法及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003078988A (ja) * | 2001-09-06 | 2003-03-14 | Nippon Telegr & Teleph Corp <Ntt> | 収音装置、方法及びプログラム、記録媒体 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU653582B2 (en) * | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5594800A (en) * | 1991-02-15 | 1997-01-14 | Trifield Productions Limited | Sound reproduction system having a matrix converter |
EP0553832B1 (en) * | 1992-01-30 | 1998-07-08 | Matsushita Electric Industrial Co., Ltd. | Sound field controller |
DE4328620C1 (de) * | 1993-08-26 | 1995-01-19 | Akg Akustische Kino Geraete | Verfahren zur Simulation eines Raum- und/oder Klangeindrucks |
AU691252B2 (en) * | 1994-02-25 | 1998-05-14 | Dorte Hammershoi | Binaural synthesis, head-related transfer functions, and uses thereof |
US7630500B1 (en) * | 1994-04-15 | 2009-12-08 | Bose Corporation | Spatial disassembly processor |
JP3385725B2 (ja) * | 1994-06-21 | 2003-03-10 | ソニー株式会社 | 映像を伴うオーディオ再生装置 |
US6978159B2 (en) * | 1996-06-19 | 2005-12-20 | Board Of Trustees Of The University Of Illinois | Binaural signal processing using multiple acoustic sensors and digital filtering |
US6990205B1 (en) * | 1998-05-20 | 2006-01-24 | Agere Systems, Inc. | Apparatus and method for producing virtual acoustic sound |
US6430528B1 (en) * | 1999-08-20 | 2002-08-06 | Siemens Corporate Research, Inc. | Method and apparatus for demixing of degenerate mixtures |
JP4017802B2 (ja) * | 2000-02-14 | 2007-12-05 | パイオニア株式会社 | 自動音場補正システム |
DE60141403D1 (de) * | 2000-06-09 | 2010-04-08 | Japan Science & Tech Agency | Hörvorrichtung für einen Roboter |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
JP3950930B2 (ja) * | 2002-05-10 | 2007-08-01 | 財団法人北九州産業学術推進機構 | 音源の位置情報を利用した分割スペクトルに基づく目的音声の復元方法 |
US7499555B1 (en) * | 2002-12-02 | 2009-03-03 | Plantronics, Inc. | Personal communication method and apparatus with acoustic stray field cancellation |
DE60304859T2 (de) * | 2003-08-21 | 2006-11-02 | Bernafon Ag | Verfahren zur Verarbeitung von Audiosignalen |
DE602004027774D1 (de) * | 2003-09-02 | 2010-07-29 | Nippon Telegraph & Telephone | Signaltrennverfahren, Signaltrenneinrichtung,und Signaltrennprogramm |
US7319769B2 (en) * | 2004-12-09 | 2008-01-15 | Phonak Ag | Method to adjust parameters of a transfer function of a hearing device as well as hearing device |
US8204235B2 (en) * | 2007-11-30 | 2012-06-19 | Pioneer Corporation | Center channel positioning apparatus |
-
2006
- 2006-02-09 JP JP2007504661A patent/JP4767247B2/ja not_active Expired - Fee Related
- 2006-02-09 US US11/884,736 patent/US20080262834A1/en not_active Abandoned
- 2006-02-09 WO PCT/JP2006/302221 patent/WO2006090589A1/ja not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003078988A (ja) * | 2001-09-06 | 2003-03-14 | Nippon Telegr & Teleph Corp <Ntt> | 収音装置、方法及びプログラム、記録媒体 |
Non-Patent Citations (1)
Title |
---|
JPN6010070711, 三輪 明宏,守田 了, "弦楽三重奏に対する自動採譜", 情報処理学会研究報告, 19980807, 74巻, 1−8, JP, 情報処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018036523A (ja) * | 2016-08-31 | 2018-03-08 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2006090589A1 (ja) | 2006-08-31 |
US20080262834A1 (en) | 2008-10-23 |
JP4767247B2 (ja) | 2011-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4767247B2 (ja) | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 | |
EP3511937B1 (en) | Device and method for sound source separation, and program | |
KR101670313B1 (ko) | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 | |
US9986332B2 (en) | Sound pick-up apparatus and method | |
US7970144B1 (en) | Extracting and modifying a panned source for enhancement and upmix of audio signals | |
US20110170707A1 (en) | Noise suppressing device | |
RU2666316C2 (ru) | Аппарат и способ улучшения аудиосигнала, система улучшения звука | |
Perez-Gonzalez et al. | Automatic equalization of multichannel audio using cross-adaptive methods | |
JP4896029B2 (ja) | 信号処理装置、信号処理方法、信号処理プログラムおよびコンピュータに読み取り可能な記録媒体 | |
KR20180050652A (ko) | 음향 신호를 사운드 객체들로 분해하는 방법 및 시스템, 사운드 객체 및 그 사용 | |
KR20110072923A (ko) | 신호 처리 방법 및 장치 | |
CN103875197A (zh) | 直接-发散分解 | |
JP2013130857A (ja) | 音響処理装置 | |
Stoller et al. | Jointly detecting and separating singing voice: A multi-task approach | |
US9966081B2 (en) | Method and apparatus for synthesizing separated sound source | |
De Man et al. | A semantic approach to autonomous mixing | |
WO2018066383A1 (ja) | 情報処理装置および方法、並びにプログラム | |
US20150063574A1 (en) | Apparatus and method for separating multi-channel audio signal | |
Grais et al. | Referenceless performance evaluation of audio source separation using deep neural networks | |
Moliner et al. | Virtual bass system with fuzzy separation of tones and transients | |
JP4533126B2 (ja) | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 | |
Fenton et al. | Objective profiling of perceived punch and clarity in produced music | |
Terrell et al. | An offline, automatic mixing method for live music, incorporating multiple sources, loudspeakers, and room effects | |
US20140140519A1 (en) | Sound processing device, sound processing method, and program | |
US20220392461A1 (en) | Electronic device, method and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110614 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140624 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |