JP5605575B2 - 多チャンネル音響信号処理方法、そのシステム及びプログラム - Google Patents
多チャンネル音響信号処理方法、そのシステム及びプログラム Download PDFInfo
- Publication number
- JP5605575B2 JP5605575B2 JP2010550500A JP2010550500A JP5605575B2 JP 5605575 B2 JP5605575 B2 JP 5605575B2 JP 2010550500 A JP2010550500 A JP 2010550500A JP 2010550500 A JP2010550500 A JP 2010550500A JP 5605575 B2 JP5605575 B2 JP 5605575B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- similarity
- channels
- feature amount
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 13
- 238000004364 calculation method Methods 0.000 claims description 39
- 238000000926 separation method Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 18
- 238000001228 spectrum Methods 0.000 claims description 14
- 230000010365 information processing Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
F2(T) = [f21(T) f22(T) … f2L(T)] … (1-2)
.
.
.
FM(T) = [fM1(T) fM2(T) … fML(T)] … (1-M)
ただし、F1(T)〜FM(T)は入力信号1〜Mから算出した特徴量1〜Mである。Tは時間のインデックスであり、複数のサンプルtを1つの区間とし、その時間区間におけるインデックスとしてTを用いてもよい。
前記チャンネル毎の特徴量のチャンネル間の類似度を計算し、
前記類似度が高い複数のチャンネルを選択し、
選択した複数のチャンネルの入力信号を用いて信号を分離する
ことを特徴とする多チャンネル音響信号処理方法。
前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算部と、
前記類似度が高い複数のチャンネルを選択するチャンネル選択部と、
選択した複数のチャンネルの入力信号を用いて信号を分離する信号分離部と
を有することを特徴とする多チャンネル音響信号処理システム。
前記類似度計算部は、異なる特徴量を用いて複数回チャンネルの選択を行い、選択するチャンネルを絞り込むことを特徴とする付記5から付記7のいずれかに記載の多チャンネル音響信号処理システム。
前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算処理と、
前記類似度が高い複数のチャンネルを選択するチャンネル選択処理と、
選択した複数のチャンネルの入力信号を用いて信号を分離する信号分離処理と
を情報処理装置に実行させることを特徴とするプログラム。
前記チャンネル選択処理は、選択するチャンネルを絞る
ことを特徴とする付記9から付記11のいずれかに記載のプログラム。
1−2 入力信号2から特徴量を算出する特徴量算出部
1−M 入力信号Mから特徴量を算出する特徴量算出部
2 類似度計算部
3 チャンネル選択部
4−1 グループ1として選択されたチャンネルの信号を分離する信号分離部
4−N グループNとして選択されたチャンネルの信号を分離する信号分離部
Claims (12)
- 少なくとも一つのチャンネルに目的信号が含まれる多チャンネルの入力信号からチャンネル毎に特徴量を算出し、
前記チャンネル毎の特徴量のチャンネル間の類似度を計算し、
前記類似度が高い複数のチャンネルを選択し、
選択した複数のチャンネルの入力信号を用いて、前記選択した複数のチャンネルの入力信号に含まれる目的信号を分離する
ことを特徴とする多チャンネル音響信号処理方法。 - 前記チャンネル毎に算出する特徴量は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを含むことを特徴とする請求項1に記載の多チャンネル音響信号処理方法。
- 前記類似度を表す指標として、相関値、距離値のうち少なくとも1つを含むことを特徴とする請求項1又は請求項2に記載の多チャンネル音響信号処理方法。
- 前記チャンネル毎の類似度を計算して類似度が高い複数のチャンネルを選択することを、異なる特徴量を用いて複数回繰り返し、選択するチャンネルを絞ることを特徴とする請求項1から請求項3のいずれかに記載の多チャンネル音響信号処理方法。
- 少なくとも一つのチャンネルに目的信号が含まれる多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出部と、
前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算部と、
前記類似度が高い複数のチャンネルを選択するチャンネル選択部と、
選択した複数のチャンネルの入力信号を用いて、前記選択した複数のチャンネルに含まれる目的信号を分離する信号分離部と
を有することを特徴とする多チャンネル音響信号処理システム。 - 前記特徴量算出部は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを、特徴量として算出することを特徴とする請求項5に記載の多チャンネル音響信号処理システム。
- 前記類似度計算部は、相関値、距離値のうち少なくとも1つを、前記類似度を表す指標として算出することを特徴とする請求項5又は請求項6に記載の多チャンネル音響信号処理システム。
- 前記特徴量算出部は、異なる特徴量の種類でチャンネル毎の異なる特徴量を算出し、
前記類似度計算部は、異なる特徴量を用いて複数回チャンネルの選択を行い、選択するチャンネルを絞り込むことを特徴とする請求項5から請求項7のいずれかに記載の多チャンネル音響信号処理システム。 - 少なくとも一つのチャンネルに目的信号が含まれる多チャンネルの入力信号からチャンネル毎に特徴量を算出する特徴量算出処理と、
前記チャンネル毎の特徴量のチャンネル間の類似度を計算する類似度計算処理と、
前記類似度が高い複数のチャンネルを選択するチャンネル選択処理と、
選択した複数のチャンネルの入力信号を用いて、前記選択した複数のチャンネルの入力信号に含まれる目的信号を分離する信号分離処理と
を情報処理装置に実行させることを特徴とするプログラム。 - 前記特徴量算出処理は、時間波形、統計量、周波数スペクトル、周波数対数スペクトル、ケプストラム、メルケプストラム、音響モデルに対する尤度、音響モデルに対する信頼度、音素認識結果、音節認識結果、音声区間長のうち少なくとも1つを、特徴量として算出することを特徴とする請求項9に記載のプログラム。
- 前記類似度計算処理は、相関値、距離値のうち少なくとも1つを、前記類似度を表す指標として算出することを特徴とする請求項9又は請求項10に記載のプログラム。
- 前記特徴量算出処理と前記類似度計算処理とを、異なる特徴量を用いて複数回繰り返し、
前記チャンネル選択処理は、選択するチャンネルを絞る
ことを特徴とする請求項9から請求項11のいずれかに記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010550500A JP5605575B2 (ja) | 2009-02-13 | 2010-02-08 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009031111 | 2009-02-13 | ||
JP2009031111 | 2009-02-13 | ||
JP2010550500A JP5605575B2 (ja) | 2009-02-13 | 2010-02-08 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
PCT/JP2010/051752 WO2010092915A1 (ja) | 2009-02-13 | 2010-02-08 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010092915A1 JPWO2010092915A1 (ja) | 2012-08-16 |
JP5605575B2 true JP5605575B2 (ja) | 2014-10-15 |
Family
ID=42561757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010550500A Active JP5605575B2 (ja) | 2009-02-13 | 2010-02-08 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9064499B2 (ja) |
JP (1) | JP5605575B2 (ja) |
WO (1) | WO2010092915A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2996043B1 (fr) * | 2012-09-27 | 2014-10-24 | Univ Bordeaux 1 | Procede et dispositif pour separer des signaux par filtrage spatial a variance minimum sous contrainte lineaire |
JP6367773B2 (ja) * | 2015-08-12 | 2018-08-01 | 日本電信電話株式会社 | 音声強調装置、音声強調方法及び音声強調プログラム |
JP6601109B2 (ja) * | 2015-09-30 | 2019-11-06 | ヤマハ株式会社 | 楽器類識別装置 |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
GB201909133D0 (en) * | 2019-06-25 | 2019-08-07 | Nokia Technologies Oy | Spatial audio representation and rendering |
CN115410584A (zh) * | 2021-05-28 | 2022-11-29 | 华为技术有限公司 | 多声道音频信号的编码方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006510069A (ja) * | 2002-12-11 | 2006-03-23 | ソフトマックス,インク | 改良型独立成分分析を使用する音声処理ためのシステムおよび方法 |
JP3949150B2 (ja) * | 2003-09-02 | 2007-07-25 | 日本電信電話株式会社 | 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体 |
JP2008092363A (ja) * | 2006-10-03 | 2008-04-17 | Sony Corp | 信号分離装置及び方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424960B1 (en) * | 1999-10-14 | 2002-07-23 | The Salk Institute For Biological Studies | Unsupervised adaptation and classification of multiple classes and sources in blind signal separation |
JP3506138B2 (ja) * | 2001-07-11 | 2004-03-15 | ヤマハ株式会社 | 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置 |
JP3812887B2 (ja) * | 2001-12-21 | 2006-08-23 | 富士通株式会社 | 信号処理システムおよび方法 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
JP4543731B2 (ja) | 2004-04-16 | 2010-09-15 | 日本電気株式会社 | 雑音除去方法、雑音除去装置とシステム及び雑音除去用プログラム |
CN1942932B (zh) * | 2005-02-08 | 2010-07-28 | 日本电信电话株式会社 | 信号分离装置和信号分离方法 |
JP4767247B2 (ja) * | 2005-02-25 | 2011-09-07 | パイオニア株式会社 | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
US20070135952A1 (en) * | 2005-12-06 | 2007-06-14 | Dts, Inc. | Audio channel extraction using inter-channel amplitude spectra |
DE102006027673A1 (de) * | 2006-06-14 | 2007-12-20 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm |
US7664643B2 (en) * | 2006-08-25 | 2010-02-16 | International Business Machines Corporation | System and method for speech separation and multi-talker speech recognition |
US8738368B2 (en) * | 2006-09-21 | 2014-05-27 | GM Global Technology Operations LLC | Speech processing responsive to a determined active communication zone in a vehicle |
US20080228470A1 (en) * | 2007-02-21 | 2008-09-18 | Atsuo Hiroe | Signal separating device, signal separating method, and computer program |
US8107321B2 (en) * | 2007-06-01 | 2012-01-31 | Technische Universitat Graz And Forschungsholding Tu Graz Gmbh | Joint position-pitch estimation of acoustic sources for their tracking and separation |
JP4469882B2 (ja) * | 2007-08-16 | 2010-06-02 | 株式会社東芝 | 音響信号処理方法及び装置 |
US8175291B2 (en) * | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
US8130978B2 (en) * | 2008-10-15 | 2012-03-06 | Microsoft Corporation | Dynamic switching of microphone inputs for identification of a direction of a source of speech sounds |
-
2010
- 2010-02-08 WO PCT/JP2010/051752 patent/WO2010092915A1/ja active Application Filing
- 2010-02-08 JP JP2010550500A patent/JP5605575B2/ja active Active
- 2010-02-08 US US13/201,375 patent/US9064499B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006510069A (ja) * | 2002-12-11 | 2006-03-23 | ソフトマックス,インク | 改良型独立成分分析を使用する音声処理ためのシステムおよび方法 |
JP3949150B2 (ja) * | 2003-09-02 | 2007-07-25 | 日本電信電話株式会社 | 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体 |
JP2008092363A (ja) * | 2006-10-03 | 2008-04-17 | Sony Corp | 信号分離装置及び方法 |
Also Published As
Publication number | Publication date |
---|---|
US9064499B2 (en) | 2015-06-23 |
US20120029916A1 (en) | 2012-02-02 |
WO2010092915A1 (ja) | 2010-08-19 |
JPWO2010092915A1 (ja) | 2012-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5605573B2 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
JP5605575B2 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
KR100745976B1 (ko) | 음향 모델을 이용한 음성과 비음성의 구분 방법 및 장치 | |
JP5605574B2 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
JP5662276B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
US8364483B2 (en) | Method for separating source signals and apparatus thereof | |
US20120103166A1 (en) | Signal Processing Device, Signal Processing Method, and Program | |
CN106098079B (zh) | 音频信号的信号提取方法与装置 | |
NZ566782A (en) | Neural network classifier for separating audio sources from a monophonic audio signal | |
KR20190069198A (ko) | 다채널 오디오 신호에서 음원을 추출하는 장치 및 그 방법 | |
Tan et al. | Evaluation of a Sparse Representation-Based Classifier For Bird Phrase Classification Under Limited Data Conditions. | |
Xiao et al. | Improved source counting and separation for monaural mixture | |
KR20170124854A (ko) | 음성/비음성 구간 검출 장치 및 방법 | |
RU2005104835A (ru) | Способ распознавания водяного знака | |
Zhang et al. | Noise-Aware Speech Separation with Contrastive Learning | |
JP2010038943A (ja) | 音響信号処理装置及び方法 | |
CN110534128B (zh) | 一种噪音处理方法、装置、设备及存储介质 | |
JP7014682B2 (ja) | 音源分離の評価装置および音源分離装置 | |
WO2007036846A2 (en) | Method and apparatus for automatic structure analysis of music | |
KR101069232B1 (ko) | 음악 장르 분류 방법 및 장치 | |
Zhang et al. | A two phase method for general audio segmentation | |
Khonglah et al. | Indoor/Outdoor Audio Classification Using Foreground Speech Segmentation. | |
Nguyen et al. | Improving mix-and-separate training in audio-visual sound source separation with an object prior | |
Petridis et al. | A multi-class method for detecting audio events in news broadcasts | |
Maka et al. | Detecting the number of speakers in speech mixtures by human and machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5605575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |