JP2015138053A5 - - Google Patents

Download PDF

Info

Publication number
JP2015138053A5
JP2015138053A5 JP2014008074A JP2014008074A JP2015138053A5 JP 2015138053 A5 JP2015138053 A5 JP 2015138053A5 JP 2014008074 A JP2014008074 A JP 2014008074A JP 2014008074 A JP2014008074 A JP 2014008074A JP 2015138053 A5 JP2015138053 A5 JP 2015138053A5
Authority
JP
Japan
Prior art keywords
time
acoustic signal
component
frequency
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014008074A
Other languages
English (en)
Other versions
JP2015138053A (ja
JP6482173B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2014008074A priority Critical patent/JP6482173B2/ja
Priority claimed from JP2014008074A external-priority patent/JP6482173B2/ja
Priority to US14/596,505 priority patent/US9646631B2/en
Publication of JP2015138053A publication Critical patent/JP2015138053A/ja
Publication of JP2015138053A5 publication Critical patent/JP2015138053A5/ja
Application granted granted Critical
Publication of JP6482173B2 publication Critical patent/JP6482173B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明にかかる音響信号処理装置は、
第一の成分と第二の成分が混合された音響信号を入力する入力手段と、
前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換する変換手段と、
前記時間周波数信号を複数の帯域に分割する分割手段と、
前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解する第一の分解手段と、
前記第一のアクティビティ行列を教師アクティビティとして、前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解する第二の分解手段と
を有する。

Claims (22)

  1. 第一の成分と第二の成分が混合された音響信号を入力する入力手段と、
    前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換する変換手段と、
    前記時間周波数信号を複数の帯域に分割する分割手段と、
    前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解する第一の分解手段と、
    前記第一のアクティビティ行列を教師アクティビティとして、前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解する第二の分解手段とを有する音響信号処理装置。
  2. 第一の成分と第二の成分が混合された音響信号を入力する入力手段と、
    前記音響信号を複数の帯域に分割する分割手段と、
    前記第二の成分の影響が小さい帯域の音響信号を時間と信号周波数の関係を示す第一の時間周波数信号に変換する第一の変換手段と、
    前記音響信号を第二の時間周波数信号に変換する第二の変換手段と、
    前記第一の時間周波数信号を第一のアクティビティ行列に分解する第一の分解手段と、
    前記第一のアクティビティ行列を教師アクティビティとして、前記第二の時間周波数信号を第二のアクティビティ行列に分解する第二の分解手段とを有する音響信号処理装置。
  3. さらに、前記第一および第二のアクティビティ行列から前記第一および第二の成分の時間周波数信号を生成する生成手段を有する請求項1または請求項2に記載された音響信号処理装置。
  4. さらに、前記第一および第二の成分の時間周波数信号からフィルタを生成し、前記音響信号から変換された時間周波数信号をフィルタリングするフィルタ手段を有する請求項3に記載された音響信号処理装置。
  5. 第一の成分と第二の成分が混合された音響信号を入力する入力手段と、
    前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換する変換手段と、
    前記音響信号に含まれる前記第二の成分の強度を判定する判定手段と、
    前記第二の成分の強度に応じて前記時間周波数信号を複数の帯域に分割する分割手段と、
    前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解する第一の分解手段と、
    前記第一のアクティビティ行列を教師アクティビティとして、前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解する第二の分解手段とを有する音響信号処理装置。
  6. 前記第一および第二のアクティビティ行列から前記第二の成分を抑圧した時間周波数信号を生成する生成手段を有する請求項5に記載された音響信号処理装置。
  7. 第一の成分と第二の成分が混合された音響信号を入力する入力手段と、
    前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換する変換手段と、
    前記時間周波数信号を複数の帯域に分割する分割手段と、
    前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解する第一の分解手段と、
    前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解する第二の分解手段と、
    前記第二のアクティビティ行列を、前記第一のアクティビティ行列と相関が高い第三のアクティビティ行列、および、前記第一のアクティビティ行列と相関がない第四のアクティビティ行列に分類する分類手段とを有する音響信号処理装置。
  8. 前記第二のアクティビティ行列が含むアクティビティベクトルの数は、前記第一のアクティビティ行列が含むアクティビティベクトルの数よりも多い請求項7に記載された音響信号処理装置。
  9. さらに、前記第三および第四のアクティビティ行列から前記第一および第二の成分の時間周波数信号を生成する生成手段を有する請求項7または請求項8に記載された音響信号処理装置。
  10. さらに、前記時間周波数信号を音響信号に逆変換する逆変換手段を有する請求項1から請求項9の何れか一項に記載された音響信号処理装置。
  11. 前記第一の成分は音声信号であり、前記第二の成分は雑音信号である請求項1から請求項10の何れか一項に記載された音響信号処理装置。
  12. 第一の成分と第二の成分が混合された音響信号を入力し、
    前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換し、
    前記時間周波数信号を複数の帯域に分割し、
    前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解し、
    前記第一のアクティビティ行列を教師アクティビティとして、前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解する音響信号処理方法。
  13. 第一の成分と第二の成分が混合された音響信号を入力し、
    前記音響信号を複数の帯域に分割し、
    前記第二の成分の影響が小さい帯域の音響信号を時間と信号周波数の関係を示す第一の時間周波数信号に変換し、
    前記音響信号を第二の時間周波数信号に変換し、
    前記第一の時間周波数信号を第一のアクティビティ行列に分解し、
    前記第一のアクティビティ行列を教師アクティビティとして、前記第二の時間周波数信号を第二のアクティビティ行列に分解する音響信号処理方法。
  14. 第一の成分と第二の成分が混合された音響信号を入力し、
    前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換し、
    前記音響信号に含まれる前記第二の成分の強度を判定し、
    前記第二の成分の強度に応じて前記時間周波数信号を複数の帯域に分割し、
    前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解し、
    前記第一のアクティビティ行列を教師アクティビティとして、前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解する音響信号処理方法。
  15. 第一の成分と第二の成分が混合された音響信号を入力し、
    前記音響信号を時間と信号周波数の関係を示す時間周波数信号に変換し、
    前記時間周波数信号を複数の帯域に分割し、
    前記第二の成分の影響が小さい帯域の時間周波数信号を第一のアクティビティ行列に分解し、
    前記音響信号から変換された時間周波数信号を第二のアクティビティ行列に分解し、
    前記第二のアクティビティ行列を、前記第一のアクティビティ行列と相関が高い第三のアクティビティ行列、および、前記第一のアクティビティ行列と相関がない第四のアクティビティ行列に分類する音響信号処理方法。
  16. 第一の成分と第一周波数帯に存在する第二の成分とが混合された音響信号の前記第一周波数帯と異なる第二周波数帯におけるスペクトログラムに対して非負値行列因子分解を行う第一処理手段と、
    前記第一周波数帯及び前記第二周波数帯を含む周波数帯における前記音響信号のスペクトログラムに対して、前記第一処理手段による非負値行列因子分解の結果を用いて非負値行列因子分解を行う第二処理手段と、
    前記第二処理手段による非負値行列因子分解の結果を用いて前記音響信号から前記第一の成分または前記第二の成分を取得するする取得手段と
    を有する音響信号処理装置。
  17. 前記第一周波数帯は、前記第二周波数帯より周波数が低いことを特徴とする請求項16に記載された音響信号処理装置。
  18. 前記音響信号の前記第二周波数帯に含まれる前記第二の成分は、前記音響信号の前記第一周波数帯に含まれる前記第二の成分より少ないことを特徴とする請求項16または請求項17に記載された音響信号処理装置。
  19. 前記音響信号の前記第二周波数帯には、前記第二の成分は含まれないことを特徴とする請求項16から請求項18の何れか一項に記載された音響信号処理装置。
  20. 前記第一の成分は、音声に対応する成分であり、
    前記第二の成分は、風雑音に対応する成分であることを特徴とする請求項1から請求項11および請求項16から請求項19の何れか一項に記載された音響信号処理装置。
  21. コンピュータを請求項1から請求項11および請求項16から請求項20の何れか一項に記載された音響信号処理装置の各手段として機能させるためのプログラム。
  22. 請求項21に記載されたプログラムが記録されたコンピュータが読み取り可能な記録媒体。
JP2014008074A 2014-01-20 2014-01-20 音響信号処理装置およびその方法 Active JP6482173B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014008074A JP6482173B2 (ja) 2014-01-20 2014-01-20 音響信号処理装置およびその方法
US14/596,505 US9646631B2 (en) 2014-01-20 2015-01-14 Audio signal processing apparatus and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014008074A JP6482173B2 (ja) 2014-01-20 2014-01-20 音響信号処理装置およびその方法

Publications (3)

Publication Number Publication Date
JP2015138053A JP2015138053A (ja) 2015-07-30
JP2015138053A5 true JP2015138053A5 (ja) 2017-02-23
JP6482173B2 JP6482173B2 (ja) 2019-03-13

Family

ID=53544864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014008074A Active JP6482173B2 (ja) 2014-01-20 2014-01-20 音響信号処理装置およびその方法

Country Status (2)

Country Link
US (1) US9646631B2 (ja)
JP (1) JP6482173B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3093846A1 (en) * 2015-05-12 2016-11-16 Nxp B.V. Accoustic context recognition using local binary pattern method and apparatus
JP6642989B2 (ja) 2015-07-06 2020-02-12 キヤノン株式会社 制御装置、制御方法及びプログラム
JP6646967B2 (ja) 2015-07-31 2020-02-14 キヤノン株式会社 制御装置、再生システム、補正方法、及び、コンピュータプログラム
JP6535611B2 (ja) * 2016-01-28 2019-06-26 日本電信電話株式会社 音源分離装置、方法、及びプログラム
KR101864925B1 (ko) * 2016-02-05 2018-06-05 전자부품연구원 글로벌 모델 기반 오디오 객체 분리 방법 및 시스템
CN109661705B (zh) 2016-09-09 2023-06-16 索尼公司 声源分离装置和方法以及程序
US11503419B2 (en) * 2018-07-18 2022-11-15 Sphereo Sound Ltd. Detection of audio panning and synthesis of 3D audio from limited-channel surround sound
JP2021009608A (ja) 2019-07-02 2021-01-28 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
KR102136700B1 (ko) * 2020-03-31 2020-07-23 한국건설기술연구원 톤 카운팅 기반의 음성활성구간 검출 장치 및 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US7415392B2 (en) 2004-03-12 2008-08-19 Mitsubishi Electric Research Laboratories, Inc. System for separating multiple sound sources from monophonic input with non-negative matrix factor deconvolution
KR101414233B1 (ko) * 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
US8015003B2 (en) * 2007-11-19 2011-09-06 Mitsubishi Electric Research Laboratories, Inc. Denoising acoustic signals using constrained non-negative matrix factorization
JP5454330B2 (ja) 2010-04-23 2014-03-26 ヤマハ株式会社 音響処理装置
JP5516169B2 (ja) * 2010-07-14 2014-06-11 ヤマハ株式会社 音響処理装置およびプログラム
JP2012163918A (ja) * 2011-02-09 2012-08-30 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
JP5662276B2 (ja) * 2011-08-05 2015-01-28 株式会社東芝 音響信号処理装置および音響信号処理方法

Similar Documents

Publication Publication Date Title
JP2015138053A5 (ja)
ES2529025T3 (es) Aparato y método para procesar una señal de audio decodificada en un dominio espectral
JP2017021385A5 (ja)
RU2015141871A (ru) Устройство и способ для многоканального прямого-окружающего разложения для обработки звукового сигнала
RU2013131775A (ru) Устройство и способ для разложения входного сигнала с использованием заранее вычисленной эталонной кривой
JP6482173B2 (ja) 音響信号処理装置およびその方法
RU2016106913A (ru) Обработка пространственно дифузных или больших звуковых объектов
JP2016533529A5 (ja)
JP2015194666A5 (ja)
GB2567339A (en) Speaker recognition
IN2015MN01954A (ja)
KR20140059754A (ko) 스펙트럼 모션 변환을 구현하는 사운드 신호 처리 시스템 및 방법
JP2014515833A5 (ja)
JP2015096921A5 (ja)
WO2017127271A8 (en) Subband spatial and crosstalk cancellation for audio reproduction
RU2019124543A (ru) Звукозапись с использованием формирования диаграммы направленности
JP6236282B2 (ja) 異常検出装置、異常検出方法、及びコンピュータ読み取り可能な記憶媒体
WO2015145261A3 (en) Noise attentuation using a dipole sparse tau-p inversion
MX356371B (es) Dispositivo de codificacion de señal acustica, dispositivo de decodificacion de señal acustica, metodo para codificar una señal acustica y metodo para decodificar una señal acustica.
BR112015029751A2 (pt) método de cancelamento de ruído e dispositivo eletrônico do mesmo
JP2018534618A5 (ja)
MX346945B (es) Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia.
CN106797517B (zh) 用于净化音频信号的多耳mmse分析技术
JP2013007944A5 (ja)
JP2017063956A5 (ja) 処理装置および処理方法