JP2017514249A - 入力信号を変換する方法 - Google Patents
入力信号を変換する方法 Download PDFInfo
- Publication number
- JP2017514249A JP2017514249A JP2017503307A JP2017503307A JP2017514249A JP 2017514249 A JP2017514249 A JP 2017514249A JP 2017503307 A JP2017503307 A JP 2017503307A JP 2017503307 A JP2017503307 A JP 2017503307A JP 2017514249 A JP2017514249 A JP 2017514249A
- Authority
- JP
- Japan
- Prior art keywords
- model
- parameters
- neural network
- input signal
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 81
- 238000013528 artificial neural network Methods 0.000 claims abstract description 56
- 230000001131 transforming effect Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 23
- 230000004913 activation Effects 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 230000002093 peripheral effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 22
- 238000005457 optimization Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 11
- 230000009466 transformation Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/043—Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
Description
音声信号、画像信号及びビデオ信号等の信号を変換することに対する最も成功している一般的な手法のうちの2つは、モデルベースの方法及びニューラルネットワークである。各々が、重要な利点及び不利な点をもたらす。
確率論的グラフィックモデル等のモデルベースの方法の主要な利点は、推測手順を考案する際に、モデルが事前知識及び直観を組み込んで問題レベルで推論することができることである。問題制約に関する重要な推定は、多くの場合、モデルベースの手法に組み込むことができる。例は、オーディオ信号、例えば、音声信号の線形加法性等の制約、及び画像処理における視覚遮断等の制約、並びに、条件付き独立、潜在的変数構造、スパース性、低ランク共分散等のより微細な統計的仮定を含む。異なる問題レベルの制約を仮定して試験することによって、問題の本質への洞察を得ることができ、これを用いてモデリング仮定を改善することができる。
ニューラルネットワークは、推測が、有限の閉形式の数式として定義され、通常、連続して実行される層に編成されるように定式化される。通常、ニューラルネットワークは、入力層と、1つ又は複数の隠れ層と、出力層とを含む。隠れ層の数が大きい場合、ニューラルネットワークはディープニューラルネットワークと呼ばれ、層は増分的に学習される。ネットワークの弁別的トレーニングを用いて、速度と正確度とのトレードオフを最適化することができる。
推測が最適化問題であるモデルを検討する。1つの例は変分推測であり、ここで、入力の尤度に対する下限を最適化して概算事後確率を推定し、これを用いて、隠れた量の条件付き予測値を求める。
図2Bに示すように、対象となる隠れた量(出力)yi502と、データインスタンスiごとに観察される変数(入力)xi501との間の関係を指定するパラメーターθ122の組によって決定されるモデルに基づいて、一般形式を説明する。
反復を手順とみなすのではなく、ニューラルネットワーク状のアーキテクチャーにおいて層111のシーケンスとして手順102を展開する(110)。ここで、反復インデックスはこのとき、ニューラルネットワーク層へのインデックスとして解釈される。中間変数φ1,...,φKは、層1〜Kのノードであり、式(3)は、層間の変換及び活性化関数を求める。隠れた量yi Kは、出力層のノードであり、
本発明者らは、全ての層に同じパラメーター112を用いることは、弁別的トレーニングとの関連において必須ではなく、更には性能に有害であり得ることを認識している。
図3に示すような1つの実施形態において、非負行列因子分解(NMF)モデルから新規のニューラルネットワークを作成する。この新規のニューラルネットワークは、任意の現実世界の非負信号に適用することができる。NMFは多くのドメインに適用することができるが、ここで、単一チャネルソース分離の現実世界のタスクに焦点を当てる。このタスクは、信号、例えばオーディオ(音声)信号の混合物からソース信号を回復することを目的とする。この関連で、モデルは、異なるソース信号のパワースペクトル又は振幅スペクトルを合算すると概ね混合物になり、各時点において、各ソースの特徴を、非負の基底関数の線形結合として説明することができるという問題レベルの仮定を包含する。
本発明によるニューラルネットワーク130が得られた後、図4に示すように、ネットワークを拡張してリカレント構造を形成することができる。この事例では、層kの出力及び前回の時間フレームt−1における活性化行列Ht−1 k+1が、時間フレームtにおける層kへの入力として含まれる。Ht−1 k+1を時間フレームtにおける層kへの入力として含める方法の1つの例は、Ht−1 k+1及びHt kを垂直方向につなぎ合わせ、ニューラルネットワーク弁別的非負行列因子分解について同じタイプの更新式を用いてHt k+1を計算し、層kごとに、Wprevious kがHt−1 k+1に適用され、Wcurrent kがHt kに適用されるように、拡張されたWk=[Wprevious k,Wcurrent k]を検討することである。
図5は、図1のトレーニング140及び変換160の一般的な方法の詳細を示す。トレーニング520は、おそらくデジタル化されたトレーニング信号510から開始する。トレーニングは、レベルごとに1つ、K組の推測パラメーター521、及びメモリ523に記憶される推定パラメーターθK522を生成する。パラメーターは、トレーニング中に最適化することができる(525)。
図6は、上記で説明したようなニューラルネットワーク弁別的NMF及びリカレントニューラルネットワーク弁別的NMFのトレーニング140及び変換160のための方法の詳細を示す。トレーニング620は、トレーニング信号609から開始し、ここで、各サンプルは、ソース信号610及び対応する基準ソース信号611の混合物を含む。トレーニングは、層ごとに1つ、K組の解析モデル基底Wk、k=0,...,K−1 621、及びメモリ623に記憶される再構成モデル基底WK622を生成する。パラメーターは、トレーニング中に最適化することができる(625)。
Claims (20)
- 入力信号を変換する方法であって、
前記入力信号を変換するためのモデルを定義するステップであって、前記モデルは制約及びモデルパラメーターの組によって指定される、ステップと、
前記モデル及び前記モデルパラメーターの組から導出される反復推測手順を定義するステップと、
前記反復推測手順を層の組に展開するステップであって、前記手順の反復ごとに1つの層があり、ネットワークパラメーターの同じ組が全ての層によって用いられる、ステップと、
層ごとにネットワークパラメーターの1つの組が存在し、ネットワークパラメーターの各組が別個に維持可能であり、対応する層に別個に適用可能であるように、前記ネットワークパラメーターの組を解放することによってニューラルネットワークを形成するステップと、
前記ニューラルネットワークをトレーニングして、トレーニングされたニューラルネットワークを得るステップと、
前記トレーニングされたニューラルネットワークを用いて前記入力信号を変換し、出力信号を得るステップと、
を含み、
前記ステップはプロセッサにおいて実行される、方法。 - 前記トレーニング中にネットワークパラメーターの1つ又は複数の組を独立して調整するステップを更に含む、
請求項1に記載の方法。 - 前記モデルは、確率論的生成モデルであり、
前記推測手順は、変分推測であり、
前記方法は、
前記入力信号の尤度に対する下限を最適化して、概算事後確率を得るステップを更に含む、
請求項1に記載の方法。 - 前記モデルは、マルコフ確率場であり、
前記推測手順は、周辺事後確率に対する局所一貫性制約を施行するループあり確率伝搬(BP)である、
請求項1に記載の方法。 - 前記モデルは、非負の基底関数拡張モデルであり、
前記推測手順は、乗法的更新に基づく、
請求項1に記載の方法。 - 前記パラメーターの組は、前記出力信号と前記入力信号との間の関係を指定する、
請求項1に記載の方法。 - 前記出力信号を求めることができる中間変数を伴う推測目的関数を最適化することによって、前記出力信号を得るステップを更に含む、
請求項6に記載の方法。 - 前記推測目的関数は、対数尤度に対する近似である、
請求項7に記載の方法。 - 前記中間変数は、変分推測手順の変分パラメーターである、
請求項7に記載の方法。 - 前記中間変数は、ループあり確率伝搬手順の事後周辺確率である、
請求項7に記載の方法。 - 前記中間変数は、基底関数の活性化係数である、
請求項7に記載の方法。 - 前記ネットワークパラメーターの組は、前記入力信号と前記出力信号との間の関係を指定し、
前記調整するステップは、引数として基準値及び推定出力信号をとる損失関数を含む弁別的目的関数を用いて前記ネットワークパラメーターの組を最適化する、
請求項2に記載の方法。 - 前記入力信号は、ノイズのある音声であり、
前記出力信号はクリーンな音声である、
請求項1に記載の方法。 - 前記入力信号は、信号の混合物であり、
前記出力信号は、1つ又は複数のソース信号である、
請求項1に記載の方法。 - 前記ニューラルネットワークは、データインスタンスの組の要素ごとに1つのニューラルネットワークを用いることによって、及び1つ又は複数のニューラルネットワークの1つ又は複数の層間で接続を合算することによって拡張される、
請求項1に記載の方法。 - 前記データインスタンスの組は、シーケンスであり、
前記結果として得られるニューラルネットワークは、リカレントニューラルネットワークである、
請求項15に記載の方法。 - 前記データインスタンスの組は、アレイである、
請求項16に記載の方法。 - 前記最適化することは、上位層から下位層への勾配の後方伝搬によって実施される勾配降下に基づく、
請求項12に記載の方法。 - 前記ネットワークパラメーターのうちの1つ又は複数は、非負であり、
前記最適化することは乗法的更新に基づく、
請求項12に記載の方法。 - 前記乗法的更新は、2つの非負項の差における勾配の分解の正の部分に対する負の部分の比に基づき、
前記分解は、上位層の前記勾配の前記分解の前記正の部分及び前記負の部分の後方伝搬によって得られる、
請求項19に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/446,431 | 2014-07-30 | ||
US14/446,431 US9582753B2 (en) | 2014-07-30 | 2014-07-30 | Neural networks for transforming signals |
PCT/JP2015/071730 WO2016017787A1 (en) | 2014-07-30 | 2015-07-24 | Method for transforming input signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017514249A true JP2017514249A (ja) | 2017-06-01 |
JP6328320B2 JP6328320B2 (ja) | 2018-05-23 |
Family
ID=53879740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017503307A Active JP6328320B2 (ja) | 2014-07-30 | 2015-07-24 | 入力信号を変換する方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US9582753B2 (ja) |
EP (1) | EP3175393B1 (ja) |
JP (1) | JP6328320B2 (ja) |
CN (1) | CN106537420B (ja) |
WO (1) | WO2016017787A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110060699A (zh) * | 2019-05-21 | 2019-07-26 | 哈尔滨工程大学 | 一种基于深度稀疏展开的单信道语音分离方法 |
CN110189761A (zh) * | 2019-05-21 | 2019-08-30 | 哈尔滨工程大学 | 一种基于贪婪深度字典学习的单信道语音去混响方法 |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170178664A1 (en) * | 2014-04-11 | 2017-06-22 | Analog Devices, Inc. | Apparatus, systems and methods for providing cloud based blind source separation services |
US9582753B2 (en) * | 2014-07-30 | 2017-02-28 | Mitsubishi Electric Research Laboratories, Inc. | Neural networks for transforming signals |
US10062201B2 (en) | 2015-04-21 | 2018-08-28 | Microsoft Technology Licensing, Llc | Time-of-flight simulation of multipath light phenomena |
US9799327B1 (en) * | 2016-02-26 | 2017-10-24 | Google Inc. | Speech recognition with attention-based recurrent neural networks |
US9760837B1 (en) * | 2016-03-13 | 2017-09-12 | Microsoft Technology Licensing, Llc | Depth from time-of-flight using machine learning |
EP4235646A3 (en) | 2016-03-23 | 2023-09-06 | Google LLC | Adaptive audio enhancement for multichannel speech recognition |
US10068140B2 (en) | 2016-12-02 | 2018-09-04 | Bayerische Motoren Werke Aktiengesellschaft | System and method for estimating vehicular motion based on monocular video data |
CN113541700B (zh) | 2017-05-03 | 2022-09-30 | 弗吉尼亚科技知识产权有限公司 | 用无线电信号变换器学习无线电信号的方法、系统和装置 |
KR102053527B1 (ko) * | 2017-10-15 | 2019-12-06 | 알레시오 주식회사 | 이미지 처리 방법 |
US11170301B2 (en) * | 2017-11-16 | 2021-11-09 | Mitsubishi Electric Research Laboratories, Inc. | Machine learning via double layer optimization |
TWI651927B (zh) * | 2018-02-14 | 2019-02-21 | National Central University | 訊號源分離方法及訊號源分離裝置 |
CN108648762A (zh) * | 2018-03-14 | 2018-10-12 | 上海交通大学 | 一种基于压缩感知的音频信号采样和重建方法 |
US20210019122A1 (en) * | 2018-03-28 | 2021-01-21 | Sony Corporation | Information processing method, information processing apparatus, and program |
EP3564698B1 (en) * | 2018-05-02 | 2024-11-06 | Rohde & Schwarz GmbH & Co. KG | Method for classifying electromagnetic signals and analysing system |
US11462209B2 (en) * | 2018-05-18 | 2022-10-04 | Baidu Usa Llc | Spectrogram to waveform synthesis using convolutional networks |
US10923141B2 (en) | 2018-08-06 | 2021-02-16 | Spotify Ab | Singing voice separation with deep u-net convolutional networks |
US10977555B2 (en) | 2018-08-06 | 2021-04-13 | Spotify Ab | Automatic isolation of multiple instruments from musical mixtures |
JP6903611B2 (ja) * | 2018-08-27 | 2021-07-14 | 株式会社東芝 | 信号生成装置、信号生成システム、信号生成方法およびプログラム |
US11657322B2 (en) * | 2018-08-30 | 2023-05-23 | Nec Corporation | Method and system for scalable multi-task learning with convex clustering |
CN109558664B (zh) * | 2018-11-22 | 2023-04-18 | 广东工业大学 | 一种注塑成型制造的复合物料配方制定方法 |
US20200184991A1 (en) * | 2018-12-05 | 2020-06-11 | Pascal Cleve | Sound class identification using a neural network |
US11640522B2 (en) * | 2018-12-13 | 2023-05-02 | Tybalt, Llc | Computational efficiency improvements for artificial neural networks |
CN113302632B (zh) | 2019-01-28 | 2024-06-14 | 三菱电机株式会社 | 开发辅助装置、开发辅助系统和开发辅助方法 |
US10885332B2 (en) | 2019-03-15 | 2021-01-05 | International Business Machines Corporation | Data labeling for deep-learning models |
CN110222844A (zh) * | 2019-05-30 | 2019-09-10 | 西安交通大学 | 一种基于人工神经网络的压缩机性能预测方法 |
CN111464468A (zh) * | 2020-03-02 | 2020-07-28 | 南方科技大学 | 信号调制模式识别方法、装置、设备和可读存储介质 |
US11494875B2 (en) | 2020-03-25 | 2022-11-08 | Nintendo Co., Ltd. | Systems and methods for machine learned image conversion |
US11379951B2 (en) | 2020-03-25 | 2022-07-05 | Nintendo Co., Ltd. | Systems and methods for machine learned image conversion |
CN111653288B (zh) * | 2020-06-18 | 2023-05-09 | 南京大学 | 基于条件变分自编码器的目标人语音增强方法 |
US20220036238A1 (en) * | 2020-07-30 | 2022-02-03 | Tektronix, Inc. | Mono channel burst classification using machine learning |
DE112020007371T5 (de) * | 2020-10-15 | 2023-05-25 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren und Einrichtung für ein neuronales Netzwerk basierend auf energiebasierten Modellen einer latenten Variable |
CN112597540B (zh) * | 2021-01-28 | 2021-10-01 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的多重共线性检测方法、装置及系统 |
CN113160898B (zh) * | 2021-05-18 | 2023-09-08 | 北京信息科技大学 | 一种铁基合金吉布斯自由能预测方法和系统 |
CN113567921B (zh) * | 2021-07-21 | 2023-08-01 | 中国人民解放军国防科技大学 | 一种基于深度展开网络的混合源定位方法及系统 |
CN113567922B (zh) * | 2021-07-21 | 2023-08-01 | 中国人民解放军国防科技大学 | 一种基于深度展开网络的近场源定位方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009128906A (ja) * | 2007-11-19 | 2009-06-11 | Mitsubishi Electric Research Laboratories Inc | 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613665B2 (en) * | 2005-06-24 | 2009-11-03 | Halliburton Energy Services, Inc. | Ensembles of neural networks with different input sets |
US20070288410A1 (en) * | 2006-06-12 | 2007-12-13 | Benjamin Tomkins | System and method of using genetic programming and neural network technologies to enhance spectral data |
EP2259215B1 (en) * | 2009-06-04 | 2016-08-10 | Honda Research Institute Europe GmbH | Method and structure for a neural associative memory based on optimal Bayesian learning |
US8700552B2 (en) | 2011-11-28 | 2014-04-15 | Microsoft Corporation | Exploiting sparseness in training deep neural networks |
US9292787B2 (en) | 2012-08-29 | 2016-03-22 | Microsoft Technology Licensing, Llc | Computer-implemented deep tensor neural network |
CN103310229B (zh) * | 2013-06-15 | 2016-09-07 | 浙江大学 | 一种用于图像分类的多任务机器学习方法及其装置 |
CN103699908B (zh) * | 2014-01-14 | 2016-10-05 | 上海交通大学 | 基于联合推理的视频多目标跟踪方法 |
US9582753B2 (en) * | 2014-07-30 | 2017-02-28 | Mitsubishi Electric Research Laboratories, Inc. | Neural networks for transforming signals |
CN104295286A (zh) * | 2014-08-11 | 2015-01-21 | 西安理工大学 | 一种有杆式抽油机运行工况智能识别方法 |
CN104157293B (zh) * | 2014-08-28 | 2017-04-05 | 福建师范大学福清分校 | 一种增强声环境中目标语音信号拾取的信号处理方法 |
CN104732500A (zh) * | 2015-04-10 | 2015-06-24 | 天水师范学院 | 脉冲耦合神经网络中药材显微图像噪声滤除系统及方法 |
-
2014
- 2014-07-30 US US14/446,431 patent/US9582753B2/en active Active
-
2015
- 2015-07-24 EP EP15751113.0A patent/EP3175393B1/en active Active
- 2015-07-24 CN CN201580038701.7A patent/CN106537420B/zh active Active
- 2015-07-24 WO PCT/JP2015/071730 patent/WO2016017787A1/en active Application Filing
- 2015-07-24 JP JP2017503307A patent/JP6328320B2/ja active Active
-
2016
- 2016-11-03 US US15/342,252 patent/US10592800B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009128906A (ja) * | 2007-11-19 | 2009-06-11 | Mitsubishi Electric Research Laboratories Inc | 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110060699A (zh) * | 2019-05-21 | 2019-07-26 | 哈尔滨工程大学 | 一种基于深度稀疏展开的单信道语音分离方法 |
CN110189761A (zh) * | 2019-05-21 | 2019-08-30 | 哈尔滨工程大学 | 一种基于贪婪深度字典学习的单信道语音去混响方法 |
CN110189761B (zh) * | 2019-05-21 | 2021-03-30 | 哈尔滨工程大学 | 一种基于贪婪深度字典学习的单信道语音去混响方法 |
Also Published As
Publication number | Publication date |
---|---|
US20170053203A1 (en) | 2017-02-23 |
US9582753B2 (en) | 2017-02-28 |
JP6328320B2 (ja) | 2018-05-23 |
US10592800B2 (en) | 2020-03-17 |
CN106537420A (zh) | 2017-03-22 |
CN106537420B (zh) | 2019-06-11 |
EP3175393B1 (en) | 2021-08-25 |
WO2016017787A1 (en) | 2016-02-04 |
US20160034810A1 (en) | 2016-02-04 |
EP3175393A1 (en) | 2017-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6328320B2 (ja) | 入力信号を変換する方法 | |
US9721202B2 (en) | Non-negative matrix factorization regularized by recurrent neural networks for audio processing | |
JP2015521748A (ja) | 入力信号を変換する方法 | |
US9607627B2 (en) | Sound enhancement through deverberation | |
Jasa et al. | Nested sampling applied in Bayesian room-acoustics decay analysis | |
Mohammadiha et al. | A state-space approach to dynamic nonnegative matrix factorization | |
O’Shaughnessy et al. | Sparse Bayesian learning with dynamic filtering for inference of time-varying sparse signals | |
JP6099032B2 (ja) | 信号処理装置、信号処理方法及びコンピュータプログラム | |
JP2014048399A (ja) | 音響信号解析装置、方法、及びプログラム | |
JP5881454B2 (ja) | 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム | |
Nortier et al. | Unsupervised speech enhancement with diffusion-based generative models | |
Antonello et al. | Source localization and signal reconstruction in a reverberant field using the FDTD method | |
Darwish et al. | Perspectives of orthonormal basis functions based kernels in Bayesian system identification | |
Chung et al. | Training and compensation of class-conditioned NMF bases for speech enhancement | |
JP5689844B2 (ja) | スペクトル推定装置、その方法及びプログラム | |
Allassonnière et al. | A new class of em algorithms. escaping local minima and handling intractable sampling | |
Mo et al. | Sparse representation in Szegő kernels through reproducing kernel Hilbert space theory with applications | |
CN111160487A (zh) | 人脸图像数据集的扩充方法和装置 | |
JP2019193073A (ja) | 音源分離装置、その方法、およびプログラム | |
JP5188319B2 (ja) | 信号解析装置、信号解析方法、プログラム及び記録媒体 | |
Koundinya et al. | Online speech enhancement by retraining of LSTM using SURE loss and policy iteration | |
Tzikas et al. | Incremental relevance vector machine with kernel learning | |
Wang | A Study on Multi-Subspace Representation of Nonlinear Mixture with Application in Blind Source Separation: Modeling and Performance Analysis | |
Ben Abdallah | N-Dimensional Polynomial Neural Networks and their Applications | |
Faubel | Statistical signal processing techniques for robust speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180320 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6328320 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |