JP7188589B2 - 復元装置、復元方法、およびプログラム - Google Patents
復元装置、復元方法、およびプログラム Download PDFInfo
- Publication number
- JP7188589B2 JP7188589B2 JP2021528089A JP2021528089A JP7188589B2 JP 7188589 B2 JP7188589 B2 JP 7188589B2 JP 2021528089 A JP2021528089 A JP 2021528089A JP 2021528089 A JP2021528089 A JP 2021528089A JP 7188589 B2 JP7188589 B2 JP 7188589B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- clipped
- restoration
- neural network
- clipped signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 58
- 230000006870 function Effects 0.000 claims description 17
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 description 48
- 238000012545 processing Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
Description
第一実施形態の信号復元装置(以下、「復元装置」とも呼ぶ)は、ゲート付き畳み込みニューラルネットワーク(Gated Convolutional Neural Network)(例えば、参考文献1,2参照)から構成される信号復元ニューラルネットワークにより、クリップ後の信号からクリップ前の信号を復元する信号処理装置である。ニューラルネットワークの演算は固定であるため、信号復元ニューラルネットワークによる信号復元処理全体の演算量は一定となる。また、十分な学習データを用いて事前に十分に信号復元ニューラルネットワークを学習させることで、復元後の信号にクリップ前の信号の特性がより良く反映されることが期待できる。
〔参考文献2〕J. Yu, Z. Lin, J. Yang, X. Shen, X. Lu, and T. S. Huang, "Free-Form Image Inpainting with Gated Convolution," arXiv:1806.03589, Submitted on 10 Jun 2018.
第一実施形態の波形復元装置1は、図1に例示するように、フレーム分割部11、波形復元部12(以下、「復元部」とも呼ぶ)、およびフレーム合成部13を備える。波形復元部12は、図2に例示するように、信号復元ニューラルネットワーク121および置換部122を備える。この波形復元装置1が、図3に例示する各ステップの処理を行うことにより第一実施形態の波形復元方法が実現される。
第一実施形態の信号復元ニューラルネットワークでは、信号のおおまかな形状は復元されるが、細部の形状は復元されにくい傾向がある。そこで、第二実施形態の波形復元部では、細部形状の復元精度を上げるために、図4に示すように、信号復元ニューラルネットワークを二段直列に接続する。すなわち、第一実施形態の信号復元ニューラルネットワーク121-1により復元された信号ベクトルに対して、さらに二段目の信号復元ニューラルネットワーク121-2を適用し、クリップ前信号のベクトルを推定するように構成する。
クリップ後の信号ではなく欠落のある信号を対象として元の信号を復元する場合にも、クリップ後の信号と同様に元の信号の細部の情報が復元された信号から失われやすい。そのため、欠落のある信号を復元する場合にも、第二実施形態の構成を適用できる。この場合、入力データは、欠落有り信号ベクトルと欠落情報ベクトルからなるL×2行列になる。図4に示すように、二段目の信号復元ニューラルネットワークを用いることで、一段目の推定信号から、より復元精度の高い復元信号を推定することができる。
本発明のポイントは以下の3点である。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図5に示すコンピュータの記憶部1020に読み込ませ、制御部1010、入力部1030、出力部1040などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (7)
- クリップ後信号と当該クリップ後信号のうちクリップされた部分を表すクリップ情報とを含む入力データから信号復元ニューラルネットワークを用いて当該クリップ後信号に対応するクリップ前信号を推定する復元部を含み、
上記信号復元ニューラルネットワークは、クリップ前信号と当該クリップ前信号に対応するクリップ後信号と当該クリップ後信号に関するクリップ情報とを学習データとして、上記入力データを入力とし、上記クリップ前信号の推定値を出力するよう学習されたものであり、
上記クリップ情報は、上限値でクリップされた部分を表す上限クリップ情報と下限値でクリップされた部分を表す下限クリップ情報とからなる、
復元装置。 - クリップ後信号と当該クリップ後信号のうちクリップされた部分を表すクリップ情報とを含む入力データから信号復元ニューラルネットワークを用いて当該クリップ後信号に対応するクリップ前信号を推定する復元部を含み、
上記信号復元ニューラルネットワークは、クリップ前信号と当該クリップ前信号に対応するクリップ後信号と当該クリップ後信号に関するクリップ情報とを学習データとして、上記入力データを入力とし、上記クリップ前信号の推定値を出力するよう学習されたものであり、
上記信号復元ニューラルネットワークは、ゲート付き畳み込みニューラルネットワークであり、活性化関数が正負の値を出力する関数である、
復元装置。 - クリップ後信号と当該クリップ後信号のうちクリップされた部分を表すクリップ情報とを含む入力データから信号復元ニューラルネットワークを用いて当該クリップ後信号に対応するクリップ前信号を推定する復元部を含み、
上記信号復元ニューラルネットワークは、クリップ前信号と当該クリップ前信号に対応するクリップ後信号と当該クリップ後信号に関するクリップ情報とを学習データとして、上記入力データを入力とし、上記クリップ前信号の推定値を出力するよう学習されたものであり、
上記復元部は、上記信号復元ニューラルネットワークを二段直列に接続し、一段目の信号復元ニューラルネットワークの出力と上記クリップ情報とからなる入力データを二段目の信号復元ニューラルネットワークへ入力して二段目の信号復元ニューラルネットワークの出力を上記クリップ前信号の推定値とする、
復元装置。 - 復元部が、クリップ後信号と当該クリップ後信号のうちクリップされた部分を表すクリップ情報とを含む入力データから信号復元ニューラルネットワークを用いて当該クリップ後信号に対応するクリップ前信号を推定し、
上記信号復元ニューラルネットワークは、クリップ前信号と当該クリップ前信号に対応するクリップ後信号と当該クリップ後信号に関するクリップ情報とを学習データとして、上記入力データを入力とし、上記クリップ前信号の推定値を出力するよう学習されたものであり、
上記クリップ情報は、上限値でクリップされた部分を表す上限クリップ情報と下限値でクリップされた部分を表す下限クリップ情報とからなる、
復元方法。 - 復元部が、クリップ後信号と当該クリップ後信号のうちクリップされた部分を表すクリップ情報とを含む入力データから信号復元ニューラルネットワークを用いて当該クリップ後信号に対応するクリップ前信号を推定し、
上記信号復元ニューラルネットワークは、クリップ前信号と当該クリップ前信号に対応するクリップ後信号と当該クリップ後信号に関するクリップ情報とを学習データとして、上記入力データを入力とし、上記クリップ前信号の推定値を出力するよう学習されたものであり、
上記信号復元ニューラルネットワークは、ゲート付き畳み込みニューラルネットワークであり、活性化関数が正負の値を出力する関数である、
復元方法。 - 復元部が、クリップ後信号と当該クリップ後信号のうちクリップされた部分を表すクリップ情報とを含む入力データから信号復元ニューラルネットワークを用いて当該クリップ後信号に対応するクリップ前信号を推定し、
上記信号復元ニューラルネットワークは、クリップ前信号と当該クリップ前信号に対応するクリップ後信号と当該クリップ後信号に関するクリップ情報とを学習データとして、上記入力データを入力とし、上記クリップ前信号の推定値を出力するよう学習されたものであり、
上記復元部は、上記信号復元ニューラルネットワークを二段直列に接続し、一段目の信号復元ニューラルネットワークの出力と上記クリップ情報とからなる入力データを二段目の信号復元ニューラルネットワークへ入力して二段目の信号復元ニューラルネットワークの出力を上記クリップ前信号の推定値とする、
復元方法。 - 請求項1から3のいずれかに記載の復元装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/024058 WO2020255242A1 (ja) | 2019-06-18 | 2019-06-18 | 復元装置、復元方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020255242A1 JPWO2020255242A1 (ja) | 2020-12-24 |
JP7188589B2 true JP7188589B2 (ja) | 2022-12-13 |
Family
ID=74037011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021528089A Active JP7188589B2 (ja) | 2019-06-18 | 2019-06-18 | 復元装置、復元方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220375489A1 (ja) |
JP (1) | JP7188589B2 (ja) |
WO (1) | WO2020255242A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11765011B2 (en) * | 2021-07-06 | 2023-09-19 | Huawei Technologies Co., Ltd. | Method and apparatus for transmitting and receiving data |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005275410A (ja) | 2004-03-23 | 2005-10-06 | Herman Becker Automotive Systems-Wavemakers Inc | ニューラルネットワークを利用してスピーチ信号を分離する。 |
JP2013162347A (ja) | 2012-02-06 | 2013-08-19 | Sony Corp | 画像処理装置、画像処理方法、プログラム、および装置 |
-
2019
- 2019-06-18 US US17/619,618 patent/US20220375489A1/en active Pending
- 2019-06-18 WO PCT/JP2019/024058 patent/WO2020255242A1/ja active Application Filing
- 2019-06-18 JP JP2021528089A patent/JP7188589B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005275410A (ja) | 2004-03-23 | 2005-10-06 | Herman Becker Automotive Systems-Wavemakers Inc | ニューラルネットワークを利用してスピーチ信号を分離する。 |
JP2013162347A (ja) | 2012-02-06 | 2013-08-19 | Sony Corp | 画像処理装置、画像処理方法、プログラム、および装置 |
Non-Patent Citations (2)
Title |
---|
IIZUKA,Satoshi et al.,Globally and Locally Consistent Image Completion,[onlone],米国,ACM,2017年07月,pages:1-14,[Retrieved from the Internet]<URL:https://dl.acm.org/doi/pdf/10.1145/3072959.3073659> |
YU,Jiahui et al.,Free-Form Image Inpainting with Gated Convolution,[online],米国,arXiv,2018年06月10日,pages:1-12,[retrieved on 2022.8.24],Retrieved from the Internet:<URL:https://arxiv.org/pdf/1806.03589v1.pdf> |
Also Published As
Publication number | Publication date |
---|---|
WO2020255242A1 (ja) | 2020-12-24 |
US20220375489A1 (en) | 2022-11-24 |
JPWO2020255242A1 (ja) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3340129B1 (en) | Artificial neural network class-based pruning | |
JP6998968B2 (ja) | ディープニューラルネットワークの実行方法、実行装置、学習方法、学習装置及びプログラム | |
JP7007488B2 (ja) | ハードウェアベースのプーリングのシステムおよび方法 | |
Chen et al. | Signal recovery on graphs: Variation minimization | |
JP2019079305A (ja) | データ分析装置、データ分析方法、およびデータ分析プログラム | |
WO2020003434A1 (ja) | 機械学習方法、機械学習装置、及び機械学習プログラム | |
US12045961B2 (en) | Image denoising method and apparatus based on wavelet high-frequency channel synthesis | |
Wei et al. | Deep unfolding with normalizing flow priors for inverse problems | |
KR20210043295A (ko) | 뉴럴 네트워크의 데이터를 양자화하는 방법 및 장치 | |
CN111783938A (zh) | 时间序列的预测方法和装置 | |
CN113454648A (zh) | 循环神经网络中的勒让德存储器单元 | |
JP7188589B2 (ja) | 復元装置、復元方法、およびプログラム | |
JP7118882B2 (ja) | 変数変換装置、潜在パラメータ学習装置、潜在パラメータ生成装置、これらの方法及びプログラム | |
Zeng et al. | Slice-based online convolutional dictionary learning | |
KR20210038027A (ko) | 신경망 압축 훈련 방법 및 압축된 신경망을 이용하는 방법 | |
JP7047665B2 (ja) | 学習装置、学習方法及び学習プログラム | |
CN113793329A (zh) | 一种空间边缘增强的轻量级显著物体检测方法 | |
WO2020137641A1 (ja) | 復元装置、復元方法、およびプログラム | |
Castro et al. | From linear to nonlinear identification: One step at a time | |
WO2021090465A1 (ja) | 帯域拡張装置、帯域拡張方法、およびプログラム | |
JP6994572B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP7055211B2 (ja) | データ処理システムおよびデータ処理方法 | |
JPWO2020054402A1 (ja) | ニューラルネットワーク処理装置、コンピュータプログラム、ニューラルネットワーク製造方法、ニューラルネットワークデータの製造方法、ニューラルネットワーク利用装置、及びニューラルネットワーク小規模化方法 | |
JP7000586B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP2020030373A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7188589 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |