JPWO2020003450A1 - データ処理システムおよびデータ処理方法 - Google Patents
データ処理システムおよびデータ処理方法 Download PDFInfo
- Publication number
- JPWO2020003450A1 JPWO2020003450A1 JP2020526814A JP2020526814A JPWO2020003450A1 JP WO2020003450 A1 JPWO2020003450 A1 JP WO2020003450A1 JP 2020526814 A JP2020526814 A JP 2020526814A JP 2020526814 A JP2020526814 A JP 2020526814A JP WO2020003450 A1 JPWO2020003450 A1 JP WO2020003450A1
- Authority
- JP
- Japan
- Prior art keywords
- data
- neural network
- intermediate data
- processing unit
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 115
- 238000003672 processing method Methods 0.000 title description 3
- 238000013528 artificial neural network Methods 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
ニューラルネットワークの学習において学習データそのもののみを学習すると、ニューラルネットワークは非常に多い最適化対象パラメータを持つため学習データに過適合した複雑な写像が得られてしまう。一般的なデータ増幅では、学習データの幾何形状、値等に摂動を加えることにより過適合を緩和できる。しかし、各学習データの近傍のみに摂動データが充填されるため、その効果は限定的である。Between Class Learningでは、2つの学習データおよび各々に対応する理想的な出力データを適当な比率で混合することでデータを増幅する。これにより、学習データの空間と出力データの空間で密に擬似データが充填され、より過適合を抑制できる。一方、学習の際、ネットワークの中間部の表現空間は学習されるデータを広い分布に表現できるよう学習される。よって本発明では、入力に近い層から出力に近い層まで多くの中間層でデータを混合することで中間部の表現空間を改善し、ネットワーク全体としても学習データへの過適合を抑制する方法を提案する。以下、具体的に説明する。
図3は、データ処理システム100による学習処理のフローチャートを示す。取得部110は、複数枚の学習用の画像を取得する(S10)。ニューラルネットワーク処理部130は、取得部110が取得した複数枚の学習用の画像のそれぞれに対して、ニューラルネットワークにしたがった処理を実行し、それぞれについての出力データを出力する(S12)。学習部140は、複数枚の学習用の画像のそれぞれについての出力データと、それぞれについての正解値とに基づいて、パラメータを更新する(S14)。学習部140は、終了条件が満たされるか否かを判定する(S16)。終了条件が満たされない場合(S16のN)、処理はS10に戻される。終了条件が満たされる場合(S16のY)、処理は終了する。
適用処理では、学習用の画像のセットに含まれるN個の学習用の画像に基づくN個の中間データのそれぞれを、当該N個の中間データから選択された少なくとも1つの中間データ、すなわち同質なデータを用いて攪乱すればよく、様々な変形例が考えられる。以下、変形例をいくつか説明する。
図5は、ニューラルネットワークの構成の他の一例を模式的に示す図である。この例では、畳み込み処理の後に攪乱要素を含む。つまり、既存手法であるResidual networksやDensely connected networksの各畳み込み処理の後に攪乱要素を含めたものに相当する。各中間層では、畳み込み処理を行う中間層要素に入力されるべき中間データと、当該中間データを当該中間層要素に入力することにより出力された中間データに対して攪乱処理を実行することにより得られる中間データとが統合される。別の言い方をすると、各中間層では、入出力関係が恒等写像である恒等写像経路と、経路に前記最適化対象パラメータを有する最適化対象経路とを統合する演算が実行される。本変形例によれば、恒等写像経路の恒等性を維持したまま最適化対象経路に撹乱を加えることで、学習をより安定させることができる。
実施の形態では特に言及しなかったが、式(1)において、σを学習の繰り返し回数に応じて単調増加させてもよい。これにより学習が安定化する学習後期に、より過学習を抑えることができる。
Claims (8)
- 入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行するニューラルネットワーク処理部と、
前記ニューラルネットワーク処理部が学習データに対して前記処理を実行することにより出力される出力データと、その学習データに対する理想的な出力データとの比較に基づいて、前記ニューラルネットワークの最適化対象パラメータを最適化する学習部と、を備え、
前記ニューラルネットワーク処理部は、第M層(Mは1以上の整数)の中間層を構成する中間層要素への入力データまたは前記中間層要素からの出力データを表す中間データであって、学習データに含まれるN(2以上の整数)個の学習サンプルのセットに基づくN個の中間データのそれぞれに対して、当該N個の中間データから選択した少なくとも1つの中間データを用いた演算を適用する攪乱処理を実行することを特徴とするデータ処理システム。 - 前記ニューラルネットワーク処理部は、攪乱処理として、N個の中間データのそれぞれに対して、当該N個の中間データから選択した少なくとも1つの中間データを線形結合することを特徴とする請求項1に記載のデータ処理システム。
- 前記ニューラルネットワーク処理部は、攪乱処理として、N個の中間データのそれぞれに対して、当該N個の中間データから選択した少なくとも1つの中間データを乱数倍したデータを足し合わせることを特徴とする請求項2に記載のデータ処理システム。
- 前記ニューラルネットワーク処理部は、攪乱処理として、N個の中間データのそれぞれに対して、当該N個の中間データからランダムに選択された少なくとも1つの中間データを用いた演算を適用することを特徴とする請求項1に記載のデータ処理システム。
- 前記ニューラルネットワーク処理部は、攪乱処理として、N個の中間データのうちのi(iは2以上N以下の整数)番目の中間データに対して、順序をランダムに並べ替えた当該N個の中間データのi番目の中間データを用いた演算を適用することを特徴とする請求項4に記載のデータ処理システム。
- 前記ニューラルネットワーク処理部は、中間層要素に入力されるべき中間データと、当該中間データを当該中間層要素に入力することにより出力された中間データに対して攪乱処理を実行することにより得られる中間データとを統合する処理を実行することを特徴とする請求項1に記載のデータ処理システム。
- 前記ニューラルネットワーク処理部は、適用処理時は、攪乱処理を実行しないことを特徴とする請求項1から6のいずれかに記載のデータ処理システム。
- 前記ニューラルネットワーク処理部は、適用処理時は、攪乱処理の代わりに、N個の中間データのうちのi番目の中間データに乗じられる係数の期待値を乗じた結果を当該i番目の中間データに対する出力データとして出力することを特徴とする請求項2に記載のデータ処理システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/024645 WO2020003450A1 (ja) | 2018-06-28 | 2018-06-28 | データ処理システムおよびデータ処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020003450A1 true JPWO2020003450A1 (ja) | 2021-02-18 |
JP6994572B2 JP6994572B2 (ja) | 2022-01-14 |
Family
ID=68986767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020526814A Active JP6994572B2 (ja) | 2018-06-28 | 2018-06-28 | データ処理システムおよびデータ処理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210117793A1 (ja) |
JP (1) | JP6994572B2 (ja) |
CN (1) | CN112313676A (ja) |
WO (1) | WO2020003450A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125572A1 (en) * | 2014-11-05 | 2016-05-05 | Korea Advanced Institute Of Science And Technology | Device and method to generate image using image learning model |
JP2017211939A (ja) * | 2016-05-27 | 2017-11-30 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP2018092610A (ja) * | 2016-11-28 | 2018-06-14 | キヤノン株式会社 | 画像認識装置、画像認識方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110861A (ja) * | 1992-09-30 | 1994-04-22 | Hitachi Ltd | 適応的制御システム |
CN106485192B (zh) * | 2015-09-02 | 2019-12-06 | 富士通株式会社 | 用于图像识别的神经网络的训练方法和装置 |
US10803582B2 (en) * | 2016-07-04 | 2020-10-13 | Nec Corporation | Image diagnosis learning device, image diagnosis device, image diagnosis method, and recording medium for storing program |
CN108074211B (zh) * | 2017-12-26 | 2021-03-16 | 浙江芯昇电子技术有限公司 | 一种图像处理装置及方法 |
CN108154145B (zh) * | 2018-01-24 | 2020-05-19 | 北京地平线机器人技术研发有限公司 | 检测自然场景图像中的文本的位置的方法和装置 |
-
2018
- 2018-06-28 JP JP2020526814A patent/JP6994572B2/ja active Active
- 2018-06-28 CN CN201880094927.2A patent/CN112313676A/zh active Pending
- 2018-06-28 WO PCT/JP2018/024645 patent/WO2020003450A1/ja active Application Filing
-
2020
- 2020-12-23 US US17/133,402 patent/US20210117793A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125572A1 (en) * | 2014-11-05 | 2016-05-05 | Korea Advanced Institute Of Science And Technology | Device and method to generate image using image learning model |
JP2017211939A (ja) * | 2016-05-27 | 2017-11-30 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP2018092610A (ja) * | 2016-11-28 | 2018-06-14 | キヤノン株式会社 | 画像認識装置、画像認識方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2020003450A1 (ja) | 2020-01-02 |
JP6994572B2 (ja) | 2022-01-14 |
US20210117793A1 (en) | 2021-04-22 |
CN112313676A (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230267330A1 (en) | Parameter-Efficient Multi-Task and Transfer Learning | |
US10540583B2 (en) | Acceleration of convolutional neural network training using stochastic perforation | |
KR102011788B1 (ko) | 계층적 시각 특징을 이용한 시각 질의 응답 장치 및 방법 | |
JP2020135011A (ja) | 情報処理装置及び方法 | |
US9536206B2 (en) | Method and apparatus for improving resilience in customized program learning network computational environments | |
US12147781B2 (en) | Computer processing and outcome prediction systems and methods | |
US12141703B2 (en) | Minimum deep learning with gating multiplier | |
CN112836820A (zh) | 用于图像分类任务的深度卷积网络训方法、装置及系统 | |
WO2019106132A1 (en) | Gated linear networks | |
Nikoloska et al. | Time-warping invariant quantum recurrent neural networks via quantum-classical adaptive gating | |
JPWO2019142241A1 (ja) | データ処理システムおよびデータ処理方法 | |
US9336498B2 (en) | Method and apparatus for improving resilience in customized program learning network computational environments | |
JP6994572B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP6942204B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP2023078578A (ja) | 画像処理装置、学習システム、および、学習方法 | |
Xu et al. | A constructive algorithm for wavelet neural networks | |
US20220375489A1 (en) | Restoring apparatus, restoring method, and program | |
JP7000586B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP7055211B2 (ja) | データ処理システムおよびデータ処理方法 | |
JP2024153149A (ja) | 情報処理装置、機械学習用システム、および機械学習用プログラム | |
Zhou et al. | A non-orthogonal and multi-width RBF neural network for chaotic time series prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200910 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200910 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211213 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6994572 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |