JP7326867B2 - 情報処理装置、情報処理プログラム及び情報処理方法 - Google Patents
情報処理装置、情報処理プログラム及び情報処理方法 Download PDFInfo
- Publication number
- JP7326867B2 JP7326867B2 JP2019095468A JP2019095468A JP7326867B2 JP 7326867 B2 JP7326867 B2 JP 7326867B2 JP 2019095468 A JP2019095468 A JP 2019095468A JP 2019095468 A JP2019095468 A JP 2019095468A JP 7326867 B2 JP7326867 B2 JP 7326867B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- mini
- batch
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Neurology (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成する処理と、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成する処理とを実行する生成部と、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、各ネットワーク層の重みパラメータを固定したうえで、前記第2のミニバッチを用いて学習を行う学習部とを有する。
<情報処理装置の機能構成>
はじめに、ニューラルネットワークの一例であるDNN(Deep Neural Network)を用いて学習処理を行う情報処理装置の機能構成について説明する。図1は、情報処理装置の機能構成の一例を示す第1の図である。情報処理装置100には、情報処理プログラムがインストールされており、当該プログラムが実行されることで、情報処理装置100は、拡張部110、学習部120、推論部130として機能する。
次に、情報処理装置100のハードウェア構成について説明する。図2は、情報処理装置のハードウェア構成の一例を示す図である。図2に示すように、情報処理装置100は、CPU(Central Processing Unit)201、GPU(Graphics Processing Unit)202を有する。また、情報処理装置100は、ROM(Read Only Memory)203、RAM(Random Access Memory)204を有する。なお、CPU201、GPU202、ROM203、RAM204は、いわゆるコンピュータを形成する。
次に、情報処理装置100の拡張部110の機能構成について説明する。図3は、情報処理装置の拡張部の機能構成の一例を示す図である。
・読み出した学習用データそれぞれについて、サイズが5%~90%の範囲、かつ、アスペクト比が0.667~1.5の範囲で、領域を切り出し、
・切り出した領域を224×224[画素]にリサイズし、
所定数のまとまりであるミニバッチを複数含む第1のミニバッチとして出力する(図3の例では、N個のミニバッチを含む第1のミニバッチとして出力した様子を示している)。
・読み出した学習用データそれぞれについて、短辺が256[画素]となるようにリサイズし、
・リサイズした学習用データそれぞれについて、中心領域の224×224[画素]を切り出し、
所定数のまとまりであるミニバッチを複数含む第2のミニバッチとして出力する(図3の例では、N個のミニバッチを含む第2のミニバッチとして出力した様子を示している)。
次に、拡張部110において第1のデータ処理により生成された第1のミニバッチの学習処理時の構成例と、第2のデータ処理により生成された第2のミニバッチの学習処理時の構成例とについて説明する。
次に、情報処理装置100の学習部120の機能構成について説明する。図5は、情報処理装置の学習部の機能構成の一例を示す第1の図である。図5に示すように、学習部120は、入力部と、第1層から第M層までの各ネットワーク層(DNNの各ネットワーク層)と、比較部とを有する。また、第1層から第M層までの各ネットワーク層は、例えば、畳み込み部と、バッチノーマライゼーション部(BN部)と、活性化部と、プーリング部とを有する(図5下側参照)。
次に、情報処理装置100による学習処理の流れについて説明する。図6は、情報処理装置による学習処理の流れを示す第1のフローチャートである。図6に示すように、ステップS601において、拡張部110は、学習用データ格納部140より学習用データを読み出す。
上記第1の実施形態では、第2のミニバッチを用いて学習を行う際、学習パラメータに加え、重みパラメータも更新するものとして説明した。これに対して、第2の実施形態では、第2のミニバッチを用いて学習を行う際、学習率をゼロに設定することで、重みパラメータを固定し、学習パラメータのみを更新する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
はじめに、第2の実施形態に係る情報処理装置100の学習部120の機能構成について説明する。図7は、情報処理装置の学習部の機能構成の一例を示す第2の図である。図5との相違点は、X+1epoch目から100epoch目まで、第2のミニバッチを用いて学習を行うにあたり、学習率をゼロに設定する点である。
次に、第2の実施形態に係る情報処理装置100による学習処理の流れについて説明する。図8は、情報処理装置による学習処理の流れを示す第2のフローチャートである。図6に示す学習処理との相違点は、ステップS801である。
上記第1及び第2の実施形態では、学習処理の際に、X+1epochから100epoch目に、第2のミニバッチを用いて学習を行うことで、偏りの少ない適切な推論用パラメータを算出するものとして説明した。
はじめに、第3の実施形態に係る情報処理装置の機能構成について説明する。図9は、情報処理装置の機能構成の一例を示す第2の図である。図1を用いて説明した情報処理装置100との相違点は、図9に示す情報処理装置900の場合、更新部910を有する点である。
次に、第3の実施形態に係る情報処理装置900の更新部910及び推論部130の機能構成について説明する。図10は、情報処理装置の更新部及び推論部の機能構成の一例を示す図である。
次に、第3の実施形態に係る情報処理装置900による推論処理の流れについて説明する。図11は、情報処理装置による推論処理の流れを示すフローチャートである。
上記第1及び第2の実施形態では、データ拡張処理の処理内容を図3に例示したが、データ拡張処理の処理内容はこれに限定されず、学習用データをランダムに変形する処理内容であれば、他の処理内容であってもよい。
(付記1)
ニューラルネットワークを用いて学習処理を行う情報処理装置であって、
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成する処理と、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成する処理とを実行する生成部と、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、前記第2のミニバッチを用いて学習を行う学習部と
を有する情報処理装置。
(付記2)
前記学習部は、前記学習処理の際、前記第1のミニバッチを用いて行う学習が、予め定められたepoch数に到達した場合に、前記第2のミニバッチを用いて学習を行う、付記1に記載の情報処理装置。
(付記3)
前記学習部は、前記学習処理の際、前記第1のミニバッチを用いて行う学習が、予め定められた学習率に到達した場合に、前記第2のミニバッチを用いて学習を行う、付記1に記載の情報処理装置。
(付記4)
前記学習部は、前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、前記学習部に含まれる各ネットワーク層の重みパラメータを固定したうえで、前記第2のミニバッチを用いて学習を行う、付記1に記載の情報処理装置。
(付記5)
前記学習処理により得られた学習結果に、推論用データを入力することで推論処理を行う推論部と、
前記推論用データを入力する際、前記推論用データを用いて推論用パラメータを算出し、前記推論部に設定する更新部と
を更に有する、付記1に記載の情報処理装置。
(付記6)
ニューラルネットワークを用いて学習処理を行うコンピュータに、
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成する処理と、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成する処理とを実行し、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、前記第2のミニバッチを用いて学習を行う、
処理を実行させる情報処理プログラム。
(付記7)
ニューラルネットワークを用いて学習処理を行うコンピュータが、
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成する処理と、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成する処理とを実行し、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、前記第2のミニバッチを用いて学習を行う、
処理を実行する情報処理方法。
110 :拡張部
120 :学習部
130 :推論部
900 :情報処理装置
910 :更新部
Claims (6)
- ニューラルネットワークを用いて学習処理を行う情報処理装置であって、
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成する処理と、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成する処理とを実行する生成部と、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、各ネットワーク層の重みパラメータを固定したうえで、前記第2のミニバッチを用いて学習を行う学習部と
を有する情報処理装置。 - 前記学習部は、前記学習処理の際、前記第1のミニバッチを用いて行う学習が、予め定められたepoch数に到達した場合に、前記第2のミニバッチを用いて学習を行う、請求項1に記載の情報処理装置。
- 前記学習部は、前記学習処理の際、前記第1のミニバッチを用いて行う学習が、予め定められた学習率に到達した場合に、前記第2のミニバッチを用いて学習を行う、請求項1に記載の情報処理装置。
- 前記学習処理により得られた学習結果に、推論用データを入力することで推論処理を行う推論部と、
前記推論用データを入力する際、前記推論用データを用いて推論用パラメータを算出し、前記推論部に設定する更新部と
を更に有する、請求項1に記載の情報処理装置。 - ニューラルネットワークを用いて学習処理を行うコンピュータに、
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成し、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成し、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、各ネットワーク層の重みパラメータを固定したうえで、前記第2のミニバッチを用いて学習を行う、
処理を実行させる情報処理プログラム。 - ニューラルネットワークを用いて学習処理を行うコンピュータが、
学習用データに対してデータ拡張処理を行い第1のミニバッチを生成し、該学習用データに対してデータ拡張処理を行わずに第2のミニバッチを生成し、
前記学習処理の際、前記第1のミニバッチを用いて学習を行った後に、各ネットワーク層の重みパラメータを固定したうえで、前記第2のミニバッチを用いて学習を行う、
処理を実行する情報処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019095468A JP7326867B2 (ja) | 2019-05-21 | 2019-05-21 | 情報処理装置、情報処理プログラム及び情報処理方法 |
EP20170677.7A EP3742353A1 (en) | 2019-05-21 | 2020-04-21 | Information processing apparatus, information processing program, and information processing method |
US16/861,273 US11941505B2 (en) | 2019-05-21 | 2020-04-29 | Information processing apparatus of controlling training of neural network, non-transitory computer-readable storage medium for storing information processing program of controlling training of neural network, and information processing method of controlling training of neural network |
CN202010396902.7A CN111985606B (zh) | 2019-05-21 | 2020-05-12 | 信息处理设备、计算机可读存储介质以及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019095468A JP7326867B2 (ja) | 2019-05-21 | 2019-05-21 | 情報処理装置、情報処理プログラム及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020190895A JP2020190895A (ja) | 2020-11-26 |
JP7326867B2 true JP7326867B2 (ja) | 2023-08-16 |
Family
ID=70390912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019095468A Active JP7326867B2 (ja) | 2019-05-21 | 2019-05-21 | 情報処理装置、情報処理プログラム及び情報処理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11941505B2 (ja) |
EP (1) | EP3742353A1 (ja) |
JP (1) | JP7326867B2 (ja) |
CN (1) | CN111985606B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7021132B2 (ja) * | 2019-01-22 | 2022-02-16 | 株式会社東芝 | 学習装置、学習方法およびプログラム |
KR102265947B1 (ko) * | 2020-11-23 | 2021-06-17 | 주식회사 엠로 | 기계 학습 기반 정보 제공 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170206457A1 (en) | 2016-01-20 | 2017-07-20 | Adobe Systems Incorporated | Digital Content Interaction Prediction and Training that Addresses Imbalanced Classes |
JP2019502970A (ja) | 2015-10-20 | 2019-01-31 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 抵抗型処理ユニット |
JP2019053383A (ja) | 2017-09-13 | 2019-04-04 | 株式会社豊田中央研究所 | ニューラルネットワーク装置及びその製造方法 |
WO2019079198A1 (en) | 2017-10-16 | 2019-04-25 | Illumina, Inc. | CLASSIFICATION OF A CONNECTION SITE BASED ON DEEP LEARNING |
US20220036548A1 (en) | 2019-04-15 | 2022-02-03 | Genentech, Inc. | Ovarian toxicity assessment in histopathological images using deep learning |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110055131A1 (en) * | 2009-08-28 | 2011-03-03 | Hung-Han Chen | Method of universal computing device |
US9607233B2 (en) * | 2012-04-20 | 2017-03-28 | Applied Materials Israel Ltd. | Classifier readiness and maintenance in automatic defect classification |
US11017311B2 (en) * | 2014-06-30 | 2021-05-25 | Hewlett Packard Enterprise Development Lp | Dataset augmentation based on occlusion and inpainting |
JP6620439B2 (ja) | 2015-07-01 | 2019-12-18 | 株式会社リコー | 学習方法、プログラム及び学習装置 |
JP2017097585A (ja) | 2015-11-24 | 2017-06-01 | 株式会社リコー | 学習装置、プログラム及び学習方法 |
CN105825228B (zh) * | 2016-03-14 | 2019-04-30 | 百度在线网络技术(北京)有限公司 | 图像识别方法及装置 |
US10915808B2 (en) * | 2016-07-05 | 2021-02-09 | International Business Machines Corporation | Neural network for chemical compounds |
CN108052862B (zh) * | 2017-11-09 | 2019-12-06 | 北京达佳互联信息技术有限公司 | 年龄预估方法和装置 |
WO2019221654A1 (en) * | 2018-05-17 | 2019-11-21 | Tobii Ab | Autoencoding generative adversarial network for augmenting training data usable to train predictive models |
KR102641116B1 (ko) * | 2018-08-23 | 2024-02-27 | 삼성전자주식회사 | 데이터 증강에 기초한 인식 모델 트레이닝 방법 및 장치, 이미지 인식 방법 및 장치 |
US20200218982A1 (en) * | 2019-01-04 | 2020-07-09 | Microsoft Technology Licensing, Llc | Dithered quantization of parameters during training with a machine learning tool |
-
2019
- 2019-05-21 JP JP2019095468A patent/JP7326867B2/ja active Active
-
2020
- 2020-04-21 EP EP20170677.7A patent/EP3742353A1/en active Pending
- 2020-04-29 US US16/861,273 patent/US11941505B2/en active Active
- 2020-05-12 CN CN202010396902.7A patent/CN111985606B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019502970A (ja) | 2015-10-20 | 2019-01-31 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 抵抗型処理ユニット |
US20170206457A1 (en) | 2016-01-20 | 2017-07-20 | Adobe Systems Incorporated | Digital Content Interaction Prediction and Training that Addresses Imbalanced Classes |
JP2019053383A (ja) | 2017-09-13 | 2019-04-04 | 株式会社豊田中央研究所 | ニューラルネットワーク装置及びその製造方法 |
WO2019079198A1 (en) | 2017-10-16 | 2019-04-25 | Illumina, Inc. | CLASSIFICATION OF A CONNECTION SITE BASED ON DEEP LEARNING |
US20220036548A1 (en) | 2019-04-15 | 2022-02-03 | Genentech, Inc. | Ovarian toxicity assessment in histopathological images using deep learning |
Non-Patent Citations (1)
Title |
---|
KAYAMA, Masahiro,Methodology for Constructing Optimal Multi-layered Neural Networks,Computer Science Department Technical Report[online],University of California,1991年09月,[retrieved on 2022.12.27], Retrieved from the Internet: <URL: https://ftp.cs.ucla.edu/tech-report/1991-reports/910068.pdf> |
Also Published As
Publication number | Publication date |
---|---|
US20200372321A1 (en) | 2020-11-26 |
EP3742353A1 (en) | 2020-11-25 |
CN111985606A (zh) | 2020-11-24 |
US11941505B2 (en) | 2024-03-26 |
JP2020190895A (ja) | 2020-11-26 |
CN111985606B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190065958A1 (en) | Apparatus and Methods for Training in Fully Connected Layers of Convolutional Networks | |
KR102129895B1 (ko) | 폴드된 특징 데이터에 대한 컨볼루션 연산을 수행하기 위한 방법 및 장치 | |
US20190114742A1 (en) | Image upscaling with controllable noise reduction using a neural network | |
JP7326867B2 (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
US20080183792A1 (en) | Method for Performing Arithmetic Operations Using a Multi-Core Processor | |
KR20200066952A (ko) | 확장 컨벌루션 연산을 수행하는 장치 및 방법 | |
US20210357740A1 (en) | Second-order optimization methods for avoiding saddle points during the training of deep neural networks | |
CN110874628A (zh) | 人工神经网络及其中控制定点的方法 | |
EP3855364A1 (en) | Training machine learning models | |
CN112396085A (zh) | 识别图像的方法和设备 | |
CN114792387A (zh) | 图像恢复方法和设备 | |
US10824944B2 (en) | Method for feature data recalibration and apparatus thereof | |
US20220092410A1 (en) | Architected library interface for kernel fusion | |
US20210125033A1 (en) | Apparatus and method for neural network processing | |
JP7279507B2 (ja) | 情報処理装置、情報処理プログラム及び制御方法 | |
KR20200072308A (ko) | 뉴럴 네트워크에서 컨볼루션 연산을 수행하는 방법 및 장치 | |
KR102559036B1 (ko) | 음수값을 갖는 활성화 함수에서 제로 스키핑을 제공하는 방법 및 장치 | |
JP7169768B2 (ja) | 画像処理装置、画像処理方法 | |
US20190073584A1 (en) | Apparatus and methods for forward propagation in neural networks supporting discrete data | |
US20230334315A1 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
US11960574B2 (en) | Image generation using adversarial attacks for imbalanced datasets | |
EP4102419A1 (en) | Method and system for kernel continuing learning | |
KR102271254B1 (ko) | 이진화된 컨벌루션 신경망의 추론 속도 향상 장치 및 방법 | |
US11907679B2 (en) | Arithmetic operation device using a machine learning model, arithmetic operation method using a machine learning model, and training method of the machine learning model | |
US20230237374A1 (en) | Method of controlling machine learning model and system performing the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7326867 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |