JPWO2020044566A1 - データ処理システムおよびデータ処理方法 - Google Patents

データ処理システムおよびデータ処理方法 Download PDF

Info

Publication number
JPWO2020044566A1
JPWO2020044566A1 JP2020540012A JP2020540012A JPWO2020044566A1 JP WO2020044566 A1 JPWO2020044566 A1 JP WO2020044566A1 JP 2020540012 A JP2020540012 A JP 2020540012A JP 2020540012 A JP2020540012 A JP 2020540012A JP WO2020044566 A1 JPWO2020044566 A1 JP WO2020044566A1
Authority
JP
Japan
Prior art keywords
data
output
intermediate layer
neural network
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020540012A
Other languages
English (en)
Other versions
JP7000586B2 (ja
Inventor
陽一 矢口
陽一 矢口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Publication of JPWO2020044566A1 publication Critical patent/JPWO2020044566A1/ja
Application granted granted Critical
Publication of JP7000586B2 publication Critical patent/JP7000586B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Image Analysis (AREA)

Abstract

データ処理システム100は、ニューラルネットワークにしたがった処理を実行するプロセッサを備える。ニューラルネットワークは、学習データに対してニューラルネットワークにしたがった処理を実行することにより出力される出力データと、学習データに対する理想的な出力データとの比較に基づいて、最適化対象パラメータが最適化されている。プロセッサは、第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、第(M+1)中間層の処理において、乗算を実行することにより出力される中間データに対して、プーリング処理を実行することを特徴とするデータ処理システム。

Description

本発明は、データ処理技術に関し、特に、学習された深層ニューラルネットワークを用いたデータ処理技術に関する。
畳み込みニューラルネットワーク(CNN : Convolutional Neural Network)は、1以上の非線形ユニットを含む数学的モデルであり、入力に対応する出力を予測する機械学習モデルである。多くの畳み込みニューラルネットワークは、入力層と出力層の他に、1以上の中間層(隠れ層)をもつ。各中間層の出力は次の層(中間層または出力層)の入力となる。畳み込みニューラルネットワークの各層は、入力および自身のパラメータに応じて出力を生成する。
Alex Krizhevsky、Ilya Sutskever、Geoffrey E. Hinton、「ImageNet Classification with Deep Convolutional Neural Networks」、NIPS2012_4824
畳み込みニューラルネットワークは、一般的に、平面方向の縮小を行うプーリング処理を含む。本発明者は、鋭意研究を重ねた結果、一貫学習の利点を活かして入力に応じて適した方法で平面方向の縮小することで、プーリング処理に入力されるデータをより有効に活用するようネットワークが学習され、その結果、未知データに対する予測精度が向上することを認識した。
本発明はこうした状況に鑑みてなされたものであり、その目的は、未知データに対する予測精度を向上できる技術を提供することにある。
上記課題を解決するために、本発明のある態様のデータ処理システムは、入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行するプロセッサを備える。ニューラルネットワークは、学習データに対して処理を実行することにより出力される出力データと、学習データに対する理想的な出力データとの比較に基づいて、最適化対象パラメータが最適化されており、プロセッサは、第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、第(M+1)中間層において、乗算を実行することにより出力される中間データに対して、プーリング処理を実行する。
本発明の別の態様もまた、データ処理システムである。このデータ処理システムは、入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行するプロセッサと、ニューラルネットワーク処理部が学習データに対して処理を実行することにより出力される出力データと、学習データに対する理想的な出力データとの比較に基づいて、ニューラルネットワークの最適化対象パラメータを最適化することにより、ニューラルネットワークを学習させる学習部と、を備える。プロセッサは、学習では、第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、第(M+1)中間層において、乗算を実行することにより出力される中間データに対して、プーリング処理を実行する。
本発明のさらに別の態様は、データ処理方法である。この方法は、入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行する。ニューラルネットワークは、学習データに対して処理を実行することにより出力される出力データと、学習データに対する理想的な出力データとの比較に基づいて、最適化対象パラメータが最適化されており、ニューラルネットワークにしたがった処理では、第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、第(M+1)中間層において、乗算を実行することにより出力される中間データに対して、プーリング処理を実行する。
本発明のさらに別の態様もまた、データ処理方法である。この方法は、学習データに対して、入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行することにより、学習データに対応する出力データを出力するステップと、学習データに対応する出力データと、学習データに対する理想的な出力データとの比較に基づいて、ニューラルネットワークの最適化対象パラメータを最適化するステップと、を備える。最適化対象パラメータを最適化するステップでは、第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、第(M+1)中間層において、乗算を実行することにより出力される中間データに対して、プーリング処理を実行する。
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、未知データに対する予測精度を向上できる。
実施の形態に係るデータ処理システムの機能および構成を示すブロック図である。 ニューラルネットワークの構成の一例を模式的に示す図である。 データ処理システムによる学習処理のフローチャートを示す図である。 データ処理システムによる適用処理のフローチャートを示す図である。
以下、本発明を好適な実施の形態をもとに図面を参照しながら説明する。
以下ではデータ処理装置を画像処理に適用する場合を例に説明するが、当業者によれば、データ処理装置を音声認識処理、自然言語処理、その他の処理にも適用可能であることが理解されよう。
図1は、実施の形態に係るデータ処理システム100の機能および構成を示すブロック図である。ここに示す各ブロックは、ハードウェア的には、コンピュータのCPU(central processing unit)をはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。
データ処理システム100は、学習用の画像(学習データ)と、その画像に対する理想的な出力データである正解値とに基づいてニューラルネットワークの学習を行う「学習処理」と、学習済みのニューラルネットワークを未知の画像(未知データ)に適用し、画像分類、物体検出または画像セグメンテーションなどの画像処理を行う「適用処理」と、を実行する。
学習処理では、データ処理システム100は、学習用の画像に対してニューラルネットワークにしたがった処理を実行し、学習用の画像に対する出力データを出力する。そしてデータ処理システム100は、出力データが正解値に近づく方向にニューラルネットワークの最適化(学習)対象のパラメータ(以下、「最適化対象パラメータ」と呼ぶ)を更新する。これを繰り返すことにより最適化対象パラメータが最適化される。
適用処理では、データ処理システム100は、学習処理において最適化された最適化対象パラメータを用いて、未知の画像に対してニューラルネットワークにしたがった処理を実行し、その画像に対する出力データを出力する。データ処理システム100は、出力データを解釈して、画像を画像分類したり、画像から物体検出したり、画像に対して画像セグメンテーションを行ったりする。
データ処理システム100は、取得部110と、記憶部120と、ニューラルネットワーク処理部130と、学習部140と、解釈部150と、を備える。主にニューラルネットワーク処理部130と学習部140により学習処理の機能が実現され、主にニューラルネットワーク処理部130と解釈部150により適用処理の機能が実現される。
取得部110は、学習処理においては、一度に複数の学習用の画像と、それら複数の学習用の画像のそれぞれに対応する正解値とを取得する。また取得部110は、適用処理においては、処理対象の未知の画像を取得する。なお、画像は、チャンネル数は特に問わず、例えばRGB画像であっても、また例えばグレースケール画像であってもよい。
記憶部120は、取得部110が取得した画像を記憶する他、ニューラルネットワーク処理部130、学習部140および解釈部150のワーク領域や、ニューラルネットワークのパラメータの記憶領域となる。
ニューラルネットワーク処理部130は、ニューラルネットワークにしたがった処理を実行する。ニューラルネットワーク処理部130は、ニューラルネットワークの入力層に対応する処理を実行する入力層処理部131と、中間層に対応する処理を実行する中間層処理部132と、出力層に対応する処理を実行する出力層処理部133と、を含む。
図2は、ニューラルネットワークの構成の一部を模式的に示す図である。
中間層処理部132は、第M(Mは1以上の整数)中間層の処理として、入力データを表す中間データと平面サイズの等しい特徴マップを出力する特徴マップ出力処理を実行する。特徴マップ出力処理では、中間データに対して、最適化対象パラメータからなる畳み込みカーネルによる畳み込み演算を含む演算を適用することにより上述の特徴マップを出力する。本実施の形態では、中間層処理部132は、特徴マップ出力処理として、中間データに対して畳み込み演算と活性化処理とを適用する。そして中間層処理部132は、第M中間層に入力されるべき中間データと、当該中間データを第M中間層に入力することにより出力される中間データとを乗算する乗算処理を実行する。
特徴マップ出力処理と乗算処理とをまとめて励起処理と呼ぶ。励起処理は、以下の式(1)により与えられる。
Figure 2020044566
カーネルwの縦横の大きさは、1より大きい任意の整数である。
また、中間層処理部132は、第(M+1)中間層の処理として、乗算処理を実行することにより出力される中間データに対してプーリング処理を実行する。プーリング処理は、以下の式(2)により与えられる。
Figure 2020044566
学習部140は、ニューラルネットワークの最適化対象パラメータを最適化する。学習部140は、学習用の画像をニューラルネットワーク処理部130に入力することにより得られた出力と、その画像に対応する正解値とを比較する目的関数(誤差関数)により、誤差を算出する。学習部140は、算出された誤差に基づいて、勾配逆伝搬法等によりパラメータについての勾配を計算し、モーメンタム法に基づいてニューラルネットワークの最適化対象パラメータを更新する。
取得部110による学習用の画像の取得と、ニューラルネットワーク処理部130による学習用画像に対するニューラルネットワークにしたがった処理と、学習部140による最適化対象パラメータの更新とを繰り返すことにより、最適化対象パラメータが最適化される。
また、学習部140は、学習を終了すべきか否かを判定する。学習を終了すべき終了条件は、例えば学習が所定回数行われたことや、外部から終了の指示を受けたことや、最適化対象パラメータの更新量の平均値が所定値に達したことや、算出された誤差が所定の範囲内に収まったことである。学習部140は、終了条件が満たされる場合、学習処理を終了させる。学習部140は、終了条件が満たされない場合、処理をニューラルネットワーク処理部130に戻す。
解釈部150は、出力層処理部133からの出力を解釈して、画像分類、物体検出または画像セグメンテーションを実施する。
実施の形態に係るデータ処理システム100の動作を説明する。
図3は、データ処理システム100による学習処理のフローチャートを示す。取得部110は、複数枚の学習用の画像を取得する(S10)。ニューラルネットワーク処理部130は、取得部110が取得した複数枚の学習用の画像のそれぞれに対して、ニューラルネットワークにしたがった処理を実行し、それぞれについての出力データを出力する(S12)。学習部140は、複数枚の学習用の画像のそれぞれについての出力データと、それぞれについての正解値とに基づいて、パラメータを更新する(S14)。学習部140は、終了条件が満たされるか否かを判定する(S16)。終了条件が満たされない場合(S16のN)、処理はS10に戻される。終了条件が満たされる場合(S16のY)、処理は終了する。
図4は、データ処理システム100による適用処理のフローチャートを示す。取得部110は、適用処理の対象の画像を取得する(S20)。ニューラルネットワーク処理部130は、取得部110が取得した画像に対して、最適化対象パラメータが最適化されたすなわち学習済みのニューラルネットワークにしたがった処理を実行し、出力データを出力する(S22)。解釈部150は、出力データを解釈し、対象の画像を画像分類したり、対象の画像から物体検出したり、対象の画像に対して画像セグメンテーションを行ったりする(S24)。
以上説明した実施の形態に係るデータ処理システム100によると、理想的な出力データの予測に有効な特徴に重きをおいて縮小できる。これにより、未知データに対する予測精度が向上する。
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、その各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
(変形例1)
実施の形態では、ニューラルネットワーク処理部130は、プーリング処理として、乗算処理を実行することにより出力される中間データに対して、平均値プーリングを適用する場合について説明したが、これには限定されず、任意のプーリング処理手法を用いてもよい。
例えばニューラルネットワーク処理部130は、プーリング処理として最大値プーリングを適用してもよい。具体的には、プーリング処理は、以下の式(3)により与えられてもよい。
Figure 2020044566
また例えばニューラルネットワーク処理部130は、プーリング処理としてグリッドプーリングを適用してもよい。具体的には、プーリング処理は、以下の式(4)により与えられてもよい。
Figure 2020044566
グリッドプーリング関数は例えば、以下の式(5)を満たす画素だけを残す処理である。
Figure 2020044566
また例えばニューラルネットワーク処理部130は、プーリング処理として総和プーリングを適用してもよい。具体的には、プーリング処理は、以下の式(6)により与えられてもよい。この場合、励起されたすべてのデータを活用できる。
Figure 2020044566
(変形例2)
励起処理には様々な変形例が考えられる。
例えば励起処理は、以下の式(7)により与えられてもよい。
Figure 2020044566
また例えば励起処理は、以下の式(8)により与えられてもよい。
Figure 2020044566
実施の形態および変形例において、データ処理システムは、プロセッサと、メモリー等のストレージを含んでもよい。ここでのプロセッサは、例えば各部の機能が個別のハードウェアで実現されてもよいし、あるいは各部の機能が一体のハードウェアで実現されてもよい。例えば、プロセッサはハードウェアを含み、そのハードウェアは、デジタル信号を処理する回路およびアナログ信号を処理する回路の少なくとも一方を含むことができる。例えば、プロセッサは、回路基板に実装された1又は複数の回路装置(例えばIC等)や、1又は複数の回路素子(例えば抵抗、キャパシター等)で構成することができる。プロセッサは、例えばCPU(Central Processing Unit)であってもよい。ただし、プロセッサはCPUに限定されるものではなく、GPU(Graphics Processing Unit)、あるいはDSP(Digital Signal Processor)等、各種のプロセッサを用いることが可能である。またプロセッサはASIC(application specific integrated circuit)又はFPGA(field-programmable gate array)によるハードウェア回路でもよい。またプロセッサは、アナログ信号を処理するアンプ回路やフィルター回路等を含んでもよい。メモリーは、SRAM、DRAMなどの半導体メモリーであってもよいし、レジスターであってもよいし、ハードディスク装置等の磁気記憶装置であってもよいし、光学ディスク装置等の光学式記憶装置であってもよい。例えば、メモリーはコンピュータにより読み取り可能な命令を格納しており、当該命令がプロセッサにより実行されることで、データ処理システムの各部の機能が実現されることになる。ここでの命令は、プログラムを構成する命令セットの命令でもよいし、プロセッサのハードウェア回路に対して動作を指示する命令であってもよい。
100 データ処理システム、 130 ニューラルネットワーク処理部、 140 学習部。
本発明は、データ処理システムおよびデータ処理方法に関する。

Claims (10)

  1. 入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行するプロセッサを備え、
    前記ニューラルネットワークは、学習データに対して前記処理を実行することにより出力される出力データと、前記学習データに対する理想的な出力データとの比較に基づいて、最適化対象パラメータが最適化されており、
    前記プロセッサは、
    第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、
    第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、
    第(M+1)中間層において、前記乗算を実行することにより出力される中間データに対して、プーリング処理を実行することを特徴とするデータ処理システム。
  2. 入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行するプロセッサと、
    前記ニューラルネットワーク処理部が学習データに対して前記処理を実行することにより出力される出力データと、前記学習データに対する理想的な出力データとの比較に基づいて、前記ニューラルネットワークの最適化対象パラメータを最適化することにより、前記ニューラルネットワークを学習させる学習部と、を備え、
    前記プロセッサは、前記学習では、
    第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、
    第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、
    第(M+1)中間層において、前記乗算を実行することにより出力される中間データに対して、プーリング処理を実行することを特徴とするデータ処理システム。
  3. 前記畳み込みカーネルは、特徴方向に直交する次元のサイズが1よりも大きいことを特徴とする請求項1または2に記載のデータ処理システム。
  4. 前記プロセッサは、特徴方向の次元が1である特徴マップを出力することを特徴とする請求項1から3のいずれかに記載のデータ処理システム。
  5. 前記プロセッサは、実数値に対して0以上1以下の実数値を出力する演算であることを特徴とする請求項1から3のいずれかに記載のデータ処理システム。
  6. 前記畳み込み演算の出力に対してシグモイド関数を適用した結果を出力することを特徴とする請求項1から4のいずれかに記載のデータ処理システム。
  7. 前記プロセッサは、前記プーリング処理として、前記乗算を実行することにより出力される中間データに対して平均プーリングを適用することを特徴とする請求項1から5のいずれかに記載のデータ処理システム。
  8. 前記プロセッサは、前記プーリング処理として、前記乗算を実行することにより出力される中間データに対して総和プーリングを適用することを特徴とする請求項1から6のいずれかに記載のデータ処理システム。
  9. 入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行するデータ処理方法であって、
    前記ニューラルネットワークは、学習データに対して前記処理を実行することにより出力される出力データと、前記学習データに対する理想的な出力データとの比較に基づいて、最適化対象パラメータが最適化されており、
    前記ニューラルネットワークにしたがった処理では、
    第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、
    第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、
    第(M+1)中間層において、前記乗算を実行することにより出力される中間データに対して、プーリング処理を実行することを特徴とするデータ処理方法。
  10. 学習データに対して、入力層、1以上の中間層および出力層を含むニューラルネットワークにしたがった処理を実行することにより、学習データに対応する出力データを出力するステップと、
    学習データに対応する出力データと、前記学習データに対する理想的な出力データとの比較に基づいて、前記ニューラルネットワークの最適化対象パラメータを最適化するステップと、を備え、
    前記最適化対象パラメータを最適化するステップでは、
    第M(Mは1以上の整数)中間層において、第M中間層への入力データを表す中間データに対して、最適化対象パラメータからなる畳み込みカーネルを用いた畳み込み演算を含む演算を適用することによって、当該中間データと平面サイズの等しい特徴マップを出力し、
    第M中間層に入力される中間データと、当該中間データを第M中間層に入力することにより出力される特徴マップの対応する座標同士を乗算し、
    第(M+1)中間層において、前記乗算を実行することにより出力される中間データに対して、プーリング処理を実行することを特徴とするデータ処理方法。
JP2020540012A 2018-08-31 2018-08-31 データ処理システムおよびデータ処理方法 Active JP7000586B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/032483 WO2020044566A1 (ja) 2018-08-31 2018-08-31 データ処理システムおよびデータ処理方法

Publications (2)

Publication Number Publication Date
JPWO2020044566A1 true JPWO2020044566A1 (ja) 2021-06-10
JP7000586B2 JP7000586B2 (ja) 2022-01-19

Family

ID=69644048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020540012A Active JP7000586B2 (ja) 2018-08-31 2018-08-31 データ処理システムおよびデータ処理方法

Country Status (4)

Country Link
US (1) US20210182678A1 (ja)
JP (1) JP7000586B2 (ja)
CN (1) CN112602097A (ja)
WO (1) WO2020044566A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358504A (ja) * 2001-05-31 2002-12-13 Canon Inc 信号処理回路及びパターン認識装置
WO2018074012A1 (ja) * 2016-10-19 2018-04-26 ソニーセミコンダクタソリューションズ株式会社 演算処理回路および認識システム
WO2018131409A1 (ja) * 2017-01-13 2018-07-19 Kddi株式会社 情報処理方法、情報処理装置及びコンピュータ可読記憶媒体
WO2018135088A1 (ja) * 2017-01-17 2018-07-26 コニカミノルタ株式会社 データ処理装置、畳み込み演算装置および畳み込みニューラルネットワーク装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108074211B (zh) * 2017-12-26 2021-03-16 浙江芯昇电子技术有限公司 一种图像处理装置及方法
CN108154145B (zh) * 2018-01-24 2020-05-19 北京地平线机器人技术研发有限公司 检测自然场景图像中的文本的位置的方法和装置
CN108229580B (zh) * 2018-01-26 2020-12-11 浙江大学 一种基于注意力机制及特征融合的眼底图中糖网特征分级装置
CN108319977B (zh) * 2018-01-30 2020-11-10 浙江大学 基于通道信息多模态网络的宫颈活检区域识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358504A (ja) * 2001-05-31 2002-12-13 Canon Inc 信号処理回路及びパターン認識装置
WO2018074012A1 (ja) * 2016-10-19 2018-04-26 ソニーセミコンダクタソリューションズ株式会社 演算処理回路および認識システム
WO2018131409A1 (ja) * 2017-01-13 2018-07-19 Kddi株式会社 情報処理方法、情報処理装置及びコンピュータ可読記憶媒体
WO2018135088A1 (ja) * 2017-01-17 2018-07-26 コニカミノルタ株式会社 データ処理装置、畳み込み演算装置および畳み込みニューラルネットワーク装置

Also Published As

Publication number Publication date
JP7000586B2 (ja) 2022-01-19
US20210182678A1 (en) 2021-06-17
WO2020044566A1 (ja) 2020-03-05
CN112602097A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
US20210004663A1 (en) Neural network device and method of quantizing parameters of neural network
CN109328362B (zh) 渐进式神经网络
US10296804B2 (en) Image recognizing apparatus, computer-readable recording medium, image recognizing method, and recognition apparatus
KR101298393B1 (ko) 그래픽 처리 유닛 상에서 콘볼루션 신경망을 트레이닝하는방법
CN113705769A (zh) 一种神经网络训练方法以及装置
JP6521440B2 (ja) ニューラルネットワーク及びそのためのコンピュータプログラム
EP3528181B1 (en) Processing method of neural network and apparatus using the processing method
WO2020061884A1 (en) Composite binary decomposition network
CN111695421A (zh) 图像识别方法、装置及电子设备
CN111105017A (zh) 神经网络量化方法、装置及电子设备
KR20210043295A (ko) 뉴럴 네트워크의 데이터를 양자화하는 방법 및 장치
JP6942203B2 (ja) データ処理システムおよびデータ処理方法
CN108229650B (zh) 卷积处理方法、装置及电子设备
US20220164639A1 (en) A system for mapping a neural network architecture onto a computing core and a method of mapping a neural network architecture onto a computing core
US20220405561A1 (en) Electronic device and controlling method of electronic device
CN113490955A (zh) 用于产生金字塔层的架构的系统和方法
JP7000586B2 (ja) データ処理システムおよびデータ処理方法
EP4083874A1 (en) Image processing device and operating method therefor
CN111788582A (zh) 电子设备及其控制方法
EP3843005A1 (en) Method and apparatus with quantized image generation
JP7055211B2 (ja) データ処理システムおよびデータ処理方法
JP6994572B2 (ja) データ処理システムおよびデータ処理方法
JP7507172B2 (ja) 情報処理方法、情報処理システム及び情報処理装置
JP6942204B2 (ja) データ処理システムおよびデータ処理方法
WO2021111831A1 (ja) 情報処理方法、情報処理システム及び情報処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211223

R151 Written notification of patent or utility model registration

Ref document number: 7000586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151