JP2020030480A5 - 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク - Google Patents

画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク Download PDF

Info

Publication number
JP2020030480A5
JP2020030480A5 JP2018154214A JP2018154214A JP2020030480A5 JP 2020030480 A5 JP2020030480 A5 JP 2020030480A5 JP 2018154214 A JP2018154214 A JP 2018154214A JP 2018154214 A JP2018154214 A JP 2018154214A JP 2020030480 A5 JP2020030480 A5 JP 2020030480A5
Authority
JP
Japan
Prior art keywords
neural network
partial
image identification
image
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018154214A
Other languages
English (en)
Other versions
JP7257756B2 (ja
JP2020030480A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2018154214A priority Critical patent/JP7257756B2/ja
Priority claimed from JP2018154214A external-priority patent/JP7257756B2/ja
Priority to US16/535,289 priority patent/US11256953B2/en
Publication of JP2020030480A publication Critical patent/JP2020030480A/ja
Publication of JP2020030480A5 publication Critical patent/JP2020030480A5/ja
Priority to US17/583,706 priority patent/US11948091B2/en
Application granted granted Critical
Publication of JP7257756B2 publication Critical patent/JP7257756B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (20)

  1. ニューラルネットワークを用いて画像データから画像の特徴量を抽出する抽出手段と、
    前記抽出手段が抽出した特徴量に基づいて前記画像の識別を行う処理手段と、を備える画像識別装置であって、
    前記ニューラルネットワークは、階層的に接続された複数の演算層を有し、
    前記ニューラルネットワークは特定の演算層より後の演算層の処理を行う複数の部分ニューラルネットワークを有し、前記複数の部分ニューラルネットワークのそれぞれには、前記特定演算層の出力のうち、それぞれが画像データの異なる部分領域に対応する互いに異なるデータが入力されることを特徴とする、画像識別装置
  2. 前記特定演算層の出力は、三次元構造を有するデータとして表現され、
    前記部分ニューラルネットワークには、前記特定演算層の出力のうち、前記三次元構造のうち少なくとも一つの次元方向に関して限定された範囲内にあるデータが入力されるように構成されていることを特徴とする、請求項1に記載の画像識別装置
  3. 記ニューラルネットワークは画像データが入力されるように構成され、
    前記部分ニューラルネットワークのそれぞれは、前記特定演算層の出力のうち、画像領域に関して限定された範囲内にあるデータが入力されるように構成されていることを特徴とする、請求項1又は2に記載の画像識別装置
  4. 前記複数の部分ニューラルネットワークのうちの第1の部分ニューラルネットワークは、前記特定演算層の出力のうち、画像の第1の領域に対応するデータが入力され、
    前記複数の部分ニューラルネットワークのうちの第2の部分ニューラルネットワークは、前記特定演算層の出力のうち、画像の第2の領域に対応するデータが入力され、
    前記第1の領域に対応するデータと前記第2の領域に対応するデータとは部分的に重複することを特徴とする、請求項3に記載の画像識別装置
  5. 前記複数の部分ニューラルネットワークは、同じ階層構造を有するが、異なる演算パラメータを有することを特徴とする、請求項1から4のいずれか1項に記載の画像識別装置
  6. 前記複数の部分ニューラルネットワークは、互いに異なる階層構造を有することを特徴とする、請求項1から4のいずれか1項に記載の画像識別装置
  7. 少なくとも1つの前記部分ニューラルネットワークは、前記特定演算層の出力のうち一部を入力として処理を行う第1部分と、前記第1部分の出力のうち互いに異なるデータを入力として処理を行う第2部分及び第3部分と、を有していることを特徴とする、請求項1から6のいずれか1項に記載の画像識別装置
  8. 前記複数の部分ニューラルネットワークは、中間層において互いに演算結果を交換することなく独立に処理が行うことができるように構成されていることを特徴とする、請求項1から7のいずれか1項に記載の画像識別装置
  9. 前記ニューラルネットワークは、前記複数の部分ニューラルネットワークからの出力を統合する統合演算層を有することを特徴とする、請求項1から8のいずれか1項に記載の画像識別装置
  10. 前記ニューラルネットワークのコストを算出する算出手段と、
    前記コストを小さくするように学習を行うことで、前記ニューラルネットワークのパラメータを決定する決定手段と、
    をさらに備えることを特徴とする、請求項1から9のいずれか1項に記載の画像識別装置。
  11. 前記算出手段は、前記複数の部分ニューラルネットワークのそれぞれの部分コストを算出し、前記部分コストに基づいて前記ニューラルネットワークの前記コストを算出することを特徴とする、請求項10に記載の画像識別装置。
  12. 前記算出手段は、前記複数の部分ニューラルネットワークのそれぞれについての重みを用いた前記部分コストの重み付け加算を用いて、前記ニューラルネットワークの前記コストを算出することを特徴とする、請求項11に記載の画像識別装置
  13. 前記部分ニューラルネットワークのそれぞれについての重み前記学習により決定されることを特徴とする、請求項12に記載の画像識別装置
  14. 前記算出手段は、前記複数の部分ニューラルネットワークからの出力の統合結果に基づいて、前記ニューラルネットワークの前記コストを算出することを特徴とする、請求項10に記載の画像識別装置。
  15. 前記複数の部分ニューラルネットワークは、それぞれ独立に結果を出力することを特徴とする、請求項1から14のいずれか1項に記載の画像識別装置。
  16. 前記複数の部分ニューラルネットワークのそれぞれは、前記特定の演算層の後において、独立したデータが入力され、独立したデータを出力することを特徴とする、請求項1から15のいずれか1項に記載の画像識別装置。
  17. 前記ニューラルネットワークは、前記特定の演算層の前に単一のニューラルネットワークを有することを特徴とする、請求項1から16のいずれか1項に記載の画像識別装置。
  18. ニューラルネットワークを用いて画像データから画像の特徴量を抽出する工程と、
    抽出された前記特徴量に基づいて前記画像を識別する工程と、
    を有する画像識別方法であって、
    前記ニューラルネットワークは、階層的に接続された複数の演算層を有し、
    前記ニューラルネットワークは特定の演算層より後の演算層の処理を行う複数の部分ニューラルネットワークを有し、前記複数の部分ニューラルネットワークのそれぞれには、前記特定の演算層の出力のうち、それぞれが画像データの異なる部分領域に対応する互いに異なるデータが入力されることを特徴とする、画像識別方法
  19. ューラルネットワークの学習を行う学習手段を備える、学習装置であって、
    前記ニューラルネットワークは、階層的に接続された複数の演算層を有し、
    記ニューラルネットワークは、特定演算層より後演算層の処理を行う複数の部分ニューラルネットワークを有し、前記複数の部分ニューラルネットワークのそれぞれには、前記特定演算層の出力のうち、それぞれが画像データの異なる部分領域に対応する互いに異なるデータが入力され
    前記学習手段は、前記複数の部分ニューラルネットワークのそれぞれからの出力に基づいて算出されるコストを小さくするように学習を行うことによって、前記ニューラルネットワークのパラメータを決定ることを特徴とする学習装置。
  20. 階層的に接続された複数の演算層を有するニューラルネットワークであって、
    前記ニューラルネットワークは特定の演算層より後の演算層の処理を行う複数の部分ニューラルネットワークを有し、前記複数の部分ニューラルネットワークのそれぞれには、前記特定の演算層の出力のうち、それぞれが画像データの異なる部分領域に対応する互いに異なるデータが入力されることを特徴とする、ニューラルネットワーク。
JP2018154214A 2018-08-20 2018-08-20 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク Active JP7257756B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018154214A JP7257756B2 (ja) 2018-08-20 2018-08-20 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク
US16/535,289 US11256953B2 (en) 2018-08-20 2019-08-08 Image identification apparatus, image identification method, training apparatus, and neural network having sub-neural networks respectively inputted with mutually different data
US17/583,706 US11948091B2 (en) 2018-08-20 2022-01-25 Image identification apparatus, image identification method, training apparatus, and neural network having sub-neural networks respectively inputted with mutually different data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018154214A JP7257756B2 (ja) 2018-08-20 2018-08-20 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク

Publications (3)

Publication Number Publication Date
JP2020030480A JP2020030480A (ja) 2020-02-27
JP2020030480A5 true JP2020030480A5 (ja) 2021-09-30
JP7257756B2 JP7257756B2 (ja) 2023-04-14

Family

ID=69522952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018154214A Active JP7257756B2 (ja) 2018-08-20 2018-08-20 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク

Country Status (2)

Country Link
US (2) US11256953B2 (ja)
JP (1) JP7257756B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10915734B2 (en) * 2018-09-28 2021-02-09 Apple Inc. Network performance by including attributes
US20210056357A1 (en) * 2019-08-19 2021-02-25 Board Of Trustees Of Michigan State University Systems and methods for implementing flexible, input-adaptive deep learning neural networks
CN111401291B (zh) * 2020-03-24 2023-07-14 盛景智能科技(嘉兴)有限公司 陌生人的识别方法和装置
JP7486349B2 (ja) * 2020-05-28 2024-05-17 キヤノン株式会社 ニューラルネットワーク、ニューラルネットワークの学習方法、プログラム、画像処理装置
CN112529883A (zh) * 2020-12-16 2021-03-19 广州佳帆计算机有限公司 一种基于图像边缘识别的贴片检测方法及装置
TWI815616B (zh) * 2022-08-17 2023-09-11 所羅門股份有限公司 物件偵測方法及裝置、電腦可讀取的記錄媒體
CN115114033B (zh) * 2022-08-30 2022-12-06 上海芯算极科技有限公司 一种基于层数分割的异构计算方法及装置
CN116310745B (zh) * 2023-05-10 2024-01-23 北京瑞莱智慧科技有限公司 图像处理方法、数据处理方法、相关装置及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03268074A (ja) * 1990-03-19 1991-11-28 Hitachi Ltd パターン認識方式および装置
JP5718973B2 (ja) 2013-05-21 2015-05-13 富士ソフト株式会社 顔認識装置、顔認識方法、およびコンピュータプログラム
EP3074918B1 (en) * 2013-11-30 2019-04-03 Beijing Sensetime Technology Development Co., Ltd. Method and system for face image recognition
US10387773B2 (en) * 2014-10-27 2019-08-20 Ebay Inc. Hierarchical deep convolutional neural network for image classification
US10062412B2 (en) * 2015-06-05 2018-08-28 Apple Inc. Hierarchical segmentation and quality measurement for video editing
US9552520B1 (en) * 2015-07-07 2017-01-24 Disney Enterprises, Inc. Systems and methods for automatic key frame extraction and storyboard interface generation for video
JP2017102671A (ja) * 2015-12-01 2017-06-08 キヤノン株式会社 識別装置、調整装置、情報処理方法及びプログラム
CN105677735B (zh) * 2015-12-30 2020-04-21 腾讯科技(深圳)有限公司 一种视频搜索方法及装置
WO2017166019A1 (en) * 2016-03-28 2017-10-05 Xiaogang Wang Method and system for pose estimation
CN108229363A (zh) * 2017-12-27 2018-06-29 北京市商汤科技开发有限公司 关键帧调度方法和装置、电子设备、程序和介质
US11577388B2 (en) * 2019-06-27 2023-02-14 Intel Corporation Automatic robot perception programming by imitation learning

Similar Documents

Publication Publication Date Title
JP2020030480A5 (ja) 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク
CN109670474B (zh) 一种基于视频的人体姿态估计方法、装置及设备
KR102696652B1 (ko) 스테레오 매칭 방법 및 영상 처리 장치
JP6306683B2 (ja) 動的カテゴリ物体認識のコンピュータベースの方法コンピュータベースの方法及びシステム
CN106960195A (zh) 一种基于深度学习的人群计数方法及装置
CN112446870B (zh) 管道损伤检测方法、装置、设备及存储介质
CN106778705B (zh) 一种行人个体分割方法及装置
KR102483641B1 (ko) 양안 시차 영상의 처리 방법 및 장치
WO2015176305A1 (zh) 人形图像分割方法
CN107784322B (zh) 异常数据检测方法、装置、存储介质以及程序产品
IL299819B2 (en) Learnable defect detection for semiconductor applications
CN113628261B (zh) 一种电力巡检场景下的红外与可见光图像配准方法
WO2021097442A1 (en) Guided training of machine learning models with convolution layer feature data fusion
CN110619316A (zh) 人体关键点检测方法、装置和电子设备
JP7150468B2 (ja) 構造物劣化検出システム
CN109325386B (zh) 车道线检测方法、设备和计算机可读存储介质
JP2018128996A5 (ja)
JP2014137756A5 (ja)
JP6876094B2 (ja) 画像内の極値点のサブピクセル位置を推定する方法、デバイス、およびシステム
JP7164028B2 (ja) 学習システム、データ生成装置、データ生成方法、及びデータ生成プログラム
CN114596266B (zh) 一种基于ConcreteCrackSegNet模型的混凝土裂缝检测方法
CN114266894A (zh) 一种图像分割方法、装置、电子设备及存储介质
CN106875345A (zh) 基于奇异值权重函数的非局部tv模型图像去噪方法
JPWO2020246366A5 (ja)
CN112348116A (zh) 利用空间上下文的目标检测方法、装置和计算机设备