JP2018205800A - 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム - Google Patents
画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム Download PDFInfo
- Publication number
- JP2018205800A JP2018205800A JP2017106492A JP2017106492A JP2018205800A JP 2018205800 A JP2018205800 A JP 2018205800A JP 2017106492 A JP2017106492 A JP 2017106492A JP 2017106492 A JP2017106492 A JP 2017106492A JP 2018205800 A JP2018205800 A JP 2018205800A
- Authority
- JP
- Japan
- Prior art keywords
- score
- context
- shape
- region
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010191 image analysis Methods 0.000 title claims abstract description 30
- 238000013528 artificial neural network Methods 0.000 title claims description 26
- 238000003703 image analysis method Methods 0.000 title claims description 3
- 238000004364 calculation method Methods 0.000 claims abstract description 107
- 238000012937 correction Methods 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims description 41
- 238000012549 training Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 23
- 230000010365 information processing Effects 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Image Analysis (AREA)
Abstract
Description
Jn=f(In,Sn) …(1)
12 画像取得部
14 特徴量算出部
16 コンテキスト算出部
18 候補領域取得部
20 形状算出部
22 抽出部
24 補正部
26 出力部
32 コンテキストスコア抽出部
34 形状スコア取得部
36 対応付け部
50 ニューラルネットワーク装置
62 画像取得層
64 特徴量算出層
66 コンテキスト算出層
68 候補領域取得層
70 形状算出層
72 抽出層
74 補正層
76 出力層
100 学習装置
112 訓練データ取得部
114 制御部
116 誤差算出部
118 調整部
Claims (14)
- 対象画像の特徴量マップを算出する特徴量算出部と、
前記特徴量マップに基づき、前記対象画像における画素毎のコンテキストを表すコンテキストスコアを算出するコンテキスト算出部と、
前記特徴量マップに基づき、前記対象画像に含まれる少なくとも1つの領域における、対象物の形状を表す形状スコアを算出する形状算出部と、
前記少なくとも1つの領域における前記形状スコアを、対応する領域における前記コンテキストスコアにより補正する補正部と、
前記少なくとも1つの領域における、補正した前記形状スコアを出力する出力部と、
を備える画像解析装置。 - 前記出力部は、前記対象画像における前記コンテキストスコアをさらに出力する
請求項1に記載の画像解析装置。 - 前記特徴量マップに基づき、前記対象画像に含まれる前記少なくとも1つの領域を特定する領域情報を生成する候補領域取得部をさらに備える
請求項1または2に記載の画像解析装置。 - 前記対象画像に含まれる前記少なくとも1つの領域を特定する領域情報を外部装置から取得する候補領域取得部をさらに備える
請求項1または2に記載の画像解析装置。 - 前記対象画像に対する前記コンテキストスコアおよび前記領域情報に基づき、前記少なくとも1つの領域における前記コンテキストスコアを抽出する抽出部をさらに備える
請求項3または4に記載の画像解析装置。 - 前記抽出部は、
前記領域情報に基づき、前記対象画像における前記コンテキストスコアから、前記少なくとも1つの領域における前記コンテキストスコアを抽出するコンテキストスコア抽出部と、
前記少なくとも1つの領域における前記形状スコアを取得する形状スコア取得部と、
前記少なくとも1つの領域について、前記コンテキストスコアと前記形状スコアとを対応付けて出力する対応付け部と、
を有する請求項5に記載の画像解析装置。 - 前記コンテキストスコアは、画素毎の対象物のカテゴリを表す情報である
請求項1から6の何れか1項に記載の画像解析装置。 - 前記コンテキストスコアは、画素毎の基準位置から対象物までの距離を表す情報である
請求項1から6の何れか1項に記載の画像解析装置。 - 前記形状スコアは、画素毎に対象物が存在するか否かを示すマスク情報である
請求項1から8の何れか1項に記載の画像解析装置。 - 前記補正部は、画素毎に前記形状スコアと前記コンテキストスコアとを乗じた値に基づき、補正した前記形状スコアを算出する
請求項1から9の何れか1項に記載の画像解析装置。 - 対象画像の特徴量マップを出力する特徴量算出層と、
前記特徴量マップを受け取って、前記対象画像における画素毎のコンテキストを表すコンテキストスコアを出力するコンテキスト算出層と、
前記特徴量マップを受け取って、少なくとも1つの領域における、対象物の形状を表す形状スコアを出力する形状算出層と、
前記対象画像における前記コンテキストスコアを受け取って、前記少なくとも1つの領域における前記コンテキストスコアを出力する抽出層と、
前記少なくとも1つの領域における前記形状スコア、および、前記少なくとも1つの領域における前記コンテキストスコアを受け取って、前記少なくとも1つの領域における、補正した前記形状スコアを出力する補正層と、
前記少なくとも1つの領域における補正した前記形状スコアと、前記対象画像における前記コンテキストスコアとを出力する出力層と、
を備えるニューラルネットワーク装置。 - 請求項11に記載のニューラルネットワーク装置を訓練する学習装置であって、
訓練用画像データと、訓練用コンテキストスコアと、前記少なくとも1つの領域についての訓練用形状スコアとの組を取得する訓練データ取得部と、
前記訓練用画像データを前記ニューラルネットワーク装置に与えて、前記コンテキストスコアおよび前記少なくとも1つの領域についての前記形状スコアを前記ニューラルネットワーク装置に算出させる制御部と、
前記コンテキストスコアと前記訓練用コンテキストスコアとの第1誤差と、前記少なくとも1つの領域の前記形状スコアと前記訓練用形状スコアとの第2誤差とを算出する誤差算出部と、
前記第1誤差および少なくとも1つの領域についての第2誤差に基づき、前記ニューラルネットワーク装置のパラメータを調整する調整部と、
を備える学習装置。 - 対象画像の特徴量マップを算出する特徴量算出ステップと、
前記特徴量マップに基づき、前記対象画像における画素毎のコンテキストを表すコンテキストスコアを算出するコンテキスト算出ステップと、
前記特徴量マップに基づき、前記対象画像に含まれる少なくとも1つの領域における、対象物の形状を表す形状スコアを算出する形状算出ステップと、
前記少なくとも1つの領域における前記形状スコアを、対応する領域における前記コンテキストスコアにより補正する補正ステップと、
前記少なくとも1つの領域における、補正した前記形状スコアを出力する出力ステップと、
を含む画像解析方法。 - 情報処理装置を画像解析装置として機能させるためのプログラムであって、
前記情報処理装置を、
対象画像の特徴量マップを算出する特徴量算出部と、
前記特徴量マップに基づき、前記対象画像における画素毎のコンテキストを表すコンテキストスコアを算出するコンテキスト算出部と、
前記特徴量マップに基づき、前記対象画像に含まれる少なくとも1つの領域における、対象物の形状を表す形状スコアを算出する形状算出部と、
前記少なくとも1つの領域における前記形状スコアを、対応する領域における前記コンテキストスコアにより補正する補正部と、
前記少なくとも1つの領域における、補正した前記形状スコアを出力する出力部と、
して機能させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017106492A JP6833620B2 (ja) | 2017-05-30 | 2017-05-30 | 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム |
EP18161166.6A EP3410344B1 (en) | 2017-05-30 | 2018-03-12 | Image analysis device, image analysis method, and computer-readable medium |
US15/917,881 US10789515B2 (en) | 2017-05-30 | 2018-03-12 | Image analysis device, neural network device, learning device and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017106492A JP6833620B2 (ja) | 2017-05-30 | 2017-05-30 | 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018205800A true JP2018205800A (ja) | 2018-12-27 |
JP6833620B2 JP6833620B2 (ja) | 2021-02-24 |
Family
ID=61622454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017106492A Active JP6833620B2 (ja) | 2017-05-30 | 2017-05-30 | 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10789515B2 (ja) |
EP (1) | EP3410344B1 (ja) |
JP (1) | JP6833620B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200101521A (ko) * | 2019-01-31 | 2020-08-28 | 연세대학교 산학협력단 | 시멘틱 매칭 장치 및 방법 |
JP2021045077A (ja) * | 2019-09-18 | 2021-03-25 | 株式会社ニコン | 処理装置、処理方法、処理プログラム、観察装置、培養装置、培養システム、及び情報処理システム |
KR102289668B1 (ko) * | 2020-02-21 | 2021-08-12 | 연세대학교 산학협력단 | 매칭 신뢰도 기반 시멘틱 매칭 장치 및 방법 |
US11417129B2 (en) | 2018-06-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Object identification image device, method, and computer program product |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348543B (zh) * | 2019-06-10 | 2023-01-06 | 腾讯医疗健康(深圳)有限公司 | 眼底图像识别方法、装置、计算机设备及存储介质 |
CN110837811B (zh) * | 2019-11-12 | 2021-01-05 | 腾讯科技(深圳)有限公司 | 语义分割网络结构的生成方法、装置、设备及存储介质 |
CN112001391A (zh) * | 2020-05-11 | 2020-11-27 | 江苏鲲博智行科技有限公司 | 一种图像特征融合图像语义分割的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043151A (ja) * | 2010-08-18 | 2012-03-01 | Canon Inc | 画像処理装置及びその方法、プログラム、並びに撮像装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8718362B2 (en) | 2012-03-28 | 2014-05-06 | Mitsubishi Electric Research Laboratories, Inc. | Appearance and context based object classification in images |
WO2016197303A1 (en) * | 2015-06-08 | 2016-12-15 | Microsoft Technology Licensing, Llc. | Image semantic segmentation |
US10657364B2 (en) * | 2016-09-23 | 2020-05-19 | Samsung Electronics Co., Ltd | System and method for deep network fusion for fast and robust object detection |
US10635927B2 (en) * | 2017-03-06 | 2020-04-28 | Honda Motor Co., Ltd. | Systems for performing semantic segmentation and methods thereof |
-
2017
- 2017-05-30 JP JP2017106492A patent/JP6833620B2/ja active Active
-
2018
- 2018-03-12 EP EP18161166.6A patent/EP3410344B1/en active Active
- 2018-03-12 US US15/917,881 patent/US10789515B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043151A (ja) * | 2010-08-18 | 2012-03-01 | Canon Inc | 画像処理装置及びその方法、プログラム、並びに撮像装置 |
Non-Patent Citations (1)
Title |
---|
KEZE WANG ET AL.: "Dictionary Pair Classifier Driven Convolutional Neural Networks for Object Detection", 2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, JPN6020036797, 2016, pages 2138 - 2146, XP033021393, ISSN: 0004356462, DOI: 10.1109/CVPR.2016.235 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11417129B2 (en) | 2018-06-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Object identification image device, method, and computer program product |
KR20200101521A (ko) * | 2019-01-31 | 2020-08-28 | 연세대학교 산학협력단 | 시멘틱 매칭 장치 및 방법 |
KR102166117B1 (ko) * | 2019-01-31 | 2020-10-15 | 연세대학교 산학협력단 | 시멘틱 매칭 장치 및 방법 |
JP2021045077A (ja) * | 2019-09-18 | 2021-03-25 | 株式会社ニコン | 処理装置、処理方法、処理プログラム、観察装置、培養装置、培養システム、及び情報処理システム |
KR102289668B1 (ko) * | 2020-02-21 | 2021-08-12 | 연세대학교 산학협력단 | 매칭 신뢰도 기반 시멘틱 매칭 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20180349748A1 (en) | 2018-12-06 |
US10789515B2 (en) | 2020-09-29 |
EP3410344A1 (en) | 2018-12-05 |
JP6833620B2 (ja) | 2021-02-24 |
EP3410344B1 (en) | 2023-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6833620B2 (ja) | 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム | |
JP6581068B2 (ja) | 画像処理装置、画像処理方法、プログラム、運転制御システム、および、車両 | |
WO2018121567A1 (zh) | 用于检测物体关键点的方法、装置及电子设备 | |
US20150279021A1 (en) | Video object tracking in traffic monitoring | |
US10614347B2 (en) | Identifying parameter image adjustments using image variation and sequential processing | |
CN103116739A (zh) | 用于散焦测距成像的系统和方法 | |
US20220101628A1 (en) | Object detection and recognition device, method, and program | |
US11301723B2 (en) | Data generation device, data generation method, and computer program product | |
US11640530B2 (en) | Learning device, learning method, computer program product, and recognition device | |
JP2018133110A (ja) | 画像処理装置及び画像処理プログラム | |
US20220189151A1 (en) | Processing system, estimation apparatus, processing method, and non-transitory storage medium | |
US20200396415A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
JP7395705B2 (ja) | 推定装置、推定方法及びプログラム | |
JP2021051347A (ja) | 距離画像生成装置及び距離画像生成方法 | |
JP2020204880A (ja) | 学習方法、プログラム及び画像処理装置 | |
CN115798005A (zh) | 基准照片的处理方法及装置、处理器和电子设备 | |
CN113255700B (zh) | 图像的特征图的处理方法及装置、存储介质、终端 | |
EP4156087A1 (en) | Authentication method, authentication program, and authentication device | |
US11200676B2 (en) | Shift invariant loss for deep learning based image segmentation | |
WO2023188160A1 (ja) | 入力支援装置、入力支援方法、及び非一時的なコンピュータ可読媒体 | |
US20230351729A1 (en) | Learning system, authentication system, learning method, computer program, learning model generation apparatus, and estimation apparatus | |
JP2019200527A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20240087299A1 (en) | Image processing apparatus, image processing method, and image processing computer program product | |
CN117576109B (zh) | 一种缺陷检测方法、装置、设备及存储介质 | |
JP7391907B2 (ja) | 異常検出装置、異常検出方法、および異常検出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210203 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6833620 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |