JP2019220014A - 画像解析装置、画像解析方法及びプログラム - Google Patents
画像解析装置、画像解析方法及びプログラム Download PDFInfo
- Publication number
- JP2019220014A JP2019220014A JP2018118089A JP2018118089A JP2019220014A JP 2019220014 A JP2019220014 A JP 2019220014A JP 2018118089 A JP2018118089 A JP 2018118089A JP 2018118089 A JP2018118089 A JP 2018118089A JP 2019220014 A JP2019220014 A JP 2019220014A
- Authority
- JP
- Japan
- Prior art keywords
- generalized
- image
- known object
- unit
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/759—Region-based matching
Abstract
Description
図1は実施形態の画像解析装置100の機能構成の例を示す図である。実施形態の画像解析装置100は、受付部10、算出部11、既知物体認識部12、汎化物体認識部13及び出力制御部14を備える。
図13は実施形態の画像解析装置のハードウェア構成の例を示す図である。実施形態の画像解析装置は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して接続されている。
11 算出部
12 既知物体認識部
13 汎化物体認識部
14 出力制御部
20 統合部
21 判定部
100 画像解析装置
301 制御装置
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
310 バス
Claims (9)
- 画像の入力を受け付ける受付部と、
前記画像に含まれる領域の特徴を示す特徴量情報を算出する算出部と、
画像認識処理の学習データに登録された既知物体を、前記特徴量情報に基づいて認識する既知物体認識部と、
前記特徴量情報に基づいて、前記既知物体から汎化可能な汎化物体を認識する汎化物体認識部と、
前記画像に含まれる物体が、前記既知物体又は前記汎化物体として特定された出力情報を出力する出力制御部と、
を備える画像解析装置。 - 前記出力制御部は、
前記既知物体認識部により認識された既知物体を含む既知物体データと、前記汎化物体認識部により認識された汎化物体を含む汎化物体データとを、統合データに統合する統合部と、
前記統合データに含まれる前記既知物体の位置と、前記汎化物体の位置とが一致する場合、前記既知物体であると判定し、前記統合データに含まれる前記既知物体の位置と、前記汎化物体の位置とが一致しない場合、前記汎化物体であると判定する判定部と、
を備える請求項1に記載の画像解析装置。 - 前記統合部は、前記既知物体データと、前記汎化物体データとを、ROI(Region Of Interest)ごとに、前記統合データ上で統合し、
前記判定部は、前記既知物体の位置と、前記汎化物体の位置とが一致するか否かを、前記ROIごとに判定する、
請求項2に記載の画像解析装置。 - 前記汎化物体認識部は、前記学習データに登録された既知物体を組み合わせることにより汎化可能な前記汎化物体を、1つの物体カテゴリとして認識する学習モデルを使用して、前記汎化物体を認識する、
請求項1に記載の画像解析装置。 - 前記出力制御部は、前記既知物体又は前記汎化物体を、既知物体又は汎化物体を囲む矩形により特定する、
請求項1に記載の画像解析装置。 - 前記出力制御部は、前記既知物体又は前記汎化物体を、既知物体又は汎化物体を示す領域の領域マスクにより特定する、
請求項1に記載の画像解析装置。 - 前記出力情報は、前記既知物体の数、前記汎化物体の数、前記既知物体の位置、前記汎化物体の位置、前記既知物体を囲む矩形、前記汎化物体を囲む矩形、前記既知物体を示す領域の領域マスク、及び、前記汎化物体を示す領域の領域マスクのうち、少なくとも1つを含む、
請求項1に記載の画像解析装置。 - 画像の入力を受け付けるステップと、
前記画像に含まれる領域の特徴を示す特徴量情報を算出するステップと、
画像認識処理の学習データに登録された既知物体を、前記特徴量情報に基づいて認識するステップと、
前記特徴量情報に基づいて、前記既知物体から汎化可能な汎化物体を認識するステップと、
前記画像に含まれる物体が、前記既知物体又は前記汎化物体として特定された出力情報を出力するステップと、
を含む画像解析方法。 - コンピュータを、
画像の入力を受け付ける受付部と、
前記画像に含まれる領域の特徴を示す特徴量情報を算出する算出部と、
画像認識処理の学習データに登録された既知物体を、前記特徴量情報に基づいて認識する既知物体認識部と、
前記特徴量情報に基づいて、前記既知物体から汎化可能な汎化物体を認識する汎化物体認識部と、
前記画像に含まれる物体が、前記既知物体又は前記汎化物体として特定された出力情報を出力する出力制御部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018118089A JP6989450B2 (ja) | 2018-06-21 | 2018-06-21 | 画像解析装置、画像解析方法及びプログラム |
US16/286,407 US11417129B2 (en) | 2018-06-21 | 2019-02-26 | Object identification image device, method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018118089A JP6989450B2 (ja) | 2018-06-21 | 2018-06-21 | 画像解析装置、画像解析方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019220014A true JP2019220014A (ja) | 2019-12-26 |
JP6989450B2 JP6989450B2 (ja) | 2022-01-05 |
Family
ID=68981921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018118089A Active JP6989450B2 (ja) | 2018-06-21 | 2018-06-21 | 画像解析装置、画像解析方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11417129B2 (ja) |
JP (1) | JP6989450B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11423647B2 (en) * | 2018-05-07 | 2022-08-23 | Nec Corporation | Identification system, model re-learning method and program |
JP7118934B2 (ja) * | 2019-09-04 | 2022-08-16 | 株式会社東芝 | 物体数推定装置、物体数推定方法、および物体数推定プログラム |
US11295430B2 (en) | 2020-05-20 | 2022-04-05 | Bank Of America Corporation | Image analysis architecture employing logical operations |
US11379697B2 (en) | 2020-05-20 | 2022-07-05 | Bank Of America Corporation | Field programmable gate array architecture for image analysis |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010262601A (ja) * | 2009-05-11 | 2010-11-18 | Canon Inc | パターン認識システム及びパターン認識方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140321756A9 (en) * | 2008-05-27 | 2014-10-30 | Samsung Electronics Co., Ltd. | System and method for circling detection based on object trajectory |
US9355337B2 (en) * | 2009-08-25 | 2016-05-31 | Xerox Corporation | Consistent hierarchical labeling of image and image regions |
WO2011126134A1 (ja) * | 2010-04-09 | 2011-10-13 | サイバーアイ・エンタテインメント株式会社 | リアルタイム動画像収集・認識・分類・処理・配信サーバシステム |
JP5830784B2 (ja) * | 2011-06-23 | 2015-12-09 | サイバーアイ・エンタテインメント株式会社 | 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム |
JP5866728B2 (ja) * | 2011-10-14 | 2016-02-17 | サイバーアイ・エンタテインメント株式会社 | 画像認識システムを備えた知識情報処理サーバシステム |
US9158971B2 (en) * | 2014-03-03 | 2015-10-13 | Xerox Corporation | Self-learning object detectors for unlabeled videos using multi-task learning |
JP6708385B2 (ja) * | 2015-09-25 | 2020-06-10 | キヤノン株式会社 | 識別器作成装置、識別器作成方法、およびプログラム |
US10867216B2 (en) * | 2016-03-15 | 2020-12-15 | Canon Kabushiki Kaisha | Devices, systems, and methods for detecting unknown objects |
US20170330059A1 (en) * | 2016-05-11 | 2017-11-16 | Xerox Corporation | Joint object and object part detection using web supervision |
JP6833620B2 (ja) | 2017-05-30 | 2021-02-24 | 株式会社東芝 | 画像解析装置、ニューラルネットワーク装置、学習装置、画像解析方法およびプログラム |
US10546197B2 (en) * | 2017-09-26 | 2020-01-28 | Ambient AI, Inc. | Systems and methods for intelligent and interpretive analysis of video image data using machine learning |
-
2018
- 2018-06-21 JP JP2018118089A patent/JP6989450B2/ja active Active
-
2019
- 2019-02-26 US US16/286,407 patent/US11417129B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010262601A (ja) * | 2009-05-11 | 2010-11-18 | Canon Inc | パターン認識システム及びパターン認識方法 |
Non-Patent Citations (1)
Title |
---|
秋山 瑞樹, 柳井 啓司: "Web上の大量画像を用いた特定物体認識手法による一般物体認識", 情報処理学会研究報告 コンピュータビジョンとイメージメディア(CVIM), vol. Vol.2010-CVIM-172, No.11, JPN6021031152, 15 June 2010 (2010-06-15), pages 1 - 8, ISSN: 0004571093 * |
Also Published As
Publication number | Publication date |
---|---|
US20190392270A1 (en) | 2019-12-26 |
JP6989450B2 (ja) | 2022-01-05 |
US11417129B2 (en) | 2022-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11854283B2 (en) | Method and apparatus for visual question answering, computer device and medium | |
JP6831480B2 (ja) | テキスト検出分析方法、装置及びデバイス | |
CN107545262B (zh) | 一种在自然场景图像中检测文本的方法及装置 | |
CN110348294B (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
Gollapudi | Learn computer vision using OpenCV | |
Kavasidis et al. | A saliency-based convolutional neural network for table and chart detection in digitized documents | |
US9367766B2 (en) | Text line detection in images | |
KR101896357B1 (ko) | 객체를 검출하는 방법, 디바이스 및 프로그램 | |
JP6989450B2 (ja) | 画像解析装置、画像解析方法及びプログラム | |
US10410354B1 (en) | Method and apparatus for multi-model primitive fitting based on deep geometric boundary and instance aware segmentation | |
CN111488826A (zh) | 一种文本识别方法、装置、电子设备和存储介质 | |
US20190019052A1 (en) | Text Region Detection in Digital Images using Image Tag Filtering | |
CN109685065B (zh) | 试卷内容自动分类的版面分析方法、系统 | |
US20210319340A1 (en) | Machine learning model confidence score validation | |
CN111931859B (zh) | 一种多标签图像识别方法和装置 | |
JP6937508B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
US11600088B2 (en) | Utilizing machine learning and image filtering techniques to detect and analyze handwritten text | |
Rehman et al. | Efficient coarser‐to‐fine holistic traffic sign detection for occlusion handling | |
CN110580499A (zh) | 基于众包重复标签的深度学习目标检测方法及系统 | |
CN110598703B (zh) | 一种基于深度神经网络的ocr识别方法及装置 | |
US11410278B2 (en) | Automatic artifact removal in a digital image | |
KR102026280B1 (ko) | 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템 | |
JP2017084006A (ja) | 画像処理装置およびその方法 | |
CN113807407B (zh) | 目标检测模型训练方法、模型性能检测方法及装置 | |
CN115004245A (zh) | 目标检测方法、装置、电子设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211202 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6989450 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |