JP7133585B2 - オブジェクト認識装置およびオブジェクト認識方法 - Google Patents
オブジェクト認識装置およびオブジェクト認識方法 Download PDFInfo
- Publication number
- JP7133585B2 JP7133585B2 JP2020086385A JP2020086385A JP7133585B2 JP 7133585 B2 JP7133585 B2 JP 7133585B2 JP 2020086385 A JP2020086385 A JP 2020086385A JP 2020086385 A JP2020086385 A JP 2020086385A JP 7133585 B2 JP7133585 B2 JP 7133585B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature map
- image
- extraction operation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000000605 extraction Methods 0.000 claims description 58
- 238000001514 detection method Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 2
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000008921 facial expression Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
110 ・・・特徴抽出部
120 ・・・バックボーンネットワーク部
121 ・・・逆残差モジュール
130 ・・・アップサンプリング部
131 ・・・アップサンプリングモジュール
140 ・・・分類部
150 ・・・位置検知部
Claims (9)
- 対象イメージが入力されれば、特徴抽出演算を実行して特徴イメージを生成する特徴抽出部、および
前記特徴イメージに特徴マップ抽出演算を繰り返し実行し、前記特徴マップ抽出演算を適用した回数に応じて各々異なる解像度を有する複数の第1特徴マップを生成するバックボーンネットワーク部を含み、
前記バックボーンネットワーク部は、
前記バックボーンネットワーク部は、
複数の逆残差モジュールを含み、前記特徴イメージを前記複数の逆残差モジュールに順次適用して前記特徴マップ抽出演算を実行し、複数の逆残差モジュールのうち、最後に演算される逆残差モジュールのストライドを2に設定し、残りの逆残差モジュールのストライドは1に設定することを特徴とする、オブジェクト認識装置。
- 前記逆残差モジュールは、
深さ基盤の分離コンボリューション演算を含み、活性関数としてPReLU(Parametric Rectified Linear Unit)またはLeaky-ReLUを用いることを特徴とする、請求項1に記載のオブジェクト認識装置。 - 対象イメージが入力されれば、特徴抽出演算を実行して特徴イメージを生成する特徴抽出部、および
前記特徴イメージに特徴マップ抽出演算を繰り返し実行し、前記特徴マップ抽出演算を適用した回数に応じて各々異なる解像度を有する複数の第1特徴マップを生成するバックボーンネットワーク部を含み、
前記バックボーンネットワーク部は、
複数の逆残差モジュールを含み、前記特徴イメージを前記複数の逆残差モジュールに順次適用して前記特徴マップ抽出演算を実行し、複数の逆残差モジュールのうち、最後に演算される逆残差モジュールのストライドを2に設定し、残りの逆残差モジュールのストライドは1に設定することを特徴とするオブジェクト認識装置。 - 前記複数の第1特徴マップ内を移動する各々の境界ボックスを用いて、前記境界ボックス内のオブジェクトの包含有無を判別する分類部、および
前記オブジェクトが含まれた場合には、前記第1特徴マップ内の境界ボックスを前記対象イメージ内の位置に回帰させて前記オブジェクトの位置情報を抽出する位置検知部をさらに含むことを特徴とする、請求項1に記載のオブジェクト認識装置。 - 前記特徴抽出部、バックボーンネットワーク部、前記分類部および位置検知部は、マルチタスク損失関数を用いて同時に学習されることを特徴とする、請求項4に記載のオブジェクト認識装置。
- 直前に生成した第2特徴マップをアップサンプリングし、前記アップサンプリングした結果と同一な解像度を有する第1特徴マップをスキップ接続技法により連結して第2特徴マップを生成するアップサンプリング部をさらに含み、
前記アップサンプリング部は、
複数の第1特徴マップのうち解像度が最も低い第1特徴マップを最初の第2特徴マップに設定することを特徴とする、請求項1に記載のオブジェクト認識装置。 - 入力された対象イメージに特徴抽出演算を実行して特徴イメージを生成するステップ、
前記特徴イメージに特徴マップ抽出演算を繰り返し実行し、前記特徴マップ抽出演算を適用した回数に応じて各々異なる解像度を有する複数の第1特徴マップを生成するステップ、および
前記複数の第1特徴マップ内を移動する各々の境界ボックスを用いて、前記境界ボックス内のオブジェクトの包含有無を判別し、前記オブジェクトが含まれた場合には前記第1特徴マップ内の境界ボックスを前記対象イメージ内の位置に回帰させて前記オブジェクトの位置情報を抽出するステップを含み、
前記複数の第1特徴マップを生成するステップは、
前記特徴イメージを複数の逆残差モジュールに順次適用して前記特徴マップ抽出演算を実行し、複数の逆残差モジュールのうち、最後に演算される逆残差モジュールのストライドを2に設定し、残りの逆残差モジュールのストライドは1に設定することを特徴とする、オブジェクト認識方法。 - 入力された対象イメージに特徴抽出演算を実行して特徴イメージを生成するステップ、
前記特徴イメージに特徴マップ抽出演算を繰り返し実行し、前記特徴マップ抽出演算を適用した回数に応じて各々異なる解像度を有する複数の第1特徴マップを生成するステップ、
複数の第1特徴マップのうち解像度が最も低い第1特徴マップを最初の第2特徴マップに設定するステップ、
直前に生成した第2特徴マップをアップサンプリングし、前記アップサンプリングした結果と同一な解像度を有する第1特徴マップをスキップ接続技法により連結して第2特徴マップを生成するステップ、および
前記複数の第2特徴マップ内を移動する各々の境界ボックスを用いて、前記境界ボックス内のオブジェクトの包含有無を判別し、前記オブジェクトが含まれた場合には前記第2特徴マップ内の境界ボックスを前記対象イメージ内の位置に回帰させて前記オブジェクトの位置情報を抽出するステップを含み、
複数の第1特徴マップを生成する前記ステップは、
前記特徴イメージを複数の逆残差モジュールに順次適用して前記特徴マップ抽出演算を実行し、複数の逆残差モジュールのうち、最後に演算される逆残差モジュールのストライドを2に設定し、残りの逆残差モジュールのストライドは1に設定することを特徴とする、オブジェクト認識方法。 - コンピュータに請求項7~8のいずれか一項に記載のオブジェクト認識方法を実行させるためのコンピュータプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2019-0070269 | 2019-06-13 | ||
KR20190070269 | 2019-06-13 | ||
KR10-2019-0117656 | 2019-09-24 | ||
KR1020190117656A KR102261894B1 (ko) | 2019-06-13 | 2019-09-24 | 객체인식장치 및 객체인식방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020201944A JP2020201944A (ja) | 2020-12-17 |
JP7133585B2 true JP7133585B2 (ja) | 2022-09-08 |
Family
ID=73744308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020086385A Active JP7133585B2 (ja) | 2019-06-13 | 2020-05-18 | オブジェクト認識装置およびオブジェクト認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7133585B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926552B (zh) * | 2021-04-23 | 2022-08-12 | 河南大学 | 基于深度神经网络的遥感影像车辆目标识别模型及方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019008383A (ja) | 2017-06-21 | 2019-01-17 | キヤノン株式会社 | 画像処理装置、撮像装置、画像処理方法、プログラム、および、記憶媒体 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6787196B2 (ja) * | 2017-03-09 | 2020-11-18 | コニカミノルタ株式会社 | 画像認識装置及び画像認識方法 |
-
2020
- 2020-05-18 JP JP2020086385A patent/JP7133585B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019008383A (ja) | 2017-06-21 | 2019-01-17 | キヤノン株式会社 | 画像処理装置、撮像装置、画像処理方法、プログラム、および、記憶媒体 |
Non-Patent Citations (3)
Title |
---|
Mark Sandler, et al.,MobileNetV2: Inverted Residuals and Linear Bottlenecks,2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition,2018年,https://ieeexplore.ieee.org/document/8578572 |
Tsung-Yi Lin, et al.,Feature Pyramid Networks for Object Detection,2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2017年,https://ieeexplore.ieee.org/document/8099589 |
Xu Tang, et al.,Feature Fusion for Weakly Supervised Object Localization,2018 Chinese Automation Congress (CAC),IEEE,2018年,https://ieeexplore.ieee.org/document/8623227 |
Also Published As
Publication number | Publication date |
---|---|
JP2020201944A (ja) | 2020-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102261894B1 (ko) | 객체인식장치 및 객체인식방법 | |
Yang et al. | Deeperlab: Single-shot image parser | |
Lim et al. | Learning multi-scale features for foreground segmentation | |
US11023767B2 (en) | Systems and methods for text localization and recognition in an image of a document | |
JP6557783B2 (ja) | オブジェクト検出のためのスケール依存プーリングによるカスケード型ニューラルネットワーク | |
JP4933186B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
EP3602397A1 (en) | Neural network systems for action recognition in videos | |
CN107909026B (zh) | 基于小规模卷积神经网络年龄和/或性别评估方法及系统 | |
GB2580671A (en) | A computer vision system and method | |
WO2018176186A1 (en) | Semantic image segmentation using gated dense pyramid blocks | |
US11853892B2 (en) | Learning to segment via cut-and-paste | |
CN101206719A (zh) | 用于检测和处理图像中特定图案的方法和设备 | |
US11385526B2 (en) | Method of processing image based on artificial intelligence and image processing device performing the same | |
CN111428664B (zh) | 一种基于深度学习技术的计算机视觉的实时多人姿态估计方法 | |
CN112529904A (zh) | 图像语义分割方法、装置、计算机可读存储介质和芯片 | |
JP2017004350A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
KR20200119384A (ko) | 차량 번호판을 실시간으로 인식하는 장치 및 방법 | |
Ramkumar et al. | An effectual facial expression recognition using HMM | |
JP7133585B2 (ja) | オブジェクト認識装置およびオブジェクト認識方法 | |
Luo et al. | A lightweight face detector by integrating the convolutional neural network with the image pyramid | |
Singh et al. | Scale normalized image pyramids with autofocus for object detection | |
Ahmadi et al. | Efficient and fast objects detection technique for intelligent video surveillance using transfer learning and fine-tuning | |
US20220044053A1 (en) | Semantic image segmentation using gated dense pyramid blocks | |
Amudhan et al. | RFSOD: a lightweight single-stage detector for real-time embedded applications to detect small-size objects | |
Chacon-Murguia et al. | Moving object detection in video sequences based on a two-frame temporal information CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200518 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20210414 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20210412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211020 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220620 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220620 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220628 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7133585 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |