JP7149124B2 - 画像オブジェクト抽出装置及びプログラム - Google Patents
画像オブジェクト抽出装置及びプログラム Download PDFInfo
- Publication number
- JP7149124B2 JP7149124B2 JP2018139764A JP2018139764A JP7149124B2 JP 7149124 B2 JP7149124 B2 JP 7149124B2 JP 2018139764 A JP2018139764 A JP 2018139764A JP 2018139764 A JP2018139764 A JP 2018139764A JP 7149124 B2 JP7149124 B2 JP 7149124B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- feature
- image
- context
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
図1は、本発明による一実施形態の画像オブジェクト抽出装置1の概略構成を示すブロック図である。本発明による一実施形態の画像オブジェクト抽出装置1は、スケール変換部11、演算領域切り出し部12、走査部13、サイズ変換部14、及びニューラルネットワーク部15を備える。
以下、より具体的に、図3及び図4を参照しながら、本実施形態の画像オブジェクト抽出装置1について説明する。図3は、本発明による一実施形態の画像オブジェクト抽出装置1の動作を示すフローチャートである。また、図4は、本発明による一実施形態の画像オブジェクト抽出装置1に係る並列処理型ニューラルネットワークの説明図である。
以下、図5乃至図7を参照して、本発明に係る画像オブジェクト抽出装置1について、畳み込みニューラルネットワークを用いた場合の実施例について説明する。
ここで、本発明に係る画像オブジェクト抽出装置1の効果を実験により検証した。実験では、本発明に係る画像オブジェクト抽出装置1として、入力画像Iから8×8画素の注目領域(ROI)と、16×16画素のコンテキスト領域の部分画像を切り出すものとした。そして、注目領域特徴演算部151における注目領域(ROI)に関する全体のストライドは2、サイズ変換部14を介するコンテキスト領域特徴演算部152におけるコンテキスト領域に関する全体のストライドも2となるように、畳み込み層とプーリング層を組み合わせて設計した。また、オブジェクト抽出部154も含めたニューラルネットワーク部15全体の畳み込み層の総数は3とした。
11 スケール変換部
12 演算領域切り出し部
13 走査部
14 サイズ変換部
15 ニューラルネットワーク部
151 注目領域特徴演算部
152 コンテキスト領域特徴演算部
153 特徴結合部
154 オブジェクト抽出部
100 画像オブジェクト抽出装置
112 注目領域切り出し部
113 走査部
115 ニューラルネットワーク部
1151 注目領域特徴演算部
1154 オブジェクト抽出部
Claims (3)
- 入力画像から特定のオブジェクトを抽出する画像オブジェクト抽出装置であって、
予め定めた最初のスケールを初期値として、所定の倍率で前記入力画像を段階的に縮小するようにスケール変換を施した入力画像を順に生成するスケール変換手段と、
前記スケール変換手段によりスケール変換された入力画像を走査しながら、注目領域の部分画像と、当該注目領域とその周りの情報を含むコンテキスト領域の部分画像とをそれぞれ1種類の予め定めたサイズで順次切り出す演算領域切り出し手段と、
順次切り出される前記コンテキスト領域の部分画像を前記注目領域と同じサイズに縮小するようにサイズ変換を行うサイズ変換手段と、
前記注目領域の部分画像に対してそのままのサイズでニューラルネットワークを用いて第1の特徴量を算出する注目領域特徴演算手段と、
当該サイズ変換した後の前記コンテキスト領域の部分画像に対してニューラルネットワークを用いて第2の特徴量を算出するコンテキスト領域特徴演算手段と、
前記第1の特徴量、及び前記第2の特徴量を結合し、結合特徴量を生成する結合手段と、
当該結合特徴量を基に前記注目領域が当該特定のオブジェクトを含んでいるか否かを判定することにより、前記スケール変換手段を経て得られる入力画像から当該特定のオブジェクトを抽出するオブジェクト抽出手段と、を備え、
少なくとも前記注目領域特徴演算手段、前記コンテキスト領域特徴演算手段、前記結合手段、及び前記オブジェクト抽出手段は、ニューラルネットワークにおける部分ネットワークとして構成され、
前記注目領域特徴演算手段、及び前記コンテキスト領域特徴演算手段が並列処理されるように構成され、
前記演算領域切り出し手段は、前記スケール変換手段を経て得られる入力画像から、それぞれ固定値で前記注目領域の部分画像、及び前記コンテキスト領域の部分画像を切り出すものとし、前記コンテキスト領域の部分画像を切り出す際に、前記コンテキスト領域が前記注目領域の重心と一致する重心を持ち、且つ前記注目領域に対して縦横四方の周りの情報が含まれるように所定量で拡大したサイズで切り出し、
前記注目領域特徴演算手段、及び前記コンテキスト領域特徴演算手段は、それぞれ同一形式の特徴量算出処理として畳み込みニューラルネットワークに基づく並列処理により、前記スケール変換手段を経て得られる入力画像を基準にして、前記第1の特徴量、及び前記第2の特徴量の各々の位置関係が相関する特徴マップを算出し、
前記オブジェクト抽出手段は、前記スケール変換手段を経て得られる入力画像のスケールが所定の閾値より小さくならない範囲内で当該スケール変換手段によるスケール変換を繰り返させて、異なるサイズのオブジェクトを抽出することを特徴とする画像オブジェクト抽出装置。 - 前記演算領域切り出し手段は、前記コンテキスト領域の面積が、前記注目領域の面積に対し1倍より大きく4倍以下を満たすように切り出すことを特徴とする、請求項1に記載の画像オブジェクト抽出装置。
- コンピュータを、請求項1又は2に記載の画像オブジェクト抽出装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018139764A JP7149124B2 (ja) | 2018-07-25 | 2018-07-25 | 画像オブジェクト抽出装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018139764A JP7149124B2 (ja) | 2018-07-25 | 2018-07-25 | 画像オブジェクト抽出装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020017082A JP2020017082A (ja) | 2020-01-30 |
JP7149124B2 true JP7149124B2 (ja) | 2022-10-06 |
Family
ID=69581483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018139764A Active JP7149124B2 (ja) | 2018-07-25 | 2018-07-25 | 画像オブジェクト抽出装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7149124B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7453828B2 (ja) | 2020-03-26 | 2024-03-21 | Go株式会社 | プログラム、ニューラルネットワークシステム、情報処理方法およびニューラルネットワークモデルの生成方法 |
CN111489287B (zh) * | 2020-04-10 | 2024-02-09 | 腾讯科技(深圳)有限公司 | 图像转换方法、装置、计算机设备和存储介质 |
TWI744999B (zh) * | 2020-07-23 | 2021-11-01 | 和碩聯合科技股份有限公司 | 焊點檢測模型訓練方法、焊點檢測方法及焊點檢測裝置 |
CN112365498B (zh) * | 2020-12-10 | 2024-01-23 | 南京大学 | 一种针对二维图像序列中多尺度多形态目标的自动检测方法 |
CN115661141B (zh) * | 2022-12-14 | 2023-03-31 | 上海牙典医疗器械有限公司 | 基于cbct图像牙齿和牙槽骨分割方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113168A (ja) | 2009-11-25 | 2011-06-09 | Fujifilm Corp | オブジェクト検出装置および方法並びにプログラム |
-
2018
- 2018-07-25 JP JP2018139764A patent/JP7149124B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113168A (ja) | 2009-11-25 | 2011-06-09 | Fujifilm Corp | オブジェクト検出装置および方法並びにプログラム |
Non-Patent Citations (1)
Title |
---|
Chenyi Chen et al.,R-CNN for Small Object Detection,[online],2016年11月21日,https://oar.princeton.edu/rt4ds/file/29906/254 |
Also Published As
Publication number | Publication date |
---|---|
JP2020017082A (ja) | 2020-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7149124B2 (ja) | 画像オブジェクト抽出装置及びプログラム | |
US12008797B2 (en) | Image segmentation method and image processing apparatus | |
US10740897B2 (en) | Method and device for three-dimensional feature-embedded image object component-level semantic segmentation | |
JP6798183B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
US20220012612A1 (en) | System, method, and program for predicting information | |
JP5505409B2 (ja) | 特徴点生成システム、特徴点生成方法および特徴点生成プログラム | |
JP5336995B2 (ja) | 特徴点位置決め装置、画像認識装置、その処理方法及びプログラム | |
US20220148328A1 (en) | Pedestrian detection method and apparatus, computer-readable storage medium, and chip | |
CN112381061B (zh) | 一种面部表情识别方法及系统 | |
CN116309983B (zh) | 虚拟人物模型的训练方法、生成方法、装置和电子设备 | |
US9965698B2 (en) | Image processing apparatus, non-transitory computer-readable recording medium having stored therein image processing program, and operation method of image processing apparatus | |
CN112686225A (zh) | Yolo神经网络的训练方法、行人检测方法和相关设备 | |
KR20200030988A (ko) | 영상 처리 장치 및 그 동작방법 | |
JP7220062B2 (ja) | 学習データ生成プログラム、学習データ生成装置、及び学習データ生成方法 | |
CN114049491A (zh) | 指纹分割模型训练、指纹分割方法、装置、设备及介质 | |
KR102333545B1 (ko) | 합성곱 신경망 기반의 영상 학습 방법 및 이를 수행하기 위한 장치 | |
JP5335554B2 (ja) | 画像処理装置及び画像処理方法 | |
KR101592087B1 (ko) | 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체 | |
KR20200134813A (ko) | 기계 학습을 위한 이미지 처리 장치 및 방법 | |
KR101853211B1 (ko) | 모바일 gpu 환경에서 차영상 정보를 이용한 sift 알고리즘의 복잡도 감소 기법 | |
US11288534B2 (en) | Apparatus and method for image processing for machine learning | |
CN114973413A (zh) | 基于单个rgb图像的三维手势识别方法与系统 | |
WO2023162132A1 (ja) | 画像変換装置、方法およびプログラム | |
Karaca et al. | Image denoising with CNN-based attention | |
CN116403269B (zh) | 一种遮挡人脸解析方法、系统、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210623 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220712 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7149124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |