KR20200143193A - 객체인식장치 및 객체인식방법 - Google Patents
객체인식장치 및 객체인식방법 Download PDFInfo
- Publication number
- KR20200143193A KR20200143193A KR1020190117656A KR20190117656A KR20200143193A KR 20200143193 A KR20200143193 A KR 20200143193A KR 1020190117656 A KR1020190117656 A KR 1020190117656A KR 20190117656 A KR20190117656 A KR 20190117656A KR 20200143193 A KR20200143193 A KR 20200143193A
- Authority
- KR
- South Korea
- Prior art keywords
- feature
- feature map
- extraction operation
- object recognition
- image
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 title claims description 15
- 238000000605 extraction Methods 0.000 claims abstract description 59
- 238000005070 sampling Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000010606 normalization Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000003252 repetitive effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008921 facial expression Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G06K9/00228—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G06K9/00201—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
Description
도2는 본 발명의 일 실시예에 의한 특징추출부를 나타내는 블록도이다.
도3은 본 발명의 일 실시예에 의한 역잔류모듈을 나타내는 블록도이다.
도4는 본 발명의 일 실시예에 의한 업샘플링모듈, 분류부 및 위치감지부를 나타내는 블록도이다.
도5는 본 발명의 일 실시예에 의한 백본네트워크의 구조를 나타내는 블록도이다.
도6은 본 발명의 다른 실시예에 의한 객체인식장치를 나타내는 블록도이다.
도7은 본 발명의 일 실시예에 의한 객체인식방법을 나타내는 순서도이다.
도8은 본 발명의 다른 실시예에 의한 객체인식방법을 나타내는 순서도이다.
120: 백본네트워크부 121: 역잔류모듈
130: 업샘플링부 131: 업샘플링모듈
140: 분류부 150: 위치감지부
Claims (11)
- 대상 이미지를 입력받으면, 특징추출연산을 수행하여 특징이미지를 생성하는 특징 추출부(feature extraction block); 및
상기 특징이미지에 특징맵추출연산을 반복적으로 수행하여, 상기 특징맵 추출연산을 적용한 횟수에 따라 각각 상이한 해상도를 가지는 복수의 제1 특징맵을 생성하는 백본 네트워크부(backbone network)를 포함하는 객체인식장치.
- 제1항에 있어서, 상기 백본 네트워크부는
복수의 역잔류모듈(inverted residual module)을 포함하고, 상기 특징이미지를 상기 복수의 역잔류모듈에 순차적으로 적용하여 상기 특징맵추출연산을 수행하는 것을 특징으로 하는 객체인식장치.
- 제3항에 있어서, 상기 역잔류모듈은
깊이 기반 분리 컨볼루션(depth-wise separable convolution) 연산을 포함하고, 활성함수(activation function)로 PReLU(Parametric Rectified Linear Unit) 또는 Leaky-ReLU를 이용하는 것을 특징으로 하는 객체인식장치.
- 제3항에 있어서, 상기 백본 네트워크부는
복수의 역잔류모듈 중에서, 가장 마지막에 연산되는 역잔류모듈의 스트라이드(stride)를 2로 설정하고, 나머지 역잔류모듈의 스트라이드는 1로 설정하는 것을 특징으로 하는 객체인식장치.
- 제1항에 있어서,
상기 복수의 제1 특징맵 내를 이동하는 각각의 경계박스를 이용하여, 상기 경계박스 내의 객체 포함여부를 판별하는 분류부(classification head); 및
상기 객체가 포함된 경우에는, 상기 제1 특징맵 내의 경계박스를 상기 대상 이미지 내의 위치로 회귀시켜 상기 객체의 위치정보를 추출하는 위치감지부(regression head)를 더 포함하는 것을 특징으로 하는 객체인식장치.
- 제6항에 있어서,
상기 특징 추출부, 백본 네트워크부, 상기 분류부 및 위치감지부는 멀티태스크 손실 함수(multitask loss function)를 이용하여 동시에 학습되는 것을 특징으로 하는 객체인식장치.
- 제1항에 있어서,
직전에 생성한 제2 특징맵을 업샘플링(upsampling)하고, 상기 업샘플링된 결과와 동일한 해상도를 가지는 제1 특징맵을 스킵 커넥션 기법(skip connection)으로 연결하여 제2 특징맵을 생성하는 업샘플링부를 더 포함하는 것으로,
상기 업샘플링부는
복수의 제1 특징맵 중에서 해상도가 가장 낮은 제1 특징맵을 최초의 제2 특징맵으로 설정하는 것을 특징으로 하는 객체인식장치.
- 입력받은 대상이미지에 특징추출연산을 수행하여 특징이미지를 생성하는 단계;
상기 특징이미지에 특징맵추출연산을 반복적으로 수행하고, 상기 특징맵 추출연산을 적용한 횟수에 따라 각각 상이한 해상도를 가지는 복수의 제1 특징맵을 생성하는 단계; 및
상기 복수의 제1 특징맵 내를 이동하는 각각의 경계박스를 이용하여, 상기 경계박스 내의 객체 포함여부를 판별하고, 상기 객체가 포함된 경우에는 상기 제1 특징맵 내의 경계박스를 상기 대상 이미지 내의 위치로 회귀시켜 상기 객체의 위치정보를 추출하는 단계를 포함하는 객체인식방법.
- 입력받은 대상이미지에 특징추출연산을 수행하여 특징이미지를 생성하는 단계;
상기 특징이미지에 특징맵추출연산을 반복적으로 수행하고, 상기 특징맵 추출연산을 적용한 횟수에 따라 각각 상이한 해상도를 가지는 복수의 제1 특징맵을 생성하는 단계;
복수의 제1 특징맵 중에서 해상도가 가장 낮은 제1 특징맵을 최초의 제2 특징맵으로 설정하는 단계;
직전에 생성한 제2 특징맵을 업샘플링(upsampling)하고, 상기 업샘플링된 결과와 동일한 해상도를 가지는 제1 특징맵을 스킵 커넥션 기법(skip connection)으로 연결하여 제2 특징맵을 생성하는 단계; 및
상기 복수의 제2 특징맵 내를 이동하는 각각의 경계박스를 이용하여, 상기 경계박스 내의 객체 포함여부를 판별하고, 상기 객체가 포함된 경우에는 상기 제2 특징맵 내의 경계박스를 상기 대상 이미지 내의 위치로 회귀시켜 상기 객체의 위치정보를 추출하는 단계를 포함하는 객체인식방법.
- 하드웨어와 결합되어, 제9항 내지 제10항 중 어느 한 항의 객체 인식방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020086385A JP7133585B2 (ja) | 2019-06-13 | 2020-05-18 | オブジェクト認識装置およびオブジェクト認識方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190070269 | 2019-06-13 | ||
KR1020190070269 | 2019-06-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200143193A true KR20200143193A (ko) | 2020-12-23 |
KR102261894B1 KR102261894B1 (ko) | 2021-06-08 |
Family
ID=74089590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190117656A KR102261894B1 (ko) | 2019-06-13 | 2019-09-24 | 객체인식장치 및 객체인식방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102261894B1 (ko) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767355A (zh) * | 2021-01-20 | 2021-05-07 | 北京小白世纪网络科技有限公司 | 一种甲状腺结节Tirads分级自动识别模型构建方法及装置 |
CN113723352A (zh) * | 2021-09-13 | 2021-11-30 | 中国银行股份有限公司 | 一种文本检测方法、系统、存储介质及电子设备 |
CN113837015A (zh) * | 2021-08-31 | 2021-12-24 | 艾普工华科技(武汉)有限公司 | 一种基于特征金字塔的人脸检测方法及系统 |
KR102444928B1 (ko) * | 2021-06-28 | 2022-09-21 | 주식회사 펫나우 | 반려 동물의 식별을 위한 객체를 검출하기 위한 방법 및 장치 |
WO2023277473A1 (ko) * | 2021-06-28 | 2023-01-05 | 주식회사 펫나우 | 반려 동물의 식별을 위한 객체를 촬영하기 위한 방법 및 전자 장치 |
KR20230036327A (ko) * | 2021-09-07 | 2023-03-14 | 서울대학교산학협력단 | 패치기반의 딥러닝 알고리즘을 통한 실내도면 이미지에서의 실내공간정보 자동추출방법 및 그 장치 |
KR20230053347A (ko) * | 2021-10-14 | 2023-04-21 | 한양대학교 산학협력단 | 좌표 정보를 이용한 객체 검출 네트워크 기법 |
KR20230089185A (ko) * | 2021-12-13 | 2023-06-20 | 삼성전자주식회사 | 객체를 검출하는 방법 및 장치 |
KR102655237B1 (ko) * | 2024-01-23 | 2024-04-08 | 한화시스템(주) | 가이드 특징맵 기반 표적 탐지 장치 및 방법 |
KR20240119731A (ko) * | 2023-01-30 | 2024-08-06 | 충남대학교산학협력단 | 미세플라스틱 계수 장치 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018147431A (ja) * | 2017-03-09 | 2018-09-20 | コニカミノルタ株式会社 | 画像認識装置及び画像認識方法 |
KR20180108123A (ko) * | 2017-03-24 | 2018-10-04 | 가톨릭대학교 산학협력단 | 다중 객체 추적 방법 |
KR20190050639A (ko) * | 2017-11-03 | 2019-05-13 | 주식회사 케이티 | 컨볼루션 신경망에 기반한 제스처 분류장치 및 방법 |
-
2019
- 2019-09-24 KR KR1020190117656A patent/KR102261894B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018147431A (ja) * | 2017-03-09 | 2018-09-20 | コニカミノルタ株式会社 | 画像認識装置及び画像認識方法 |
KR20180108123A (ko) * | 2017-03-24 | 2018-10-04 | 가톨릭대학교 산학협력단 | 다중 객체 추적 방법 |
KR20190050639A (ko) * | 2017-11-03 | 2019-05-13 | 주식회사 케이티 | 컨볼루션 신경망에 기반한 제스처 분류장치 및 방법 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767355A (zh) * | 2021-01-20 | 2021-05-07 | 北京小白世纪网络科技有限公司 | 一种甲状腺结节Tirads分级自动识别模型构建方法及装置 |
KR102444928B1 (ko) * | 2021-06-28 | 2022-09-21 | 주식회사 펫나우 | 반려 동물의 식별을 위한 객체를 검출하기 위한 방법 및 장치 |
WO2023277473A1 (ko) * | 2021-06-28 | 2023-01-05 | 주식회사 펫나우 | 반려 동물의 식별을 위한 객체를 촬영하기 위한 방법 및 전자 장치 |
AU2022300548B2 (en) * | 2021-06-28 | 2024-08-08 | Petnow Inc. | Method for photographing object for identifying companion animal, and electronic device |
CN113837015A (zh) * | 2021-08-31 | 2021-12-24 | 艾普工华科技(武汉)有限公司 | 一种基于特征金字塔的人脸检测方法及系统 |
KR20230036327A (ko) * | 2021-09-07 | 2023-03-14 | 서울대학교산학협력단 | 패치기반의 딥러닝 알고리즘을 통한 실내도면 이미지에서의 실내공간정보 자동추출방법 및 그 장치 |
CN113723352A (zh) * | 2021-09-13 | 2021-11-30 | 中国银行股份有限公司 | 一种文本检测方法、系统、存储介质及电子设备 |
KR20230053347A (ko) * | 2021-10-14 | 2023-04-21 | 한양대학교 산학협력단 | 좌표 정보를 이용한 객체 검출 네트워크 기법 |
KR20230089185A (ko) * | 2021-12-13 | 2023-06-20 | 삼성전자주식회사 | 객체를 검출하는 방법 및 장치 |
KR20240119731A (ko) * | 2023-01-30 | 2024-08-06 | 충남대학교산학협력단 | 미세플라스틱 계수 장치 |
KR102655237B1 (ko) * | 2024-01-23 | 2024-04-08 | 한화시스템(주) | 가이드 특징맵 기반 표적 탐지 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102261894B1 (ko) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102261894B1 (ko) | 객체인식장치 및 객체인식방법 | |
EP3690742A1 (en) | Method for auto-labeling training images for use in deep learning network to analyze images with high precision, and auto-labeling device using the same | |
Roy et al. | Deep learning based hand detection in cluttered environment using skin segmentation | |
CN108229490B (zh) | 关键点检测方法、神经网络训练方法、装置和电子设备 | |
US11853892B2 (en) | Learning to segment via cut-and-paste | |
US20180096457A1 (en) | Methods and Software For Detecting Objects in Images Using a Multiscale Fast Region-Based Convolutional Neural Network | |
US20180114071A1 (en) | Method for analysing media content | |
US8103058B2 (en) | Detecting and tracking objects in digital images | |
CN111563502A (zh) | 图像的文本识别方法、装置、电子设备及计算机存储介质 | |
CN110070115B (zh) | 一种单像素攻击样本生成方法、装置、设备及存储介质 | |
Khan et al. | Face segmentation: A journey from classical to deep learning paradigm, approaches, trends, and directions | |
CN110348358B (zh) | 一种肤色检测系统、方法、介质和计算设备 | |
CN118279679B (zh) | 基于深度学习模型的图像分类方法、图像分类设备及介质 | |
Novak | Vehicle detection and pose estimation for autonomous driving | |
CN113807354B (zh) | 图像语义分割方法、装置、设备和存储介质 | |
CN113095473A (zh) | 神经网络架构搜索系统和方法及计算机可读记录介质 | |
CN117315752A (zh) | 人脸情绪识别网络模型的训练方法、装置、设备和介质 | |
CN110688511A (zh) | 细粒度图像检索方法、装置、计算机设备及存储介质 | |
CN112825116A (zh) | 监控视频图像人脸检测和追踪方法、装置、介质及设备 | |
CN118552553B (zh) | 一种医学图像分割方法、装置及介质 | |
JP7133585B2 (ja) | オブジェクト認識装置およびオブジェクト認識方法 | |
Kane et al. | Sign Language apprehension using convolution neural networks | |
KR102026139B1 (ko) | 특징맵에 대한 영역 분할과 병합을 통해 기계학습 기반의 객체 식별을 수행하는 전자 장치 및 그 동작 방법 | |
CN114708591A (zh) | 基于单字连接的文档图像中文字符检测方法 | |
CN117612231B (zh) | 人脸检测方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190924 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200902 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210323 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210601 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210602 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240327 Start annual number: 4 End annual number: 4 |