KR101980360B1 - 컨볼루션 신경망을 이용한 객체 인식 장치 및 방법 - Google Patents
컨볼루션 신경망을 이용한 객체 인식 장치 및 방법 Download PDFInfo
- Publication number
- KR101980360B1 KR101980360B1 KR1020150125393A KR20150125393A KR101980360B1 KR 101980360 B1 KR101980360 B1 KR 101980360B1 KR 1020150125393 A KR1020150125393 A KR 1020150125393A KR 20150125393 A KR20150125393 A KR 20150125393A KR 101980360 B1 KR101980360 B1 KR 101980360B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- depth
- neural network
- depth image
- convolutional neural
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 12
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 43
- 239000002131 composite material Substances 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 230000002146 bilateral effect Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Images
Classifications
-
- G06K9/66—
-
- G06K9/4652—
-
- G06K9/6204—
-
- G06K9/6215—
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
상기 영상 처리부는, 상기 깊이 영상의 값을 이용하여 깊이 영상의 픽셀에 대응되는 색상 영상의 픽셀을 매핑하여 합성 영상을 생성하고, 합성 영상에서 색상 영상과 깊이 영상이 매핑되지 않는 영역을 잘라냄으로써 합성 영상의 해상도를 보정한다.
상기 영상 처리부는, 마르코프 랜덤 필드(Markov Random Field, MRF), 시공간 필터(Spatiotemporal filter) 및 에지를 보존하는 양방향 필터(Bilateral filter) 중 적어도 하나를 이용하여 깊이 영상을 업샘플링(upsampling)하여 깊이 영상의 해상도를 높이도록 한다.
상기 영상 처리부는, 양방향 필터 및 중간값 필터(Median filter) 중 적어도 하나를 이용하여 깊이 영상의 노이즈를 제거한다.
상기 객체 인식부의 컨볼루션 신경망은, 원영상으로부터 추출된 코너 특징점을 추적함으로써 카메라의 움직임(Ego-motion)을 예측하고, 다른 움직임의 성분을 갖는 객체의 영역을 관심 영역(Region of interest, ROI)으로 설정하는 특징점 추출기; 및 다중 계층 신경망으로 구성되어, 상기 설정된 ROI에 포함된 객체를 분류하는 신경망 분류기를 포함한다.
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는, 상기 깊이 영상의 값을 이용하여 깊이 영상의 픽셀에 대응되는 색상 영상의 픽셀을 매핑하여 합성 영상을 생성하고, 합성 영상에서 색상 영상과 깊이 영상이 매핑되지 않는 영역을 잘라냄으로써 합성 영상의 해상도를 보정하는 단계를 포함한다.
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는, 마르코프 랜덤 필드(Markov Random Field, MRF), 시공간 필터(Spatiotemporal filter) 및 에지를 보존하는 양방향 필터(Bilateral filter) 중 적어도 하나를 이용하여 깊이 영상을 업샘플링(upsampling)하여 깊이 영상의 해상도를 높이도록 한다.
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는, 양방향 필터 및 중간값 필터(Median filter) 중 적어도 하나를 이용하여 깊이 영상의 노이즈를 제거한다.
상기 객체를 인식하는 단계는, 특징점 추출기를 이용하여 원영상으로부터 추출된 코너 특징점을 추적함으로써 카메라의 움직임(Ego-motion)을 예측하고, 다른 움직임의 성분을 갖는 객체의 영역을 관심 영역(Region of interest, ROI)으로 설정하는 단계; 및 다중 계층 신경망으로 구성된 신경망 분류기를 이용하여 상기 설정된 ROI에 포함된 객체를 분류하는 단계를 포함한다.
도 2는 본 발명에 따른 컨볼루션 신경망을 이용한 객체 인식 장치에 의해 생성된 합성 영상의 실시예를 도시한 도면이다.
도 3 및 도 4는 본 발명에 따른 컨볼루션 신경망을 이용한 객체 인식 방법에 대한 동작 흐름을 도시한 도면이다.
도 5는 본 발명에 따른 장치가 적용된 컴퓨팅 시스템을 도시한 도면이다.
120: 영상 입력부 130: 입력부
140: 출력부 150: 통신부
160: 저장부 170: 영상 처리부
180: 크기정보 추출부 190: 객체 인식부
Claims (10)
- 색상 영상 및 깊이 영상을 획득하여 입력하는 영상 입력부;
상기 색상 영상 및 상기 깊이 영상의 합성 영상을 생성하고, 생성된 합성 영상의 해상도를 보정하며 노이즈를 제거하는 영상 처리부;
상기 깊이 영상의 깊이 값을 이용하여 해당 깊이 영상에 포함된 객체의 크기 정보를 추출하는 크기정보 추출부; 및
상기 영상 처리부에 의해 보정된 합성 영상 및 상기 크기정보 추출부에 의해 추출된 객체의 크기 정보를 컨볼루션 신경망에 적용하여 객체를 인식하는 객체 인식부를 포함하되,
상기 영상 처리부는 상기 깊이 영상을 업샘플링(upsampling)하여 깊이 영상의 해상도를 높이도록 하는 것인 컨볼루션 신경망을 이용한 객체 인식 장치.
- 제1항에 있어서,
상기 영상 처리부는,
상기 깊이 영상의 깊이값을 이용하여 깊이 영상의 픽셀에 대응되는 색상 영상의 픽셀을 매핑하여 합성 영상을 생성하고, 합성 영상에서 색상 영상과 깊이 영상이 매핑되지 않는 영역을 잘라냄으로써 합성 영상의 해상도를 보정하는 것인 컨볼루션 신경망을 이용한 객체 인식 장치.
- 제2항에 있어서,
상기 영상 처리부는,
마르코프 랜덤 필드(Markov Random Field, MRF), 시공간 필터(Spatiotemporal filter) 및 에지를 보존하는 양방향 필터(Bilateral filter) 중 적어도 하나를 이용하여 깊이 영상을 업샘플링(upsampling)하여 상기 깊이 영상의 해상도를 높이도록 하는 것인 컨볼루션 신경망을 이용한 객체 인식 장치.
- 제2항에 있어서,
상기 영상 처리부는,
양방향 필터 및 중간값 필터(Median filter) 중 적어도 하나를 이용하여 깊이 영상의 노이즈를 제거하는 것인 컨볼루션 신경망을 이용한 객체 인식 장치.
- 제1항에 있어서,
상기 객체 인식부의 컨볼루션 신경망은,
원영상으로부터 추출된 코너 특징점을 추적함으로써 카메라의 움직임(Ego-motion)을 예측하고, 상기 카메라의 움직임과 다른 움직임의 성분을 갖는 객체의 영역을 관심 영역(Region of interest, ROI)으로 설정하는 특징점 추출기; 및
다중 계층 신경망으로 구성되어, 상기 설정된 ROI에 포함된 객체를 분류하는 신경망 분류기를 포함하는 것인 컨볼루션 신경망을 이용한 객체 인식 장치.
- 컨볼루션 신경망을 이용한 객체 인식 장치에 의해 수행되는 객체 인식 방법에 있어서,
색상 영상 및 깊이 영상을 획득하여 입력하는 단계;
상기 색상 영상 및 상기 깊이 영상의 합성 영상을 생성하고, 생성된 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계;
상기 깊이 영상의 깊이 값을 이용하여 해당 깊이 영상에 포함된 객체의 크기 정보를 추출하는 단계; 및
상기 보정된 합성 영상 및 상기 추출된 객체의 크기 정보를 컨볼루션 신경망에 적용하여 객체를 인식하는 단계를 포함하되,
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는 상기 깊이 영상을 업샘플링(upsampling)하여 깊이 영상의 해상도를 높이는 것인 컨볼루션 신경망을 이용한 객체 인식 방법.
- 제6항에 있어서,
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는,
상기 깊이 영상의 깊이값을 이용하여 깊이 영상의 픽셀에 대응되는 색상 영상의 픽셀을 매핑하여 합성 영상을 생성하고, 합성 영상에서 색상 영상과 깊이 영상이 매핑되지 않는 영역을 잘라냄으로써 합성 영상의 해상도를 보정하는 단계를 포함하는 것인 컨볼루션 신경망을 이용한 객체 인식 방법.
- 제7항에 있어서,
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는,
마르코프 랜덤 필드(Markov Random Field, MRF), 시공간 필터(Spatiotemporal filter) 및 에지를 보존하는 양방향 필터(Bilateral filter) 중 적어도 하나를 이용하여 상기 깊이 영상을 업샘플링(upsampling)하여 깊이 영상의 해상도를 높이는 것인 컨볼루션 신경망을 이용한 객체 인식 방법.
- 제7항에 있어서,
상기 합성 영상의 해상도를 보정하고 노이즈를 제거하는 단계는,
양방향 필터 및 중간값 필터(Median filter) 중 적어도 하나를 이용하여 깊이 영상의 노이즈를 제거하는 것인 컨볼루션 신경망을 이용한 객체 인식 방법.
- 제6항에 있어서,
상기 객체를 인식하는 단계는,
특징점 추출기를 이용하여 원영상으로부터 추출된 코너 특징점을 추적함으로써 카메라의 움직임(Ego-motion)을 예측하고, 상기 카메라의 움직임과 다른 움직임의 성분을 갖는 객체의 영역을 관심 영역(Region of interest, ROI)으로 설정하는 단계; 및
다중 계층 신경망으로 구성된 신경망 분류기를 이용하여 상기 설정된 ROI에 포함된 객체를 분류하는 단계를 포함하는 것인 컨볼루션 신경망을 이용한 객체 인식 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150125393A KR101980360B1 (ko) | 2015-09-04 | 2015-09-04 | 컨볼루션 신경망을 이용한 객체 인식 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150125393A KR101980360B1 (ko) | 2015-09-04 | 2015-09-04 | 컨볼루션 신경망을 이용한 객체 인식 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170028591A KR20170028591A (ko) | 2017-03-14 |
KR101980360B1 true KR101980360B1 (ko) | 2019-08-28 |
Family
ID=58460101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150125393A KR101980360B1 (ko) | 2015-09-04 | 2015-09-04 | 컨볼루션 신경망을 이용한 객체 인식 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101980360B1 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110337807B (zh) * | 2017-04-07 | 2024-12-10 | 英特尔公司 | 针对深度通道和卷积神经网络图像和格式使用相机设备的方法和系统 |
WO2019083336A1 (ko) * | 2017-10-27 | 2019-05-02 | 전북대학교산학협력단 | 신경회로망 학습에 의한 작물과 잡초 식별 방법 및 장치 |
KR102069675B1 (ko) * | 2017-12-13 | 2020-01-28 | 동국대학교 산학협력단 | 로스팅 완료 시간 예측 장치 및 이의 동작 방법 |
KR102045533B1 (ko) | 2018-01-31 | 2019-11-18 | 전남대학교산학협력단 | 심층 네트워크를 이용한 악보인식 시스템 및 그 방법 |
KR102524220B1 (ko) * | 2018-04-26 | 2023-04-24 | 한국전자통신연구원 | 신경망 학습에 기반한 적층형 다종 영상 객체 보호 장치, 시스템 및 방법 |
KR102213600B1 (ko) * | 2018-08-28 | 2021-02-05 | 포항공과대학교 산학협력단 | Cnn을 이용하여 크기 독립적으로 물체를 검출하는 방법 및 장치 |
KR102164950B1 (ko) * | 2018-10-26 | 2020-10-13 | 계명대학교 산학협력단 | 교사-학생 랜덤 펀을 이용한 다수의 보행자 추적 방법 및 시스템 |
KR20200142883A (ko) | 2019-06-13 | 2020-12-23 | 엘지이노텍 주식회사 | 카메라 장치 및 카메라 장치의 이미지 생성 방법 |
KR20210009458A (ko) | 2019-07-16 | 2021-01-27 | 삼성전자주식회사 | 객체 검출 방법 및 객체 검출 장치 |
KR102300864B1 (ko) * | 2019-10-29 | 2021-09-10 | 오토아이티(주) | 색상 및 온도 정보 기반의 객체 검출 장치 및 방법 |
CN112115913B (zh) * | 2020-09-28 | 2023-08-25 | 杭州海康威视数字技术股份有限公司 | 图像处理方法、装置及设备、存储介质 |
KR102743437B1 (ko) | 2020-10-23 | 2024-12-17 | 한국전자통신연구원 | 확장 가능한 심층신경망 기반 고속 관심 객체 검출 장치 및 그 방법 |
KR102735045B1 (ko) * | 2024-04-26 | 2024-11-27 | (주)믹스폴 | 충돌 방지기능을 갖는 ai 지게차 안전 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101476799B1 (ko) | 2013-07-10 | 2014-12-26 | 숭실대학교산학협력단 | 깊이 정보를 이용한 객체 검출 시스템 및 방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120052610A (ko) * | 2010-11-16 | 2012-05-24 | 삼성전자주식회사 | 신경망 학습을 통한 동작 인식 방법 및 장치 |
KR102070778B1 (ko) * | 2012-11-23 | 2020-03-02 | 엘지전자 주식회사 | Rgb-ir 센서 및 이를 이용한 3차원 영상 획득 방법 및 장치 |
KR101994319B1 (ko) | 2013-02-20 | 2019-06-28 | 삼성전자주식회사 | 깊이 영상을 이용하는 객체 인식 장치 및 그 장치를 이용한 방법 |
KR101486543B1 (ko) * | 2013-05-31 | 2015-01-26 | 한국과학기술원 | 3차원 객체 인식을 위한 rgb-d 영상 기반 객체 구역화 및 인식 방법 및 장치 |
KR102103984B1 (ko) * | 2013-07-15 | 2020-04-23 | 삼성전자주식회사 | 깊이 영상 처리 방법 및 장치 |
KR101515597B1 (ko) * | 2013-07-18 | 2015-04-27 | 주식회사 에스원 | 3차원 영상 정보를 이용한 감지 방법 및 장치 |
KR102106135B1 (ko) * | 2013-10-01 | 2020-05-04 | 한국전자통신연구원 | 행동 인식 기반의 응용 서비스 제공 장치 및 그 방법 |
KR102113812B1 (ko) * | 2014-09-19 | 2020-05-22 | 한국전자통신연구원 | Rgb-d 영상을 이용한 실감형 증강현실 구현 장치 및 방법 |
-
2015
- 2015-09-04 KR KR1020150125393A patent/KR101980360B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101476799B1 (ko) | 2013-07-10 | 2014-12-26 | 숭실대학교산학협력단 | 깊이 정보를 이용한 객체 검출 시스템 및 방법 |
Non-Patent Citations (1)
Title |
---|
장영균 외 1명, "RGB-D 영상 기반 다수 객체 구역화 및 인식 : 다수 객체 구역화를 위한 사용자 참여형 깊이 영상 군집화와 컬러 영상 기반 다수 객체 인식", 한국HCI학회 학술대회, pp. 4-7, 2013년 1월. |
Also Published As
Publication number | Publication date |
---|---|
KR20170028591A (ko) | 2017-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101980360B1 (ko) | 컨볼루션 신경망을 이용한 객체 인식 장치 및 방법 | |
EP3152706B1 (en) | Image capturing parameter adjustment in preview mode | |
KR102117050B1 (ko) | 이미지 내 휴먼 분리를 위한 전자 장치 및 방법 | |
US10380756B2 (en) | Video processing system and method for object detection in a sequence of image frames | |
US9697416B2 (en) | Object detection using cascaded convolutional neural networks | |
US9466009B2 (en) | Feature density object classification, systems and methods | |
US9928439B2 (en) | Facilitating text identification and editing in images | |
US10037466B2 (en) | Video processing apparatus, video processing method, and video processing program | |
US10891473B2 (en) | Method and device for use in hand gesture recognition | |
US20160154469A1 (en) | Mid-air gesture input method and apparatus | |
US10839537B2 (en) | Depth maps generated from a single sensor | |
WO2017139049A1 (en) | Recognition-based object segmentation of a 3-dimensional image | |
CN110869944B (zh) | 使用移动设备读取测试卡 | |
US10122912B2 (en) | Device and method for detecting regions in an image | |
US11462040B2 (en) | Distractor classifier | |
US9400924B2 (en) | Object recognition method and object recognition apparatus using the same | |
KR20120044484A (ko) | 이미지 처리 시스템에서 물체 추적 장치 및 방법 | |
US10163212B2 (en) | Video processing system and method for deformation insensitive tracking of objects in a sequence of image frames | |
WO2014184372A1 (en) | Image capture using client device | |
US20150112853A1 (en) | Online loan application using image capture at a client device | |
US9846807B1 (en) | Detecting eye corners | |
KR20210069686A (ko) | 사용자 지정 초기화 포인트에 기반한 개체 추적 | |
CN110717060B (zh) | 图像mask的过滤方法、装置及存储介质 | |
KR20180065666A (ko) | 차량의 영상 처리 장치 및 방법 | |
JP6497007B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20150904 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20170809 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20150904 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20180912 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190220 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20190514 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20190515 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20211125 Start annual number: 4 End annual number: 4 |
|
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20240225 |