KR102592551B1 - Ar장치를 위한 객체 인식 처리 장치 및 방법 - Google Patents
Ar장치를 위한 객체 인식 처리 장치 및 방법 Download PDFInfo
- Publication number
- KR102592551B1 KR102592551B1 KR1020210168994A KR20210168994A KR102592551B1 KR 102592551 B1 KR102592551 B1 KR 102592551B1 KR 1020210168994 A KR1020210168994 A KR 1020210168994A KR 20210168994 A KR20210168994 A KR 20210168994A KR 102592551 B1 KR102592551 B1 KR 102592551B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- module
- data set
- learning
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000001514 detection method Methods 0.000 claims abstract description 44
- 238000004891 communication Methods 0.000 claims abstract description 12
- 230000003190 augmentative effect Effects 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000003672 processing method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 5
- 238000013145 classification model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 206010000372 Accident at work Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
- G06T7/001—Industrial image inspection using an image reference approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 객체 인식 프로그램의 구성을 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 객체 탐지 모듈의 동작을 설명하기 위한 도면이다.
도 4와 도 5는 본 발명의 일 실시예에 따른 객체 추적 및 데이터셋 수집 모듈의 동작을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 객체 학습 모듈의 동작을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 객체 인지 모듈의 동작을 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른 객체 인식 방법을 도시한 순서도이다.
110: 통신 모듈
120: 메모리
130: 프로세서
140: 데이터베이스
300: 객체 인식 프로그램
310: AR 정보 수집 모듈
320: 객체 탐지 모듈
330: 객체 추적 및 데이터 셋 수집 모듈
340: 객체 학습 모듈
350: 객체 인지 모듈
Claims (19)
- AR(Augmented Reality) 장치를 위한 객체 인식 처리 장치에 있어서,
통신모듈;
객체 인식 프로그램이 저장된 메모리; 및
상기 객체 인식 프로그램을 실행하는 프로세서를 포함하되,
상기 객체 인식 프로그램은 적어도 하나 이상의 AR 장치로부터 AR 영상, AR 영상의 촬영 시간, AR 영상이 촬영된 장소의 위치 정보, 해당 영상을 촬영한 AR 장치에 대한 정보를 수신하는 AR 정보 수집 모듈, 상기 AR 영상에서 각각의 객체를 구분하는 객체 탐지 모듈, 상기 객체 탐지 모듈을 통해 구분된 객체 카테고리 정보를 수신하고 각 객체의 유사도에 기초하여 객체를 추적하고, 해당 객체의 학습을 위한 데이터 셋을 추출하는 객체 추적 및 데이터셋 수집 모듈, 상기 객체 추적 및 데이터셋 수집 모듈로부터 데이터 셋을 수신하고, 수신된 데이터 셋의 유사도에 기초하여 각 객체를 구분하기 위한 학습을 수행하는 객체 학습 모듈 및 입력된 AR 영상으로부터 상기 객체 탐지 모듈을 통해 구분된 객체를 상기 객체 학습 모듈에 입력하여 객체 식별 정보를 출력하는 객체 인지 모듈을 포함하고,
상기 객체 탐지 모듈은,
상기 AR 영상에서 각 객체별로 바운딩 박스를 생성하고, 각 객체별 바운딩 박스에 상기 객체 카테고리 정보를 부여하여 상기 객체 추적 및 데이터셋 수집 모듈에 전달하는 것인, 객체 인식 처리 장치. - 삭제
- 제1항에 있어서,
상기 객체 탐지 모듈은 상기 AR 영상에서 각 객체별로 바운딩 박스를 생성하고, 각 객체별 바운딩 박스에 상기 객체 카테고리 정보를 부여하여 상기 객체 인지 모듈에 전달하고,
상기 객체 인지 모듈은 상기 객체 카테고리 정보를 추가로 활용하여 상기 객체 식별 정보를 출력하는 것인, 객체 인식 처리 장치. - 제1항에 있어서,
상기 객체 탐지 모듈은 상기 AR 영상에서 기탐지되어 추적중인 객체가 존재하는 경우 해당 객체의 영역을 제외한 나머지 영역에 대해 객체 탐지를 수행하는 것인, 객체 인식 처리 장치. - 제1항에 있어서,
상기 객체 추적 및 데이터셋 수집 모듈은 상기 AR 영상으로부터 상기 객체 탐지 모듈을 통해 구분된 각 프레임별 객체에 샴 네트워크(Siamese Network)를 적용하여, 각 프레임별로 유사도가 가장 큰 객체를 추출하는 방식으로 객체를 추적하는 것인, 객체 인식 처리 장치. - 제5항에 있어서,
상기 객체 추적 및 데이터셋 수집 모듈은 상기 객체 추적에 사용된 전체 프레임들 중에서의 각 객체간의 유사도의 합이 최소가 되는 복수의 프레임 또는 각 프레임들간의 유사도가 임계값 이하인 소정 개수의 프레임을 선택하여 학습을 위한 데이터 셋으로 선택하는 것인, 객체 인식 처리 장치. - 제1항에 있어서,
상기 객체 추적 및 데이터셋 수집 모듈은 상기 객체의 탐지 또는 객체의 추적 과정에서 식별된 객체의 특징 정보로부터 추출되는 각 객체의 부가 식별 정보를 상기 학습을 위한 데이터 셋에 추가하고,
상기 객체 학습 모듈은 상기 부가 식별 정보가 추가된 데이터 셋을 기초로 각 객체를 학습하는 것인, 객체 인식 처리 장치. - 제1항에 있어서,
상기 객체 학습 모듈은 상기 수신된 데이터 셋의 유사도에 기초하여, 각 객체를 구분하는 상기 객체 식별 정보를 부여하되, AR 영상의 촬영 시간 및 AR 영상이 촬영된 장소의 위치 정보를 추가적으로 고려하여 데이터 셋을 갱신하는 방식으로 학습을 수행하는 것인, 객체 인식 처리 장치. - 제1항에 있어서,
상기 객체 인지 모듈은
상기 객체 탐지 모듈을 통해 구분된 객체와 상기 객체 학습 모듈의 각 객체별 데이터 셋과의 유사도에 기초하여, 기존 객체 식별 정보로 분류하거나, 신규 객체 식별 정보를 부여하거나, 미확정으로 분류하는 것인, 객체 인식 처리 장치. - AR(Augmented Reality) 장치를 위한 객체 인식 처리 장치를 이용한 객체 인식 처리 방법에 있어서,
(a) 적어도 하나 이상의 AR 장치로부터 AR 영상, AR 영상의 촬영 시간, AR 영상이 촬영된 장소의 위치 정보, 해당 영상을 촬영한 AR 장치에 대한 정보를 수신하는 단계;
(b) 상기 AR 영상에서 각각의 객체를 구분하고, 구분된 객체 카테고리 정보를 생성하는 단계;
(c) 상기 구분된 객체 카테고리 정보를 수신하고 각 객체의 유사도에 기초하여 객체를 추적하고, 해당 객체의 학습을 위한 데이터 셋을 추출하는 단계;
(d) 상기 추출된 데이터 셋을 수신하고, 수신된 데이터 셋의 유사도에 기초하여 각 객체를 구분하기 위한 학습을 수행하여 객체 학습 모듈을 구축하는 단계; 및
(e) 입력된 AR 영상으로부터 상기 구분된 객체를 상기 객체 학습 모듈에 입력하여 객체 식별 정보를 출력하는 객체 인지 단계를 포함하고,
상기 (b) 단계는,
상기 AR 영상에서 각 객체별로 바운딩 박스를 생성하고, 각 객체별 바운딩 박스에 상기 객체 카테고리 정보를 부여하는 것인, 객체 인식 처리 방법. - 삭제
- 제10항에 있어서,
상기 (b) 단계는 상기 AR 영상에서 각 객체별로 바운딩 박스를 생성하고, 각 객체별 바운딩 박스에 상기 객체 카테고리 정보를 부여하여 상기 (e) 단계로 전달하고,
상기 (e) 단계는 상기 객체 카테고리 정보를 추가로 활용하여 상기 객체 식별 정보를 출력하는 것인, 객체 인식 처리 방법. - 제10항에 있어서,
상기 (b) 단계는 상기 AR 영상에서 기탐지되어 추적중인 객체가 존재하는 경우 해당 객체의 영역을 제외한 나머지 영역에 대해 객체 탐지를 수행하는 것인, 객체 인식 처리 방법. - 제10항에 있어서,
상기 (c) 단계는 상기 AR 영상으로부터 각 프레임별 객체에 샴 네트워크(Siamese Network)를 적용하여, 각 프레임별로 유사도가 가장 큰 객체를 추출하는 방식으로 객체를 추적하는 것인, 객체 인식 처리 방법. - 제14항에 있어서,
상기 (c) 단계는 상기 객체 추적에 사용된 전체 프레임들 중에서의 각 객체간의 유사도의 합이 최소가 되는 복수의 프레임 또는 각 프레임들간의 유사도가 임계값 이하인 소정 개수의 프레임을 선택하여 학습을 위한 데이터 셋으로 선택하는 것인, 객체 인식 처리 방법. - 제10항에 있어서,
상기 (c) 단계는 상기 객체의 탐지 또는 객체의 추적 과정에서 식별된 객체의 특징 정보로부터 추출되는 각 객체의 부가 식별 정보를 상기 학습을 위한 데이터 셋에 추가하고,
상기 (d) 단계는 상기 부가 식별 정보가 추가된 데이터 셋을 기초로 각 객체를 학습하는 것인, 객체 인식 처리 방법. - 제10항에 있어서,
상기 (d) 단계는 상기 수신된 데이터 셋의 유사도에 기초하여, 각 객체를 구분하는 상기 객체 식별 정보를 부여하되, AR 영상의 촬영 시간 및 AR 영상이 촬영된 장소의 위치 정보를 추가적으로 고려하여 데이터 셋을 갱신하는 방식으로 학습을 수행하는 것인, 객체 인식 처리 방법. - 제10항에 있어서,
상기 (e) 단계는 상기 (b) 단계를 통해 구분된 객체와 상기 객체 학습 모듈의 각 객체별 데이터 셋과의 유사도에 기초하여, 기존 객체 식별 정보로 분류하거나, 신규 객체 식별 정보를 부여하거나, 미확정으로 분류하는 것인, 객체 인식 처리 방법. - 제10항, 제12항 내지 제 18 항 중 어느 한 항에 따른 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200164494 | 2020-11-30 | ||
KR20200164494 | 2020-11-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220076398A KR20220076398A (ko) | 2022-06-08 |
KR102592551B1 true KR102592551B1 (ko) | 2023-10-24 |
Family
ID=81980789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210168994A Active KR102592551B1 (ko) | 2020-11-30 | 2021-11-30 | Ar장치를 위한 객체 인식 처리 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102592551B1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12243538B2 (en) * | 2021-09-01 | 2025-03-04 | Gulfstream Aerospace Corporation | Interactive aircraft cabin environment |
KR102695828B1 (ko) | 2022-08-22 | 2024-08-20 | 한국전자기술연구원 | Ar 영상 수신 장치 및 방법 |
US12190457B2 (en) | 2022-08-23 | 2025-01-07 | Snap Inc. | Object counting on AR wearable devices |
CN119948533A (zh) * | 2022-09-28 | 2025-05-06 | 三星电子株式会社 | 用于识别图像中的对象的增强现实装置和方法 |
KR102647135B1 (ko) * | 2022-10-31 | 2024-03-15 | 이관훈 | 인공지능 기반 객체 탐지 알고리즘을 이용하는 시공 현장을 위한 실시간 균열 탐지 시스템 및 이를 위한 동작 방법 |
KR102725274B1 (ko) | 2022-11-23 | 2024-11-01 | (주)씨지픽셀스튜디오 | 마커리스 ar 인식 구현을 위한 오브젝트 인식 및 증강 구현 시스템, 그리고 그 방법 |
KR102681566B1 (ko) * | 2023-03-10 | 2024-07-05 | 한국철도기술연구원 | 메모리 성능이 개선된 객체 인식 및 추적 방법과 이를 수행하는 자율주행 로봇 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101140506B1 (ko) * | 2010-05-06 | 2012-04-30 | 엔에이치엔(주) | 포즈 템플릿을 제공하는 촬영 장치 및 방법 |
KR102286037B1 (ko) * | 2018-11-12 | 2021-08-05 | 한국전자통신연구원 | 기계 학습을 위한 학습 데이터 셋 생성 장치 및 방법 |
KR102132330B1 (ko) * | 2018-11-27 | 2020-07-09 | 주식회사 코이노 | 하이퍼모션 단계 처리가 가능한 증강현실 및 기계학습 기반 원격 가이던스 장치 및 그 방법 |
KR102243244B1 (ko) * | 2019-08-26 | 2021-04-23 | 엘지전자 주식회사 | 자율주행시스템에서 긴급단계에 따른 제어방법 및 이를 위한 장치 |
-
2021
- 2021-11-30 KR KR1020210168994A patent/KR102592551B1/ko active Active
Also Published As
Publication number | Publication date |
---|---|
KR20220076398A (ko) | 2022-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102592551B1 (ko) | Ar장치를 위한 객체 인식 처리 장치 및 방법 | |
US11188783B2 (en) | Reverse neural network for object re-identification | |
US10417526B2 (en) | Object recognition method and device | |
WO2019218824A1 (zh) | 一种移动轨迹获取方法及其设备、存储介质、终端 | |
JP6018674B2 (ja) | 被写体再識別のためのシステム及び方法 | |
Lu et al. | Feature extraction and fusion using deep convolutional neural networks for face detection | |
Arietta et al. | City forensics: Using visual elements to predict non-visual city attributes | |
Wu et al. | 3d instances as 1d kernels | |
US20170300744A1 (en) | Method and apparatus for determining identity identifier of face in face image, and terminal | |
US20120207346A1 (en) | Detecting and Localizing Multiple Objects in Images Using Probabilistic Inference | |
CN111241989A (zh) | 图像识别方法及装置、电子设备 | |
KR20160091786A (ko) | 사용자 관리 방법 및 사용자 관리 장치 | |
CN110431560A (zh) | 目标人物的搜索方法和装置、设备、程序产品和介质 | |
US20230095533A1 (en) | Enriched and discriminative convolutional neural network features for pedestrian re-identification and trajectory modeling | |
JP2018026122A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN114387656B (zh) | 基于人工智能的换脸方法、装置、设备及存储介质 | |
US11055572B2 (en) | System and method of training an appearance signature extractor | |
Wu et al. | Comparative analysis and application of LBP face image recognition algorithms | |
CN112925899A (zh) | 排序模型建立方法、案件线索推荐方法、装置及介质 | |
CN113869304A (zh) | 视频的文字检测方法及装置 | |
CN114463555B (zh) | 步态特征提取方法及装置 | |
CN114677611B (zh) | 数据识别方法、存储介质及设备 | |
Meena et al. | A robust face recognition system for one sample problem | |
CN111783725A (zh) | 人脸识别方法、装置及存储介质 | |
Li et al. | Multitarget tracking of pedestrians in video sequences based on particle filters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20211130 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220926 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230320 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230922 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20231018 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20231019 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |