KR20230057646A - 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법 - Google Patents
멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법 Download PDFInfo
- Publication number
- KR20230057646A KR20230057646A KR1020210141635A KR20210141635A KR20230057646A KR 20230057646 A KR20230057646 A KR 20230057646A KR 1020210141635 A KR1020210141635 A KR 1020210141635A KR 20210141635 A KR20210141635 A KR 20210141635A KR 20230057646 A KR20230057646 A KR 20230057646A
- Authority
- KR
- South Korea
- Prior art keywords
- level
- domain
- region
- feature
- rpn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명에 따른 도메인 적응형 객체 검출 방법을 설명하는 순서도이다.
도 3은 본 발명에 따른 도메인 적응형 객체 검출 방법의 프레임워크를 설명하는 도면이다.
도 4는 본 발명에 따른 전이 영역 필터링 과정을 설명하는 도면이다.
도 5 내지 10은 본 발명에 관한 실험 결과를 설명하는 도면이다.
도 11은 본 발명에 따른 도메인 적응형 객체 검출 장치의 시스템 구성을 설명하는 도면이다.
도 12는 본 발명에 따른 도메인 적응형 객체 검출 시스템을 설명하는 도면이다.
데이터셋 이름 | 데이터셋 설명 | 검출 객체 수 |
Cityscape | 독일의 다른 50개의 도시의 거리 이미지. 2975개의 학습 데이터와 500개의 테스트 데이터로 구성 | 8가지 |
Foggy- Cityscape |
Cityscape 데이터셋에 흐린 날씨를 합성한 합성데이터셋. 데이터 구조는 Cityscape와 동일함 | 8가지 |
BDD100K | 다양한 조건 (날씨, 시간, 장소)을 포함한 대규모 데이터 주행 데이터셋 | 7가지 |
KITTI | 독일의 도로 및 고속도로 환경을 찍은 저화질 데이터셋. 7,481개의 학습데이터로 구성 | 1가지 |
Sim10K | Grand Theft Auto (GTA)에서 생성한 가상 주행 데이터셋으로 10,000개의 데이터셋과 58,701개의 박스 라벨링이 되어있음 | 1가지 |
110: 이미지 레벨 피처부 130: RPN 레벨 피처부
150: 인스턴스 레벨 피처부 170: 객체 검출부
190: 제어부
1200: 도메인 적응형 객체 검출 시스템
Claims (12)
- 언라벨 타겟 데이터(unlabeled target data)를 복수의 컨볼루션 레이어들에 제공하여 이미지 레벨 피처를 추출하는 이미지 레벨 피처부;
상기 이미지 레벨 피처를 RPN(Region Proposal Network)에 제공하여 RPN-레벨 도메인 적응 및 전이 영역 필터링을 수행함으로써 영역 후보들을 결정하는 RPN 레벨 피처부; 및
상기 영역 후보들에 대한 동적 인스턴스 샘플링(Dynamic Instance Sampling)을 수행하여 RoI (Region of Interest) 풀링 피처를 추출하는 인스턴스 레벨 피처부;를 포함하는 멀티-레벨 전이 영역 (Multi-level Transferable Region) 기반의 도메인 적응형 객체 검출 장치.
- 제1항에 있어서, 상기 이미지 레벨 피처부는
상기 복수의 컨볼루션 레이어들 각각으로부터 상기 언라벨 타겟 데이터의 다중 스케일 피처들을 수집하고 상기 다중 스케일 피처들을 병합하여 전이 가능 어텐션 맵을 생성하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치.
- 제2항에 있어서, 상기 이미지 레벨 피처부는
상기 전이 가능 어텐션 맵과 글로벌 피처 간의 곱 연산을 통해 상기 이미지 레벨 피처를 생성하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치.
- 제1항에 있어서, 상기 RPN 레벨 피처부는
상기 RPN-레벨 도메인 적응 과정에서 상기 RPN에서 출력된 전경 피처 및 GRL(Gradient Reversal Layer) 기반의 도메인 분류기(Dbox)를 경유한 도메인 분류 피처를 병합하여 RPN-레벨 도메인 피처를 생성하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치.
- 제4항에 있어서, 상기 RPN 레벨 피처부는
상기 전이 영역 필터링 과정에서 상기 RPN-레벨 도메인 피처를 입력받고 배경 영역들을 걸러내서 상기 영역 후보들을 결정하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치.
- 제1항에 있어서, 상기 인스턴스 레벨 피처부는
전경 확률 및 이미지 경도 점수 간의 불일치를 기초로 상기 영역 후보들의 개수를 조절하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치.
- 제1항에 있어서,
상기 RoI 풀링 피처를 DCN(Deformable Convolutional Networks)에 제공하여 상기 언라벨 타겟 데이터에 있는 객체를 검출하는 객체 검출부;를 더 포함하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치.
- 언라벨 타겟 데이터(unlabeled target data)를 복수의 컨볼루션 레이어들에 제공하여 이미지 레벨 피처를 추출하는 단계;
상기 이미지 레벨 피처를 RPN(Region Proposal Network)에 제공하여 RPN-레벨 도메인 적응 및 전이 영역 필터링을 수행함으로써 영역 후보들을 결정하는 단계; 및
상기 영역 후보들에 대한 동적 인스턴스 샘플링(Dynamic Instance Sampling)을 수행하여 RoI (Region of Interest) 풀링 피처를 추출하는 단계;를 포함하는 멀티-레벨 전이 영역 (Multi-level Transferable Region) 기반의 도메인 적응형 객체 검출 방법.
- 제8항에 있어서, 상기 이미지 레벨 피처를 추출하는 단계는
상기 복수의 컨볼루션 레이어들 각각으로부터 상기 언라벨 타겟 데이터의 다중 스케일 피처들을 수집하고 상기 다중 스케일 피처들을 병합하여 전이 가능 어텐션 맵을 생성하는 단계를 포함하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 방법.
- 제9항에 있어서, 상기 이미지 레벨 피처를 추출하는 단계는
상기 전이 가능 어텐션 맵과 글로벌 피처 간의 곱 연산을 통해 상기 이미지 레벨 피처를 생성하는 단계를 포함하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 방법.
- 제8항에 있어서, 상기 RoI 풀링 피처를 추출하는 단계는
전경 확률 및 이미지 경도 점수 간의 불일치를 기초로 상기 영역 후보들의 개수를 조절하는 단계를 포함하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 방법.
- 제8항에 있어서,
상기 RoI 풀링 피처를 DCN(Deformable Convolutional Networks)에 제공하여 상기 언라벨 타겟 데이터에 있는 객체를 검출하는 단계;를 더 포함하는 것을 특징으로 하는 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210141635A KR102781019B1 (ko) | 2021-10-22 | 2021-10-22 | 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법 |
US17/540,757 US11908170B2 (en) | 2021-10-22 | 2021-12-02 | Multi-level transferable region-based domain adaptive object detection apparatus and method |
JP2021207600A JP7389787B2 (ja) | 2021-10-22 | 2021-12-21 | マルチ-レベル転移領域に基づくドメイン適応型オブジェクト検出装置及び方法 |
EP21212014.1A EP4170605A1 (en) | 2021-10-22 | 2022-01-20 | Multi-level transferable region-based domain adaptive object detection apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210141635A KR102781019B1 (ko) | 2021-10-22 | 2021-10-22 | 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230057646A true KR20230057646A (ko) | 2023-05-02 |
KR102781019B1 KR102781019B1 (ko) | 2025-03-12 |
Family
ID=78821056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210141635A Active KR102781019B1 (ko) | 2021-10-22 | 2021-10-22 | 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11908170B2 (ko) |
EP (1) | EP4170605A1 (ko) |
JP (1) | JP7389787B2 (ko) |
KR (1) | KR102781019B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116958774B (zh) * | 2023-09-21 | 2023-12-01 | 北京航空航天大学合肥创新研究院 | 一种基于自适应空间特征融合的目标检测方法 |
CN117115170B (zh) * | 2023-10-25 | 2024-01-12 | 安徽大学 | 一种无监督域自适应sar舰船检测方法及系统 |
CN117173748B (zh) * | 2023-11-03 | 2024-01-26 | 杭州登虹科技有限公司 | 一种基于人形识别与人形检测的视频人形事件提取系统 |
CN117765378B (zh) * | 2024-02-22 | 2024-04-26 | 成都信息工程大学 | 多尺度特征融合的复杂环境下违禁物品检测方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200038846A (ko) | 2018-10-04 | 2020-04-14 | 주식회사 스트라드비젼 | R-cnn 기반 객체 검출기의 학습 방법과 테스팅 방법, 및 이를 이용한 학습 장치와 테스팅 장치 |
US20210027098A1 (en) * | 2019-07-22 | 2021-01-28 | Shenzhen Malong Technologies Co., Ltd. | Weakly Supervised Image Segmentation Via Curriculum Learning |
US20210042928A1 (en) * | 2019-08-05 | 2021-02-11 | Sony Corporation Of America | Image mask generation using a deep neural network |
US20210090217A1 (en) * | 2019-09-23 | 2021-03-25 | Tencent America LLC | Video coding for machine (vcm) based system and method for video super resolution (sr) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109523526B (zh) * | 2018-11-08 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 组织结节检测及其模型训练方法、装置、设备和系统 |
CN111222387B (zh) | 2018-11-27 | 2023-03-03 | 北京嘀嘀无限科技发展有限公司 | 对象检测的系统和方法 |
US11544503B2 (en) * | 2020-04-06 | 2023-01-03 | Adobe Inc. | Domain alignment for object detection domain adaptation tasks |
CN111553397B (zh) | 2020-04-21 | 2022-04-29 | 东南大学 | 基于区域全卷积网络和自适应的跨域目标检测方法 |
US11544495B2 (en) * | 2020-07-10 | 2023-01-03 | Adobe Inc. | Attributionally robust training for weakly supervised localization and segmentation |
-
2021
- 2021-10-22 KR KR1020210141635A patent/KR102781019B1/ko active Active
- 2021-12-02 US US17/540,757 patent/US11908170B2/en active Active
- 2021-12-21 JP JP2021207600A patent/JP7389787B2/ja active Active
-
2022
- 2022-01-20 EP EP21212014.1A patent/EP4170605A1/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200038846A (ko) | 2018-10-04 | 2020-04-14 | 주식회사 스트라드비젼 | R-cnn 기반 객체 검출기의 학습 방법과 테스팅 방법, 및 이를 이용한 학습 장치와 테스팅 장치 |
US20210027098A1 (en) * | 2019-07-22 | 2021-01-28 | Shenzhen Malong Technologies Co., Ltd. | Weakly Supervised Image Segmentation Via Curriculum Learning |
US20210042928A1 (en) * | 2019-08-05 | 2021-02-11 | Sony Corporation Of America | Image mask generation using a deep neural network |
US20210090217A1 (en) * | 2019-09-23 | 2021-03-25 | Tencent America LLC | Video coding for machine (vcm) based system and method for video super resolution (sr) |
Non-Patent Citations (1)
Title |
---|
Dang-Khoa Nguyen et al.,‘Domain-Adaptive Object Detection via Uncertainty-Aware Distribution Alignment’, 28th ACM International Conference on Multimedia, 2020.10, URL:https://dl.acm.org/doi/10.1145/3394171.3413553* * |
Also Published As
Publication number | Publication date |
---|---|
EP4170605A1 (en) | 2023-04-26 |
KR102781019B1 (ko) | 2025-03-12 |
JP2023063200A (ja) | 2023-05-09 |
US20230129263A1 (en) | 2023-04-27 |
US11908170B2 (en) | 2024-02-20 |
JP7389787B2 (ja) | 2023-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230057646A (ko) | 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법 | |
EP3844669B1 (en) | Method and system for facilitating recognition of vehicle parts based on a neural network | |
CN110569701B (zh) | 计算机执行的车辆定损方法及装置 | |
KR102117543B1 (ko) | 컴퓨팅 장치 및 이를 이용한 인공 지능 기반 영상 처리 서비스 시스템 | |
WO2020233270A1 (zh) | 票据分析方法、分析装置、计算机设备和介质 | |
Gong et al. | An object recognition, tracking, and contextual reasoning-based video interpretation method for rapid productivity analysis of construction operations | |
Haq et al. | Can offline testing of deep neural networks replace their online testing? a case study of automated driving systems | |
CN108875600A (zh) | 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质 | |
CN114663904B (zh) | 一种pdf文档布局检测方法、装置、设备及介质 | |
CN113762455B (zh) | 检测模型训练方法、单字检测方法、装置、设备及介质 | |
CN108154191B (zh) | 文档图像的识别方法和系统 | |
CN112699671B (zh) | 一种语言标注方法、装置、计算机设备和存储介质 | |
KR20200048256A (ko) | 객체 정보 추출 장치 및 방법 | |
CN116823793A (zh) | 设备缺陷检测方法、装置、电子设备和可读存储介质 | |
CN111738290B (zh) | 图像检测方法、模型构建和训练方法、装置、设备和介质 | |
US12190535B2 (en) | Generating depth images for image data | |
Singh et al. | Evaluating the Performance of Ensembled YOLOv8 Variants in Smart Parking Applications for Vehicle Detection and License Plate Recognition under Varying Lighting Conditions | |
KR102546193B1 (ko) | 컬러 정보를 이용한 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
CN111666503B (zh) | 出行方式推荐方法、装置、计算机设备和可读存储介质 | |
JP2023048062A (ja) | 弱教師あり客体認識装置及び方法 | |
Yin et al. | An uncertainty-aware domain adaptive semantic segmentation framework | |
KR102546195B1 (ko) | 수집 환경 기반 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
CN113158803A (zh) | 一种教室空座查询系统、实时视频分析系统及方法 | |
KR102546198B1 (ko) | 물리적 요인 기반 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
KR102531917B1 (ko) | 경계선 이식을 통한 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20211022 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240724 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20250305 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20250310 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20250310 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |