WO2022025690A1 - 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 - Google Patents
복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 Download PDFInfo
- Publication number
- WO2022025690A1 WO2022025690A1 PCT/KR2021/009939 KR2021009939W WO2022025690A1 WO 2022025690 A1 WO2022025690 A1 WO 2022025690A1 KR 2021009939 W KR2021009939 W KR 2021009939W WO 2022025690 A1 WO2022025690 A1 WO 2022025690A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- class
- neural network
- network model
- loss
- observation
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (10)
- 영상의 복합 특성 분류 및 공통 국소화를 위한 신경망 모델의 학습 방법으로,상기 신경망 모델은,입력 영상에 대해 컨볼루션 필터를 이용하여 컨볼루션 연산을 수행하는 컨볼루션층과,상기 컨볼루션층의 출력에 대해 풀링(pooling)을 수행하기 위한 풀링층과,복합 특성이 분류되는 복수의 클래스에 각각 대응하며, 상기 풀링층의 출력에 대해 클래스별 가중치(wfc(Tt))를 곱한 값을 출력하는 복수의 클래스별 완전결합층(fully connected layer)을 포함하고,상기 복수의 클래스는 서로 상이한 기준에 의해 구별되며,상기 복수의 클래스 각각은 복수의 클래스별 특성으로 분류되며,상기 신경망 모델은, 상기 클래스별 완전결합층의 출력에 따라, 상기 복수의 클래스 각각의 클래스별 특성들에 대한 클래스별 특성 확률을 제공 가능하고,상기 방법은,(a) 입력 영상을 상기 컨볼루션층에 입력하는 단계;(b) 상기 컨볼루션층의 출력에 기초하여, 상기 복수의 클래스 각각에 대한 클래스별 관찰 지도를 연산하는 단계;(c) 상기 클래스별 관찰 지도에 기초하여, 상기 복수의 클래스에 공통되는 관찰 손실(Lobs)을 연산하는 단계; 및(d) 상기 관찰 손실(Lobs)에 기초한 손실을 상기 신경망 모델에 역전파하는 단계를 포함하고,상기 (c) 단계는,(c-1) 상기 클래스별 관찰 지도에 기초하여, 상기 복수의 클래스에 공통되는 공통 관찰 지도를 생성하는 단계; 및(c-2) 상기 공통 관찰 지도 및 상기 입력 영상의 대상 영역을 이용하여 상기 관찰 손실(Lobs)을 연산하는 단계를 포함하고, 각 단계가 컴퓨터 프로세서에 의해 수행되는 신경망 모델의 학습 방법.
- 제1항에 있어서,상기 공통 관찰 지도는 상기 클래스별 관찰 지도의 평균값인 것을 특징으로 하는 신경망 모델의 학습 방법.
- 제1항에 있어서,상기 관찰 손실은 상기 공통 관찰 지도와 상기 입력 영상의 대상 영역을 각각 가로 및 세로 방향으로 프로젝션 한 값들을 연결(concatenate)한 값에 대해 코사인 거리를 계산함으로써 산출되는 것을 특징으로 하는 신경망 모델의 학습 방법.
- 제1항에 있어서,상기 신경망 모델은,상기 복수의 클래스별 완전결합층에 각각 대응하며, 각 클래스별 완전결합층의 출력에 따라 클래스별 특성 확률을 연산하는 복수의 클래스별 분류기를 더 포함하는 것을 특징으로 하는 신경망 모델의 학습 방법.
- 제5항에 있어서,상기 (d) 단계는,(d-1) 상기 복수의 클래스별 분류기 각각의 출력 결과에 기초하여 클래스별 분류 손실(Lcls(Tt))을 연산하는 단계;(d-2) 상기 관찰 손실(Lobs) 및 상기 클래스별 분류 손실(Lcls(Tt))에 기초하여 클래스별 특성 손실(L(Tt))을 연산하는 단계; 및(d-3) 상기 클래스별 특성 손실(L(Tt))을 클래스별로 상기 복수의 클래스별 분류기 및 상기 복수의 클래스별 완전결합층에 역전파하는 단계를 포함하는 것을 특징으로 하는 신경망 모델의 학습 방법.
- 제6항에 있어서,상기 (d) 단계는,(d-4) 복수의 상기 클래스별 분류 손실(Lcls(Tt))과 상기 관찰 손실(Lobs)에 기초하여 다중 레이블 분류 손실(L(T))을 연산하는 단계; 및(d-5) 상기 다중 레이블 분류 손실(L(T))을 상기 복수의 클래스별 분류기, 상기 복수의 클래스별 완전결합층, 상기 풀링층 및 상기 컨볼루션층에 역전파하는 단계를 더 포함하는 것을 특징으로 하는 신경망 모델의 학습 방법.
- 제1항에 있어서,상기 풀링층은 전체 평균 풀링층(global average pooling layer)인 것을 특징으로 하는 신경망 모델의 학습 방법.
- 신경망 모델이 저장되는 메모리; 및프로세서를 포함하는 영상의 복합 특성 분류 및 공통 국소화를 위한 신경망 모델의 학습 장치로서,상기 신경망 모델은,입력 영상에 대해 컨볼루션 필터를 이용하여 컨볼루션 연산을 수행하는 컨볼루션층과,상기 컨볼루션층의 출력에 대해 풀링(pooling)을 수행하기 위한 풀링층과,복합 특성이 분류되는 복수의 클래스에 각각 대응하며, 상기 풀링층의 출력에 대해 클래스별 가중치(wfc(Tt))를 곱한 값을 출력하는 복수의 클래스별 완전결합층(fully connected layer)을 포함하고,상기 복수의 클래스는 서로 상이한 기준에 의해 구별되며,상기 복수의 클래스 각각은 복수의 클래스별 특성으로 분류되며,상기 신경망 모델은, 상기 클래스별 완전결합층의 출력에 따라, 상기 복수의 클래스 각각의 클래스별 특성들에 대한 클래스별 특성 확률을 제공 가능하고,상기 프로세서는,입력 영상을 상기 컨볼루션층에 입력하고, 상기 컨볼루션층의 출력에 기초하여, 상기 복수의 클래스 각각에 대한 복수의 클래스별 관찰 지도를 연산하고, 상기 클래스별 관찰 지도에 기초하여, 상기 복수의 클래스에 공통되는 공통 관찰 지도를 생성하고, 상기 공통 관찰 지도 및 상기 입력 영상의 대상 영역을 이용하여 관찰 손실(Lobs)을 연산하고, 상기 관찰 손실(Lobs)에 기초한 손실을 상기 신경망 모델에 역전파하는 것을 특징으로 하는 신경망 모델의 학습 장치.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202180006146.5A CN114641780A (zh) | 2020-07-31 | 2021-07-29 | 用于复合特性分类和共同局部化的神经网络模型的学习方法及装置 |
US17/777,246 US20220406035A1 (en) | 2020-07-31 | 2021-07-29 | Neural network model training method and apparatus for complex characteristic classification and common localization |
EP21849783.2A EP4191480A1 (en) | 2020-07-31 | 2021-07-29 | Neural network model training method and apparatus for complex characteristic classification and common localization |
JP2022524128A JP2022553407A (ja) | 2020-07-31 | 2021-07-29 | 複合特性分類と共通局所化のためのニューラルネットワークモデルの学習方法及び装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200095773A KR102236615B1 (ko) | 2020-07-31 | 2020-07-31 | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 |
KR10-2020-0095773 | 2020-07-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022025690A1 true WO2022025690A1 (ko) | 2022-02-03 |
Family
ID=75472778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2021/009939 WO2022025690A1 (ko) | 2020-07-31 | 2021-07-29 | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220406035A1 (ko) |
EP (1) | EP4191480A1 (ko) |
JP (1) | JP2022553407A (ko) |
KR (1) | KR102236615B1 (ko) |
CN (1) | CN114641780A (ko) |
WO (1) | WO2022025690A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102236615B1 (ko) * | 2020-07-31 | 2021-04-06 | 주식회사 웨이센 | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017084320A (ja) * | 2015-03-06 | 2017-05-18 | パナソニックIpマネジメント株式会社 | 学習方法およびプログラム |
KR20180025093A (ko) * | 2016-08-30 | 2018-03-08 | 주식회사 루닛 | 약한 지도 학습 기반의 기계 학습 방법 및 그 장치 |
KR102074406B1 (ko) * | 2019-07-25 | 2020-02-06 | 주식회사 딥노이드 | 영상 랜드마크 분류 장치 및 방법 |
KR20200020079A (ko) * | 2018-08-16 | 2020-02-26 | 한국과학기술원 | 안저 사진에서 녹내장 진단을 위해 cam에서 추출된 roi를 중간 입력자로 사용하는 2단계 랭킹 컨볼루셔널 뉴럴 네트워크 |
JP2020080021A (ja) * | 2018-11-12 | 2020-05-28 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
KR102236615B1 (ko) * | 2020-07-31 | 2021-04-06 | 주식회사 웨이센 | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160096460A (ko) * | 2015-02-05 | 2016-08-16 | 삼성전자주식회사 | 복수의 분류기를 포함하는 딥 러닝 기반 인식 시스템 및 그 제어 방법 |
KR20180048407A (ko) * | 2016-10-31 | 2018-05-10 | 삼성전자주식회사 | 차선 검출 장치 및 방법 |
KR102095335B1 (ko) | 2017-11-15 | 2020-03-31 | 에스케이텔레콤 주식회사 | 연산 가속화가 적용된 신경망 모델의 생성 및 활용을 위한 장치 및 방법 |
KR101977067B1 (ko) * | 2018-08-24 | 2019-05-10 | 주식회사 뷰노 | 심층 신경망 기반 특징 추출을 통하여 진단 맵을 재구축하는 방법 및 이를 이용한 장치 |
-
2020
- 2020-07-31 KR KR1020200095773A patent/KR102236615B1/ko active IP Right Grant
-
2021
- 2021-07-29 WO PCT/KR2021/009939 patent/WO2022025690A1/ko active Application Filing
- 2021-07-29 JP JP2022524128A patent/JP2022553407A/ja active Pending
- 2021-07-29 US US17/777,246 patent/US20220406035A1/en active Pending
- 2021-07-29 CN CN202180006146.5A patent/CN114641780A/zh active Pending
- 2021-07-29 EP EP21849783.2A patent/EP4191480A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017084320A (ja) * | 2015-03-06 | 2017-05-18 | パナソニックIpマネジメント株式会社 | 学習方法およびプログラム |
KR20180025093A (ko) * | 2016-08-30 | 2018-03-08 | 주식회사 루닛 | 약한 지도 학습 기반의 기계 학습 방법 및 그 장치 |
KR20200020079A (ko) * | 2018-08-16 | 2020-02-26 | 한국과학기술원 | 안저 사진에서 녹내장 진단을 위해 cam에서 추출된 roi를 중간 입력자로 사용하는 2단계 랭킹 컨볼루셔널 뉴럴 네트워크 |
JP2020080021A (ja) * | 2018-11-12 | 2020-05-28 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
KR102074406B1 (ko) * | 2019-07-25 | 2020-02-06 | 주식회사 딥노이드 | 영상 랜드마크 분류 장치 및 방법 |
KR102236615B1 (ko) * | 2020-07-31 | 2021-04-06 | 주식회사 웨이센 | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR102236615B1 (ko) | 2021-04-06 |
CN114641780A (zh) | 2022-06-17 |
JP2022553407A (ja) | 2022-12-22 |
US20220406035A1 (en) | 2022-12-22 |
EP4191480A1 (en) | 2023-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020101103A1 (ko) | 옵티컬 플로우 영상 처리를 이용하는 하천 유속 측정 장치 및 방법 | |
EP3735662A1 (en) | Method of performing learning of deep neural network and apparatus thereof | |
WO2020153623A1 (ko) | 결함 검사 장치 | |
WO2022025690A1 (ko) | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 | |
EP1126698B1 (en) | High-speed vision sensor | |
WO2021091021A1 (ko) | 화재 검출 시스템 | |
WO2015182904A1 (ko) | 관심객체 검출을 위한 관심영역 학습장치 및 방법 | |
WO2013125768A1 (ko) | 다중 컬러 필터 조리개를 구비한 촬상 장치에 의해 촬영된 영상의 자동 객체 검출 및 깊이 정보 추정장치 및 방법 | |
WO2019235828A1 (ko) | 투 페이스 질병 진단 시스템 및 그 방법 | |
WO2021006522A1 (ko) | 딥 러닝 모델을 활용한 영상 진단 장치 및 그 방법 | |
WO2017142311A1 (ko) | 다중 객체 추적 시스템 및 이를 이용한 다중 객체 추적 방법 | |
WO2021101045A1 (en) | Electronic apparatus and method for controlling thereof | |
WO2022114731A1 (ko) | 딥러닝 기반 비정상 행동을 탐지하여 인식하는 비정상 행동 탐지 시스템 및 탐지 방법 | |
WO2021010671A9 (ko) | 뉴럴 네트워크 및 비국소적 블록을 이용하여 세그멘테이션을 수행하는 질병 진단 시스템 및 방법 | |
WO2018139847A1 (ko) | 얼굴 비교를 통한 개인 식별 방법 | |
WO2021071288A1 (ko) | 골절 진단모델의 학습 방법 및 장치 | |
WO2020071618A1 (ko) | 엔트로피 기반 신경망 부분학습 방법 및 시스템 | |
WO2022092993A1 (ko) | 대상 이미지에 대한 추론 작업을 수행하는 방법 및 시스템 | |
WO2019045147A1 (ko) | 딥러닝을 pc에 적용하기 위한 메모리 최적화 방법 | |
WO2020050456A1 (ko) | 설비 데이터의 이상 정도 평가 방법 | |
WO2020204610A1 (ko) | 딥러닝 기반 컬러링 방법, 시스템 및 프로그램 | |
WO2014058165A1 (ko) | 단일객체의 크기를 추정하는 영상 감시장치 및 방법 | |
WO2020032561A2 (ko) | 다중 색 모델 및 뉴럴 네트워크를 이용한 질병 진단 시스템 및 방법 | |
WO2023096133A1 (ko) | 경량화된 자세 추정 모델 제공 장치 및 방법 | |
WO2022055231A1 (ko) | 인공신경망을 이용한 주행 차량의 차로 판단 방법과 장치 및 이를 포함하는 내비게이션 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21849783 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022524128 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2021849783 Country of ref document: EP |
|
ENP | Entry into the national phase |
Ref document number: 2021849783 Country of ref document: EP Effective date: 20230228 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |