KR102200212B1 - 불확실성 예측을 위한 샘플링 모델 생성 장치 및 방법, 불확실성 예측 장치 - Google Patents
불확실성 예측을 위한 샘플링 모델 생성 장치 및 방법, 불확실성 예측 장치 Download PDFInfo
- Publication number
- KR102200212B1 KR102200212B1 KR1020180157352A KR20180157352A KR102200212B1 KR 102200212 B1 KR102200212 B1 KR 102200212B1 KR 1020180157352 A KR1020180157352 A KR 1020180157352A KR 20180157352 A KR20180157352 A KR 20180157352A KR 102200212 B1 KR102200212 B1 KR 102200212B1
- Authority
- KR
- South Korea
- Prior art keywords
- uncertainty
- neural network
- artificial neural
- output
- sampling
- Prior art date
Links
- 238000005070 sampling Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013528 artificial neural network Methods 0.000 claims abstract description 47
- 238000013135 deep learning Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 15
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 238000013531 bayesian neural network Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/043—Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
도 2는 본 발명의 일 실시 예에 따른 불확실성 예측 모델 생성 방법을 설명하기 위한 순서도이다.
도 3은 본 발명의 일 실시 예에 따른 불확실성 예측 장치의 블록 구성도이다.
도 4는 본 발명의 다른 실시 예에 따른 불확실성 예측 장치의 블록 구성도이다.
도 5는 판단하기 애매한 MNIST 데이터에 대한 불확실성 테스트 결과 도면이다.
도 6은 notMNIST 데이터에 대한 불확실성 테스트 결과 도면이다.
Claims (10)
- 삭제
- 딥러닝 기반으로 학습된 인공 신경망 모델과,
인공 신경망 모델의 학습 과정에서 샘플링된 적어도 둘 이상의 가중치들 각각에 의해 모델링된 샘플링 모델들과,
인공 신경망 모델 및 샘플링 모델들 각각에 동일한 하나의 데이터가 입력된 후, 각각으로부터 출력되는 출력값들을 종합하여 불확실성 정도가 반영된 결과값을 생성하는 출력 생성부를 포함하되,
샘플링된 적어도 둘 이상의 가중치들은 국소 최소(local minimum)에 근접한 것인 불확실성 예측 장치.
- 딥러닝 기반으로 학습된 인공 신경망 모델과,
인공 신경망 모델의 학습 과정에서 샘플링된 적어도 둘 이상의 가중치들 각각에 의해 모델링된 샘플링 모델들과,
인공 신경망 모델 및 샘플링 모델들 각각에 동일한 하나의 데이터가 입력된 후, 각각으로부터 출력되는 출력값들을 종합하여 불확실성 정도가 반영된 결과값을 생성하는 출력 생성부를 포함하되,
샘플링된 적어도 둘 이상의 가중치들은 인공 신경망 모델의 훈련 데이터들 중 미니 배치의 데이터들 각각 대한 가중치의 경사 벡터들 간 내적값들의 합산값이 소정 임계치 이하일 때 샘플링된 것인 불확실성 예측 장치.
- 제 2항에 있어서, 인공 신경망 모델은
N개의 레이블들 중 하나로 라벨링된 훈련 데이터들에 의해 학습되고,
샘플링 모델들 각각의 출력값은
N개의 레이블들 각각에 대해 상응하는 확률값들인 N차원 정보이되,
출력 생성부는
샘플링 모델들 각각으로부터 산출된 N차원 정보들을 합산한 하나의 N차원 정보를 출력하는 불확실성 정도 산출부를 포함하는 불확실성 예측 장치.
- 제 2항에 있어서, 인공 신경망 모델은
N개의 레이블들 중 하나로 라벨링된 훈련 데이터들에 의해 학습되고,
샘플링 모델들 각각의 출력값은
N개의 레이블들 각각에 대해 상응하는 확률값들인 N차원 정보이되,
출력 생성부는
샘플링 모델들 각각으로부터 산출된 N차원 정보들 각각으로부터 최대 확률값을 가지는 하나의 레이블을 선별하고, 레이블들 별로 선별된 갯수를 카운팅한 값인 N차원 정보를 출력하는 불확실성 정도 산출부를 포함하는 불확실성 예측 장치.
- 제 4항 또는 제 5항에 있어서, 출력 생성부는
인공 신경망 모델로부터 출력된 정답 추정값와 함께 불확실성 정도 산출부로부터 출력된 정답 추정값에 대한 불확실성 정도를 별개로 출력하는 불확실성 예측 장치.
- 제 4항 또는 제 5항에 있어서, 출력 생성부는
인공 신경망 모델로부터 출력된 정답 추정값 및 불확실성 정도 산출부로부터 출력된 불확실성 정도를 기반으로 하나의 불확실성 반영된 정답 추정값을 산출하는 결과값 조합부를 더 포함하는 불확실성 예측 장치.
- 각 단계가 컴퓨터에서 실행되는 프로그램 명령어들로 구현되어 컴퓨터에 의해 실행되는 불확실성 예측을 위한 샘플링 모델 생성 방법에 있어서,
인공 신경망에 훈련 데이터들 중 해당 순번의 미니 배치 데이터를 입력하는 단계와,
인공 신경망의 출력값으로부터 가중치의 국소 최소(local minimum) 근접 여부를 판단하는 단계와,
가중치가 국소 최소에 근접한 것으로 판단될 경우, 해당 가중치로 모델링된 샘플링 모델을 생성하고, 가우시안 노이즈를 추가하여 가중치를 업데이트시키는 단계와,
가중치가 국소 최소에 근접한 것이 아닌 것으로 판단될 경우, 가중치를 업데이트시키는 단계를 포함하되,
상기 단계들을 순차적으로 반복하는 불확실성 예측을 위한 샘플링 모델 생성 방법.
- 제8 항에 있어서, 판단하는 단계는
미니 배치의 데이터들 각각 대한 가중치의 경사 벡터를 산출하는 단계와,
경사 벡터들 간의 내적값들의 합산값을 산출하는 단계와,
합산값이 소정 임계치 이하인지를 판단하는 단계를 포함하는 불확실성 예측을 위한 샘플링 모델 생성 방법.
- 제 8항 내지 제 9항 중 어느 하나에 기재된 방법으로 동작되는 불확실성 예측을 위한 샘플링 모델 생성 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180157352A KR102200212B1 (ko) | 2018-12-07 | 2018-12-07 | 불확실성 예측을 위한 샘플링 모델 생성 장치 및 방법, 불확실성 예측 장치 |
US16/706,679 US11610097B2 (en) | 2018-12-07 | 2019-12-07 | Apparatus and method for generating sampling model for uncertainty prediction, and apparatus for predicting uncertainty |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180157352A KR102200212B1 (ko) | 2018-12-07 | 2018-12-07 | 불확실성 예측을 위한 샘플링 모델 생성 장치 및 방법, 불확실성 예측 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200075071A KR20200075071A (ko) | 2020-06-26 |
KR102200212B1 true KR102200212B1 (ko) | 2021-01-08 |
Family
ID=70970242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180157352A KR102200212B1 (ko) | 2018-12-07 | 2018-12-07 | 불확실성 예측을 위한 샘플링 모델 생성 장치 및 방법, 불확실성 예측 장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11610097B2 (ko) |
KR (1) | KR102200212B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230046516A (ko) | 2021-09-30 | 2023-04-06 | 서울여자대학교 산학협력단 | 테스트 시간 혼합 증강 기반 불확실성 추정 방법, 장치 및 프로그램 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11099108B2 (en) * | 2018-11-21 | 2021-08-24 | Qc Labs | Systems and method for providing a graphical user interface for automated determination of randomized representative sampling |
KR102590113B1 (ko) * | 2020-12-02 | 2023-10-18 | 한국과학기술원 | 인간의 불확실성 추론을 위한 컴퓨터 시스템 및 그의 방법 |
WO2022146080A1 (ko) * | 2020-12-31 | 2022-07-07 | 서울대학교산학협력단 | 딥러닝 네트워크의 동적 양자화 정밀도 가변 알고리즘 및 방법 |
CN112836050B (zh) * | 2021-02-04 | 2022-05-17 | 山东大学 | 针对关系不确定性的引文网络节点分类方法及系统 |
WO2022193171A1 (en) * | 2021-03-17 | 2022-09-22 | Huawei Cloud Computing Technologies Co., Ltd. | System and method for unsupervised multi-model joint reasoning |
CN113127624B (zh) * | 2021-06-16 | 2021-11-16 | 北京金山数字娱乐科技有限公司 | 问答模型的训练方法及装置 |
CN113487617A (zh) * | 2021-07-26 | 2021-10-08 | 推想医疗科技股份有限公司 | 数据处理方法、装置、电子设备以及存储介质 |
CN114936561B (zh) * | 2022-04-11 | 2025-01-07 | 阿里巴巴(中国)有限公司 | 语音文本的处理方法和装置、存储介质和处理器 |
CN115430347B (zh) * | 2022-07-14 | 2024-04-19 | 上海荣美农业科技有限公司 | 控制器、搅拌设备、控制方法及计算机可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180240031A1 (en) * | 2017-02-17 | 2018-08-23 | Twitter, Inc. | Active learning system |
US11676296B2 (en) * | 2017-08-11 | 2023-06-13 | Sri International | Augmenting reality using semantic segmentation |
US11995538B2 (en) * | 2018-05-10 | 2024-05-28 | Microsoft Technology Licensing, Llc | Selecting a neural network architecture for a supervised machine learning problem |
US12001949B2 (en) * | 2018-09-05 | 2024-06-04 | Sartorius Stedim Data Analytics Ab | Computer-implemented method, computer program product and system for data analysis |
-
2018
- 2018-12-07 KR KR1020180157352A patent/KR102200212B1/ko active IP Right Grant
-
2019
- 2019-12-07 US US16/706,679 patent/US11610097B2/en active Active
Non-Patent Citations (1)
Title |
---|
Uncertainty in Neural Networks: Bayesian Ensembling. Tim Pearce et al. arXiv. 2018.10.22.* |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230046516A (ko) | 2021-09-30 | 2023-04-06 | 서울여자대학교 산학협력단 | 테스트 시간 혼합 증강 기반 불확실성 추정 방법, 장치 및 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
KR20200075071A (ko) | 2020-06-26 |
US20200184312A1 (en) | 2020-06-11 |
US11610097B2 (en) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102200212B1 (ko) | 불확실성 예측을 위한 샘플링 모델 생성 장치 및 방법, 불확실성 예측 장치 | |
CN110136103B (zh) | 医学影像解释方法、装置、计算机设备及存储介质 | |
US20200134427A1 (en) | Method of outputting prediction result using neural network, method of generating neural network, and apparatus therefor | |
US11983245B2 (en) | Unmanned driving behavior decision-making and model training | |
US20180189604A1 (en) | Character detection method and apparatus | |
US11475180B2 (en) | System and method for determination of air entrapment in ladles | |
EP3671555A1 (en) | Object shape regression using wasserstein distance | |
US20220405682A1 (en) | Inverse reinforcement learning-based delivery means detection apparatus and method | |
JPH08329031A (ja) | 仮説生成装置及び仮説生成方法並びに分類装置 | |
CN111639755B (zh) | 一种网络模型训练方法、装置、电子设备及存储介质 | |
CN114357594B (zh) | 一种基于sca-gru的桥梁异常监测方法、系统、设备及存储介质 | |
US20190385055A1 (en) | Method and apparatus for artificial neural network learning for data prediction | |
KR20190078899A (ko) | 계층적 시각 특징을 이용한 시각 질의 응답 장치 및 방법 | |
CN112686317B (zh) | 神经网络训练方法、装置、电子设备及存储介质 | |
KR20240034804A (ko) | 자동 회귀 언어 모델 신경망을 사용하여 출력 시퀀스 평가 | |
JP6955233B2 (ja) | 予測モデル作成装置、予測モデル作成方法、および予測モデル作成プログラム | |
WO2019167240A1 (ja) | 情報処理装置、制御方法、及びプログラム | |
US20230206054A1 (en) | Expedited Assessment and Ranking of Model Quality in Machine Learning | |
US11816186B2 (en) | Architecture for dynamic ML model drift evaluation and visualization on a GUI | |
Kim et al. | Adaptive self-training framework for fine-grained scene graph generation | |
US11373285B2 (en) | Image generation device, image generation method, and image generation program | |
Dutta et al. | An adversarial explainable artificial intelligence (XAI) based approach for action forecasting | |
Rguibi et al. | Explaining Deep Neural Networks in medical imaging context | |
CN114358084A (zh) | 一种基于ddqn和生成对抗网络的触觉材料分类方法 | |
KR102731304B1 (ko) | 하이퍼파라미터를 최적화하기 위한 장치, 방법 및 명령어들을 저장한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20181207 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200602 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20200810 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201223 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210104 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210104 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |