KR20090005506A - 분포 적합 자동화 시스템 및 방법 - Google Patents
분포 적합 자동화 시스템 및 방법 Download PDFInfo
- Publication number
- KR20090005506A KR20090005506A KR1020070068598A KR20070068598A KR20090005506A KR 20090005506 A KR20090005506 A KR 20090005506A KR 1020070068598 A KR1020070068598 A KR 1020070068598A KR 20070068598 A KR20070068598 A KR 20070068598A KR 20090005506 A KR20090005506 A KR 20090005506A
- Authority
- KR
- South Korea
- Prior art keywords
- distribution
- parameter
- value
- candidate
- probability
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Complex Calculations (AREA)
Abstract
Description
Claims (17)
- 특정 데이터에 대한 최적의 확률분포 및 확률분포의 모수를 추정하기 위한 분포 적합 자동화 시스템에서의 분포 적합 자동화 방법으로서,a) 분포 적합 자동화 시스템이 사용자에 의해 입력되는 복수의 데이터를 분석하여 분포모형을 판단하는 단계; 및b) 상기 a) 단계의 결과, 분포모형이 일반분포인 경우, 후보 분포별 최적값을 산출하여, 우도 함수값이 최대인 해당 후보 분포를 최적의 확률분포로 선택하고, 선택된 해당 후보 분포에 대한 모수를 최적의 확률분포 모수로 설정하는 일반분포 적합화를 수행하고,상기 a) 단계의 결과, 분포모형이 혼합분포인 경우, 기 설정된 분리 조건에 따라 혼합분포의 데이터셋을 분리한 후, 분리된 각각의 데이터셋에 대한 후보 분포별 최적값을 산출하고, 혼합분포의 후보 분포별 최적값을 산출하여 우도 함수값이 최대인 해당 후보 분포를 최적의 확률분포로 선택하고, 선택된 해당 후보 분포에 대한 모수를 최적의 확률분포 모수로 설정하는 혼합분포 적합화를 수행하는 단계;를 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제1항에 있어서,상기 a) 단계의 분포모형을 결정하는 단계는,a-1) 복수 데이터의 최소값으로부터 최대값의 구간을 임의의 간격으로 구분 한 후, 도수 밀도를 산출하는 단계;a-2) 도수 밀도에 따라 모드(Mode) 수를 산출하는 단계; 및a-3) 상기 모드 수에 따라 일반분포 또는 혼합분포 중 어느 하나로 구분하는 단계;를 더 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제2항에 있어서,상기 a-2) 단계 이후 a-3) 단계 이전에,산출된 모드 수가 기 설정된 최대 모드 수를 초과하면, 상기 최대 모드 수를 초과하지 않도록 모드 수를 조정하는 단계;를 더 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제1항에 있어서,상기 a) 단계 이전에,복수의 데이터에 대해 데이터 수집 과정에서 발생한 오류를 수정하고, 이상치를 제거하는 전처리 절차를 수행하는 단계;를 더 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제1항에 있어서,상기 분포모형이 일반분포인 경우,상기 b) 단계의 일반분포 적합화 단계는,b-1) 후보 변수 데이터의 최소값과 최대값인 절단 모수를 산출하고, 복수의 후보 분포 중 어느 하나에 대해 최대 우도 추정법(MLE)을 적용하여 초기 모수를 추정하는 단계;b-2) 상기 b-1) 단계에서 산출된 데이터의 최소값과 최대값을 이용하여 이동 모수 범위를 산출하고, 상기 이동 모수 범위를 임의로 구분한 후 구분한 구간 중 가장 작은 값을 이동 모수로 설정하는 단계;b-3) 상기 b-1) 단계 및 상기 b-2) 단계에서 산출된 절단 모수 및 이동 모수를 이용하여 확률 분포 함수를 정의하는 단계;b-4) 상기 b-3) 단계에서 정의된 확률 분포 함수의 우도 함수를 최대화하는 분포 모수의 최적값을 산출하는 단계;b-5) 상기 b-2) 단계에서 구분한 이동 모수 구간별 이동 모수를 기초로 상기 b-3) 단계 내지 b-4) 단계를 수행하여 최적값을 산출하고, 이동 모수 구간별 최적값 중 우도 함수값이 최대인 값을 선택하는 단계;b-6) 상기 b-5) 단계에서 선택된 값을 중심으로 전후 범위에 대해 일정한 개수의 구간으로 재분리하는 단계;b-7) 상기 b-6) 단계에서 분리한 구간에 대해 상기 b-3) 단계 내지 b-6) 단계를 반복 수행하고, 여기서 획득된 최대 우도 함수값의 개선 과정 확인을 통해 최적값을 산출하는 단계;b-8) 복수의 후보 분포 각각에 대해 상기 b-1) 단계 내지 b-7) 단계를 수행 하여, 각각의 최적값을 산출하고, 산출된 최적값 중 우도 함수값이 가장 큰 해당 후보 분포를 최적의 확률분포로 설정하고, 설정된 확률분포에 대한 모수를 최적의 확률분포 모수로 설정하는 단계;를 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제5항에 있어서,상기 b-3) 단계는,현재 적용하고 있는 후보 분포의 확률 분포 함수, 절단분포의 확률 분포 함수 및 이동분포의 확률 분포 함수를 이용하여 확률 분포 함수를 산출하고, 산출된 확률 분포 함수에 상기 절단 모수와 이동 모수를 적용하여 확률 분포 함수를 정의하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제5항에 있어서,상기 b-4) 단계는,상기 b-1) 단계에서 최대 우도 추정법(MLE)을 적용하여 추정한 초기 모수를 초기값으로 하여 분포 모수의 최적값을 산출하는 단계인 것을 특징으로 하는 분포 적합 자동화 방법.
- 제5항에 있어서,상기 b-4) 단계에서,비선형계획 최적화 방식인 심플렉스(Simplex) 방식을 적용하여 분포 모수를 산출하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제5항에 있어서,상기 b-7) 단계는,최대 우도 함수값을 개선하는 과정에서 이전 우도 함수값과 비교하여 현재 우도 함수값의 개선 정도가 1 미만인 경우, 최대 우도 함수값의 개선 과정을 종료하는 단계;를 더 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제1항에 있어서,상기 분포모형이 혼합분포인 경우,상기 b) 단계의 혼합분포 적합화 단계는,b-1) 기 설정된 분리 조건에 따라 혼합분포의 데이터셋을 분리한 후, 분리된 각각의 데이터셋에 대한 후보 분포별 최적값을 산출하고, 최적값 중 우도 함수값이 가장 큰 분포를 각각 선택하는 단계;b-2) 상기 b-1) 단계에서 선택된 각각의 분포를 혼합한 혼합분포의 확률 분포 함수를 산출하는 단계;b-3) 산출된 확률 분포 함수의 우도 함수값이 최대가 되는 가중 모수를 산출하는 단계;b-4) 상기 b-3) 단계에서 산출된 혼합분포 모수의 전체 데이터에 대한 개선 과정을 수행하는 단계; 및b-5) 산출된 모수를 초기값으로 하고, 모수에 대해 심플렉스 방식을 적용하여, 최적값을 산출하는 단계;를 포함하는 것을 특징으로 하는 분포 적합 자동화 방법.
- 제1항 내지 제12항 중 어느 한 항에 있어서,상기 후보 분포는,정규(Normal) 분포, 로그 정규(Log-Normal) 분포, 지수(Exponential) 분포, 와이블(Weibull) 분포, 감마(Gamma) 분포, 일반 파레토(General Pareto) 분포, 균일(Uniform) 분포 또는 이들의 조합 중 어느 하나인 것을 특징으로 하는 분포 적합 자동화 방법.
- 특정 데이터에 대한 최적의 확률분포 및 확률분포의 모수를 추정하기 위한 분포 적합 자동화 시스템으로서,수집된 데이터를 입력 받는 데이터 입력부;상기 데이터 입력부를 통해 입력된 복수의 데이터 모형이 일반분포인지 또는 혼합분포인지 여부를 판단하는 분포 모형 판별부;후보 분포별 최적값을 산출하여, 우도 함수값이 최대인 해당 후보 분포를 최적의 확률분포로 선택하고, 선택된 해당 후보 분포에 대한 모수를 최적의 확률분포 모수로 설정하는 일반분포 적합화를 수행하는 일반분포 적합 처리부; 및기 설정된 분리 조건에 따라 혼합분포의 데이터셋을 분리한 후, 분리된 각각의 데이터셋에 대한 후보 분포별 최적값을 산출하여 우도 함수값이 최대인 해당 후보 분포를 최적의 확률분포로 선택하고, 선택된 해당 후보 분포에 대한 모수를 최적의 확률분포 모수로 설정하는 혼합분포 적합화를 수행하는 혼합분포 적합 처리 부;를 포함하는 것을 특징으로 하는 분포 적합 자동화 시스템.
- 제14항에 있어서,수집된 데이터에 대해 데이터 수집 과정에서 발생한 오류를 수정하고, 이상치를 제거하는 전처리 수행부;를 더 포함하는 것을 특징으로 하는 분포 적합 자동화 시스템.
- 제14항에 있어서,상기 일반분포 적합 처리부 및 혼합분포 적합 처리부에 의해서 적합화된 확률분포 모수와 확률분포를 미리 설정된 기준에 따라 검정하는 적합도 검정부; 및상기 분포 적합 자동화 시스템과 관련된 정보를 저장하는 데이터베이스;를 더 포함하는 것을 특징으로 하는 분포 적합 자동화 시스템.
- 제14항에 있어서,상기 후보 분포는,정규(Normal) 분포, 로그 정규(Log-Normal) 분포, 지수(Exponential) 분포, 와이블(Weibull) 분포, 감마(Gamma) 분포, 일반 파레토(General Pareto) 분포, 균일(Uniform) 분포 또는 이들의 조합 중 어느 하나인 것을 특징으로 하는 분포 적합 자동화 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070068598A KR100879854B1 (ko) | 2007-07-09 | 2007-07-09 | 분포 적합 자동화 시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070068598A KR100879854B1 (ko) | 2007-07-09 | 2007-07-09 | 분포 적합 자동화 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090005506A true KR20090005506A (ko) | 2009-01-14 |
KR100879854B1 KR100879854B1 (ko) | 2009-01-22 |
Family
ID=40487092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070068598A KR100879854B1 (ko) | 2007-07-09 | 2007-07-09 | 분포 적합 자동화 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100879854B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102336679B1 (ko) * | 2020-06-25 | 2021-12-09 | 켐아이넷(주) | 모델선정지표 정규화 기반의 확률분포 선정 방법 |
KR102561776B1 (ko) * | 2022-12-28 | 2023-08-02 | (주)휴엔릭스 | 화학물질 누출사고의 피해등급 자동산정장치 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101507903B1 (ko) | 2013-04-01 | 2015-04-07 | (주)나노포인트 | 운전 위험 지수관련 이벤트 등록을 위한 관찰 기준 임계값 추정 장치 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7395170B2 (en) | 2001-05-24 | 2008-07-01 | Test Advantage, Inc. | Methods and apparatus for data analysis |
KR100706544B1 (ko) * | 2005-07-29 | 2007-04-13 | 현대자동차주식회사 | 전산해석 신뢰도 분석방법 |
-
2007
- 2007-07-09 KR KR1020070068598A patent/KR100879854B1/ko active IP Right Grant
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102336679B1 (ko) * | 2020-06-25 | 2021-12-09 | 켐아이넷(주) | 모델선정지표 정규화 기반의 확률분포 선정 방법 |
KR102561776B1 (ko) * | 2022-12-28 | 2023-08-02 | (주)휴엔릭스 | 화학물질 누출사고의 피해등급 자동산정장치 |
Also Published As
Publication number | Publication date |
---|---|
KR100879854B1 (ko) | 2009-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11216741B2 (en) | Analysis apparatus, analysis method, and non-transitory computer readable medium | |
CN110084271B (zh) | 一种图片类别的识别方法和装置 | |
EP2854053A1 (en) | Defect prediction method and device | |
EP1835426A1 (en) | Estimating software power consumption | |
CN105488539B (zh) | 分类模型的生成方法及装置、系统容量的预估方法及装置 | |
US7373332B2 (en) | Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers | |
CN108829878B (zh) | 一种工业实验数据异常点检测方法及装置 | |
CN113516228B (zh) | 一种基于深度神经网络的网络异常检测方法 | |
CN105488599B (zh) | 预测文章热度的方法和装置 | |
KR100879854B1 (ko) | 분포 적합 자동화 시스템 및 방법 | |
US20190331721A1 (en) | Noise spectrum analysis for electronic device | |
CN113642209B (zh) | 基于数字孪生的结构植入故障响应数据获取及评判方法 | |
CN104992050A (zh) | 基于统计信号处理的时间序列特性评价的预测模型选择方法 | |
CN112256881B (zh) | 用户信息分类方法及装置 | |
CN113762401A (zh) | 自适应分类任务阈值调整方法、装置、设备及存储介质 | |
CN105608460A (zh) | 多分类器融合方法和系统 | |
Kousathanas et al. | A guide to general-purpose ABC software | |
CN114186644A (zh) | 一种基于优化随机森林的缺陷报告严重程度预测方法 | |
US20060074826A1 (en) | Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers | |
CN114861800A (zh) | 模型训练方法、概率确定方法、装置、设备、介质及产品 | |
CN112861689A (zh) | 一种基于nas技术的坐标识别模型的搜索方法及装置 | |
CN112785000A (zh) | 面向大规模机器学习系统的机器学习模型训练方法及系统 | |
CN110516659A (zh) | 滚珠丝杠退化阶段识别方法、装置、设备及存储介质 | |
CN115171781B (zh) | 肿瘤变异位点是否为噪音的识别方法、系统、装置和介质 | |
JP7393827B1 (ja) | 出題最適化システム、出題最適化方法、及び出題最適化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130103 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140115 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150112 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160111 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170103 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180104 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190102 Year of fee payment: 11 |