KR101692611B1 - 데이터 연관성 기반 이상치 평가 장치 및 방법 - Google Patents
데이터 연관성 기반 이상치 평가 장치 및 방법 Download PDFInfo
- Publication number
- KR101692611B1 KR101692611B1 KR1020150027914A KR20150027914A KR101692611B1 KR 101692611 B1 KR101692611 B1 KR 101692611B1 KR 1020150027914 A KR1020150027914 A KR 1020150027914A KR 20150027914 A KR20150027914 A KR 20150027914A KR 101692611 B1 KR101692611 B1 KR 101692611B1
- Authority
- KR
- South Korea
- Prior art keywords
- input data
- data
- attribute
- information
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G06F17/30289—
-
- G06F17/30303—
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
Description
도 2는 본 발명에 따른 이상치 평가 장치를 도시한 구성도.
도 3a 내지 3c는 본 발명에 따른 수치형 속성에 대한 이상치 정도 산출 과정을 도시한 도면.
도 4a 및 4b는 본 발명에 따른 범주형 속성에 대한 이상치 정도 산출 과정을 도시한 도면.
도 5a 및 5b는 본 발명에 따른 복합형 속성에 대한 이상치 정도 평가 과정을 도시한 도면.
도 6은 본 발명에 따른 데이터 이상치 평가 방법을 독시한 흐름도.
Claims (12)
- 테이블 형태로 데이터를 저장하는 데이터베이스 내 입력되는 입력 데이터에 대한 이상치 평가 장치로서,
상기 입력 데이터가 입력되면, 상호 연관성이 있는 관련 속성에 대한 분포정보를 제공하는 분포 모듈; 및
상기 분포정보를 이용해 관련 속성이 수치형, 범주형 및 복합형 중 어느 종류인지를 확인하고, 상기 관련 속성의 종류에 따라 상기 입력 데이터와 상기 관련 속성 내 속성 간의 거리 및 상기 입력 데이터와 상기 관련 속성의 데이터 간의 조합 빈도수 중 적어도 하나를 이용하여 상기 입력 데이터의 이상치 정도를 평가하는 평가 모듈를 포함하되,
상기 분포 모듈은, 상기 관련 속성이 수치형이면, 상기 관련 속성에 대응하는 데이터를 군집하여 생성된 적어도 하나의 군집정보를 포함하는 상기 분포정보를 제공하며,
상기 평가 모듈은, 상기 군집정보를 참고해 상기 적어도 하나의 군집과 상기 입력 데이터의 거리를 산출하고, 산출된 상기 거리를 이용해 상기 입력 데이터와 가장 가까운 일 군집을 선택하며, 상기 입력 데이터의 상기 일 군집에 대한 소속 정도를 이용해 상기 입력 데이터의 이상치 정도를 산출하는 제1 평가부를 포함하는 것인 데이터 이상치 평가 장치. - 삭제
- 제1항에 있어서, 상기 제1 평가부는,
상기 입력 데이터와 상기 일 군집의 거리에 퍼지 소속함수를 적용하여 상기 입력 데이터의 상기 일 군집에 대한 소속정도 값을 산출하고, 1에서 상기 소속 정도의 값을 뺄셈한 결과를 상기 이상치 정도로 산출하는 것인 데이터 이상치 평가 장치. - 제1항에 있어서,
상기 분포 모듈은, 상기 관련 속성이 범주형이면, 상기 관련 속성의 가능한 조합에 대한 적어도 하나의 조합 빈도수 정보를 포함하는 상기 분포정보를 제공하고,
상기 평가 모듈은, 상기 조합 빈도수 정보를 이용하여 상기 입력 데이터와 상기 관련 속성의 가능한 조합에 대한 적어도 하나의 빈도수를 산출하고, 이를 이용하여 상기 입력 데이터의 이상치 정보를 산출하는 제2 평가부를 포함하는 것인 데이터 이상치 평가 장치. - 제4항에 있어서, 상기 제2 평가부는,
상기 적어도 하나의 조합 빈도수를 이용하여 정규화된 히스토그램을 산출하고, 1에서 상기 히스토그램의 각 빈도수를 뺄셈한 결과를 상기 이상치 정도로 산출하는 것인 데이터 이상치 평가 장치. - 제1항에 있어서,
상기 분포 모듈은, 상기 관련 속성 내 각 속성이 상기 수치형과 상기 범주형이 혼용된 복합형이면, 상기 관련 속성 중에서 범주형 속성값을 기준으로 상기 관련 속성에 대응하는 데이터를 계층화(Stratification)하여 적어도 하나의 속성층을 구성하고, 상기 적어도 하나의 속성층의 각 층에 있는 수치형 속성값에 대응하는 데이터를 군집화한 결과 적어도 하나의 군집정보를 포함하는 상기 분포정보를 제공하며,
상기 평가 모듈은, 상기 적어도 하나의 군집정보를 이용하여 상기 입력 데이터와 상기 적어도 하나의 군집정보에 따른 군집 간의 거리를 이용하여 상기 이상치 정도를 산출하는 것인 데이터 이상치 평가 장치. - 제1항, 제3항 내지 제6항 중 어느 한 항에 있어서,
상기 이상치 정도와 기설정된 임계치와 비교하여 상기 입력 데이터의 이상치 데이터 여부를 판정하고, 판정 결과를 사용자에게 안내하는 판정 모듈
을 더 포함하는 데이터 이상치 평가 장치. - 제1항에 있어서,
상기 분포 모듈은, 상기 입력 데이터를 정상 데이터로 판정하면, 상기 입력 데이터를 상기 데이터베이스에 저장시키고, 상기 입력 데이터를 포함하는 상기 분포정보를 생성하는 것인 데이터 이상치 평가 장치. - 적어도 하나의 프로세서에 의한 데이터베이스 내 입력되는 입력 데이터에 대한 이상치 평가 방법으로서,
상기 입력 데이터가 입력되면, 상호 연관성이 있는 관련 속성에 대한 분포정보를 제공하는 단계;
상기 분포정보를 이용해 관련 속성이 수치형, 범주형 및 복합형 중 어느 종류인지를 확인하는 단계; 및
상기 관련 속성의 종류에 따라 상기 입력 데이터와 상기 관련 속성 내 속성 간의 거리 및 상기 입력 데이터와 상기 관련 속성의 데이터 간의 조합 빈도수 중 적어도 하나를 이용하여 상기 입력 데이터의 이상치 정도를 평가하는 단계를 포함하되,
상기 제공하는 단계는, 상기 관련 속성이 수치형이면, 상기 관련 속성에 대응하는 데이터를 군집하여 생성된 적어도 하나의 군집정보를 포함하는 상기 분포정보를 제공하는 단계를 포함하며,
상기 평가하는 단계는, 상기 군집정보를 참고해 상기 적어도 하나의 군집과 상기 입력 데이터의 거리를 산출하고, 산출된 상기 거리를 이용해 상기 입력 데이터와 가장 가까운 일 군집을 선택하며, 상기 입력 데이터의 상기 일 군집에 대한 소속 정도를 이용해 상기 입력 데이터의 이상치 정도를 산출하는 단계를 포함하는 것인 데이터 이상치 평가 방법. - 삭제
- 제9항에 있어서,
상기 제공하는 단계는, 상기 관련 속성이 범주형이면, 상기 관련 속성의 가능한 조합에 대한 적어도 하나의 조합 빈도수 정보를 포함하는 상기 분포정보를 제공하는 단계를 포함하며,
상기 평가하는 단계는, 상기 조합 빈도수 정보를 이용하여 상기 입력 데이터와 상기 관련 속성의 가능한 조합에 대한 적어도 하나의 빈도수를 산출하고, 이를 이용하여 상기 입력 데이터의 이상치 정보를 산출하는 단계를 포함하는 것인 데이터 이상치 평가 방법. - 제9항에 있어서,
상기 제공하는 단계는, 상기 관련 속성 내 각 속성이 상기 수치형과 상기 범주형이 혼용된 복합형이면, 상기 관련 속성 중에서 범주형 속성값을 기준으로 상기 관련 속성에 대응하는 데이터를 계층화(Stratification)하여 적어도 하나의 속성층을 구성하고, 상기 적어도 하나의 속성층의 각 층에 있는 수치형 속성값에 대응하는 데이터를 군집화한 결과 적어도 하나의 군집정보를 포함하는 상기 분포정보를 제공하며,
상기 평가하는 단계는, 상기 적어도 하나의 군집정보를 이용하여 상기 입력 데이터와 상기 적어도 하나의 군집정보에 따른 군집 간의 거리를 이용하여 상기 이상치 정도를 산출하는 것인 데이터 이상치 평가 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150027914A KR101692611B1 (ko) | 2015-02-27 | 2015-02-27 | 데이터 연관성 기반 이상치 평가 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150027914A KR101692611B1 (ko) | 2015-02-27 | 2015-02-27 | 데이터 연관성 기반 이상치 평가 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160104945A KR20160104945A (ko) | 2016-09-06 |
KR101692611B1 true KR101692611B1 (ko) | 2017-01-17 |
Family
ID=56945872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150027914A Active KR101692611B1 (ko) | 2015-02-27 | 2015-02-27 | 데이터 연관성 기반 이상치 평가 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101692611B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102470763B1 (ko) | 2022-10-13 | 2022-11-25 | 주식회사 비플컨설팅 | 데이터 이상치 탐색 장치 및 방법 |
KR20230166608A (ko) | 2022-05-31 | 2023-12-07 | 삼성에스디에스 주식회사 | 이상치 탐지 방법 및 그 시스템 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020241959A1 (ko) * | 2019-05-31 | 2020-12-03 | 주식회사 포스코아이씨티 | 비정상 제어데이터 탐지시스템 |
CN112101765A (zh) * | 2020-09-08 | 2020-12-18 | 国网山东省电力公司菏泽供电公司 | 一种配电网运行指标数据异常数据处理方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101172579B1 (ko) * | 2009-12-15 | 2012-08-09 | 한국과학기술원 | 이상 속성을 포함하는 데이터의 검출 방법 및 장치 |
-
2015
- 2015-02-27 KR KR1020150027914A patent/KR101692611B1/ko active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230166608A (ko) | 2022-05-31 | 2023-12-07 | 삼성에스디에스 주식회사 | 이상치 탐지 방법 및 그 시스템 |
KR102470763B1 (ko) | 2022-10-13 | 2022-11-25 | 주식회사 비플컨설팅 | 데이터 이상치 탐색 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20160104945A (ko) | 2016-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109472005B (zh) | 数据可信度评估方法、装置、设备和存储介质 | |
Yin et al. | Optimal linear combinations of multiple diagnostic biomarkers based on Youden index | |
US8423960B2 (en) | Evaluation of software based on review history | |
US20160210535A1 (en) | Image processing apparatus, image processing method, program, and storage medium | |
KR101692611B1 (ko) | 데이터 연관성 기반 이상치 평가 장치 및 방법 | |
CN103080954B (zh) | 用于分析飞行器飞行期间所记录的飞行数据的方法和系统 | |
US20180174062A1 (en) | Root cause analysis for sequences of datacenter states | |
US20100162401A1 (en) | Risk model correcting system, risk model correcting method, and risk model correcting program | |
US12259971B2 (en) | Method, apparatus, and computer-readable recording medium for performing machine learning-based observation level measurement using server system log and performing risk calculation using the same | |
US20200311486A1 (en) | Testing bias checkers | |
KR101588027B1 (ko) | 소프트웨어 현지화를 위한 테스트 케이스 생성 장치 및 방법 | |
KR20160064930A (ko) | 소스 코드의 오류 검출에 있어서 경보 유형 분류 방법, 이를 위한 컴퓨터 프로그램, 그 기록매체 | |
CN108885684A (zh) | 用于检测视频中的对象的方法和系统 | |
CN114746859A (zh) | 评价方法、评价程序以及信息处理装置 | |
Azzalini et al. | FAIR-DB: Function Al dependencies to discover data bias | |
US20210157831A1 (en) | Method and analytical engine for a semantic analysis of textual data | |
Khoshnevis et al. | Prioritizing ground‐motion validation metrics using semisupervised and supervised learning | |
US11016467B2 (en) | Method and system for sensing fine changes in processing/equipment measurement data | |
US9020268B2 (en) | Method and apparatus for annotating multimedia data in a computer-aided manner | |
US20220060487A1 (en) | Priority determination apparatus, priority determination method, and computer readable medium | |
Ryu et al. | Improving prediction robustness of VAB-SVM for cross-project defect prediction | |
KR20140054913A (ko) | 분산된 시스템을 위한 데이터 오류 처리 장치 및 방법 | |
US10733081B2 (en) | Automatically establishing significance of static analysis results | |
JP2016099688A (ja) | リスク評価方法およびリスク評価装置 | |
Ndenga et al. | Performance and cost-effectiveness of change burst metrics in predicting software faults |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20150227 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160420 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20161027 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20161228 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20161228 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200916 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220929 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20231026 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20241114 Start annual number: 9 End annual number: 9 |