KR20200010679A - 이질성 학습 기반의 정보 분류 장치 - Google Patents
이질성 학습 기반의 정보 분류 장치 Download PDFInfo
- Publication number
- KR20200010679A KR20200010679A KR1020180080271A KR20180080271A KR20200010679A KR 20200010679 A KR20200010679 A KR 20200010679A KR 1020180080271 A KR1020180080271 A KR 1020180080271A KR 20180080271 A KR20180080271 A KR 20180080271A KR 20200010679 A KR20200010679 A KR 20200010679A
- Authority
- KR
- South Korea
- Prior art keywords
- classification
- learning
- heterogeneous
- classification rule
- data
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 45
- 238000010200 validation analysis Methods 0.000 claims description 22
- 238000010801 machine learning Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 도 1에 있는 정보 분류 장치를 설명하는 블록도이다.
도 3은 도 1에 있는 정보 분류 장치에서 수행되는 정보 분류 과정을 설명하는 순서도이다.
도 4는 본 발명의 일 실시예에 따른 이질성 학습 기반의 정보 분류 장치의 전체적인 개요를 나타내는 도면이다.
도 5 및 6은 본 발명의 일 실시예에 따른 이질성 학습 기반의 정보 분류 장치에서 수행되는 데이터의 구조화 과정을 설명하는 도면이다.
도 7은 정보 분류 장치에서 수행되는 이질성 학습을 통해 이질성이 주입되는 과정의 일 실시예를 설명하는 예시도이다.
도 8은 정보 분류 장치에서 도 4의 타겟 데이터 A를 대상으로 분류 규칙을 적용한 결과와 복수의 예비후보 분류 규칙들 및 후보 분류 규칙의 일 실시예를 설명하는 예시도이다.
도 9는 본 발명의 일 실시예에 따른 이질성 학습 기반의 정보 분류 장치에서 사용되는 규칙 선별 알고리즘의 일 실시예를 설명하는 도면이다.
110: 프로세서 130: 메모리
150: 사용자 입출력부 170: 네트워크 입출력부
210: 지도학습 처리부 230: 이질성 학습 처리부
250: 분류 규칙 생성부 270: 제어부
Claims (10)
- 제1 지도학습용 학습 데이터 모집단을 통해 제1 분류 규칙을 생성하는 지도학습 처리부;
제2 지도학습용 학습 데이터 모집단을 통해 초기 분류 규칙을 생성하고 상기 초기 분류 규칙에 대해 이질성 학습 데이터를 주입하여 제2 분류 규칙을 생성하는 이질성 학습 처리부; 및
상기 제1 및 제2 분류 규칙들을 통해 생성된 적어도 하나의 후보 분류 규칙 중에서 최종 분류 규칙을 생성하는 분류 규칙 생성부를 포함하는 이질성 학습 기반의 정보 분류 장치.
- 제1항에 있어서, 상기 지도학습 처리부는
기계학습 알고리즘을 통해 상기 제1 지도학습용 학습 데이터 모집단에 포함된 학습 데이터를 학습하여 상기 제1 분류 규칙을 생성하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제1항에 있어서, 상기 이질성 학습 처리부는
미분류된 복수의 학습 데이터들로 구성된 N개의(상기 N은 자연수) 학습 데이터 모집단들을 상기 이질성 학습 데이터로서 주입하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제1항에 있어서, 상기 이질성 학습 처리부는
상기 초기 분류 규칙을 적용하여 상기 이질성 학습 데이터를 분류하고 분류 결과를 기초로 상기 이질성 학습 데이터를 선별하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제4항에 있어서, 상기 이질성 학습 처리부는
상기 제2 지도학습용 학습 데이터 모집단에 선별된 상기 이질성 학습 데이터를 추가하고 재학습을 통해 이질성 분류기를 생성하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제5항에 있어서, 상기 이질성 학습 처리부는
상기 이질성 분류기가 M개(상기 M은 자연수)인 경우 상기 M개의 이질성 분류기들의 분류 결과를 결합하여 상기 제2 분류 규칙을 생성하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제1항에 있어서, 상기 분류 규칙 생성부는
상기 제1 분류 규칙에 의한 예측값과 상기 제2 분류 규칙에 의한 예측값 간의 비교를 통해 상기 적어도 하나의 후보 분류 규칙을 생성하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제7항에 있어서, 상기 분류 규칙 생성부는
상기 예측값들 간의 차이에 관한 특정 임계값을 포함하는 복수의 예비후보 분류 규칙들을 생성하고 상기 복수의 예비후보 분류 규칙들 각각의 분류 정확도를 기초로 상기 적어도 하나의 후보 분류 규칙을 생성하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제1항에 있어서, 상기 분류 규칙 생성부는
상기 적어도 하나의 후보 분류 규칙에 대해 유효성 검증을 수행하고 상기 유효성 검증을 통과한 후보 분류 규칙을 기초로 상기 최종 분류 규칙을 생성하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
- 제9항에 있어서, 상기 분류 규칙 생성부는
유효성 검증용 데이터 모집단에 대해 상기 적어도 하나의 후보 분류 규칙을 적용하여 산출된 분류 정확도를 이용하여 상기 유효성 검증을 수행하는 것을 특징으로 하는 이질성 학습 기반의 정보 분류 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180080271A KR102115973B1 (ko) | 2018-07-11 | 2018-07-11 | 이질성 학습 기반의 정보 분류 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180080271A KR102115973B1 (ko) | 2018-07-11 | 2018-07-11 | 이질성 학습 기반의 정보 분류 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200010679A true KR20200010679A (ko) | 2020-01-31 |
KR102115973B1 KR102115973B1 (ko) | 2020-05-27 |
Family
ID=69369289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180080271A KR102115973B1 (ko) | 2018-07-11 | 2018-07-11 | 이질성 학습 기반의 정보 분류 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102115973B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102229381B1 (ko) * | 2020-10-26 | 2021-03-18 | 주식회사 웨이센 | Ai 예측 모델을 이용한 예측 결과의 학습 데이터 추가 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040038559A (ko) * | 2002-11-01 | 2004-05-08 | 한국전자통신연구원 | 텍스트 문서집합에서 반복학습을 통한 개체명 인식 및의미범주 분류 장치 및 그 방법 |
KR20060016933A (ko) | 2004-08-19 | 2006-02-23 | 함정우 | 문서분류장치 및 문서분류방법 |
US20160163210A1 (en) * | 2013-12-04 | 2016-06-09 | The Trustees Of The Stevens Institute Of Technolog | Automated Framework For Personalized Learning From Heterogeneous Data Repositories |
US20170221163A1 (en) * | 2014-07-31 | 2017-08-03 | Hewlett-Packard Development Company, L.P. | Create a heterogeneous learner group |
US20180024982A1 (en) * | 2016-07-22 | 2018-01-25 | International Business Machines Corporation | Real-time dynamic visual aid implementation based on context obtained from heterogeneous sources |
KR20180049642A (ko) * | 2016-11-03 | 2018-05-11 | 네모커머스(주) | 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템 |
-
2018
- 2018-07-11 KR KR1020180080271A patent/KR102115973B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040038559A (ko) * | 2002-11-01 | 2004-05-08 | 한국전자통신연구원 | 텍스트 문서집합에서 반복학습을 통한 개체명 인식 및의미범주 분류 장치 및 그 방법 |
KR20060016933A (ko) | 2004-08-19 | 2006-02-23 | 함정우 | 문서분류장치 및 문서분류방법 |
US20160163210A1 (en) * | 2013-12-04 | 2016-06-09 | The Trustees Of The Stevens Institute Of Technolog | Automated Framework For Personalized Learning From Heterogeneous Data Repositories |
US20170221163A1 (en) * | 2014-07-31 | 2017-08-03 | Hewlett-Packard Development Company, L.P. | Create a heterogeneous learner group |
US20180024982A1 (en) * | 2016-07-22 | 2018-01-25 | International Business Machines Corporation | Real-time dynamic visual aid implementation based on context obtained from heterogeneous sources |
KR20180049642A (ko) * | 2016-11-03 | 2018-05-11 | 네모커머스(주) | 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템 |
Non-Patent Citations (1)
Title |
---|
김다솜 외 1인, 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법론, Journal of Intelligence and Information 2016 December, vol.22, no.4, pp. 193-215. 1부.* * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102229381B1 (ko) * | 2020-10-26 | 2021-03-18 | 주식회사 웨이센 | Ai 예측 모델을 이용한 예측 결과의 학습 데이터 추가 방법 |
WO2022092672A1 (ko) * | 2020-10-26 | 2022-05-05 | 주식회사 웨이센 | Ai 예측 모델을 이용한 예측 결과의 학습 데이터 추가 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102115973B1 (ko) | 2020-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022100045A1 (zh) | 分类模型的训练方法、样本分类方法、装置和设备 | |
Rahman et al. | Classifying non-functional requirements using RNN variants for quality software development | |
Jia et al. | Improving the quality of explanations with local embedding perturbations | |
US11874863B2 (en) | Query expansion in information retrieval systems | |
US12073181B2 (en) | Systems and methods for natural language processing (NLP) model robustness determination | |
US12159112B2 (en) | Hierarchical machine learning architecture including master engine supported by distributed light-weight real-time edge engines | |
Balli et al. | Sentimental analysis of Twitter users from Turkish content with natural language processing | |
Gunaseelan et al. | Automatic extraction of segments from resumes using machine learning | |
US11887059B2 (en) | Apparatus and methods for creating a video record | |
Jeyakarthic et al. | Optimal bidirectional long short term memory based sentiment analysis with sarcasm detection and classification on twitter data | |
Xie et al. | Heterogeneous graph neural network via knowledge relations for fake news detection | |
Abdollahpour et al. | Image classification using ontology based improved visual words | |
CN114254622A (zh) | 一种意图识别方法和装置 | |
JP2020135689A (ja) | モデル学習システム、意図解釈システム、モデル学習方法およびモデル学習用プログラム | |
KR102115973B1 (ko) | 이질성 학습 기반의 정보 분류 장치 | |
KR102255600B1 (ko) | Gan을 이용한 문서형 악성코드 탐지 장치 및 방법 | |
CN112835798A (zh) | 聚类学习方法、测试步骤聚类方法及相关装置 | |
US11868313B1 (en) | Apparatus and method for generating an article | |
CN115270763B (zh) | 一种基于多数据库的风险控制方法 | |
Read et al. | Efficient multi-label classification for evolving data streams | |
Simanjuntak et al. | Research and Analysis of IndoBERT Hyperparameter Tuning in Fake News Detection | |
Li et al. | LogPS: A robust log sequential anomaly detection approach based on natural language processing | |
Wei et al. | Deep learning-based attribute optimization method for ABAC | |
Fatima | Deploying Transformer Models to Detect and Analyze Sponsored Content in Spotify Podcasts | |
KR102715898B1 (ko) | 데이터 분석을 위한 테이블 분석 처리 방법 및 그를 위한 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180711 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20191119 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200427 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200521 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200521 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230321 Start annual number: 4 End annual number: 4 |