KR20190061984A - 딥러닝을 이용한 분류코드 추천 시스템 - Google Patents
딥러닝을 이용한 분류코드 추천 시스템 Download PDFInfo
- Publication number
- KR20190061984A KR20190061984A KR1020170160920A KR20170160920A KR20190061984A KR 20190061984 A KR20190061984 A KR 20190061984A KR 1020170160920 A KR1020170160920 A KR 1020170160920A KR 20170160920 A KR20170160920 A KR 20170160920A KR 20190061984 A KR20190061984 A KR 20190061984A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- processing information
- module
- code
- processing
- Prior art date
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 claims description 48
- 238000007781 pre-processing Methods 0.000 claims description 31
- 238000010801 machine learning Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000007717 exclusion Effects 0.000 claims description 5
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 5
- 241000209094 Oryza Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 235000013599 spices Nutrition 0.000 description 3
- 240000002234 Allium sativum Species 0.000 description 2
- 230000000844 anti-bacterial effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 235000004611 garlic Nutrition 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G06F17/2755—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
또한, 분류코드 추천의 정확성, 신뢰성을 높일 수 있고, 통계 업무에서 딥러닝 기술 적용에 따른 투입 인력 감소 및 소요 예산 절감의 효과가 있다.
Description
A | 농업, 임업, 어업 |
A01 | 농업 |
A011 | 작물재배업 |
A0111 | 곡물 및 기타 식량작물 재배업 |
A01110 | 곡물 및 기타 식량작물 재배업 |
도 2는 전처리과정의 예들을 나타낸 도면이다.
도 3은 본 발명의 다른 실시예에 따른 딥러닝을 이용한 분류코드 추천 시스템의 블록도이다.
101 : 전처리모듈
103 : 사전데이터베이스부
105 : 기분석모듈
107 : 기계학습기반모듈
109 : 규칙체크모듈
TI : 텍스트정보
PP : 전처리과정
PI_1 : 제1처리정보
PI_2 : 제2처리정보
PI_3, 3_PI : 제3처리정보
DCI : 사전코드정보
CCI : 분류코드정보
SCI : 학습코드정보
Claims (6)
- 입력되는 텍스트정보(TI)를 전처리과정(PP)을 통해 제1처리정보(PI_1)로 변환하는 전처리모듈(101);
상기 전처리모듈(101)로부터 상기 제1처리정보(PI_1)를 입력받고, 기저장된 사전데이터베이스부(103)의 사전코드정보(DCI)와 비교하여, 상기 제1처리정보(PI_1)와 상기 사전코드정보(DCI)의 일치시, 상기 제1처리정보(PI_1)를 분류코드정보(CCI)로 출력하는 기분석모듈(105);
상기 제1처리정보(PI_1)와 상기 사전코드정보(DCI)의 불일치시, 상기 기분석모듈(105)로부터 상기 제1처리정보(PI_1)를 입력받고, 딥러닝을 통해 구축되어 저장된 학습코드정보(SCI)와 상기 제1처리정보(PI_1)를 비교하여, 상기 학습코드정보(SCI)와 상기 제1처리정보(PI_1)의 일치시, 상기 학습코드정보(SCI)를 제2처리정보(PI_2)로 출력하는 기계학습기반모듈(107); 및
상기 기계학습기반모듈(107)로부터 상기 제2처리정보(PI_2)를 입력받고, 포함 또는 제외 처리과정을 통해 제3처리정보(PI_3)를 생성하며, 상기 제3처리정보(PI_3)와 상기 사전데이터베이스부(103)의 상기 사전코드정보(DCI)를 비교하여, 상기 제3처리정보(PI_3)와 상기 사전코드정보(DCI)의 일치시, 상기 제3처리정보(PI_3)를 상기 분류코드정보(CCI)로 출력하는 규칙체크모듈(109);
을 포함하는 것을 특징으로 하는 딥러닝을 이용한 분류코드 추천 시스템. - 제 1 항에 있어서,
상기 전처리과정(PP)은,
특수문자제거과정, 정규화과정, 형태소분석을 이용한 자연어처리과정 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 딥러닝을 이용한 분류코드 추천 시스템. - 제 2 항에 있어서,
상기 사전코드정보(DCI)는,
정규식 re 모듈이 이용되어 정규식 문법에 기반하여 생성된 것을 특징으로 하는 딥러닝을 이용한 분류코드 추천 시스템. - 입력되는 텍스트정보(TI)를 전처리과정(PP)을 통해 제1처리정보(PI_1)로 변환하는 전처리모듈(101);
상기 전처리모듈(101)로부터 상기 제1처리정보(PI_1)를 입력받고, 기저장된 사전데이터베이스부(103)의 사전코드정보(DCI)와 비교하여, 상기 제1처리정보(PI_1)와 상기 사전코드정보(DCI)의 일치시, 상기 제1처리정보(PI_1)를 분류코드정보(CCI)로 출력하는 기분석모듈(105);
상기 제1처리정보(PI_1)와 상기 사전코드정보(DCI)의 불일치시, 상기 기분석모듈(105)로부터 상기 제1처리정보(PI_1)를 입력받고, 딥러닝을 통해 구축되어 저장된 학습코드정보(SCI)와 상기 제1처리정보(PI_1)를 비교하여, 상기 학습코드정보(SCI)와 상기 제1처리정보(PI_1)의 일치시, 상기 학습코드정보(SCI)를 제2처리정보(PI_2)로 출력하는 기계학습기반모듈(107); 및
상기 기계학습기반모듈(107)로부터 상기 제2처리정보(PI_2)를 입력받고, 상기 제2처리정보(PI_2)를 기저장된 텍스트빈도정보(TFI) 또는 코드빈도정보(CFI)를 기반으로 매칭하여 제3처리정보(3_PI)를 생성하며, 생성된 상기 제3처리정보(3_PI)를 상기 분류코드정보(CCI)로 출력하는 통계기반모듈(301);
을 포함하는 것을 특징으로 하는 딥러닝을 이용한 분류코드 추천 시스템. - 제 4 항에 있어서,
상기 전처리과정(PP)은,
특수문자제거과정, 정규화과정, 형태소분석을 이용한 자연어처리과정 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 딥러닝을 이용한 분류코드 추천 시스템. - 제 5 항에 있어서,
상기 사전코드정보(DCI)는,
정규식 re 모듈이 이용되어 정규식 문법에 기반하여 생성된 것을 특징으로 하는 딥러닝을 이용한 분류코드 추천 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170160920A KR20190061984A (ko) | 2017-11-28 | 2017-11-28 | 딥러닝을 이용한 분류코드 추천 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170160920A KR20190061984A (ko) | 2017-11-28 | 2017-11-28 | 딥러닝을 이용한 분류코드 추천 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190061984A true KR20190061984A (ko) | 2019-06-05 |
Family
ID=66844898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170160920A KR20190061984A (ko) | 2017-11-28 | 2017-11-28 | 딥러닝을 이용한 분류코드 추천 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20190061984A (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102145698B1 (ko) * | 2019-09-27 | 2020-08-18 | 주식회사 인피니그루 | 딥러닝 모델을 통해 예측된 해답을 해석하는 방법 및 시스템 |
WO2021040354A1 (ko) * | 2019-08-23 | 2021-03-04 | 주식회사 세진마인드 | 신경망을 이용한 데이터 처리 방법 |
KR20220003819A (ko) * | 2020-07-02 | 2022-01-11 | 주식회사 에프에스 | 산업 직업 코드분류 시스템 및 그 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000050214A (ko) | 2000-05-26 | 2000-08-05 | 김환식 | 산업정보 등록 방법, 검색 방법, 그리고 이에 적합한 장치 |
-
2017
- 2017-11-28 KR KR1020170160920A patent/KR20190061984A/ko not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000050214A (ko) | 2000-05-26 | 2000-08-05 | 김환식 | 산업정보 등록 방법, 검색 방법, 그리고 이에 적합한 장치 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021040354A1 (ko) * | 2019-08-23 | 2021-03-04 | 주식회사 세진마인드 | 신경망을 이용한 데이터 처리 방법 |
KR102145698B1 (ko) * | 2019-09-27 | 2020-08-18 | 주식회사 인피니그루 | 딥러닝 모델을 통해 예측된 해답을 해석하는 방법 및 시스템 |
KR20220003819A (ko) * | 2020-07-02 | 2022-01-11 | 주식회사 에프에스 | 산업 직업 코드분류 시스템 및 그 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11704325B2 (en) | Systems and methods for automatic clustering and canonical designation of related data in various data structures | |
Rabuzin et al. | Prediction of Public Procurement Corruption Indices using Machine Learning Methods. | |
CN110276382B (zh) | 基于谱聚类的人群分类方法、装置及介质 | |
US10387805B2 (en) | System and method for ranking news feeds | |
US11966698B2 (en) | System and method for automatically tagging customer messages using artificial intelligence models | |
CN110990529B (zh) | 企业的行业明细划分方法及系统 | |
CN113051291A (zh) | 工单信息的处理方法、装置、设备及存储介质 | |
CN109902179A (zh) | 基于自然语言处理的筛选电商垃圾评论的方法 | |
KR20190061984A (ko) | 딥러닝을 이용한 분류코드 추천 시스템 | |
CN110689371B (zh) | 一种基于ai和大数据的智能营销云服务平台 | |
US20180025428A1 (en) | Methods and systems for analyzing financial risk factors for companies within an industry | |
CN114462556A (zh) | 企业关联产业链分类方法、训练方法、装置、设备和介质 | |
CN108509588B (zh) | 一种基于大数据的律师评估方法及推荐方法 | |
Shanmugalingam et al. | Corporate it-support help-desk process hybrid-automation solution with machine learning approach | |
CN112513901A (zh) | 使用人工神经网络来从给定文本中查找唯一协调制度代码的方法和用于实现该方法的系统 | |
CN115577172A (zh) | 物品推荐方法、装置、设备及介质 | |
CN105373568B (zh) | 问题答案自动学习方法和装置 | |
Caron et al. | Identification of organization name variants in large databases using rule-based scoring and clustering: With a case study on the web of science database | |
Romanov et al. | Research of neural networks application efficiency in automatic scientific articles classification according to UDC | |
WO2016059505A1 (en) | A system and a method for recognition of aerospace parts in unstructured text | |
Alan | Bibliometric Analysis of Public Relations Research Literature | |
CN115907706A (zh) | 一种定向招聘智能匹配推荐和自动化审核系统 | |
Thida | Automated analysis of job market demands using large language model | |
CN113743902A (zh) | 基于人工智能的信息审核方法、装置、终端设备及介质 | |
El-Khchine et al. | Machine Learning for Supply Chain’s Big Data: State of the art and application to Social Networks’ data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20171128 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190110 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20190909 Patent event code: PE09021S02D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20200409 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20190909 Comment text: Final Notice of Reason for Refusal Patent event code: PE06011S02I Patent event date: 20190110 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |