KR20190091011A - 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 - Google Patents
민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 Download PDFInfo
- Publication number
- KR20190091011A KR20190091011A KR1020180009927A KR20180009927A KR20190091011A KR 20190091011 A KR20190091011 A KR 20190091011A KR 1020180009927 A KR1020180009927 A KR 1020180009927A KR 20180009927 A KR20180009927 A KR 20180009927A KR 20190091011 A KR20190091011 A KR 20190091011A
- Authority
- KR
- South Korea
- Prior art keywords
- increase rate
- frequency
- word
- extracting
- issue
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 29
- 238000003058 natural language processing Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 4
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G06Q50/30—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출방법에 관한 것이다.
본 발명의 민원 이슈어 분석 추출 시스템은 복수 개의 민원이 게시되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 수집부 및 수집부에서 단어를 수신하여, 단어의 특징을 추출하는 자연어처리부, 자연어처리부에서 추출된 단어의 출현빈도를 추출하고, 추출된 출현빈도의 증가율을 추출하는 빈도추출부 및 증가율이 기준증가율과 비교하여, 증가율이 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하는 이슈어설정부를 포함한다.
또한, 민원 이슈어 분석 추출 방법은 복수 개의 민원이 기재되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계, 단어로부터 단어의 특징 및 정보를 추출하는 (B)단계, 설정기간 내에 수집된 단어의 출현빈도를 추출하는 (C)단계, 설정기간 내의 출현빈도의 증가율을 추출하고, 증가율을 기준증가율과 비교하는 (D)단계 및 증가율이 기준증가율 이상이 되면, 단어를 이슈어로 설정하는 (E)를 포함한다.
본 발명의 민원 이슈어 분석 추출 시스템은 복수 개의 민원이 게시되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 수집부 및 수집부에서 단어를 수신하여, 단어의 특징을 추출하는 자연어처리부, 자연어처리부에서 추출된 단어의 출현빈도를 추출하고, 추출된 출현빈도의 증가율을 추출하는 빈도추출부 및 증가율이 기준증가율과 비교하여, 증가율이 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하는 이슈어설정부를 포함한다.
또한, 민원 이슈어 분석 추출 방법은 복수 개의 민원이 기재되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계, 단어로부터 단어의 특징 및 정보를 추출하는 (B)단계, 설정기간 내에 수집된 단어의 출현빈도를 추출하는 (C)단계, 설정기간 내의 출현빈도의 증가율을 추출하고, 증가율을 기준증가율과 비교하는 (D)단계 및 증가율이 기준증가율 이상이 되면, 단어를 이슈어로 설정하는 (E)를 포함한다.
Description
본 발명은 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출방법에 관한 기술이다. 더욱 상세하게는 게시판에 올라온 민원 단어를 데이터 마이닝 기법으로 분석하여, 민원 게시 글을 보다 정확하고 빠르게 분석할 수 있는 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법에 관한 기술이다.
공공기관, 지자체 및 서비스를 제공하는 회사들은 고객들의 요청 사항 및 불만을 파악하고자 민원 게시판을 운영하고 있다.
현재, 공공기관 및 회사들은 민원 게시판을 통해 고객들의 불만, 문의 사항을 접수하여 민원 담당자가 접수된 사항을 읽은 후, 각 사항에 답변을 달아주는 방식으로 민원 게시판을 운영하고 있다.
그러나 민원 게시판을 올라오는 민원 수는 점차 증가하는 반면, 민원을 해결하거나 조언을 주는 담당자들은 민원 수에 맞춰 증원되지 못하고 있다. 이에, 많은 민원이 신속하게 처리되지 못하는 문제가 있다. 아울러, 민원 처리 담당자가 부족하게 되면서 한 분야의 전문 인력이 다른 분야의 민원까지 해결하고 있다.
어느 한 명의 담당자가 자신의 전문 분야가 아닌 분야의 민원에 대해 그 분야의 전문 분야인 담당자 수준의 민원 해결방안을 제시하지 못하고 있다. 이에 따라, 많은 민원에 양질의 답변 및 일관성 있는 답변이 제시되지 못하는 문제가 있다.
본 발명이 이루고자 하는 기술적 과제는 이러한 문제점을 해결하기 위한 것으로서, 특정기간 동안 민원 게시판에 게시된 글의 단어를 분석하여 게시 글의 주제를 파악해 게시 글을 분류하고 분류된 글을 각 분야의 전문 담당자에게 전달할 수 있도록 하고자 한다.
그리고 분류된 글에 담당자가 답변한 글을 저장한 후, 추후 동일한 게시 글이 올라올 경우 담당자가 답변한 글을 하나의 해결방안으로 담당자에게 추천해주고자 한다.
또한, 특정기간 동안 설정된 이슈어에 가중치를 부여해, 이슈어를 순위화하여 우선적으로 처리해야 할 민원을 담당자에게 알려줌으로써, 담당자가 민원 해결을 보다 효율적으로 할 수 있도록 한다.
본 발명의 기술적 과제는 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 달성하기 위한 본 발명은 복수 개의 민원이 게시되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 수집부;
상기 수집부에서 상기 단어를 수신하여, 상기 단어의 특징을 추출하는 자연어처리부;
상기 자연어처리부에서 추출된 상기 단어의 출현빈도를 추출하고, 상기 설정기간 이전의 과거기간 대비 추출된 상기 출현빈도의 증가율을 추출하는 빈도추출부; 및
상기 증가율이 상기 기준증가율과 비교하여, 상기 증가율이 상기 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하는 이슈어설정부를 포함한다.
상기 빈도추출부는 추출된 상기 증가율을 상기 단어의 빈도수에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 비교하여, 복수 개의 빈발수준등급을 추출할 수 있다.
상기 이슈어설정부는 상기 출현빈도의 증가율과 상기 과거기간에서 추출되는 과거출현빈도의 증가율을 비교하여, 상기 출현빈도의 증가율과 상기 과거출현빈도의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율과 상기 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산할 수 있다.
상기 이슈어설정부는 상기 제2가중치가 부여되는 상기 출현빈도의 증가율 가운데, 상기 출현빈도의 증가율이 가장 큰 단어를 상기 민원의 대표이슈어로 설정할 수 있다.
상기 이슈어설정부는 상기 이슈어를 저장하는 이슈어 데이터 베이스를 더 포함하고, 상기 이슈어 데이터 베이스에 저장되어 있는 이슈어와 설정기간 내에 저장되는 상기 이슈어를 매칭시킬 수 있다.
상기 민원 게시판은 관리자가 읽을 수 있도록 민원을 출력하고, 상기 관리자에 의해 상기 이슈어가 추가될 수 있다.
또한, 상기 기술적 과제를 달성하기 위한 본 발명의 민원 이슈어 분석 추출 방법은 복수 개의 민원이 기재되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계, 상기 단어로부터 단어의 특징을 추출하는 (B)단계, 상기 설정기간 내에 수집된 상기 단어의 출현빈도를 추출하는 (C)단계, 상기 설정기간 내의 상기 출현빈도의 증가율을 추출하고, 상기 증가율을 기준증가율과 비교하는 (D)단계 및 상기 증가율이 기준증가율 이상이 되면, 상기 단어를 이슈어로 설정하는 (E)를 포함한다.
상기 (D)단계는 추출된 상기 출현빈도의 증가율을 상기 단어의 빈도에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 대비하여, 복수 개의 빈발수준등급을 추출하는 (D-1)단계를 포함할 수 있다.
상기 (D)단계에서 추출되는 상기 출현빈도의 증가율은 상기 설정기간 이전인 과거기간에서 추출되는 과거출현빈도의 증가율과 비교하여, 상기 출현빈도의 증가율과 상기 과거출현빈도의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율과 상기 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산하여 상기 단어를 이슈어로 설정할 수 있다.
상기 (E)단계 이후, 이슈어 데이터 베이스에 상기 이슈어를 저장하는 (E-1)단계를 포함할 수 있다.
상기 (E)단계 이후, 상기 단어의 출현빈도가 가장 높은 이슈어를 상기 민원의 대표이슈어로 설정하는 (E-2)단계를 포함할 수 있다.
상기 (E-2)단계 이후, 관리자가 상기 대표이슈어의 민원에 답변을 기재하는 (F) 단계 및 상기 (F)단계를 상기 이슈어 데이터 베이스에 저장한 후, 상기 설정기간 이후에 상기 대표이슈어와 매칭되는 민원의 대표이슈어가 추출되면 저장된 상기 대표이슈어의 답변을 검색하는 (F-1)단계 를 포함할 수 있다.
상기 (E)단계 이후, 상기 이슈어를 추출된 상기 문자의 빈도 순으로 정렬하는 (E-3)단계를 포함할 수 있다.
본 발명에 따른 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법은 특정기간 동안 민원 게시판에 게시된 글의 단어를 분석해, 주별로 글을 분류하여 담당자에게 전달할 수 있다. 그리고 추후 동일한 게시글이 올라올 경우 이를 하나의 해결방안으로 담당자에게 추천할 수도 있다. 또한, 게시글의 핵심이 되는 단어에 가중치를 부여해, 게시글을 순위화하여 우선적으로 처리해야 할 민원을 신속하게 담당자에게 전달할 수 있다.
도 1은 본 발명의 일 실시예에 따른 민원 이슈어 분석 추출 시스템에 대한 블록도이다.
도 2는 도 1의 빈도순위, 출현 키워드, 키워드 빈도 및 기간대비 증가율이 나타난 목록 표이다.
도 3은 도1의 신규 민원 목록을 나타낸 목록 표이다.
도 4 및 도 5는 도 1의 민원 이슈어 분석 추출 시스템이 추출단어에 가중치를 부여하거나 부여하지 않은 과정을 나타낸 도면이다.
도 6은 본 발명의 일 실시예의 따른 민원 이슈어 분석 추출 방법의 순서도이다.
도 2는 도 1의 빈도순위, 출현 키워드, 키워드 빈도 및 기간대비 증가율이 나타난 목록 표이다.
도 3은 도1의 신규 민원 목록을 나타낸 목록 표이다.
도 4 및 도 5는 도 1의 민원 이슈어 분석 추출 시스템이 추출단어에 가중치를 부여하거나 부여하지 않은 과정을 나타낸 도면이다.
도 6은 본 발명의 일 실시예의 따른 민원 이슈어 분석 추출 방법의 순서도이다.
본 발명의 이점 및 특징 그리고 그것들을 달성하기 위한 방법들은 첨부되는 도면과 함께 상세하게 후술 되어 있는 실시 예를 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예는 본 발명의 개시가 완전하도록 하고 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다.
본 발명의 청구범위는 청구항을 비롯해 청구항을 뒷받침하는 설명에 의해 정의될 수 있다. 아울러, 명세서 전체에 걸쳐 동일 참조부호는 동일 구성요소를 지칭한다.
본 명세서 전체에 걸쳐 기술되는 민원 이슈어 분석 추출 시스템에 대한 모든 설명은 민원 이슈어 분석 추출방법에 그대로 적용될 수 있다.
본 명세서상에서 설명이 간결하고 명확해 질 수 있도록 민원 이슈어 분석 시스템에 대해 상세히 설명한 후, 이를 바탕으로 민원 이슈어 분석 추출방법에 대해 설명한다.
먼저, 본 발명의 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출방법을 설명 하기 앞서, 본 명세서상에 기술된 단어는 온라인상에 형성된 민원 게시판에 기재된 글 가운데서 자립하여 쓰일 수 있거나 따로 떨어져서 문법적 기능을 가지는 언어의 최소 기본 어휘를 의미한다.
일례로, 단어는“민원 이슈어 분석 추출 시스템”이 라는 문장에서 자립적으로 쓸 수 있는‘민원’,‘이슈어’,‘분석’,‘추출’ 및‘시스템’이 될 수 있다.
이하, 도 1 내지 도 3을 참조하여, 본 발명의 민원 이슈어 분석 추출 시스템에 대해 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 민원 이슈어 분석 추출 시스템에 대한 블록도이고, 도 2는 도 1의 빈도순위, 출현 키워드, 키워드 빈도 및 기간대비 증가율이 나타난 목록 표이고, 도 3은 도 1의 신규 민원 목록을 나타낸 목록 표이다.
민원 이슈어 분석 추출 시스템(1)은 담당자 및 관리자(M)가 설정한 일정기간 동안 민원 게시판(50)에 게시된 글의 단어를 수집부(10)에서 수집하고, 자연어처리부(20)에서 수집된 단어를 분석하여 게시된 글의 주제를 파악한다. 그리고 빈도추출부(30)에서 분석된 단어의 빈도횟수를 산출하고, 이슈어설정부(40)에서 산출된 빈도수를 고려해 이슈어(I.W)로 설정하고, 설정된 이슈어(I.W)를 각 민원의 대표이슈어(I.W)로 설정한 후, 글을 이슈별로 분류하여 각 민원의 관리자에게 전달한다.
또한, 민원 이슈어 분석 추출 시스템(1)은 관리자가 처리한 민원의 해결방안을 저장한 후, 추후 동일한 민원 게시글이 올라올 경우 앞서 해결 방안으로 제시한 답글을 하나의 해결 방안으로 관리자(M)에게 추천할 수도 있다.
또한, 민원 이슈어 분석 추출 시스템(1)은 이슈어(I.W)에 가중치를 부여하여 민원 게시판에 올라온 많은 게시글을 순위화하여, 관리자가 우선적으로 처리해야 할 민원을 신속히 파악할 수 있도록 한다.
이와 같은 본 발명의 일 실시예에 따른 민원 이슈어 분석 추출 시스템(1)은 수집부(10), 자연어처리부(20), 빈도추출부(30) 및 이슈어설정부(40) 등을 구성요소로 포함한다. 이하, 본 발명의 구성요소들에 대해 구체적으로 설명한다.
수집부(10)는 복수 개의 민원이 게시되는 민원 게시판(50)에서 관리자가 설정한 설정기간 동안에 기재된 민원 글의 단어를 수집한다.
여기서, 민원 게시판(50)은 고객불만 사항을 접수하여, 관리자가 불만 사항 처리를 완료될 때까지 고객에게 처리 사항을 실시간으로 보여줄 수 있는 응용 어플리케이션이 된다. 이러한 민원 게시판(50)은 관리자(M)에 의해 후술할 이슈어(I.W)가 추가되거나 삭제되며, 출력되는 민원의 목록 순서가 변경 가능하게 하는 응용 어플리케이션으로 형성될 수도 있다.
수집부(10)는 단어를 수집한 후 자연어처리부(20)로 전송한다. 자연어처리부(Natural Language Processing, 20)는 수집부(10)에서 단어를 수신하여 단어의 특징을 추출한다. 이때, 자연어처리부(20)가 단어의 특징을 추출한다 함은 컴퓨터가 사람의 일상생활 언어를 형태 분석, 의미 분석, 대회 분석 등을 통하여 컴퓨터가 처리하여 단어의 의미를 추출하는 것을 의미한다. 일례로, 자연어처리부(20)는 여진이라는 단어로부터 여진에 숨겨져 있는 유용한 상관관계를 가진 단어인 지진, 붕괴, 재해 등을 추출할 수 있다.
자연어처리부(20)는 수집된 단어와 상관관계를 가진 단어를 추출해 빈도추출부(30)로 전달한다.
빈도추출부(30)는 자연어처리부(20)에서 추출된 단어의 출현빈도를 추출한다. 아울러, 빈도추출부(30)는 추출된 출현빈도를 설정기간 이전의 과거기간으로부터 얼마나 증가했는지를 파악한다. 즉, 빈도추출부(30)는 출현빈도의 증가율을 추출한다.
이러한 빈도추출부(30)는 추출된 출현빈도의 증가율을 단어의 빈도수에 곱 연산하여 빈발수준값을 추출한다. 그리고 빈발수준값을 빈발수준기준값과 비교하여, 복수 개의 빈발수준등급을 추출할 수 있다.
일례로, 도 2에 도시된 바와 같이, 빈도추출부(30)는 설정기간인 2018년 07월 01일부터 2018년 07월 31일까지 자연어처리부(20)에서 전달된 단어 즉, ‘여진’,‘화재’,‘금융자사’,‘담보’ 및‘전력’의 빈도수를 계산한다. 이때, 빈도추출부(30)는 여진의 빈도수를 100, 화재의 빈도수를 21, 금융자산의 빈도 수를 19, 담보의 빈도수를 17 및 전력의 빈도수를 15로 산출하고, 산출된 빈도수를 오름차순으로 정렬시켜 출현 단어를 나타낼 수 있다.
또한, 빈도추출부(30)는 각 단어가 동일 년 지난달 또는 동일 년 지난날 대비 얼마나 많이 증가하였는지를 출현빈도의 증가율 그리고 증가율 추세를 막대 그래프로 나타낼 수 있다. 아울러, 빈발 출현 되는 수준을 등급으로 나타낼 수 있다.
보다 구체적으로 빈도추출부(30)는 추출된 증가율에 단어의 빈도수를 곱 연산하여 빈발수준값을 추출하고, 빈발수준값과 관리자가 설정한 빈발수준기준값을 비교한다. 이때, 빈도추출부(30)는 빈발수준값이 빈발수준기준값 보다 크되, 빈발수준값이 빈발수준기준값 보다 20% 이상 클 때에는 빈발수준 등급을 ‘심각’을 의미하는 빨간색 동그라미로 나타낼 수 있고, 빈발수준값이 빈발수준기준값 보다 10% 이상 클 때, 빈발수준 등급을‘경계’를 의미하는 주황색 동그라미로 나타낼 수 있다.
여기서, 기재된 20% 및 10%는 하나의 예시일 뿐, 이러한 값으로 한정되는 아니며, 관리자가 빈발수준기준값과 함께 얼마든지 다른 값으로 조정할 수 있다.
또한, 빈도추출부(30)는 빈발수준값이 빈발수준값과 동일할 때 빈발수준 등급을 ‘보통’을 의미하는 초록색 동그라미로 나타낼 수 있고, 빈발수준값이 빈발수준값 이하일 때, 빈발수준등급을 ‘낮음’을 의미하는 노란색 동그라미로 나타낼 수 있다.
이와 같이, 빈도추출부(30)는 출현빈도, 출현빈도의 증가율 및 빈발 출현 되는 수준 등급을 한 화면에 출력하여 관리자가 많은 민원을 쉽게 파악할 수 있도록 한다.
이슈어설정부(40)는 단어의 출현빈도의 증가율을 기준증가율과 비교하고, 비교값에 따라 단어에 가중치를 부여해 단어를 이슈어로 설정한다.
이슈어설정부(40)에 대해 보다 구체적으로 설명하면, 이슈어설정부(40)는 출현빈도의 증가율과 과거기간에서 추출되는 과거출현빈도의 증가율을 비교한다. 이때, 이슈어설정부(40)는 출현빈도의 증가율과 과거출현빈도의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 출현빈도의 증가율에 곱 연산한다.
반면, 출현빈도의 증가율과 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 제1가중치보다 큰 값을 갖는 제2가중치를 출현빈도의 증가율에 곱 연산한다. 여기서 제1가중치는 자연수 1이 될 수 있고, 제2가중치는 자연수 1보다 큰 수가 될 수 있다.
이러한 이슈어설정부(40)에 대한 이러한 특징에 대해서는 도 4 및 도 5를 설명할 때 구체적으로 설명하도록 한다.
이슈어설정부(40)는 제2가중치가 부여되는 단어 가운데 출현빈도의 증가율이 가장 높은 단어를 민원의 대표이슈어(M.I.W)로 설정할 수 있다. 이러한 이슈어설정부(40)는 도 3에 도시된 바와 같이, 각 민원의 제목에 대표이슈어(M.I.W)를 달아 관리자(M)가 쉽게 민원을 파악할 수 있도록 한다.
또한, 이슈어설정부(40)는 이슈어 데이터 베이스(41)를 포함하여, 설정된 이슈어 및 관리자가 민원에 답변한 답글을 저장한다. 이러한 이슈어설정부(40)는 이슈어 데이터 베이스(41)에 저장되어 있는 이슈어와 설정기간 내에 저장되는 이슈어를 매칭시킨 후, 전에 관리자가 답변한 민원의 답글을 관리자에게 제공할 수 있다.
관리자는 이슈어설정부(40)에서 제공되는 답글을 통해, 반복적으로 올라오는 민원에 신속하면서도 일관성 있는 답변을 제공할 수 있게 된다.
이하, 도 4 및 도 5를 참조하여, 이슈어설정부가 단어에 어떠한 가중치가 부여되는지에 대해 구체적으로 설명한다.
도 4 및 도 5는 도 1의 민원 이슈어 분석 추출 시스템이 추출단어에 가중치를 부여하거나 부여하지 않은 과정을 나타낸 도면이다.
이슈어설정부(40)는 설정기간 내에 출현한 단어의 출현빈도의 증가율과 과거기간에서 추출되는 과거출현빈도의 증가율을 비교하며, 단어가 이슈어가 되는지 안 되는지를 결정한다. 일례로, 이슈어설정부(40)는 2018년 07월 01일부터 2018년 07월 31일까지 출현 된 전력(I.W)이라는 단어의 이전달 대비 증가율(현재의 증가율)을 추출하면, 추출된 증가율을 전년도 즉, 2017년 07월 01일부터 2017년 07월 31일까지 출현 된 전력(P.W1)이라는 단어의 이전 대비 증가율(제1과거의 증가율) 그리고, 2016년 07월 01일부터 2016년 07월 31일까지 출현 된 전력(P.W2)이라는 단어의 이전 대비 증가율(제2 과거의 증가율)을 비교한다.
이때, 이슈어설정부(40)는 현재의 증가율이 제1과거의 증가율과 제2과거의 증가율과 기준범위 내에서 매칭되면, 전력이라는 단어는 통상적으로 매년 07월01부터 07월31일까지는 매년 많이 출현하는 단어라고 판단하여 현재의 증가율의 단어에 제1가중치를 부여한다.
반면, 이슈어설정부(40)는 2018년 07월 01일부터 2018년 07월 31일까지 출현된 여진(I.W)이라는 단어의 이전달 대비 증가율(현재의 증가율)을 추출하면, 추출된 증가율을 전년도 즉, 2017년 07월 01일부터 2017년 07월 31일까지 출현 된 여진(P.W1)이라는 단어의 이전 대비 증가율(제1과거의 증가율) 그리고, 2016년 07월 01일부터 2016년 07월 31일까지 출현 된 여진(P.W2)이라는 단어의 이전 대비 증가율(제2 과거의 증가율)과 비교한다.
이때, 이슈어설정부(40)는 현재의 증가율이 제1과거의 증가율 및 제2과거의 증가율이 기준범위 내에서 매칭되지 않으면, 여진이라는 단어는 우선순위로 해결해야 할 민원의 단어라고 판단하여 현재의 증가율의 단어에 제2가중치를 부여한다. 그리고 이러한 단어를 대표이슈어로 설정한다. 여기서, 기준범위는 현재의 증가율과 과거의 증가율 간 비교 차가 ±5%가 되는 범위가 될 수 있다.
다만, 이러한 기준범위는 ±5%로 한정되는 것은 아니며 관리자에 의해 얼마든지 다른 값으로 변경될 수 있다.
이하, 지금까지 설명한 일 실시예의 민원 이슈어 분석 추출시스템(1)에 대한 설명을 바탕으로 본 발명의 일 실시예에 민원 이슈어 분석 추출방법에 대해 상세히 설명한다. 민원 이슈어 분석 추출방법은 도 6의 순서도를 기준으로 한다.
도 6은 본 발명의 일 실시예의 따른 민원 이슈어 분석 추출 방법의 순서도이다.
도 6을 참조하면, 본 발명의 민원 이슈어 분석 추출 방법은 민원 게시판(50)에 기재된 민원의 단어를 수집하는 (A)단계(S110), 민원의 단어로부터 단어의 특징을 추출하는 (B)단계 즉, 자연어 처리하는 단계(S120), 수집된 단어의 출현빈도를 추출하는 (C)단계(S130), 출현빈도의 증가율을 추출하고, 추출된 증가율을 기준증가율과 비교하는 (D)단계(S140) 및 추출된 증가율이 기준증가율 이상이 되면, 단어를 이슈어로 도출하는 (E) 단계(S150)를 주요 단계로 포함한다.
이와 같은 주요 단계 그리고 주요 단계를 연결하는 세부 단계들에 대해 좀 더 구체적으로 설명한다.
민원 이슈어 분석 추출 방법은 복수 개의 민원이 기재되는 민원 게시판에 설정기간 동안 게시된 민원의 단어를 수집하는 (A)단계(S110)로 시작한다. 이후, 수집된 단어의 특징을 추출하는 (B)단계(S120)와 수집된 단어의 출현빈도를 추출하는 (C)단계(S130)를 진행한다. 이후, 출현빈도의 증가율을 추출하고, 추출된 증가율을 기준증가율과 비교하는 (D)단계(S140)를 진행한다.
민원 이슈어 분석 추출 방법은 (D)단계에서 추출된 출현빈도의 증가율을 단어의 빈도에 곱 연산하여 빈발수준값을 추출하는 단계 및 빈발수준값을 빈발수준기준값과 비교하여, 복수 개의 빈발수준등급을 추출하는 단계(S141)를 진행할 수 있다.
또한, 민원 이슈어 분석 추출 방법은 추출되는 출현빈도의 증가율을 설정기간 이전인 과거기간에서 추출되는 과거출현빈도의 증가율과 비교한다.
출현빈도의 증가율과 과거출현빈도의 증가율을 비교하여, 비교 값이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 출현빈도의 증가율에 곱 연산하는 단계 및 출현빈도의 증가율과 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 제1가중치보다 큰 값을 갖는 제2가중치를 출현빈도의 증가율에 곱 연산하는 단계를 진행할 수 있다.
이후, 민원 이슈어 분석 추출 방법은 가중치가 부여된 단어를 민원의 대표이슈어로 설정하는 (E)단계(S160)를 진행한다.
민원 이슈어 분석 추출 방법은 (E) 단계와 동시에, 이슈어 데이터 베이스에 이슈어를 저장하는 (E-1)단계(S151)를 진행할 수 있다.
이때, 민원 이슈어 분석 추출 방법은 대표이슈어의 출현빈도가 높은 순으로 민원을 정렬하는 단계를 진행할 수도 있다.
또한, 민원 이슈어 분석 추출 방법은 (E)단계 이후, 관리자가 민원을 읽어보면 민원에 대표이슈어를 추가 및 변경할 수 있는 단계(S170)를 진행할 수 있고, 이러한 단계 이후 민원에 답변을 기재하는 (F)단계(S180)를 진행될 수 있다.
민원 이슈어 분석 추출 방법은 (F)단계 이후, 대표이슈어를 설정기간 이후에 저장되는 대표이슈어와 매칭 하여 저장되어 있는 민원의 답변을 검색하여 관리자에게 보여주는 (F-1)단계(S190)를 진행할 수 있다.
이와 같은 일련의 단계를 통해, 민원 이슈어 분석 추출 방법은 특정기간 동안 민원 게시판에 게시된 글의 단어를 분석해, 주제별로 글을 분류하여 담당자 즉, 관리자에게 전달할 수 있다.
그리고 추후 동일한 게시 글이 올라올 경우 이를 하나의 해결방안으로 관리자에게 추천할 수도 있다. 또한, 게시 글의 핵심이 되는 대표이슈어에 가중치를 부여해, 게시 글을 순위화하여 관리자가 우선적으로 처리해야 할 민원을 제공함으로써, 관리자의 업무효율을 향상시킬 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시 예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야 한다.
1: 민원 이슈어 분석 추출 시스템
10: 수집부 20: 자연어처리부
30: 빈도추출부 40: 이슈어설정부
41: 이슈어 데이터 베이스 50: 민원 게시판
M: 관리자
I.W: 이슈어 M.I.W: 대표이슈어
W1: 제1가중치 W2: 제2가중치
10: 수집부 20: 자연어처리부
30: 빈도추출부 40: 이슈어설정부
41: 이슈어 데이터 베이스 50: 민원 게시판
M: 관리자
I.W: 이슈어 M.I.W: 대표이슈어
W1: 제1가중치 W2: 제2가중치
Claims (8)
- 복수 개의 민원이 게시되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 수집부;
상기 수집부에서 상기 단어를 수신하여, 상기 단어의 특징을 추출하는 자연어처리부;
상기 자연어처리부에서 추출된 상기 단어의 출현빈도를 추출하고, 상기 설정기간과 상기 설정기간 이전의 상기 설정기간과 동일한 기간의 과거기간 대비 추출된 상기 출현빈도의 증가율을 추출하는 빈도추출부;
상기 증가율을 기준증가율과 비교하여, 상기 증가율이 상기 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하는 이슈어설정부를 포함하는 민원 이슈어 분석 추출 시스템. - 제1항에 있어서,
상기 빈도추출부는 추출된 상기 증가율을 상기 단어의 빈도수에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 비교하여, 복수 개의 빈발수준등급을 추출하는 민원 이슈어 분석 추출 시스템. - 제1항에 있어서,
상기 이슈어설정부는 상기 출현빈도의 증가율과 상기 과거기간에서 추출되는 과거출현빈도의 증가율을 비교하여, 상기 출현빈도의 증가율과 상기 과거출현빈도의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율과 상기 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산하는 민원 이슈어 분석 추출 시스템. - 제3항에 있어서,
상기 이슈어설정부는 상기 제2가중치가 부여되는 상기 출현빈도의 증가율 가운데, 상기 출현빈도의 증가율이 가장 큰 단어를 상기 민원의 대표이슈어로 설정하는 민원 이슈어 분석 추출 시스템. - 제4항에 있어서,
상기 이슈어설정부는 상기 이슈어를 저장하는 이슈어 데이터 베이스를 더 포함하고, 상기 이슈어 데이터 베이스에 저장되어 있는 이슈어와 설정기간 내에 저장되는 상기 이슈어를 매칭시킬 수 있는 민원 이슈어 분석 추출 시스템. - 제1항에 있어서,
상기 민원 게시판은 관리자가 읽을 수 있도록 민원을 출력하고, 상기 관리자에 의해 상기 이슈어가 추가되는 민원 이슈어 분석 추출 시스템. - 복수 개의 민원이 기재되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계;
상기 단어로부터 단어의 특징을 추출하는 (B)단계;
상기 설정기간 내에 수집된 상기 단어의 출현빈도를 추출하는 (C)단계;
상기 설정기간 내의 상기 출현빈도의 증가율을 추출하고, 상기 증가율을 기준증가율과 비교하는 (D)단계 및 상기 증가율이 기준증가율 이상이 되면, 상기 단어를 이슈어로 설정하는 (E)를 포함하는 민원 이슈어 분석 추출 방법. - 제7항에 있어서,
상기 (D)단계는 추출된 상기 출현빈도의 증가율을 상기 문자의 빈도에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 대비하여, 복수 개의 빈발수준등급을 추출하는 (D-1)단계를 포함하는 민원 게시판 이슈어 분석 추출 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180009927A KR102123687B1 (ko) | 2018-01-26 | 2018-01-26 | 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180009927A KR102123687B1 (ko) | 2018-01-26 | 2018-01-26 | 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190091011A true KR20190091011A (ko) | 2019-08-05 |
KR102123687B1 KR102123687B1 (ko) | 2020-06-16 |
Family
ID=67616217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180009927A KR102123687B1 (ko) | 2018-01-26 | 2018-01-26 | 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102123687B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102306932B1 (ko) * | 2020-11-10 | 2021-09-30 | 주식회사 토이코스 | 민원 데이터를 이용한 위기 대응 방법 및 그 시스템 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139716A (ja) * | 2004-11-15 | 2006-06-01 | Nippon Telegr & Teleph Corp <Ntt> | 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
KR20090113097A (ko) * | 2008-04-25 | 2009-10-29 | (주)아워텍 | 웹 환경에서의 트렌드 기반 정보 검색 시스템 |
KR20160075974A (ko) | 2014-12-19 | 2016-06-30 | 케이웨어 (주) | 문맥기반 공공민원 빅 데이터 자동 분류 방법 |
-
2018
- 2018-01-26 KR KR1020180009927A patent/KR102123687B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006139716A (ja) * | 2004-11-15 | 2006-06-01 | Nippon Telegr & Teleph Corp <Ntt> | 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
KR20090113097A (ko) * | 2008-04-25 | 2009-10-29 | (주)아워텍 | 웹 환경에서의 트렌드 기반 정보 검색 시스템 |
KR20160075974A (ko) | 2014-12-19 | 2016-06-30 | 케이웨어 (주) | 문맥기반 공공민원 빅 데이터 자동 분류 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102306932B1 (ko) * | 2020-11-10 | 2021-09-30 | 주식회사 토이코스 | 민원 데이터를 이용한 위기 대응 방법 및 그 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR102123687B1 (ko) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lalor et al. | Building an evaluation scale using item response theory | |
US9990356B2 (en) | Device and method for analyzing reputation for objects by data mining | |
US8325189B2 (en) | Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products | |
US8577884B2 (en) | Automated analysis and summarization of comments in survey response data | |
Ong et al. | Linguistic characteristics of shill reviews | |
US20210349893A1 (en) | Method and system for analytic based connections among user types in an online platform | |
CN107436916B (zh) | 智能提示答案的方法及装置 | |
CN112950359B (zh) | 一种用户识别方法和装置 | |
JP2012164242A (ja) | 関連語抽出装置、関連語抽出方法、関連語抽出プログラム | |
Afrizal et al. | New filtering scheme based on term weighting to improve object based opinion mining on tourism product reviews | |
Shan et al. | Inconsistency investigation between online review content and ratings | |
KR101671890B1 (ko) | 거래관계 분석 장치 및 방법 | |
CN112949963A (zh) | 员工服务质量的评估方法、装置、存储介质和智能设备 | |
US9165053B2 (en) | Multi-source contextual information item grouping for document analysis | |
KR20190091011A (ko) | 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 | |
KR20200143989A (ko) | 고객 문의에 대한 유형 분류에 기초한 담당자 배정 시스템 및 방법 | |
KR102018819B1 (ko) | 특정 주제에 관한 질문-답변 데이터 셋 자동 생성 방법 및 장치 | |
Ikram et al. | Open source software adoption evaluation through feature level sentiment analysis using Twitter data | |
CN110674632A (zh) | 一种确定安全级别的方法及装置、存储介质和设备 | |
US11134045B2 (en) | Message sorting system, message sorting method, and program | |
KR20190104745A (ko) | 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체 | |
Bratawisnu et al. | Association perception customer feedback with text network analysis in social media (case study on internet banking BRI, BCA, Mandiri in Indonesia) | |
CN115392220A (zh) | 一种满意度数值的确定方法及装置 | |
JP5223671B2 (ja) | テキストマイニング装置、テキストマイニング方法、および、テキストマイニングプログラム | |
JP6059683B2 (ja) | ローカル話題語抽出装置、ローカル話題語抽出方法及びローカル話題語抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |