KR102123687B1 - 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 - Google Patents

민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 Download PDF

Info

Publication number
KR102123687B1
KR102123687B1 KR1020180009927A KR20180009927A KR102123687B1 KR 102123687 B1 KR102123687 B1 KR 102123687B1 KR 1020180009927 A KR1020180009927 A KR 1020180009927A KR 20180009927 A KR20180009927 A KR 20180009927A KR 102123687 B1 KR102123687 B1 KR 102123687B1
Authority
KR
South Korea
Prior art keywords
frequency
past
increase
issuer
rate
Prior art date
Application number
KR1020180009927A
Other languages
English (en)
Other versions
KR20190091011A (ko
Inventor
오창용
Original Assignee
(주) 에스알포스트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 에스알포스트 filed Critical (주) 에스알포스트
Priority to KR1020180009927A priority Critical patent/KR102123687B1/ko
Publication of KR20190091011A publication Critical patent/KR20190091011A/ko
Application granted granted Critical
Publication of KR102123687B1 publication Critical patent/KR102123687B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출방법에 관한 것이다.
본 발명의 민원 이슈어 분석 추출 시스템은 복수 개의 민원이 게시되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 수집부 및 수집부에서 단어를 수신하여, 단어의 특징을 추출하는 자연어처리부, 자연어처리부에서 추출된 단어의 출현빈도를 추출하고, 추출된 출현빈도의 증가율을 추출하는 빈도추출부 및 증가율이 기준증가율과 비교하여, 증가율이 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하는 이슈어설정부를 포함한다.
또한, 민원 이슈어 분석 추출 방법은 복수 개의 민원이 기재되는 민원 게시판에서 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계, 단어로부터 단어의 특징 및 정보를 추출하는 (B)단계, 설정기간 내에 수집된 단어의 출현빈도를 추출하는 (C)단계, 설정기간 내의 출현빈도의 증가율을 추출하고, 증가율을 기준증가율과 비교하는 (D)단계 및 증가율이 기준증가율 이상이 되면, 단어를 이슈어로 설정하는 (E)를 포함한다.

Description

민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법{System For Analyzing And Extracting Inssue Word from Public Service Board And Method For Analyzing And Extracting Inssue Word from Public Service Board And Method}
본 발명은 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출방법에 관한 기술이다. 더욱 상세하게는 게시판에 올라온 민원 단어를 데이터 마이닝 기법으로 분석하여, 민원 게시 글을 보다 정확하고 빠르게 분석할 수 있는 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법에 관한 기술이다.
공공기관, 지자체 및 서비스를 제공하는 회사들은 고객들의 요청 사항 및 불만을 파악하고자 민원 게시판을 운영하고 있다.
현재, 공공기관 및 회사들은 민원 게시판을 통해 고객들의 불만, 문의 사항을 접수하여 민원 담당자가 접수된 사항을 읽은 후, 각 사항에 답변을 달아주는 방식으로 민원 게시판을 운영하고 있다.
그러나 민원 게시판을 올라오는 민원 수는 점차 증가하는 반면, 민원을 해결하거나 조언을 주는 담당자들은 민원 수에 맞춰 증원되지 못하고 있다. 이에, 많은 민원이 신속하게 처리되지 못하는 문제가 있다. 아울러, 민원 처리 담당자가 부족하게 되면서 한 분야의 전문 인력이 다른 분야의 민원까지 해결하고 있다.
어느 한 명의 담당자가 자신의 전문 분야가 아닌 분야의 민원에 대해 그 분야의 전문 분야인 담당자 수준의 민원 해결방안을 제시하지 못하고 있다. 이에 따라, 많은 민원에 양질의 답변 및 일관성 있는 답변이 제시되지 못하는 문제가 있다.
대한민국 공개특허 제10-2016-0075974호 (2016.06.30)
본 발명이 이루고자 하는 기술적 과제는 이러한 문제점을 해결하기 위한 것으로서, 특정기간 동안 민원 게시판에 게시된 글의 단어를 분석하여 게시 글의 주제를 파악해 게시 글을 분류하고 분류된 글을 각 분야의 전문 담당자에게 전달할 수 있도록 하고자 한다.
그리고 분류된 글에 담당자가 답변한 글을 저장한 후, 추후 동일한 게시 글이 올라올 경우 담당자가 답변한 글을 하나의 해결방안으로 담당자에게 추천해주고자 한다.
또한, 특정기간 동안 설정된 이슈어에 가중치를 부여해, 이슈어를 순위화하여 우선적으로 처리해야 할 민원을 담당자에게 알려줌으로써, 담당자가 민원 해결을 보다 효율적으로 할 수 있도록 한다.
본 발명의 기술적 과제는 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 달성하기 위한 본 발명은 관리자가 날짜의 년과 월을 설정한 설정기간 내에 복수 개의 민원이 게시되는 민원 게시판에서 기재된 민원의 단어를 수집하는 수집부;
상기 수집부에서 상기 단어를 수신하여, 상기 단어의 특징을 추출하는 자연어처리부;
상기 자연어처리부에서 추출된 상기 단어의 출현빈도를 추출하고, 상기 설정기간과 상기 설정기간의 설정년과 동일한 동일년 이면서 상기 설정기간의 설정월 보다 지난달의 과거기간 대비 추출된 상기 출현빈도의 증가율을 상기 단어의 빈도수에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 비교하여, 심각, 경계, 보통, 낮음을 포함하는 빈발수준등급 중 어느 하나의 빈발수준등급으로 나타내는 빈도추출부;
관리자가 민원에 답변한 답글을 저장하는 이슈어 데이터 베이스를 더 포함하며, 상기 출현빈도의 증가율을 기준증가율과 비교하여, 상기 출현빈도의 증가율이 상기 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하며, 상기 이슈어를 저장하는 이슈어설정부를 포함하고,
상기 이슈어설정부는 상기 출현빈도의 증가율과 상기 설정기간의 설정년보다 일년 전인 제1과거년과 상기 설정기간의 설정월과 동일한 월인 제1동일월로 설정되는 제1과거에서 추출되는 제1과거의 증가율 그리고 상기 제1과거의 제1과거년 보다 일년 전인 제2과거년과 상기 제1과거의 제1동일월과 동일한 월인 제2동일월로 설정되는 제2과거에서 추출되는 제2과거의 증가율을 비교하여, 상기 출현빈도의 증가율, 상기 제1과거의 증가율과 상기 제2과거의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율, 상기 제1과거의 증가율 및 상기 제2과거의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산하고
상기 이슈어설정부는 상기 제2가중치가 부여되는 상기 출현빈도의 증가율 가운데, 상기 출현빈도의 증가율이 가장 큰 단어를 상기 민원의 대표이슈어로 설정하고, 상기 이슈어 데이터 베이스에 저장되어 있는 이슈어와 설정기간 내에 저장되는 상기 이슈어를 매칭시킨 후, 상기 이슈어에 대한 민원의 답글을 관리자에게 제공할 수 있다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
상기 민원 게시판은 관리자가 읽을 수 있도록 민원을 출력하고, 상기 관리자에 의해 상기 이슈어가 추가될 수 있다.
또한, 상기 기술적 과제를 달성하기 위한 본 발명의 민원 이슈어 분석 추출 방법은 수집부가 복수 개의 민원이 기재되는 민원 게시판에서 날짜의 년과 월이 설정된 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계;
자연어처리부가 상기 수집부에서 상기 단어를 수신하여 상기 단어로부터 단어의 특징을 추출하는 (B)단계;
이슈어설정부가 상기 설정기간 내에 수집된 상기 단어의 출현빈도를 추출하는 (C)단계;
빈도추출부가 상기 자연어처리부에서 추출된 상기 단어의 출현빈도를 추출하고, 상기 설정기간과 상기 설정기간의 설정년과 동일한 동일년 이면서 상기 설정기간의 설정월 보다 지난달의 과거기간 대비 추출된 상기 출현빈도의 증가율을 상기 단어의 빈도수에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 비교하여, 심각, 경계, 보통, 낮음을 포함하는 빈발수준등급 중 어느 하나의 빈발수준등급으로 나타내는 (D)단계;
관리자가 민원에 답변한 답글을 저장하는 이슈어 데이터 베이스를 포함하는 이슈어설정부가 상기 증가율이 기준증가율 이상이 되면, 상기 단어를 이슈어로 설정하는 (E)단계
상기 이슈어설정부가 상기 출현빈도의 증가율과 상기 설정기간의 설정년보다 일년 전인 제1과거년과 상기 설정기간의 설정월과 동일한 월인 제1동일월로 설정되는 제1과거에서 추출되는 제1과거의 증가율 그리고 상기 제1과거의 제1과거년 보다 일년 전인 제2과거년과 상기 제1과거의 제1동일월과 동일한 월인 제2동일월로 설정되는 제2과거에서 추출되는 제2과거의 증가율을 비교하여, 상기 출현빈도의 증가율, 상기 제1과거의 증가율과 상기 제2과거의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율, 상기 제1과거의 증가율 및 상기 제2과거의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산하는 단계,
상기 이슈어설정부는 상기 제2가중치가 부여되는 상기 출현빈도의 증가율 가운데, 상기 출현빈도의 증가율이 가장 큰 단어를 상기 민원의 대표이슈어로 설정하는 단계,
상기 이슈어 데이터 베이스에 저장되어 있는 이슈어와 설정기간 내에 저장되는 상기 이슈어를 매칭시킨 후, 상기 이슈어에 대한 민원의 답글을 관리자에게 제공하는 단계를 포함한다.
삭제
삭제
삭제
삭제
삭제
삭제
본 발명에 따른 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법은 특정기간 동안 민원 게시판에 게시된 글의 단어를 분석해, 주제별로 글을 분류하여 담당자에게 전달할 수 있다. 그리고 추후 동일한 게시글이 올라올 경우 이를 하나의 해결방안으로 담당자에게 추천할 수도 있다. 또한, 게시글의 핵심이 되는 단어에 가중치를 부여해, 게시글을 순위화하여 우선적으로 처리해야 할 민원을 신속하게 담당자에게 전달할 수 있다.
도 1은 본 발명의 일 실시예에 따른 민원 이슈어 분석 추출 시스템에 대한 블록도이다.
도 2는 도 1의 빈도순위, 출현 키워드, 키워드 빈도 및 기간대비 증가율이 나타난 목록 표이다.
도 3은 도1의 신규 민원 목록을 나타낸 목록 표이다.
도 4 및 도 5는 도 1의 민원 이슈어 분석 추출 시스템이 추출단어에 가중치를 부여하거나 부여하지 않은 과정을 나타낸 도면이다.
도 6은 본 발명의 일 실시예의 따른 민원 이슈어 분석 추출 방법의 순서도이다.
본 발명의 이점 및 특징 그리고 그것들을 달성하기 위한 방법들은 첨부되는 도면과 함께 상세하게 후술 되어 있는 실시 예를 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예는 본 발명의 개시가 완전하도록 하고 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다.
본 발명의 청구범위는 청구항을 비롯해 청구항을 뒷받침하는 설명에 의해 정의될 수 있다. 아울러, 명세서 전체에 걸쳐 동일 참조부호는 동일 구성요소를 지칭한다.
본 명세서 전체에 걸쳐 기술되는 민원 이슈어 분석 추출 시스템에 대한 모든 설명은 민원 이슈어 분석 추출방법에 그대로 적용될 수 있다.
본 명세서상에서 설명이 간결하고 명확해 질 수 있도록 민원 이슈어 분석 시스템에 대해 상세히 설명한 후, 이를 바탕으로 민원 이슈어 분석 추출방법에 대해 설명한다.
먼저, 본 발명의 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출방법을 설명 하기 앞서, 본 명세서상에 기술된 단어는 온라인상에 형성된 민원 게시판에 기재된 글 가운데서 자립하여 쓰일 수 있거나 따로 떨어져서 문법적 기능을 가지는 언어의 최소 기본 어휘를 의미한다.
일례로, 단어는“민원 이슈어 분석 추출 시스템”이 라는 문장에서 자립적으로 쓸 수 있는‘민원’,‘이슈어’,‘분석’,‘추출’ 및‘시스템’이 될 수 있다.
이하, 도 1 내지 도 3을 참조하여, 본 발명의 민원 이슈어 분석 추출 시스템에 대해 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 민원 이슈어 분석 추출 시스템에 대한 블록도이고, 도 2는 도 1의 빈도순위, 출현 키워드, 키워드 빈도 및 기간대비 증가율이 나타난 목록 표이고, 도 3은 도 1의 신규 민원 목록을 나타낸 목록 표이다.
민원 이슈어 분석 추출 시스템(1)은 담당자 및 관리자(M)가 설정한 일정기간 동안 민원 게시판(50)에 게시된 글의 단어를 수집부(10)에서 수집하고, 자연어처리부(20)에서 수집된 단어를 분석하여 게시된 글의 주제를 파악한다. 그리고 빈도추출부(30)에서 분석된 단어의 빈도횟수를 산출하고, 이슈어설정부(40)에서 산출된 빈도수를 고려해 이슈어(I.W)로 설정하고, 설정된 이슈어(I.W)를 각 민원의 대표이슈어(I.W)로 설정한 후, 글을 이슈별로 분류하여 각 민원의 관리자에게 전달한다.
또한, 민원 이슈어 분석 추출 시스템(1)은 관리자가 처리한 민원의 해결방안을 저장한 후, 추후 동일한 민원 게시글이 올라올 경우 앞서 해결 방안으로 제시한 답글을 하나의 해결 방안으로 관리자(M)에게 추천할 수도 있다.
또한, 민원 이슈어 분석 추출 시스템(1)은 이슈어(I.W)에 가중치를 부여하여 민원 게시판에 올라온 많은 게시글을 순위화하여, 관리자가 우선적으로 처리해야 할 민원을 신속히 파악할 수 있도록 한다.
이와 같은 본 발명의 일 실시예에 따른 민원 이슈어 분석 추출 시스템(1)은 수집부(10), 자연어처리부(20), 빈도추출부(30) 및 이슈어설정부(40) 등을 구성요소로 포함한다. 이하, 본 발명의 구성요소들에 대해 구체적으로 설명한다.
수집부(10)는 복수 개의 민원이 게시되는 민원 게시판(50)에서 관리자가 설정한 설정기간 동안에 기재된 민원 글의 단어를 수집한다.
여기서, 민원 게시판(50)은 고객불만 사항을 접수하여, 관리자가 불만 사항 처리를 완료될 때까지 고객에게 처리 사항을 실시간으로 보여줄 수 있는 응용 어플리케이션이 된다. 이러한 민원 게시판(50)은 관리자(M)에 의해 후술할 이슈어(I.W)가 추가되거나 삭제되며, 출력되는 민원의 목록 순서가 변경 가능하게 하는 응용 어플리케이션으로 형성될 수도 있다.
수집부(10)는 단어를 수집한 후 자연어처리부(20)로 전송한다. 자연어처리부(Natural Language Processing, 20)는 수집부(10)에서 단어를 수신하여 단어의 특징을 추출한다. 이때, 자연어처리부(20)가 단어의 특징을 추출한다 함은 컴퓨터가 사람의 일상생활 언어를 형태 분석, 의미 분석, 대회 분석 등을 통하여 컴퓨터가 처리하여 단어의 의미를 추출하는 것을 의미한다. 일례로, 자연어처리부(20)는 여진이라는 단어로부터 여진에 숨겨져 있는 유용한 상관관계를 가진 단어인 지진, 붕괴, 재해 등을 추출할 수 있다.
자연어처리부(20)는 수집된 단어와 상관관계를 가진 단어를 추출해 빈도추출부(30)로 전달한다.
빈도추출부(30)는 자연어처리부(20)에서 추출된 단어의 출현빈도를 추출한다. 아울러, 빈도추출부(30)는 추출된 출현빈도를 설정기간 이전의 과거기간으로부터 얼마나 증가했는지를 파악한다. 즉, 빈도추출부(30)는 출현빈도의 증가율을 추출한다.
이러한 빈도추출부(30)는 추출된 출현빈도의 증가율을 단어의 빈도수에 곱 연산하여 빈발수준값을 추출한다. 그리고 빈발수준값을 빈발수준기준값과 비교하여, 복수 개의 빈발수준등급을 추출할 수 있다.
일례로, 도 2에 도시된 바와 같이, 빈도추출부(30)는 설정기간인 2018년 07월 01일부터 2018년 07월 31일까지 자연어처리부(20)에서 전달된 단어 즉, ‘여진’,‘화재’,‘금융자사’,‘담보’ 및‘전력’의 빈도수를 계산한다. 이때, 빈도추출부(30)는 여진의 빈도수를 100, 화재의 빈도수를 21, 금융자산의 빈도 수를 19, 담보의 빈도수를 17 및 전력의 빈도수를 15로 산출하고, 산출된 빈도수를 오름차순으로 정렬시켜 출현 단어를 나타낼 수 있다.
또한, 빈도추출부(30)는 각 단어가 동일 년 지난달 또는 동일 년 지난날 대비 얼마나 많이 증가하였는지를 출현빈도의 증가율 그리고 증가율 추세를 막대 그래프로 나타낼 수 있다. 아울러, 빈발 출현 되는 수준을 등급으로 나타낼 수 있다.
보다 구체적으로 빈도추출부(30)는 추출된 증가율에 단어의 빈도수를 곱 연산하여 빈발수준값을 추출하고, 빈발수준값과 관리자가 설정한 빈발수준기준값을 비교한다. 이때, 빈도추출부(30)는 빈발수준값이 빈발수준기준값 보다 크되, 빈발수준값이 빈발수준기준값 보다 20% 이상 클 때에는 빈발수준 등급을 ‘심각’을 의미하는 빨간색 동그라미로 나타낼 수 있고, 빈발수준값이 빈발수준기준값 보다 10% 이상 클 때, 빈발수준 등급을‘경계’를 의미하는 주황색 동그라미로 나타낼 수 있다.
여기서, 기재된 20% 및 10%는 하나의 예시일 뿐, 이러한 값으로 한정되는 아니며, 관리자가 빈발수준기준값과 함께 얼마든지 다른 값으로 조정할 수 있다.
또한, 빈도추출부(30)는 빈발수준값이 빈발수준값과 동일할 때 빈발수준 등급을 ‘보통’을 의미하는 초록색 동그라미로 나타낼 수 있고, 빈발수준값이 빈발수준값 이하일 때, 빈발수준등급을 ‘낮음’을 의미하는 노란색 동그라미로 나타낼 수 있다.
이와 같이, 빈도추출부(30)는 출현빈도, 출현빈도의 증가율 및 빈발 출현 되는 수준 등급을 한 화면에 출력하여 관리자가 많은 민원을 쉽게 파악할 수 있도록 한다.
이슈어설정부(40)는 단어의 출현빈도의 증가율을 기준증가율과 비교하고, 비교값에 따라 단어에 가중치를 부여해 단어를 이슈어로 설정한다.
이슈어설정부(40)에 대해 보다 구체적으로 설명하면, 이슈어설정부(40)는 출현빈도의 증가율과 과거기간에서 추출되는 과거출현빈도의 증가율을 비교한다. 이때, 이슈어설정부(40)는 출현빈도의 증가율과 과거출현빈도의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 출현빈도의 증가율에 곱 연산한다.
반면, 출현빈도의 증가율과 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 제1가중치보다 큰 값을 갖는 제2가중치를 출현빈도의 증가율에 곱 연산한다. 여기서 제1가중치는 자연수 1이 될 수 있고, 제2가중치는 자연수 1보다 큰 수가 될 수 있다.
이러한 이슈어설정부(40)에 대한 이러한 특징에 대해서는 도 4 및 도 5를 설명할 때 구체적으로 설명하도록 한다.
이슈어설정부(40)는 제2가중치가 부여되는 단어 가운데 출현빈도의 증가율이 가장 높은 단어를 민원의 대표이슈어(M.I.W)로 설정할 수 있다. 이러한 이슈어설정부(40)는 도 3에 도시된 바와 같이, 각 민원의 제목에 대표이슈어(M.I.W)를 달아 관리자(M)가 쉽게 민원을 파악할 수 있도록 한다.
또한, 이슈어설정부(40)는 이슈어 데이터 베이스(41)를 포함하여, 설정된 이슈어 및 관리자가 민원에 답변한 답글을 저장한다. 이러한 이슈어설정부(40)는 이슈어 데이터 베이스(41)에 저장되어 있는 이슈어와 설정기간 내에 저장되는 이슈어를 매칭시킨 후, 전에 관리자가 답변한 민원의 답글을 관리자에게 제공할 수 있다.
관리자는 이슈어설정부(40)에서 제공되는 답글을 통해, 반복적으로 올라오는 민원에 신속하면서도 일관성 있는 답변을 제공할 수 있게 된다.
이하, 도 4 및 도 5를 참조하여, 이슈어설정부가 단어에 어떠한 가중치가 부여되는지에 대해 구체적으로 설명한다.
도 4 및 도 5는 도 1의 민원 이슈어 분석 추출 시스템이 추출단어에 가중치를 부여하거나 부여하지 않은 과정을 나타낸 도면이다.
이슈어설정부(40)는 설정기간 내에 출현한 단어의 출현빈도의 증가율과 과거기간에서 추출되는 과거출현빈도의 증가율을 비교하며, 단어가 이슈어가 되는지 안 되는지를 결정한다. 일례로, 이슈어설정부(40)는 2018년 07월 01일부터 2018년 07월 31일까지 출현 된 전력(I.W)이라는 단어의 이전달 대비 증가율(현재의 증가율)을 추출하면, 추출된 증가율을 전년도 즉, 2017년 07월 01일부터 2017년 07월 31일까지 출현 된 전력(P.W1)이라는 단어의 이전 대비 증가율(제1과거의 증가율) 그리고, 2016년 07월 01일부터 2016년 07월 31일까지 출현 된 전력(P.W2)이라는 단어의 이전 대비 증가율(제2 과거의 증가율)을 비교한다.
이때, 이슈어설정부(40)는 현재의 증가율이 제1과거의 증가율과 제2과거의 증가율과 기준범위 내에서 매칭되면, 전력이라는 단어는 통상적으로 매년 07월01부터 07월31일까지는 매년 많이 출현하는 단어라고 판단하여 현재의 증가율의 단어에 제1가중치를 부여한다.
반면, 이슈어설정부(40)는 2018년 07월 01일부터 2018년 07월 31일까지 출현된 여진(I.W)이라는 단어의 이전달 대비 증가율(현재의 증가율)을 추출하면, 추출된 증가율을 전년도 즉, 2017년 07월 01일부터 2017년 07월 31일까지 출현 된 여진(P.W1)이라는 단어의 이전 대비 증가율(제1과거의 증가율) 그리고, 2016년 07월 01일부터 2016년 07월 31일까지 출현 된 여진(P.W2)이라는 단어의 이전 대비 증가율(제2 과거의 증가율)과 비교한다.
이때, 이슈어설정부(40)는 현재의 증가율이 제1과거의 증가율 및 제2과거의 증가율이 기준범위 내에서 매칭되지 않으면, 여진이라는 단어는 우선순위로 해결해야 할 민원의 단어라고 판단하여 현재의 증가율의 단어에 제2가중치를 부여한다. 그리고 이러한 단어를 대표이슈어로 설정한다. 여기서, 기준범위는 현재의 증가율과 과거의 증가율 간 비교 차가 ±5%가 되는 범위가 될 수 있다.
다만, 이러한 기준범위는 ±5%로 한정되는 것은 아니며 관리자에 의해 얼마든지 다른 값으로 변경될 수 있다.
이하, 지금까지 설명한 일 실시예의 민원 이슈어 분석 추출시스템(1)에 대한 설명을 바탕으로 본 발명의 일 실시예에 민원 이슈어 분석 추출방법에 대해 상세히 설명한다. 민원 이슈어 분석 추출방법은 도 6의 순서도를 기준으로 한다.
도 6은 본 발명의 일 실시예의 따른 민원 이슈어 분석 추출 방법의 순서도이다.
도 6을 참조하면, 본 발명의 민원 이슈어 분석 추출 방법은 민원 게시판(50)에 기재된 민원의 단어를 수집하는 (A)단계(S110), 민원의 단어로부터 단어의 특징을 추출하는 (B)단계 즉, 자연어 처리하는 단계(S120), 수집된 단어의 출현빈도를 추출하는 (C)단계(S130), 출현빈도의 증가율을 추출하고, 추출된 증가율을 기준증가율과 비교하는 (D)단계(S140) 및 추출된 증가율이 기준증가율 이상이 되면, 단어를 이슈어로 도출하는 (E) 단계(S150)를 주요 단계로 포함한다.
이와 같은 주요 단계 그리고 주요 단계를 연결하는 세부 단계들에 대해 좀 더 구체적으로 설명한다.
민원 이슈어 분석 추출 방법은 복수 개의 민원이 기재되는 민원 게시판에 설정기간 동안 게시된 민원의 단어를 수집하는 (A)단계(S110)로 시작한다. 이후, 수집된 단어의 특징을 추출하는 (B)단계(S120)와 수집된 단어의 출현빈도를 추출하는 (C)단계(S130)를 진행한다. 이후, 출현빈도의 증가율을 추출하고, 추출된 증가율을 기준증가율과 비교하는 (D)단계(S140)를 진행한다.
민원 이슈어 분석 추출 방법은 (D)단계에서 추출된 출현빈도의 증가율을 단어의 빈도에 곱 연산하여 빈발수준값을 추출하는 단계 및 빈발수준값을 빈발수준기준값과 비교하여, 복수 개의 빈발수준등급을 추출하는 단계(S141)를 진행할 수 있다.
또한, 민원 이슈어 분석 추출 방법은 추출되는 출현빈도의 증가율을 설정기간 이전인 과거기간에서 추출되는 과거출현빈도의 증가율과 비교한다.
출현빈도의 증가율과 과거출현빈도의 증가율을 비교하여, 비교 값이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 출현빈도의 증가율에 곱 연산하는 단계 및 출현빈도의 증가율과 과거출현빈도의 증가율이 기준범위 내에서 매칭되지 않는 경우, 제1가중치보다 큰 값을 갖는 제2가중치를 출현빈도의 증가율에 곱 연산하는 단계를 진행할 수 있다.
이후, 민원 이슈어 분석 추출 방법은 가중치가 부여된 단어를 민원의 대표이슈어로 설정하는 (E)단계(S160)를 진행한다.
민원 이슈어 분석 추출 방법은 (E) 단계와 동시에, 이슈어 데이터 베이스에 이슈어를 저장하는 (E-1)단계(S151)를 진행할 수 있다.
이때, 민원 이슈어 분석 추출 방법은 대표이슈어의 출현빈도가 높은 순으로 민원을 정렬하는 단계를 진행할 수도 있다.
또한, 민원 이슈어 분석 추출 방법은 (E)단계 이후, 관리자가 민원을 읽어보면 민원에 대표이슈어를 추가 및 변경할 수 있는 단계(S170)를 진행할 수 있고, 이러한 단계 이후 민원에 답변을 기재하는 (F)단계(S180)를 진행될 수 있다.
민원 이슈어 분석 추출 방법은 (F)단계 이후, 대표이슈어를 설정기간 이후에 저장되는 대표이슈어와 매칭 하여 저장되어 있는 민원의 답변을 검색하여 관리자에게 보여주는 (F-1)단계(S190)를 진행할 수 있다.
이와 같은 일련의 단계를 통해, 민원 이슈어 분석 추출 방법은 특정기간 동안 민원 게시판에 게시된 글의 단어를 분석해, 주제별로 글을 분류하여 담당자 즉, 관리자에게 전달할 수 있다.
그리고 추후 동일한 게시 글이 올라올 경우 이를 하나의 해결방안으로 관리자에게 추천할 수도 있다. 또한, 게시 글의 핵심이 되는 대표이슈어에 가중치를 부여해, 게시 글을 순위화하여 관리자가 우선적으로 처리해야 할 민원을 제공함으로써, 관리자의 업무효율을 향상시킬 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시 예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야 한다.
1: 민원 이슈어 분석 추출 시스템
10: 수집부 20: 자연어처리부
30: 빈도추출부 40: 이슈어설정부
41: 이슈어 데이터 베이스 50: 민원 게시판
M: 관리자
I.W: 이슈어 M.I.W: 대표이슈어
W1: 제1가중치 W2: 제2가중치

Claims (8)

  1. 관리자가 날짜의 년과 월을 설정한 설정기간 내에 복수 개의 민원이 게시되는 민원 게시판에서 기재된 민원의 단어를 수집하는 수집부;
    상기 수집부에서 상기 단어를 수신하여, 상기 단어의 특징을 추출하는 자연어처리부;
    상기 자연어처리부에서 추출된 상기 단어의 출현빈도를 추출하고, 상기 설정기간과 상기 설정기간의 설정년과 동일한 동일년 이면서 상기 설정기간의 설정월 보다 지난달의 과거기간 대비 추출된 상기 출현빈도의 증가율을 상기 단어의 빈도수에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 비교하여, 심각, 경계, 보통, 낮음을 포함하는 빈발수준등급 중 어느 하나의 빈발수준등급으로 나타내는 빈도추출부;
    관리자가 민원에 답변한 답글을 저장하는 이슈어 데이터 베이스를 더 포함하며, 상기 출현빈도의 증가율을 기준증가율과 비교하여, 상기 출현빈도의 증가율이 상기 기준증가율 이상이 되면, 상기 단어에 가중치를 부여하여 이슈어로 설정하며, 상기 이슈어를 저장하는 이슈어설정부를 포함하고,
    상기 이슈어설정부는 상기 출현빈도의 증가율과 상기 설정기간의 설정년보다 일년 전인 제1과거년과 상기 설정기간의 설정월과 동일한 월인 제1동일월로 설정되는 제1과거에서 추출되는 제1과거의 증가율 그리고 상기 제1과거의 제1과거년 보다 일년 전인 제2과거년과 상기 제1과거의 제1동일월과 동일한 월인 제2동일월로 설정되는 제2과거에서 추출되는 제2과거의 증가율을 비교하여, 상기 출현빈도의 증가율, 상기 제1과거의 증가율과 상기 제2과거의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율, 상기 제1과거의 증가율 및 상기 제2과거의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산하고
    상기 이슈어설정부는 상기 제2가중치가 부여되는 상기 출현빈도의 증가율 가운데, 상기 출현빈도의 증가율이 가장 큰 단어를 상기 민원의 대표이슈어로 설정하고, 상기 이슈어 데이터 베이스에 저장되어 있는 이슈어와 설정기간 내에 저장되는 상기 이슈어를 매칭시킨 후, 상기 이슈어에 대한 민원의 답글을 관리자에게 제공하는, 민원 이슈어 분석 추출 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 민원 게시판은 관리자가 읽을 수 있도록 민원을 출력하고, 상기 관리자에 의해 상기 이슈어가 추가되는 민원 이슈어 분석 추출 시스템.
  7. 수집부가 복수 개의 민원이 기재되는 민원 게시판에서 날짜의 년과 월이 설정된 설정기간 내에 기재된 민원의 단어를 수집하는 (A)단계;
    자연어처리부가 상기 수집부에서 상기 단어를 수신하여 상기 단어로부터 단어의 특징을 추출하는 (B)단계;
    이슈어설정부가 상기 설정기간 내에 수집된 상기 단어의 출현빈도를 추출하는 (C)단계;
    빈도추출부가 상기 자연어처리부에서 추출된 상기 단어의 출현빈도를 추출하고, 상기 설정기간과 상기 설정기간의 설정년과 동일한 동일년 이면서 상기 설정기간의 설정월 보다 지난달의 과거기간 대비 추출된 상기 출현빈도의 증가율을 상기 단어의 빈도수에 곱 연산하여 빈발수준값을 추출하고, 상기 빈발수준값을 빈발수준기준값과 비교하여, 심각, 경계, 보통, 낮음을 포함하는 빈발수준등급 중 어느 하나의 빈발수준등급으로 나타내는 (D)단계;
    관리자가 민원에 답변한 답글을 저장하는 이슈어 데이터 베이스를 포함하는 이슈어설정부가 상기 증가율이 기준증가율 이상이 되면, 상기 단어를 이슈어로 설정하는 (E)단계;
    상기 이슈어설정부가 상기 출현빈도의 증가율과 상기 설정기간의 설정년보다 일년 전인 제1과거년과 상기 설정기간의 설정월과 동일한 월인 제1동일월로 설정되는 제1과거에서 추출되는 제1과거의 증가율 그리고 상기 제1과거의 제1과거년 보다 일년 전인 제2과거년과 상기 제1과거의 제1동일월과 동일한 월인 제2동일월로 설정되는 제2과거에서 추출되는 제2과거의 증가율을 비교하여, 상기 출현빈도의 증가율, 상기 제1과거의 증가율과 상기 제2과거의 증가율이 기준범위 내에서 매칭되는 경우, 기본가중치인 제1가중치를 상기 출현빈도의 증가율에 곱 연산하고, 상기 출현빈도의 증가율, 상기 제1과거의 증가율 및 상기 제2과거의 증가율이 기준범위 내에서 매칭되지 않는 경우, 상기 제1가중치보다 큰 값을 갖는 제2가중치를 상기 출현빈도의 증가율에 곱 연산하는 단계,
    상기 이슈어설정부는 상기 제2가중치가 부여되는 상기 출현빈도의 증가율 가운데, 상기 출현빈도의 증가율이 가장 큰 단어를 상기 민원의 대표이슈어로 설정하는 단계,
    상기 이슈어 데이터 베이스에 저장되어 있는 이슈어와 설정기간 내에 저장되는 상기 이슈어를 매칭시킨 후, 상기 이슈어에 대한 민원의 답글을 관리자에게 제공하는 단계를 포함하는, 민원 이슈어 분석 추출 방법.
  8. 삭제
KR1020180009927A 2018-01-26 2018-01-26 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법 KR102123687B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180009927A KR102123687B1 (ko) 2018-01-26 2018-01-26 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180009927A KR102123687B1 (ko) 2018-01-26 2018-01-26 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법

Publications (2)

Publication Number Publication Date
KR20190091011A KR20190091011A (ko) 2019-08-05
KR102123687B1 true KR102123687B1 (ko) 2020-06-16

Family

ID=67616217

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180009927A KR102123687B1 (ko) 2018-01-26 2018-01-26 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법

Country Status (1)

Country Link
KR (1) KR102123687B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102306932B1 (ko) * 2020-11-10 2021-09-30 주식회사 토이코스 민원 데이터를 이용한 위기 대응 방법 및 그 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139716A (ja) * 2004-11-15 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090113097A (ko) * 2008-04-25 2009-10-29 (주)아워텍 웹 환경에서의 트렌드 기반 정보 검색 시스템
KR20160075974A (ko) 2014-12-19 2016-06-30 케이웨어 (주) 문맥기반 공공민원 빅 데이터 자동 분류 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139716A (ja) * 2004-11-15 2006-06-01 Nippon Telegr & Teleph Corp <Ntt> 話題語抽出方法及び装置及びプログラム及びプログラムを格納した記憶媒体

Also Published As

Publication number Publication date
KR20190091011A (ko) 2019-08-05

Similar Documents

Publication Publication Date Title
US8032471B2 (en) System and method for annotating and analyzing reviews with inferred analytics
Akhtar et al. The potential of chatbots: analysis of chatbot conversations
US8325189B2 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
WO2009116198A1 (ja) 広告媒体決定装置および広告媒体決定方法
US20090171932A1 (en) System and method for annotation and ranking of reviews personalized to prior user experience
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
US20170169020A9 (en) System and method for annotation and ranking reviews personalized to prior user experience
CN107240033B (zh) 一种电力识别模型的构建方法及系统
US20050021357A1 (en) System and method for the efficient creation of training data for automatic classification
CN110728453B (zh) 一种基于大数据的政策自动匹配分析系统
US11790380B2 (en) Systems and methods for finding an interaction subset within a set of interactions
KR20110068278A (ko) 특허 자동 평가 시스템의 특허 자동 평가 방법
JP2016110213A (ja) 情報処理装置、情報処理システム、端末装置、情報処理方法、及び情報処理プログラム
Abbas Deposit subscribe prediction using data mining techniques based real marketing dataset
KR102123687B1 (ko) 민원 이슈어 분석 추출 시스템 및 민원 이슈어 분석 추출 방법
KR101671890B1 (ko) 거래관계 분석 장치 및 방법
Ham et al. Same crisis, different responses: Case studies of how multiple competing corporations responded to the same explosion-related crises
KR20220152756A (ko) 연구개발 과제 평가 환경 제공 시스템 및 그 방법
KR20200143989A (ko) 고객 문의에 대한 유형 분류에 기초한 담당자 배정 시스템 및 방법
Dachyar et al. Analysis of satisfaction and improvement design of electronic insurance claim service
KR101716748B1 (ko) 콜 센터 상담품질관리를 위한 콜 분류 시스템 및 방법
Opoku et al. The effect of the marketing communication mix on customer loyalty in the banking sector in Ghana
KR102121653B1 (ko) 아웃소싱 기업 신뢰도 평가 지원 방법 및 시스템
KR101997613B1 (ko) 인공지능을 활용한 기업과 이벤트 상호 매칭시스템 및 매칭방법
CN115168531A (zh) 数据分析的方法、数据分析系统、计算设备、存储介质和程序产品

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant