KR20180057470A - 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법 - Google Patents

데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20180057470A
KR20180057470A KR1020170008087A KR20170008087A KR20180057470A KR 20180057470 A KR20180057470 A KR 20180057470A KR 1020170008087 A KR1020170008087 A KR 1020170008087A KR 20170008087 A KR20170008087 A KR 20170008087A KR 20180057470 A KR20180057470 A KR 20180057470A
Authority
KR
South Korea
Prior art keywords
social problem
analysis
social
data
information
Prior art date
Application number
KR1020170008087A
Other languages
English (en)
Inventor
백승철
조성혜
김남희
최승연
김효배
Original Assignee
주식회사 마이소사이어티
백승철
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마이소사이어티, 백승철 filed Critical 주식회사 마이소사이어티
Publication of KR20180057470A publication Critical patent/KR20180057470A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q90/00Systems or methods specially adapted for administrative, commercial, financial, managerial or supervisory purposes, not involving significant data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 클라이언트로부터 특정 주제를 입력받으면, 데이터 마이닝을 이용하여 자동으로 분석하여 분석 데이터를 제공하는 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법에 관한 것으로, 분석이 필요한 사회문제에 대한 정보와 각 정보 항목에 대한 가중치를 입력하는 사용자 단말;상기 사용자 단말을 통하여 입력한 정보와 유사한 사회문제 정보, 해당 사회문제에 대한 원인으로 추측되는 정보를 분석결과로 제공하기 위한 분석 요청 및 분석 결과 제공을 위한 서비스를 수행하는 사회문제 분석 서비스 서버;상기 사회문제 분석 서비스 서버의 분석 요청에 의해 사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하고, 해당 단어를 포함한 사회문제 문서의 링크 정보를 검색하여 분석 결과를 사회문제 분석 서비스 서버로 제공하는 사회문제 분석 데이터 관리 서버;초기 사회문제 데이터 또는 운영을 위해 필요한 사회문제 데이터를 입력하는 서비스 운영자 단말;을 포함하는 것이다.

Description

데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법{System and Method for Analyzing Social Problem Using Data Mining}
본 발명은 사회문제 분석에 관한 것으로, 구체적으로 클라이언트로부터 특정 주제를 입력받으면, 데이터 마이닝을 이용하여 자동으로 분석하여 분석 데이터를 제공하는 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법에 관한 것이다.
사회문제란 사회제도나 사회구조의 결함과 모순에 의해 발생되는 문제들로 특정 지역, 문화, 계층 등에서 따라 유형화되어 나타난다.
과거 사회문제는 정부와 시민단체들을 중심으로 복지, 시민운동, 정치적 방법으로 접근되었지만 최근 사회구조가 복잡해지고 이해관계자가 다양해짐에 따라 개인의 특성과 상황에 최적화된 문제해결 방법이 필요하다.
또한, 국제개발원조의 활성화로 해외를 대상으로 하는 사회문제 해결에 대한 접근이 활발해지고 있다.
이를 위해, 사회적 기업과 소셜 벤처와 같은 사회적 경제 육성과 사회문제 해결형 기술개발의 필요성이 부각되고 있다.
사회문제를 복지가 아닌 대안적 경제와 산업적 관점으로 접근하려는 추세가 확산되고 있으나, 산업의 주체인 기업 또는 기술 전문가가 사회문제를 심도 있게 이해하는 과정은 매우 많은 시간이 소모된다.
현재까지의 사회문제 분석 방법들은 대부분 전문가의 정성적인 의견과 주관적인 평가에 의해 이루어지고 있으며, 객관적인 분석 및 접근에 대한 연구와 시도는 아직까지 미흡한 실정이다.
이러한 전문가에 의한 사회 문제 분석 및 접근은 전문가들의 경향, 정치적 요소, 인맥 관계 등의 다양한 요소에 의해 일부 편향적인 의견이나 주장이 반영될 가능성이 있고, 또한, 전문가들의 평가도 객관적인 자료의 획득 및 선별이 일관성이 없어 분석 결과의 객관성을 확보하기 어렵다.
한편, 데이터 분석 기술의 발전으로 데이터 마이닝을 통해 사용자가 조회한 정보와 유사정보를 분석하고 추가적으로 원하는 정보까지 예측할 수 있게 되었다.
이를 통해, 사용자는 모든 정보를 인지하지 않아도 시스템으로부터 정보를 추천받을 수 있게 되었다.
하지만, 데이터 마이닝 기술을 사회문제 분석에 적용하여 정보를 추천받는 것에는 한계가 있다.
사회문제의 특성상 동일한 현상을 가진 사회문제도 장소/시간/발생 원인에 따라 다른 분석 결과를 필요로 한다.
따라서, 시스템을 통해 사회문제의 현상, 발생장소, 발생시간, 발생원인 등 다양한 관점에서 연관관계를 분석하여 문제해결을 위한 아이디어를 얻을 필요성이 증대되고 있다.
대한민국 공개특허 제10-2014-0081721호 대한민국 공개특허 제10-2016-0075971호
본 발명은 이와 같은 종래 기술의 사회 문제 분석의 문제를 해결하기 위한 것으로, 클라이언트로부터 특정 주제를 입력받으면, 데이터 마이닝을 이용하여 자동으로 분석하여 분석 데이터를 제공하는 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명은 사회 문제 분석 시스템을 구축하여 객관적인 자료의 획득 및 선별이 이루어져 분석 결과의 객관성을 확보할 수 있도록 한 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명은 특정 지역과 상황에서 발생하는 사회문제에 대해 발생 대상, 시간, 장소에 관한 정보수집이 이루어질 수 있도록 가이드를 제공하고, 사회문제로 인해 발생하는 현상정보를 기반으로 발생 원인을 찾아갈 수 있도록 한 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명은 사회문제 분석 관점에 따라 이해관계자, 지역, 시기, 솔루션에 따른 가중치를 부여하여 사회문제 해결을 위한 효과적이고 전략적인 계획을 수립할 수 있도록 한 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명은 축적된 데이터에 의해 상황에 따른 사회문제의 현상과 원인 간의 연관관계를 파악하고 빅데이터로 저장하여 향후 특정 조건에서 사회문제 예측 시스템으로 활용될 수 있도록 한 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템은 분석이 필요한 사회문제에 대한 정보와 각 정보 항목에 대한 가중치를 입력하는 사용자 단말;상기 사용자 단말을 통하여 입력한 정보와 유사한 사회문제 정보, 해당 사회문제에 대한 원인으로 추측되는 정보를 분석결과로 제공하기 위한 분석 요청 및 분석 결과 제공을 위한 서비스를 수행하는 사회문제 분석 서비스 서버;상기 사회문제 분석 서비스 서버의 분석 요청에 의해 사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하고, 해당 단어를 포함한 사회문제 문서의 링크 정보를 검색하여 분석 결과를 사회문제 분석 서비스 서버로 제공하는 사회문제 분석 데이터 관리 서버;초기 사회문제 데이터 또는 운영을 위해 필요한 사회문제 데이터를 입력하는 서비스 운영자 단말;을 포함하는 것을 특징으로 한다.
여기서, 상기 사용자 단말을 통하여 입력되는 사회문제에 대한 정보는 사회문제의 대상, 시일, 장소, 현상, 니즈, 문제해결 중 적어도 어느 하나를 포함하는 것을 특징으로 한다.
그리고 상기 사용자 단말을 통하여 입력되는 사회문제에 대한 정보는 중요도에 따라 사용자가 가중치를 설정하고, 상기 가중치는 사회문제 주제의 구성을 모두 더했을 때 1이 되는 것을 특징으로 한다.
그리고 상기 사용자 단말을 통하여 입력되는 사회문제 정보의 텍스트 데이터는 형태소 분석을 통해 형태소 단위로 전송,저장,관리되고, 이미지, 영상, 사운드의 데이터는 메타데이터, 또는 텍스트 변환과정을 통해 분석이 이루어지는 것을 특징으로 한다.
그리고 상기 사회문제 분석 데이터 관리 서버는, 사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하는 과정에서, 사회문제의 대상, 시일, 장소, 현상에 관한 항목의 가중치에 따라 단어 간의 유사도 계산을 하고, 니즈, 문제해결에 관한 항목은 가중치를 차감하여 단어 간의 유사도 계산을 하는 것을 특징으로 한다.
그리고 상기 사회문제 분석 데이터 관리 서버는, 사회문제 분석 서비스 서버가 전달한 단어와 유사도가 높은 단어 리스트와, 각 단어 간의 유사도, 해당 단어와 함께 입력된 문서의 원본 URL 값을 사회문제 분석 서비스 서버로 제공하는 것을 특징으로 한다.
그리고 서비스 운영자는 서비스 운영자 단말을 통하여, 사회문제 사례정보, 연관개념 정보, 분석 결과 보정 값을 사회문제 분석 데이터 관리 서버에 입력하고 통계분석 결과와 로그데이터를 확인하는 것을 특징으로 한다.
그리고 상기 사회문제 분석 데이터 관리 서버에서 사회문제 DB를 구축하기 위하여, 문서 입력부를 통하여 문서단위로 입력된 데이터 중 텍스트 데이터를 추출하고, 이미지, 영상, 음향의 멀티미디어 데이터를 입력하면 메타 데이터, 텍스트 변환과정을 거쳐 텍스트화하는 텍스트 추출부와,상기 텍스트 추출부에서 텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 형태소 단위로 처리하는 형태소 분석부와,연관개념 입력 과정을 통해 유사도를 보정하는 연관 개념 입력부와,분석결과 보정을 통해 단어에 대한 유사도 값을 보정하는 분석 결과 보정부를 포함하는 것을 특징으로 한다.
다른 목적을 달성하기 위한 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 방법은 사회문제 분석 데이터 관리 서버에서, 텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 형태소 단위로 분리된 사회문제 데이터를 사회문제 DB에 저장하고, 유사도 보정을 수행하는 사회문제 DB 구축 및 관리 단계;사회문제 분석 데이터 관리 서버에서 사회문제 DB의 구축이 이루어진 상태에서 사회문제에 관한 주제를 수신하는 단계;사회문제 DB에 저장된 데이터와 수신한 사회문제 주제의 텍스트 유사도를 분석하는 단계;관련 단어를 포함하는 사회문제 문헌을 탐색하여 사회문제 문헌과 연결되는 링크를 출력하여 요청한 사회문제 분석 결과를 클라이언트에게 전송하는 단계;를 포함하는 것을 특징으로 한다.
여기서, 상기 사회문제 DB 구축 및 관리 단계에서, 사회문제 분석 데이터 관리 서버에서 문서단위로 입력된 데이터에서 텍스트 데이터를 추출하는 단계와,멀티미디어 데이터를 메타 데이터, 텍스트 변환과정을 거쳐 텍스트화 과정을 수행하는 단계와,텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 기초단어로 처리하는 단계와,기초단어 단위로 분리된 사회문제 데이터를 문서에 포함된 단어빈도, 단어별 유사도와 함께 사회문제 DB에 저장하는 단계와,연관개념 입력 과정을 통해 유사도 보정, 분석결과 보정을 통해 단어에 대한 유사도 값 보정을 수행하는 단계를 포함하는 것을 특징으로 한다.
이와 같은 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법은 다음과 같은 효과를 갖는다.
첫째, 클라이언트로부터 특정 주제를 입력받으면, 데이터 마이닝을 이용하여 자동으로 분석하여 사회 문제에 관한 분석 데이터를 제공한다.
둘째, 사회 문제 분석 시스템을 구축하여 객관적인 자료의 획득 및 선별이 이루어져 분석 결과의 객관성을 확보할 수 있다.
셋째, 특정 지역과 상황에서 발생하는 사회문제에 대해 발생 대상, 시간, 장소에 관한 정보수집이 이루어질 수 있도록 가이드를 제공하고, 사회문제로 인해 발생하는 현상정보를 기반으로 발생 원인을 찾아 정확한 사회 문제 분석 정보를 얻을 수 있다.
넷째, 사회문제 분석 관점에 따라 이해관계자, 지역, 시기, 솔루션에 따른 가중치를 부여하여 사회문제 해결을 위한 효과적이고 전략적인 계획을 수립할 수 있도록 한다.
다섯째, 축적된 데이터에 의해 상황에 따른 사회문제의 현상과 원인 간의 연관관계를 파악하고 빅데이터로 저장하여 향후 특정 조건에서 사회문제 예측 시스템으로 활용될 수 있도록 한다.
도 1은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 전체 구성 및 프로세스 구성도
도 2는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 클라이언트의 정보입력 구성도
도 3은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 정보 간 관계 모형 표시의 구성도
도 4는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 데이터베이스에 사회문제 데이터를 입력 및 관리 과정을 나타낸 구성도
도 5는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 세부 구성도
도 6은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 방법을 나타낸 플로우 차트
이하, 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법의 바람직한 실시 예에 관하여 상세히 설명하면 다음과 같다.
본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법의 특징 및 이점들은 이하에서의 각 실시 예에 대한 상세한 설명을 통해 명백해질 것이다.
도 1은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 전체 구성 및 프로세스 구성도이다.
본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법은 사회 문제 분석 시스템을 구축하여 객관적인 자료의 획득 및 선별이 이루어져 분석 결과의 객관성을 확보할 수 있도록 한 것으로, 특정 지역과 상황에서 발생하는 사회문제에 대해 발생 대상, 시간, 장소에 관한 정보수집이 이루어질 수 있도록 가이드를 제공하고, 사회문제로 인해 발생하는 현상정보를 기반으로 발생 원인을 찾아갈 수 있도록 한 것이다.
특히, 본 발명은 사회문제 분석 관점에 따라 이해관계자, 지역, 시기, 솔루션에 따른 가중치를 부여하여 사회문제 해결을 위한 효과적이고 전략적인 계획을 수립할 수 있도록 한다.
또한, 축적된 데이터에 의해 상황에 따른 사회문제의 현상과 원인 간의 연관관계를 파악하고 분석 데이터를 향후 특정 조건에서 사회문제 예측 시스템으로 활용될 수 있도록 사회 문제 DB에 저장하는 구성을 포함한다.
본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템은 인터넷 네트워크 접속이 가능한 PC, 모바일 등의 사용자 단말(100)과, 사회문제 분석 서비스 서버(200), 사회문제 분석 데이터 관리 서버(300), 서비스 운영자 단말(400)을 포함하고, 사회문제 데이터 저장을 위한 데이터베이스가 구축된 환경에서 사용한다.
구체적으로, 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템은 도 1에서와 같이, 사회문제에 대한 정보(사회문제의 대상, 시간/시기, 장소/지역, 사회문제의 현상, 니즈/문제해결 등 기타)와 각 정보 항목에 대한 가중치를 입력하는 사용자 단말(100)과, 사용자 단말(100)을 통하여 사용자가 입력한 정보와 유사한 사회문제 정보, 해당 사회문제에 대한 원인으로 추측되는 정보 등을 분석결과로 제공하기 위한 분석 요청 및 분석 결과 제공을 위한 서비스를 수행하는 사회문제 분석 서비스 서버(200)와, 사회문제 분석 서비스 서버(200)의 분석 요청에 의해 사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하고 해당 단어를 포함한 사회문제 문서의 링크 정보를 검색하여 분석 결과를 사회문제 분석 서비스 서버(200)로 제공하는 사회문제 분석 데이터 관리 서버(300)와, 초기 사회문제 데이터 또는 운영을 위해 필요한 사회문제 데이터를 입력하는 서비스 운영자 단말(400)을 포함한다.
여기서, 사용자 단말(100)을 통한 사회문제 정보 입력 시 "캄보디아 어린이는 물을 먹을 때 설사를 자주 하므로 물을 정수할 수 있는 방법이 필요하다."라는 내용을 입력했을 시, 유사 단어로 "비소", "메콩강 지하수", "석회", "수인성질환"등의 단어가 결과 값으로 나타나며, 동일한 내용에서 국가명만 바꿔"한국 어린이는 물을 먹을 때 설사를 자주 하므로 물을 정수할 수 있는 방법이 필요하다."라는 내용일 입력했을 시, 과식", "급식", "유통기한" 등의 단어를 결과 값으로 출력하게 된다.
이때 입력단어는 대상, 장소, 시간, 사회문제, 필요한 것으로 구분되어 입력된다.
도 2는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 클라이언트의 정보입력 구성도이다.
도 2에서와 같이, 사용자가 인터넷 네트워크가 연결된 정보기기 즉, 사용자 단말(100)에서 사회문제에 대한 정보(사회문제의 대상, 시간/시기, 장소/지역, 사회문제의 현상, 니즈/문제해결 등 기타)와 각 정보 항목에 대한 가중치를 입력하면, 사회문제 분석 데이터 관리 서버(300)에서 해당 데이터를 분석하여 사용자가 입력한 정보와 유사한 사회문제 정보, 해당 사회문제에 대한 원인으로 추측되는 정보 등을 분석결과로 추출하고, 사회문제 분석 서비스 서버(200)를 통하여 사용자 단말(100)로 제공한다.
가중치는 절대값의 합이 1이 되도록 입력하거나, 가중치 절대값의 총합이 1이 되도록 변환한다.
표 1은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 가중치 입력 예를 나타낸 것이다.
Figure pat00001
그리고 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템에서 텍스트 데이터는 형태소 분석기를 통해 형태소 단위로 전송/저장/관리된다.
텍스트 데이터를 분석 포맷으로 하지만 이미지, 영상, 사운드 등의 데이터는 메타데이터, 또는 텍스트 변환과정을 통해 분석한다.
사회문제 분석 서비스 서버(200)는 사용자가 분석 요청한 데이터를 사회문제 분석 데이터 관리 서버(300)에 텍스트 형태로 전달하여 데이터 분석을 요청한다.
사회문제 분석 데이터 관리 서버(300)는 통계 분석, 데이터마이닝을 수행하는 기능을 탑재하고 있다.
사회문제 분석 데이터 관리 서버(300)는 사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하고 해당 단어를 포함한 사회문제 문서의 링크 정보를 검색한다.
이때, 사회문제의 대상, 시간/시기, 장소/지역, 사회문제의 현상, 기타 정보 값은 단어 간의 유사도 계산 시 가중치에 따라 계산을 하지만, 니즈/문제해결에 대한 데이터는 유사도 계산 시 가중치를 차감하여 계산 한다.
문제해결 값은 문제의 원인 값과 반대개념으로 유사성 검사 시 서로 거리가 먼 것으로 처리한다.
도 3은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 정보 간 관계 모형 표시의 구성도이다.
사회문제 분석 데이터 관리 서버(300)는 사회문제 분석 서비스 서버(200)가 전달한 단어와 유사도가 높은 단어 리스트와 각 단어 간의 유사도(데이터 간의 거리 값), 해당 단어와 함께 입력된 문서의 원본 URL 값을 사회문제 분석 서비스 서버(200)로 제공한다.
그리고 사회문제 분석 서비스 서버(200)는 사용자 단말(100)을 통하여 클라이언트가 원하는 포맷에 맞게 가시화하여 분석 결과를 제공한다.
사용자는 분석 대상 사회문제와 유사도가 높은 사회문제 정보와 해당 사회문제의 원인으로 분석된 사회문제에 대한 이름과 관련 문서를 확인할 수 있다.
그리고 초기 사회문제 데이터 또는 운영을 위해 필요한 사회문제 데이터는 서비스 운영자가 PC 또는 기타 정보기기 즉, 서비스 운영자 단말(400)을 통하여 입력한다.
이와 같은 사회문제 분석 및 결과 제공서비스 과정에서 사용자의 반복적 사용을 통해 사회문제 해결을 위한 분석 데이터가 사회문제 DB에 축적된다.
도 4는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 데이터베이스에 사회문제 데이터를 입력 및 관리 과정을 나타낸 구성도이다.
도 4에서와 같이, 서비스 운영자는 서비스 운영자 단말(400)을 통하여 초기 데이터 입력을 위해서 사회문제에 관련된 문서를 사회문제 DB에 저장한다.
서비스 운영자는 사회문제 사례정보, 연관개념 정보, 분석 결과 보정 값 등을 사회문제 분석 데이터 관리 서버(300)에 입력하고 통계분석 결과와 로그데이터를 확인할 수 있다.
사회문제 사례정보는 텍스트로 변환된 사회문제에 대한 정보를 의미한다.
연관개념 정보는 단어-단어 간의 관계(유사, 포함, 독립 등)에 대한 정보를 서비스 운영자가 직접 정의하는 데이터이다. 연관개념 정보는 사용자가 입력한 데이터가 의미적으로는 DB에 입력된 데이터와 유사하지만 물리적으로 다르기 때문에 분석결과를 제공하지 못하는 것을 방지하기 위한 정보이다.
연관개념 정보를 통해 사용자가 입력한 데이터를 분석결과의 신뢰성을 높일 수 있고 연관개념 정보의 양이 많을수록 다양한 주제와 단어에 대한 사회문제 분석이 가능하다.
연관개념 정보의 가중치는 기준항목과 연관개념과의 유사도를 의미하며 초기 임의의 값을 입력하고 서비스 운영자가 분석 최적치를 조절할 수 있다.
관계 값은 기준항목과 연관개념의 관계를 의미하는 값으로 유사도 분석의 범위를 설정하는 데이터로 사용된다.
표 2는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 관련 개념 매칭을 나타낸 예를 나타낸 것이다.
Figure pat00002
표 2에서와 같이, 분석 결과 보정 값은 단어 간의 유사도(데이터의 거리 값)를 서비스 운영자가 보정하는 것에 의해 사회문제 DB에 저장된 값을 수정한다.
서비스 운영자는 데이터 마이닝을 이용한 사회문제 분석 시스템의 운영자 시스템을 통해 사회문제 DB에 데이터를 입력할 수 있다.
도 5는 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템의 세부 구성도이다.
도 5는 사회문제 분석 데이터 관리 서버(300)에서 사회문제 DB를 구축하는 구성을 나타낸 것으로, 문서 입력부(50)를 통하여 문서단위로 입력된 데이터 중 텍스트 데이터를 추출하고, 이미지, 영상, 음향 등의 멀티미디어 데이터를 입력하면 메타 데이터, 텍스트 변환과정을 거쳐 텍스트화하는 텍스트 추출부(51)와, 상기 텍스트 추출부(51)에서 텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 형태소 단위로 처리하는 형태소 분석부(52)와, 연관개념 입력 과정을 통해 유사도를 보정하는 연관 개념 입력부(53)와, 분석결과 보정을 통해 단어에 대한 유사도 값을 보정하는 분석 결과 보정부(54)를 포함한다.
이와 같은 과정을 수행하여 텍스트로 구성된 사회문제 데이터는 형태소 분석 과정을 거쳐 기초단어(형태소)로 처리된다. 이때 형태소 분석은 언어처리 분야에서 사용하는 형태소 분석기를 통해 수행한다.
그리고 기초단어(형태소) 단위로 분리된 사회문제 데이터는 문서에 포함된 단어빈도, 단어별 유사도와 함께 사회문제 DB에 저장된다.
이와 같이 서비스 운영을 통한 데이터의 축적과 운영자 시스템의 반복적 교정을 통해 유사도 값은 점차 최적화된다.
이와 같은 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템을 이용한 사회문제 분석 과정을 구체적으로 설명하면 다음과 같다.
도 6은 본 발명의 실시 예에 따른 데이터 마이닝을 이용한 사회문제 분석 방법을 나타낸 플로우 차트이다.
먼저, 사회문제 분석 데이터 관리 서버(300)에서 사회문제 DB를 구축하기 위하여, 문서단위로 입력된 데이터에서 텍스트 데이터를 추출하고, 멀티미디어 데이터는 메타 데이터, 텍스트 변환과정을 거쳐 텍스트화 과정을 수행한다.(S601)
이어, 텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 기초단어로 처리한다.(S602)
그리고 기초단어(형태소) 단위로 분리된 사회문제 데이터를 문서에 포함된 단어빈도, 단어별 유사도와 함께 사회문제 DB에 저장한다.(S603)
이어, 연관개념 입력 과정을 통해 유사도 보정, 분석결과 보정을 통해 단어에 대한 유사도 값 보정을 수행한다.(S604)
이와 같이 사회문제 분석 데이터 관리 서버(300)에서 사회문제 DB의 구축이 이루어진 상태에서 인터넷 네트워크로 연결된 클라이언트로부터 사회문제에 관한 주제 수신하면(S605), 사회문제 DB에 저장된 데이터와 클라이언트로부터 수신한 사회문제 주제의 텍스트 유사도를 분석한다.(S606)
그리고 관련 단어를 포함하는 사회문제 문헌을 탐색하여 사회문제 문헌과 연결되는 링크를 출력한다.(S607)
이어, 요청한 사회문제 분석 결과를 클라이언트에게 전송한다.(S608)
이상에서 설명한 본 발명에 따른 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법은 사회 문제 분석 시스템을 구축하여 객관적인 자료의 획득 및 선별이 이루어져 분석 결과의 객관성을 확보할 수 있도록 한 것으로, 특정 지역과 상황에서 발생하는 사회문제에 대해 발생 대상, 시간, 장소에 관한 정보수집이 이루어질 수 있도록 가이드를 제공하고, 사회문제로 인해 발생하는 현상정보를 기반으로 발생 원인을 찾아갈 수 있도록 한 것이다.
특히, 본 발명은 사회문제 분석 관점에 따라 이해관계자, 지역, 시기, 솔루션에 따른 가중치를 부여하여 사회문제 해결을 위한 효과적이고 전략적인 계획을 수립할 수 있도록 한다.
이상에서의 설명에서와 같이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명이 구현되어 있음을 이해할 수 있을 것이다.
그러므로 명시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 범위는 전술한 설명이 아니라 특허청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100. 사용자 단말 200. 사회문제 분석 서비스 서버
300. 사회문제 분석 데이터 관리 서버 400. 서비스 운영자 단말

Claims (10)

  1. 분석이 필요한 사회문제에 대한 정보와 각 정보 항목에 대한 가중치를 입력하는 사용자 단말;
    상기 사용자 단말을 통하여 입력한 정보와 유사한 사회문제 정보, 해당 사회문제에 대한 원인으로 추측되는 정보를 분석결과로 제공하기 위한 분석 요청 및 분석 결과 제공을 위한 서비스를 수행하는 사회문제 분석 서비스 서버;
    상기 사회문제 분석 서비스 서버의 분석 요청에 의해 사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하고, 해당 단어를 포함한 사회문제 문서의 링크 정보를 검색하여 분석 결과를 사회문제 분석 서비스 서버로 제공하는 사회문제 분석 데이터 관리 서버;
    초기 사회문제 데이터 또는 운영을 위해 필요한 사회문제 데이터를 입력하는 서비스 운영자 단말;을 포함하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  2. 제 1 항에 있어서, 상기 사용자 단말을 통하여 입력되는 사회문제에 대한 정보는 사회문제의 대상, 시일, 장소, 현상, 니즈, 문제해결 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  3. 제 2 항에 있어서, 상기 사용자 단말을 통하여 입력되는 사회문제에 대한 정보는 중요도에 따라 사용자가 가중치를 설정하고,
    상기 가중치는 사회문제 주제의 구성을 모두 더했을 때 1이 되는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  4. 제 1 항에 있어서, 상기 사용자 단말을 통하여 입력되는 사회문제 정보의 텍스트 데이터는 형태소 분석을 통해 형태소 단위로 전송,저장,관리되고,
    이미지, 영상, 사운드의 데이터는 메타데이터, 또는 텍스트 변환과정을 통해 분석이 이루어지는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  5. 제 1 항에 있어서, 상기 사회문제 분석 데이터 관리 서버는,
    사회문제 DB에 입력되어 있는 사회문제에 관련된 텍스트와 사용자가 입력한 텍스트 간의 유사도를 분석하는 과정에서,
    사회문제의 대상, 시일, 장소, 현상에 관한 항목의 가중치에 따라 단어 간의 유사도 계산을 하고, 니즈, 문제해결에 관한 항목은 가중치를 차감하여 단어 간의 유사도 계산을 하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  6. 제 1 항에 있어서, 상기 사회문제 분석 데이터 관리 서버는,
    사회문제 분석 서비스 서버가 전달한 단어와 유사도가 높은 단어 리스트와, 각 단어 간의 유사도, 해당 단어와 함께 입력된 문서의 원본 URL 값을 사회문제 분석 서비스 서버로 제공하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  7. 제 1 항에 있어서, 서비스 운영자는 서비스 운영자 단말을 통하여,
    사회문제 사례정보, 연관개념 정보, 분석 결과 보정 값을 사회문제 분석 데이터 관리 서버에 입력하고 통계분석 결과와 로그데이터를 확인하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  8. 제 1 항에 있어서, 상기 사회문제 분석 데이터 관리 서버에서 사회문제 DB를 구축하기 위하여,
    문서 입력부를 통하여 문서단위로 입력된 데이터 중 텍스트 데이터를 추출하고, 이미지, 영상, 음향의 멀티미디어 데이터를 입력하면 메타 데이터, 텍스트 변환과정을 거쳐 텍스트화하는 텍스트 추출부와,
    상기 텍스트 추출부에서 텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 형태소 단위로 처리하는 형태소 분석부와,
    연관개념 입력 과정을 통해 유사도를 보정하는 연관 개념 입력부와,
    분석결과 보정을 통해 단어에 대한 유사도 값을 보정하는 분석 결과 보정부를 포함하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 시스템.
  9. 사회문제 분석 데이터 관리 서버에서, 텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 형태소 단위로 분리된 사회문제 데이터를 사회문제 DB에 저장하고, 유사도 보정을 수행하는 사회문제 DB 구축 및 관리 단계;
    사회문제 분석 데이터 관리 서버에서 사회문제 DB의 구축이 이루어진 상태에서 사회문제에 관한 주제를 수신하는 단계;
    사회문제 DB에 저장된 데이터와 수신한 사회문제 주제의 텍스트 유사도를 분석하는 단계;
    관련 단어를 포함하는 사회문제 문헌을 탐색하여 사회문제 문헌과 연결되는 링크를 출력하여 요청한 사회문제 분석 결과를 클라이언트에게 전송하는 단계;를 포함하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 방법.
  10. 제 9 항에 있어서, 상기 사회문제 DB 구축 및 관리 단계에서,
    사회문제 분석 데이터 관리 서버에서 문서단위로 입력된 데이터에서 텍스트 데이터를 추출하는 단계와,
    멀티미디어 데이터를 메타 데이터, 텍스트 변환과정을 거쳐 텍스트화 과정을 수행하는 단계와,
    텍스트로 구성된 사회문제 데이터를 형태소 분석 과정을 거쳐 기초단어로 처리하는 단계와,
    기초단어 단위로 분리된 사회문제 데이터를 문서에 포함된 단어빈도, 단어별 유사도와 함께 사회문제 DB에 저장하는 단계와,
    연관개념 입력 과정을 통해 유사도 보정, 분석결과 보정을 통해 단어에 대한 유사도 값 보정을 수행하는 단계를 포함하는 것을 특징으로 하는 데이터 마이닝을 이용한 사회문제 분석 방법.
KR1020170008087A 2016-11-21 2017-01-17 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법 KR20180057470A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20160154989 2016-11-21
KR1020160154989 2016-11-21

Publications (1)

Publication Number Publication Date
KR20180057470A true KR20180057470A (ko) 2018-05-30

Family

ID=62300211

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170008087A KR20180057470A (ko) 2016-11-21 2017-01-17 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20180057470A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022264227A1 (ja) * 2021-06-14 2022-12-22 日本電信電話株式会社 情報処理システム、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022264227A1 (ja) * 2021-06-14 2022-12-22 日本電信電話株式会社 情報処理システム、方法およびプログラム

Similar Documents

Publication Publication Date Title
US20230419261A1 (en) Social media profiling for one or more authors using one or more social media platforms
US10614077B2 (en) Computer system for automated assessment at scale of topic-specific social media impact
US10146878B2 (en) Method and system for creating filters for social data topic creation
CN106844640B (zh) 一种网页数据分析处理方法
CN104899324B (zh) 一种基于idc有害信息监测系统的样本训练系统
CN104504081A (zh) 全媒体检测及监播大数据行为智能分析系统
CN103914478A (zh) 网页训练方法及系统、网页预测方法及系统
US20120011139A1 (en) Unified numerical and semantic analytics system for decision support
US8099430B2 (en) Computer method and apparatus of information management and navigation
US10331790B1 (en) System and method for actionizing comments
CN103530364A (zh) 提供下载链接的方法及系统
KR102107474B1 (ko) 크롤링을 통한 사회이슈 도출 시스템 및 그 도출 방법
CN104636386A (zh) 信息监控方法及装置
KR101532252B1 (ko) 소셜 네트워크 정보 수집 및 분석 시스템
JP2006268690A (ja) Faq提示・改善方法、faq提示・改善装置およびfaq提示・改善プログラム
KR102413961B1 (ko) Rpa 모니터링을 이용한 뉴스 분석 서비스 제공 방법
CN104965894A (zh) 一种用于idc有害信息监测平台的数据分析系统
KR20190139037A (ko) 텍스트마이닝 기반 건설공사 문서분석방법 및 시스템
KR20180057470A (ko) 데이터 마이닝을 이용한 사회문제 분석 시스템 및 방법
CN116226494A (zh) 一种用于信息搜索的爬虫系统及方法
CN108520012A (zh) 基于机器学习的移动互联网用户评论挖掘方法
JP2018198044A (ja) 複数イベント・パターン・クエリーを生成するための装置および方法
KR101862207B1 (ko) 데이터 마이닝을 이용한 사회문제 해결기술 제공 시스템 및 방법
Cherichi et al. Big data analysis for event detection in microblogs
KR20220116086A (ko) 텍스트 데이터의 수집·정제 시스템 및 방법, 그 방법을 수행하기 위한 기록 매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application