KR101791086B1 - 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법 - Google Patents

관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법 Download PDF

Info

Publication number
KR101791086B1
KR101791086B1 KR1020170061408A KR20170061408A KR101791086B1 KR 101791086 B1 KR101791086 B1 KR 101791086B1 KR 1020170061408 A KR1020170061408 A KR 1020170061408A KR 20170061408 A KR20170061408 A KR 20170061408A KR 101791086 B1 KR101791086 B1 KR 101791086B1
Authority
KR
South Korea
Prior art keywords
data
link
point
view data
analysis
Prior art date
Application number
KR1020170061408A
Other languages
English (en)
Inventor
함영국
Original Assignee
함영국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 함영국 filed Critical 함영국
Priority to KR1020170061408A priority Critical patent/KR101791086B1/ko
Priority to PCT/KR2017/006059 priority patent/WO2018212398A1/ko
Application granted granted Critical
Publication of KR101791086B1 publication Critical patent/KR101791086B1/ko

Links

Images

Classifications

    • G06F17/30312
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 복수의 사용자 단말 및 참여자 단말과 네트워크를 통해 연결되는 분석 서버에서 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석을 수행하는 방법에 관한 것으로서, 상기 사용자 단말로부터 이슈 정보 및 목표 정보에 관련된 정보를 수신하고, 이와 관련된 가상 룸 필드를 생성하는 단계, 상기 사용자 단말 또는 참여자 단말로부터 상기 이슈 및 목표에 대한 관점 데이터를 수신하면 이를 상기 가상 룸에 로드하는 단계, 상기 사용자 단말 또는 참여자 단말로부터 상기 관점 데이터들 간을 연결하는 링크에 대한 정보와 상기 링크를 설정한 이유에 대한 연결 관점 데이터를 수신하면 이를 상기 가상 룸에 로드하는 단계 및 상기 관점 데이터들의 논리적 흐름 순서와 상기 관점 데이터들 간을 연결하는 링크들의 빈도수 정보에 기초하여 상기 이슈 정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 단계를 포함한다.
상기와 같은 본 발명에 따르면, 마인드 마이닝을 이용하여 현재의 변화요인으로 촉발된 불확실성에서 문제를 구조화하여 위험을 식별할 수 있고, 이를 활용한 모니터링, 시각화 및 시뮬레이션 등 관리기법을 통해 해법이나 대안을 도출할 수 있다.

Description

관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법{Mind Mining Analysis Method Using Links Between View Data}
본 발명은 관심 이슈 및 제시 목표 또는 기대에 대해 제시된 관점(view) 데이터 간의 링크(bridge, connection)를 이용한 마인드 마이닝 분석 방법에 관한 기술로서, 보다 상세하게는 특정 이슈와 관련하여 다양한 참여자에 의해 제시된 관점 데이터와 관점 데이터 간의 링크 구조 분석을 통해 의사결정을 위한 문제 구조화, 위크시그널(weak signal) 탐지 등 위험분석, 시나리오 도출 등을 통한 목표에 대한 가설 설정, 그리고 설계 및 검증 활동 등에 활용될 수 있도록 하는 분석 방법에 관한 것이다.
빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기가 짧고, 수치 데이터의 형태뿐 아니라 문자, 그림, 영상 데이터를 포함하는 대규모 데이터를 말한다. 위치정보 및 SNS(social network service) 등 디지털 환경은 과거에 비해 데이터 양의 폭증과 데이터 종류의 다양함을 발생시켜 사람들의 행동은 물론 생각과 의견까지 분석하고 예측할 수 있는 환경을 제공하고 있다.
비단 민간 분야뿐 아니라 공공 분야에서도 빅데이터를 양산 중이다. 센서스(Census)를 비롯한 다양한 사회 조사, 국세자료, 의료보험, 연금 등의 분야에서 대량의 데이터가 생산되고 있다. 이처럼 다양하고 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원으로 활용될 수 있다는 점에서 주목받고 있다.
최근에는 비정형 빅데이터 분석방법에 대한 요구 및 연구가 증가하고 관심이 높아지고 있다. 비정형 데이터란 숫자 데이터와 달리 문자나 그림, 영상, 문서처럼 형태와 구조가 복잡해 정형화되지 않은 데이터를 말한다. 블로그, 메신저, 게시판 등 웹에서 폭발적으로 발생하는 비정형 데이터는 그 내용을 통해 여론의 흐름을 파악할 수 있다는 점에서 주목받고 있다. 비정형 데이터 분석방법으로는 텍스트 마이닝(text mining), 웹 마이닝(web mining), 오피니언 마이닝(opinion mining) 등이 있다.
빅데이터의 분석은 데이터 마이닝(data mining)을 통해서 이루어지는데, 이는 기존의 통계적 분석방법론과 함께 기계학습(machine learning), 인공지능(artificial intelligence), 컴퓨터과학(computer science) 등을 결합해 사용한다. 즉, 통계적인 방법론뿐 아니라 기계학습(machine learning & deep learning), 신경망분석(neural network analysis) 등도 데이터로부터 정보를 추출하기 위한 다양한 접근방법들로 활용되고 있다.
빅데이터 분석 중에서도 비정형 빅데이터에 대한 분석은 주로 웹 마이닝 기법과 오피니언 마이닝 기법이 이용된다.
웹 마이닝은 인터넷을 이용하는 과정에서 생성되는 웹 로그(web log) 정보나 검색어로부터 유용한 정보를 추출하는 웹을 대상으로 한 데이터 마이닝을 말한다.
오피니언 마이닝이란 어떤 사안이나 인물, 이슈, 이벤트에 대한 사람들의 의견이나 평가, 태도, 감정 등을 분석하는 것을 말한다. 특정 이슈에 대해 사람들의 주관적인 의견을 모아 문장을 분석한다. 문장 분석에서는 사실과 의견을 구분해 의견을 뽑아내어 긍정과 부정으로 나누고 그 강도를 측정한다.
오피니언 마이닝의 분석 대상은 주로 포털 게시판, 블로그, 쇼핑몰과 같은 대규모의 웹 문서이기 때문에 자동화된 분석방법을 사용한다. 오피니언 마이닝도 분석 대상이 텍스트이므로 텍스트 마이닝에서 활용하는 자연어 처리(NLP, natural language processing) 방법, 컴퓨터 언어학(computational linguistics) 등을 활용한다.
그러나, 종래 인공 지능 등을 이용한 빅데이터 분석 방법은 다음과 같은 문제점이 존재한다.
첫째, 분석을 위해 입력되는 데이터는 관련성이 낮은 데이터가 정제된 데이터로서 어느 정도 선험적 오류가 존재할 수 있다. 예를 들어, 수많은 데이터 중에서 현재 관점에서 관련성이 낮은 것으로 판단되어 분석 대상에서 제외된 데이터(위크시그널 : weak signal)가 시간 경과에 따라 중요도가 높아지면서 와일드카드(wild card) 및 이머징리스크(emerging risk) 정보가 되는 경우가 발생할 수 있다는 점에서 데이터 정제 과정에서 선험적 오류가 발생할 수 있는 것이다.
둘째, 비정형 데이터 마이닝 기법 중 오피니언 마이닝은 의견을 긍정과 부정으로 나누어 그 강도를 측정하는 방식으로 긍적적인 여론과 부정적인 여론을 구별하는 정도로서 다양한 의견들을 조합하여 하나의 시나리오를 완성하거나 전략을 결정하는 정도에는 이르지 못해 의사결정을 위한 도구로 사용하기에는 부족한 문제가 있다.
셋째, 인공 지능과 같이 자동화된 분석방법을 적용하기 전 또는 완료 후에 분석된 데이터들을 관련 데이터들끼리 클러스터링을 하여 분석 결과 데이터들을 패턴화 또는 정규화하는 과정이 수행되는데, 이 과정은 관련 분야의 소수 전문가들의 주관적인 해석 과정을 통해 이루어지며, 전문가에 따라 데이터를 바라보는 시각이 다르고 상이한 해석을 할 수 있다는 점에서 경우에 따라서는 데이터 분석의 오류로 누적되는 경우가 있다.
따라서, 빅데이터 분석에 있어서 분석할 데이터 선택 과정에서의 선험적 오류와 소수 전문가의 주관적 해석에 의한 분석 데이터 패턴화의 문제를 해결할 수 있는 방법론에 대한 요구가 높아지고 있는 실정이다.
한국등록특허 제1730883호 "코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법" 한국공개특허 제2016-0056255호 "소셜미디어 상의 사용자 의견성향 파악을 위한 데이터 융복합 분석 방법 및 장치"
본 발명은 상기와 같은 문제점을 해결 또는 보완하기 위해 제안된 것으로서, 본 발명의 목적은 다수의 참여자의 관점(view) 데이터 간을 연결하는 링크(bridge, connection) 정보들의 강도와 연결 관점(connected bridge) 데이터를 이용하여 마인드 마이닝 분석이 이루어지는 휴먼 러닝 기법을 적용하여 보다 객관적인 관점에서 빅데이터 분석이 이루어질 수 있도록 하는 것이다.
본 발명의 다른 목적은 연결 강도가 낮은 위크시그널(weak signal)들을 수집하여 이들의 트렌드 또는 흐름을 모니터링 및 분석하여 분석과정에서의 데이터 신뢰도를 향상시키는 것이다.
상기와 같은 본 발명의 목적을 달성하기 위한 본 발명의 바람직한 일 측면에 따르면, 복수의 사용자 단말 및 참여자 단말과 네트워크를 통해 연결되는 분석 서버에서 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석을 수행하는 방법에 있어서, 상기 사용자 단말로부터 이슈 정보 및 목표 정보에 관련된 정보를 수신하고, 이와 관련된 가상 룸 필드를 생성하는 단계, 상기 사용자 단말 또는 참여자 단말로부터 상기 이슈에 대한 관점 데이터를 수신하면 이를 상기 가상 룸에 로드하는 단계;
상기 사용자 단말 또는 참여자 단말로부터 상기 관점 데이터들 간을 연결하는 링크에 대한 정보와 상기 링크를 설정한 이유에 대한 연결 관점 데이터를 수신하면 이를 상기 가상 룸에 로드하는 단계, 상기 관점 데이터들의 논리적 흐름 순서와 상기 관점 데이터들 간을 연결하는 링크들의 빈도수 정보에 기초하여 상기 이슈 정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 단계를 포함하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법이 제공된다.
여기서, 상기 관점 데이터들의 논리적 흐름 순서와 상기 관점 데이터들 간을 연결하는 링크들의 빈도수 정보에 기초하여 상기 이슈 정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 단계는, 빈도수가 높은 링크를 우선순위로 하여 상기 이슈정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 것일 수 있으며, 상기 관점 데이터들의 논리적 흐름 관점에서 상기 이슈 정보에 가까운 위치의 링크에 대하여 우선순위가 부여되는 것이 바람직하다.
그리고, 상기 관점 데이터 및 연결 관점 데이터는 비정형 데이터 또는 텍스트 데이터 중 적어도 어느 하나를 포함할 수 있고, 상기 텍스트 데이터는 상기 비정형 데이터를 설명하는 단어 또는 문장일 수 있다.
그리고, 상기 분석 서버는 각 링크를 구성하는 관점 데이터 및 연결 관점 데이터에 포함된 텍스트 데이터에 대한 텍스트 마이닝을 수행하여 각 링크에 대한 경로 설명문을 생성할 수 있고, 더 나아가 설정된 경로를 구성하는 각 링크에 대한 경로 설명문들에 대한 텍스트 마이닝을 수행하여 상기 경로 전체에 대한 종합 설명문을 생성할 수 있다.
여기서, 상기 텍스트 마이닝은, 시맨틱 데이터 정제 단계, 주요 품사 단어 추출 및 빈도수 산출 단계 및 품사별 단어 재배열 단계를 포함하여 수행될 수 있다.
그리고, 상기 분석 서버는 링크 빈도수가 기준 값보다 낮은 링크에 속하는 관점 데이터들을 위크시그널로서 추출하고, 상기 위크시그널의 주기적인 증가레벨을 검출하여 증가 레벨이 임계치를 초과하는 경우 상기 위크시그널에 속하는 관점 데이터들을 포함하는 경로를 분석 대상 경로로 설정하는 것도 가능하다.
상기와 같은 본 발명에 따르면, 마인드 마이닝을 이용하여 현재의 변화요인으로 촉발된 불확실성에서 문제를 구조화하여 위크시그널 등 예후 및 위험을 식별할 수 있고, 이를 활용한 모니터링, 시각화 및 시뮬레이션 등 관리기법을 통해 해법이나 대안을 도출할 수 있는 효과가 있다.
본 발명은 의사결정을 위한 문제 구조화, 위크시그널 등 위험분석, 시나리오 도출 등을 통한 목표에 대한 가설 설정, 그리고 설계 및 검증 활동 등의 다양한 분야에서 활용성이 높은 장점이 있다.
도 1은 본 발명에 따른 마인드 마이닝 분석 시스템의 구성을 도시한 것이다.
도 2는 이슈 및 목표 또는 기대에 대해 제시된 관점(view) 데이터 간의 연결 브릿지(bridge)를 이용한 마인드 마이닝 분석 방법에 대한 개념을 설명하기 위한 것이다.
도 3은 경로 설명문 생성 절차를 나타낸 흐름도이다.
도 4는 위크시그널 탐지 및 분석 방법을 나타낸 흐름도이다.
도 5는 마인드 마이닝 분석 결과에 대한 시각화를 예시한 것이다.
이하에서는 첨부된 도면을 참조하여 본 발명을 보다 상세하게 설명한다. 도면들 중 동일한 구성요소들은 가능한 한 어느 곳에서든지 동일한 부호로 나타내고 있음을 유의해야 한다. 한편, 이에 앞서 본 명세서 및 특허청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
도 1은 본 발명에 따른 마인드 마이닝 분석 시스템의 구성을 도시한 것이다. 도 1에 도시된 바와 같이 본 발명에 따른 마인드 마이닝 분석 시스템은 빅데이터 플랫폼(10), 분석 서버(20), 사용자 단말(30) 및 참여자 단말(40)을 포함하여 구성될 수 있다.
빅데이터 플랫폼(10)은 다양한 데이터 소스에서 수집한 데이터를 처리, 분석하여 지식을 추출하고, 이를 기반으로 지능화된 서비스를 제공하는 데 필요한 IT 환경으로서, 빅데이터 플랫폼은 확장성 있는 대용량 처리 능력, 이기종 데이터 수집 및 통합 처리 능력, 빠른 데이터 접근 및 처리 능력, 대량의 데이터를 저장 관리할 수 있는 능력, 대량의 이기종 데이터를 원하는 수준으로 분석할 수 있는 능력 등을 갖춰야 한다.
빅데이터 플랫폼(10)은 예를 들면, '한국언론재단'의 뉴스 빅데이터 플랫폼과 같은 텍스트 마이닝 서비스일 수 있으며, 텍스트 마이닝을 통해 빅데이터를 시각화하거나 빈도수가 높은 정보를 제공할 수 있다. 빈도수가 높은 정보들을 이슈로 선정하고 이에 대한 목표 또는 기대의 제시를 통해 본 발명에 따른 마인드 마이닝 분석 방법이 수행될 수 있다.
본 실시예에서는 빅데이터 플랫폼을 통해 마인드 마이닝 분석을 위한 이슈를 설정하는 것을 예시하였으나, 빅데이터 플랫폼으로부터 정보를 제공받지 않고, 사용자가 임의로 자신이 원하는 이슈와 목표 또는 기대를 설정하고, 다수의 참여자가 해당 이슈, 목표 및 기대에 대해 관점(view)을 제시하는 것에 의해 본 발명에 따른 마인드 마이닝 분석이 이루어지는 것도 가능하다.
분석 서버(20)는 다수의 사용자와 참여자가 사용자 단말(30) 및 참여자 단말(40)를 통해 접속하여 이슈 제시, 목표 및 기대 제시, 해당 이슈와 해당 목표의 관계상에 존재할 수 있는 관점(view) 제시, 관점 간의 링크(bridge, connection) 형성 및 링크 형성에 대한 연결 관점(connected bridge) 제시 등의 활동이 이루어질 수 있는 가상공간을 제공하는 것으로서, 이슈의 개수에 해당하는 수의 가상 룸을 생성할 수 있고 또는 한 개의 가상 룸에 상호 관련성이 있는 여러 개의 이슈를 제시하는 것도 가능하다. 분석 서버(20)는 사용자 단말(30)의 가상 룸 개설에 대한 요청신호에 응답하여 데이터베이스 내에 가상 룸 필드를 생성한다.
분석 서버(20)는 사용자 단말(30) 또는 참여자 단말(40)로부터 이슈와 목표에 대한 다수의 관점 데이터들과 각 관점들 간의 링크 연결을 통해 형성되는 경로 데이터 및 링크에 대한 연결 관점 데이터를 수신하면, 이러한 데이터들을 가상 룸 상에 로드하여 모든 참여자들이 업로드하는 정보들을 볼 수 있도록 하고, 수신된 데이터들에 기초하여 마인드 마이닝 분석을 수행한다.
사용자 단말(30)은 특정 이슈를 대상으로 최초 이벤트를 설정하고 자신이 원하는 목표를 제시하는 사용자의 통신단말로서, PC, 노트북, 태블릿 PC, 스마트 폰, 기타 디스플레이 장치(예, 가상현실 및 증강현실) 등의 다양한 통신단말이 사용될 수 있다. 사용자는 빅데이터 플랫폼(10)을 통해 제공된 이슈를 변화요인 또는 트리거이벤트(trigger event)로 최초 이벤트를 설정하거나 자신이 생각하는 변화요인에 관한 이슈를 대상으로 최초 이벤트를 설정할 수 있다. 사용자는 변화요인으로부터 목표 또는 기대 이전에 예상되는 중간 이벤트가 있다면 추가로 설정할 수도 있다.
사용자는 자신이 원하는 목표 또는 기대를 제시할 수 있고, 자신도 참여자로서 자신이 선택 또는 제시한 이슈들로 개설한 가상 룸에 참여할 수 있다.
참여자 단말(40)은 사용자가 개설한 가상 룸에 참여하는 참여자가 사용하는 통신단말로서, PC, 노트북, 태블릿 PC, 스마트 폰, 기타 디스플레이 장치(예, 가상현실 및 증강현실) 등의 다양한 통신단말이 사용될 수 있다. 참여자는 사용자가 개설한 가상 룸에 참여하여 이슈 및 예상 이벤트와 목표 또는 기대를 참고하여 비정형 데이터를 업로드하면서 자신의 관점을 제시하거나, 관점 간을 비정형 데이터를 수반할 수 있는 링크 생성과 함께 링크에 대한 자신의 설명(즉, 연결 관점)을 제시할 수 있다.
도 2는 이슈에 대해 제시된 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법에 대한 개념을 설명하기 위한 것이다.
사용자가 사용자 단말(30)을 통해 분석 서버(20)에 접속하여 자신의 관심 이슈와 목표 또는 기대에 대하여 다수의 참여자들이 참여할 수 있는 가상 룸을 개설하고, 해당 이슈와 목표 또는 기대에 관심이 있는 다수의 참여자들이 참여자 단말(40)을 통해 분석 서버(20)에 접속하여 개설된 가상 룸에 참여하여 해당 이슈와 목표 또는 기대 대한 관점을 제시할 수 있다.
예를 들어, 정치적인 이슈에 대한 마인드 마이닝 분석의 예로서, 이슈를 "이번 대선에서 누가 대통령이 될 자격이 있는가?"에 해당하는 정보, "후보 ○명에 대한 지지율을 알고 싶다."에 해당하는 정보 등으로 설정하고, 목표 및 기대로서 "○○○이 대통령이 되어야 한다." 등이 설정될 수 있다. 앞서 하나의 가상 룸에서 이슈가 복수 개 일 수 있듯이 하나의 가상 룸 내에서 목표 또는 기대도 복수 개일 수 있다.
도 2에서 관점 데이터(100)는 해당 이슈와 목표 또는 기대에 대하여 사용자 또는 참여자에 의해 제시된 관점에 관한 정보로서, 비정형 데이터(110)와 비정형 데이터(110)에 대한 설명 텍스트(120)를 포함할 수 있다. 비정형 데이터(110)는 해당 이슈와 관련된 그림, 동영상, URL, 문서 등일 수 있으며, 설명 텍스트(120)는 현재 이슈와 관련하여 해당 비정형 데이터를 업로드한 이유를 설명하는 문장일 수 있다.
연결 관점 데이터(200)는 참여자가 관점 데이터(100) 간을 링크하고 링크한 이유에 대한 설명을 제시하기 위해 사용되는 것으로서, 비정형 데이터(210)에 대한 설명 텍스트(220)를 포함할 수 있다. 비정형 데이터(210)는 해당 이슈와 관련된 그림, 동영상, URL, 문서 등을 업로드 할 수 있으며, 설명 텍스트(220)는 현재 이슈 및 목표와 관련하여 해당 링크를 생성한 이유를 설명하는 문장일 수 있다.
연결 관점 데이터(200)는 관점 데이터(100) 간을 연결하는 것으로서 방향성을 갖는 연결선(300)을 더 포함한다. 예를 들어, 도 2에서 관점 데이터 A(100)와 관점 데이터 B(100) 간의 연결선(300)은 참여자가 해당 이슈와 목표에 관하여 관점 A와 관점 B가 서로 관련성이 있거나 2개의 관점이 결합하면 좋을 것으로 판단한 경우 이들 간을 링크하는 것으로서, 참여자들이 선택된 링크의 수가 많을수록 연결선이 굵어지도록 표시하거나 연결선의 색상이 가변되도록 하는 등 링크의 빈도수를 인식할 수 있도록 하는 방식이면 어느 것이든 사용될 수 있다.
도 2를 참조하면, 우선 사용자는 자신의 관심 이슈를 주제로 하는 가상 룸의 개설과 목표 또는 기대를 제시하고, 해당 관심 이슈에 대한 자신의 관점 데이터 A를 제시하여 최초 이벤트를 설정할 수 있다. 이후, 참여자들이 개설된 방에 참여하여 해당 이슈와 목표에 대한 자신의 관점(관점 B, 관점 C, 관점 D 등)을 제시할 수 있다. 여기서, 관점은 개설된 이슈들과 목표들의 관계 사이의 의견 또는 특정 이슈 및 목표에 대한 의견일 수 있다. 상술한 바와 같이, 여기서 제시되는 관점은 비정형 데이터(110)와 이에 대한 설명 텍스트(120)일 수 있으며, 이 중 어느 하나만을 포함할 수도 있다. 이 경우 이후 텍스트 마이닝 분석을 위해서는 설명 텍스트는 제시되는 것이 바람직하다.
그리고, 참여자들은 관점을 제시하지 않고 또는 관점 제시와 함께 관점 데이터와 관점 데이터 간을 링크하면서 연결 관점 데이터(링크 AB, 링크 BD, 링크 AC, 링크 CD)를 제시할 수도 있다. 여기서, 연결 관점은 참여자가 2개의 관점을 연결한 이유에 대한 의견 또는 설명으로서, 2개의 관점을 연계하면 좋은 의견 또는 좋은 해답이 될 수 있는 경우에 관한 것일 수 있다. 상술한 바와 같이, 여기서 제시되는 연결 관점 데이터(200)는 비정형 데이터(210)와 이에 대한 설명 텍스트(220)일 수 있으며, 이 중 어느 하나만을 포함할 수도 있다. 이 경우에도 이후 텍스트 마이닝 분석을 위해서는 설명 텍스트는 제시되는 것이 바람직하다.
도 2에서 분석 서버는 각 링크를 연결하여 관심 이슈에서 출발하여 목표에 도달하는 경로를 설정한다. 이때 링크 간을 연결하는 경로는 여러 개가 형성될 수 있으며, 도 2에서는 관점 A - 관점 B - 관점 D를 연결하는 경로와 관점 A- 관점 C- 관점 D를 연결하는 경로 즉 2개의 경로가 존재하는 경우를 예시하고 있다.
이때 관심 이슈와 목표를 연결하는 경로를 형성하는 규칙은 다음과 같이 설정될 수 있다.
(1) 링크의 빈도수 즉, 참여자들이 해당 링크를 선택한 수가 많을수록 우선순 위가 높아지도록 설정하여 우선 순위가 높은 링크들을 연결하면 하나의 경로가 완성된다.
(2) 링크들 중에서 제시된 이슈에 가까운 링크(논리 흐름상 제시된 이슈에 가까운 위치에 있는 링크)에 우선 순위를 부여한다. 이는 논리 흐름상 초기에 제시된 관점에 링크가 많은 경우 해당 관점이 해당 이슈를 먼저 선점하고 있다고 판단하는 것으로서, 다른 관점에서의 분석이 필요한 경우 우선순위는 달라질 수 있다. 여기서, 논리 흐름은 시간의 흐름상의 순서일 수 있다.
예를 들어, 도 2에서 링크 AB의 연결선과 링크CD의 연결선의 빈도수가 높고, 링크 BD와 링크 AC의 연결선이 상대적으로 빈도수가 낮은 경우, 위의 규칙을 적용하면 빈도수가 높은 링크 AB와 링크CD에 우선순위가 있으나, 링크 AB가 링크 CD에 비해 논리적 흐름에서 빠른 시점에 위치하므로 링크 AB를 포함하는 경로인 관점 A - 관점 B - 관점 D를 연결하는 경로가 메인 경로로서 선택되고, 이에 대한 분석이 이루어지게 된다.
도 3은 경로 설명문 생성 절차를 나타낸 흐름도이다.
도 2에서 다수의 참여자에 의해 다수의 관점 데이터 및 연결 관점 데이터가 제시되면, 이를 시각화하여 제공할 필요가 있다.
시각화의 방법으로서 관점 데이터와 연결 관점 데이터의 개수가 적은 경우에는 이들 모두를 보여주는 것이 가능하나, 개수가 많은 경우에는 이들에 대한 텍스트 마이닝을 통해 대표 키워드나 대표 키워드로 이루어지는 문장 또는 대표성을 갖는 심벌(Symbol) 등으로 제시할 필요가 있다.
도 2는 이에 대한 방법에 관한 것으로서, 다수의 관점 데이터와 연결 관점 데이터가 수집되면, 분석 서버(20)는 시맨틱 데이터 분석 방법을 통해 기계가 관점 데이터 및 연결 관점 데이터의 문맥적 의미를 이해하고, 추론 및 정제를 통해 관련성이 높은 데이터들을 선별한다(S300).
위의 과정을 통해 데이터가 정제되면, 분석 서버(20)는 관점 데이터에서 공통적으로 사용되는 주요 품사별 단어를 추출하고 그 빈도수를 산출한다(S310). 주요 품사로는 의미 전달에 있어 중요한 품사로서 형용사, 명사, 동사가 사용될 수 있다.
그 다음, 분석 서버(20)는 빈도수가 높은 주요 품사별 단어들을 재배열하여 경로 설명문을 생성한다(S320).
예를 들어, S310 단계에서 빈도수가 높은 형용사로서 "substantial", 명사로서 "ERWS", "acceptability", 동사로서 "investigate"가 추출된 경우, S320의 재배열 단계를 통해 경로 설명문은 "investigate substantial ERWS acceptability"의 형태로 생성할 수 있다. 이러한 과정을 통해 하나의 링크를 구성하는 2개의 관점 데이터와 이들의 연결이유를 설명하는 연결 관점 데이터들을 1개 또는 복수 개의 경로 설명문으로 표현할 수 있게 된다.
더 나아가, 제시된 이슈와 목표는 여러 개의 논리적 흐름 순서를 갖는 링크의 연결 구조를 갖는 경로를 통해 연결되어 경로를 구성하는 각 링크에 대한 경로 설명문들에 대해서도 텍스트 마이닝 등의 분석을 통해 경로 전체를 압축적으로 설명하는 설명문을 생성하는 것도 가능할 수 있다.
도 4는 위크시그널 탐지 및 분석 방법을 나타낸 흐름도이다.
배경기술에서 설명한 바와 같이 분석을 위해 입력되는 데이터는 관련성이 낮은 데이터가 정제된 데이터로서 어느 정도 선험적 오류가 존재할 수 있는데, 도 4에서는 이를 해결하기 위한 방법을 제시한다.
도 2에서 연결선(300)이 없거나 연결선(300)이 가는 링크를 갖는 관점 데이터(100)는 마인드 마이닝 분석에서 사용되지 않는 정보이다. 따라서, 분석서버(20)는 이러한 데이터들을 위크시그널로 간주하여 위크시그널만을 별도로 추출하여 저장한다(S400).
분석서버(20)는 일정 주기마다 위크시그널들의 빈도수를 분석하여 위크시그널들의 증가 레벨을 검출한다(S410).
분석 서버(20)는 위크시그널들의 증가 레벨 정보에 기초하여 위크시그널의 트렌드를 분석하고 보고서를 생성한다(S420). 분석서버(20)는 위크시그널의 증가 레벨이 임계치를 넘어서는 경우 해당 위크시그널을 와일드카드로 간주하여 해당 관점 데이터를 반영한 마이닝 마인드 분석을 수행할 수 있다.
예를 들어, 도 2에서 설명한 바와 같이, 링크 AB의 연결선과 링크CD의 연결선의 빈도수가 높고, 링크 BD와 링크 AC의 연결선이 상대적으로 빈도수가 낮은 경우 관점 A - 관점 C - 관점 D를 연결하는 경로는 위크시그널로서 인식된다.
따라서, 상기 경로에 대해서는 마이닝 마인드 분석은 이루어지지 않으나, 이들 정보들을 위크시그널로서 계속 추출하여 저장하여 두고, 일정 주기마다 해당 위크시그널의 증가 레벨을 검출하여 설정된 임계치를 넘어서면 해당 시그널도 의미 있는 정보로서 인식하여, 상기 위크시그널에 해당하는 경로에 대해서도 마인드 마이닝 분석이 이루어지도록 함으로써 보다 객관적인 분석이 가능하도록 할 수 있다.
도 5는 마인드 마이닝 분석 결과에 대한 시각화를 예시한 것이다.
도 2에서 관점 데이터 및 연결 관점 데이터의 수가 많은 경우에는 해당 데이터들에 대한 마인드 특성을 하나의 아이콘이나 심벌 형태로 표시하여 시각화하는 것이 효율적일 수 있다. 이러한 시각화는 시스템 다이나믹스 시뮬레이션 기법의 일종으로서, 도 5의 실시예에서는 각 관점의 마인드 특성을 행성의 생명 주기에 관한 그림으로 표현한 경우를 예시하고 있다.
비록 본 발명이 상기 바람직한 실시 예들과 관련하여 설명되어졌지만, 발명의 요지와 범위로부터 벗어남이 없이 다양한 수정이나 변형을 하는 것이 가능하다. 따라서, 첨부된 특허 청구범위는 본 발명의 요지에 속하는 이러한 수정이나 변형을 포함할 것이다.
10 : 빅데이터 플랫폼 20 : 분석 서버
30 : 사용자 단말 40 : 참여자 단말

Claims (9)

  1. 복수의 사용자 단말 및 참여자 단말과 네트워크를 통해 연결되는 분석 서버에서 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석을 수행하는 방법에 있어서,
    상기 사용자 단말로부터 이슈 정보 및 목표 정보에 관련된 정보를 수신하고, 이와 관련된 가상 룸 필드를 생성하는 단계;
    상기 사용자 단말 또는 참여자 단말로부터 상기 이슈에 대한 관점 데이터를 수신하면 이를 상기 가상 룸에 로드하는 단계;
    상기 사용자 단말 또는 참여자 단말로부터 상기 관점 데이터들 간을 연결하는 링크에 대한 정보와 상기 링크를 설정한 이유에 대한 연결 관점 데이터를 수신하면 이를 상기 가상 룸에 로드하는 단계;
    상기 관점 데이터들의 논리적 흐름 순서와 상기 관점 데이터들 간을 연결하는 링크들의 빈도수 정보에 기초하여 상기 이슈 정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 단계를 포함하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  2. 제 1 항에 있어서,
    상기 관점 데이터들의 논리적 흐름 순서와 상기 관점 데이터들 간을 연결하는 링크들의 빈도수 정보에 기초하여 상기 이슈 정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 단계는, 빈도수가 높은 링크를 우선순위로 하여 상기 이슈정보로부터 상기 목표 정보를 연결하는 경로를 설정하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  3. 제 2 항에 있어서,
    상기 관점 데이터들의 논리적 흐름 관점에서 상기 이슈 정보에 가까운 위치의 링크에 대하여 우선순위가 부여되는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  4. 제 2 항에 있어서,
    상기 관점 데이터 및 연결 관점 데이터는 비정형 데이터 또는 텍스트 데이터 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  5. 제 4 항에 있어서,
    상기 텍스트 데이터는 상기 비정형 데이터를 설명하는 단어 또는 문장인 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  6. 제 4 항에 있어서,
    상기 분석 서버는 각 링크를 구성하는 관점 데이터 및 연결 관점 데이터에 포함된 텍스트 데이터에 대한 텍스트 마이닝을 수행하여 각 링크에 대한 경로 설명문을 생성하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  7. 제 6 항에 있어서,
    상기 분석 서버는 설정된 경로를 구성하는 각 링크에 대한 경로 설명문들에 대한 텍스트 마이닝을 수행하여 상기 경로 전체에 대한 종합 설명문을 생성하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  8. 제 6 항 또는 7 항에 있어서,
    상기 텍스트 마이닝은, 시맨틱 데이터 정제 단계, 주요 품사 단어 추출 및 빈도수 산출 단계 및 품사별 단어 재배열 단계를 포함하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
  9. 제 4 항에 있어서,
    상기 분석 서버는 링크 빈도수가 기준 값보다 낮은 링크에 속하는 관점 데이터들을 위크시그널로서 추출하고, 상기 위크시그널의 주기적인 증가레벨을 검출하여 증가 레벨이 임계치를 초과하는 경우 상기 위크시그널에 속하는 관점 데이터들을 포함하는 경로를 분석 대상 경로로 설정하는 것을 특징으로 하는 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법.
KR1020170061408A 2017-05-18 2017-05-18 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법 KR101791086B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170061408A KR101791086B1 (ko) 2017-05-18 2017-05-18 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법
PCT/KR2017/006059 WO2018212398A1 (ko) 2017-05-18 2017-06-12 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170061408A KR101791086B1 (ko) 2017-05-18 2017-05-18 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법

Publications (1)

Publication Number Publication Date
KR101791086B1 true KR101791086B1 (ko) 2017-10-27

Family

ID=60300395

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170061408A KR101791086B1 (ko) 2017-05-18 2017-05-18 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법

Country Status (2)

Country Link
KR (1) KR101791086B1 (ko)
WO (1) WO2018212398A1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060271526A1 (en) 2003-02-04 2006-11-30 Cataphora, Inc. Method and apparatus for sociological data analysis

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101735312B1 (ko) * 2013-03-28 2017-05-16 한국전자통신연구원 소셜 미디어 분석을 기반으로 복합이슈를 탐지하기 위한 장치, 시스템 및 그 방법
KR101638535B1 (ko) * 2014-12-02 2016-07-11 세종대학교 산학협력단 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체
KR101542235B1 (ko) * 2015-01-23 2015-08-06 주식회사 프로이트 실시간 데이터 마이닝 방법
ZA201504892B (en) * 2015-04-10 2016-07-27 Musigma Business Solutions Pvt Ltd Text mining system and tool

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060271526A1 (en) 2003-02-04 2006-11-30 Cataphora, Inc. Method and apparatus for sociological data analysis

Also Published As

Publication number Publication date
WO2018212398A1 (ko) 2018-11-22

Similar Documents

Publication Publication Date Title
Hamborg et al. Automated identification of media bias in news articles: an interdisciplinary literature review
AU2018383346B2 (en) Domain-specific natural language understanding of customer intent in self-help
Pappa et al. Harnessing social media data for pharmacovigilance: a review of current state of the art, challenges and future directions
US9892109B2 (en) Automatically coding fact check results in a web page
Bigham et al. Human-computer interaction and collective intelligence
US10891322B2 (en) Automatic conversation creator for news
KR101695011B1 (ko) 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법
Karduni et al. Vulnerable to misinformation? Verifi!
Núñez-Valdez et al. A recommender system based on implicit feedback for selective dissemination of ebooks
JP6776310B2 (ja) ユーザ−入力コンテンツと連関するリアルタイムフィードバック情報提供方法およびシステム
US10482142B2 (en) Information processing device, information processing method, and program
KR101735312B1 (ko) 소셜 미디어 분석을 기반으로 복합이슈를 탐지하기 위한 장치, 시스템 및 그 방법
McKelvey et al. Visualizing communication on social media: Making big data accessible
WO2019060520A1 (en) METHOD, APPARATUS AND COMPUTER-READABLE MEDIA FOR SEMANTIC ANALYSIS AND ANNOTATION OF CLIENT INTERACTIONS
US10770072B2 (en) Cognitive triggering of human interaction strategies to facilitate collaboration, productivity, and learning
Scharl et al. Semantic systems and visual tools to support environmental communication
Kim et al. You Don't Know How I Feel: Insider-Outsider Perspective Gaps in Cyberbullying Risk Detection
Nakov et al. A survey on predicting the factuality and the bias of news media
KR20180078022A (ko) 패션 분야의 트렌드 분석방법 및 이를 포함하는 저장매체
Mehmood et al. A study of sentiment and trend analysis techniques for social media content
Cheng et al. Context-based page unit recommendation for web-based sensemaking tasks
WO2023040516A1 (zh) 一种事件整合方法、装置、电子设备、计算机可读存储介质及计算机程序产品
KR101791086B1 (ko) 관점 데이터 간의 링크를 이용한 마인드 마이닝 분석 방법
Shapiro et al. Visual deep learning recommender system for personal computer users
KR20200106231A (ko) 정성적 가짜 뉴스 판단 시스템, 판단 방법 및 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant