KR101907041B1 - 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법 - Google Patents

소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법 Download PDF

Info

Publication number
KR101907041B1
KR101907041B1 KR1020120147067A KR20120147067A KR101907041B1 KR 101907041 B1 KR101907041 B1 KR 101907041B1 KR 1020120147067 A KR1020120147067 A KR 1020120147067A KR 20120147067 A KR20120147067 A KR 20120147067A KR 101907041 B1 KR101907041 B1 KR 101907041B1
Authority
KR
South Korea
Prior art keywords
risk
prediction
social web
block
web content
Prior art date
Application number
KR1020120147067A
Other languages
English (en)
Other versions
KR20140079563A (ko
Inventor
김현진
이충희
오효정
장명길
조요한
김현기
류법모
허정
윤여찬
최미란
최윤재
박상규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120147067A priority Critical patent/KR101907041B1/ko
Priority to US13/868,678 priority patent/US20140172497A1/en
Publication of KR20140079563A publication Critical patent/KR20140079563A/ko
Application granted granted Critical
Publication of KR101907041B1 publication Critical patent/KR101907041B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

본 발명의 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치는 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 어휘를 추출하여 관리하는 리스크 어휘 관리부와, 상기 소셜 웹 콘텐츠의 원문으로부터 분석대상이 되는 텍스트와 관련된 메타정보를 추출하여 언어분석 및 감성분석을 수행하는 리스크 이슈 예측 분석 자질 추출부와, 추출된 자질들을 기반으로 통계적 및 기계학습 방법의 예측 방식을 통해 리스크 예측분석을 모델링하는 리스크 예측 모델링부와, 상기 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 인식되는 리스크를 자동 탐지하고, 탐지된 리스크를 자동 알람하는 리스크 탐지 및 알람부와, 상기 탐지된 리스크에 대해 알람이 울릴 때 리스크 대상에 대한 리스크 상태를 실시간으로 모니터링하는 리스크 상황 모니터링부와, 모니터링되는 리스크 정보에 대한 사용자 피드백을 수용하고, 종료된 리스크의 상황에 대한 기록을 관리하는 리스크 히스토리 관리부를 포함할 수 있다.

Description

소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법{APPARATUS AND METHOD FOR MANAGING RISK BASED ON PREDICTION ON SOCIAL WEB MEDIA}
본 발명은 소셜 웹 콘텐츠에서 예측 기반으로 리스크를 관리하는 기법에 관한 것으로, 더욱 상세하게는 소셜 미디어 상의 소셜 웹 콘텐츠(예컨대, 웹 콘텐츠, 뉴스, 블로그, 트윗 등의 SNS 콘텐츠)에서 도출 혹은 잠재되어 있는 리스크(위기) 이슈를 예측하고 조기 탐색하여 사용자에게 알람해 주며, 리스크의 진행 상황에 대한 모니터링을 통해 리스크 이슈를 지속적으로 관리하는데 적합한 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법에 관한 것이다.
잘 알려진 바와 같이, 소셜 미디어가 기업, 정부, 개인에 이르기까지 소통과 홍보 등의 도구로 활용되고 있는 시대에, 소셜 미디어에서의 특성상 악성 루머, 불만 사항, 소문 등으로 시작하는 정보들이 짧은 시간에 해당 기업, 정부, 개인들을 위기 상황으로 몰아가는 경우가 흔히 발생하고 있다.
따라서, 최근에는 다양한 분야(예컨대, 정치, 경제, 사회 등)에서 무엇이 이슈가 되고 있는 지, 부정적인 정보들이 논란이 되고 있지 않은 지 등에 대해 심도 있게 분석하는 기술에 대한 수요가 높아지고 있다.
실제로, 기업들 사이에는 소셜 미디어에서 논란이 되어 기업이 위기 상태를 맞이한 사례를 기반으로'소셜 미디어 상의 위기 대응 방법'등을 구체적으로 언급하며, 그에 대한 대책 마련을 고민하고 있는 사례도 빈번히 접할 수 있다.
그러나, 대부분의 소셜 미디어 분석 기술들(예컨대, Recorded Future, 다음소프트의'소셜 메트릭스', 코난테크놀로지의'펄스 K'등)은 소셜 미디어에서 최근 사람들의 관심이 높은 것이 무엇인지에 대해 초점을 맞춘 기술들이 주류를 이루고 있는데, 이러한 기술들은 소셜 미디어에서의 전반적인 동향을 파악해 주고 이슈를 분석하는데 그치고 있으며, 실제 실시간으로 벌어지고 있는 위기 상황에 대한 대처에는 부적합하다는 문제가 있다.
따라서 실시간으로 기업, 정부, 개인 각각의 대상에 특화된 위기(Risk) 상황을 예측 및 인지하고, 예측 및 인지된 리스크 상황에 대해 신속하게 대처할 수 있도록 지원 가능한 기술에 대한 요구가 필요하다.
대한민국 공개특허 제2012-0087303호(공개일 : 2012. 08. 07.)
본 발명은 소셜 미디어 상에서 기업, 정부, 개인에게 발생하거나 혹은 발생할 잠재력이 있는 리스크에 대해 예측 방식을 적용하여 분석함으로써, 사용자에게 실시간으로 리스크 상황을 알람 및 모니터링해 주고, 리스크 상황에 대한 피드백을 시스템이 받아 그 히스토리를 관리하게 함으로써 리스크 예측의 신뢰도를 높일 수 있는 기법을 제공할 수 있다.
본 발명은, 일 관점에 따라, 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 어휘를 추출하여 관리하는 리스크 어휘 관리부와, 상기 소셜 웹 콘텐츠의 원문으로부터 분석대상이 되는 텍스트와 관련된 메타정보를 추출하여 언어분석 및 감성분석을 수행하는 리스크 이슈 예측 분석 자질 추출부와, 추출된 자질들을 기반으로 통계적 및 기계학습 방법의 예측 방식을 통해 리스크 예측분석을 모델링하는 리스크 예측 모델링부와, 상기 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 인식되는 리스크를 자동 탐지하고, 탐지된 리스크를 자동 알람하는 리스크 탐지 및 알람부와, 상기 탐지된 리스크에 대해 알람이 울릴 때 리스크 대상에 대한 리스크 상태를 실시간으로 모니터링하는 리스크 상황 모니터링부와, 모니터링되는 리스크 정보에 대한 사용자 피드백을 수용하고, 종료된 리스크의 상황에 대한 기록을 관리하는 리스크 히스토리 관리부를 포함하는 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치를 제공한다.
본 발명의 상기 어휘는, 상기 리스크로 관리해야 할 키워드 및 이벤트를 포함할 수 있다.
본 발명의 상기 리스크 어휘 관리부는, 관리하고자 하는 리스크 대상 키워드와 대상 이벤트의 입력을 위한 사용자 인터페이스를 제공하는 수동 입력 관리 블록과, 리스크로 관리하고자 하는 특정 소셜 웹 콘텐츠에 대한 사용자 입력을 제공하고, 상기 특정 소셜 웹 콘텐츠로부터 선택된 이벤트 및 키워드의 등록을 위한 사용자 인터페이스를 제공하는 반자동 추천 블록과, 기 저장된 유사 사례들로부터 리스크 키워드 및 리스크 이벤트를 자동 추출하는 자동 추천 블록을 포함할 수 있다.
본 발명의 상기 리스크 이슈 예측 분석 자질 추출부는, 상기 소셜 웹 콘텐츠를 실시간으로 수집 및 저장하는 소셜 웹 콘텐츠 수집 블록과, 수집된 상기 소셜 웹 콘텐츠에 대한 자연언어 처리를 통해 언어를 분석하는 언어 분석 블록과, 입력문에 나타난 감성 단어들에 의거하여 각 단어의 감성을 분석하는 감성 분석 블록과, 언어 분석의 결과에 따라 리스크 이벤트를 명사 형태, 복합명사 형태, 구문 형태 중 어느 하나의 자질로 추출하는 리스크 이벤트 자질 추출 블록과, 리스크 대상 키워드 및 대상 이벤트가 소셜 웹 콘텐츠 상에서 단위 시간당 얼마나 출현했는지에 대한 정보를 추출하는 빈도 자질 추출 블록과, 리스크 대상 키워드에 대해 문장 내에서의 감성분석 정보를 추출하여 해당 감성의 추이가 부정의 감성을 내포하고 있는 정도를 감성 자질로 추출하는 감성 자질 추출 블록과, 단위 시간 내에서 네트워크의 전파 양상의 추이를 리스크 이슈 자질로 추출하는 네트워크 전파 자질 추출 블록과, 리스크 키워드와 이벤트가 문서에서 나타나는 양상을 라이프 사이클 자질로 추출하는 라이프 사이클 자질 추출 블록을 포함할 수 있다.
본 발명의 상기 자연언어 처리는, 상기 소셜 웹 콘텐츠에 대한 전처리, 형태소 분석, 개체명 인식, 구문분석 및 관계추출을 포함할 수 있다.
본 발명의 상기 자연언어 처리는, 상기 소셜 웹 콘텐츠에 대한 예측 자질의 종류와 단계에 따라 그 적용을 서로 달리할 수 있다.
본 발명의 상기 감성 분석 블록은, 상기 각 단어의 감성 정도를 수치 정보로 추출하여 세분화할 수 있다.
본 발명의 상기 감성 분석 블록은, 상기 각 단어의 감성을 긍정, 부정, 중립, 자질 중 어느 하나로 분류할 수 있다.
본 발명의 상기 빈도 자질 추출 블록은, 시간의 흐름에 따른 빈도 추이의 모델링을 통해 상대적으로 짧은 시간에 상대적으로 많은 빈도가 추출되는 지와 지속성이 유지되는지 혹은 일반적 빈도 추이와는 다른 이상치 현상의 빈도가 추출되는 지를 반도 자질로서 추출할 수 있다.
본 발명의 상기 네트워크 전파 자질 추출 블록은, 상기 네트워크의 전파 양상 중에서 형태가 다른 사용자 집단들에 고루 분포되는지의 여부와 전파 속도가 급속히 이뤄지는 지의 여부를 네트워크 전파 자질로 추출할 수 있다.
본 발명의 상기 라이프 사이클 자질 추출 블록은, 상기 양상이 일반적 현상인지 혹은 리스크 상태로 인정 가능한 현상인지를 나타내기 위한 모델링의 자질로 활용하기 위해, 기간별 빈도 추이를 생성, 소멸, 재생의 라이프사이클 형식 및 타입으로 분류 및 정의할 수 있다.
본 발명의 상기 리스크 예측 모델링부는, 로지스틱 회귀, 선형 회귀, SVM 방식 중 어느 하나를 상기 통계적 및 기계학습 방법으로 이용할 수 있다.
본 발명의 상기 리스크 상황 모니터링부는, 상기 리스크 대상에 대해 현재의 실시간 빈도 추이 및 과거 소셜 웹 콘텐츠에서의 빈도 추이를 모니터링하는 빈도 모니터링 블록과, 상기 리스크 대상에 대한 감성 정보를 시간의 추이에 따른 스펙트럼으로 제공하는 감성 스펙트럼 모니터링 블록과, 네트워크 전파 양상을 그래픽 형식 또는 전파 양상의 분류 타입으로 정의하여 제공하는 네트워크 분산 모니터링 블록과, 상기 리스크 대상에 대한 소셜 웹 콘텐츠가 각 매체별로 확산되는 양상을 모니터링하는 매체별 확산 모니터링 블록과, 상기 리스크 대상과 과거 사례에서 유사한 리스크 이벤트가 발생한 이력이 있는지의 여부를 검색하는 유사 사례 검색 블록과, 탐지된 리스크의 알람에 대한 피드백을 전달하는 리스크 피드백 블록을 포함할 수 있다.
본 발명의 상기 분류 타입은, 분산형, 밀집형, 확산형 중 어느 하나일 수 있다.
본 발명의 상기 리스크 히스토리 관리부는, 리스크 알람에 대해서 시스템으로 피드백을 전달하는 리스크 상태 피드백 블록과, 리스크 상태 피드백에서 반영된 정보에 따라 리스크 모델을 재학습하는 피드백 기반 리스크 모델 학습 블록과, 상기 리스크 대상과 과거 사례에서 유사한 리스크 이벤트가 발생한 이력이 있는지를 검색하는 유사 사례 검색 블록과, 상기 리스크의 유형을 분석하여 리스크 관리 대상에 대한 통계적인 정보를 제공하는 리스크 유형 분석 블록을 포함할 수 있다.
본 발명의 상기 리스크 상태 피드백 블록은, 리스크 상태가 아닌 경우일 때, 성능 개선의 반영을 위해 리스크 해제 피드백을 상기 시스템으로 전달할 수 있다.
본 발명의 상기 유사 사례 검색 블록은, 동일 리스크 대상에서 과거 발생한 리스크 이벤트 혹은 상기 리스크 대상과 동일한 분류의 리스크 대상에서 과거에 일어난 유사한 리스크 이벤트를 검색할 수 있다.
본 발명의 상기 리스크 유형 분석 블록은, 상기 리스크 대상에 따라 리스크 이벤트 유형, 시간의 추이에 따른 계절적 리스크 유형 또는 반복적 리스크 유형, 확산의 양상에 따른 일회성 리스크 유형 또는 지속적 리스크 유형 중 어느 한 유형을 상기 리스크의 유형으로 제공할 수 있다.
본 발명은, 다른 관점에 따라, 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 어휘를 추출하여 관리하는 과정과, 추출된 상기 소셜 웹 콘텐츠의 원문으로부터 분석대상이 되는 텍스트와 관련된 메타정보를 추출하여 언어분석 및 감성분석을 수행하는 과정과, 추출된 자질들을 기반으로 통계적 및 기계학습 방법의 예측 방식을 통해 리스크 예측분석을 모델링하는 과정과, 상기 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 인식되는 리스크를 자동 탐지한 후 알람하는 과정과, 탐지된 리스크에 대해 알람이 울릴 때 리스크 대상에 대한 리스크 상태를 실시간으로 모니터링하는 과정과, 상기 탐지된 리스크에 대한 상황이 종료될 때 관련 리스크 종료 상황을 리스크 히스토리 DB에 기록하는 과정을 포함하는 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 방법을 제공한다.
본 발명의 상기 모델링하는 과정은, 로지스틱 회귀, 선형 회귀, SVM 방식 중 어느 하나를 상기 통계적 및 기계학습 방법으로 이용할 수 있다.
본 발명에 따르면, 소셜 미디어 상에서 도출 혹은 잠재되어 있는 리스크 이슈들을 조기에 찾아내고, 그 진행 상황의 모니터링을 통해 미래의 진행 추이를 예측함으로써, 기업, 정부, 개인들이 소셜 미디어를 통해 발생할 수 있는 리스크(위기) 상황을 적절한 시기에 대처 및 관리할 수 있도록 해 줌으로써, 다음과 같은 효과를 얻을 수 있다.
첫째, 리스크 대상과 관련된 리스크 이슈를 자동으로 탐지하고, 각 리스크를 단계로 구분하여 사용자에게 조기 알람해 줌으로써, 발생 가능한 리스크에 대한 조기 대처 방안을 제공할 수 있다.
둘째, 데이터의 일시적인 현상만으로 판단해서 상황을 알려주는 것이 아니라, 과거의 데이터로부터 다양한 언어적/네트워크적 자질들을 추출해서 예측 모형을 제시함으로써, 보다 조기에 정확한 리스크 상태를 제공할 수 있다.
셋째, 일방적인 시스템의 결과를 반영하는 것이 아니라, 시스템과 사용자의 피드백 방식을 통해 각 사용자마다의 리스크 모델링이 최적화될 수 있는 방안을 제시함으로써, 시스템에 대한 지속적인 성능 개선을 실현할 수 있다.
도 1은 본 발명에 따른 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치의 블록 구성도,
도 2는 도 1에 도시된 리스크 어휘 관리부의 세부적인 블록 구성도,
도 3은 도 1에 도시된 리스크 이슈 예측 분석 자질 추출부의 세부적인 블록 구성도,
도 4는 본 발명에 따른 리스크 탐지 및 알람을 위한 예시적인 시나리오 1을 설명하기 위한 개념도,
도 5는 본 발명에 따른 리스크 탐지 및 알람을 위한 예시적인 시나리오 2를 설명하기 위한 개념도,
도 6은 본 발명에 따라 리스크 상황을 모니터링하는 예시적인 시나리오 1을 설명하기 위한 개념도,
도 7은 본 발명에 따라 리스크 상황을 모니터링하는 예시적인 시나리오 2를 설명하기 위한 개념도,
도 8은 도 1에 도시된 리스크 상황 모니터링부의 세부적인 블록 구성도,
도 9는 본 발명에 따라 리스크 세부 정보를 모니터링하는 예시적인 시나리오 1을 설명하기 위한 개념도,
도 10은 본 발명에 따라 리스크 세부 정보를 모니터링하는 예시적인 시나리오 2를 설명하기 위한 개념도,
도 11은 본 발명에 따라 리스크 세부 정보를 모니터링하는 예시적인 시나리오 3을 설명하기 위한 개념도,
도 12는 도 1에 도시된 리스크 히스토리 관리부의 세부적인 블록 구성도.
먼저, 본 발명의 장점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되는 실시 예들을 참조하면 명확해질 것이다. 여기에서, 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 발명의 범주를 명확하게 이해할 수 있도록 하기 위해 예시적으로 제공되는 것이므로, 본 발명의 기술적 범위는 청구항들에 의해 정의되어야 할 것이다.
아울러, 아래의 본 발명을 설명함에 있어서 공지 기능 또는 구성 등에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들인 것으로, 이는 사용자, 운용자 등의 의도 또는 관례 등에 따라 달라질 수 있음은 물론이다. 그러므로, 그 정의는 본 명세서의 전반에 걸쳐 기술되는 기술사상을 토대로 이루어져야 할 것이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예에 대하여 상세하게 설명한다.
먼저, 본 발명에서 사용되는 용어인 리스크(Risk), 리스크 대상(Entity) 및 리스크 이벤트(Event)는 다음과 같이 정의될 수 있다.
리스크
소셜 웹 콘텐츠(예컨대, 뉴스, 블로그, 트윗 등의 SNS 문서 등)에서 다양하게 발생하는 이슈 중에서 고객(사용자)에게 위협이 되거나 혹은 잠재적으로 위험을 내포하고 있는 이슈들을 리스크로 정의함
리스크 대상
리스크를 관리해야 하는 모든 것이 대상이 될 수 있으며, 주로 기업, 브랜드, 제품, 사람(예컨대, 특정 인물, 기관의 대표, 연예인 등), 정책, 기관(정부 기관 포함) 등이 될 수 있음
리스크 이벤트
리스크 대상에서 선정한 위험성 있는 것들은 모두 리스크 이벤트로 정의할 수 있으며, 기업, 제품, 사람, 정책 등에 대해서는 예컨대 다음과 같은 사항들이 리스크 이벤트로 관리 대상이 될 수 있음
기술적 원인에 의한 이벤트 : 불량/고장, 리콜/회수, 정보 유출, 세균 검출, 사고 등
내외부적 적대 세력에 의한 이벤트 : 불매운동, 악성루머 등
기후나 자연적 요인 및 환경 관련 이벤트 : 태풍, 가뭄, 기름 유출, 오염 등
불법/법률적 행위로 인한 이벤트 : 소송, 위법행위, 위반/적발 등
부정부패에 의한 이벤트 : 뇌물 수수, 병역비리 등의 각종 비리 등
기타 이벤트 : 마약, 스캔들 등
도 1은 본 발명에 따른 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치의 블록 구성도로서, 리스크 어휘 관리부(102), 리스크 이슈 예측 분석 자질 추출부(104), 리스크 예측 모델링부(106), 리스크 예측 자질 DB(108), 리스크 유형 DB(110), 리스크 히스토리 DB(112), 리스크 탐지 및 알람부(114), 리스크 상황 모니터링부(116) 및 리스크 히스토리 관리부(118) 등을 포함할 수 있다.
도 1을 참조하면, 리스크 어휘 관리부(102)는 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 어휘(대상 키워드 및 대상 이벤트)를 추출, 즉 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 키워드 및 이벤트 등의 어휘를 수동, 반자동 또는 자동의 방식으로 추출하여 관리하는 기능을 제공할 수 있는 것으로, 이를 위해 리스크 어휘 관리부(102)는 도 2에 도시된 바와 같은 구성을 포함할 수 있다.
도 2는 도 1에 도시된 리스크 어휘 관리부의 세부적인 블록 구성도로서, 수동 입력 관리 블록(202), 반자동 추천 관리 블록(204) 및 자동 추천 관리 블록(206) 등을 포함할 수 있다.
도 2를 참조하면, 수동 입력 관리 블록(202)은 관리하고자 하는 리스크 대상 키워드와 대상 이벤트의 입력을 위한 사용자 인터페이스를 제공하는 등의 기능을 수행할 수 있으며, 이를 통해 시스템에서는 사용자가 입력한 관리 대상 키워드와 대상 이벤트를 중심으로 리스크 탐지 및 모니터링 등의 관리 기능을 실행할 수 있다.
다음에, 반자동 추천 블록(204)은 리스크로 관리하고자 하는 특정 소셜 웹 콘텐츠에 대한 사용자 입력을 제공하고, 해당 소셜 웹 콘텐츠의 문서로부터 리스크 관리 대상과 이벤트 키워드들을 자동 추출하여 후보로 보여주며(디스플레이), 사용자에 의해 특정 소셜 웹 콘텐츠로부터 선택된 관리 대상과 리스크 이벤트들을 등록할 수 있는 기능 및 이를 위한 사용자 인터페이스를 제공하는 등의 기능을 수행할 수 있다.
또한, 자동 추천 블록(206)은 시스템에 기 구축되어 리스크 유형 DB(110)에 저장된 유사 사례들로부터 리스크 키워드 및 리스크 이벤트를 자동 추출, 즉 리스크 대상에 대한 유사 사례들을 검색하여 유사한 리스크 이벤트들을 자동으로 추천해 주는 기능을 제공할 수 있으며, 이를 위해 리스크 유형 DB(110)에는 기존 구축되어 있는 리스크 사례에 대해 각 대상별로 리스크 이벤트들이 추출되어 저장되어 있다.
다시, 도 1을 참조하면, 리스크 이슈 예측 분석 자질 추출부(104)는 소셜 웹 콘텐츠의 원문으로부터 분석대상이 되는 텍스트와 관련된 메타정보를 추출하여 언어분석 및 감성분석을 수행하는 등의 기능을 제공할 수 있는 것으로, 이를 위해 리스크 이슈 예측 분석 자질 추출부(104)는 도 3에 도시된 바와 같은 구성을 포함할 수 있다.
도 3은 도 1에 도시된 리스크 이슈 예측 분석 자질 추출부의 세부적인 블록 구성도로서, 소셜 웹 콘텐츠 수집 블록(302), 언어 분석 블록(304), 감성 분석 블록(306), 리스크 이벤트 자질 추출 블록(308), 빈도 자질 추출 블록(310), 감성 자질 추출 블록(312), 네트워크 전파 자질 추출 블록(314) 및 라이트 사이클 자질 추출 블록(316) 등을 포함할 수 있다.
도 3을 참조하면, 소셜 웹 콘텐츠 수집 블록(302)은 소셜 웹 콘텐츠, 즉 웹 문서, 뉴스, 블로그, 트윗 등의 SNS 문서 등을 실시간으로 수집하여 리스크 예측 자질 DB(108)에 저장하는 등의 기능을 제공할 수 있다.
다음에, 언어 분석 블록(304)은 수집되어 리스크 예측 자질 DB(108)에 저장된 소셜 웹 콘텐츠에 대한 자연언어 처리를 통해 언어를 분석, 즉 소셜 웹 콘텐츠의 전처리(예컨대, 불필요한 데이터를 제거하는 필터링, 문장 분리 등의 과정 수행), 형태소 분석, 개체명 인식, 구문 분석, 관계추출 등의 자연언어 처리 기술의 일반적인 과정을 수행할 수 있는 것으로, 소셜 웹 콘텐츠에 대한 예측 자질의 종류와 단계에 따라 적용하는 언어처리 단계를 서로 달리할 수 있다.
또한, 감성 분석 블록(306)은 입력문에 나타난 감성 단어들에 의거하여 각 단어의 감성을 분석, 즉 입력문에 나타난 감성 단어들(예컨대, 나쁘다, 좋다, 기쁘다, 화난다, 짜증난다, 반대한다, 찬성한다 등)을 기반으로 크게 긍정과 부정의 감성 등을 분석하는 기능을 제공할 수 있다.
여기에서, 감성 정보는 크게 긍정, 부정, 중립으로 나누어질 수 있으며, 감성 분석 시스템에 따라 각 감성의 정도(Degree)를 추출하여 감성을 수치 정보로 추출하거나 단계를 더 세분화(예컨대, 매우 긍정, 긍정, 중립, 부정, 매우 부정 등)할 수 있으며, 감성의 세부 분류를 통해 긍정과 부정의 감성을 더 세분화해서 자질(예컨대, 분노, 실망, 놀람, 화남, 의아함, 의혹 등)로 추출(분류)할 수도 있다.
그리고, 리스크 이벤트 자질 추출 블록(308)은 언어 분석 블록(304)에 의한 언어 분석의 결과에 따른 리스크 이벤트를 명사 형태(예컨대, 비리, 의혹 등), 복합명사 형태(예컨대, 불매운동, 뇌물수수 등), 구문 형태(예컨대, 특허침해로 피소 등) 등과 같이 다양한 자질로 추출하는 등의 기능을 제공할 수 있다.
다음에, 빈도 자질 추출 블록(310)은 리스크 대상 키워드 및 대상 이벤트가 소셜 웹 콘텐츠 상에서 단위 시간당 얼마나 출현했는지에 대한 정보를 추출, 예컨대 시간의 흐름에 따른 빈도 추이의 모델링을 통해 상대적으로 짧은 시간에 상대적으로 많은 빈도가 추출되는 지와 지속성이 유지되는지 혹은 일반적 빈도 추이와는 다른 이상치 현상의 빈도가 추출되는 지를 반도 자질로서 추출하는 등의 기능을 제공할 수 있다.
또한, 감성 자질 추출 블록(312)은 리스크 대상 키워드에 대해 문장 내에서의 감성분석 정보를 추출하여 해당 감성의 추이가 부정의 감성을 내포하고 있고, 특히 리스크 이벤트에서 주로 발생하는 감성 분류(예컨대, 분노, 실망, 의혹 등 부정의 세분화된 감성 분류)가 어느 정도 나타나는 지를 자질로 추출 및 사용하는 등의 기능을 제공할 수 있다.
그리고, 네트워크 전파 자질 추출 블록(314)은 단위 시간 내에서 네트워크의 전파 양상의 추이를 리스크 이슈 자질로 추출, 예컨대 트윗 등의 SNS 콘텐츠의 경우 리트윗 등의 전파 양상을 추출할 수 있으며, 단위 시간 내에서 전파 양상의 추이를 통해 리스크 이슈 자질로 사용할 수 있다. 예컨대, 네트워크의 전파 양상 중에서 형태가 특정 사용자 집단에서만 전파되는 형식이 아니고, 다양한 사용자 집단에 골고루 분포가 된다든지, 전파 속도가 급속히 이뤄지는 등의 양상이 네트워크 전파 자질로 추출 및 활용될 수 있다.
마지막으로, 라이프 사이클 자질 추출 블록(316)은 리스크 키워드(대상어)와 이벤트가 문서에서 나타나는 양상을 라이프 사이클 자질로 추출하는 등의 기능을 제공할 수 있다. 즉, 리스크 키워드와 이벤트가 문서에서 나타나는 양상을 추출해서 일반적으로 늘 나타나는 현상인지, 혹은 리스크 상태로 인정할 만한 현상으로 나타나는 지에 대한 모델링을 위한 자질로 활용하기 위해, 기간별 빈도 추이를 생성, 소멸, 재생 등의 라이프 사이클 형식으로 분류하고 타입을 정의할 수 있는데, 라이프 사이클 형식은 다음과 같이 정의될 수 있다.
생성(new): 기간 내 처음 나타난 경우
성장(growing): 처음 등장 이후 지속적으로 일정하게 상승하는 경우
유지(steady): 상승/하락의 특별한 곡선을 나타내지 않고 계속 일정 수준 유지하는 경우
쇠퇴(declining) : 라이프 사이클 단계에서 쇠퇴기에 접어든 경우
소멸(dead) : 이미 라이프 사이클을 통해 발현한 뒤 완전 없어진 경우
재생(recycling) : 이미 소멸한 상태 뒤에 다시 반복하는 경우
계절적 재생 : 계절적/시간적 요인으로 반복하고 있는 경우
이상적(outlier) 재생 : 특별한 요인없이 재생하는 경우
도 4는 본 발명에 따른 리스크 탐지 및 알람을 위한 예시적인 시나리오 1을 설명하기 위한 개념도이고, 도 5는 본 발명에 따른 리스크 탐지 및 알람을 위한 예시적인 시나리오 2를 설명하기 위한 개념도이다.
도 4를 참조하면, 리스크 대상을 도메인(예컨대, 인물, 정책, 기업, 상품 등)으로 구분하고 각 도메인별로 실시간으로 리스크로 탐지된 대상에 대해 화면에 표기(디스플레이)하고, 각 리스크 대상(예컨대, 한일군사협정(정책 예), 돼지바(제품 예) 등)에 대한 현재 시간대의 리스크 상태(예컨대, 주의 단계, 경계 단계, 심각 단계, 종료 단계 등)를 나타내며, 리스크 대상이 된 이벤트(예컨대, 세균 검출, 성폭행 혐의 등)에 대해 화면에 표기하여 사용자가 한 화면에서 시간대별로의 리스크 상태를 모니터링 할 수 있도록 제공할 수 있다.
도 5를 참조하면, 각 도메인(예컨대, 인물, 기업/기관, 제품 등)에 따라 시간의 흐름 혹은 리스크의 단계에 따라서 탐지된 리스크들을 나열하고, 각 리스크 세부 내용의 일부를 요약 형식으로 보여줄 수 있다.
다시, 도 1을 참조하면, 리스크 예측 모델링부(106)는 추출된 자질들을 기반으로 통계적 및 기계학습 방법의 예측 방식을 통해 리스크 예측분석을 모델링하는 등의 기능을 제공할 수 있는데, 여기에서 통계적 및 기계학습 방법으로는, 예컨대 로지스틱 회귀, 선형 회귀, SVM(support vector machine) 방식 중 어느 하나가 이용될 수 있다.
또한, 리스크 탐지 및 알람부(114)는 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 인식되는 리스크를 자동 탐지하고, 자동 탐지된 리스크를 자동 알람하는 등의 기능을 제공할 수 있다.
즉, 실시간으로 입력되는 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 리스크로 인식되는 경우, 리스크를 자동으로 탐지하고, 리스크의 단계(예컨대, 주의, 경계, 심각 등의 단계)를 인식하여 화면에 표기할 수 있다. 일예로서 도 4 및 도 5에 도시된 바와 같이, 각 도메인(예컨대, 정책, 인물, 기업, 상품 등)에 따라 리스크가 탐지되고, 리스크 키워드 및 이벤트 등록을 한 기업, 기관, 브랜드, 인물 등의 리스크 대상에 해당 리스크가 탐지되면, 리스크 탐지 및 알람부(114)는 자동으로 알람을 알려주는 기능(예컨대, 이메일, SMS/MMS, SNS 등의 추가 매체를 활용할 수 있음)을 사용자에게 제공할 수 있다.
다음에, 리스크 상황 모니터링부(116)는 리스크 탐지 및 알람부(114)를 통해 탐지된 리스크에 대해 알람이 울릴 때 리스크 대상에 대한 리스크 상태를 실시간으로 모니터링하는 등의 기능을 제공할 수 있는데, 이에 대해서는 도 6 내지 도 11을 참조하여 상세하게 설명한다.
도 6은 본 발명에 따라 리스크 상황을 모니터링하는 예시적인 시나리오 1을 설명하기 위한 개념도이고, 도 7은 본 발명에 따라 리스크 상황을 모니터링하는 예시적인 시나리오 2를 설명하기 위한 개념도이다.
도 6을 참조하면, 첫 화면은 특정 시간대에서 리스크 알람이 발생한 경우의 예로 특정 리스크 대상 제품이 화면에 도출되며 현재의 리스크 상태를 알려준다. 시간의 추이에 따른 리스크 분석의 결과에 따라서 리스크 상태는 변화가 있을 수 있으며, 각 리스크 단계의 변화 상태를 시간의 흐름에 따라 지속적으로 모니터링하게 지원할 수 있다.
그리고, 마지막 단계에서는 예컨대'돼지바'의 경우는 리스크 예측의 결과로 리스크의 단계가 진행(예컨대, 주의 → 경계 → 심각)되었음을 알 수 있고,'카페오레'의 경우는 같은 시간대에 종료 상태가 되었음을 표시하고 있다. 이런 식으로 시간의 흐름에 따라서 리스크 단계의 변화가 있을 시에는 실시간으로 화면에 나타내며, 이를 통해 사용자는 상태의 추이를 알 수 있게 된다.
도 7을 참조하면, 시간의 흐름에 따라 리스크의 상황 단계 및 수집된 데이터량 등이 변화를 보이면서 모니터링되고 있는 시나리오를 보여준다.
다시 도 1을 참조하면, 리스크 상황 모니터링부(116)는 사용자가 특정 리스크 대상을 클릭하거나, 특정 리스크 대상으로 검색을 하거나, 혹은 리스크 모니터링 대상으로 특정 대상을 지정할 경우, 화면에 해당 리스크 대상에 대해 추가적인 정보를 화면에 제공하는데, 이러한 화면에서는 특정 리스크 대상에 대해 시간대 별로 과거 이력을 보여주고, 현재 리스크로 알람이 되어 있는 리스크 이벤트에 대해서도 화면에 도출한다.
그리고, 사용자가 해당 리스크를 선택하면 상황요약을 통해 간략한 정보를 먼저 제공하는데, 이러한 상황요약에는 해당 리스크에 대한 대상과 리스크로 선택된 이유를 알려주는 이벤트 정보, 간략한 감성 스펙트럼 요약(예컨대, 부정 감성 비율, 특정 부정 감성 분류에 대한 빈도 및 비율 정보 등) 그리고 간략한 빈도 추이(현재 시간대별 빈도 증가량, 평소의 일반적 빈도량 대비 증가량 등)를 보여준다. 이후, 사용자가 상세보기를 선택하면 좀 더 자세한 리스크 상태에 대해 모니터링하는 정보를 제공할 수 있는데, 이를 위해 리스크 상황 모니터링부(116)는 도 8에 도시된 바와 같은 구성을 포함할 수 있다.
도 8은 도 1에 도시된 리스크 상황 모니터링부의 세부적인 블록 구성도로서, 빈도 모니터링 블록(802), 감성 스펙트럼 모니터링 블록(804), 네트워크 분산 모니터링 블록(806), 매체별 확산 모니터링 블록(808), 유사 사례 검색 블록(810) 및 리스크 피드백 블록(812) 등을 포함할 수 있다.
도 8을 참조하면, 빈도 모니터링 블록(802)은 리스크 예측 자질 DB(108)와 리스크 유형 DB(110)의 탐색을 통해 리스크 대상에 대해 현재의 실시간 빈도 추이 및 과거 소셜 웹 콘텐츠에서의 빈도 추이를 모니터링하여 화면에 표시(디스플레이)하는 등의 기능을 제공할 수 있다.
또한, 감성 스펙트럼 모니터링 블록(804)은 리스크 대상에 대한 감성 정보를 시간의 추이에 따른 스펙트럼으로 제공, 즉 긍정, 부정 정보와 함께 긍정과 부정의 세부 감성 정보(예컨대, 분노, 실망, 아쉬움 등)의 세분화된 정보를 시간의 추이에 따라 제공할 수 있다.
다음에, 네트워크 분산 모니터링 블록(806)은 트윗 등의 SNS 콘텐츠에서의 네트워크 전파 양상을 사용자가 시각적으로 인식할 수 있도록 그래픽 형식 또는 전파 양상의 분류 타입으로 정의하여 제공하는 등의 기능을 제공할 수 있다. 여기에서, 분류 타입은, 예컨대 분산형, 밀집형, 확산형 중 어느 하나일 수 있다.
그리고, 매체별 확산 모니터링 블록(808)은 리스크 대상에 대한 소셜 웹 콘텐츠가 각 매체별로 확산되는 양상을 모니터링하는 등의 기능을 제공할 수 있다. 즉, 리스크 대상에 대한 소셜 웹 콘텐츠가 각 매체별(예컨대, 뉴스, 블로그, 트윗 등)로 어떤 식으로 확산되었는지에 대한 정보를 제공할 수 있으며, 예컨대 뉴스 보도 후 트윗 전파, 트윗 확산 후 블로그 전파, 블로그 확산 후 트윗 전파 등 어떤 매체에서 먼저 발산되고 다른 매체로 전파되는 지에 대한 확산 양상에 대해 모니터링 및 리포팅할 수 있다.
또한, 유사 사례 검색 블록(810)은 리스크 예측 자질 DB(108)와 리스크 유형 DB(110)의 탐색을 통해 현재 모니터링하고 있는 리스크 대상과 과거 사례에서 유사한 리스크 이벤트가 발생한 이력이 있는지의 여부를 검색하고, 그 검색 결과 정보를 사용자에게 제공하는 등의 기능을 수행할 수 있다.
마지막으로, 리스크 피드백 블록(812)은 현재 시스템에서 제공하는 탐지된 리스크의 알람에 대한 피드백을 시스템으로 전달하는 등의 기능을 제공할 수 있다.
도 9는 본 발명에 따라 리스크 세부 정보를 모니터링하는 예시적인 시나리오 1을 설명하기 위한 개념도이고, 도 10은 본 발명에 따라 리스크 세부 정보를 모니터링하는 예시적인 시나리오 2를 설명하기 위한 개념도이며, 도 11은 본 발명에 따라 리스크 세부 정보를 모니터링하는 예시적인 시나리오 3을 설명하기 위한 개념도이다.
도 9를 참조하면, 도 5에 도시된 리스크 탐지 및 알람 시나리오 2에서의 특정 리스크 하나에 대해 사용자가 세부 내용 보기를 선택했을 때의 상황을 시나리오로 도식화하였으며, 리스크가 탐지된 날짜별로 각 리스크의 단계 정보와 뉴스 및 트윗에서의 빈도 정보 및 세부 정보에 대한 모니터링을 제공한다.
도 10을 참조하면, 특정 기간 내에서 리스크를 검색한 경우의 화면에 대한 시나리오를 도식화한 예로서, 검색된 리스크 키워드에 대해 날짜별 리스크 단계 변화와 리스크 세부 내용에 대한 모니터링 결과를 제공한다.
도 11을 참조하면, 도 10에서 사용자가 특정 리스크 이벤트(동그라미로 표시, 예컨대, 이혼, 위법, 소송 등)를 선택했을 시에, 해당 리스크 정보의 좀 더 상세한 세부 정보가 제공되는 것을 도식화하였다.
다시, 도 1을 참조하면, 리스크 히스토리 관리부(118)는 모니터링되는 리스크 정보에 대한 사용자 피드백을 수용하고, 종료된 리스크의 상황에 대한 기록을 리스크 히스토리 DB(112)에 저장 및 관리하는 등의 기능을 제공할 수 있으며, 이를 위해 리스크 히스토리 관리부(118)는 도 12에 도시된 바와 같은 구성을 포함할 수 있다.
도 12는 도 1에 도시된 리스크 히스토리 관리부의 세부적인 블록 구성도로서, 리스크 히스토리 관리부(118)는 리스크 상태 피드백 블록(1212)과 피드백 기반 리스크 모델 학습 블록(1214)으로 구성되는 자가 학습 기반 히스토리 관리부(1210)와 유사 사례 검색 블록(1222)과 리스크 유형 분석 블록(1224)으로 구성되는 사례 기반 히스토리 관리부(1220) 등을 포함할 수 있다.
도 12를 참조하면, 자가 학습 기반 히스토리 관리부(1210) 내 리스크 상태 피드백 블록(1212)은 시스템에서 제공한 리스크 알람에 대해 시스템으로 피드백을 전달하는 등의 기능을 제공, 즉 현재 시스템에서 제공한 리스크 상태가 사용자의 판단으로 리스크 상태가 아닌 경우일 때 리스크 해제 피드백을 전달하면, 시스템에서는 성능 개선으로의 반영을 위해 도 1의 리스크 히스토리 관리부(118)로 피드백 정보를 반영시킨다.
다음에, 피드백 기반 리스크 모델 학습 블록(1214)은 리스크 상태 피드백에서 반영된 정보에 따라 리스크 모델을 재학습하는 등의 기능을 제공할 수 있는데, 사용자의 피드백 정보에 따라 예측 자질의 각 모델링을 재학습함으로써, 리스크 예측의 성능개선에 기여할 수 있다.
또한, 사례 기반 히스토리 관리부(1220) 내 유사 사례 검색 블록(1222)은 리스크 유형 DB(110)와 리스크 히스토리 DB(112)의 탐색을 통해 현재 모니터링되고 있는 리스크 대상과 과거 사례에서 유사한 리스크 이벤트가 발생한 이력이 있는지를 검색하고, 그 검색 결과 정보를 사용자에게 제공하는 등의 기능을 수행할 수 있다. 여기에서, 유사 사례는 동일 리스크 대상에서 과거 발생한 리스크 이벤트에 대해서 검색을 제공할 수도 있고, 리스크 대상과 동일한 분류(예컨대, 유사 제품군, 유사 인물, 유사 브랜드 등)의 리스크 대상에서 과거에 일어난 유사한 리스크 이벤트에 대한 사례(리스크 이벤트)를 제공할 수도 있다.
그리고, 리스크 유형 분석 블록(1224)은 현재 모니터링되고 있는 리스크의 유형을 분석하여 리스크 관리 대상에 대한 통계적인 정보를 제공하는 등의 기능을 제공할 수 있다. 여기에서, 리스크 유형은 리스크 대상에 따라 리스크 이벤트 유형(예컨대, 불매운동, 악성루머, 위반 등)으로 제공될 수도 있고, 시간의 추이에 따라 계절적 리스크 유형, 반복적 리스크 유형 등으로 제공될 수 있으며, 확산의 양상에 따라 일회성 리스크, 지속적 리스크 등으로 분류될 수 있다. 이러한 리스크 유형 정보들은 도 1의 리스크 유형 DB에 저장된다.
이상의 설명은 본 발명의 기술사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경 등이 가능함을 쉽게 알 수 있을 것이다. 즉, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것으로서, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다.
따라서, 본 발명의 보호 범위는 후술되는 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
102 : 리스크 어휘 관리부
104 : 리스크 이슈 예측 분석 자질 추출부
106 : 리스크 예측 모델링부
108 : 리스크 예측 자질 DB
110 : 리스크 유형 DB
112 : 리스크 히스토리 DB
114 : 리스크 탐지 및 알람부
116 : 리스크 상황 모니터링부
118 : 리스크 히스토리 관리부

Claims (20)

  1. 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 어휘를 추출하여 관리하는 리스크 어휘 관리부와,
    상기 소셜 웹 콘텐츠의 원문으로부터 분석대상이 되는 텍스트와 관련된 메타정보를 추출하여 언어분석 및 감성분석을 수행하는 리스크 이슈 예측 분석 자질 추출부와,
    추출된 자질들을 기반으로 통계적 및 기계학습 방법의 예측 방식을 통해 리스크 예측분석을 모델링하는 리스크 예측 모델링부와,
    상기 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 인식되는 리스크를 자동 탐지하고, 탐지된 리스크를 자동 알람하는 리스크 탐지 및 알람부와,
    상기 탐지된 리스크에 대해 알람이 울릴 때 리스크 대상에 대한 리스크 상태를 실시간으로 모니터링하는 리스크 상황 모니터링부와,
    모니터링되는 리스크 정보에 대한 사용자 피드백을 수용하고, 종료된 리스크의 상황에 대한 기록을 관리하는 리스크 히스토리 관리부를 포함하고,
    상기 리스크 이슈 예측 분석 자질 추출부는,
    리스크 키워드와 이벤트가 문서에서 나타나는 양상을 라이프 사이클로 추출하는 라이프 사이클 자질 추출 블록을 포함하고,
    상기 라이프 사이클 자질 추출 블록은,
    상기 양상이 일반적 현상인지 혹은 리스크 상태로 인정 가능한 현상인지를 나타내기 위한 모델링의 자질로 활용하기 위해, 기간별 빈도 추이를 생성, 성장, 유지, 쇠퇴, 소멸, 재생, 이상적 재생, 계절적 재생 중 하나의 라이프사이클 형식으로 분류 및 정의하는, 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  2. 제 1 항에 있어서,
    상기 어휘는,
    상기 리스크로 관리해야 할 키워드 및 이벤트를 포함하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  3. 제 2 항에 있어서,
    상기 리스크 어휘 관리부는,
    관리하고자 하는 리스크 대상 키워드와 대상 이벤트의 입력을 위한 사용자 인터페이스를 제공하는 수동 입력 관리 블록과,
    리스크로 관리하고자 하는 특정 소셜 웹 콘텐츠에 대한 사용자 입력을 제공하고, 상기 특정 소셜 웹 콘텐츠로부터 선택된 이벤트 및 키워드의 등록을 위한 사용자 인터페이스를 제공하는 반자동 추천 블록과,
    기 저장된 유사 사례들로부터 리스크 키워드 및 리스크 이벤트를 자동 추출하는 자동 추천 블록
    을 포함하는 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  4. 제 1 항에 있어서,
    상기 리스크 이슈 예측 분석 자질 추출부는,
    상기 소셜 웹 콘텐츠를 실시간으로 수집 및 저장하는 소셜 웹 콘텐츠 수집 블록과,
    수집된 상기 소셜 웹 콘텐츠에 대한 자연언어 처리를 통해 언어를 분석하는 언어 분석 블록과,
    입력문에 나타난 감성 단어들에 의거하여 각 단어의 감성을 분석하는 감성 분석 블록과,
    언어 분석의 결과에 따라 리스크 이벤트를 명사 형태, 복합명사 형태, 구문 형태 중 어느 하나의 자질로 추출하는 리스크 이벤트 자질 추출 블록과,
    리스크 대상 키워드 및 대상 이벤트가 소셜 웹 콘텐츠 상에서 단위 시간당 얼마나 출현했는지에 대한 정보를 추출하는 빈도 자질 추출 블록과,
    리스크 대상 키워드에 대해 문장 내에서의 감성분석 정보를 추출하여 해당 감성의 추이가 부정의 감성을 내포하고 있는 정도를 감성 자질로 추출하는 감성 자질 추출 블록과,
    단위 시간 내에서 상기 소셜 웹 콘텐츠의 전파 양상의 추이를 리스크 이슈 자질로 추출하는 네트워크 전파 자질 추출 블록을 포함하는 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  5. 제 4 항에 있어서,
    상기 자연언어 처리는,
    상기 소셜 웹 콘텐츠에 대한 전처리, 형태소 분석, 개체명 인식, 구문분석 및 관계추출을 포함하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  6. 제 5 항에 있어서,
    상기 자연언어 처리는,
    상기 소셜 웹 콘텐츠에 대한 예측 자질의 종류와 단계에 따라 그 적용을 서로 달리하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  7. 제 4 항에 있어서,
    상기 감성 분석 블록은,
    상기 각 단어의 감성 정도를 수치 정보로 추출하여 세분화하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  8. 제 4 항에 있어서,
    상기 감성 분석 블록은,
    상기 각 단어의 감성을 긍정, 부정, 중립 중 어느 하나로 분류하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  9. 제 4 항에 있어서,
    상기 빈도 자질 추출 블록은,
    시간의 흐름에 따른 빈도 추이의 모델링을 통해 상대적으로 짧은 시간에 상대적으로 많은 빈도가 추출되는 지와 지속성이 유지되는지 혹은 일반적 빈도 추이와는 다른 이상치 현상의 빈도가 추출되는 지를 반도 자질로서 추출하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  10. 제 4 항에 있어서,
    상기 네트워크 전파 자질 추출 블록은,
    상기 네트워크의 전파 양상 중에서 형태가 다른 사용자 집단들에 고루 분포되는지의 여부와 전파 속도가 급속히 이뤄지는 지의 여부를 네트워크 전파 자질로 추출하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  11. 삭제
  12. 제 1 항에 있어서,
    상기 리스크 예측 모델링부는,
    로지스틱 회귀, 선형 회귀, SVM 방식 중 어느 하나를 상기 통계적 및 기계학습 방법으로 이용하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  13. 제 1 항에 있어서,
    상기 리스크 상황 모니터링부는,
    상기 리스크 대상에 대해 현재의 실시간 빈도 추이 및 과거 소셜 웹 콘텐츠에서의 빈도 추이를 모니터링하는 빈도 모니터링 블록과,
    상기 리스크 대상에 대한 감성 정보를 시간의 추이에 따른 스펙트럼으로 제공하는 감성 스펙트럼 모니터링 블록과,
    네트워크 전파 양상을 그래픽 형식 또는 전파 양상의 분류 타입으로 정의하여 제공하는 네트워크 분산 모니터링 블록과,
    상기 리스크 대상에 대한 소셜 웹 콘텐츠가 각 매체별로 확산되는 양상을 모니터링하는 매체별 확산 모니터링 블록과,
    상기 리스크 대상과 과거 사례에서 유사한 리스크 이벤트가 발생한 이력이 있는지의 여부를 검색하는 유사 사례 검색 블록과,
    탐지된 리스크의 알람에 대한 피드백을 전달하는 리스크 피드백 블록
    을 포함하는 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  14. 제 13 항에 있어서,
    상기 분류 타입은,
    분산형, 밀집형, 확산형 중 어느 하나인
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  15. 제 1 항에 있어서,
    상기 리스크 히스토리 관리부는,
    리스크 알람에 대해서 시스템으로 피드백을 전달하는 리스크 상태 피드백 블록과,
    리스크 상태 피드백에서 반영된 정보에 따라 리스크 모델을 재학습하는 피드백 기반 리스크 모델 학습 블록과,
    상기 리스크 대상과 과거 사례에서 유사한 리스크 이벤트가 발생한 이력이 있는지를 검색하는 유사 사례 검색 블록과,
    상기 리스크의 유형을 분석하여 리스크 관리 대상에 대한 통계적인 정보를 제공하는 리스크 유형 분석 블록
    을 포함하는 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  16. 제 15 항에 있어서,
    상기 리스크 상태 피드백 블록은,
    리스크 상태가 아닌 경우일 때, 성능 개선의 반영을 위해 리스크 해제 피드백을 상기 시스템으로 전달하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  17. 제 15 항에 있어서,
    상기 유사 사례 검색 블록은,
    동일 리스크 대상에서 과거 발생한 리스크 이벤트 혹은 상기 리스크 대상과 동일한 분류의 리스크 대상에서 과거에 일어난 유사한 리스크 이벤트를 검색하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  18. 제 15 항에 있어서,
    상기 리스크 유형 분석 블록은,
    상기 리스크 대상에 따라 리스크 이벤트 유형, 시간의 추이에 따른 계절적 리스크 유형 또는 반복적 리스크 유형, 확산의 양상에 따른 일회성 리스크 유형 또는 지속적 리스크 유형 중 어느 한 유형을 상기 리스크의 유형으로 제공하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치.
  19. 소셜 웹 콘텐츠로부터 리스크로 관리해야 하는 어휘를 추출하여 관리하는 과정과,
    상기 소셜 웹 콘텐츠의 원문으로부터 분석대상이 되는 텍스트와 관련된 메타정보를 추출하여 언어분석 및 감성분석을 수행하는 과정과,
    추출된 자질들을 기반으로 통계적 및 기계학습 방법의 예측 방식을 통해 리스크 예측분석을 모델링하는 과정과,
    상기 소셜 웹 콘텐츠로부터 미리 모델링한 리스크 예측 모델에 기반하여 인식되는 리스크를 자동 탐지한 후 알람하는 과정과,
    탐지된 리스크에 대해 알람이 울릴 때 리스크 대상에 대한 리스크 상태를 실시간으로 모니터링하는 과정과,
    상기 탐지된 리스크에 대한 상황이 종료될 때 관련 리스크 종료 상황을 리스크 히스토리 DB에 기록하는 과정을 포함하고,
    상기 언어분석 및 감성분석을 수행하는 과정은,
    리스크 키워드와 이벤트가 문서에서 나타나는 양상을 라이프 사이클로 추출하는 과정; 및
    상기 양상이 일반적 현상인지 혹은 리스크 상태로 인정 가능한 현상인지를 나타내기 위한 모델링의 자질로 활용하기 위해, 기간별 빈도 추이를 생성, 성장, 유지, 쇠퇴, 소멸, 재생, 이상적 재생, 계절적 재생 중 하나의 라이프사이클 형식으로 분류 및 정의하는 과정을 포함하는, 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 방법.
  20. 제 19 항에 있어서,
    상기 모델링하는 과정은,
    로지스틱 회귀, 선형 회귀, SVM 방식 중 어느 하나를 상기 통계적 및 기계학습 방법으로 이용하는
    소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 방법.
KR1020120147067A 2012-12-17 2012-12-17 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법 KR101907041B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120147067A KR101907041B1 (ko) 2012-12-17 2012-12-17 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법
US13/868,678 US20140172497A1 (en) 2012-12-17 2013-04-23 Apparatus and method for managing risk based on prediction on social web media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120147067A KR101907041B1 (ko) 2012-12-17 2012-12-17 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20140079563A KR20140079563A (ko) 2014-06-27
KR101907041B1 true KR101907041B1 (ko) 2018-10-11

Family

ID=50931985

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120147067A KR101907041B1 (ko) 2012-12-17 2012-12-17 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법

Country Status (2)

Country Link
US (1) US20140172497A1 (ko)
KR (1) KR101907041B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102608849B1 (ko) * 2023-04-25 2023-12-01 주식회사 직스테크놀로지 고객사 데이터의 정확도 향상을 위한 cad 프로그램 판매영업 관리 서비스 제공 시스템

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9219746B2 (en) * 2013-08-30 2015-12-22 Bank Of America Corporation Risk identification based on identified parts of speech of terms in a string of terms
US9531782B2 (en) * 2014-01-30 2016-12-27 Avaya Inc. Dynamic management of collaboration sessions using real-time text analytics
US10789563B2 (en) * 2014-04-11 2020-09-29 International Business Machines Corporation Building confidence of system administrator in productivity tools and incremental expansion of adoption
KR102230394B1 (ko) * 2014-09-24 2021-03-22 삼성에스디에스 주식회사 물류 리스크 예측 방법 및 그 장치
KR102190578B1 (ko) * 2014-10-21 2020-12-15 삼성에스디에스 주식회사 텍스트 데이터의 분석을 통한 이상 감지 및 예측 시스템 및 방법
KR101628738B1 (ko) * 2014-10-29 2016-06-09 (주)타파크로스 학습형 룰베이스 방식의 부정적 이슈 감지 방법 및 시스템
KR102069698B1 (ko) * 2014-11-20 2020-02-12 한국전자통신연구원 언어분석결과 업데이트 장치 및 방법
US9906484B2 (en) * 2015-02-24 2018-02-27 International Business Machines Corporation Dynamic analytics controlled information dissemination in social media
CN106296195A (zh) * 2015-05-29 2017-01-04 阿里巴巴集团控股有限公司 一种风险识别方法及装置
US20160371618A1 (en) * 2015-06-11 2016-12-22 Thomson Reuters Global Resources Risk identification and risk register generation system and engine
US10242207B2 (en) 2016-09-17 2019-03-26 International Business Machines Corporation Technology for confidentiality advising
KR20180082231A (ko) * 2017-01-10 2018-07-18 주식회사 사운드잇 사용자맞춤형음향 센싱 장치 및 방법
US10999296B2 (en) * 2017-05-15 2021-05-04 Forcepoint, LLC Generating adaptive trust profiles using information derived from similarly situated organizations
CN109104280B (zh) * 2017-06-20 2021-09-28 腾讯科技(深圳)有限公司 转发消息的方法及装置
CN107358344B (zh) * 2017-06-29 2021-09-03 浙江图讯科技股份有限公司 企业隐患管理方法及其管理系统、电子设备及存储介质
US11042540B2 (en) 2017-09-12 2021-06-22 International Business Machines Corporation Determining whether to take an action by applying a metric calculated using natural language processing tokens
KR102105744B1 (ko) * 2017-12-01 2020-05-29 신한금융투자 주식회사 지능형 증권 투자 의사결정 지원 방법 및 그 장치
CN108765178A (zh) * 2018-04-23 2018-11-06 华侨大学 玩具缺陷事件的互联网传播影响力的评估方法
CN108985929B (zh) * 2018-06-11 2022-04-08 创新先进技术有限公司 训练方法、业务数据分类处理方法及装置、电子设备
ES2878263T3 (es) 2018-08-30 2021-11-18 Freudenberg Carl Kg Diseño, control y funcionamiento de filtros para turbomáquinas
US20200110895A1 (en) * 2018-10-03 2020-04-09 International Business Machines Corporation Social post management based on security considerations
CN110084468B (zh) * 2019-03-14 2020-09-01 阿里巴巴集团控股有限公司 一种风险识别方法及装置
KR102076657B1 (ko) * 2019-05-31 2020-02-12 주식회사 브레인커머스 기업의 위기 조짐 모니터링을 위한 기업 위험도 분석 방법 및 이를 위한 장치
CN113139116B (zh) * 2020-01-19 2024-03-01 北京中科闻歌科技股份有限公司 基于bert的媒体信息观点抽取方法、装置、设备和存储介质
US11763012B2 (en) * 2021-08-20 2023-09-19 ArmorBlox, Inc. Method for data protection across sharing platforms
CN117390602B (zh) * 2023-12-11 2024-03-29 深圳市瑞迅通信息技术有限公司 一种信息安全风险评价方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040059736A1 (en) * 2002-09-23 2004-03-25 Willse Alan R. Text analysis techniques
US20100325107A1 (en) * 2008-02-22 2010-12-23 Christopher Kenton Systems and methods for measuring and managing distributed online conversations
US20110022941A1 (en) * 2006-04-11 2011-01-27 Brian Osborne Information Extraction Methods and Apparatus Including a Computer-User Interface
US20120047219A1 (en) * 2010-08-18 2012-02-23 At&T Intellectual Property I, L.P. Systems and Methods for Social Media Data Mining

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9269068B2 (en) * 2006-05-05 2016-02-23 Visible Technologies Llc Systems and methods for consumer-generated media reputation management
US20080109454A1 (en) * 2006-11-03 2008-05-08 Willse Alan R Text analysis techniques
CA2675216A1 (en) * 2007-01-10 2008-07-17 Nick Koudas Method and system for information discovery and text analysis
US8266148B2 (en) * 2008-10-07 2012-09-11 Aumni Data, Inc. Method and system for business intelligence analytics on unstructured data
US8645298B2 (en) * 2010-10-26 2014-02-04 Microsoft Corporation Topic models
US8818932B2 (en) * 2011-02-14 2014-08-26 Decisive Analytics Corporation Method and apparatus for creating a predictive model
US20130132851A1 (en) * 2011-11-22 2013-05-23 International Business Machines Corporation Sentiment estimation of web browsing user

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040059736A1 (en) * 2002-09-23 2004-03-25 Willse Alan R. Text analysis techniques
US20110022941A1 (en) * 2006-04-11 2011-01-27 Brian Osborne Information Extraction Methods and Apparatus Including a Computer-User Interface
US20100325107A1 (en) * 2008-02-22 2010-12-23 Christopher Kenton Systems and methods for measuring and managing distributed online conversations
US20120047219A1 (en) * 2010-08-18 2012-02-23 At&T Intellectual Property I, L.P. Systems and Methods for Social Media Data Mining

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102608849B1 (ko) * 2023-04-25 2023-12-01 주식회사 직스테크놀로지 고객사 데이터의 정확도 향상을 위한 cad 프로그램 판매영업 관리 서비스 제공 시스템

Also Published As

Publication number Publication date
KR20140079563A (ko) 2014-06-27
US20140172497A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
KR101907041B1 (ko) 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법
Alam et al. Descriptive and visual summaries of disaster events using artificial intelligence techniques: case studies of Hurricanes Harvey, Irma, and Maria
Gandomi et al. Beyond the hype: Big data concepts, methods, and analytics
CA2862273C (en) Methods and systems for generating corporate green score using social media sourced data and sentiment analysis
US20160085827A1 (en) Real-time and adaptive data mining
US20150088608A1 (en) Customer Feedback Analyzer
US20120296845A1 (en) Methods and systems for generating composite index using social media sourced data and sentiment analysis
US8762161B2 (en) Method and apparatus for visualization of interaction categorization
KR101594452B1 (ko) 온라인 게시물의 유언비어 식별장치
TWI650655B (zh) 網路事件自動蒐集分析方法及系統
CN116663664A (zh) 一种基于nlp算法的客户营销场景数据分析系统及方法
US20160085824A1 (en) Real-time and adaptive data mining
CN111666499A (zh) 一种基于大数据的舆情监测云服务平台
WO2022178153A1 (en) Framework for early warning of domain-specific events
Mehmood et al. A study of sentiment and trend analysis techniques for social media content
US20160085821A1 (en) Real-time and adaptive data mining
KR102242317B1 (ko) 정성적 가짜 뉴스 판단 시스템, 판단 방법 및 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
CN111241077A (zh) 基于互联网数据的金融欺诈行为的识别方法
Bouma et al. On the early detection of threats in the real world based on open-source information on the internet
US20160085805A1 (en) Real-time and adaptive data mining
US20160085826A1 (en) Real-time and adaptive data mining
US20160085822A1 (en) Real-time and adaptive data mining
KR102180329B1 (ko) 가짜 뉴스 판단 시스템
US20160085806A1 (en) Real-time and adaptive data mining
US20160085820A1 (en) Real-time and adaptive data mining

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant