KR101693727B1 - 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법 - Google Patents

소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법 Download PDF

Info

Publication number
KR101693727B1
KR101693727B1 KR1020150026636A KR20150026636A KR101693727B1 KR 101693727 B1 KR101693727 B1 KR 101693727B1 KR 1020150026636 A KR1020150026636 A KR 1020150026636A KR 20150026636 A KR20150026636 A KR 20150026636A KR 101693727 B1 KR101693727 B1 KR 101693727B1
Authority
KR
South Korea
Prior art keywords
issue
issues
network
clustering
unit
Prior art date
Application number
KR1020150026636A
Other languages
English (en)
Other versions
KR20160103802A (ko
Inventor
김남규
윌리엄
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020150026636A priority Critical patent/KR101693727B1/ko
Publication of KR20160103802A publication Critical patent/KR20160103802A/ko
Application granted granted Critical
Publication of KR101693727B1 publication Critical patent/KR101693727B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/30

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 유사성에 근거한 기존 이슈 클러스터링의 틀을 넘어서 관련성 측면에서의 이슈 클러스터링을 수행하므로써, 서로 유사하지는 않지만 관련이 있는 이슈들의 집합으로부터 새로운 가치를 창출할 수 있는 R&D 관점의 사회적 이슈 재구성 장치 및 방법을 제공하기 위한 것으로서, 사용자와 이슈간 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶어 소비자 선호 이슈 관점의 이슈 클러스터링을 수행하는 제 1 클러스터링부와, 기사와 이슈간 네트워크의 각 이슈에 대해, 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 제 3 클러스터링부와, 상기 소비자 선호 이슈 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 다차원 이슈 클러스터링부를 포함하여 구성되는데 있다.

Description

소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법{Apparatus and method for reorganizing social issues from research and development perspective using social network}
본 발명은 사회적 이슈 재구성 장치 및 방법에 관한 것으로, 특히 소셜 네트워크를 활용한 연구개발(research and development : R&D) 관점의 사회적 이슈 재구성 장치 및 방법에 관한 것이다.
최근 다양한 소셜미디어를 통해 유통되는 비정형 데이터의 양이 급증함에 따라, 데이터의 양 자체가 문제의 일부분이 되는 빅 데이터(Big Data) 분석기술에 대한 수요와 관심이 증대되고 있다.
빅 데이터는 기존의 방법이나 도구로는 수집, 저장, 검색, 분석, 시각화가 어려운 정형 또는 비정형 데이터를 의미하며, 특히 뉴스, 블로그, 소셜미디어 등을 통해 유통되는 비정형 텍스트 데이터는 풍부한 정보나 의견을 거의 실시간으로 표현하고 있다는 특징으로 인해 많은 연구자들의 관심을 모으고 있다. 특히, 텍스트는 분석 목적에 따라 행렬, 계층, 벡터 등의 다양한 형태로 표현되며, 최근에는 텍스트 분석 기술을 기존의 데이터 마이닝(Data Minig) 프로세스에 확장하여 적용한 텍스트 마이닝(Text Mining)의 활용도가 더욱 높아지고 있다.
상기 텍스트 마이닝의 활용 분야 중 최근 학계와 업계에서 가장 주목 받고 있는 대표적인 응용으로, 방대한 텍스트 문서로부터 주요 토픽을 발굴하기 위한 토픽 분석(Topic Analysis)을 들 수 있다. 토픽 분석은 텍스트 입력에 대한 파싱(Parsing)과 필터링(Filtering)을 수행한 후 TF-IDF(Term Frequency-Inverse Document Frequency) 등의 척도에 의해 각 문서를 대표하는 주요 어휘를 도출하는 과정으로 요약될 수 있으며, 분석 대상 문서의 종류에 따라 이슈 분석 또는 트랜드 분석으로 불리기도 한다. 특히 토픽 분석은 하나의 문서가 여러 토픽에 대응되는 실세계의 현상을 표현할 수 있기 때문에, 하나의 문서를 하나의 군집에만 대응시키는 문서 클러스터링(Document Clustering)에 비해 활용도가 높은 것으로 평가 받고 있다. 구체적으로 트윗(Tweet) 분석을 통해 사회적 이슈를 발굴하여 선거 및 마케팅 전략 수립에 활용하고, 뉴스 및 정책보고서에 대한 분석을 통해 국가 현안을 발굴하여 국정과제를 보완하는 등의 시도가 활발하게 이루어지고 있다.
이러한 토픽 분석을 통해 도출되는 이슈의 수 또한 매우 많을 수 있기 때문에, 최근에는 발견된 이슈에 대한 클러스터링을 통해 상위 개념의 새로운 이슈를 도출하기 위한 이슈 클러스터링(Issue Clustering)에 대한 관심이 높아지고 있다. 예를 들면 “여가”와 “건강”의 이슈를 통합하여 “웰빙(Well-Being)”이라는 이슈 클러스터를 생성하는 경우가 이에 해당된다. 이러한 이슈 클러스터링은 주로 이슈 키워드들의 동시출현 빈도에 기반하여 이루어진다. 즉 “여가”의 이슈를 대표하는 키워드와 “건강”의 이슈를 대표하는 키워드가 동시에 출현하는 문서의 수가 많다면 이 두 이슈는 매우 연관성이 높은 것으로 파악되는 것이다. 하지만 이러한 전통적인 이슈 클러스터링 방식은 동시출현 빈도는 낮지만 실제로는 매우 밀접한 관계가 있는 이슈간의 연관성을 파악하지 못한다는 한계를 갖는다. 이러한 한계는 도 1에서 도시하고 있는 실시예를 통해 자세히 설명될 수 있다.
도 1 은 뉴스 기사에 나타난 이슈 키워드와 R&D 키워드간의 관계를 동시출현 빈도에 기반하여 도식화한 가상 네트워크를 보여준다.
도 1에서 도시하고 있는 것과 같이, “실버산업”과 “성범죄” 이슈는 “심박수”, “RF 태그”, “CCTV”라는 기술과 관련된다는 점에서 서로 연관성이 매우 높다고 할 수 있다. 이러한 연관성은 “성범죄” 관련 분야에서 축적된 R&D 기술이 “실버산업” 분야에 적용될 수 있고, 두 분야의 전문가 그룹이 공유될 수 있음을 의미하기 때문에 활용 가치가 매우 높다고 할 수 있다.
하지만 “실버산업”과 “성범죄”의 이슈가 동일한 문서에서 함께 언급되는 빈도수는 그다지 높지 않을 것으로 예상되므로, 전통적인 이슈 클러스터링 방식은 이 두 이슈간의 연관성을 발견하기 어렵다. 본 예는 이슈 클러스터링의 결과가 이슈 간 연결 구조를 어떻게 정의하고 해석하느냐에 따라 상이하게 나타나므로, 분석의 관점 및 활용 목적에 따라 각 기준에 맞는 이슈 클러스터링이 수행되어야 할 필요성을 나타내고 있다.
등록특허공보 제10-1473076호: 웹 탐색들에 대한 소셜 디멘젼의 선택적 추가 등록특허공보 제10-0932843호: 검색결과간의 연관도에 기초하여 클러스터링된 검색결과를 제공하는 방법 및 시스템 그리고 검색결과를 클러스터링하는 방법 및 시스템
따라서 본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 유사성에 근거한 기존 이슈 클러스터링의 틀을 넘어서 관련성 측면에서의 이슈 클러스터링을 수행하므로써, 서로 유사하지는 않지만 관련이 있는 이슈들의 집합으로부터 새로운 가치를 창출할 수 있는 R&D 관점의 사회적 이슈 재구성 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적은 전통적인 방법의 이슈 클러스터링(즉, 문서 내 동시출현 빈도 기반의 클러스터링), R&D 관점의 이슈 클러스터링, 그리고 소비자 선호 이슈 관점의 이슈 클러스터링의 다차원 이슈 클러스터링을 통한 사회적 이슈 재구성 장치 및 방법을 제공하는데 있다.
본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치의 특징은 사용자와 이슈간 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶어 소비자 선호 이슈 관점의 이슈 클러스터링을 수행하는 제 1 클러스터링부와, 기사와 이슈간 네트워크의 각 이슈에 대해, 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 제 3 클러스터링부와, 상기 소비자 선호 이슈 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 다차원 이슈 클러스터링부를 포함하여 구성되는데 있다.
바람직하게 상기 R&D 관점의 사회적 이슈 재구성 장치는 R&D와 이슈간 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 제 2 클러스터링부를 더 포함하여 구성되고, 이때, 상기 다차원 이슈 클러스터링부는 상기 소비자 선호 이슈 관점, R&D 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치의 다른 특징은 R&D와 이슈간 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 제 2 클러스터링부와, 기사와 이슈간 네트워크의 각 이슈에 대해, 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 제 3 클러스터링부와, 상기 R&D 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 다차원 이슈 클러스터링부를 포함하여 구성되는데 있다.
바람직하게 상기 제 3 클러스터링부는 고객의 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 크롤링(crawling)된 뉴스기사정보를 저장하는 뉴스기사 정보 DB와, 상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 토픽 분석부와, 상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 제 3 네트워크 구성부와, 상기 제 3 네트워크 구성부에서 구성된 기사와 이슈간 네트워크의 이슈들을 동일한 클러스터로 묶어 내용의 유사성 관점의 이슈 클러스터링을 수행하는 제 3 이슈 클러스터링부를 포함하여 구성되는 것을 특징으로 한다.
바람직하게 상기 제 1 클러스터링부는 고객의 웹 검색기록정보를 저장하는 검색기록정보 DB와, 상기 검색기록정보 DB에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 방문 기록을 분석하는 방문기록 분석부와, 상기 방문기록 분석부에서 분석된 방문 기록을 기반으로 사용자와 기사간의 다대다 관계를 그래프로 도식화하여 사용자와 기사간의 네트워크를 구성하는 제 1 네트워크 구성부와, 상기 제 1 네트워크 구성부에서 구성된 사용자와 기사간의 네트워크를 상기 제 3 클러스터링부에서 구성된 기사와 이슈간의 네트워크와 병합하는 제 1 네트워크 병합부와, 상기 제 1 네트워크 병합부에서 병합된 사용자와 이슈간의 다대다 관계를 그래프로 도식화하여 사용자와 이슈간의 이원 네트워크를 구성하는 제 2 네트워크 구성부와, 상기 제 2 네트워크 구성부에서 구성된 사용자와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 사용자 관점의 이슈 클러스터링을 수행하는 제 1 이슈 클러스터링부와, 상기 검색기록정보 DB에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하여 제 3 클러스터링부로 전달하는 크롤링부를 포함하여 구성되는 것을 특징으로 한다.
바람직하게 상기 제 2 클러스터링부는 특허 정보 또는 연구 보고서를 포함하는 R&D 문서로부터 R&D 용어집을 구축하여 저장하는 R&D 용어정보 DB와, 상기 제 3 클러스터링부에 저장된 뉴스기사정보를 기반으로 상기 R&D 용어정보 DB에 저장된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도를 분석하는 R&D 용도 분석부와, 상기 R&D 용도 분석부에서 분석된 수록 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 다대다 관계를 그래프로 도식화하여 R&D와 기사간의 네트워크를 구성하는 제 3 네트워크 구성부와, 상기 제 3 네트워크 구성부에서 구성된 R&D와 기사간의 네트워크를 상기 제 3 클러스터링부에서 구성된 기사와 이슈간의 네트워크와 병합하는 제 2 네트워크 병합부와, 상기 제 2 네트워크 병합부에서 병합된 R&D와 이슈간의 다대다 관계를 그래프로 도식화하여 R&D와 이슈간의 이원 네트워크를 구성하는 제 4 네트워크 구성부와, 상기 제 4 네트워크 구성부에서 구성된 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 제 2 이슈 클러스터링부를 포함하여 구성되는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법의 특징은 (A) 제 3 클러스터링부를 통해 기사와 이슈간 네트워크를 구성하여 기사가 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계와, (B) 제 1 클러스터링부를 통해 고객의 웹 검색기록정보를 기반으로 분석된 인터넷 뉴스 사이트의 방문 기록으로 사용자와 기사간의 네트워크를 구성하고, 상기 제 3 클러스터링부에서 구성된 기사와 이슈간 네트워크와 병합하여 사용자와 이슈간 이원 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶어 소비자 선호 이슈 관점의 이슈 클러스터링을 수행하는 단계와, (C) 다차원 이슈 클러스터링부를 통해 상기 소비자 선호 이슈 관점 및 내용의 유사성 관점을 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 단계를 포함하여 이루어지는데 있다.
바람직하게 상기 R&D 관점의 사회적 이슈 재구성 방법은 제 2 클러스터링부를 통해 특허 정보, 연구 보고서를 포함하는 R&D 문서로부터 구축된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 네트워크를 구성하고, 상기 제 3 클러스터링부에서 구성된 기사와 이슈간 네트워크와 병합하여 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 단계를 더 포함하여 이루어지고, 이때, 상기 (C) 단계는 다차원 이슈 클러스터링부를 통해 상기 소비자 선호 이슈 관점, R&D 관점 및 내용의 유사성 관점을 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법의 다른 특징은 (a) 제 3 클러스터링부를 통해 기사와 이슈간 네트워크를 구성하여 기사가 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계와, (b) 제 2 클러스터링부를 통해 특허 정보, 연구 보고서를 포함하는 R&D 문서로부터 구축된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 네트워크를 구성하고, 상기 제 3 클러스터링부에서 구성된 기사와 이슈간 네트워크와 병합하여 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 단계와, (c) 다차원 이슈 클러스터링부를 통해 상기 R&D 관점 및 내용의 유사성 관점을 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 단계를 포함하여 이루어지는데 있다.
바람직하게 상기 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계는 인터넷 뉴스 사이트 방문 기록을 토대로 크롤링(Crawling)된 분석 대상 뉴스 기사를 입력으로 저장하는 단계와, 토픽 분석부를 통해 상기 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 단계와, 제 3 네트워크 구성부를 통해 상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 단계와, 상기 구성된 기사와 이슈간 네트워크의 이슈들을 제 3 이슈 클러스터링부를 통해 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
바람직하게 상기 (B) 단계는 고객의 웹 검색기록정보를 저장하는 단계와, 크롤링부를 통해 상기 저장된 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하여 제 3 클러스터링부로 전달하는 단계와, 방문기록 분석부를 통해 상기 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 방문 기록을 분석하는 단계와, 상기 분석된 방문 기록을 기반으로 제 1 네트워크 구성부를 통해 사용자와 기사간의 다대다 관계를 그래프로 도식화하여 사용자와 기사간의 네트워크를 구성하는 단계와, 제 1 네트워크 병합부를 통해 상기 구성된 사용자와 기사간의 네트워크를 상기 제 3 클러스터링부에서 구성된 기사와 이슈간의 네트워크와 병합하는 단계와, 제 2 네트워크 구성부를 통해 상기 병합된 사용자와 이슈간의 다대다 관계를 그래프로 도식화하여 사용자와 이슈간의 이원 네트워크를 구성하는 단계와, 제 1 이슈 클러스터링부를 통해 상기 구성된 사용자와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶어 사용자 관점의 이슈 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
바람직하게 상기 R&D 관점의 이슈 클러스터링을 수행하는 단계는 특허 정보, 연구 보고서를 포함하는 R&D 문서로부터 R&D 용어집을 구축하여 저장하는 단계와, R&D 용도 분석부를 통해 저장된 뉴스기사정보를 기반으로 상기 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도를 분석하는 단계와, 상기 분석된 어휘들이 뉴스 기사 출현 빈도에 따라 제 3 네트워크 구성부를 통해 R&D와 기사간의 다대다 관계를 그래프로 도식화하여 R&D와 기사간의 네트워크를 구성하는 단계와, 제 2 네트워크 병합부를 통해 상기 구성된 R&D와 기사간의 네트워크를 상기 제 3 클러스터링부에서 구성된 기사와 이슈간의 네트워크와 병합하는 단계와, 제 4 네트워크 구성부를 통해 상기 병합된 R&D와 이슈간의 다대다 관계를 그래프로 도식화하여 R&D와 이슈간의 이원 네트워크를 구성하는 단계와, 제 2 이슈 클러스터링부를 통해 상기 구성된 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
이상에서 설명한 바와 같은 본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치 및 방법은 다음과 같은 효과가 있다.
첫째, 유사성에 근거한 기존의 이슈 클러스터링의 틀을 넘어서 관련성 측면에서의 이슈 클러스터링을 수행하므로써, 서로 유사하지는 않지만 관련이 있는 이슈들의 집합으로부터 새로운 가치를 창출할 수 있는 효과가 있다.
둘째, 학술적, 실무적 기여가 매우 클 것으로 기대되며, 특히 소비자 선호 이슈와 공급 기술(R&D) 관점에서의 이슈 클러스터링 과정을 적용함으로써, 향후 이와 유사한 방식의 접근, 즉 두 단계의 네트워크 구축을 통해 제3의 관점과 토픽 분석의 결과를 연계하는 연구가 활발하게 수행될 수 있다.
셋째, 기존에는 파악되지 않았던 소비자 관점에서의 연관 이슈를 분석함으로써 상위 개념의 새로운 이슈를 도출하고 이에 기반하여 신규 고객군을 정의할 수 있을 뿐 아니라, R&D 기술 측면의 연관 이슈를 파악함으로써, 국가적 차원의 효율적인 R&D 투자 정책 수립에도 기여할 수 있다.
도 1 은 일반적인 뉴스 기사에 나타난 이슈 키워드와 R&D 키워드간의 관계를 동시출현 빈도에 기반하여 도식화한 가상 네트워크를 나타낸 구성도
도 2 는 본 발명의 실시예에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치의 구성을 나타낸 블록도
도 3 은 본 발명의 실시예에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법을 설명하기 위한 흐름도
도 4 는 도 3의 S100에서 기재하고 있는 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 과정을 보다 상세히 설명하기 위한 흐름도
도 5 는 도 3의 S200에서 기재하고 있는 소비자 선호 이슈 관점의 이슈 클러스터링을 수행하는 과정을 보다 상세히 설명하기 위한 흐름도
도 6 는 도 3의 S300에서 기재하고 있는 R&D 관점의 이슈 클러스터링을 수행하는 과정을 보다 상세히 설명하기 위한 흐름도
도 7 은 사용자와 기사간의 네트워크를 기사와 이슈간의 네트워크와 병합하여 사용자와 이슈간 네트워크를 도출하는 과정을 설명하기 위한 직관적 예를 나타낸 구성도
도 8 은 사용자와 기사간의 네트워크를 기사와 이슈간의 네트워크와 병합하는 과정을 매트릭스 형태로 나타낸 구성도
본 발명의 다른 목적, 특성 및 이점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.
본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치 및 방법의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 설명하면 다음과 같다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록하며 통상의 지식을 가진자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
도 2 는 본 발명의 실시예에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치의 구성을 나타낸 블록도이다.
도 2에서 도시하고 있는 것과 같이, 본 발명은 사용자와 이슈간 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 소비자 선호 이슈 관점의 이슈 클러스터링을 수행하는 제 1 클러스터링부(100)와, R&D와 이슈간 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 R&D 관점의 이슈 클러스터링을 수행하는 제 2 클러스터링부(200)와, 기사와 이슈간 네트워크의 각 이슈에 대해, 기사내용이 유사한 이슈들을 동일한 클러스터로 묶음으로써, 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 제 3 클러스터링부(300)와, 상기 소비자 선호 이슈 관점, R&D 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 다차원 이슈 클러스터링부(400)로 구성된다.
이때, 상기 제 3 클러스터링부(300)는 고객의 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 크롤링(crawling)된 뉴스기사정보를 저장하는 뉴스기사 정보 DB(301)와, 상기 뉴스기사정보 DB(301)에 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 토픽 분석부(302)와, 상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 제 3 네트워크 구성부(303)와, 상기 제 3 네트워크 구성부(303)에서 구성된 기사와 이슈간 네트워크의 이슈들을 동일한 클러스터로 묶음으로써, 내용의 유사성 관점의 이슈 클러스터링을 수행하는 제 3 이슈 클러스터링부(304)로 구성된다.
그리고 상기 제 1 클러스터링부(100)는 고객의 웹 검색기록정보를 저장하는 검색기록정보 DB(101)와, 상기 검색기록정보 DB(101)에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 방문 기록을 분석하는 방문기록 분석부(102)와, 상기 방문기록 분석부(102)에서 분석된 방문 기록을 기반으로 사용자와 기사간의 다대다 관계를 그래프로 도식화하여 사용자와 기사간의 네트워크를 구성하는 제 1 네트워크 구성부(103)와, 상기 제 1 네트워크 구성부(103)에서 구성된 사용자와 기사간의 네트워크를 상기 제 3 클러스터링부(300)의 제 3 네트워크 구성부(303)에서 구성된 기사와 이슈간의 네트워크와 병합하는 제 1 네트워크 병합부(104)와, 상기 제 1 네트워크 병합부(104)에서 병합된 사용자와 이슈간의 다대다 관계를 그래프로 도식화하여 사용자와 이슈간의 이원 네트워크를 구성하는 제 2 네트워크 구성부(105)와, 상기 제 2 네트워크 구성부(105)에서 구성된 사용자와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 사용자 관점의 이슈 클러스터링을 수행하는 제 1 이슈 클러스터링부(106)로 구성된다. 그리고 상기 검색기록정보 DB(101)에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하여 제 3 클러스터링부(300)로 전달하는 크롤링부(107)를 구성한다.
또한, 상기 제 2 클러스터링부(200)는 특허 정보 또는 연구 보고서 등의 R&D 문서로부터 R&D 용어집을 구축하여 저장하는 R&D 용어정보 DB(201)와, 상기 제 3 클러스터링부(300)의 뉴스기사 정보 DB(301)에 저장된 뉴스기사정보를 기반으로 상기 R&D 용어정보 DB(201)에 저장된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도를 분석하는 R&D 용도 분석부(202)와, 상기 R&D 용도 분석부(202)에서 분석된 수록 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 다대다 관계를 그래프로 도식화하여 R&D와 기사간의 네트워크를 구성하는 제 3 네트워크 구성부(203)와, 상기 제 3 네트워크 구성부(203)에서 구성된 R&D와 기사간의 네트워크를 상기 제 3 클러스터링부(300)의 제 3 네트워크 구성부(303)에서 구성된 기사와 이슈간의 네트워크와 병합하는 제 2 네트워크 병합부(204)와, 상기 제 2 네트워크 병합부(204)에서 병합된 R&D와 이슈간의 다대다 관계를 그래프로 도식화하여 R&D와 이슈간의 이원 네트워크를 구성하는 제 4 네트워크 구성부(205)와, 상기 제 4 네트워크 구성부(205)에서 구성된 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 R&D 관점의 이슈 클러스터링을 수행하는 제 2 이슈 클러스터링부(206)로 구성된다.
이와 같이 구성된 본 발명에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치의 동작을 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다. 도 2와 동일한 참조부호는 동일한 기능을 수행하는 동일한 부재를 지칭한다.
도 3 은 본 발명의 실시예에 따른 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법을 설명하기 위한 흐름도이다.
도 3을 참조하여 설명하면, 먼저 제 3 클러스터링부(300)를 이용하여 기사와 이슈간 네트워크를 구성하여 기사가 유사한 이슈들을 동일한 클러스터로 묶음으로써, 기사내용의 유사성 관점의 이슈 클러스터링을 수행한다(S100). 이에 따른 상세한 설명은 도 4를 참조하여 아래에서 상세히 설명한다.
이어, 제 1 클러스터링부(100)를 이용하여 고객의 웹 검색기록정보를 기반으로 분석된 인터넷 뉴스 사이트의 방문 기록으로 사용자와 기사간의 네트워크를 구성한 후, 상기 제 3 클러스터링부(300)에서 구성된 기사와 이슈간 네트워크와 병합하여 사용자와 이슈간 이원 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써, 소비자 선호 이슈 관점의 이슈 클러스터링을 수행한다(S200). 이에 따른 상세한 설명은 도 5를 참조하여 아래에서 상세히 설명한다.
또한 제 2 클러스터링부(200)를 이용하여 특허 정보 또는 연구 보고서 등의 R&D 문서로부터 구축된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 네트워크를 구성한 후, 상기 제 3 클러스터링부(300)에서 구성된 기사와 이슈간 네트워크와 병합하여 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써, R&D 관점의 이슈 클러스터링을 수행한다(S300). 이에 따른 상세한 설명은 도 6을 참조하여 아래에서 상세히 설명한다.
그리고 다차원 이슈 클러스터링부(400)를 이용하여 상기 소비자 선호 이슈 관점, R&D 관점 및 내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화 한다(S400).
이처럼, 본 발명은 다양한 관점에서의 이슈 클러스터링을 수행하고 이를 통합하므로써, 기존에는 파악되지 않았던 소비자 관점에서의 연관 이슈를 분석하여 상위 개념의 새로운 이슈를 도출하고 이에 기반하여 신규 고객군을 정의할 수 있을 뿐 아니라, R&D 기술 측면의 연관 이슈를 파악함으로써 국가적 차원의 효과적인 R&D 투자 정책 수립에도 기여할 수 있다.
도 4 는 도 3의 S100에서 기재하고 있는 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 과정을 보다 상세히 설명하기 위한 흐름도이다.
도 4를 참조하여 설명하면, 먼저 인터넷 뉴스 사이트 방문 기록을 토대로 크롤링(Crawling)된 분석 대상 뉴스 기사를 입력으로 저장한다(S101). 이는 제 1 클러스터링부(100)로부터 고객의 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 크롤링(crawling)되어 수집된 뉴스기사정보를 입력받게 된다.
그리고 토픽 분석부(302)를 통해 상기 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출한다(S102).
이어 제 3 네트워크 구성부(303)를 통해 상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성한다(S103).
이렇게 구성된 기사와 이슈간 네트워크의 이슈들을 제 3 이슈 클러스터링부(304)를 통해 기사내용이 유사한 이슈들을 동일한 클러스터로 묶음으로써, 기사내용의 유사성 관점의 이슈 클러스터링을 수행한다(S104).
도 5 는 도 3의 S200에서 기재하고 있는 소비자 선호 이슈 관점의 이슈 클러스터링을 수행하는 과정을 보다 상세히 설명하기 위한 흐름도이다.
도 5를 참조하여 설명하면, 먼저 고객의 웹 검색기록정보를 저장한다(S201).
이때, 뉴스기사를 수집하고자 하는 경우(S202), 크롤링부(107)를 통해 상기 저장된 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하여(S203) 제 3 클러스터링부(300)로 전달한다(S204).
그리고 방문기록 분석부(102)는 상기 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 방문 기록을 분석한다(S205).
이어 상기 분석된 방문 기록을 기반으로 제 1 네트워크 구성부(103)를 통해 사용자와 기사간의 다대다 관계를 그래프로 도식화하여 사용자와 기사간의 네트워크를 구성한다(S206).
그리고 제 1 네트워크 병합부(104)를 통해 상기 구성된 사용자와 기사간의 네트워크를 상기 제 3 클러스터링부(300)의 제 3 네트워크 구성부(303)에서 구성된 기사와 이슈간의 네트워크와 병합한다(S207). 제 2 네트워크 구성부(105)는 이렇게 병합된 사용자와 이슈간의 다대다 관계를 그래프로 도식화하여 사용자와 이슈간의 이원 네트워크를 구성한다(S208).
도 7 은 사용자와 기사간의 네트워크를 기사와 이슈간의 네트워크와 병합하여 사용자와 이슈간 네트워크를 도출하는 과정을 설명하기 위한 직관적 예를 나타낸 구성도이고, 도 8 은 사용자와 기사간의 네트워크를 기사와 이슈간의 네트워크와 병합하는 과정을 매트릭스 형태로 나타낸 구성도로서, 이를 참조하여 설명하면 다음과 같다.
도 8(a)는 사용자와 기사간 대응 매트릭스, 도 8(b)는 기사와 이슈간 대응 매트릭스를 나타내고 있으며, 도 8(c)는 위의 두 매트릭스를 병합하여 사용자가 각 토픽별 기사를 접속한 횟수에 대하여 사용자와 이슈간 초기 이원 매트릭스를 보여주고 있다.
예를 들어 도 8(b)에서 이슈 T1에 속하는 기사는 A1, A3, A4임을 알 수 있으며, 이들 기사 중 사용자 U1이 읽은 기사는 A1, A3임을 알 수 있다. 즉 U1은 T1에 속하는 기사 두 개를 읽었으며, 이 값이 도 8(c)의 (U1, T1) 셀에 나타나 있다. 이 때, 임계치를 2로 적용하여 도 8(d)에서 임계치보다 적을 경우 모두 0으로 변환하여 최종 사용자와 이슈간 이원 매트릭스를 형성한다.
그리고 마지막으로 제 1 이슈 클러스터링부(106)를 통해 상기 구성된 사용자와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 사용자 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 사용자 관점의 이슈 클러스터링을 수행한다(S209).
도 6 는 도 3의 S300에서 기재하고 있는 R&D 관점의 이슈 클러스터링을 수행하는 과정을 보다 상세히 설명하기 위한 흐름도이다.
도 6을 참조하여 설명하면, 먼저 특허 정보 또는 연구 보고서 등의 R&D 문서로부터 R&D 용어집을 구축하여 저장한다(S301).
그리고 R&D 용도 분석부(202)를 통해 저장된 뉴스기사정보를 기반으로 상기 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도를 분석한다(S302).
이어 상기 분석된 어휘들이 뉴스 기사 출현 빈도에 따라 제 3 네트워크 구성부(203)는 R&D와 기사간의 다대다 관계를 그래프로 도식화하여 R&D와 기사간의 네트워크를 구성한다(S303).
그리고 제 2 네트워크 병합부(204)를 통해 상기 구성된 R&D와 기사간의 네트워크를 상기 제 3 클러스터링부(300)의 제 3 네트워크 구성부(303)에서 구성된 기사와 이슈간의 네트워크와 병합한다(S304). 제 4 네트워크 구성부(205)는 이렇게 병합된 R&D와 이슈간의 다대다 관계를 그래프로 도식화하여 R&D와 이슈간의 이원 네트워크를 구성한다(S305). 이때, 네트워크의 병합 및 R&D와 이슈간의 이원 네트워크의 구성은 도 7 및 도 8을 참조하여 위에서 설명하고 있으며, 이를 통해 구성이 가능하므로, 이에 따른 상세한 설명은 생략한다.
그리고 마지막으로 제 2 이슈 클러스터링부(206)를 통해 상기 구성된 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶음으로써 R&D 관점의 이슈 클러스터링을 수행한다(S306).
상기에서 설명한 본 발명의 기술적 사상은 바람직한 실시예에서 구체적으로 기술되었으나, 상기한 실시예는 그 설명을 위한 것이며 그 제한을 위한 것이 아님을 주의하여야 한다. 또한, 본 발명의 기술적 분야의 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 실시예가 가능함을 이해할 수 있을 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (13)

  1. 삭제
  2. 삭제
  3. R&D와 이슈간 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 제 2 클러스터링부와,
    기사와 이슈간 네트워크의 각 이슈에 대해, 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 제 3 클러스터링부와,
    상기 R&D 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 다차원 이슈 클러스터링부를 포함하여 구성되고,
    이때, 상기 제 3 클러스터링부는
    고객의 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 크롤링(crawling)된 뉴스기사정보를 저장하는 뉴스기사 정보 DB와,
    상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 토픽 분석부와,
    상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 제 3 네트워크 구성부와,
    상기 제 3 네트워크 구성부에서 구성된 기사와 이슈간 네트워크의 이슈들을 동일한 클러스터로 묶어 내용의 유사성 관점의 이슈 클러스터링을 수행하는 제 3 이슈 클러스터링부를 포함하여 구성되고,
    또한, 상기 제 2 클러스터링부는
    특허 정보 또는 연구 보고서를 포함하는 R&D 문서로부터 R&D 용어집을 구축하여 저장하는 R&D 용어정보 DB와,
    상기 제 3 클러스터링부에 저장된 뉴스기사정보를 기반으로 상기 R&D 용어정보 DB에 저장된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도를 분석하는 R&D 용도 분석부와,
    상기 R&D 용도 분석부에서 분석된 수록 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 다대다 관계를 그래프로 도식화하여 R&D와 기사간의 네트워크를 구성하는 제 3 네트워크 구성부와,
    상기 제 3 네트워크 구성부에서 구성된 R&D와 기사간의 네트워크를 상기 제 3 클러스터링부에서 구성된 기사와 이슈간의 네트워크와 병합하는 제 2 네트워크 병합부와,
    상기 제 2 네트워크 병합부에서 병합된 R&D와 이슈간의 다대다 관계를 그래프로 도식화하여 R&D와 이슈간의 이원 네트워크를 구성하는 제 4 네트워크 구성부와,
    상기 제 4 네트워크 구성부에서 구성된 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 제 2 이슈 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치.
  4. 제 3 항에 있어서, 상기 제 3 클러스터링부는
    고객의 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 크롤링(crawling)된 뉴스기사정보를 저장하는 뉴스기사 정보 DB와,
    상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 토픽 분석부와,
    상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 제 3 네트워크 구성부와,
    상기 제 3 네트워크 구성부에서 구성된 기사와 이슈간 네트워크의 이슈들을 동일한 클러스터로 묶어 내용의 유사성 관점의 이슈 클러스터링을 수행하는 제 3 이슈 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 장치.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. R&D와 이슈간 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 제 2 클러스터링부와, 기사와 이슈간 네트워크의 각 이슈에 대해, 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 기반의 이슈 클러스터링을 수행하는 제 3 클러스터링부와, 상기 R&D 관점 및 기사내용의 유사성 관점을 적어도 2개 이상 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 다차원 이슈 클러스터링부를 포함하여 구성되는 사회적 이슈 재구성 장치를 이용한 사회적 이슈 재구성 방법은
    (a) 제 3 클러스터링부를 통해 기사와 이슈간 네트워크를 구성하여 기사가 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계와,
    (b) 제 2 클러스터링부를 통해 특허 정보, 연구 보고서를 포함하는 R&D 문서로부터 구축된 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도에 따라 R&D와 기사간의 네트워크를 구성하고, 상기 제 3 클러스터링부에서 구성된 기사와 이슈간 네트워크와 병합하여 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 단계와,
    (c) 다차원 이슈 클러스터링부를 통해 상기 R&D 관점 및 내용의 유사성 관점을 활용한 다차원 이슈 클러스터링을 통해 데이터를 그룹화하는 단계를 포함하여 이루어지고,
    이때, 상기 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계는
    인터넷 뉴스 사이트 방문 기록을 토대로 크롤링(Crawling)된 분석 대상 뉴스 기사를 입력으로 저장하는 단계와,
    토픽 분석부를 통해 상기 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 단계와,
    제 3 네트워크 구성부를 통해 상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 단계와,
    상기 구성된 기사와 이슈간 네트워크의 이슈들을 제 3 이슈 클러스터링부를 통해 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계를 포함하여 이루어지며,
    또한, 상기 R&D 관점의 이슈 클러스터링을 수행하는 단계는
    특허 정보, 연구 보고서를 포함하는 R&D 문서로부터 R&D 용어집을 구축하여 저장하는 단계와,
    R&D 용도 분석부를 통해 저장된 뉴스기사정보를 기반으로 상기 R&D 용어집에 수록된 어휘들이 뉴스 기사에 출현하는 빈도를 분석하는 단계와,
    상기 분석된 어휘들이 뉴스 기사 출현 빈도에 따라 제 3 네트워크 구성부를 통해 R&D와 기사간의 다대다 관계를 그래프로 도식화하여 R&D와 기사간의 네트워크를 구성하는 단계와,
    제 2 네트워크 병합부를 통해 상기 구성된 R&D와 기사간의 네트워크를 상기 제 3 클러스터링부에서 구성된 기사와 이슈간의 네트워크와 병합하는 단계와,
    제 4 네트워크 구성부를 통해 상기 병합된 R&D와 이슈간의 다대다 관계를 그래프로 도식화하여 R&D와 이슈간의 이원 네트워크를 구성하는 단계와,
    제 2 이슈 클러스터링부를 통해 상기 구성된 R&D와 이슈간의 이원 네트워크의 각 이슈에 대해, 연결된 R&D 노드가 유사한 이슈들을 동일한 클러스터로 묶어 R&D 관점의 이슈 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법.
  10. 제 9 항에 있어서, 상기 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계는
    인터넷 뉴스 사이트 방문 기록을 토대로 크롤링(Crawling)된 분석 대상 뉴스 기사를 입력으로 저장하는 단계와,
    토픽 분석부를 통해 상기 저장된 뉴스기사정보에 대하여 토픽 분석을 수행하여 주요 이슈를 추출하는 단계와,
    제 3 네트워크 구성부를 통해 상기 추출된 각 기사와 이슈간의 다대다 관계를 그래프로 도식화하여 기사와 이슈간의 네트워크를 구성하는 단계와,
    상기 구성된 기사와 이슈간 네트워크의 이슈들을 제 3 이슈 클러스터링부를 통해 기사내용이 유사한 이슈들을 동일한 클러스터로 묶어 기사내용의 유사성 관점의 이슈 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법.
  11. 제 10 항에 있어서,
    상기 분석 대상 뉴스 기사의 입력은 제 1 클러스터링부로부터 고객의 웹 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 크롤링(crawling)되어 수집된 뉴스기사정보를 입력받는 것을 특징으로 하는 소셜 네트워크를 활용한 R&D 관점의 사회적 이슈 재구성 방법.
  12. 삭제
  13. 삭제
KR1020150026636A 2015-02-25 2015-02-25 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법 KR101693727B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150026636A KR101693727B1 (ko) 2015-02-25 2015-02-25 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150026636A KR101693727B1 (ko) 2015-02-25 2015-02-25 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20160103802A KR20160103802A (ko) 2016-09-02
KR101693727B1 true KR101693727B1 (ko) 2017-01-17

Family

ID=56943010

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150026636A KR101693727B1 (ko) 2015-02-25 2015-02-25 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101693727B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175293B (zh) * 2019-05-30 2021-01-29 北京小米智能科技有限公司 一种确定新闻脉络的方法、装置及电子设备
CN110929145B (zh) * 2019-10-17 2023-07-21 平安科技(深圳)有限公司 舆情分析方法、装置、计算机装置及存储介质
KR102368823B1 (ko) * 2019-10-29 2022-03-03 한국전자기술연구원 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101259417B1 (ko) * 2011-11-17 2013-04-30 한국과학기술정보연구원 집단지성을 활용한 하이브리드형 유망기술 추출 시스템 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100932843B1 (ko) 2008-01-29 2009-12-21 엔에이치엔(주) 검색결과간의 연관도에 기초하여 클러스터링된 검색결과를제공하는 방법 및 시스템 그리고 검색결과를클러스터링하는 방법 및 시스템
KR101370831B1 (ko) * 2012-04-23 2014-03-17 줌인터넷 주식회사 축약된 이슈문장 추출 시스템 및 방법
KR101735312B1 (ko) * 2013-03-28 2017-05-16 한국전자통신연구원 소셜 미디어 분석을 기반으로 복합이슈를 탐지하기 위한 장치, 시스템 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101259417B1 (ko) * 2011-11-17 2013-04-30 한국과학기술정보연구원 집단지성을 활용한 하이브리드형 유망기술 추출 시스템 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
김지은 외 2명, ‘다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링’, 지능정보연구 제20권 제2호, 2014.6, 93-107

Also Published As

Publication number Publication date
KR20160103802A (ko) 2016-09-02

Similar Documents

Publication Publication Date Title
Lozano et al. Complex network analysis of keywords co-occurrence in the recent efficiency analysis literature
Atzmueller et al. Description-oriented community detection using exhaustive subgroup discovery
Bedi et al. Community detection in social networks
CN104881424B (zh) 一种基于正则表达式的电力大数据采集、存储及分析方法
Sukanya et al. Techniques on text mining
Dominguez-Sal et al. A discussion on the design of graph database benchmarks
US9183281B2 (en) Context-based document unit recommendation for sensemaking tasks
CN107729336A (zh) 数据处理方法、设备及系统
Effendy et al. Analysing trends in computer science research: A preliminary study using the microsoft academic graph
Agrahari et al. A review paper on Big Data: technologies, tools and trends
CN104598536B (zh) 一种分布式网络信息结构化处理方法
Velardi et al. A new content-based model for social network analysis
KR101693727B1 (ko) 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법
Wang et al. Exploring all-author tripartite citation networks: A case study of gene editing
CN106682206A (zh) 一种大数据处理方法及系统
Atzmueller et al. MinerLSD: efficient mining of local patterns on attributed networks
CN109345293A (zh) 一种面向品牌电商的大数据信息服务方法和系统
Meena et al. A survey on community detection algorithm and its applications
Shi et al. Flow-based influence graph visual summarization
Chehreghani et al. Density link-based methods for clustering web pages
CN115293479A (zh) 舆情分析工作流系统及其方法
KR101664358B1 (ko) 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법
Nogueira et al. pytwanalysis: Twitter data management and analysis at scale
Caraballo et al. Automatic creation and analysis of a linked data cloud diagram
Huynh et al. An approach for incremental mining of clickstream patterns as a service application

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant