KR101644036B1 - 개인 관심 이슈 트래킹 장치 및 방법 - Google Patents

개인 관심 이슈 트래킹 장치 및 방법 Download PDF

Info

Publication number
KR101644036B1
KR101644036B1 KR1020150026067A KR20150026067A KR101644036B1 KR 101644036 B1 KR101644036 B1 KR 101644036B1 KR 1020150026067 A KR1020150026067 A KR 1020150026067A KR 20150026067 A KR20150026067 A KR 20150026067A KR 101644036 B1 KR101644036 B1 KR 101644036B1
Authority
KR
South Korea
Prior art keywords
issue
individual
document
matrix
issues
Prior art date
Application number
KR1020150026067A
Other languages
English (en)
Inventor
김남규
류신
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020150026067A priority Critical patent/KR101644036B1/ko
Application granted granted Critical
Publication of KR101644036B1 publication Critical patent/KR101644036B1/ko

Links

Images

Classifications

    • G06F17/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

본 발명은 세부 기간별 토픽 분석 및 개인별 관심이슈 도출을 통한 이슈 매칭을 통하여 개인의 관심 변화를 정확하게 분석할 수 있도록 한 개인 관심 이슈 트래킹 장치 및 방법에 관한 것으로, 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 세부 기간별 구분부;각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하는 토픽 분석부;토픽 분석을 통하여 문서/이슈간 대응 매트릭스를 도출하는 문서/이슈간 매트릭스 처리부;개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 문서/개인간 매트릭스 처리부;문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 이슈/개인간 매트릭스 처리부;도출된 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 이슈 매칭부;를 포함하는 것이다.

Description

개인 관심 이슈 트래킹 장치 및 방법{System and Method for Tracking Individual Interests Issue}
본 발명은 이슈 트래킹에 관한 것으로, 구체적으로 세부 기간별 토픽 분석 및 개인별 관심이슈 도출을 통한 이슈 매칭을 통하여 개인의 관심 변화를 정확하게 분석할 수 있도록 한 개인 관심 이슈 트래킹 장치 및 방법에 관한 것이다.
다양한 스마트기기와 클라우드 기술을 포함한 정보통신기술이 급속도로 발달함에 따라 사람들은 장소와 공간에 상관없이 인터넷에 쉽게 접근할 수 있게 되었으며, 이로 인해 매우 방대한 데이터가 빠른 속도로 생성되고 있다.
이처럼 그 양이 방대하여 기존의 방법이나 도구로는 수집, 저장, 검색, 분석, 시각화가 어려운 정형 또는 비정형 데이터를 빅데이터(Big Data)라고 한다.
특히 사용자들이 실시간으로 참여하여 사회적 이슈나 개인의 관심사에 대해 의견을 표현할 수 있는 다양한 소셜미디어가 활성화되고 있으며, 이러한 현상은 비정형 텍스트 처리 기술의 발전과 더불어 빅데이터 분석의 수요 증가를 견인하고 있다.
즉, Facebook, Twitter 등의 SNS(Social Network Service)를 통해 유통되는 텍스트 데이터의 양이 급증함에 따라, 이러한 글에 대한 분석을 통해 사회적 이슈의 흐름 또는 특정 제품이나 서비스에 대한 의견을 파악하기 위한 시도가 활발하게 이루어지고 있다.
이러한 시도 중 비정형 텍스트 분석을 통해 의미를 도출하기 위한 각종 알고리즘 및 방법론을 다루는 분야를 텍스트 마이닝(Text Mining)이라 하며, 다양한 텍스트 마이닝의 세부 분야 중 특히 다수의 문서로부터 핵심 주제를 식별해내는 토픽 분석(Topic Analysis)은 이미 여러 분야에서 가시적인 성과를 내고 있다.
토픽 분석에 주로 사용되는 원본(Source) 데이터는 크게 Facebook, Twitter 등의 SNS 데이터와, 뉴스 또는 인터넷 게시판 등의 인터넷 게시물을 들 수 있다.
SNS 데이터는 다양한 의견을 실시간으로 들을 수 있다는 장점이 있지만 정제되지 않은 표현이 너무 많고 주제가 특정 분야에 한정되지 않아 분석이 어렵다는 한계를 갖는다.
한편 뉴스 데이터는 비교적 정제된 표현과 주제의 집중도로 인해 분석이 용이하다는 장점을 갖지만, 사회 전체적인 이슈의 흐름을 나타낼 뿐 이 이슈와 개인들과의 관계를 파악하기는 어렵다는 한계를 갖는다.
토픽 분석이 특정 시점의 이슈의 분포를 파악하기 위한 정적인 분석의 성격을 갖는 것과 달리, 최근에는 여러 시점에 걸친 이슈의 변화를 분석하고 추적하기 위한 이슈 트래킹에 대한 연구가 다수 이루어지고 있다.
이슈 트래킹은 대상 기간에 게시 또는 접속된 문서들로부터 주요 이슈를 추출한 뒤, 대상 기간을 세부 기간으로 나누어 각 세부 기간별 주요 이슈의 분포를 분석하는 것을 목적으로 한다.
하지만 전통적인 이슈 트래킹은 사회 전체 관점(Macro-level)에서의 이슈의 추적할 뿐, 각 이슈에 관심을 갖는 개인들의 관심의 흐름을 추적하지는 못한다는 한계를 갖는다. 이러한 한계는 도 1 내지 도 3을 통해 설명된다
도 1은 주요 이슈 및, 각 이슈에 관심을 갖는 개인 수의 변화를 나타낸 구성도이다.
그리고 도 2는 이슈 트래킹에 위한 이슈 변화를 나타낸 그래프이고, 도 3은 개인별 관심 추세의 변화를 나타낸 구성도이다.
도 1은 Week1과 Week2에 걸친 주요 이슈 및, 각 이슈에 관심을 갖고 있는 개인 수의 변화를 나타내고 있다.
도 1에서 개인의 수는 해당 이슈에 대응되는 글을 작성하거나 조회한 사람의 수로 이해될 수 있다. 첫 주에는 건강, 쇼핑, 금융의 이슈가 주요 이슈이며, 둘째 주에는 월드컵, 외식, 금융의 이슈가 주요 이슈임을 알 수 있다.
이러한 이슈의 변화는 도 2의 그래프로 도식화하여 나타낼 수 있다.
도 2에서 건강과 쇼핑의 이슈는 소멸되었으며, 금융의 이슈에 대한 관심이 감소하고, 이러한 이슈들에 대한 관심은 새로 생성된 이슈인 외식과 월드컵으로 옮겨갔음을 알 수 있다.
물론 이러한 분석을 통해 주요 이슈의 흐름을 파악함으로써 이에 따라 마케팅 전략을 수립하는 것도 매우 의미가 있지만, 전체 이슈의 변화가 곧 개인의 관심 변화를 나타낸다고 보기는 어렵기 때문에 분석 결과의 활용 범위는 제한적일 수밖에 없다.
이는 대부분의 마케팅 전략은 궁극적으로 고객(개인)을 대상으로 하는 것에 반해, 전통적인 이슈 트래킹의 결과는 이슈의 흐름만 분석할 뿐 개인에 대해서는 충분한 정보를 주지 못하고 있기 때문이다.
예를 들어 도 3은 도 1의 상황에서 개인별 관심 추세의 변화를 파악할 수 있다고 가정한 상황을 나타내고 있다.
즉 Week2의 월드컵 이슈는 Week1의 금융과 쇼핑에 관심을 갖던 개인들을 흡수하였으며, 건강에 관심을 갖던 개인은 외식으로 관심이 변경되었음을 알 수 있다.
텍스트 마이닝에 관하여 설명하면 다음과 같다.
텍스트는 의료, 고객 항의, 제품 문의, 제품 수리, 의견 표출 등의 일상 생활에서 컴퓨터가 아닌 사람의 소통을 위해 사용된다. 특히 최근에는 정보통신의 발달과 다양한 소셜미디어 서비스의 활성화로 인해 무수히 많은 양의 텍스트가 유통되고 있다.
즉 웹2.0의 목표인 사용자 참여 및 소통을 지원하기 위해 다양한 기술의 발전이 이루어졌으며, 그 결과로 더욱 많은 텍스트 컨텐츠들이 생성되고 유통되고 있다.
따라서 이러한 텍스트 데이터에 대한 분석을 통해 더욱 의미있는 가치를 창출하고자 하는 텍스트 마이닝(Text Mining)에 대한 관심이 급증하는 것은 매우 당연하다고 할 수 있다.
텍스트 마이닝이란 방대한 양의 텍스트 문서로부터 의미있는 정보를 추출하는 일련의 과정을 의미한다. 텍스트 마이닝은 정보 검색, 데이터 마이닝, 기계 학습(Machine Learning), 통계학, 컴퓨터 언어학 등이 결합된 학제적(Interdisciplinary) 분야의 성격을 갖는다.
텍스트 마이닝은 문서 분류(Classification), 문서 군집화(Clustering), 정보 추출 등에 활용되며, 일반적으로 행렬, 계층, 벡터 등의 형식으로 정형화된 뒤 이후 분석 작업이 이루어진다.
특히 가장 기본적인 변환 방식으로 각 문서에 용어의 빈도를 요약하는 벡터공간모델(Vector Space Model)이 주로 사용된다.
텍스트 마이닝 응용 중 가장 대표적인 것으로 토픽 분석(Topic Analysis)을 들 수 있다. 토픽 분석은 벡터공간모델과 TF-IDF에 기반하여 수행되며, 주로 파싱(Parsing), 필터링(Filtering)을 거친 후에 이루어진다.
토픽 분석은 유사한 주제를 갖는 문서들을 묶는다는 점에서는 전통적인 군집화와 유사하지만, 하나의 문서가 다수의 토픽에 대응될 수 있다는 점에서 군집화와는 구별되는 특징을 갖는다.
그리고 한 시점의 주요 이슈를 파악하는 정적인 분석인 토픽 분석과 달리, 여러 시점에 걸친 주요 이슈의 변화를 추적하는 분야를 이슈 트래킹(Issue Tracking)이라 한다.
이슈 트래킹은 인터넷 뉴스 기사, 소셜미디어 게시물 등에서 사람들이 자주 언급하는 정치, 경제, 연예, 스포츠 등 사회 전반에 걸친 이슈들을 추출, 발견하는 것을 목표로 한다.
이슈 트래킹을 통해 대상 기간의 주요 이슈를 파악할 수 있음은 물론, 기간의 변화에 따라 어떤 이슈가 새로 생성되고 또 얼마나 지속되는지 파악할 수 있다.
주로 해외에서 활발하게 연구되며 사용되고 있는 이슈 트래킹은 주로 뉴스 데이터에 대한 분석이 주를 이루며, 이미 시스템으로 제공되어 다양한 응용에 사용되고 있다. 국내의 경우에도 최근 트위터 데이터를 대상으로 한 이슈 트래킹 연구가 활발하게 수행되고 있으며, 분석을 통해 대선 후보별 이슈를 분석한 연구가 자주 인용되고 있다.
하지만 기존의 이슈 트래킹은 분석 대상이 되는 전체 기간의 문서를 한꺼번에 분석해야 하기 때문에 확장성이 낮다는 한계가 있다.
또한 기존의 이슈 트래킹 결과는 특정 기간에 어떤 이슈에 대한 관심이 높았는지는 보여줄 수 있지만, 개인들의 관심이 어떤 이슈에서 어떤 이슈로 이동했는지는 보여주지 못한다는 한계를 갖는다.
한국공개특허번호 10-2010-0103001호 한국공개특허번호 10-2013-0116982호 한국공개특허번호 10-2013-0082662호
본 발명은 이와 같은 종래 기술의 이슈 트래킹의 문제를 해결하기 위한 것으로, 세부 기간별 토픽 분석 및 개인별 관심이슈 도출을 통한 이슈 매칭을 통하여 개인의 관심 변화를 정확하게 분석할 수 있도록 한 개인 관심 이슈 트래킹 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명은 전통적 이슈 트래킹의 한계를 극복하기 위한 개인별 관심 트래킹을 통해 개인들이 어떤 이슈에서 어떤 이슈로 관심이 변화하는지를 추적할 수 있도록 한 개인 관심 이슈 트래킹 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명은 개인별 관심 트래킹을 통해 개인의 관심 변화를 예측하고 이에 대해 선제적으로 대응하는 마케팅 전략을 수립함으로써 새로운 가치창출을 극대화할 수 있도록 한 개인 관심 이슈 트래킹 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명은 분석 대상이 되는 전체 기간의 문서를 한꺼번에 분석해야 하는 기존의 이슈 트래킹과 달리, 새로운 기간의 문서가 추가되었을 때 전체 기간의 문서가 아닌 새로 추가된 문서에 대해서만 토픽 분석을 수행하고 이를 이전의 분석 결과와 통합할 수 있으므로 기간의 확장성 측면에서 유리한 개인 관심 이슈 트래킹 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 개인 관심 이슈 트래킹 장치는 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 세부 기간별 구분부;각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하는 토픽 분석부;토픽 분석을 통하여 문서/이슈간 대응 매트릭스를 도출하는 문서/이슈간 매트릭스 처리부;개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 문서/개인간 매트릭스 처리부;문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 이슈/개인간 매트릭스 처리부;도출된 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 이슈 매칭부;를 포함하는 것을 특징으로 한다.
여기서, 토픽 분석부에 의한 토픽 분석은, 각 문서에 포함된 용어의 빈도수에 근거하여 문서를 계량화한 뒤, 문서 간의 거리에 기반하여 유사 문서를 그룹화하는 것을 특징으로 한다.
그리고 토픽 분석에서의 빈도수는, TF-IDF(Term Frequency-Inverse Document Frequency) 기반 상대 빈도수가 사용되며, 토픽 분석의 결과로는 대표 키워드로 표현되는 각 토픽과 해당 토픽에 대응되는 문서 리스트가 생성되는 것을 특징으로 한다.
그리고 이슈/개인간 매트릭스 처리부에서 도출된 이슈/개인간 대응 매트릭스는, 뉴스 조회 빈도가 높은 개인이 그렇지 않은 개인에 비해 모든 이슈에 대한 관심이 높게 나타나는 왜곡 현상을 방지하기 위하여 각 개인이 이슈에 대해 갖는 총합을 일정하게 유지하는 개인별 표준화를 거쳐 이슈 매칭에 사용되는 것을 특징으로 한다.
그리고 이슈 매칭부에서의 이슈 매칭을 통한 개인 관심 트래킹 과정은, 두 개의 표준화된 개인/이슈 매트릭스를 사용하고, 모든 개인에 대해 각 개인의 두 이슈에 대한 관심의 가중합을 구하는 것에 의해 이루어지는 것을 특징으로 한다.
다른 목적을 달성하기 위한 본 발명에 따른 개인 관심 이슈 트래킹 방법은 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 단계;각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하여 문서/이슈간 대응 매트릭스를 도출하는 단계;개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 단계;문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 단계;도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 단계;를 포함하는 것을 특징으로 한다.
여기서, 각 세부 기간별 뉴스에 대한 각각의 토픽 분석은, 각 문서에 포함된 용어의 빈도수에 근거하여 문서를 계량화한 뒤, 문서 간의 거리에 기반하여 유사 문서를 그룹화하는 것을 특징으로 한다.
그리고 토픽 분석에서의 빈도수는, TF-IDF(Term Frequency-Inverse Document Frequency) 기반 상대 빈도수가 사용되며, 토픽 분석의 결과로는 대표 키워드로 표현되는 각 토픽과 해당 토픽에 대응되는 문서 리스트가 생성되는 것을 특징으로 한다.
그리고 도출된 이슈/개인간 대응 매트릭스는, 뉴스 조회 빈도가 높은 개인이 그렇지 않은 개인에 비해 모든 이슈에 대한 관심이 높게 나타나는 왜곡 현상을 방지하기 위하여 각 개인이 이슈에 대해 갖는 총합을 일정하게 유지하는 개인별 표준화를 거쳐 이슈 매칭에 사용되는 것을 특징으로 한다.
그리고 도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 단계에서, 두 개의 표준화된 개인/이슈 매트릭스를 사용하고, 모든 개인에 대해 각 개인의 두 이슈에 대한 관심의 가중합을 구하는 것에 의해 이루어지는 것을 특징으로 한다.
그리고 도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 단계에서,
Figure 112015018390270-pat00001
을 사용하여 이슈 매칭을 하고,
여기서, Match(Ta, Tb)는 이슈 Ta와 이슈 Tb의 대응도를 나타내며, n은 개인의 수를, Ui a와 Ui b는 각각 개인 Ui가 이슈 Ta와 이슈 Tb에 대해 갖는 관심도를 의미하는 것을 특징으로 한다.
이와 같은 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법은 다음과 같은 효과를 갖는다.
첫째, 세부 기간별 토픽 분석 및 개인별 관심이슈 도출을 통한 이슈 매칭을 통하여 개인의 관심 변화를 정확하게 분석할 수 있다.
둘째, 개인별 관심 트래킹을 통해 전통적 이슈 트래킹의 한계를 극복하고 개인들이 어떤 이슈에서 어떤 이슈로 관심이 변화하는지를 추적할 수 있다.
셋째, 개인별 관심 트래킹을 통해 개인의 관심 변화를 예측하고 이에 대해 선제적으로 대응하는 마케팅 전략을 수립함으로써 새로운 가치창출을 극대화할 수 있도록 한다.
넷째, 새로운 기간의 문서가 추가되었을 때 전체 기간의 문서가 아닌 새로 추가된 문서에 대해서만 토픽 분석을 수행하고 이를 이전의 분석 결과와 통합할 수 있어 기간의 확장성 측면에서 유리하다.
도 1은 주요 이슈 및, 각 이슈에 관심을 갖는 개인 수의 변화를 나타낸 구성도
도 2는 이슈 트래킹에 위한 이슈 변화를 나타낸 그래프
도 3은 개인별 관심 추세의 변화를 나타낸 구성도
도 4a는 본 발명에 따른 개인 관심 이슈 트래킹 방법을 나타낸 흐름도
도 4b는 본 발명에 따른 개인 관심 이슈 트래킹 장치의 구성도
도 5는 토픽 분석의 일 예를 나타낸 테이블 구성도
도 6은 개인별 이슈 도출 과정을 나타낸 테이블 구성도
도 7은 개인별 표준화 과정을 나타낸 테이블 구성도
도 8은 이슈 대응 매트릭스를 나타낸 테이블 구성도
도 9는 개인 관심의 흐름을 나타낸 구성도
도 10은 토픽 분석 결과로 나타난 문서/이슈 매트릭스 일부에 대한 스냅샷 구성도
도 11은 문서/개인 매트릭스 구성도
도 12는 개인/이슈 매트릭스 구성도
도 13은 이슈 매칭 결과 테이블 구성도
도 14는 이슈 매칭 결과에 따른 버블 차트 구성도
도 15는 개인 관심 이슈 트래킹에 따른 관심 변화를 나타낸 구성도
이하, 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법의 바람직한 실시 예에 관하여 상세히 설명하면 다음과 같다.
본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법의 특징 및 이점들은 이하에서의 각 실시 예에 대한 상세한 설명을 통해 명백해질 것이다.
도 4a는 본 발명에 따른 개인 관심 이슈 트래킹 방법을 나타낸 흐름도이고, 도 4b는 본 발명에 따른 개인 관심 이슈 트래킹 장치의 구성도이다.
본 발명은 전통적 이슈 트래킹의 한계를 극복하기 위한 개인별 관심 트래킹을 통해 개인들이 어떤 이슈에서 어떤 이슈로 관심이 변화하는지를 추적할 수 있도록 세부 기간별 토픽 분석 및 개인별 관심이슈 도출을 통한 이슈 매칭을 통하여 개인의 관심 변화를 정확하게 분석할 수 있도록 한 것이다.
이를 위한 본 발명에 따른 개인 관심 이슈 트래킹 방법은 도 4a에서와 같이, 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 단계(S401)와, 각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하여(S402) 문서/이슈간 대응 매트릭스를 도출하는 단계(S403)와, 개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 단계(S404)와, 문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 단계(S405)와, 도출된 두 개의 이슈/개인간 대응 매트릭스(S406)를 개인 관점에서 통합하여 최종 산출물인 각 개인 단위의 관심 흐름을 도출하는 단계(S407)를 포함하는 것이다.
이를 위한 본 발명에 따른 개인 관심 이슈 트래킹 장치는 도 4b에서와 같이, 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 세부 기간별 구분부(40)와, 각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하는 토픽 분석부(41)와, 토픽 분석을 통하여 문서/이슈간 대응 매트릭스를 도출하는 문서/이슈간 매트릭스 처리부(42)와, 개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 문서/개인간 매트릭스 처리부(43)와, 문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 이슈/개인간 매트릭스 처리부(44)와, 도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 이슈 매칭부(45)를 포함한다.
이와 같은 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법에 대하여 구체적으로 설명하면 다음과 같다.
우선 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분한다.
도 4a에서는 세부 기간을 N주와 (N+1)주의 두 기간으로만 구분하였으나, 실제로는 보다 많은 세부 기간에 대한 분석이 필요하다.
다음 단계에서는 각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하며, 각 토픽 분석의 결과로 문서/이슈간 대응 매트릭스가 도출된다.
한편 개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출한다.
도출된 두 매트릭스, 즉 문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출한다. 이렇게 도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 최종 산출물인 각 개인 단위의 관심 흐름도를 도출한다.
도 4의 주요 과정에 대한 세부 내용은 다음과 같다.
세부 기간별 토픽 분석은 세부 기간별로 독립적인 토픽 분석을 통해 각 기간별 이슈를 도출하는 과정이다.
즉, 각 기간별로 이슈를 도출하고, 추후 각 기간의 이슈별 매핑을 통해 전체 기간의 이슈의 흐름을 파악하고자 한다. 또한 이러한 이슈의 매핑이 개인 관점에서 이루어지기 때문에, 이슈의 흐름은 개인별 관심의 흐름을 나타내는 것으로 파악될 수 있다.
이러한 분석을 위한 첫 단계는 세부 기간별 이슈를 담고 있는 문서 집합을 준비하는 것이다.
본 발명에서는 게시일이 명확할 뿐 아니라 매우 정제된 표현만을 담고 있는 뉴스 기사를 분석 대상으로 사용한다. 따라서 분석의 첫 단계에서는 수집된 뉴스 기사를 각 세부 기간별로 나누는 작업이 수행된다.
본 발명의 실시 예에서는 2주간의 뉴스를 수집하여 N주와 (N+1)주의 두 세부 기간으로 나누는 것을 가정하였으나, 실제로는 더욱 많은 세부 기간이 분석에 사용되어야 한다.
다음으로 이렇게 분할된 세부 기간별 뉴스에 대해 각 기간별로 토픽 분석을 실시한다.
토픽 분석은 각 문서에 포함된 용어의 빈도수에 근거하여 문서를 계량화한 뒤, 문서 간의 거리에 기반하여 유사 문서를 그룹화하는 방법이다.
토픽 분석에서의 빈도수는 단순 빈도수가 아닌 TF-IDF(Term Frequency-Inverse Document Frequency) 기반 상대 빈도수가 사용되며, 토픽 분석의 결과로는 대표 키워드로 표현되는 각 토픽과 해당 토픽에 대응되는 문서 리스트가 생성된다.
본 발명의 실시 예에 따른 문서 집합에 대해 토픽 분석을 실시한 결과는 도 5에서와 같다.
도 5는 N주의 문서 5개(D1_1 ~ D1_5)와 (N+1)주의 문서 5개(D2_1 ~ D2_5)에 대해 각각 가상 토픽 분석을 실시한 결과를 보여주며, 분석을 통해 N주의 토픽 4개(T1_1 ~ T1_4)와 (N+1)주의 토픽 4개(T2_1 ~ T2_4)가 도출되었음을 알 수 있다.
위의 결과에서 각 토픽은 다수의 문서를 포함하며, 어떤 문서는 둘 이상의 토픽에 대응됨을 확인할 수 있다.
그리고 개인별 관심이슈 도출 과정은 다음과 같다.
본 발명은 인터넷 뉴스를 조회하는 각 개인을 분석의 최소 단위로 사용하기 때문에, 분석을 위해서는 각 개인의 인터넷 뉴스 조회 기록이 반드시 필요하다.
도 5에서 도출한 문서/이슈간 대응 매트릭스와 개인의 인터넷 뉴스 조회 기록으로부터 도출한 문서/개인간 대응 매트릭스를 통해 개인별 관심이슈를 도출하는 과정은 다음과 같다.
전체 과정은 도 6에서와 같이 각 개인은 U1 ~ U3로 나타난다.
도 6(a)는 N주의 개인별 이슈 도출 과정을, 도 6(b)는 (N+1)주의 개인별 이슈 도출 과정을 나타낸 것이다.
최상단 매트릭스는 도 5의 표를 재정리한 것으로, 각 이슈별 대응 문서를 보여준다. 또한 가운데의 매트릭스는 개인의 인터넷 뉴스 조회기록을 요약한 것으로, 어떤 개인이 어떤 뉴스 기사를 조회했을 경우 대응되는 셀의 값은 '1'로 나타난다.
그리고 최하단 매트릭스는 개인별 이슈를 요약한 것으로, 셀 내의 값은 해당 개인이 조회한 기사 중 해당 이슈에 속한 기사의 수를 의미한다.
예를 들어 행 U1과 열 T1_1이 교차하는 셀의 값 '2'는 개인 U1이 이슈 T1_1에 속한 뉴스 두 개(D1_1, D1_3)를 조회한 결과로 나타난다.
이렇게 도출된 개인/이슈 매트릭스는 각 개인별로 표준화된 뒤 이후 과정에 사용된다.
본 발명에서는 각 개인이 다양한 이슈에 대해 갖는 총합을 일정하게 유지함으로써, 인터넷 뉴스 조회 빈도가 높은 개인이 그렇지 않은 개인에 비해 모든 이슈에 대한 관심이 높게 나타나는 왜곡 현상을 방지할 수 있도록 한다.
이러한 개인별 표준화는 도 7의 과정을 통해 수행될 수 있다.
도 7에서 상단 매트릭스는 도 6의 개인/이슈 매트릭스를 나타내며, 여기서 각 셀의 값을 각 행의 총합으로 나눔으로써 표준화된 개인/이슈 매트릭스를 도출할 수 있다.
그리고 이슈 매칭을 통한 개인 관심 트래킹 과정은 다음과 같다.
본 발명의 실시 예에서는 기본적으로 도 7의 최종 산출물인 두 개의 표준화된 개인/이슈 매트릭스를 사용한다.
이슈 매칭을 통한 개인 관심 트래킹 과정은 모든 개인에 대해 각 개인의 두 이슈에 대한 관심의 가중합을 구함으로써 이루어진다.
수학식 1에서 Match(Ta, Tb)는 이슈 Ta와 이슈 Tb의 대응도를 나타내며, n은 개인의 수를, Ui a와 Ui b는 각각 개인 Ui가 이슈 Ta와 이슈 Tb에 대해 갖는 관심도를 의미한다.
Figure 112015018390270-pat00002
수학식 1에 의하면 두 이슈 Ta와 이슈 Tb에 동시에 높은 관심을 가진 개인이 많을수록 두 이슈의 대응도인 Match(Ta, Tb)는 높게 나타난다. 이와 같은 방식으로 N주의 모든 이슈와 (N+1)주의 모든 이슈간의 대응도를 수학식 1에 의해 산출해야 하며, 이 과정은 행렬 곱에 의해 쉽게 구현될 수 있다.
도 7에서 나타난 N주와 (N+1)주의 각각의 이슈간 대응도를 계산하는 과정은 도 8에서와 같다.
도 8(a)는 도 7(a)의 최하단 매트릭스의 전치행렬(Transpose Matrix)를 나타내며, 도 8(b)는 도 7(b)의 최하단 매트릭스와 동일하다. 이 두 매트릭스의 행렬 곱을 통해 도 8(c)를 도출할 수 있으며, 이 결과가 N주와 (N+1)주의 이슈간 대응 매트릭스가 된다.
이슈간 대응 매트릭스에 대해 임의의 임계값을 설정하고, 이 임계값을 상회하는 대응 관계만을 도식화함으로써 N주와 (N+1)주간에 나타난 개인들의 관심의 흐름을 도 9와 같이 파악할 수 있다.
도 9에서 N주에 T1_1, T1_3, T1_4의 이슈에 관심을 가졌던 개인들은 대체로 (N+1)주에는 T2_1의 이슈에 관심을 갖게 되었음을 알 수 있다.
또한 N주에 T1_1의 이슈에 관심을 가졌던 개인들은 (N+1)주에는 T2_1과 T2_2의 이슈로 관심이 분산되었음을 알 수 있다.
이와 같은 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법을 적용한 이슈 트래킹 특성을 설명하면 다음과 같다.
인터넷 포털 사이트 뉴스 기사와 개인의 뉴스 접근 기록에 대하여 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법을 적용한 결과는 다음과 같다.
본 발명의 일 실시 예에 사용된 데이터는 국내 한 인터넷 사이트 순위 분석 전문 업체로부터 제공받은 패널 5,000명의 2012년 7월부터 2013년 6월까지의 웹 사용 기록 약 1억 5천만 건을 사용하였다.
전체 사용 기록 중 해당 기간 내에 대형 인터넷 뉴스 포털 사이트를 방문한 사용자는 총 4,308명이었으며, 이들은 동일 기간 동안 234,776건의 뉴스 기사를 총 337,786번 방문한 것으로 나타났다.
기간별 이슈 분석을 위해 본 실험에서는 방문 기록에 나타난 뉴스 기사 원문 234,776건을 크롤링을 통해 수집하였다.
세부 기간을 월 단위로 구분하여 사용하였다. 즉 2012년 7월과 2012년 8월에 게시된 뉴스 기사에 대한 분석을 통해 관심 트래킹을 시도하였다. 하지만 월 단위의 분석을 통해서는 두 기간 사이의 공통 이슈를 찾기가 매우 어려운 것으로 나타났다.
이는 이슈의 생성 및 변화 속도가 매우 빠른 현상에 기인한 것으로 해석될 수 있다. 따라서 실제 실험에서는 세부 기간을 주 단위로 구분하여 사용하였으며, 구체적으로는 2012년 7월 1일부터 2012년 7월 7일까지, 그리고 2012년 7월 8일부터 2012년 7월 14일까지의 2주간의 기록을 사용하였다.
전체 방문 기록 중 이 기간에 포함된 데이터는 사용자 1,112명의 방문 기록 1,506 건이었다. 또한 해당 기간에 게시되어 분석에 사용된 뉴스는 총 8,474건으로 나타났다.
수집 데이터와 분석 데이터에 대한 요약이 표 1에 나타나있다.
Figure 112015018390270-pat00003
먼저 세부 기간별 토픽 분석에 대한 결과는 다음과 같다.
우선 분석 데이터를 2012년 7월 1일부터 2012년 7월 7일까지의 첫 주(W1)의 기사 4,071건과 2012년 7월 8일부터 2012년 7월 14일까지의 둘째 주(W2) 기사 4,403건으로 분할하였다.
다음으로 분할된 두 기간의 뉴스 기사 각각에 대한 독립적인 토픽 분석을 통해 각 기간의 주요 이슈 및 각 이슈에 대응되는 기사를 파악하였다.
토픽 분석은 SAS Enterprise Miner 12.1의 Text Miner 모듈을 사용하여 파싱, 필터링, 토픽 분석의 순으로 진행하였으며, 각 기간별 토픽의 수는 25개로 제한하였다.
토픽 분석 결과로 나타난 문서/이슈 매트릭스 일부에 대한 스냅샷은 도 10에서와 같다.
도 10(a)는 W1의 기사에 대한 토픽 분석 결과를, 도 10(b)는 W2의 기사에 대한 토픽 분석 결과이다.
최상단 행은 이슈의 주요 키워드를, 다음 행은 해당 이슈의 번호를 나타낸다.
또한 맨 좌측 열은 문서(뉴스 기사)의 번호를 나타내며, 특정 문서가 특정 이슈에 해당되는 경우 해당 문서 번호와 이슈 번호가 교차하는 셀의 값을 '1'로 나타낸다.
그리고 개인별 관심이슈 도출 과정은 다음과 같다.
도출한 세부 기간별 문서/이슈 매트릭스와 개인의 뉴스 조회 기록으로부터 개인/이슈 대응 매트릭스를 도출한 결과는 다음과 같다.
W1과 W2의 개인/이슈 매트릭스 도출과정은 서로 동일하므로, W1에 대한 결과만 설명한다.
도 11은 W1 기간 내에 이루어진 개인의 뉴스 조회 기록, 즉 문서/개인 매트릭스를 보이고 있다.
도 11에서는 U_ID 1, 5, 25번 개인이 Doc. No. 100,000번 이내의 문서를 조회한 기록만을 보인다.
도 11(a)는 조회 기록에 대한 원(Raw) 데이터이며, 이를 매트릭스로 변환한 형태는 도 11(b)와 같다.
도 10(a)의 W1의 문서/이슈 매트릭스와 도 11(b)의 W1의 문서/개인 매트릭스에 대해 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법을 적용하여 도출한 W1의 개인/이슈 매트릭스가 도 12(a)에 나타나있다.
한편 도 12(b)는 이와 동일한 방법에 의해 도출한 W2의 개인/이슈 매트릭스를 나타낸다. 이렇게 도출된 개인/이슈 매트릭스는 개인별 표준화 과정을 거쳐 이후 프로세스에 사용된다.
그리고 이슈 매칭을 통한 개인 관심 트래킹 과정은 다음과 같다.
도출된 W1와 W2의 표준화된 개인/이슈 매트릭스를 통해 각 개인의 관심 이슈를 매칭한 결과는 다음과 같다.
이슈 매칭은 기본적으로 행렬 곱 연산에 의해 이루어지며, 이슈 매칭 결과로부터 의미를 도출하기 위해 임계값을 설정해야 한다.
이때 임계값이 너무 낮으면 전체 결과와 유사한 결과가 나타나며, 임계값이 너무 낮으면 당연한 결과만 얻게 될 수 있다.
따라서 다양한 임계값을 적용하는 시도를 통해 적정 임계값을 찾아야 하며, 본 발명의 일 실시 예에서는 1.5의 임계값을 적용하였다.
이슈 매칭 결과 전체에서 1.5 이상의 값을 갖는 셀을 회색으로 표시하고, 각 행이나 열 중 1.5 이상의 값을 하나도 갖지 못하는 행이나 열을 제거한 결과가 도 13에 나타나있다.
또한 1.5 이상의 값만을 버블 차트(Bubble Chart)로 도식화한 결과가 도 14에 나타나있다.
도 15는 도 13에서 나타난 결과 중 임계값 이상의 대응도를 갖는 이슈 쌍을 도식화한 결과이다.
이슈간 화살표는 W1의 해당 이슈에 관심을 갖던 개인들 중 많은 수가 W2의 해당 이슈로 관심을 옮겨갔음을 의미한다. 따라서 이러한 결과로부터 W1과 W2 사이의 개인들의 관심을 트래킹할 수 있다.
예를 들면, W1 기간에 "리포트, 김지연, 유재석, 아이폰, 안드로이드" 라는 이슈에 관심을 갖고 있던 개인들은 W2 기간에는 "스타, 리얼타임 연예, 무한, 연예, 리얼" 이라는 이슈에 관심을 보이는 경향이 있음을 알 수 있다.
이와 같은 본 발명에 따른 개인 관심 이슈 트래킹 장치 및 방법은 거시적 이슈의 흐름이 아닌 개인별 관심의 흐름을 파악할 수 있도록 하고, 새로운 기간의 문서가 추가되었을 때 전체 기간의 문서가 아닌 새로 추가된 문서에 대해서만 추가 분석을 수행할 수 있는 기간 확장 구성을 포함하는 것이다.
이상에서의 설명에서와 같이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명이 구현되어 있음을 이해할 수 있을 것이다.
그러므로 명시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 범위는 전술한 설명이 아니라 특허청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
40. 세부 기간별 구분부 41. 토픽 분석부
42. 문서/이슈간 매트릭스 처리부 43. 문서/개인간 매트릭스 처리부
44. 이슈/개인간 매트릭스 처리부 45. 이슈 매칭부

Claims (11)

  1. 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 세부 기간별 구분부;
    각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하는 토픽 분석부;
    토픽 분석을 통하여 문서/이슈간 대응 매트릭스를 도출하는 문서/이슈간 매트릭스 처리부;
    개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 문서/개인간 매트릭스 처리부;
    문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 이슈/개인간 매트릭스 처리부;
    도출된 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하고, 이슈 매칭을 통한 개인 관심 트래킹 과정을 두 개의 표준화된 개인/이슈 매트릭스를 사용하고, 모든 개인에 대해 각 개인의 두 이슈에 대한 관심의 가중합을 구하여 수행하는 이슈 매칭부;를 포함하는 것을 특징으로 하는 개인 관심 이슈 트래킹 장치.
  2. 제 1 항에 있어서, 상기 토픽 분석부에 의한 토픽 분석은,
    각 문서에 포함된 용어의 빈도수에 근거하여 문서를 계량화한 뒤, 문서 간의 거리에 기반하여 유사 문서를 그룹화하는 것을 특징으로 하는 개인 관심 이슈 트래킹 장치.
  3. 제 2 항에 있어서, 상기 토픽 분석에서의 빈도수는,
    TF-IDF(Term Frequency-Inverse Document Frequency) 기반 상대 빈도수가 사용되며, 토픽 분석의 결과로는 대표 키워드로 표현되는 각 토픽과 해당 토픽에 대응되는 문서 리스트가 생성되는 것을 특징으로 하는 개인 관심 이슈 트래킹 장치.
  4. 제 1 항에 있어서, 상기 이슈/개인간 매트릭스 처리부에서 도출된 이슈/개인간 대응 매트릭스는,
    뉴스 조회 빈도가 높은 개인이 그렇지 않은 개인에 비해 모든 이슈에 대한 관심이 높게 나타나는 왜곡 현상을 방지하기 위하여 각 개인이 이슈에 대해 갖는 총합을 일정하게 유지하는 개인별 표준화를 거쳐 이슈 매칭에 사용되는 것을 특징으로 하는 개인 관심 이슈 트래킹 장치.
  5. 삭제
  6. 세부 기간별 구분부에서 분석 대상 기간에 속하는 전체 뉴스를 분석 단위인 세부 기간별로 구분하는 단계;
    토픽 분석부에서 각 세부 기간별 뉴스에 대해 각각 토픽 분석을 별도로 수행하고 문서/이슈간 매트릭스 처리부에서 문서/이슈간 대응 매트릭스를 도출하는 단계;
    문서/개인간 매트릭스 처리부에서 개인의 뉴스 접근 기록이 저장된 트랜잭션으로부터 문서/개인간 대응 매트릭스를 도출하는 단계;
    이슈/개인간 매트릭스 처리부에서 문서/이슈간 매트릭스 및 문서/개인간 매트릭스를 병합하여 이슈/개인간 대응 매트릭스를 도출하는 단계;
    이슈 매칭부에서 두 개의 표준화된 개인/이슈 매트릭스를 사용하고, 모든 개인에 대해 각 개인의 두 이슈에 대한 관심의 가중합을 구하여, 도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 단계;를 포함하는 것을 특징으로 하는 개인 관심 이슈 트래킹 방법.
  7. 제 6 항에 있어서, 상기 토픽 분석부에서의 각 세부 기간별 뉴스에 대한 각각의 토픽 분석은,
    각 문서에 포함된 용어의 빈도수에 근거하여 문서를 계량화한 뒤, 문서 간의 거리에 기반하여 유사 문서를 그룹화하는 것을 특징으로 하는 개인 관심 이슈 트래킹 방법.
  8. 제 7 항에 있어서, 상기 토픽 분석에서의 빈도수는,
    TF-IDF(Term Frequency-Inverse Document Frequency) 기반 상대 빈도수가 사용되며, 토픽 분석의 결과로는 대표 키워드로 표현되는 각 토픽과 해당 토픽에 대응되는 문서 리스트가 생성되는 것을 특징으로 하는 개인 관심 이슈 트래킹 방법.
  9. 제 6 항에 있어서, 상기 이슈/개인간 매트릭스 처리부에서 도출된 이슈/개인간 대응 매트릭스는,
    뉴스 조회 빈도가 높은 개인이 그렇지 않은 개인에 비해 모든 이슈에 대한 관심이 높게 나타나는 왜곡 현상을 방지하기 위하여 각 개인이 이슈에 대해 갖는 총합을 일정하게 유지하는 개인별 표준화를 거쳐 이슈 매칭에 사용되는 것을 특징으로 하는 개인 관심 이슈 트래킹 방법.
  10. 삭제
  11. 제 6 항에 있어서, 상기 이슈 매칭부에서 도출된 두 개의 이슈/개인간 대응 매트릭스를 개인 관점에서 통합하여 각 개인 단위의 관심 흐름을 도출하는 단계에서,
    Figure 112016024736812-pat00004
    을 사용하여 이슈 매칭을 하고,
    여기서, Match(Ta, Tb)는 이슈 Ta와 이슈 Tb의 대응도를 나타내며, n은 개인의 수를, Ui a와 Ui b는 각각 개인 Ui가 이슈 Ta와 이슈 Tb에 대해 갖는 관심도를 의미하는 것을 특징으로 하는 개인 관심 이슈 트래킹 방법.
KR1020150026067A 2015-02-24 2015-02-24 개인 관심 이슈 트래킹 장치 및 방법 KR101644036B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150026067A KR101644036B1 (ko) 2015-02-24 2015-02-24 개인 관심 이슈 트래킹 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150026067A KR101644036B1 (ko) 2015-02-24 2015-02-24 개인 관심 이슈 트래킹 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101644036B1 true KR101644036B1 (ko) 2016-07-29

Family

ID=56617872

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150026067A KR101644036B1 (ko) 2015-02-24 2015-02-24 개인 관심 이슈 트래킹 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101644036B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970998A (zh) * 2017-04-06 2017-07-21 北京奇虎科技有限公司 新闻数据的更新方法及装置
KR20190061667A (ko) 2017-11-28 2019-06-05 (주)타이거컴퍼니 태그 추천 및 태그화 방법
KR102402416B1 (ko) 2021-09-01 2022-05-26 정철웅 이슈 기반 뉴스 정보 제공을 위한 서비스 제공 장치 및 방법
KR20230033535A (ko) 2021-09-01 2023-03-08 정철웅 이슈 기반 뉴스 정보 제공을 위한 서비스 제공 장치 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090014504A (ko) * 2007-08-06 2009-02-11 한국과학기술원 매체 편향의 효과를 완화하는 뉴스 서비스 시스템 및 방법
KR20100103001A (ko) 2009-03-12 2010-09-27 조정열 이슈 분석 시스템 및 이슈 분석을 위한 이슈 분석 데이터를생성하는 방법
KR20110097320A (ko) * 2010-02-25 2011-08-31 고려대학교 산학협력단 뉴스 데이터 분석 장치 및 방법
KR20130082662A (ko) 2011-12-13 2013-07-22 한국전자통신연구원 사용자 관심사 키워드 관련 토픽 맵 관리 장치 및 방법, 토픽 맵을 이용한 광고 서비스 장치 및 방법
KR20130116982A (ko) 2012-04-17 2013-10-25 한국과학기술원 Sns에서 사회적 이웃의 관심사와 사회적 활동의 토픽을 통해 사용자 관심사를 추론하는 방법 및 그 시스템
KR101401175B1 (ko) * 2012-12-28 2014-05-29 성균관대학교산학협력단 가중치 tf 기법을 이용한 텍스트 마이닝 방법 및 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090014504A (ko) * 2007-08-06 2009-02-11 한국과학기술원 매체 편향의 효과를 완화하는 뉴스 서비스 시스템 및 방법
KR20100103001A (ko) 2009-03-12 2010-09-27 조정열 이슈 분석 시스템 및 이슈 분석을 위한 이슈 분석 데이터를생성하는 방법
KR20110097320A (ko) * 2010-02-25 2011-08-31 고려대학교 산학협력단 뉴스 데이터 분석 장치 및 방법
KR20130082662A (ko) 2011-12-13 2013-07-22 한국전자통신연구원 사용자 관심사 키워드 관련 토픽 맵 관리 장치 및 방법, 토픽 맵을 이용한 광고 서비스 장치 및 방법
KR20130116982A (ko) 2012-04-17 2013-10-25 한국과학기술원 Sns에서 사회적 이웃의 관심사와 사회적 활동의 토픽을 통해 사용자 관심사를 추론하는 방법 및 그 시스템
KR101401175B1 (ko) * 2012-12-28 2014-05-29 성균관대학교산학협력단 가중치 tf 기법을 이용한 텍스트 마이닝 방법 및 시스템

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YING HUANG, AN INTELLIGENT ADAPTIVE NEWS FILTERING SYSTEM, 2001 URL : http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.11.5799&rep=rep1&type=pdf* *
YING HUANG, AN INTELLIGENT ADAPTIVE NEWS FILTERING SYSTEM, 2001 URL : http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.11.5799&rep=rep1&type=pdf*

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970998A (zh) * 2017-04-06 2017-07-21 北京奇虎科技有限公司 新闻数据的更新方法及装置
CN106970998B (zh) * 2017-04-06 2021-12-21 北京奇虎科技有限公司 新闻数据的更新方法及装置
KR20190061667A (ko) 2017-11-28 2019-06-05 (주)타이거컴퍼니 태그 추천 및 태그화 방법
KR102402416B1 (ko) 2021-09-01 2022-05-26 정철웅 이슈 기반 뉴스 정보 제공을 위한 서비스 제공 장치 및 방법
KR20230033535A (ko) 2021-09-01 2023-03-08 정철웅 이슈 기반 뉴스 정보 제공을 위한 서비스 제공 장치 및 방법

Similar Documents

Publication Publication Date Title
Leydesdorff et al. Citations: Indicators of quality? The impact fallacy
Keramatfar et al. Bibliometrics of sentiment analysis literature
Gao et al. A comparative study of users’ microblogging behavior on Sina Weibo and Twitter
Rigby Technological relatedness and knowledge space: entry and exit of US cities from patent classes
CN105224699B (zh) 一种新闻推荐方法及装置
McCorriston et al. Organizations are users too: Characterizing and detecting the presence of organizations on twitter
Lak et al. Star ratings versus sentiment analysis--a comparison of explicit and implicit measures of opinions
Bar‐Ilan JASIST 2001–2010
KR101644036B1 (ko) 개인 관심 이슈 트래킹 장치 및 방법
Wang et al. Who sets the agenda? The dynamic agenda setting of the wildlife issue on social media
Jha et al. A review on the study and analysis of big data using data mining techniques
Das et al. A CV parser model using entity extraction process and big data tools
Udayakumar et al. Demographics analysis of twitter users who tweeted on psychological articles and tweets analysis
CN103854206A (zh) 一种分析人群特征的方法和设备
Banica et al. Big data in business environment
Subramani et al. Extracting actionable knowledge from domestic violence discourses on social media
Vaidya et al. A survey of algorithms, technologies and issues in big data analytics and applications
Ha et al. Analysis of Twitter research trends based on SLR
Umali et al. Sentiment analysis: A case study among the selected government agencies in the Philippines
Li et al. What is the nature of chinese microblogging: Unveiling the unique features of tencent weibo
Kaur et al. A Review on Sentimental Analysis on Facebook Comments by using Data Mining Technique
Murthy Critically engaging with social media research methods
Phan et al. A tweet summarization method based on maximal association rules
CN109033133A (zh) 基于特征项权重增长趋势的事件检测与跟踪方法
Shabana et al. A study on Big data advancement and Big data analytics

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant