KR102078541B1 - 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체 - Google Patents

이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체 Download PDF

Info

Publication number
KR102078541B1
KR102078541B1 KR1020180025239A KR20180025239A KR102078541B1 KR 102078541 B1 KR102078541 B1 KR 102078541B1 KR 1020180025239 A KR1020180025239 A KR 1020180025239A KR 20180025239 A KR20180025239 A KR 20180025239A KR 102078541 B1 KR102078541 B1 KR 102078541B1
Authority
KR
South Korea
Prior art keywords
issue
news
interest
key
population
Prior art date
Application number
KR1020180025239A
Other languages
English (en)
Other versions
KR20190104745A (ko
Inventor
김남규
이동훈
최호창
백민지
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020180025239A priority Critical patent/KR102078541B1/ko
Publication of KR20190104745A publication Critical patent/KR20190104745A/ko
Application granted granted Critical
Publication of KR102078541B1 publication Critical patent/KR102078541B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법에 관한 것으로, 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 이슈 관심도 산출부; 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 유사도 분석부; 및 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 뉴스 가치 평가부;를 포함한다. 따라서, 본 발명은 특정 시점에 관심도 높은 이슈와의 유사도를 기초로 뉴스의 가치를 평가할 수 있다.

Description

이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체{ISSUE INTEREST BASED NEWS VALUE EVALUATION APPARATUS AND METHOD, STORAGE MEDIA STORING THE SAME}
본 발명은 이슈 관심도 기반의 뉴스 가치 평가 기술에 관한 것으로, 보다 상세하게는 특정 시점에 관심도 높은 이슈와의 유사도를 기초로 뉴스의 가치를 평가할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법에 관한 것이다.
텍스트 마이닝(Text Mining)은 데이터 마이닝(Data Mining)을 포함한 다양한 분야의 기술을 포괄적으로 활용한다. 그 중에서도 자연어(Natural Language) 형태로 작성되는 텍스트의 특성상 이를 정형화하기 위한 자연어 처리 기술은 텍스트 마이닝 분석의 핵심 요소이다. 텍스트 마이닝은 일반적으로 비정형 텍스트 문서를 정형화한 뒤, 기존의 다양한 마이닝 기법을 변형하여 활용하는 형태로 이루어진다. 텍스트의 정형화 과정에는 기본적으로 각 문서에 사용된 용어의 빈도에 따라 문서의 주제 및 특성을 요약하는 벡터공간모델(Vector Space Model)이 사용된다.
한국공개특허 제10-2009-0047646(2009.05.13)호는 기사가치 평가방법에 관한 것으로, 각종 언론매체를 통하여 기사화된 정보 중에서 해당 기업체에 관련된 정보나 상품 정보 등에 관한 기사의 가치를 실질적인 금액의 가치값으로 산출함으로써, 객관적이고 계량화된 데이터의 분석 및 평가를 통해 기업의 이미지 제고와 브랜드관리 또는 마케팅 등에 활용할 수 있고, 기업의 홍보활동의 투입대비 성과(Return of Investment) 평가 등에 활용할 수 있는 효과를 갖는 것이다.
한국공개특허 제10-2009-0047646(2009.05.13)호
본 발명의 일 실시예는 특정 시점에 관심도 높은 이슈와의 유사도를 기초로 뉴스의 가치를 평가할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 특정 이슈에 대한 대중들의 관심도를 관련 뉴스 및 SNS 메시지를 통해 측정할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 이슈 관심도를 기초로 평가된 뉴스의 가치에 따라 사용자에게 제공되는 우선순위를 결정할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법을 제공하고자 한다.
실시예들 중에서, 이슈 관심도 기반의 뉴스 가치 평가 장치는 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 이슈 관심도 산출부, 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 유사도 분석부 및 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 뉴스 가치 평가부를 포함한다.
상기 이슈 관심도 산출부는 상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정할 수 있다.
상기 이슈 관심도 산출부는 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 상기 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출할 수 있다.
상기 이슈 관심도 산출부는 다음의 수학식을 통해 상기 이슈 관심도를 산출할 수 있다.
[수학식]
Figure 112018021473763-pat00001
, 1 ≤ i ≤ n (n은 자연수)
(여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)
상기 유사도 분석부는 토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정할 수 있다.
상기 뉴스 가치 평가부는 상기 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 상기 이슈 관심도 및 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출할 수 있다.
실시예들 중에서, 이슈 관심도 기반의 뉴스 가치 평가 방법은 (a) 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 단계, (b) 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 단계 및 (c) 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 단계를 포함한다.
상기 (a) 단계는 상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정하는 단계일 수 있다.
상기 (a) 단계는 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 상기 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하는 단계일 수 있다.
상기 (c) 단계는 다음의 수학식을 통해 상기 이슈 관심도를 산출하는 단계일 수 있다.
[수학식]
Figure 112018021473763-pat00002
, 1 ≤ i ≤ n (n은 자연수)
(여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)
상기 (b) 단계는 토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정하는 단계일 수 있다.
상기 (c) 단계는 상기 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 상기 이슈 관심도 및 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 단계일 수 있다.
실시예들 중에서, 컴퓨터 수행 가능한 기록매체는 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 과정, 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 과정 및 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 과정을 포함한다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법은 특정 이슈에 대한 대중들의 관심도를 관련 뉴스 및 SNS 메시지를 통해 측정할 수 있다.
본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법은 이슈 관심도를 기초로 평가된 뉴스의 가치에 따라 사용자에게 제공되는 우선순위를 결정할 수 있다.
도 1은 본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 시스템을 설명하는 도면이다.
도 2는 도 1에 있는 뉴스 가치 평가 장치를 설명하는 블록도이다.
도 3은 도 1에 있는 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 과정을 설명하는 순서도이다.
도 4는 본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 시스템의 전체적인 개요를 나타내는 도면이다.
도 5는 도 2에 있는 이슈 관심도 산출부에서 뉴스 모집단에 대한 토픽 모델링을 수행하여 핵심 이슈 및 관련 용어를 추출하는 과정을 설명하는 예시도이다.
도 6은 도 2에 있는 이슈 관심도 산출부에서 핵심 이슈별 핵심 용어를 추출하는 과정을 설명하는 예시도이다.
도 7은 도 2에 있는 이슈 관심도 산출부에서 특정 이슈에 대한 뉴스 및 트윗으로부터 뉴스당 트윗 비율을 산출하는 과정을 설명하는 예시도이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 시스템을 설명하는 도면이다.
도 1을 참조하면, 이슈 관심도 기반의 뉴스 가치 평가 시스템(이하, 뉴스 가치 평가 시스템이라 한다.)(100)은 사용자 단말(110), 뉴스 가치 평가 장치(130) 및 데이터베이스(150)를 포함할 수 있다.
사용자 단말(110)은 특정 뉴스에 접근하여 해당 뉴스의 내용을 확인할 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 뉴스 가치 평가 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)은 뉴스 가치 평가 장치(130)와 동시에 연결될 수 있다.
일 실시예에서, 사용자 단말(110)은 뉴스 가치 평가 장치(130)에 특정 뉴스에 대한 뉴스 가치 평가를 요청할 수 있고, 뉴스 가치 평가 장치(130)로부터 뉴스 가치 평가 결과를 수신하여 확인할 수 있다. 다른 실시예에서, 사용자 단말(110)은 복수의 뉴스들로 구성된 특정 뉴스 페이지에 접근하는 경우 자동으로 해당 뉴스 페이지에 포함된 복수의 뉴스들에 대한 뉴스 가치 평가를 뉴스 가치 평가 장치(130)에 요청할 수 있고, 뉴스 가치 평가 장치(130)로부터 수신 받은 뉴스 가치 정보를 기초로 복수의 뉴스들을 뉴스 가치 순서에 따라 정렬하여 표시할 수 있다.
뉴스 가치 평가 장치(130)는 사용자 단말(110)로부터 수신한 뉴스 가치 평가 요청에 따라 특정 뉴스에 대한 뉴스 가치를 평가 하여 평가 결과를 사용자 단말(110)에 제공할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 뉴스 가치 평가 장치(130)는 사용자 단말(110)과 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 주고 받을 수 있다.
뉴스 가치 평가 장치(130)는 데이터베이스(150)를 포함하여 구현될 수 있고, 데이터베이스(150)와 독립적으로 구현될 수 있다. 데이터베이스(150)와 독립적으로 구현된 경우 뉴스 가치 평가 장치(130)는 데이터베이스(150)와 유선 또는 무선으로 연결되어 데이터를 주고 받을 수 있다.
데이터베이스(150)는 뉴스 가치 평가를 위해 필요한 다양한 정보들을 저장할 수 있는 저장장치이다. 데이터베이스(150)는 사용자 단말(110)로부터 수신한 평가 요청과 관련된 뉴스 정보를 저장할 수 있고, 뉴스 가치 평가에 사용되는 특정 기간 동안 생성된 뉴스 데이터 및 SNS 메시지 데이터를 저장할 수 있으며, 반드시 이에 한정되지 않고, 특정 뉴스에 대한 가치를 평가하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다. 여기에서, SNS 메시지는 대표적인 소셜네트워크서비스(Social Network Services, SNS)인 트위터(Twitter), 페이스북(Facebook), 라인(Line) 등에서 사용자들이 생성하는 다양한 메시지에 해당할 수 있다.
데이터베이스(150)는 특정 범위에 속하는 정보들을 저장하는 적어도 하나의 독립된 서브-데이터베이스들로 구성될 수 있고, 적어도 하나의 독립된 서브-데이터베이스들이 하나로 통합된 통합 데이터베이스로 구성될 수 있다. 적어도 하나의 독립된 서브-데이터베이스들로 구성되는 경우에는 각각의 서브-데이터베이스들은 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 상호 간의 데이터를 주고 받을 수 있다. 데이터베이스(150)는 통합 데이터베이스로 구성되는 경우 각각의 서브-데이터베이스들을 하나로 통합하고 상호 간의 데이터 교환 및 제어 흐름을 관리하는 제어부를 포함할 수 있다.
도 2는 도 1에 있는 뉴스 가치 평가 장치를 설명하는 블록도이다.
도 2를 참조하면, 뉴스 가치 평가 장치(130)는 이슈 관심도 산출부(210), 유사도 분석부(230), 뉴스 가치 평가부(250) 및 제어부(270)를 포함할 수 있다.
이슈 관심도 산출부(210)는 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출할 수 있다. 여기에서, 이슈 관심도는 정보의 가치를 정보의 수요와 공급의 관계에 기반을 두어 측정하기 위한 것으로, 정보 공급의 대표 매체로 인터넷 뉴스 기사를, 정보 수요를 나타내는 대표 매체로 SNS 메시지를 선정하고, 특정 이슈에 대한 뉴스의 정보로서의 가치를 이와 관련된 SNS 메시지의 양으로 평가하여 수치화한 것이다.
일 실시예에서, 이슈 관심도 산출부(210)는 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정할 수 있다. 여기에서, 토픽 모델링은 각 문서에 수록된 용어를 분석하여 유사도에 따라 문서를 그룹화한 뒤, 각 그룹의 핵심 용어를 토픽 키워드로 제시하는 기법이다.
일반적인 문서는 상당히 많은 양의 용어를 포함하고 있기 때문에 토픽 모델링을 통해 전체 용어에 대한 차원 축소가 이루어지며, 이 과정에서 사용된 차원의 수가 토픽의 수를 결정하게 된다. 용어 가중치(Term Topic Weight)는 각 용어의 각 토픽에 대한 대응도에 해당할 수 있고 토픽 모델링을 수행한 결과로서 도출될 수 있고, 미리 설정된 용어 임계값(Term Cutoff)이상의 용어 가중치를 갖는 용어는 해당 토픽을 기술하는 용어로 분류될 수 있다.
또한, 각 문서에 대해서도 유사한 방식으로 문서 가중치(Document Topic Weight)가 산출될 수 있고, 미리 설정된 문서 임계값(Document Cutoff)이상의 문서 가중치를 갖는 문서는 해당 토픽을 포함한 문서로 인정될 수 있다. 토픽 모델링은 이러한 과정을 통해 방대한 양의 문서로부터 핵심 토픽을 추출할 수 있으며, 전체 뉴스로부터 핵심 이슈를 도출한 예에 대해서는 도 5에서 보다 자세히 설명한다.
일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈의 모든 용어 가중치의 '평균+1σ(Sigma, 표준편차)'를 통해 산출되는 용어 임계값을 이용하여 각 핵심 이슈별 핵심 용어를 결정할 수 있다.
일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈별 용어 가중치에 따라 상위 n개(n은 자연수)의 용어를 선별하고 선별된 용어들의 용어 가중치 전체에 대한 평균을 통해 산출된 용어 임계값을 이용하여 각 핵심 이슈별 핵심 용어를 결정할 수 있다. 예를 들어, 이슈 관심도 산출부(210)는 핵심 이슈가 10개이고 n = 5인 경우 총 50개 용어의 용어 가중치에 대한 평균을 산출할 수 있다. 이슈 관심도 산출부(210)는 산출된 평균을 새로운 용어 임계값으로 결정할 수 있고 각 핵심 이슈별로 용어 임계값을 초과하는 용어 가중치를 가진 용어를 선별함으로써 핵심 용어를 결정할 수 있다.
일 실시예에서, 이슈 관심도 산출부(210)는 뉴스 모집단 및 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 이슈 관심도를 산출할 수 있다. 이슈 관심도 산출부(210)는 뉴스 모집단에 대한 토픽 모델링을 통해 도출된 각 핵심 이슈별 핵심 용어를 키워드로 하여 뉴스 모집단 및 SNS 메시지 모집단에 대한 검색을 통해 핵심 용어와 관련된 뉴스 및 SNS 메시지를 선별할 수 있다.
이슈 관심도 산출부(210)는 각 핵심 이슈별 뉴스 및 SNS 메시지 수를 이용하여 뉴스당 SNS 메시지 비율을 산출함으로써 해당 핵심 이슈에 대한 관심도를 도출할 수 있다. 이슈 관심도 산출부(210)는 특정 핵심 이슈에 대한 뉴스가 많을수록 관심도가 높은 것이 아니라 해당 핵심 이슈에 대한 SNS 메시지가 많을수록 관심도가 높은 것으로 파악할 수 있다. 이슈 관심도 산출부(210)는 각 핵심 이슈별 뉴스당 SNS 메시지 비율을 일별, 주별 및 월별로 산출함으로써 핵심 이슈에 대한 관심도가 시간의 흐름에 따라 변화하는 모습을 확인할 수 있다.
일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈별 핵심 용어 들을 AND 또는 OR 조건으로 조합하여 뉴스 모집단 및 SNS 메시지 모집단을 검색할 수 있다. 예를 들어, 이슈 관심도 산출부(210)는 특정 이슈 A에 대한 핵심 용어가 '클린턴', '트럼프' 및 '대선'인 경우, {'클린턴' AND '트럼프' AND '대선'} 또는 {'클린턴' OR '트럼프' OR '대선'} 과 같이 조합하여 검색을 수행할 수 있다.
일 실시예에서, 이슈 관심도 산출부(210)는 다음의 수학식 1을 통해 이슈 관심도를 산출할 수 있다.
[수학식 1]
ISSi = (Si / Ni) / (S / N), 1 ≤ i ≤ n (n은 자연수)
여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.
일 실시예에서, 이슈 관심도 산출부(210)는 다음의 수학식 2를 통해 이슈 관심도를 산출할 수 있다.
[수학식 2]
Figure 112018021473763-pat00003
, 1 ≤ i ≤ n (n은 자연수)
여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.
유사도 분석부(230)는 평가 모집단에 포함된 복수의 뉴스들에 대해 적어도 하나의 핵심 이슈 간의 유사도를 분석할 수 있다. 보다 구체적으로, 유사도 분석부(230)는 각 뉴스별로 해당 뉴스의 내용과 뉴스 모집단에 대한 토픽 모델링을 통해 도출된 핵심 이슈들 사이에 어느 정도의 연관성이 존재하는지를 유사도에 기초하여 판단할 수 있다.
일 실시예에서, 유사도 분석부(230)는 토픽 모델링을 통해 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 뉴스 주제 및 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정할 수 있다. 여기에서, 각 뉴스에 대한 뉴스 주제는 토픽 모델링을 통해 도출된 결과에 해당하므로 복수의 뉴스 토픽을 포함하는 토픽 집합으로 표현될 수 있다. 유사도 분석부(230)는 뉴스 주제에 포함된 뉴스 토픽들과 핵심 이슈에 포함된 핵심 용어들 간의 유사도를 기초로 각 뉴스 및 핵심 이슈들 간의 유사도를 결정할 수 있다.
예를 들어, 유사도 분석부(230)는 뉴스 토픽들 중에서 대표 뉴스 토픽을 추출하고 핵심 용어들 중에서 대표 핵심 용어를 추출한 후 대표 뉴스 토픽 및 대표 핵심 용어 간의 유사도를 해당 뉴스 및 핵심 이슈 간의 유사도로써 산출할 수 있다. 또한, 유사도 분석부(230)는 뉴스 토픽 및 핵심 용어 간의 유사도를 모두 산출한 후 평균한 값을 해당 뉴스 및 핵심 이슈 간의 유사도로써 산출할 수 있다.
뉴스 가치 평가부(250)는 유사도 및 이슈 관심도를 기초로 평가 모집단에 포함된 복수의 뉴스들에 대한 뉴스 가치를 평가할 수 있다. 보다 구체적으로, 뉴스 가치 평가부(250)는 특정 뉴스에 대하여 뉴스 모집단으로부터 도출된 핵심 이슈들 중에서 가장 유사한 핵심 이슈를 결정할 수 있고, 해당 핵심 이슈의 이슈 관심도를 기초로 해당 뉴스에 대한 뉴스 가치를 평가할 수 있다.
일 실시예에서, 뉴스 가치 평가부(250)는 유사도를 정규화하고 유사도가 가장 높은 핵심 이슈의 이슈 관심도 및 정규화된 유사도 간의 곱 연산을 통해 뉴스 가치를 산출할 수 있다. 예를 들어, 뉴스 가치 평가부(250)는 유사도를 0 에서 1 사이의 값을 가지도록 정규화할 수 있고 정규화된 유사도 및 가장 높은 유사도를 가지는 핵심 이슈의 이슈 관심도 간의 곱 연산을 통해 특정 뉴스에 대한 뉴스 가치를 산출할 수 있다.
제어부(270)는 뉴스 가치 평가 장치(130)의 전체적인 동작을 제어하고, 이슈 관심도 산출부(210), 유사도 분석부(230) 및 뉴스 가치 평가부(250) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.
도 3은 도 1에 있는 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 과정을 설명하는 순서도이다.
도 3을 참조하면, 뉴스 가치 평가 장치(130)는 이슈 관심도 산출부(210)를 통해 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출할 수 있다(단계 S310).
일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈별 핵심 용어 들을 용어 가중치가 높은 순서에 따라 3개의 집합으로 분할한 후 첫 번째 집합에 대해서는 AND 조건으로 조합하고 나머지 집합에 대해서는 OR 조건으로 조합하여 뉴스 모집단 및 SNS 메시지 모집단을 검색할 수 있다.
예를 들어, 이슈 관심도 산출부(210)는 특정 이슈 A에 대한 핵심 용어가 '클린턴', '트럼프' 및 '대선'이고 용어 가중치가 높은 순서도 동일한 경우, {'클린턴' AND ('트럼프' OR '대선')}과 같이 조합하여 검색을 수행할 수 있다. 즉, 용어 가중치가 가장 높은 '클린턴'은 AND 조건으로, 나머지 핵심 용어인 '트럼프' 및 '대선'은 OR 조건으로 조합하여 검색을 수행할 수 있다.
뉴스 가치 평가 장치(130)는 유사도 분석부(230)를 통해 평가 모집단에 포함된 복수의 뉴스들에 대해 적어도 하나의 핵심 이슈 간의 유사도를 분석할 수 있다(단계 S330).
뉴스 가치 평가 장치(130)는 뉴스 가치 평가부(250)를 통해 유사도 및 이슈 관심도를 기초로 평가 모집단에 포함된 복수의 뉴스들에 대한 뉴스 가치를 평가할 수 있다(단계 S350). 일 실시예에서, 뉴스 가치 평가부(250)는 평가 모집단에 포함된 복수의 뉴스들에 대한 뉴스 가치를 산출할 수 있고, 뉴스 가치가 높은 순서에 따라 정렬된 복수의 뉴스들에 대한 정보를 사용자 단말(110)에 제공할 수 있다. 사용자 단말(110)은 뉴스 가치 평가부(250)로부터 제공된 정보에 따라 복수의 뉴스들을 디스플레이 장치에 표시할 수 있다.
도 4는 도 2에 있는 이슈 관심도 산출부의 전체적인 개요를 나타내는 도면이다.
도 4를 참조하면, 이슈 관심도 산출부(210)는 뉴스 모집단에 포함된 뉴스 기사에 대해 토픽 모델링을 통해 분석 대상이 되는 핵심 이슈를 추출할 수 있고(단계 S410), 특정 핵심 이슈에 대응되는 뉴스 기사와 트윗(Tweet)을 추출할 수 있다(단계 S420). 여기에서, 트윗은 SNS 중 하나인 트위터(Twitter)에서 사용자들이 생성하는 메시지에 해당할 수 있고, 도 4에서는 SNS 메시지 중 트윗만을 이용하여 이슈 관심도를 산출하는 예를 나타내고 있다.
즉, 이슈 관심도 추출부(210)는 각 핵심 이슈를 구성하고 있는 용어 중 특정 임계값 이상의 용어만을 선별할 수 있고 선별된 용어를 관련 뉴스 및 트윗 추출에 사용할 수 있다. 이슈 관심도 추출부(210)는 각 핵심 이슈별 뉴스당 트윗 비율을 산출할 수 있고(단계 S430), 산출된 값을 각 일자별 뉴스당 트윗 기준 비율로 나눔으로써(단계 S440) 핵심 이슈별 이슈 관심도를 도출할 수 있다(단계 S450).
핵심 이슈별 뉴스당 트윗 비율은 핵심 이슈별 트윗의 수를 핵심 이슈별 뉴스의 수로 나눈 값에 해당할 수 있고, 뉴스당 트윗 기준 비율은 생성된 전체 트윗의 수를 전체 뉴스의 수로 나눈 값에 해당할 수 있다. 이슈 관심도 산출부(210)는 뉴스당 트윗 비율 및 뉴스당 트윗 기준 비율을 일별, 주별 및 월별로 산출하여 활용할 수 있다.
도 5는 도 2에 있는 이슈 관심도 산출부에서 뉴스 모집단에 대한 토픽 모델링을 수행하여 핵심 이슈 및 관련 용어를 추출하는 과정을 설명하는 예시도이다.
도 5를 참조하면, 이슈 관심도 산출부(210)는 뉴스 모집단에 대한 토픽 모델링을 통해 3개의 핵심 이슈로서 Issue 1, Issue 2 및 Issue 3을 추출할 수 있다. Issue 1은 (클린턴, 트럼프, 대선)에 해당하고, Issue 2는 (최순실, JTBC, 배후)에 해당하며, Issue 3은 (건강, 위염, 내시경)에 해당할 수 있다. 또한, 각 핵심 이슈를 나타내는 주요 용어를 각 용어의 가중치와 함께 핵심 이슈별로 10개씩 제시하고 있다.
각 핵심 이슈를 기술하는 용어는 각 핵심 이슈에 포함된 용어 중에서 용어 가중치가 특정 임계값 이상인 용어에 해당할 수 있고, 용어 가중치 순으로 특정 수의 용어에 해당할 수 있다. 예를 들어, Issue 1에 포함된 용어들 중에서 용어 가중치가 가장 높은 3개의 용어는 각각 0.248의 가중치를 갖는 '클린턴', 0.203의 가중치를 갖는 '트럼프' 및 0.186의 가중치를 갖는 '대선'임을 확인할 수 있다. 이슈 관심도 산출부(210)는 도 5와 같이 도출된 핵심 이슈별 키워드를 활용하여 관련 뉴스 및 트윗을 선별할 수 있다.
도 6은 도 2에 있는 이슈 관심도 산출부에서 핵심 이슈별 핵심 용어를 추출하는 과정을 설명하는 예시도이다.
도 6을 참조하면, 이슈 관심도 산출부(210)는 토픽 모델링을 통해 추출된 각 핵심 이슈별 용어들 중에서 보다 강화된 기준으로 핵심 용어를 재선별할 수 있다. 예를 들어, 이슈 관심도 산출부(210)는 각 핵심 이슈별로 용어 가중치에 따라 상위 N개의 용어를 구분한 뒤, 이들 전체 용어의 용어 가중치의 평균을 산출할 수 있고, 산출된 평균값을 새로운 용어 임계값으로 지정하여 각 핵심 이슈의 핵심 용어를 도출함으로써, 각 핵심 이슈와 직접적인 관계가 있는 핵심 용어만을 식별할 수 있다.
도 6에서, 이렇게 산출된 값이 0.15일 때, 핵심 이슈별 용어 중 일부는 제거되고 최상위 용어만 핵심 이슈의 핵심 용어로 잔류하는 것을 확인할 수 있다. 어둡게 표시된 용어는 이 과정에서 제거된 용어를 나타내며, 잔류한 핵심 용어의 수는 각 핵심 이슈별로 상이하게 나타날 수 있다. Issue 1의 경우 4개, Issue 2의 경우 8개, Issue 3의 경우 5개의 핵심 용어가 잔류한 것을 확인할 수 있다.
도 7은 도 2에 있는 이슈 관심도 산출부에서 특정 이슈에 대한 뉴스 및 트윗으로부터 뉴스당 트윗 비율을 산출하는 과정을 설명하는 예시도이다.
도 7을 참조하면, 뉴스에서 가장 많이 언급된 이슈는 Issue 1(클린턴, 트럼프, 대선)이며, Issue 2(최순실, JTBC, 배후)이 그 다음, 그리고 Issue 3(건강, 위염, 내시경)은 가장 적게 언급되었음을 알 수 있다(도 6의 (a)). 또한, 트윗 수 측면에서는 Issue 2가 가장 많이 언급되었으며, 그 다음 Issue 1, Issue 3 순서로 언급되었음을 알 수 있다(도 6의 (b)).
공급 대비 수요의 비율, 즉 뉴스당 트윗의 비율은 Issue 2가 가장 높게 나타나서, 해당 이슈에 대한 대중의 관심에 비해 뉴스가 적게 제공되고 있음을 나타내고 있다(도 6의 (c)). Issue 1의 경우 뉴스당 트윗 비율이 Issue 3보다도 낮게 나타났으며, 이는 대중의 관심에 비해 뉴스가 지나치게 많이 공급되고 있음을 나타낸다. 따라서, 개별 뉴스의 가치는 Issue 2 > Issue 3 > Issue 1의 순서로 높게 나타나는 것으로 해석할 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 이슈 관심도 기반의 뉴스 가치 평가 시스템
110: 사용자 단말 130: 뉴스 가치 평가 장치
150: 데이터베이스
210: 이슈 관심도 산출부 230: 유사도 분석부
250: 뉴스 가치 평가부 270: 제어부

Claims (13)

  1. 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 이슈 관심도 산출부;
    평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 유사도 분석부; 및
    상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들 각각에 대한 뉴스 가치를 평가하는 뉴스 가치 평가부를 포함하되,
    상기 이슈 관심도 산출부는 상기 적어도 하나의 핵심 이슈 별로 핵심 용어를 결정하고, 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별한 후 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하며,
    상기 뉴스 가치 평가부는 상기 복수의 뉴스들 각각에 대한 뉴스 주제와 상기 적어도 하나의 핵심 이슈 간의 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 이슈 관심도와 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
  2. 제1항에 있어서, 상기 이슈 관심도 산출부는
    상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
  3. 삭제
  4. 제1항에 있어서, 상기 이슈 관심도 산출부는
    다음의 수학식을 통해 상기 이슈 관심도를 산출하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
    [수학식]
    Figure 112019090358481-pat00004
    , 1 ≤ i ≤ n (n은 자연수)
    (여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)
  5. 제1항에 있어서, 상기 유사도 분석부는
    토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
  6. 삭제
  7. 이슈 관심도 기반의 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 방법에 있어서,
    (a) 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 단계;
    (b) 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 단계; 및
    (c) 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들 각각에 대한 뉴스 가치를 평가하는 단계를 포함하되,
    상기 (a) 단계는 상기 적어도 하나의 핵심 이슈 별로 핵심 용어를 결정하고, 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별한 후 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하는 단계를 포함하며,
    상기 (c) 단계는 상기 복수의 뉴스들 각각에 대한 뉴스 주제와 상기 적어도 하나의 핵심 이슈 간의 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 이슈 관심도와 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 단계를 포함하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
  8. 제7항에 있어서, 상기 (a) 단계는
    상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
  9. 삭제
  10. 제7항에 있어서, 상기 (c) 단계는
    다음의 수학식을 통해 상기 이슈 관심도를 산출하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
    [수학식]
    Figure 112019090358481-pat00005
    , 1 ≤ i ≤ n (n은 자연수)
    (여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)
  11. 제7항에 있어서, 상기 (b) 단계는
    토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
  12. 삭제
  13. 이슈 관심도 기반의 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 방법을 기록하는 컴퓨터 수행 가능한 기록매체에 있어서,
    특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 과정;
    평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 과정; 및
    상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들 각각에 대한 뉴스 가치를 평가하는 과정을 포함하되,
    상기 산출하는 과정은 상기 적어도 하나의 핵심 이슈 별로 핵심 용어를 결정하고, 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별한 후 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하는 과정을 포함하며
    상기 평가하는 과정은 상기 복수의 뉴스들 각각에 대한 뉴스 주제와 상기 적어도 하나의 핵심 이슈 간의 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 이슈 관심도와 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 과정을 포함하는 것을 특징으로 하는 기록매체.
KR1020180025239A 2018-03-02 2018-03-02 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체 KR102078541B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180025239A KR102078541B1 (ko) 2018-03-02 2018-03-02 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180025239A KR102078541B1 (ko) 2018-03-02 2018-03-02 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체

Publications (2)

Publication Number Publication Date
KR20190104745A KR20190104745A (ko) 2019-09-11
KR102078541B1 true KR102078541B1 (ko) 2020-02-19

Family

ID=67949196

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180025239A KR102078541B1 (ko) 2018-03-02 2018-03-02 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체

Country Status (1)

Country Link
KR (1) KR102078541B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681056B (zh) * 2023-05-24 2024-01-26 人民网股份有限公司 基于价值量表的文本价值计算方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101705810B1 (ko) * 2015-11-18 2017-02-10 고려대학교 산학협력단 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0317764A (pt) * 2002-12-27 2006-02-21 Intellectual Property Bank dispositivo de avaliação de tecnologia, programa de avaliação de tecnologia, e método de avaliação de tecnologia
KR20090047646A (ko) 2007-11-08 2009-05-13 장남석 기사가치 평가방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101705810B1 (ko) * 2015-11-18 2017-02-10 고려대학교 산학협력단 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법

Also Published As

Publication number Publication date
KR20190104745A (ko) 2019-09-11

Similar Documents

Publication Publication Date Title
CN109522556B (zh) 一种意图识别方法及装置
CN107391493B (zh) 一种舆情信息提取方法、装置、终端设备及存储介质
Alshamsi et al. Sentiment analysis in English texts
US20140172415A1 (en) Apparatus, system, and method of providing sentiment analysis result based on text
CN105183717B (zh) 一种基于随机森林和用户关系的osn用户情感分析方法
US20100079464A1 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
CN108021651B (zh) 一种网络舆情风险评估方法及装置
US10671926B2 (en) Method and system for generating predictive models for scoring and prioritizing opportunities
CN103258025B (zh) 生成共现关键词的方法、提供关联搜索词的方法以及系统
US10706359B2 (en) Method and system for generating predictive models for scoring and prioritizing leads
CN105225135B (zh) 潜力客户识别方法以及装置
CN110334356A (zh) 文章质量的确定方法、文章筛选方法、以及相应的装置
CN105359181A (zh) 基于在线内容评估品牌的价值
CN102402717A (zh) 数据分析设备和方法
CN116109373A (zh) 金融产品的推荐方法、装置、电子设备和介质
CN115063035A (zh) 基于神经网络的客户评估方法、系统、设备及存储介质
KR102078541B1 (ko) 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체
CN116340831B (zh) 一种信息分类方法、装置、电子设备及存储介质
CN112132368A (zh) 信息处理方法以及装置、计算设备、存储介质
JP6178480B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
CN107590163B (zh) 文本特征选择的方法、装置和系统
CN106933797B (zh) 目标信息的生成方法及装置
CN113010664A (zh) 一种数据处理方法、装置及计算机设备
KR20220105792A (ko) 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템
CN112200602A (zh) 用于广告推荐的神经网络模型训练方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant