KR20190104745A - Issue interest based news value evaluation apparatus and method, storage media storing the same - Google Patents

Issue interest based news value evaluation apparatus and method, storage media storing the same Download PDF

Info

Publication number
KR20190104745A
KR20190104745A KR1020180025239A KR20180025239A KR20190104745A KR 20190104745 A KR20190104745 A KR 20190104745A KR 1020180025239 A KR1020180025239 A KR 1020180025239A KR 20180025239 A KR20180025239 A KR 20180025239A KR 20190104745 A KR20190104745 A KR 20190104745A
Authority
KR
South Korea
Prior art keywords
issue
news
interest
core
population
Prior art date
Application number
KR1020180025239A
Other languages
Korean (ko)
Other versions
KR102078541B1 (en
Inventor
김남규
이동훈
최호창
백민지
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020180025239A priority Critical patent/KR102078541B1/en
Publication of KR20190104745A publication Critical patent/KR20190104745A/en
Application granted granted Critical
Publication of KR102078541B1 publication Critical patent/KR102078541B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to an apparatus and method for evaluating a value of news based on issue interest. The apparatus comprises: an issue interest calculation unit extracting at least one key issue based on a news population and SNS message population created during a specific period and calculating issue interest for the key issues; a similarity analysis unit analyzing the similarity between the key issues for a plurality of news included in an evaluation population; and a news value evaluation unit evaluating a value of the news for the news included in the evaluation population based on the similarity and issue interest. Therefore, the apparatus and method of the present invention may evaluate the value of the news based on the similarity with an issue having high interest at a specific time.

Description

이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체{ISSUE INTEREST BASED NEWS VALUE EVALUATION APPARATUS AND METHOD, STORAGE MEDIA STORING THE SAME}ISSUE INTEREST BASED NEWS VALUE EVALUATION APPARATUS AND METHOD, STORAGE MEDIA STORING THE SAME}

본 발명은 이슈 관심도 기반의 뉴스 가치 평가 기술에 관한 것으로, 보다 상세하게는 특정 시점에 관심도 높은 이슈와의 유사도를 기초로 뉴스의 가치를 평가할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법에 관한 것이다.The present invention relates to a news value evaluation technology based on issue interest, and more particularly, to an issue interest based news value evaluation apparatus and method for evaluating the value of news based on the similarity to issues of high interest at a specific time. will be.

텍스트 마이닝(Text Mining)은 데이터 마이닝(Data Mining)을 포함한 다양한 분야의 기술을 포괄적으로 활용한다. 그 중에서도 자연어(Natural Language) 형태로 작성되는 텍스트의 특성상 이를 정형화하기 위한 자연어 처리 기술은 텍스트 마이닝 분석의 핵심 요소이다. 텍스트 마이닝은 일반적으로 비정형 텍스트 문서를 정형화한 뒤, 기존의 다양한 마이닝 기법을 변형하여 활용하는 형태로 이루어진다. 텍스트의 정형화 과정에는 기본적으로 각 문서에 사용된 용어의 빈도에 따라 문서의 주제 및 특성을 요약하는 벡터공간모델(Vector Space Model)이 사용된다. Text mining makes extensive use of technologies in a variety of fields, including data mining. Among them, natural language processing technology to formalize it is the core element of text mining analysis. Text mining is generally formed in the form of unstructured text document and then transforming and using various existing mining techniques. In the text formalization process, a vector space model is used that summarizes the subject and characteristics of a document according to the frequency of terms used in each document.

한국공개특허 제10-2009-0047646(2009.05.13)호는 기사가치 평가방법에 관한 것으로, 각종 언론매체를 통하여 기사화된 정보 중에서 해당 기업체에 관련된 정보나 상품 정보 등에 관한 기사의 가치를 실질적인 금액의 가치값으로 산출함으로써, 객관적이고 계량화된 데이터의 분석 및 평가를 통해 기업의 이미지 제고와 브랜드관리 또는 마케팅 등에 활용할 수 있고, 기업의 홍보활동의 투입대비 성과(Return of Investment) 평가 등에 활용할 수 있는 효과를 갖는 것이다.Korean Patent Laid-Open Publication No. 10-2009-0047646 (2009.05.13) relates to a method for evaluating article values. By calculating the value, it can be used to enhance the company's image, brand management or marketing through the analysis and evaluation of objective and quantified data, and to evaluate the return of investment of the company's public relations activities. To have.

한국공개특허 제10-2009-0047646(2009.05.13)호Korean Patent Publication No. 10-2009-0047646 (2009.05.13)

본 발명의 일 실시예는 특정 시점에 관심도 높은 이슈와의 유사도를 기초로 뉴스의 가치를 평가할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법을 제공하고자 한다.An embodiment of the present invention is to provide an apparatus and method for assessing news value based on an issue interest level that can evaluate the value of news based on similarity to issues of high interest level at a specific time.

본 발명의 일 실시예는 특정 이슈에 대한 대중들의 관심도를 관련 뉴스 및 SNS 메시지를 통해 측정할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법을 제공하고자 한다.An embodiment of the present invention is to provide an apparatus and method for assessing news value based on issue interest that can measure public interest in a specific issue through related news and SNS messages.

본 발명의 일 실시예는 이슈 관심도를 기초로 평가된 뉴스의 가치에 따라 사용자에게 제공되는 우선순위를 결정할 수 있는 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법을 제공하고자 한다.An embodiment of the present invention is to provide an apparatus and method for assessing news value based on issue interest that can determine the priority provided to a user according to the value of news evaluated based on issue interest.

실시예들 중에서, 이슈 관심도 기반의 뉴스 가치 평가 장치는 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 이슈 관심도 산출부, 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 유사도 분석부 및 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 뉴스 가치 평가부를 포함한다.Among the embodiments, the news interest evaluation apparatus based on the issue interest extracts at least one key issue based on the news population and the SNS message population generated during a specific period of time, and extracts the issue interest for the at least one core issue. A calculated issue interest calculation unit, a similarity analysis unit analyzing a similarity between the at least one core issue with respect to a plurality of news included in the evaluation population, and the plurality of included in the evaluation population based on the similarity and the issue interest level A news value evaluator that evaluates the news value of the news of the company.

상기 이슈 관심도 산출부는 상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정할 수 있다.The issue interest calculation unit includes a term having a term weight exceeding a term threshold value among a plurality of terms constituting each core issue with respect to the at least one core issue extracted through topic modeling of the news population. Can be determined as a key term.

상기 이슈 관심도 산출부는 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 상기 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출할 수 있다.The issue interest calculation unit identifies news and SNS messages associated with the key terms determined for each key issue from the news population and the SNS message population, and calculates the issue interest based on the number of news and the number of SNS messages for each key issue. can do.

상기 이슈 관심도 산출부는 다음의 수학식을 통해 상기 이슈 관심도를 산출할 수 있다.The issue interest calculation unit may calculate the issue interest through the following equation.

[수학식][Equation]

Figure pat00001
, 1 ≤ i ≤ n (n은 자연수)
Figure pat00001
, 1 ≤ i ≤ n (n is a natural number)

(여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)(Here, ISS i corresponds to issue interest for core issue i, S i corresponds to the number of SNS messages for core issue i, N i corresponds to news number for core issue i, and S is the total It corresponds to the number of SNS messages, and N corresponds to the total number of news.)

상기 유사도 분석부는 토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정할 수 있다.The similarity analyzer may extract a news topic for each of the plurality of news through topic modeling and determine a core issue having the highest similarity between the news topic and the at least one core issue.

상기 뉴스 가치 평가부는 상기 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 상기 이슈 관심도 및 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출할 수 있다.The news value evaluator may normalize the similarity and calculate the news value by multiplying the issue interest of the core issue having the highest similarity and the normalized similarity.

실시예들 중에서, 이슈 관심도 기반의 뉴스 가치 평가 방법은 (a) 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 단계, (b) 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 단계 및 (c) 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 단계를 포함한다.Among embodiments, an issue interest based news valuation method may include: (a) extracting at least one key issue based on a news population and an SNS message population generated during a particular time period and for the at least one key issue. Calculating an issue interest, (b) analyzing a similarity between the at least one core issue for a plurality of news contained in the assessment population, and (c) applying the interest to the assessment population based on the similarity and the issue interest. Evaluating news value for the plurality of news included.

상기 (a) 단계는 상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정하는 단계일 수 있다.Step (a) has a term weight exceeding a term threshold value among a plurality of terms constituting each core issue for the at least one core issue extracted through topic modeling of the news population. The term may be determined as a key term.

상기 (a) 단계는 상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 상기 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하는 단계일 수 있다.Step (a) identifies the news and SNS messages associated with the key terms determined for each key issue from the news population and the SNS message population, and issues the issue interest based on the number of news and the number of SNS messages for each key issue. The calculating may be a step.

상기 (c) 단계는 다음의 수학식을 통해 상기 이슈 관심도를 산출하는 단계일 수 있다.Step (c) may be a step of calculating the issue interest level through the following equation.

[수학식][Equation]

Figure pat00002
, 1 ≤ i ≤ n (n은 자연수)
Figure pat00002
, 1 ≤ i ≤ n (n is a natural number)

(여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)(Here, ISS i corresponds to issue interest for core issue i, S i corresponds to the number of SNS messages for core issue i, N i corresponds to news number for core issue i, and S is the total It corresponds to the number of SNS messages, and N corresponds to the total number of news.)

상기 (b) 단계는 토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정하는 단계일 수 있다.Step (b) may be a step of extracting a news topic for each of the plurality of news through topic modeling and determining a core issue having the highest similarity between the news topic and the at least one core issue.

상기 (c) 단계는 상기 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 상기 이슈 관심도 및 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 단계일 수 있다.The step (c) may be a step of calculating the news value by normalizing the similarity and multiplying the issue interest of the core issue having the highest similarity and the normalized similarity.

실시예들 중에서, 컴퓨터 수행 가능한 기록매체는 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 과정, 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 과정 및 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 과정을 포함한다.Among the embodiments, the computer-executable recording medium extracts at least one key issue based on the news population and the SNS message population generated during the specified time period and calculates an issue interest rate for the at least one key issue. Analyzing a similarity between the at least one key issue with respect to a plurality of news items included in an evaluation population, and calculating news values for the plurality of news items included in the evaluation population based on the similarity and the issue interest rate. It includes the process of evaluation.

개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.The disclosed technique can have the following effects. However, since a specific embodiment does not mean to include all of the following effects or only the following effects, it should not be understood that the scope of the disclosed technology is limited by this.

본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법은 특정 이슈에 대한 대중들의 관심도를 관련 뉴스 및 SNS 메시지를 통해 측정할 수 있다. An apparatus and method for assessing news value based on issue interest according to an embodiment of the present invention may measure the interest of the public on a specific issue through related news and SNS messages.

본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법은 이슈 관심도를 기초로 평가된 뉴스의 가치에 따라 사용자에게 제공되는 우선순위를 결정할 수 있다. An apparatus and method for evaluating news value based on issue interest according to an embodiment of the present invention may determine a priority provided to a user according to the value of news evaluated based on issue interest.

도 1은 본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 시스템을 설명하는 도면이다.
도 2는 도 1에 있는 뉴스 가치 평가 장치를 설명하는 블록도이다.
도 3은 도 1에 있는 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 과정을 설명하는 순서도이다.
도 4는 본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 시스템의 전체적인 개요를 나타내는 도면이다.
도 5는 도 2에 있는 이슈 관심도 산출부에서 뉴스 모집단에 대한 토픽 모델링을 수행하여 핵심 이슈 및 관련 용어를 추출하는 과정을 설명하는 예시도이다.
도 6은 도 2에 있는 이슈 관심도 산출부에서 핵심 이슈별 핵심 용어를 추출하는 과정을 설명하는 예시도이다.
도 7은 도 2에 있는 이슈 관심도 산출부에서 특정 이슈에 대한 뉴스 및 트윗으로부터 뉴스당 트윗 비율을 산출하는 과정을 설명하는 예시도이다.
1 is a diagram illustrating an issue interest based news valuation system according to an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a news value evaluation apparatus in FIG. 1.
3 is a flowchart illustrating a news value evaluation process performed in the news value evaluation apparatus of FIG. 1.
4 is a diagram illustrating an overall overview of an issue interest based news valuation system according to an embodiment of the present invention.
5 is an exemplary diagram illustrating a process of extracting a core issue and related terms by performing topic modeling on a news population in the issue interest calculation unit of FIG. 2.
FIG. 6 is an exemplary view illustrating a process of extracting key terms for each key issue from the issue interest calculation unit of FIG. 2.
FIG. 7 is an exemplary diagram illustrating a process of calculating a tweet rate per news from news and tweets about a specific issue in the issue interest calculation unit of FIG. 2.

본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.Description of the present invention is only an embodiment for structural or functional description, the scope of the present invention should not be construed as limited by the embodiments described in the text. That is, since the embodiments may be variously modified and may have various forms, the scope of the present invention should be understood to include equivalents capable of realizing the technical idea. In addition, the objects or effects presented in the present invention does not mean that a specific embodiment should include all or only such effects, the scope of the present invention should not be understood as being limited thereby.

한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.On the other hand, the meaning of the terms described in the present application should be understood as follows.

"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.Terms such as "first" and "second" are intended to distinguish one component from another component, and the scope of rights should not be limited by these terms. For example, the first component may be named a second component, and similarly, the second component may also be named a first component.

어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being "connected" to another component, it should be understood that there may be other components in between, although it may be directly connected to the other component. On the other hand, when a component is referred to as being "directly connected" to another component, it should be understood that there is no other component in between. On the other hand, other expressions describing the relationship between the components, such as "between" and "immediately between" or "neighboring to" and "directly neighboring to", should be interpreted as well.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Singular expressions should be understood to include plural expressions unless the context clearly indicates otherwise, and terms such as "comprise" or "have" refer to a feature, number, step, operation, component, part, or feature thereof. It is to be understood that the combination is intended to be present and does not exclude in advance the possibility of the presence or addition of one or more other features or numbers, steps, operations, components, parts or combinations thereof.

각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.In each step, an identification code (e.g., a, b, c, etc.) is used for convenience of description, and the identification code does not describe the order of the steps, and each step clearly indicates a specific order in context. Unless stated otherwise, they may occur out of the order noted. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.

본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can be embodied as computer readable code on a computer readable recording medium, and the computer readable recording medium includes all kinds of recording devices in which data can be read by a computer system. . Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.

여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.All terms used herein have the same meaning as commonly understood by one of ordinary skill in the art unless otherwise defined. Generally, the terms defined in the dictionary used are to be interpreted to coincide with the meanings in the context of the related art, and should not be interpreted as having ideal or excessively formal meanings unless clearly defined in the present application.

도 1은 본 발명의 일 실시예에 따른 이슈 관심도 기반의 뉴스 가치 평가 시스템을 설명하는 도면이다.1 is a diagram illustrating an issue interest based news valuation system according to an embodiment of the present invention.

도 1을 참조하면, 이슈 관심도 기반의 뉴스 가치 평가 시스템(이하, 뉴스 가치 평가 시스템이라 한다.)(100)은 사용자 단말(110), 뉴스 가치 평가 장치(130) 및 데이터베이스(150)를 포함할 수 있다.Referring to FIG. 1, an issue interest based news valuation system (hereinafter referred to as a news valuation system) 100 may include a user terminal 110, a news valuation device 130, and a database 150. Can be.

사용자 단말(110)은 특정 뉴스에 접근하여 해당 뉴스의 내용을 확인할 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 뉴스 가치 평가 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)은 뉴스 가치 평가 장치(130)와 동시에 연결될 수 있다. The user terminal 110 may correspond to a computing device capable of accessing specific news to check the contents of the news, and may be implemented as a smartphone, a notebook, or a computer, and the present disclosure is not limited thereto. It can also be implemented. The user terminal 110 may be connected to the news value evaluating apparatus 130 through a network, and the plurality of user terminals 110 may be connected to the news value evaluating apparatus 130 at the same time.

일 실시예에서, 사용자 단말(110)은 뉴스 가치 평가 장치(130)에 특정 뉴스에 대한 뉴스 가치 평가를 요청할 수 있고, 뉴스 가치 평가 장치(130)로부터 뉴스 가치 평가 결과를 수신하여 확인할 수 있다. 다른 실시예에서, 사용자 단말(110)은 복수의 뉴스들로 구성된 특정 뉴스 페이지에 접근하는 경우 자동으로 해당 뉴스 페이지에 포함된 복수의 뉴스들에 대한 뉴스 가치 평가를 뉴스 가치 평가 장치(130)에 요청할 수 있고, 뉴스 가치 평가 장치(130)로부터 수신 받은 뉴스 가치 정보를 기초로 복수의 뉴스들을 뉴스 가치 순서에 따라 정렬하여 표시할 수 있다.In an embodiment, the user terminal 110 may request a news value evaluation for a specific news from the news value evaluation device 130, and receive and confirm a news value evaluation result from the news value evaluation device 130. In another embodiment, when the user terminal 110 accesses a specific news page composed of a plurality of news, the user terminal 110 automatically transmits the news valuation for the plurality of news included in the news page to the news valuation device 130. A plurality of news may be sorted and displayed in order of news value based on the news value information received from the news value evaluation device 130.

뉴스 가치 평가 장치(130)는 사용자 단말(110)로부터 수신한 뉴스 가치 평가 요청에 따라 특정 뉴스에 대한 뉴스 가치를 평가 하여 평가 결과를 사용자 단말(110)에 제공할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 뉴스 가치 평가 장치(130)는 사용자 단말(110)과 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 주고 받을 수 있다.The news value evaluation apparatus 130 corresponds to a computer or a program capable of evaluating news value for a specific news and providing the evaluation result to the user terminal 110 according to the news value evaluation request received from the user terminal 110. Can be implemented as a server. The news value evaluation device 130 may be wirelessly connected to the user terminal 110 through Bluetooth, WiFi, and the like, and may exchange data with the user terminal 110 through a network.

뉴스 가치 평가 장치(130)는 데이터베이스(150)를 포함하여 구현될 수 있고, 데이터베이스(150)와 독립적으로 구현될 수 있다. 데이터베이스(150)와 독립적으로 구현된 경우 뉴스 가치 평가 장치(130)는 데이터베이스(150)와 유선 또는 무선으로 연결되어 데이터를 주고 받을 수 있다.The news valuation device 130 may be implemented including a database 150 and may be implemented independently of the database 150. When implemented independently of the database 150, the news value evaluation device 130 may be connected to the database 150 by wire or wirelessly to exchange data.

데이터베이스(150)는 뉴스 가치 평가를 위해 필요한 다양한 정보들을 저장할 수 있는 저장장치이다. 데이터베이스(150)는 사용자 단말(110)로부터 수신한 평가 요청과 관련된 뉴스 정보를 저장할 수 있고, 뉴스 가치 평가에 사용되는 특정 기간 동안 생성된 뉴스 데이터 및 SNS 메시지 데이터를 저장할 수 있으며, 반드시 이에 한정되지 않고, 특정 뉴스에 대한 가치를 평가하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다. 여기에서, SNS 메시지는 대표적인 소셜네트워크서비스(Social Network Services, SNS)인 트위터(Twitter), 페이스북(Facebook), 라인(Line) 등에서 사용자들이 생성하는 다양한 메시지에 해당할 수 있다.The database 150 is a storage device that can store a variety of information required for news valuation. The database 150 may store news information related to the evaluation request received from the user terminal 110, and may store news data and SNS message data generated during a specific period of time used for evaluating news value, but are not limited thereto. Instead, information collected or processed in various forms can be stored in the process of evaluating the value of a particular news. Here, the SNS message may correspond to various messages generated by users in Twitter, Facebook, Line, etc., which are representative social network services (SNS).

데이터베이스(150)는 특정 범위에 속하는 정보들을 저장하는 적어도 하나의 독립된 서브-데이터베이스들로 구성될 수 있고, 적어도 하나의 독립된 서브-데이터베이스들이 하나로 통합된 통합 데이터베이스로 구성될 수 있다. 적어도 하나의 독립된 서브-데이터베이스들로 구성되는 경우에는 각각의 서브-데이터베이스들은 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 상호 간의 데이터를 주고 받을 수 있다. 데이터베이스(150)는 통합 데이터베이스로 구성되는 경우 각각의 서브-데이터베이스들을 하나로 통합하고 상호 간의 데이터 교환 및 제어 흐름을 관리하는 제어부를 포함할 수 있다.The database 150 may be composed of at least one independent sub-databases that store information belonging to a specific range, and may be configured as an integrated database in which at least one independent sub-databases are integrated into one. When composed of at least one independent sub-database, each sub-database may be wirelessly connected through Bluetooth, WiFi, and the like, and may exchange data with each other through a network. When the database 150 is configured as an integrated database, the database 150 may include a control unit for integrating respective sub-databases into one and managing data exchange and control flow between them.

도 2는 도 1에 있는 뉴스 가치 평가 장치를 설명하는 블록도이다.FIG. 2 is a block diagram illustrating a news value evaluation apparatus in FIG. 1.

도 2를 참조하면, 뉴스 가치 평가 장치(130)는 이슈 관심도 산출부(210), 유사도 분석부(230), 뉴스 가치 평가부(250) 및 제어부(270)를 포함할 수 있다.Referring to FIG. 2, the news value evaluating apparatus 130 may include an issue interest calculating unit 210, a similarity analyzing unit 230, a news value evaluating unit 250, and a controller 270.

이슈 관심도 산출부(210)는 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출할 수 있다. 여기에서, 이슈 관심도는 정보의 가치를 정보의 수요와 공급의 관계에 기반을 두어 측정하기 위한 것으로, 정보 공급의 대표 매체로 인터넷 뉴스 기사를, 정보 수요를 나타내는 대표 매체로 SNS 메시지를 선정하고, 특정 이슈에 대한 뉴스의 정보로서의 가치를 이와 관련된 SNS 메시지의 양으로 평가하여 수치화한 것이다.The issue interest calculation unit 210 may extract at least one key issue based on the news population and the SNS message population generated during the specific period and calculate an issue interest rate for the at least one key issue. Here, the issue interest level is to measure the value of the information based on the relationship between the supply and demand of the information, select an Internet news article as a representative medium of information supply, and select an SNS message as a representative medium representing information demand, The value of news information on a specific issue is quantified by evaluating the amount of SNS messages related to it.

일 실시예에서, 이슈 관심도 산출부(210)는 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정할 수 있다. 여기에서, 토픽 모델링은 각 문서에 수록된 용어를 분석하여 유사도에 따라 문서를 그룹화한 뒤, 각 그룹의 핵심 용어를 토픽 키워드로 제시하는 기법이다. In one embodiment, the issue interest calculation unit 210 exceeds a term threshold value among a plurality of terms constituting each core issue with respect to at least one core issue extracted through topic modeling of the news population. The term with the term weight can be determined as the key term. Here, the topic modeling is a technique of analyzing the terms contained in each document, grouping the documents according to similarity, and then presenting key terms of each group as topic keywords.

일반적인 문서는 상당히 많은 양의 용어를 포함하고 있기 때문에 토픽 모델링을 통해 전체 용어에 대한 차원 축소가 이루어지며, 이 과정에서 사용된 차원의 수가 토픽의 수를 결정하게 된다. 용어 가중치(Term Topic Weight)는 각 용어의 각 토픽에 대한 대응도에 해당할 수 있고 토픽 모델링을 수행한 결과로서 도출될 수 있고, 미리 설정된 용어 임계값(Term Cutoff)이상의 용어 가중치를 갖는 용어는 해당 토픽을 기술하는 용어로 분류될 수 있다. Because a general document contains a large amount of terms, topic modeling reduces dimension to the whole terminology, and the number of dimensions used in this process determines the number of topics. Term Topic Weight may correspond to a correspondence degree for each topic of each term and may be derived as a result of topic modeling, and a term having a term weight above a preset term cutoff Can be classified into terms describing the topic.

또한, 각 문서에 대해서도 유사한 방식으로 문서 가중치(Document Topic Weight)가 산출될 수 있고, 미리 설정된 문서 임계값(Document Cutoff)이상의 문서 가중치를 갖는 문서는 해당 토픽을 포함한 문서로 인정될 수 있다. 토픽 모델링은 이러한 과정을 통해 방대한 양의 문서로부터 핵심 토픽을 추출할 수 있으며, 전체 뉴스로부터 핵심 이슈를 도출한 예에 대해서는 도 5에서 보다 자세히 설명한다.In addition, a document weight may be calculated in a similar manner for each document, and a document having a document weight greater than or equal to a preset document cutoff may be recognized as a document including a corresponding topic. Topic modeling can extract key topics from a large amount of documents through this process, and an example of deriving key issues from the entire news will be described in more detail with reference to FIG. 5.

일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈의 모든 용어 가중치의 '평균+1σ(Sigma, 표준편차)'를 통해 산출되는 용어 임계값을 이용하여 각 핵심 이슈별 핵심 용어를 결정할 수 있다.In one embodiment, the issue interest calculation unit 210 may determine a key term for each key issue using a term threshold calculated through 'average + 1σ (Sigma, standard deviation)' of all term weights of each key issue. have.

일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈별 용어 가중치에 따라 상위 n개(n은 자연수)의 용어를 선별하고 선별된 용어들의 용어 가중치 전체에 대한 평균을 통해 산출된 용어 임계값을 이용하여 각 핵심 이슈별 핵심 용어를 결정할 수 있다. 예를 들어, 이슈 관심도 산출부(210)는 핵심 이슈가 10개이고 n = 5인 경우 총 50개 용어의 용어 가중치에 대한 평균을 산출할 수 있다. 이슈 관심도 산출부(210)는 산출된 평균을 새로운 용어 임계값으로 결정할 수 있고 각 핵심 이슈별로 용어 임계값을 초과하는 용어 가중치를 가진 용어를 선별함으로써 핵심 용어를 결정할 수 있다.In one embodiment, the issue interest calculation unit 210 selects the top n terms (n is a natural number) according to the term weight for each core issue, and calculates the term threshold calculated through an average of all the term weights of the selected terms. You can use it to determine key terms for each key issue. For example, the issue interest calculator 210 may calculate an average of the term weights of a total of 50 terms when there are 10 core issues and n = 5. The issue interest calculator 210 may determine the calculated mean as a new term threshold and determine key terms by selecting terms having a term weight exceeding the term threshold for each key issue.

일 실시예에서, 이슈 관심도 산출부(210)는 뉴스 모집단 및 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 이슈 관심도를 산출할 수 있다. 이슈 관심도 산출부(210)는 뉴스 모집단에 대한 토픽 모델링을 통해 도출된 각 핵심 이슈별 핵심 용어를 키워드로 하여 뉴스 모집단 및 SNS 메시지 모집단에 대한 검색을 통해 핵심 용어와 관련된 뉴스 및 SNS 메시지를 선별할 수 있다.In one embodiment, the issue interest calculator 210 identifies news and SNS messages associated with key terms determined for each key issue from the news population and the SNS message population and based on the number of news and the number of SNS messages for each key issue. Issue interest can be calculated. The issue interest calculation unit 210 may select news and SNS messages related to key terms by searching for a news population and an SNS message population using key terms for each key issue derived through topic modeling of the news population as keywords. have.

이슈 관심도 산출부(210)는 각 핵심 이슈별 뉴스 및 SNS 메시지 수를 이용하여 뉴스당 SNS 메시지 비율을 산출함으로써 해당 핵심 이슈에 대한 관심도를 도출할 수 있다. 이슈 관심도 산출부(210)는 특정 핵심 이슈에 대한 뉴스가 많을수록 관심도가 높은 것이 아니라 해당 핵심 이슈에 대한 SNS 메시지가 많을수록 관심도가 높은 것으로 파악할 수 있다. 이슈 관심도 산출부(210)는 각 핵심 이슈별 뉴스당 SNS 메시지 비율을 일별, 주별 및 월별로 산출함으로써 핵심 이슈에 대한 관심도가 시간의 흐름에 따라 변화하는 모습을 확인할 수 있다.The issue interest calculation unit 210 may derive an interest in a corresponding core issue by calculating the SNS message ratio per news using the number of news and SNS messages for each core issue. The issue interest calculation unit 210 may determine that the more news about a particular core issue, the higher the interest level, and that the more SNS messages for the corresponding core issue, the higher the interest level. The issue interest calculation unit 210 may calculate the SNS message rate per news for each core issue on a daily, weekly and monthly basis to confirm that interest in the core issue changes over time.

일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈별 핵심 용어 들을 AND 또는 OR 조건으로 조합하여 뉴스 모집단 및 SNS 메시지 모집단을 검색할 수 있다. 예를 들어, 이슈 관심도 산출부(210)는 특정 이슈 A에 대한 핵심 용어가 '클린턴', '트럼프' 및 '대선'인 경우, {'클린턴' AND '트럼프' AND '대선'} 또는 {'클린턴' OR '트럼프' OR '대선'} 과 같이 조합하여 검색을 수행할 수 있다.In one embodiment, the issue interest calculator 210 may search for a news population and an SNS message population by combining key terms for each key issue in an AND or OR condition. For example, the issue interest calculator 210 may determine {Clinton 'AND' Trump 'AND' President '} or {' when the key terms for a specific issue A are 'Clinton', 'Trump' and 'Presidential election'. The search can be performed in combination with Clinton 'OR' Trump 'OR' Presidential '}.

일 실시예에서, 이슈 관심도 산출부(210)는 다음의 수학식 1을 통해 이슈 관심도를 산출할 수 있다.In one embodiment, the issue interest calculation unit 210 may calculate the issue interest through Equation 1 below.

[수학식 1][Equation 1]

ISSi = (Si / Ni) / (S / N), 1 ≤ i ≤ n (n은 자연수)ISS i = (S i / N i ) / (S / N), 1 ≤ i ≤ n (n is a natural number)

여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.Where ISS i corresponds to issue interest in core issue i, S i corresponds to the number of SNS messages for core issue i, N i corresponds to the news number for core issue i, and S is the total SNS N corresponds to the number of messages, N corresponds to the total number of news.

일 실시예에서, 이슈 관심도 산출부(210)는 다음의 수학식 2를 통해 이슈 관심도를 산출할 수 있다.In one embodiment, the issue interest calculation unit 210 may calculate the issue interest level through Equation 2 below.

[수학식 2][Equation 2]

Figure pat00003
, 1 ≤ i ≤ n (n은 자연수)
Figure pat00003
, 1 ≤ i ≤ n (n is a natural number)

여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.Where ISS i corresponds to issue interest in core issue i, S i corresponds to the number of SNS messages for core issue i, N i corresponds to the news number for core issue i, and S is the total SNS N corresponds to the number of messages, N corresponds to the total number of news.

유사도 분석부(230)는 평가 모집단에 포함된 복수의 뉴스들에 대해 적어도 하나의 핵심 이슈 간의 유사도를 분석할 수 있다. 보다 구체적으로, 유사도 분석부(230)는 각 뉴스별로 해당 뉴스의 내용과 뉴스 모집단에 대한 토픽 모델링을 통해 도출된 핵심 이슈들 사이에 어느 정도의 연관성이 존재하는지를 유사도에 기초하여 판단할 수 있다.The similarity analyzer 230 may analyze the similarity between at least one key issue with respect to a plurality of news items included in the evaluation population. More specifically, the similarity analysis unit 230 may determine, based on the similarity, the degree of association between the contents of the news and the key issues derived through topic modeling of the news population for each news.

일 실시예에서, 유사도 분석부(230)는 토픽 모델링을 통해 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 뉴스 주제 및 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정할 수 있다. 여기에서, 각 뉴스에 대한 뉴스 주제는 토픽 모델링을 통해 도출된 결과에 해당하므로 복수의 뉴스 토픽을 포함하는 토픽 집합으로 표현될 수 있다. 유사도 분석부(230)는 뉴스 주제에 포함된 뉴스 토픽들과 핵심 이슈에 포함된 핵심 용어들 간의 유사도를 기초로 각 뉴스 및 핵심 이슈들 간의 유사도를 결정할 수 있다.In one embodiment, the similarity analyzer 230 may extract a news topic for each of the plurality of news through topic modeling, and determine a core issue having the highest similarity between the news topic and the at least one key issue. Here, since a news topic for each news corresponds to a result derived through topic modeling, the news topic may be represented as a topic set including a plurality of news topics. The similarity analyzer 230 may determine the similarity between each news and the core issues based on the similarity between the news topics included in the news topic and the key terms included in the core issues.

예를 들어, 유사도 분석부(230)는 뉴스 토픽들 중에서 대표 뉴스 토픽을 추출하고 핵심 용어들 중에서 대표 핵심 용어를 추출한 후 대표 뉴스 토픽 및 대표 핵심 용어 간의 유사도를 해당 뉴스 및 핵심 이슈 간의 유사도로써 산출할 수 있다. 또한, 유사도 분석부(230)는 뉴스 토픽 및 핵심 용어 간의 유사도를 모두 산출한 후 평균한 값을 해당 뉴스 및 핵심 이슈 간의 유사도로써 산출할 수 있다.For example, the similarity analyzer 230 extracts a representative news topic from news topics and extracts a representative key term from key terms, and then calculates the similarity between the representative news topic and the representative key term as the similarity between the corresponding news and the key issues. can do. In addition, the similarity analyzer 230 may calculate the similarity between the news topic and the key terms and then calculate the average value as the similarity between the news and the core issue.

뉴스 가치 평가부(250)는 유사도 및 이슈 관심도를 기초로 평가 모집단에 포함된 복수의 뉴스들에 대한 뉴스 가치를 평가할 수 있다. 보다 구체적으로, 뉴스 가치 평가부(250)는 특정 뉴스에 대하여 뉴스 모집단으로부터 도출된 핵심 이슈들 중에서 가장 유사한 핵심 이슈를 결정할 수 있고, 해당 핵심 이슈의 이슈 관심도를 기초로 해당 뉴스에 대한 뉴스 가치를 평가할 수 있다.The news value evaluator 250 may evaluate news values of a plurality of news items included in the evaluation population based on the similarity and the issue interest. More specifically, the news value evaluator 250 may determine the most similar core issues among the core issues derived from the news population for a particular news, and may determine a news value for the news based on the issue interest of the core issues. Can be evaluated

일 실시예에서, 뉴스 가치 평가부(250)는 유사도를 정규화하고 유사도가 가장 높은 핵심 이슈의 이슈 관심도 및 정규화된 유사도 간의 곱 연산을 통해 뉴스 가치를 산출할 수 있다. 예를 들어, 뉴스 가치 평가부(250)는 유사도를 0 에서 1 사이의 값을 가지도록 정규화할 수 있고 정규화된 유사도 및 가장 높은 유사도를 가지는 핵심 이슈의 이슈 관심도 간의 곱 연산을 통해 특정 뉴스에 대한 뉴스 가치를 산출할 수 있다.In one embodiment, the news value evaluator 250 may normalize the similarity and calculate the news value by multiplying the issue interest of the core issue with the highest similarity and the normalized similarity. For example, the news valuation unit 250 may normalize the similarity to have a value between 0 and 1, and multiply the issue interest of the core issue with the normalized similarity and the highest similarity with respect to a specific news. Can calculate news value.

제어부(270)는 뉴스 가치 평가 장치(130)의 전체적인 동작을 제어하고, 이슈 관심도 산출부(210), 유사도 분석부(230) 및 뉴스 가치 평가부(250) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.The controller 270 controls the overall operation of the news value evaluator 130 and manages a control flow or data flow between the issue interest calculator 210, the similarity analyzer 230, and the news value evaluator 250. Can be.

도 3은 도 1에 있는 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 과정을 설명하는 순서도이다.3 is a flowchart illustrating a news value evaluation process performed in the news value evaluation apparatus of FIG. 1.

도 3을 참조하면, 뉴스 가치 평가 장치(130)는 이슈 관심도 산출부(210)를 통해 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출할 수 있다(단계 S310). Referring to FIG. 3, the news value evaluating apparatus 130 extracts at least one key issue based on the news population and the SNS message population generated during a specific time period through the issue interest calculation unit 210 and at least one. It is possible to calculate the degree of issue interest in the core issue of (step S310).

일 실시예에서, 이슈 관심도 산출부(210)는 각 핵심 이슈별 핵심 용어 들을 용어 가중치가 높은 순서에 따라 3개의 집합으로 분할한 후 첫 번째 집합에 대해서는 AND 조건으로 조합하고 나머지 집합에 대해서는 OR 조건으로 조합하여 뉴스 모집단 및 SNS 메시지 모집단을 검색할 수 있다. In one embodiment, the issue interest calculation unit 210 divides the key terms for each key issue into three sets according to the high term weighting order, then combines the first set with an AND condition and the remaining sets with an OR condition. In combination, the news population and the SNS message population can be retrieved.

예를 들어, 이슈 관심도 산출부(210)는 특정 이슈 A에 대한 핵심 용어가 '클린턴', '트럼프' 및 '대선'이고 용어 가중치가 높은 순서도 동일한 경우, {'클린턴' AND ('트럼프' OR '대선')}과 같이 조합하여 검색을 수행할 수 있다. 즉, 용어 가중치가 가장 높은 '클린턴'은 AND 조건으로, 나머지 핵심 용어인 '트럼프' 및 '대선'은 OR 조건으로 조합하여 검색을 수행할 수 있다.For example, the issue interest calculation unit 210 may determine {'Clinton' AND ('Trump' OR) when the key terms for a specific issue A are 'Clinton', 'Trump', and 'election', and the order of the term weights is the same. Search can be performed in combination as in the following. That is, 'Clinton' having the highest term weight is an AND condition, and the other key terms 'Trump' and 'election' may be combined with an OR condition.

뉴스 가치 평가 장치(130)는 유사도 분석부(230)를 통해 평가 모집단에 포함된 복수의 뉴스들에 대해 적어도 하나의 핵심 이슈 간의 유사도를 분석할 수 있다(단계 S330).The news value evaluation apparatus 130 may analyze the similarity between at least one key issue with respect to the plurality of news items included in the evaluation population through the similarity analyzer 230 (step S330).

뉴스 가치 평가 장치(130)는 뉴스 가치 평가부(250)를 통해 유사도 및 이슈 관심도를 기초로 평가 모집단에 포함된 복수의 뉴스들에 대한 뉴스 가치를 평가할 수 있다(단계 S350). 일 실시예에서, 뉴스 가치 평가부(250)는 평가 모집단에 포함된 복수의 뉴스들에 대한 뉴스 가치를 산출할 수 있고, 뉴스 가치가 높은 순서에 따라 정렬된 복수의 뉴스들에 대한 정보를 사용자 단말(110)에 제공할 수 있다. 사용자 단말(110)은 뉴스 가치 평가부(250)로부터 제공된 정보에 따라 복수의 뉴스들을 디스플레이 장치에 표시할 수 있다.The news value evaluating apparatus 130 may evaluate the news values of the plurality of news items included in the evaluation population based on the similarity and the issue interest level through the news value evaluator 250 (step S350). In one embodiment, the news value evaluator 250 may calculate a news value for a plurality of news included in the evaluation population, and user information about the plurality of news sorted according to the high news value order. It may be provided to the terminal 110. The user terminal 110 may display a plurality of news on the display device according to the information provided from the news value evaluator 250.

도 4는 도 2에 있는 이슈 관심도 산출부의 전체적인 개요를 나타내는 도면이다.4 is a diagram illustrating an overview of an issue interest level calculator of FIG. 2.

도 4를 참조하면, 이슈 관심도 산출부(210)는 뉴스 모집단에 포함된 뉴스 기사에 대해 토픽 모델링을 통해 분석 대상이 되는 핵심 이슈를 추출할 수 있고(단계 S410), 특정 핵심 이슈에 대응되는 뉴스 기사와 트윗(Tweet)을 추출할 수 있다(단계 S420). 여기에서, 트윗은 SNS 중 하나인 트위터(Twitter)에서 사용자들이 생성하는 메시지에 해당할 수 있고, 도 4에서는 SNS 메시지 중 트윗만을 이용하여 이슈 관심도를 산출하는 예를 나타내고 있다. Referring to FIG. 4, the issue interest calculation unit 210 may extract a core issue to be analyzed through topic modeling of news articles included in a news population (step S410), and news corresponding to a specific core issue. An article and a tweet may be extracted (step S420). Here, the tweet may correspond to a message generated by users in Twitter (Twitter), one of the SNS, Figure 4 shows an example of calculating the issue interest using only the tweet of the SNS message.

즉, 이슈 관심도 추출부(210)는 각 핵심 이슈를 구성하고 있는 용어 중 특정 임계값 이상의 용어만을 선별할 수 있고 선별된 용어를 관련 뉴스 및 트윗 추출에 사용할 수 있다. 이슈 관심도 추출부(210)는 각 핵심 이슈별 뉴스당 트윗 비율을 산출할 수 있고(단계 S430), 산출된 값을 각 일자별 뉴스당 트윗 기준 비율로 나눔으로써(단계 S440) 핵심 이슈별 이슈 관심도를 도출할 수 있다(단계 S450).That is, the issue interest extraction unit 210 may select only terms above a certain threshold value among terms constituting each core issue and use the selected terms in extracting related news and tweets. The issue interest extraction unit 210 may calculate the tweet rate per news for each core issue (step S430), and divide the calculated value by the tweet reference ratio per news for each date (step S440) to derive the issue interest for each core issue. It may be (step S450).

핵심 이슈별 뉴스당 트윗 비율은 핵심 이슈별 트윗의 수를 핵심 이슈별 뉴스의 수로 나눈 값에 해당할 수 있고, 뉴스당 트윗 기준 비율은 생성된 전체 트윗의 수를 전체 뉴스의 수로 나눈 값에 해당할 수 있다. 이슈 관심도 산출부(210)는 뉴스당 트윗 비율 및 뉴스당 트윗 기준 비율을 일별, 주별 및 월별로 산출하여 활용할 수 있다.The tweet rate per news by key issue may correspond to the number of tweets by key issue divided by the number of news by key issue, and the tweet criterion per news may correspond to the total number of tweets generated divided by the total number of news. . The issue interest calculation unit 210 may calculate and use the tweet rate per news and the tweet reference rate per news on a daily, weekly and monthly basis.

도 5는 도 2에 있는 이슈 관심도 산출부에서 뉴스 모집단에 대한 토픽 모델링을 수행하여 핵심 이슈 및 관련 용어를 추출하는 과정을 설명하는 예시도이다.5 is an exemplary diagram illustrating a process of extracting a core issue and related terms by performing topic modeling on a news population in the issue interest calculation unit of FIG. 2.

도 5를 참조하면, 이슈 관심도 산출부(210)는 뉴스 모집단에 대한 토픽 모델링을 통해 3개의 핵심 이슈로서 Issue 1, Issue 2 및 Issue 3을 추출할 수 있다. Issue 1은 (클린턴, 트럼프, 대선)에 해당하고, Issue 2는 (최순실, JTBC, 배후)에 해당하며, Issue 3은 (건강, 위염, 내시경)에 해당할 수 있다. 또한, 각 핵심 이슈를 나타내는 주요 용어를 각 용어의 가중치와 함께 핵심 이슈별로 10개씩 제시하고 있다. Referring to FIG. 5, the issue interest calculation unit 210 may extract Issue 1, Issue 2, and Issue 3 as three core issues through topic modeling of a news population. Issue 1 may correspond to (Clinton, Trump, Presidential Election), Issue 2 may correspond to (Choi Soon-sil, JTBC, behind), and Issue 3 may correspond to (Health, Gastritis, Endoscopy). In addition, 10 key terms representing each key issue are presented for each key issue along with the weight of each term.

각 핵심 이슈를 기술하는 용어는 각 핵심 이슈에 포함된 용어 중에서 용어 가중치가 특정 임계값 이상인 용어에 해당할 수 있고, 용어 가중치 순으로 특정 수의 용어에 해당할 수 있다. 예를 들어, Issue 1에 포함된 용어들 중에서 용어 가중치가 가장 높은 3개의 용어는 각각 0.248의 가중치를 갖는 '클린턴', 0.203의 가중치를 갖는 '트럼프' 및 0.186의 가중치를 갖는 '대선'임을 확인할 수 있다. 이슈 관심도 산출부(210)는 도 5와 같이 도출된 핵심 이슈별 키워드를 활용하여 관련 뉴스 및 트윗을 선별할 수 있다.Terms describing each core issue may correspond to a term having a term weight greater than or equal to a certain threshold among terms included in each core issue, and may correspond to a certain number of terms in order of term weight. For example, among the terms included in Issue 1, the three terms with the highest term weights are 'Clinton' with a weight of 0.248, 'Trump' with a weight of 0.203, and 'Presidential' with a weight of 0.186. Can be. The issue interest calculation unit 210 may select related news and tweets by using the keywords for each key issue derived as shown in FIG. 5.

도 6은 도 2에 있는 이슈 관심도 산출부에서 핵심 이슈별 핵심 용어를 추출하는 과정을 설명하는 예시도이다.FIG. 6 is an exemplary view illustrating a process of extracting key terms for each key issue from the issue interest calculation unit of FIG. 2.

도 6을 참조하면, 이슈 관심도 산출부(210)는 토픽 모델링을 통해 추출된 각 핵심 이슈별 용어들 중에서 보다 강화된 기준으로 핵심 용어를 재선별할 수 있다. 예를 들어, 이슈 관심도 산출부(210)는 각 핵심 이슈별로 용어 가중치에 따라 상위 N개의 용어를 구분한 뒤, 이들 전체 용어의 용어 가중치의 평균을 산출할 수 있고, 산출된 평균값을 새로운 용어 임계값으로 지정하여 각 핵심 이슈의 핵심 용어를 도출함으로써, 각 핵심 이슈와 직접적인 관계가 있는 핵심 용어만을 식별할 수 있다. Referring to FIG. 6, the issue interest calculation unit 210 may reselect key terms based on a stronger standard among terms of respective key issues extracted through topic modeling. For example, the issue interest calculation unit 210 may classify the top N terms according to the term weights for each core issue, calculate an average of the term weights of all the whole terms, and use the calculated mean value as a new term threshold. By assigning values to derive key terms for each key issue, only those key terms that are directly related to each key issue can be identified.

도 6에서, 이렇게 산출된 값이 0.15일 때, 핵심 이슈별 용어 중 일부는 제거되고 최상위 용어만 핵심 이슈의 핵심 용어로 잔류하는 것을 확인할 수 있다. 어둡게 표시된 용어는 이 과정에서 제거된 용어를 나타내며, 잔류한 핵심 용어의 수는 각 핵심 이슈별로 상이하게 나타날 수 있다. Issue 1의 경우 4개, Issue 2의 경우 8개, Issue 3의 경우 5개의 핵심 용어가 잔류한 것을 확인할 수 있다.In FIG. 6, when the calculated value is 0.15, it may be confirmed that some of the terms per core issue are removed and only the top term remains as the core term of the core issue. The darker terms represent terms that have been removed in this process, and the number of remaining key terms may vary for each key issue. Four key terms remain for Issue 1, eight for Issue 2, and five for Issue 3.

도 7은 도 2에 있는 이슈 관심도 산출부에서 특정 이슈에 대한 뉴스 및 트윗으로부터 뉴스당 트윗 비율을 산출하는 과정을 설명하는 예시도이다.FIG. 7 is an exemplary diagram illustrating a process of calculating a tweet rate per news from news and tweets about a specific issue in the issue interest calculation unit of FIG. 2.

도 7을 참조하면, 뉴스에서 가장 많이 언급된 이슈는 Issue 1(클린턴, 트럼프, 대선)이며, Issue 2(최순실, JTBC, 배후)이 그 다음, 그리고 Issue 3(건강, 위염, 내시경)은 가장 적게 언급되었음을 알 수 있다(도 6의 (a)). 또한, 트윗 수 측면에서는 Issue 2가 가장 많이 언급되었으며, 그 다음 Issue 1, Issue 3 순서로 언급되었음을 알 수 있다(도 6의 (b)). Referring to FIG. 7, the most mentioned issue in the news is Issue 1 (Clinton, Trump, Presidential Election), followed by Issue 2 (Sunsil, JTBC, behind), and Issue 3 (Health, Gastritis, Endoscopy) It can be seen that less mention (Fig. 6 (a)). In addition, in terms of the number of tweets, Issue 2 was mentioned the most, and then it can be seen that Issue 1 and Issue 3 were mentioned in the order (Fig. 6 (b)).

공급 대비 수요의 비율, 즉 뉴스당 트윗의 비율은 Issue 2가 가장 높게 나타나서, 해당 이슈에 대한 대중의 관심에 비해 뉴스가 적게 제공되고 있음을 나타내고 있다(도 6의 (c)). Issue 1의 경우 뉴스당 트윗 비율이 Issue 3보다도 낮게 나타났으며, 이는 대중의 관심에 비해 뉴스가 지나치게 많이 공급되고 있음을 나타낸다. 따라서, 개별 뉴스의 가치는 Issue 2 > Issue 3 > Issue 1의 순서로 높게 나타나는 것으로 해석할 수 있다.The ratio of demand to supply, that is, the ratio of tweets per news, is highest in Issue 2, indicating that less news is provided than the public's interest in the issue (Fig. 6 (c)). In Issue 1, the tweet rate per news was lower than Issue 3, indicating that the news is being fed too much for the public. Therefore, the value of individual news can be interpreted as being higher in order of Issue 2> Issue 3> Issue 1.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although described above with reference to a preferred embodiment of the present invention, those skilled in the art will be variously modified and changed within the scope of the invention without departing from the spirit and scope of the invention described in the claims below I can understand that you can.

100: 이슈 관심도 기반의 뉴스 가치 평가 시스템
110: 사용자 단말 130: 뉴스 가치 평가 장치
150: 데이터베이스
210: 이슈 관심도 산출부 230: 유사도 분석부
250: 뉴스 가치 평가부 270: 제어부
100: Issue valuation based news valuation system
110: user terminal 130: news valuation device
150: database
210: issue interest calculation unit 230: similarity analysis unit
250: news value evaluation unit 270: control unit

Claims (13)

특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 이슈 관심도 산출부;
평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 유사도 분석부; 및
상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 뉴스 가치 평가부를 포함하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
An issue interest calculation unit for extracting at least one key issue based on the news population and the SNS message population generated during a specific period and calculating an issue interest rate for the at least one key issue;
A similarity analyzer for analyzing a similarity between the at least one core issue with respect to a plurality of news items included in an evaluation population; And
And a news value evaluator for evaluating news values for the plurality of news items included in the evaluation population based on the similarity and the issue interest.
제1항에 있어서, 상기 이슈 관심도 산출부는
상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
The method of claim 1, wherein the issue interest calculator
Determining a term having a term weight exceeding a term threshold from among a plurality of terms constituting each core issue with respect to the at least one core issue extracted through topic modeling of the news population as a core term News valuation device based on the issue interest, characterized in that.
제2항에 있어서, 상기 이슈 관심도 산출부는
상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 상기 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
The method of claim 2, wherein the issue interest calculator
Identifying the news and SNS messages associated with the core terms determined for each core issue from the news population and the SNS message population and calculating the issue interest based on the number of news and the number of SNS messages for each core issue A news valuation device based on issue interest.
제3항에 있어서, 상기 이슈 관심도 산출부는
다음의 수학식을 통해 상기 이슈 관심도를 산출하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
[수학식]
Figure pat00004
, 1 ≤ i ≤ n (n은 자연수)
(여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)
The method of claim 3, wherein the issue interest calculator
An apparatus for evaluating news value based on issue interest, characterized in that the issue interest is calculated through the following equation.
[Equation]
Figure pat00004
, 1 ≤ i ≤ n (n is a natural number)
(Here, ISS i corresponds to issue interest for core issue i, S i corresponds to the number of SNS messages for core issue i, N i corresponds to news number for core issue i, and S is the total It corresponds to the number of SNS messages, and N corresponds to the total number of news.)
제1항에 있어서, 상기 유사도 분석부는
토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
The method of claim 1, wherein the similarity analysis unit
And extracting a news topic for each of the plurality of news through topic modeling, and determining a core issue having the highest similarity between the news topic and the at least one key issue.
제5항에 있어서, 상기 뉴스 가치 평가부는
상기 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 상기 이슈 관심도 및 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 장치.
The method of claim 5, wherein the news value evaluator
And calculating the news value by normalizing the similarity and multiplying the issue interest of the core issue having the highest similarity and the normalized similarity.
이슈 관심도 기반의 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 방법에 있어서,
(a) 특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 단계;
(b) 평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 단계; 및
(c) 상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 단계를 포함하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
In the news valuation method performed in the news valuation device based on the issue interest,
(a) extracting at least one key issue based on the news population and the SNS message population generated during a particular time period and calculating issue interest for the at least one key issue;
(b) analyzing the similarity between the at least one key issue for a plurality of news included in an assessment population; And
and (c) evaluating news values for the plurality of news items included in the evaluation population based on the similarity and issue interest.
제7항에 있어서, 상기 (a) 단계는
상기 뉴스 모집단에 대한 토픽 모델링(Topic Modeling)을 통해 추출된 상기 적어도 하나의 핵심 이슈에 대해 각 핵심 이슈를 구성하는 복수의 용어들 중에서 용어 임계값을 초과하는 용어 가중치를 가진 용어를 핵심 용어로 결정하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
The method of claim 7, wherein step (a)
Determining a term having a term weight exceeding a term threshold from among a plurality of terms constituting each core issue with respect to the at least one core issue extracted through topic modeling of the news population as a core term News valuation method based on the issue interest, characterized in that the step of doing.
제8항에 있어서, 상기 (a) 단계는
상기 뉴스 모집단 및 상기 SNS 메시지 모집단으로부터 각 핵심 이슈별로 결정된 상기 핵심 용어와 연관된 뉴스 및 SNS 메시지를 식별하고 각 핵심 이슈별 뉴스의 수 및 SNS 메시지의 수를 기초로 상기 이슈 관심도를 산출하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
The method of claim 8, wherein step (a)
Identifying the news and SNS messages associated with the key terms determined for each key issue from the news population and the SNS message population and calculating the issue interest based on the number of news and the number of SNS messages for each key issue. How to assess news value based on issue interest.
제9항에 있어서, 상기 (c) 단계는
다음의 수학식을 통해 상기 이슈 관심도를 산출하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
[수학식]
Figure pat00005
, 1 ≤ i ≤ n (n은 자연수)
(여기에서, ISSi는 핵심 이슈 i에 대한 이슈 관심도에 해당하고, Si은 핵심 이슈 i에 대한 SNS 메시지 수에 해당하고, Ni은 핵심 이슈 i에 대한 뉴스 수에 해당하고, S은 전체 SNS 메시지 수에 해당하고, N은 전체 뉴스 수에 해당한다.)
The method of claim 9, wherein step (c)
An issue interest based news value evaluation method, characterized in that the step of calculating the issue interest through the following equation.
[Equation]
Figure pat00005
, 1 ≤ i ≤ n (n is a natural number)
(Here, ISS i corresponds to issue interest for core issue i, S i corresponds to the number of SNS messages for core issue i, N i corresponds to news number for core issue i, and S is the total It corresponds to the number of SNS messages, and N corresponds to the total number of news.)
제7항에 있어서, 상기 (b) 단계는
토픽 모델링을 통해 상기 복수의 뉴스들 각각에 대한 뉴스 주제를 추출하고 상기 뉴스 주제 및 상기 적어도 하나의 핵심 이슈 간의 유사도가 가장 높은 핵심 이슈를 결정하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
The method of claim 7, wherein step (b)
Extracting a news topic for each of the plurality of news through topic modeling and determining a core issue having the highest similarity between the news topic and the at least one core issue. Way.
제11항에 있어서, 상기 (c) 단계는
상기 유사도를 정규화하고 상기 유사도가 가장 높은 핵심 이슈의 상기 이슈 관심도 및 정규화된 상기 유사도 간의 곱 연산을 통해 상기 뉴스 가치를 산출하는 단계인 것을 특징으로 하는 이슈 관심도 기반의 뉴스 가치 평가 방법.
The method of claim 11, wherein step (c)
And calculating the news value by normalizing the similarity and multiplying the issue interest of the core issue having the highest similarity and the normalized similarity.
이슈 관심도 기반의 뉴스 가치 평가 장치에서 수행되는 뉴스 가치 평가 방법을 기록하는 컴퓨터 수행 가능한 기록매체에 있어서,
특정 기간 동안 생성된 뉴스 모집단 및 SNS 메시지 모집단을 기초로 적어도 하나의 핵심 이슈(Issue)를 추출하고 상기 적어도 하나의 핵심 이슈에 대한 이슈 관심도를 산출하는 과정;
평가 모집단에 포함된 복수의 뉴스들에 대해 상기 적어도 하나의 핵심 이슈 간의 유사도를 분석하는 과정; 및
상기 유사도 및 상기 이슈 관심도를 기초로 상기 평가 모집단에 포함된 상기 복수의 뉴스들에 대한 뉴스 가치를 평가하는 과정을 포함하는 기록매체.
A computer-executable recording medium for recording a news valuation method performed in an issue interest based news valuation device,
Extracting at least one key issue based on the news population and the SNS message population generated during a specific time period and calculating an issue interest rate for the at least one key issue;
Analyzing similarity between the at least one key issue for a plurality of news included in an evaluation population; And
And evaluating news values for the plurality of news items included in the evaluation population based on the similarity and the issue interest.
KR1020180025239A 2018-03-02 2018-03-02 Issue interest based news value evaluation apparatus and method, storage media storing the same KR102078541B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180025239A KR102078541B1 (en) 2018-03-02 2018-03-02 Issue interest based news value evaluation apparatus and method, storage media storing the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180025239A KR102078541B1 (en) 2018-03-02 2018-03-02 Issue interest based news value evaluation apparatus and method, storage media storing the same

Publications (2)

Publication Number Publication Date
KR20190104745A true KR20190104745A (en) 2019-09-11
KR102078541B1 KR102078541B1 (en) 2020-02-19

Family

ID=67949196

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180025239A KR102078541B1 (en) 2018-03-02 2018-03-02 Issue interest based news value evaluation apparatus and method, storage media storing the same

Country Status (1)

Country Link
KR (1) KR102078541B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681056A (en) * 2023-05-24 2023-09-01 人民网股份有限公司 Text value calculation method and device based on value scale

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050096924A (en) * 2002-12-27 2005-10-06 가부시키가이샤 아이.피.비. Technique evaluating device, technique evaluating program and technique evaluating method
KR20090047646A (en) 2007-11-08 2009-05-13 장남석 Method for evaluating news articles
KR101705810B1 (en) * 2015-11-18 2017-02-10 고려대학교 산학협력단 Server, smart device and method for news recommendation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050096924A (en) * 2002-12-27 2005-10-06 가부시키가이샤 아이.피.비. Technique evaluating device, technique evaluating program and technique evaluating method
KR20090047646A (en) 2007-11-08 2009-05-13 장남석 Method for evaluating news articles
KR101705810B1 (en) * 2015-11-18 2017-02-10 고려대학교 산학협력단 Server, smart device and method for news recommendation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681056A (en) * 2023-05-24 2023-09-01 人民网股份有限公司 Text value calculation method and device based on value scale
CN116681056B (en) * 2023-05-24 2024-01-26 人民网股份有限公司 Text value calculation method and device based on value scale

Also Published As

Publication number Publication date
KR102078541B1 (en) 2020-02-19

Similar Documents

Publication Publication Date Title
CN109522556B (en) Intention recognition method and device
CN107851097B (en) Data analysis system, data analysis method, data analysis program, and storage medium
US8325189B2 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
US20140172415A1 (en) Apparatus, system, and method of providing sentiment analysis result based on text
CN105183717B (en) A kind of OSN user feeling analysis methods based on random forest and customer relationship
Perdana et al. Combining likes-retweet analysis and naive bayes classifier within twitter for sentiment analysis
US10671926B2 (en) Method and system for generating predictive models for scoring and prioritizing opportunities
US10706359B2 (en) Method and system for generating predictive models for scoring and prioritizing leads
CN111309864B (en) User group emotional tendency migration dynamic analysis method for microblog hot topics
CN112733042A (en) Recommendation information generation method, related device and computer program product
CN102402717A (en) Data analysis facility and method
CN116109373A (en) Recommendation method and device for financial products, electronic equipment and medium
CN113435627A (en) Work order track information-based electric power customer complaint prediction method and device
CN115063035A (en) Customer evaluation method, system, equipment and storage medium based on neural network
CN115396389A (en) Internet of things information technology customer service system based on emotion energy perception
WO2019242453A1 (en) Information processing method and device, storage medium, and electronic device
KR102078541B1 (en) Issue interest based news value evaluation apparatus and method, storage media storing the same
Ponelis et al. A descriptive framework of business intelligence derived from definitions by academics, practitioners and vendors
JP6178480B1 (en) DATA ANALYSIS SYSTEM, ITS CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM
KR20200143989A (en) The person in charge assignment system and method based on type classification for customer inquiries
CN112132368A (en) Information processing method and device, computing equipment and storage medium
CN114331572A (en) Potential customer determination method and device, electronic equipment and storage medium
CN109242690A (en) Finance product recommended method, device, computer equipment and readable storage medium storing program for executing
CN115080741A (en) Questionnaire survey analysis method, device, storage medium and equipment
KR20190094541A (en) Advertisement recommendation apparatus and method based on comments

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant