KR20170058785A - 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법 - Google Patents

자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법 Download PDF

Info

Publication number
KR20170058785A
KR20170058785A KR1020150162833A KR20150162833A KR20170058785A KR 20170058785 A KR20170058785 A KR 20170058785A KR 1020150162833 A KR1020150162833 A KR 1020150162833A KR 20150162833 A KR20150162833 A KR 20150162833A KR 20170058785 A KR20170058785 A KR 20170058785A
Authority
KR
South Korea
Prior art keywords
article
data
generating
sentence
event
Prior art date
Application number
KR1020150162833A
Other languages
English (en)
Other versions
KR101753762B1 (ko
Inventor
이준환
김동환
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020150162833A priority Critical patent/KR101753762B1/ko
Publication of KR20170058785A publication Critical patent/KR20170058785A/ko
Application granted granted Critical
Publication of KR101753762B1 publication Critical patent/KR101753762B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06F17/21
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/101Collaborative creation, e.g. joint development of products or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 기사가 만들어지는데 필요한 모든 판단을 기계가 대체함으로써 완벽하게 자동화된 기사 생성 시스템 및 기사 생성 시스템이 수행하는 기사 생성 방법을 구현하고자 하는 것으로서, 기사 생성 시스템이 데이터를 수집하여 하나 이상의 이벤트를 추출하는 단계, 추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하고 선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기(mood)를 결정하는 단계 및 결정된 기사의 분위기에 기초하여 기사를 생성하는 단계를 포함함으로써 자동으로 기사를 생성하는 방법에 관한 것이다.

Description

자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법 {Robot Journalism Method and System for Automatic Article Generation}
본 발명은 데이터를 통해 자동으로 기사를 생성하기 위한 로봇 저널리즘 시스템 및 방법에 관한 것이며, 보다 구체적으로 미디어 산업 분야와 일반 정보통신 분야에 폭넓게 활용될 수 있는 기사 생성 방법 및 기사 생성 시스템에 관한 것이다.
과거에는 모든 데이터를 사람이 직접 모으고, 판단하고, 글로 만들어서 구독자에게 배포하는 과정으로 저널리즘이 이루어졌다. 여기에 컴퓨터의 보조적인 활용이 가능할 뿐이었다.
최근에는 인터넷 언론사 등 언론 매체의 폭발적인 증가로 언론사 간의 경쟁이 치열해지고 있다. 때문에 언론사로서는 보다 빠르고 정확하게 정보를 생성해야 하면서도, 언론사의 규모는 줄여야 하는 상황에 처하게 되었다. 따라서 적은 인력으로도 보다 생산적인 업무를 가능하게 도와주는 로봇 저널리즘 프레임워크의 필요성이 점점 커지고 있다.
기존에는 이미 작성되어 있는 여러 언론사의 신문 기사를 그대로 옮겨와 배치를 조정하는 수준의 기술이 존재하였다. 본 발명은 여기에서 더 나아가 기사가 만들어지는데 필요한 모든 판단을 기계가 대체함으로써 완벽하게 자동화된 뉴스 기사 생성 시스템을 구현하고자 한다.
한편, 전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 발명의 일실시예는 기사를 생성함에 있어서 분위기(mood)를 적용함으로써 단순한 정보 전달 이상의 풍성한 기사를 제공하고자 하는 데에 목적이 있다.
또한, 본 발명의 일실시예는 데이터를 수집하고 처리하여 기사를 발행함에 있어서 속도 경쟁에서의 우위를 선점하는 데에 목적이 있다.
또한, 본 발명의 일실시예는 저널리즘에 있어서 사람이 처리해야 하는 반복적인 업무를 기계가 대신 수행함으로써 인력과 시간을 절약하는 데에 목적이 있다.
또한, 본 발명의 일실시예는 구독자에게 개인화된 콘텐츠를 제공하는 데에 목적이 있다.
또한, 본 발명의 일실시예는 기사를 생성하는 과정에서 사용자가 사용하고 있는 기기(device)에 따라 정보의 길이와 종류를 다르게 함으로써 사용자의 상황과 환경에 맞는 내러티브를 제공하는 데에 목적이 있다.
또한, 본 발명의 일실시예는 뉴스 기사를 국문뿐 아니라 영어, 중국어, 일어 등의 외국어를 포함한 다양한 언어로 표현하고자 하는 데에 목적이 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면은, 기사 생성 시스템이 수행하는 기사 생성 방법으로서, 상기 기사 생성 시스템이 데이터를 수집하는 단계, 수집한 데이터로부터 하나 이상의 이벤트를 추출하는 단계, 추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하는 단계, 선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기(mood)를 결정하는 단계 및 결정된 기사의 분위기에 기초하여 기사를 생성하는 단계를 포함할 수 있다.
본 발명의 제 2 측면에 따르면, 기사 생성 시스템은 데이터 크롤링 알고리즘을 통해 데이터를 수집하는 데이터 수집부, 수집한 데이터로부터 이벤트를 추출하는 이벤트 추출부, 추출한 이벤트에 가중치를 부여하여 중요 이벤트를 선정하는 이벤트 선정부, 선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기를 결정하는 분위기 결정부 및 결정된 기사의 분위기를 기초로 기사를 생성하는 기사 생성부를 포함할 수 있다.
또한, 본 발명의 제 3 측면에 따르면, 기사 생성 방법을 수행하기 위해 기록매체에 저장된 컴퓨터 프로그램으로서, 데이터를 수집하는 단계, 수집한 데이터로부터 하나 이상의 이벤트를 추출하는 단계, 추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하는 단계, 선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기를 결정하는 단계 및 결정된 기사의 분위기에 기초하여 기사를 생성하는 단계를 수행하기 위한 컴퓨터 프로그램을 개시한다.
또한, 본 발명의 제 4 측면에 따르면, 기사 생성 방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한 기록매체로서, 데이터를 수집하는 단계, 수집한 데이터로부터 하나 이상의 이벤트를 추출하는 단계, 추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하는 단계, 선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기를 결정하는 단계 및 결정된 기사의 분위기에 기초하여 기사를 생성하는 단계를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록매체를 개시한다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명의 일실시예는 기사를 생성함에 있어서 분위기(mood)를 적용함으로써 단순한 정보 전달 이상의 풍성한 기사를 구독자에게 제공할 수 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명의 일실시예는 데이터의 수집과 처리를 자동으로 수행하고, 인간의 개입 없이 기사의 발행까지 수행함으로써 속도 경쟁에서 우위를 선점할 수 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명의 일실시예는 사람이 처리해야 하는 반복적인 업무를 기계가 대신 수행함으로써 인력과 시간을 절약할 수 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 개인의 관심과 취향을 바탕으로 맞춤형 정보를 생성함으로써 구독자에게 개인화된 콘텐츠를 제공할 수 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 기사를 생성하는 과정에서 사용자가 사용하고 있는 기기에 따라 정보의 길이와 종류를 다르게 함으로써 사용자의 상황과 환경에 맞는 내러티브를 생성할 수 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 기사를 국문뿐 아니라 영어, 중국어, 일어 등 외국어를 포함한 다양한 언어로 표현함으로써 국제화된 저널리즘을 수행할 수 있다.
한편, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일실시예에 따른 자동화된 저널리즘 환경을 도시한 구성도이다.
도 2는 본 발명의 일실시예에 따른 기사 생성 시스템을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 기사 생성 방법을 도시한 순서도이다.
도 4 및 도 5는 본 발명의 일실시예에 따른 기사 생성 방법을 설명하기 위한 예시도이다.
도 6은 본 발명, 기사 생성 방법의 일실시예에 따른 순서도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
다만 이를 설명하기에 앞서, 아래에서 사용되는 용어들의 의미를 먼저 정의한다.
저널리즘이란, 대중에게 시사적인 정보와 의견을 제공하는 활동을 포함하여, 매스미디어를 통하여 정보 및 오락을 제공하는 활동을 폭넓게 이른다. 최근 들어서는, 각종 정보를 담고 있는 전자문서를 네트워크를 통해 배포하는 전자 저널리즘이 활성화되고 있다.
본 발명의 일실시예로서 구현하고자 하는 기사 생성 방법은, 컴퓨터 알고리즘에 의해 자동으로 수행되는 저널리즘을 말한다. 기사 생성 방법의 각 단계에 의하면, 기사 작성에 필요한 데이터의 수집과 분석, 수집한 데이터로부터 이벤트의 추출, 추출한 이벤트에 대한 기사 분위기의 결정 및 기사 생성에 이르기까지의 과정을 포함하는 언론 행위를 컴퓨터 알고리즘을 통해 자동으로 수행할 수 있으며, 이를 구현할 수 있는 장치를 기사 생성 시스템(100)이라 한다.
또한, 본 발명의 일실시예로서, 기사 생성 시스템(100), 기사 생성 시스템(100)이 정보 데이터를 수집할 수 있는 외부 DB(데이터베이스)(200) 및 생성된 기사를 구독자에게 배포할 수 있는 기사 제공 장치(300)를 포함하여 자동화된 저널리즘 환경(1000)이라 한다.
도 1은 본 발명의 일실시예에 따른 기사 생성 시스템(100)을 포함하는 자동화된 저널리즘 환경(1000)을 설명하기 위한 구성도이다.
자동화된 저널리즘 환경(1000)은 기사 생성 시스템(100), 외부 DB(외부 데이터베이스)(200) 및 기사 제공 장치(300)를 포함한다. 본 발명의 일실시예로서, 외부 DB(200)는 기사 생성 시스템(100)과 네트워크(N1)로 연결된 정보 제공 수단으로서, 기사 생성 시스템(100)이 정보를 수집할 수 있는 웹상의 모든 정보 제공 수단을 포함할 수 있다.
본 발명의 일실시예로서, 기사 제공 장치(300)는 기사 생성 시스템(100)이 생성한 기사를 구독자에게 배포할 수 있는 장치로서, 기사 생성 시스템(100)과 네트워크(N2)로 연결되어 정보를 송수신한다. 예를 들어, 기사 제공 장치(300)는 전자문서를 출력할 수 있는 단말을 포함할 수 있다.
단말은 네트워크를 통해 원격지의 서버에 접속하거나, 타 단말 및 서버와 연결 가능한 컴퓨터나 휴대용 단말기, 텔레비전, 웨어러블 디바이스(Wearable Device) 등으로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop)등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant),GSM(Global System for Mobile communications), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet), 스마트폰(Smart Phone), 모바일 WiMAX(Mobile Worldwide Interoperability for Microwave Access) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, 텔레비전은 IPTV(Internet Protocol Television), 인터넷 TV(Internet Television), 지상파 TV, 케이블 TV 등을 포함할 수 있다. 나아가 웨어러블 디바이스는 예를 들어, 시계, 안경, 액세서리, 의복, 신발 등 인체에 직접 착용 가능한 타입의 정보처리장치로서, 직접 또는 다른 정보처리장치를 통해 네트워크를 경유하여 원격지의 서버에 접속하거나 타 단말과 연결될 수 있다.
본 발명의 또다른 일실시예로서, 기사 제공 장치(300)는 기사를 유체물로 발행하기 위한 장치일 수 있다. 예를 들면, 기사 제공 장치(300)는 종이 신문을 발행하는 장치일 수 있다.
본 발명의 일실시예로서, 기사 생성 시스템(100)과 외부 DB(200) 사이를 연결하는 네트워크(N1)와 기사 생성 시스템(100)과 기사 제공 장치(300) 사이를 연결하는 네트워크(N2)는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 부가가치 통신망(Value Added Network; VAN), 개인 근거리 무선통신(Personal Area Network; PAN), 이동 통신망(mobile radio communication network), Wibro(Wireless Broadband Internet), Mobile WiMAX, HSDPA(High Speed Downlink Packet Access) 또는 위성 통신망 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.
본 발명의 일실시예로서, 자동화된 저널리즘 환경(1000)의 기사 생성 시스템(100)과 외부 DB(200) 사이를 연결하는 네트워크(N1)와, 기사 생성 시스템(100)과 기사 제공 장치(300) 사이를 연결하는 네트워크(N2)는 서로 동종이거나 이종일 수 있다. 즉, 기사 생성 시스템(100)과 외부 DB(200) 사이를 연결하는 네트워크(N1)이 광역통신망에 연결되어 있을 때, 기사 생성 시스템(100)과 기사 제공 장치(300) 사이를 연결하는 네트워크(N2)는 인트라넷일 수 있다. 또는 그 반대일 수 있다.
한편, 도 2는 본 발명의 일실시예에 따른 기사 생성 시스템(100)을 설명하기 위한 구성도이다.
본 발명의 일실시예로서, 기사 생성 시스템(100)은 데이터 수집부(101), 이벤트 추출부(102), 이벤트 선정부(103), 분위기 결정부(104) 및 기사 생성부(105)를 포함할 수 있다. 또한, 본 발명의 일실시예로서, 기사 생성 시스템(100)은 데이터베이스(106), 개인 설정부(107) 및 기사 배포부(108)를 더 포함할 수 있으며, 기사 생성 시스템(100)에 포함된 각 구성이 서로 유관하게 작용할 수 있도록 기능하는 제어부(109)를 포함할 수 있다.
본 발명의 일실시예로서, 데이터 수집부(101)는 데이터 수집 알고리즘을 통해 데이터를 수집할 수 있다. 예를 들어, 데이터 수집부(101)는 네트워크(N1)를 통해 외부 DB(200)에서 데이터를 크롤링할 수 있다.
본 발명의 일실시예로서, 데이터 수집부(101)는 수집한 데이터를 분석 가능한 데이터 형태로 변환할 수 있다. 예를 들면, 수집한 일련의 데이터를 의미 있는 토큰으로 분해하고, 분해된 토큰으로 이루어진 파스 트리를 만듦으로써 수집한 데이터를 파싱할 수 있다.
본 발명의 일실시예로서, 이벤트 추출부(102)는 데이터 수집부(101)가 수집한 데이터로부터 하나 이상의 이벤트를 추출할 수 있다. 이벤트 추출부(102)는 수집한 데이터를 해석 규칙에 따라 사건 맥락에 맞는 이벤트로 재구성할 수 있다.
본 발명의 일실시예로서, 이벤트 선정부(103)는 이벤트 추출부(102)가 추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정할 수 있다.
다음은 가중치를 연산하는 본 발명의 일실시예이다. 이벤트 선정부(103)는 추출된 이벤트에 포함된 단어에 대하여 가중치를 부여할 수 있다. 단어에 대한 가중치는 동의어를 포함하는 동일 단어의 반복값, 단어를 수사하는 형용사값 및 단어가 포함된 문장의 기사 전체에서의 위치값 중 적어도 하나를 연산하여 가중치를 결정할 수 있다.
본 발명의 일실시예로서, 반복값은 동의어를 포함하는 동일 단어의 반복 횟수로 연산할 수 있으며, 형용사값은 단어를 수사하는 형용사의 개수 및 형용사의 강도로 연산할 수 있다. 이를 위해 데이터베이스(106)는 형용사의 강도에 따른 값을 각 형용사와 매칭하여 저장할 수 있다.
본 발명의 일실시예로서, 문장의 위치값은 역피라미드형 기사 작성 규칙에 따라 연산할 수 있다. 역피라미드형 기사 작성 규칙에 따르면, 기자는 전달하고자 하는 뉴스 정보 또는 사실을 중요도의 역순으로 기사 내에 배치한다. 따라서 크롤링한 데이터가 신문 기사일 경우, 가중치를 연산하고자 하는 단어가 포함된 문장이 기사 전체에서 뒤쪽에 위치할수록 높은 가중치를 부여할 수 있다.
가중치를 연산하는 또 다른 실시예로서, 본 발명, 기사 생성 시스템(100)은 기사의 구독자로부터 관심 및 취향 중 적어도 하나에 대응되는 개인 설정 데이터를 입력 받는 개인 설정부(107)를 더 포함할 수 있다. 이벤트 선정부(103)는 개인 설정부(107)를 통해 입력 받은 개인 설정 데이터에 대응되는 연관어를 기준으로 가중치를 연산할 수 있다.
가중치를 연산하는 또 다른 실시예로서, 기사 생성 시스템(100)은 시계열 데이터의 피크를 중요 이벤트로 간주할 수 있다. 예를 들면, 추출된 이벤트 관련 데이터를 시점 별로 분류하여 각 시점의 데이터량에 따라 가중치를 부여하거나, 각 시점의 데이터 증가량에 따라 가중치를 부여할 수 있다. 이와 같은 방법에 따라 추출된 이벤트에 관련된 이벤트 중 높은 가중치를 부여한 이벤트가 중요 이벤트로 선정될 수 있다.
본 발명의 일실시예로서, 이벤트 선정부(103)는 위의 실시예를 포함하는 연산 방법에 의해 연산한 가중치를 각각의 이벤트의 가중치 점수로서 계산하여, 각각의 이벤트에 대한 가중치 점수를 기준으로 적어도 하나의 중요 이벤트를 선정할 수 있다.
본 발명의 일실시예로서, 추출된 하나 이상의 이벤트에 대한 가중치 점수는 이벤트 데이터가 포함하는 단어 혹은 문장에 대응되는 가중치의 총점 또는 평균점을 이벤트에 대한 가중치 점수로 계산할 수 있다.
한편, 본 발명의 일실시예로서, 분위기 결정부(104)는 이벤트 선정부(103)가 선정한 중요 이벤트의 데이터를 해석하여 기사의 분위기(mood:무드)를 결정할 수 있다.
본 발명의 일실시예로서, 분위기 결정부(104)는 중요 이벤트를 해석하는 과정에서 중요 이벤트의 맥락 정보를 추출할 수 있다. 맥락 정보란, 가중치를 부여하는 과정에서 도출된 중요 이벤트와 중요 이벤트에 연관된 여러 상황들의 관계를 고려한 정보로서, 이를 토대로 전체 사건의 분위기를 설정할 수 있다.
예를 들어, 특정 사건이 자주 발생하면 “습관적”인 경향을 보인다고 말하고, 거의 발생하지 않는 일이 발생하면 “놀랍게도”라는 수식어가 붙는다. 이 경우, “습관적” 또는 ”놀랍게도”라는 표현을 맥락 정보로서 추출할 수 있다. 또는, 중요 이벤트와 중요 이벤트에 연관된 여러 상황들의 관계를 고려하여 특정 이벤트가 자주 일어나는 경우 “습관적”이라는 맥락 정보를 분석해내거나 거의 발생하지 않는 일인 경우 “놀랍게도”라는 맥락 정보를 분석해낼 수 있다.
본 발명의 또 다른 일실시예로서, 소셜 데이터를 분석하여 맥락 정보를 파악할 수 있다. 예를 들어, 소셜 미디어에서 특정 경기가 언급된 데이터를 분석하여 가장 많은 활동이 포착되는 시간 대를 분석하고, 이를 통해 경기의 하이라이트 구간을 찾아낼 수 있다. 또는, 드라마를 보면서 시청자들이 남기는 게시글을 분석해 영상에 등장하는 인물과 등장 시점을 찾아낼 수 있다. 즉, 중요 이벤트와 관련된 소셜 미디어 데이터에 대하여 정량적 분석 및 정성적 분석 중 적어도 하나를 실시하여 맥락 정보를 분석해낼 수 있다. 이 때, 정량적 분석은 소셜 미디어 데이터량을 분석하는 것을 포함할 수 있으며, 정성적 분석은 소셜 미디어 데이터의 발생의 추이, 발생 시간대 또는 데이터가 최대량으로 발생한 시간대 등에 대한 분석을 포함할 수 있다.
또 다른 예로서, 야구 경기 기사의 경우, 야구 경기에서 홈팀이 원정팀에 승리한 것을 중요 이벤트로 선정하고, 중요 이벤트와 연관된 여러 상황 중 하나로서 홈팀이 해당 경기 전에 세 경기 연속 패한 것을 맥락 정보로 추출할 수 있다. 이 때, 분위기 결정부(104)는 “3연패 끝에 값진 승리”와 같이 분위기를 설정할 수 있다.
본 발명의 일실시예로서, 분위기 결정부(104)는 맥락 정보 분석에 있어서 구체적인 조건을 미리 설정해둘 수 있다. 예를 들어, 야구 경기 기사의 경우, 경기 결과가 10점 이상의 큰 점수차를 맥락 정보로 분석했을 때, “대승”이라는 분위기를 결정할 수 있고, 근소한 점수 차를 맥락 정보로 분석했을 때, “박빙의 승리”라는 분위기를 결정할 수 있다. 즉, 홈팀이 원정팀에 승리한 사건이 중요 이벤트로 선정된 경우 위의 분위기를 적용하게 되면, “홈팀 대승” 또는 “홈팀 박빙의 승리”라는 관점이 설정될 수 있다. 즉, 가장 중요한 이벤트를 중심으로 기사의 분위기가 결정되고, 이를 바탕으로 뉴스 기사의 전체적인 논조가 결정된다.
본 발명의 일실시예로서, 분위기 결정부(104)는 중요 이벤트의 가중치 점수에 따라 분위기의 경중 또는 고저를 결정할 수 있다. 이 때, 데이터베이스(106)에 저장된 형용사의 강도에 따라 분위기를 나타내는 형용사를 선택할 수 있다.
본 발명의 실시예와 같이, 분위기 결정부(104)에서 분석해낸 맥락 정보와 중요 이벤트의 가중치 점수는 기사 전체를 관통하는 일관된 논조 또는 관점을 만들어낸다. 특정 논조 또는 관점에서 사건을 기술함으로써 이야기를 보다 풍성하게 전달 할 수 있으며, 분위기가 가미된 기사를 생성함으로써 이벤트를 바라보는 관점을 구독자에게 제공할 수 있다. 관점은 기사의 전체적인 분위기를 정하는 중요한 기준점으로, 관점에 따라 같은 사건에 대해서 긍정적으로 기술하거나 또는 부정적으로 기술하게 될 수 있다.
즉, 본 발명의 일실시예로서, 기사 생성부(105)는 분위기 결정부(104)가 결정한 기사의 분위기에 기초하여 기사를 생성할 수 있다. 기사 생성부(105)는 수집되고 분석 가능한 형태로 변환된 데이터, 가중치 점수가 부여된 중요 이벤트 및 이벤트에 대하여 결정된 분위기 중 적어도 하나를 포함하는 데이터와 데이터에 대한 해석을 종합하여 실제 기사를 생성할 수 있다.
본 발명의 일실시예로서, 기사 생성부(105)는 문장 템플릿을 끌어다 쓰는 방식으로 기사를 생성할 수 있다. 즉, 여러 문장을 만들어 둔 뒤, 상황과 맥락에 따라 문장을 선택하는 방식으로 기사를 작성할 수 있다. 이런 문장들은 일반적인 기사 구성 형식에 따르는 템플릿의 개념으로 생각할 수 있다.
본 발명의 일실시예로서, 문장 템플릿은 주어와 목적어 등을 비워둔 문장일 수 있으며, 기사 생성부(105)는, 문장 템플릿과 중요 이벤트의 데이터를 결합하는 방식으로 기사를 생성할 수 있다. 예를 들어, 스포츠 뉴스의 경우, “ㅇㅇㅇ가 ㅇ루 주자를 불러들이는 안타를 쳐서 ㅇ점을 냈다”라는 문장 템플릿을 만들어 둔다면 추출된 데이터를 활용해 빈칸을 채울 수 있게 된다. 이 예문의 경우는 안타를 친 경우의 예시이고, 홈런이나 밀어내기 득점과 같은 경우 등 상황에 따른 다양한 문장 템플릿을 만들어 적용할 수 있다.
본 발명의 일실시예로서, 문장 템플릿에 결정한 분위기가 적용되면 '안타깝게도' 점수를 내지 못했다거나 '시원한 2루타'와 같은 표현이 만들어질 수 있다. 분위기는 분위기 결정부(104)의 데이터 처리에서 판단되며, 기사 생성부(105)는 이와 같이 분위기가 적용된 완성 문장을 생성하고, 생성된 완성 문장을 중요 이벤트가 발생하는 상황에 따라 탄력적으로 선택해 배열하게 된다. 예를 들어, 완성 문장의 배열은 중요 이벤트의 가중치 점수에 따라 배열할 수 있다. 역피라미드형 기사 작성법에 따라 가중치 점수가 높은 중요 이벤트에 대응되는 완성 문장을 기사의 후반에 배치할 수 있다. 또는, 내러티브 저널리즘 방식에 따라 기사를 작성할 수 있다. 내러티브 저널리즘 방식에 따라 기사를 작성할 때에는 통계적인 정보가 포함된 문장보다는 인물을 중심으로 서술한 문장을 중점적으로 배열할 수 있다. 또는 대화 중심으로 서술한 문장을 중점적으로 배열할 수 있다. 이처럼 실제로 풍성한 이야기를 전하기 위한 노력은 기사 생성부(105)에서 발현되게 된다.
본 발명의 일실시예로서, 기사 생성부(105)가 완성 문장을 배열하는 방법을 실시하기 위해 다음의 알고리즘을 적용할 수 있다. 예를 들어, 문장 템플릿이 기본적으로 가지고 있는 고정된 중요도, 선정된 중요 이벤트 및 결정된 분위기에 따른 완성 문장의 동적인 중요도가 각 문장마다 계산되며, 연산된 동적 중요도가 높은 완성 문장을 기준으로 문장을 배열할 수 있다.
본 발명의 일실시예로서, 고정된 중요도는 각 문장 템플릿마다 미리 설정하여 데이터베이스(106)에 저장되어 있을 수 있다. 동적인 중요도는 고정된 중요도뿐만 아니라 이벤트에 부여된 가중치 점수에 따라 연산할 수 있다.
본 발명의 일실시예로서, 기사 생성부(105)는, 기사 제공 장치(300)에 따라 기사의 길이 또는 종류를 조절할 수 있다.
예를 들어, 기사의 유형에 따라 포함되는 문장 템플릿의 숫자와 비율을 달리하는 방식으로 완성 문장의 생성에 있어 유연성을 지닐 수 있다. 즉, 속보 성 기사는 문장 템플릿의 수를 줄일 수 있다. 또는, PC용 웹사이트에 게재되는 기사는 화면이 작은 모바일단말용 웹사이트에 제공될 기사에 비해 더 많은 문장으로 생성되거나 더 긴 문장으로 생성될 수 있다. 이 경우 중요 이벤트의 숫자를 늘려 적절한 문장의 수를 판단하여 배정할 수 있다.
또한, 본 발명의 일실시예로서, 기사 생성부(105)는, 기사의 길이 또는 종류를 조절하여 기사 제공 형태를 다양화할 수 있다. 예를 들어, 간략한 기사와 자세한 기사를 함께 생성할 수 있다. 간략한 기사를 제공한 후 구독자로부터 기사의 어느 부분을 선택하는 입력을 수신하는 경우 자세한 기사를 제공하는 방식으로 기사 제공 형태를 다양화할 수 있다. 또 다른 예로서, 동영상 자료와 같은 멀티미디어 정보와 함께 기사를 제공하는 경우 기사 제공 형태를 다양화할 수 있다. 만약, 동영상 재생 중 어느 시점에서 기사를 선택하는 사용자 입력이 수신된다면, 그 시점에 관련된 기사를 제공할 수 있다. 여기에는 앞서 기재한 소셜 미디어 데이터를 분석하여 맥락 정보를 파악하는 방법이 이용될 수 있다. 예를 들어, 드라마 방영 시간대에 생성된 소셜 미디어 데이터를 분석하여 드라마 방영 시간대별로 기사를 생성할 수 있다.
또한, 컴퓨터가 문장을 작성했다는 느낌을 줄이기 위해서는, 동일한 문장의 반복을 줄이는 편이 좋다. 따라서 같은 상황에 대한 문장 템플릿은 가능한 한 많을수록 유리하다. 본 발명의 일실시예로서, 각각의 문장 템플릿은 여러 속성 값을 가지며, 기사 작성 알고리즘은 문장 템플릿이 가진 속성 값과 주어진 데이터 간의 매칭 스코어를 계산해 상황에 가장 잘 맞는 문장 템플릿을 선택할 수 있다.
본 발명의 일실시예로서, 기사 생성부(105)는 국문 및 외국어 중 적어도 하나로 기사를 생성할 수 있다. 외국어는 예를 들어, 일어, 중어 및 영어 중 하나 이상을 포함할 수 있다.
본 발명의 일실시예로서, 기사 생성 시스템(100)은 생성된 기사를 기사 구독자에게 배포하는 기사 배포부(108)를 더 포함할 수 있다. 기사 배포부(108)는 네트워크를 통해 기사 제공 장치(300)에 생성된 기사를 제공할 수 있다.
본 발명의 일실시예로서, 기사 생성 시스템(100)은 데이터베이스(106)를 더 포함할 수 있다. 데이터베이스(106)는 데이터 수집부(101)가 수집한 데이터 및 분석 가능한 형태로 변환한 데이터를 저장할 수 있으며, 기사 구독자로부터 입력 받은 개인 설정 데이터를 저장할 수 있다. 또한, 문장 템플릿과 각 문장 템플릿에 대해 설정된 고정 중요도, 기타 기사 생성 시스템(100)이 기사를 생성함에 있어서 필요한 각종 데이터를 저장할 수 있다.
한편, 도 3에 도시된 실시예에 따른 기사 생성 방법은 도 2에 도시된 기사 생성 시스템(100)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하에서 생략된 내용이라고 하더라도 도 2에 도시된 기사 생성 시스템(100)에 관하여 이상에서 기술한 내용은 도 3에 도시된 실시예에 따른 기사 생성 방법에도 적용될 수 있다.
본 발명의 일실시예에 따르면, 기사 생성 시스템(100)이 수행하는 기사 생성 방법은 데이터를 수집하는 단계(S101)를 포함할 수 있다. 데이터를 수집하는 S101단계는, 데이터를 수집해 분석 가능한 형태로 변환하는 단계 및 분석 가능한 형태로 변환된 데이터를 데이터베이스(106)에 저장하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따르면, 기사 생성 방법은 수집한 데이터로부터 하나 이상의 이벤트를 추출하는 단계(S102)를 더 포함할 수 있다. 이벤트를 추출하는 S102단계는 수집한 데이터를 해석 규칙에 따라 사건 맥락에 맞는 이벤트로 재구성하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따르면, 기사 생성 방법은 추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하는 단계(S103)를 더 포함할 수 있다.
본 발명의 일실시예로서, 가중치는 동의어를 포함하는 동일 단어의 반복값, 수사하는 형용사값 및 기사 전체에서 문장의 위치값 중 적어도 하나를 연산하여 결정할 수 있다. 또 다른 실시예로서, 가중치는 개인 설정 데이터에 대응되는 연관어를 기준으로 연산할 수 있다. 개인 설정 데이터는 기사의 구독자의 관심 및 취향 중 적어도 하나에 대응되는 데이터로서 사용자로부터 입력받을 수 있다. 또 다른 실시예로서, 가중치는 소셜 미디어 데이터의 분석에 의해 이루어질 수 있다.
본 발명의 일실시예에 따르면, 기사 생성 방법은 선정된 중요 이벤트의 데이터를 해석하여 기사의 분위기를 결정하는 단계(S104)를 더 포함할 수 있다.
본 발명의 일실시예로서, 데이터의 해석은 중요 이벤트에서 맥락 정보를 추출함으로써 이루어질 수 있다. 기사의 분위기를 결정하는 단계는 선정된 중요 이벤트의 가중치 점수와 추출된 중요 이벤트 관련 맥락 정보 중 하나 이상을 분석하는 단계를 포함할 수 있다. 중요 이벤트의 가중치 점수와 추출된 중요 이벤트 관련 맥락 정보 중 하나 이상을 분석하여 중요 이벤트를 중심으로 기사의 분위기를 결정하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따르면, 기사 생성 방법은 결정된 기사의 분위기를 기초로 기사를 생성하는 단계(S105)를 더 포함할 수 있다. 기사를 생성하는 S105단계는 선정된 중요 이벤트에 대응되는 하나 이상의 문장 템플릿을 선택하는 단계를 포함할 수 있다. 문장 템플릿을 선택하는 단계는, 문장 템플릿의 속성값과 관련 데이터 간의 매칭 스코어를 연산함으로써 문장 템플릿을 선택할 수 있다.
본 발명의 일실시예로서 기사를 생성하는 S105단계는 선택된 문장 템플릿과 중요 이벤트의 데이터를 결합하는 단계, 중요 이벤트의 데이터가 결합된 문장 템플릿에 결정된 상기 기사의 분위기를 적용하여 완성 문장을 생성하는 단계를 포함할 수 있다. 기사를 생성하는 S105단계는 생성된 완성 문장을 가중치 점수에 따라 배열하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일실시예로서, 완성 문장을 배열하는 단계는, 문장 템플릿의 고정 중요도, 선정된 중요 이벤트 및 결정된 분위기에 따른 완성 문장의 동적 중요도를 연산하는 단계 및 연산된 동적 중요도가 높은 완성 문장을 기준으로 문장을 배열하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따르면, 기사를 생성하는 S105단계는 기사 제공 장치(300)에 따라 기사의 길이 및 종류 중 적어도 하나를 다르게 생성할 수 있으며, 국문 및 외국어 중 적어도 하나로 기사를 생성할 수 있다.
본 발명의 일실시예로서, 기사 생성 방법은 위와 같은 각 단계로 생성된 기사를 구독자에게 배포하는 단계(S106)를 더 포함할 수 있다. 본 발명의 일실시예로서, 구독자에게 배포하는 단계는 생성된 기사를 포함하는 전자문서를 출력할 수 있는 단말을 통해 이루어질 수 있다. 또는, 기사를 종이 신문 등 유체물로 발행하여 구독자에게 배포하는 단계를 포함할 수 있다.
한편, 도 4는 본 발명의 일실시예를 도시한 예시도로서, 기사 생성 시스템(100)이 생성한 프로 야구 경기 결과에 대한 기사(400)의 실제 사례이며, 도 5는 야구 경기에 대하여 문자 중계가 이루어질 때, 문자 중계의 JSON데이터(500)의 예시도이다.
본 발명의 일실시예로서, 기사 생성 시스템(100)은 프로 야구 경기의 문자 중계 데이터(500)를 불러들여 실제로 구독자에게 제공되는 도 4와 같은 뉴스 기사를 생성할 수 있다.
도 4에 도시된 프로 야구 경기 결과에 대한 기사(400)는 2015년 5월 12일, 넥센과 롯데의 경기에 대한 기사이다. 이처럼 본 발명, 기사 생성 시스템(100)이 수행하는 기사 생성 방법은 온라인에서 수집한 프로 야구 정보를 토대로 완전히 새로운 기사를 생성해낼 수 있다.
본 발명의 일실시예에 따른 기사 생성 방법에 의하면 기사 생성 시스템(100)은 프로 야구를 포함한 스포츠 기사와 주식 시황 정보를 포함하는 금융 관련 기사 등 다양한 저널리즘 분야에서 저널리스트의 역할을 수행할 수 있다.
이 밖에도 본 발명의 일실시예에 따른 기사 생성 시스템(100)은 정치, 경제, 사회에 관련한 다양한 뉴스 기사를 생성할 수 있음은 물론이고, 기업의 재무재표를 바탕으로 작성되는 기업분석 보고서, 개인의 건강 기록을 사물인터넷(IoT) 기기로부터 얻어 건강 관련 리포트를 주기적으로 생성하고 상담해주는 지능형 시스템에 이르는 다양한 분야의 전자 문서 생성을 할 수 있다.
한편, 도 6은 본 발명, 기사 생성 방법의 일실시예에 따른 순서도이다. 본 발명의 일실시예에 따른 기사 생성 방법은, 데이터 수집, 이벤트 추출, 중요 이벤트 선별, 기사의 무드(Mood: 분위기) 결정, 기사 생성의 각 단계를 거칠 수 있으며, 이벤트 추출 단계와 중요 이벤트 선별 단계 사이에는 이벤트 스코어링(Event Scoring), 즉, 추출된 이벤트에 가중치 점수를 부여하는 단계를 더 포함할 수 있다. 또한, 중요 이벤트 선별과 기사의 무드 결정 단계 사이에는 맥락 정보의 고려 단계를 더 포함할 수 있으며, 이 단계에서 고려된 맥락 정보를 이용하여 기사의 무드를 결정할 수 있다.
도 3을 통해 설명된 실시예에 따른 기사 생성 방법은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
또한 본 발명의 일실시예에 따르는 기사 생성 방법은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 컴퓨터 프로그램(또는 컴퓨터 프로그램 제품)으로 구현될 수도 있다. 컴퓨터 프로그램은 프로세서에 의해 처리되는 프로그래밍 가능한 기계 명령어를 포함하고, 고레벨 프로그래밍 언어(High-level Programming Language), 객체 지향 프로그래밍 언어(Object-oriented Programming Language), 어셈블리 언어 또는 기계 언어 등으로 구현될 수 있다. 또한 컴퓨터 프로그램은 유형의 컴퓨터 판독가능 기록매체(예를 들어, 메모리, 하드디스크, 자기/광학 매체 또는 SSD(Solid-State Drive) 등)에 기록될 수 있다.
따라서 본 발명의 일실시예에 따르는 기사 생성 방법은 상술한 바와 같은 컴퓨터 프로그램이 컴퓨팅 장치에 의해 실행됨으로써 구현될 수 있다. 컴퓨팅 장치는 프로세서와, 메모리와, 저장 장치와, 메모리 및 고속 확장포트에 접속하고 있는 고속 인터페이스와, 저속 버스와 저장 장치에 접속하고 있는 저속 인터페이스 중 적어도 일부를 포함할 수 있다. 이러한 성분들 각각은 다양한 버스를 이용하여 서로 접속되어 있으며, 공통 머더보드에 탑재되거나 다른 적절한 방식으로 장착될 수 있다.
여기서 프로세서는 컴퓨팅 장치 내에서 명령어를 처리할 수 있는데, 이런 명령어로는, 예컨대 고속 인터페이스에 접속된 디스플레이처럼 외부 입력, 출력 장치상에 GUI(Graphic User Interface)를 제공하기 위한 그래픽 정보를 표시하기 위해 메모리나 저장 장치에 저장된 명령어를 들 수 있다. 다른 실시예로서, 다수의 프로세서 및(또는) 다수의 버스가 적절히 다수의 메모리 및 메모리 형태와 함께 이용될 수 있다. 또한 프로세서는 독립적인 다수의 아날로그 및(또는) 디지털 프로세서를 포함하는 칩들이 이루는 칩셋으로 구현될 수 있다.
또한 메모리는 컴퓨팅 장치 내에서 정보를 저장한다. 일례로, 메모리는 휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 다른 예로, 메모리는 비휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 또한 메모리는 예컨대, 자기 혹은 광 디스크와 같이 다른 형태의 컴퓨터 판독 가능한 매체일 수도 있다.
그리고 저장장치는 컴퓨팅 장치에게 대용량의 저장공간을 제공할 수 있다. 저장 장치는 컴퓨터 판독 가능한 매체이거나 이런 매체를 포함하는 구성일 수 있으며, 예를 들어 SAN(Storage Area Network) 내의 장치들이나 다른 구성도 포함할 수 있고, 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 혹은 테이프 장치, 플래시 메모리, 그와 유사한 다른 반도체 메모리 장치 혹은 장치 어레이일 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
1000: 자동화된 저널리즘 환경 N1, N2: 네트워크
100: 기사 생성 시스템 200: 외부 DB 300: 기사 제공 장치
101: 데이터 수집부 102: 이벤트 추출부 103: 이벤트 선정부
104: 분위기 결정부 105: 기사 생성부 106: 데이터베이스 107: 개인 설정부 108: 기사 배포부 109: 제어부

Claims (20)

  1. 기사 생성 시스템이 수행하는 기사 생성 방법에 있어서,
    데이터를 수집하는 단계;
    수집한 데이터로부터 하나 이상의 이벤트를 추출하는 단계;
    추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하는 단계;
    선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기(Mood)를 결정하는 단계; 및
    결정된 기사의 분위기에 기초하여 기사를 생성하는 단계를 포함하는, 기사 생성 방법.
  2. 제 1 항에 있어서,
    상기 데이터를 수집하는 단계는,
    데이터를 수집해 분석 가능한 형태로 변환하는 단계 및
    분석 가능한 형태로 변환된 데이터를 데이터베이스에 저장하는 단계를 더 포함하는, 기사 생성 방법.
  3. 제 1 항에 있어서,
    상기 가중치는,
    동의어를 포함하는 동일 단어의 반복값, 수사하는 형용사값 및 기사 전체에서의 문장의 위치값 중 적어도 하나를 연산하여 결정되는, 기사 생성 방법.
  4. 제 1 항에 있어서,
    상기 기사 생성 방법은,
    기사의 구독자로부터 관심 및 취향 중 적어도 하나에 대응되는 개인 설정 데이터를 입력 받는 단계를 더 포함하고,
    상기 가중치는,
    상기 개인 설정 데이터에 대응되는 연관어를 기준으로 연산되는, 기사 생성 방법.
  5. 제 1 항에 있어서,
    상기 데이터 해석은,
    상기 선정된 중요 이벤트의 맥락 정보를 추출함으로써 이루어지고,
    상기 기사의 분위기를 결정하는 단계는,
    상기 선정된 중요 이벤트의 가중치 점수 및 추출된 상기 맥락 정보 중 하나 이상을 분석하는 단계; 및
    상기 분석에 따라 기사의 분위기를 결정하는 단계를 포함하는, 기사 생성 방법.
  6. 제 1 항에 있어서,
    상기 기사를 생성하는 단계는,
    상기 선정된 중요 이벤트에 대응되는 하나 이상의 문장 템플릿을 선택하는 단계;
    선택된 문장 템플릿과 상기 중요 이벤트의 데이터를 결합하는 단계;
    상기 중요 이벤트의 데이터가 결합된 문장 템플릿에 결정된 상기 기사의 분위기를 적용하여 완성 문장을 생성하는 단계; 및
    상기 완성 문장을 배열하는 단계를 더 포함하는, 기사 생성 방법.
  7. 제 6 항에 있어서,
    상기 배열하는 단계는,
    상기 문장 템플릿의 고정 중요도, 상기 선정된 중요 이벤트 및 상기 결정된 분위기에 따른 완성 문장의 동적 중요도를 연산하는 단계; 및
    연산된 동적 중요도가 높은 완성 문장을 기준으로 완성 문장을 배열하는 단계를 포함하는, 기사 생성 방법.
  8. 제 1 항에 있어서,
    상기 기사를 생성하는 단계는,
    상기 기사 생성 시스템으로부터 생성된 기사를 구독자에게 제공하는 기사 제공 장치에 따라 기사의 길이 및 종류 중 적어도 하나를 다르게 생성하는, 기사 생성 방법.
  9. 제 1 항에 있어서,
    상기 기사를 생성하는 단계는,
    국문 및 외국어 중 적어도 하나로 기사를 생성하는, 기사 생성 방법.
  10. 기사 생성 시스템에 있어서,
    데이터를 수집하는 데이터 수집부;
    수집한 데이터로부터 하나 이상의 이벤트를 추출하는 이벤트 추출부;
    추출한 하나 이상의 이벤트에 가중치를 부여하여 적어도 하나의 중요 이벤트를 선정하는 이벤트 선정부;
    선정된 중요 이벤트의 데이터 해석을 통하여 기사의 분위기를 결정하는 분위기 결정부; 및
    결정된 기사의 분위기에 기초하여 기사를 생성하는 기사 생성부를 포함하는, 기사 생성 시스템.
  11. 제 10 항에 있어서,
    상기 기사 생성 시스템은,
    데이터베이스를 더 포함하고,
    상기 데이터 수집부는,
    데이터를 수집해 분석 가능한 형태로 변환하고, 분석 가능한 형태로 변환된 데이터를 상기 데이터베이스에 저장하는, 기사 생성 시스템.
  12. 제 10 항에 있어서,
    상기 이벤트 선정부는,
    동의어를 포함하는 동일 단어의 반복값, 수사하는 형용사값 및 기사 전체에서 문장의 위치값 중 적어도 하나를 연산하여 가중치를 결정하는, 기사 생성 시스템.
  13. 제 10 항에 있어서,
    상기 기사 생성 시스템은,
    기사의 구독자로부터 관심 및 취향 중 적어도 하나에 대응되는 개인 설정 데이터를 입력 받는 개인 설정부를 더 포함하고,
    상기 이벤트 선정부는,
    상기 개인 설정 데이터에 대응되는 연관어를 기준으로 가중치를 연산하는, 기사 생성 시스템.
  14. 제 10 항에 있어서,
    상기 분위기 결정부는,
    상기 선정된 중요 이벤트의 맥락 정보를 추출하고, 상기 중요 이벤트의 가중치 점수 및 추출된 상기 맥락 정보 중 하나 이상을 분석하여, 상기 중요 이벤트를 중심으로 기사의 분위기를 결정하는, 기사 생성 시스템.
  15. 제 10 항에 있어서,
    상기 기사 생성부는,
    상기 선정된 중요 이벤트에 대응되는 하나 이상의 문장 템플릿을 선택하여 상기 중요 이벤트의 데이터를 결합하고, 상기 기사의 분위기를 적용함으로써 완성 문장을 생성한 뒤, 상기 완성 문장을 배열하는, 기사 생성 시스템.
  16. 제 15 항에 있어서,
    상기 기사 생성부는,
    상기 완성 문장을 배열함에 있어서, 상기 선택된 문장 템플릿의 고정 중요도, 상기 선정된 중요 이벤트 및 상기 결정된 분위기에 따른 완성 문장의 동적 중요도를 연산하여, 연산된 동적 중요도가 높은 문장을 기준으로 완성 문장을 배열하는, 기사 생성 시스템.
  17. 제 10 항에 있어서,
    상기 기사 생성부는,
    상기 기사 생성 시스템으로부터 생성된 기사를 구독자에게 제공하는 기사 제공 장치에 따라 기사의 길이 및 종류 중 적어도 하나를 다르게 생성하는, 기사 생성 시스템.
  18. 제 10 항에 있어서,
    상기 기사 생성부는,
    국문 및 외국어 중 적어도 하나로 기사를 생성하는, 기사 생성 시스템.
  19. 제 1 항에 기재된 방법을 수행하기 위해 기록매체에 저장된 컴퓨터 프로그램.
  20. 제 1 항에 기재된 방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한 기록매체.
KR1020150162833A 2015-11-19 2015-11-19 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법 KR101753762B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150162833A KR101753762B1 (ko) 2015-11-19 2015-11-19 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150162833A KR101753762B1 (ko) 2015-11-19 2015-11-19 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20170058785A true KR20170058785A (ko) 2017-05-29
KR101753762B1 KR101753762B1 (ko) 2017-07-04

Family

ID=59053643

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150162833A KR101753762B1 (ko) 2015-11-19 2015-11-19 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101753762B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190081130A (ko) * 2017-12-29 2019-07-09 (주)엠로보 주식 기사 생성 장치 및 방법
KR102020012B1 (ko) 2018-06-08 2019-09-11 (주)에이피케이어플킹 빅데이터 분석 기반의 인공지능 실시간 스포츠 기사 자동 작성 시스템 및 방법
KR102026907B1 (ko) * 2019-04-29 2019-09-30 이원세 로봇 저널리즘 장치 및 방법
CN112232035A (zh) * 2019-07-15 2021-01-15 北京字节跳动网络技术有限公司 一种文章生成方法、装置、电子设备及存储介质
KR20220021520A (ko) * 2020-08-14 2022-02-22 김지완 맞춤형 정보 제공이 가능한 로봇기사 자동 생성 시스템
WO2024085718A1 (ko) * 2022-10-20 2024-04-25 주식회사 아이팩토리 문장 템플릿을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190068005A (ko) 2017-12-08 2019-06-18 (주)엠로보 로봇 저널리즘을 이용한 투자 정보 큐레이션 방법 및 장치
KR102214136B1 (ko) 2019-08-22 2021-02-09 백석대학교산학협력단 Sns 기반 상품 이미지 검색 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101377114B1 (ko) * 2012-10-11 2014-03-24 한양대학교 에리카산학협력단 뉴스 요약문 생성 시스템 및 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190081130A (ko) * 2017-12-29 2019-07-09 (주)엠로보 주식 기사 생성 장치 및 방법
KR102020012B1 (ko) 2018-06-08 2019-09-11 (주)에이피케이어플킹 빅데이터 분석 기반의 인공지능 실시간 스포츠 기사 자동 작성 시스템 및 방법
KR102026907B1 (ko) * 2019-04-29 2019-09-30 이원세 로봇 저널리즘 장치 및 방법
CN112232035A (zh) * 2019-07-15 2021-01-15 北京字节跳动网络技术有限公司 一种文章生成方法、装置、电子设备及存储介质
KR20220021520A (ko) * 2020-08-14 2022-02-22 김지완 맞춤형 정보 제공이 가능한 로봇기사 자동 생성 시스템
WO2024085718A1 (ko) * 2022-10-20 2024-04-25 주식회사 아이팩토리 문장 템플릿을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템

Also Published As

Publication number Publication date
KR101753762B1 (ko) 2017-07-04

Similar Documents

Publication Publication Date Title
KR101753762B1 (ko) 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
US10423664B2 (en) Method and system for providing recommended terms
US8725717B2 (en) System and method for identifying topics for short text communications
CN101000627B (zh) 一种相关信息的发布方法和装置
AU2017232912A1 (en) Method and apparatus for building prediction models from customer web logs
US20090063984A1 (en) Customized today module
CN104391999B (zh) 信息推荐方法和装置
WO2020088058A1 (zh) 生成信息的方法和装置
CN106354861A (zh) 电影标签自动标引方法及自动标引系统
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
CN106339398A (zh) 一种网页页面的预读取方法、装置及智能终端设备
US10019419B2 (en) Method, server, browser, and system for recommending text information
CN111479169A (zh) 一种视频评论显示方法、电子设备以及计算机存储介质
CN104090757A (zh) 针对浏览器的富媒体信息展示方法
CN103942328B (zh) 一种视频检索方法及视频装置
JP2022043273A (ja) 弾幕を生成する方法、装置、デバイス、記憶媒体およびコンピュータプログラム製品
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN104503988A (zh) 搜索方法及装置
KR101269205B1 (ko) 하나의 웹사이트 상에서의 다국어 정보 제공시스템
AU2016346740A1 (en) Internet content providing server and computer readable recording medium embodying same method
US20180047062A1 (en) Systems and methods for delivering relevant content
JP5988345B1 (ja) 評価装置、評価方法、評価プログラム、レコメンド装置、レコメンド方法およびレコメンドプログラム
CN105893584A (zh) 一种显示收藏夹网址标签的方法、客户端和系统
CN107085573A (zh) 热点信息的获取方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant