KR102159715B1

KR102159715B1 - Ai 헤드라인 뉴스

Info

Publication number: KR102159715B1
Application number: KR1020180119688A
Authority: KR
Inventors: 유봉석; 정은주; 최창렬; 윤정혜; 전중달; 전대원; 김재민; 김수향; 김혜진; 성현탁
Original assignee: 네이버 주식회사
Priority date: 2018-05-21
Filing date: 2018-10-08
Publication date: 2020-09-24
Also published as: KR20190132904A

Abstract

AI 헤드라인 뉴스가 개시된다. 일 실시예에 따른 서버에서 수행되는 뉴스 기사 자동화 방법은, 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계; 및 상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 단계를 포함할 수 있다.

Description

AI 헤드라인 뉴스{AI HEADLINE NEWS}

아래의 설명은 뉴스 기사를 자동화하는 기술에 관한 것이다.

종래의 뉴스정보 기술에서는 방송사에서 운영되는 방송서버가 대중을 위한 뉴스정보를 수집하여 정해진 시간마다 방송망을 통해 사용자 단말에 전송하고 있다. 사용자는 정해진 시간마다 방송서버로부터 뉴스정보를 제공받는다. 이때, 뉴스정보에 관한 사건 발생 시점과 사용자가 뉴스정보를 제공받는 시점 간에는 시간 차이가 발생하게 된다.

한편, 방송망이 아닌 인터넷 검색 엔진에서도 수집된 뉴스정보가 게시된다. 사용자는 게시된 뉴스정보를 제공받기 위해서, 직접 인터넷 사이트에 접속하여 해당 뉴스정보를 검색하여 확인할 수 있다. 인터넷 사이트들은 매일 많은 양의 뉴스들을 제공하고 있으며, 구독자가 관심을 가질만한 이슈가 되는 사건의 경우 대부분의 인터넷 사이트들은 해당 사건에 관련된 유사한 뉴스 기사를 제공한다.

이와 같이, 현재의 인터넷 사이트들은 이슈가 되는 사건에 대한 뉴스 기사를 중복적으로 게시하기 때문에 사용자가 이전에 습득하였던 정보와 유사한 뉴스 기사를 불필요하게 반복적으로 제공받게 되고, 새로운 뉴스를 제공받기 위하여 오랜 시간이 소요되는 불편을 겪는다. 이에, 이슈 별로 대표 기사를 선정하여 뉴스 기사를 자동화하는 기술이 요구된다.

인공지능에 기반하여 뉴스 기사를 자동화하는 방법 및 시스템을 제공할 수 있다.

컨텐츠들에 대한 클러스터링을 통하여 생성된 적어도 하나 이상의 클러스터를 분석하여 이슈별로 대표 기사를 선정하는 방법 및 시스템을 제공할 수 있다.

서버에서 수행되는 뉴스 기사 자동화 방법은, 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계; 및 상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 단계를 포함할 수 있다.

상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는, 상기 생성된 적어도 하나 이상의 클러스터에 대한 시간 정보를 고려한 기사량 또는 기사 분포를 포함하는 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 상기 적어도 하나 이상의 클러스터의 랭킹을 결정하는 단계를 포함할 수 있다.

상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는, 기사가 피딩된 시점으로부터의 지난 시간을 의미하는 기사 나이에 상대 구간을 적용하고, 상기 상대 구간에 존재하는 상기 적어도 하나 이상의 클러스터에 포함된 기사들의 분포에 기초하여 클러스터의 랭킹을 결정하기 위한 점수를 부여하는 단계를 포함할 수 있다.

상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는, 상기 기사가 피딩 시간을 기준으로 상기 상대 구간에 시간대별 가중치를 부여하는 단계를 포함할 수 있다.

상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는, 인공지능에 기반하여 상기 클러스터의 랭킹을 자동화하기 위한 사용자의 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 클러스터의 랭킹을 자동화하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위한 기사 점수를 계산하여 클러스터 내의 기사들에 대한 우선순위를 결정하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위하여 새로운 팩터를 추가하고, 상기 새로운 팩터를 포함하는 팩터들에 기초하여 계산된 기사 점수를 일정 범주 내의 값으로 산출하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위하여 설정된 팩터들에 대한 가중치를 0 내지 1 사이의 값으로 부여하고, 팩터들 각각에 대한 가점과 상기 팩터들에 대하여 부여된 각각의 가중치에 기초하여 계산을 수행함에 따라 기사 점수를 획득하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 클러스터링을 통하여 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 컨텐츠들의 특징을 분석하여 클러스터의 대표 기사를 선정하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 사용자의 기사 점수에 기초하여 상기 적어도 하나 이상의 클러스터의 각각으로부터 대표 기사를 다르게 추출하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반한 퀄리티 모델을 통하여 학습된 결과에 기초하여 대표 기사를 선정하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 클러스터들 각각에 포함된 기사들로부터 상기 기사들과 관련된 분석을 수행함에 따라 추출된 특징에 기반하여 정보량과 관련된 기사를 분류하고, 상기 기사들에 대한 피드백 특징을 추출하여 사용자와 관련된 기사를 예측하고, 상기 정보량과 관련된 기사 및 상기 사용자와 관련된 기사를 인공 신경망 기반하여 구성된 퀄리티 모델을 통하여 학습을 수행하는 단계를 포함할 수 있다.

상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는, 상기 퀄리티 모델을 통하여 학습된 결과에 기초하여 순위화된 상기 클러스터들 각각에 포함된 기사들을 정렬함에 따라 상기 클러스터들 각각에 포함된 기사들로부터 각각의 대표 기사를 선정하는 단계를 포함할 수 있다.

서버에 의해 수행되는 뉴스 기사를 자동화하는 방법을 실행시키기 위하여 컴퓨터 판독 가능한 저장매체에 저장된 컴퓨터 프로그램은, 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계; 및 상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 단계를 포함할 수 있다.

뉴스 기사를 자동화하는 서버는, 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 클러스터 생성부; 및 상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 랭킹 자동화부를 포함할 수 있다.

상기 랭킹 자동화부는, 상기 생성된 적어도 하나 이상의 클러스터에 대한 시간 정보를 고려한 기사량 또는 기사 분포를 포함하는 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 상기 적어도 하나 이상의 클러스터의 랭킹을 결정할 수 있다.

상기 랭킹 자동화부는, 기사가 피딩된 시점으로부터의 지난 시간을 의미하는 기사 나이에 상대 구간을 적용하고, 상기 상대 구간에 존재하는 상기 적어도 하나 이상의 클러스터에 포함된 기사들의 분포에 기초하여 클러스터의 랭킹을 결정하기 위한 점수를 부여할 수 있다.

상기 클러스터 생성부는, 상기 클러스터들 각각에 포함된 기사들을 순위화하기 위한 기사 점수를 계산하여 클러스터 내의 기사들에 대한 우선순위를 결정할 수 있다.

상기 클러스터 생성부는, 상기 클러스터들 각각에 포함된 기사들을 순위화하기 위하여 설정된 팩터들에 대한 가중치를 0 내지 1 사이의 값으로 부여하고, 팩터들 각각에 대한 가점과 상기 팩터들에 대하여 부여된 각각의 가중치에 기초하여 계산을 수행함에 따라 기사 점수를 획득할 수 있다.

상기 클러스터 생성부는, 상기 클러스터들 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반한 퀄리티 모델을 통하여 학습된 결과에 기초하여 대표 기사를 선정할 수 있다.

시간 정보를 고려한 기사량 또는 기사 분포와 관련된 이슈 강도에 따라 클러스터의 랭킹을 자동화하여 이슈 순위를 결정할 수 있다.

클러스터에 포함된 기사들에 대한 기사별 점수에 기초하여 기사별 우선순위를 결정할 수 있다.

클러스터들 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반하여 학습한 결과에 기초하여 클러스터의 대표 기사를 자동으로 선정할 수 있다.

도 1은 일 실시예에 따른 네트워크 환경의 예를 도시한 도면이다.
도 2는 일 실시예에 따른 전자 기기 및 서버의 내부 구성을 설명하기 위한 블록도이다.
도 3은 일 실시예에 따른 서버의 프로세서가 포함할 수 있는 구성 요소의 예를 도시한 블록도이다.
도 4는 일 실시예에 따른 서버에서 뉴스 기사를 자동화하는 방법을 설명하기 위한 흐름도이다.
도 5는 일 실시예에 따른 서버에서 이슈 강도에 기초하여 클러스터의 랭킹을 결정하는 방법을 설명하기 위한 도면이다.
도 6 및 도 7은 일 실시예에 있어서, 채널 연동 언론사 기사의 1주일 통계 데이터 및 전체 언론사 기사의 1주일 통계 데이터를 그래프로 나타낸 것이다.
도 8은 일 실시예에 따른 서버에서 인공지능에 기반한 대표 기사를 제공하는 프로세스를 설명하기 위한 도면이다.
도 9는 일 실시예에 따른 서버에서 딥 러닝 기술을 활용하여 특징을 추출하는 예를 설명하기 위한 도면이다.
도 10은 일 실시예에 따른 서버에서 대표 기사를 배열하는 것을 설명하기 위한 도면이다.
도 11은 일 실시예에 따른 서버에서 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하는 방법을 설명하기 위한 흐름도이다.
도 12는 일 실시예에 따른 서버에서 클러스터의 대표 기사를 선정하는 방법을 설명하기 위한 흐름도이다.

이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.

도 1은 일 실시예에 따른 네트워크 환경의 예를 도시한 도면이다.

도 1의 네트워크 환경은 전자 기기(110), 서버(100) 및 네트워크(120)를 포함하는 예를 나타내고 있다. 이러한 도 1은 발명의 설명을 위한 일례로 단말의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다.

전자 기기(110)는 컴퓨터 장치로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 전자 기기(110)의 예를 들면, 스마트폰(smart phone), 휴대폰, 네비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC, 웨어러블 기기, HMD(Head　mounted　Display) 등이 있다. 전자 기기(110)는 무선 또는 유선 통신 방식을 이용하여 네트워크(120)를 통해 다른 전자 기기들 및/또는 서버(100)와 통신할 수 있다.

통신 방식은 제한되지 않으며, 네트워크(120)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(120)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(120)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.

서버(100)는 전자 기기(110)와 네트워크(120)를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 일례로, 서버(100)는 네트워크(120)를 통해 접속한 단말(110)로 어플리케이션의 설치를 위한 파일을 제공할 수 있다. 이 경우 전자 기기(110)는 서버(100)로부터 제공된 파일을 이용하여 어플리케이션을 설치할 수 있다. 또한 전자 기기(110)가 포함하는 운영체제(Operating System, OS)나 적어도 하나의 프로그램(일례로 브라우저나 상기 설치된 어플리케이션)의 제어에 따라 서버(100)에 접속하여 서버(100)가 제공하는 서비스나 컨텐츠를 제공받을 수 있다. 예를 들면, 전자 기기(110)가 어플리케이션의 제어에 따라 네트워크(120)를 통해 서비스 요청 메시지를 서버(100)로 전송하면, 서버(100)는 서비스 요청 메시지에 대응하는 코드를 전자 기기(110)로 전송할 수 있고, 전자 기기(110)는 어플리케이션의 제어에 따라 코드에 따른 화면을 구성하여 표시함으로써 사용자에게 컨텐츠를 제공할 수 있다.

일례로, 다양한 종류의 컨텐츠 중 기사의 내용을 자동으로 분석하여 해당 이슈의 대표 기사를 선정할 수 있다. 이때, 기사량과 기사 분포에 따라 클러스터의 랭킹을 자동화하여 이슈를 선출하고, 기사의 중요도에 따라 정렬된 클러스터 내의 기사들의 우선순위를 결정하고, 클러스터 각각으로부터 클러스터의 헤드라인/대표 기사를 제공하는 뉴스 자동화 방법에 대하여 설명하기로 한다.

도 2에서는 하나의 단말 및 하나의 서버의 내부 구성을 설명하고 있으나, 도 1을 통해 설명한 네트워크 환경에 포함될 수 있는 또 다른 단말들이나 또 다른 서버들에도 동일한 또는 유사한 내부 구성요소들이 적용될 수 있다.

전자 기기(110)는 예를 들면, 프로세서(200), 적어도 하나의 어플리케이션(201), 메모리(202), 통신 모듈(203), 입출력 인터페이스(204) 및 카메라(206)를 포함할 수 있다.

서버(100)는 프로세서(211), 메모리(212), 통신 모듈(213)을 포함할 수 있다. 메모리(202, 212)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 영구 대용량 저장장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리(202, 212)에는 운영체제나 적어도 하나의 프로그램 코드(일례로 전자 기기(110)에 설치되어 구동되는 브라우저나 상술한 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(202, 212)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 통신 모듈(203, 213)을 통해 메모리(202, 212)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로 상술한 서버(100))가 네트워크(120)를 통해 제공하는 파일들에 의해 설치되는 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(202, 212)에 로딩될 수 있다.

프로세서(200, 211)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(202, 212) 또는 통신 모듈(203, 213)에 의해 프로세서(200, 211)로 제공될 수 있다. 예를 들면, 프로세서(200, 211)는 메모리(202, 212)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.

통신 모듈(203, 213)은 네트워크(120)를 통해 전자 기기(110)와 서버(100)가 서로 통신하기 위한 기능을 제공할 수 있으며, 다른 전자 기기 또는 다른 서버와 통신하기 위한 기능을 제공할 수 있다. 일례로, 전자 기기(110)의 프로세서(200)가 메모리(202)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청이 통신 모듈(203)의 제어에 따라 네트워크(120)를 통해 서버(100)로 전달될 수 있다. 역으로, 서버(100)의 프로세서(211)의 제어에 따라 제공되는 제어 신호나 명령, 컨텐츠, 파일 등이 통신 모듈(213)과 네트워크(120)를 거쳐 전자 기기(110)의 통신 모듈(203)을 통해 전자 기기(110)로 수신될 수 있다. 예를 들면, 통신 모듈(203)을 통해 수신된 서버(100)의 제어 신호나 명령 등은 프로세서(200)나 메모리(202)로 전달될 수 있고, 컨텐츠나 파일 등은 전자 기기(110)가 더 포함할 수 있는 저장 매체로 저장될 수 있다.

입출력 인터페이스(204)는 입출력 장치와의 인터페이스를 위한 수단일 수 있다. 예를 들면, 입력 장치는 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 어플리케이션의 통신 세션을 표시하기 위한 디스플레이와 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(204)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 보다 구체적인 예로, 전자 기기(110)의 프로세서(200)는 메모리(202)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 서버(100)나 다른 전자 기기가 제공하는 데이터를 이용하여 구성되는 서비스 화면이나 컨텐츠가 입출력 인터페이스(204)를 통해 디스플레이(205)에 표시될 수 있다.

또한, 다른 실시예들에서 전자 기기(110) 및 서버(100)는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들면, 전자 기기(110)는 입출력 장치 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라(206), 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다. 보다 구체적인 예로, 전자 기기(110)가 스마트 폰인 경우, 일반적으로 스마트 폰이 포함하고 있는 가속도 센서나 자이로 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 전자 기기(110)에 더 포함되도록 구현될 수 있다.

도 3은 일 실시예에 따른 서버의 프로세서가 포함할 수 있는 구성 요소의 예를 도시한 블록도이고, 도 4는 일 실시예에 따른 서버에서 뉴스 기사를 자동화하는 방법을 설명하기 위한 흐름도이다.

서버(100)의 프로세서(211)는 클러스터 생성부(310) 및 랭킹 자동화부(320) 를 포함할 수 있다. 이러한 프로세서(211)의 구성요소들은 서버(100)에 저장된 프로그램 코드가 제공하는 제어 명령에 따라 프로세서(211)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 프로세서(211) 및 프로세서(211)의 구성요소들은 도 4의 뉴스 기사를 자동화하는 방법이 포함하는 단계들(410 내지 420)을 수행하도록 서버(100)를 제어할 수 있다. 이때, 프로세서(211) 및 프로세서(211)의 구성요소들은 메모리가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.

프로세서(211)는 뉴스 기사를 자동화하는 방법을 위한 프로그램의 파일에 저장된 프로그램 코드를 메모리에 로딩할 수 있다. 예를 들면, 서버(100)에서 프로그램이 실행되면, 프로세서는 운영체제의 제어에 따라 프로그램의 파일로부터 프로그램 코드를 메모리에 로딩하도록 서버(100)를 제어할 수 있다. 이때, 프로세서(211) 및 프로세서(211)가 포함하는 클러스터 생성부(310) 및 랭킹 자동화부(320) 각각은 메모리에 로딩된 프로그램 코드 중 대응하는 부분의 명령을 실행하여 이후 단계들(410 내지 420)을 실행하기 위한 프로세서(211)의 서로 다른 기능적 표현들일 수 있다.

단계(410)에서 클러스터 생성부(310)는 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성할 수 있다. 클러스터 생성부(310)는 다양한 컨텐츠들을 이슈별로 클러스터링하여 적어도 하나 이상의 클러스터를 생성할 수 있다. 이하, 실시예에서는 컨텐츠 중 기사를 예를 들어 설명하기로 한다. 일례로, 클러스터 생성부(310)는 최근 인입된 기사 25000건을 기준으로 클러스터링 기법을 통해 이슈별로 컨텐츠들을 클러스터링함에 따라 적어도 하나 이상의 클러스터를 생성할 수 있다. 클러스터 생성부(310)는 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화할 수 있다. 또한, 클러스터 생성부(310)는 적어도 하나 이상의 클러스터의 각각으로부터 클러스터의 대표 기사를 선정할 수 있다.

도 11을 참고하면, 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하는 방법을 설명하기 위한 흐름도이다.

단계(1110)에서 클러스터 생성부(310)는 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위한 기사 점수를 계산할 수 있다. 클러스터 생성부(310)는 클러스터들 각각에 포함된 기사들에 가점을 부여하고, 각각의 기사를 순위화하여 기사의 중요도, 기사별 판단을 정량화할 수 있다. 클러스터 생성부(310)는 기사의 점수를 계산하기 위하여 기사관계중요도/기사시간가점/최신기사가점/단독/기사길이가점/품질점수 등 다양한 요인에 대해 각 팩터를 점수화할 수 있다.

클러스터 생성부(310)는 기사의 중요도, 기사별 판단을 정량화하는 기사팩터를 생성할 수 있다. 이때, 기사팩터에 기초하여 기사들이 클러스터링된 이슈, 클러스터 내의 개별 기사간의 순위를 결정하기 위한 기사별 점수를 생성할 수 있다. 예를 들면, 각 기사에 0~10 범위의 점수가 부여받게 된다. 이러한 기사 점수는 다음과 같은 수학식 1을 통하여 계산할 수 있다. 이때, 기사 점수의 식에서 새로운 팩터가 추가될 수 있으며, 기사들을 순위화하기 위하여 새로운 팩터가 추가된 팩터들에 기초하여 계산된 기사 점수가 일정 범주 내의 값으로 산출될 수 있다.

수학식 1:

기사 점수(w)=

이때, w는 기사 점수(0~10), x₁~x_n은 각각이 기사팩터로서 기사관계중요도/기사시간가점/최신기사가점/단독/기사길이가점/품질점수 등 다양한 요인으로 정해질 수 있다. 값은 0~1 범위의 점수 혹은 0,1의 값으로 정해질 수 있다.

클러스터 생성부(310)는 기사관계중요도의 경우 동일 클러스터 내 기사의 유사 정도에 따라 점수를 부여할 수 있다. 기사시간가점의 경우 기사시간이 빠르면 높은 점수를 늦으면 낮은 점수를, 예를 들면, 0~1 시간된 기사에는 1점, 1~2시간된 기사에는 0.5 점, 3시간 이상된 기사에는 0.1 점을 부여할 수 있다. 클러스터 생성부(310)는 기사속성가점의 경우 특정 속성의 유무를 기준으로 점수를 부여할 수 있다. 예를 들어, 기사에 '단독' 키워드가 의미있는 속성이라고 판단된다면, 기사에 '단독'이 있는 경우 1점을 부여할 수 있다. 또한, 클러스터 생성부(310)는 기사의 길이를 기준으로 점수를 부여할 수 있으며, 예를 들면, 길이가 길면 높은 점수 짧으면 낮은 점수를 부여할 수도 있고, 상대적인 값 예를 들어, 기사의 길이/최대 기사의 길이를 계산하여 점수를 부여할 수 있다. 클러스터 생성부(310)는 문서 유사도가 80% 이상인 기사들 중 가장 오래된 기사로서, 최초 보도한 기사에게 점수가 부여되도록 할 수도 있다. 또한, 메인노출여부, 댓글이나 사용자 피드백 등도 기사팩터의 예시가 될 수 있다.

a1~an은 항목별 가중치를 의미하며, 각각의 a1~an값은 0 내지 1 사이의 값이 초기값으로 셋팅될 수 있으며, 모니터링함에 따라 최적의 값으로 도출될 수 있다. 예를 들면, 초기값으로 a는 1, b는 1, c는 1, d는 0.5, e는 0.8로 셋팅될 수 있다. 클러스터 생성부(310)는 각각의 가중치를 기계학습을 통하여 최적의 값을 도출할 수 있다. 이에 따라, 모든 기사들은 0~10 사이의 균일한 값을 가지게 된다.

단계(1120)에서 클러스터 생성부(310)는 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위한 기사 점수를 계산함에 따라 클러스터 내의 기사들에 대한 우선순위를 결정할 수 있다. 클러스터 생성부(310)는 글러스터 내에 포함된 기사들 간에 상대적인 우선순위를 결정할 수 있다. 클러스터 생성부(310)는 기사 점수가 부여된 기사들에 대한 우선순위에 기반하여 클러스터 내에 존재하는 기사들을 내림차순 또는 오름차순으로 정렬할 수 있다. 이와 같이, 클러스터 생성부(310)는 각각의 기사에 대하여 일정 범위 내의 정량화된 값들로 산출되기 때문에 기사들을 보다 간편하게 관리할 수 있다.

도 12를 참고하면, 클러스터의 대표 기사를 선정하는 방법을 설명하기 위한 흐름도이다.

단계(1210)에서 클러스터 생성부(310)는 클러스터링을 통하여 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 컨텐츠들의 특징을 분석할 수 있다. 예를 들면, 클러스터 생성부(310)는 적어도 하나 이상의 클러스터 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반하여 학습시킬 수 있다.

단계(1220)에서 클러스터 생성부(310)는 클러스터의 대표 기사를 선정할 수 있다. 클러스터 생성부(310)는 적어도 하나 이상의 클러스터의 각각에 포함된 컨텐츠들의 특징을 분석함에 따라 획득된 클러스터에 포함된 기사들의 순위에 기초하여 클러스터의 대표 기사를 선정할 수 있다. 클러스터 생성부(310)는 인공 신경망에 기반하여 학습된 결과에 기초하여 순위화된 클러스터들 각각에 포함된 기사들을 정렬함에 따라 클러스터들 각각에 포함된 기사들로부터 클러스터에 대한 대표 기사를 선정할 수 있다. 클러스터 생성부(310)는 클러스터들 각각으로부터 선정된 각각의 대표 기사를 자동으로 배열할 수 있다.

이때, 클러스터 생성부(310)는 클러스터에서 대표 기사의 가점을 산출할 수도 있다. 클러스터 생성부(310)는 클러스터에서 선정된 대표 기사(메인 노출 기사)에 가점을 부여할 수 있다. 또한, 클러스터 생성부(310)는 클러스터에서 선정된 대표 기사의 경우, 기사 피딩 시간 기준으로 시간대별 가점과 동일한 가점을 추가적으로 부여할 수 있다. 또한, 해당 클러스터 내 기사들의 관계중요도 점수의 평균값 보다 대표 기사의 관계중요도 점수가 적은 경우 추가 가점을 제거할 수 있다.

또한, 클러스터 생성부(310)는 사용자의 기사 점수를 적용하여 적어도 하나 이상의 클러스터의 각각으로부터 대표 기사를 다르게 추출할 수 있다. 예를 들면, 클러스터 생성부(310)는 인공지능에 기반하여 사용자에 따른 기사 점수를 도출할 수 있다. 클러스터 생성부(310)는 인공지능에 기반하여 사용자의 선호도가 반영된 기사 점수를 계산할 수 있고, 계산된 기사 점수에 기초하여 클러스터의 대표 기사를 선정할 수 있다.

단계(420)에서 랭킹 자동화부(320)는 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화할 수 있다. 이슈 정보란 기사량, 기사 분포, 기사에 대한 반응 등을 고려한 것을 의미한다. 랭킹 자동화부(320)는 적어도 하나 이상의 클러스터를 분석하여 클러스터의 랭킹을 결정할 수 있다. 랭킹 자동화부(320)는 생성된 적어도 하나 이상의 클러스터에 대한 시간 정보를 고려한 기사량 또는 기사 분포를 포함하는 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 적어도 하나 이상의 클러스터의 랭킹을 결정할 수 있다.

이슈 강도에 기초하여 클러스터의 랭킹을 결정하기 위하여 도 5를 참고하여 설명하기로 한다. 도 5를 참고하면, 랭킹 자동화부(320)는 단순 기사량뿐만 아니라 기사 인입시간 또는 시간대별 총 기사량 등 전체적으로 기사량 또는 기사 분포와 관련된 이슈 강도를 통하여 클러스터의 랭킹을 결정할 수 있다. 일례로, 뉴스 생산자인 언론사가 생산해내는 기사량에 비례하여 이슈가 선별될 수 있다. 이때, 랭킹 자동화부(320)는 이러한 이슈 강도에 따라 이슈(클러스터)의 랭킹을 결정할 수 있다. 여기서, 이슈 강도란, 복수의 지표를 반영하여 클러스터의 랭킹을 결정하는 점수를 의미한다. 예를 들면, 모든 기사를 이슈별(섹션별)로 구분하여 클러스터링함에 따라 복수 개의 클러스터를 획득할 수 있고, 이슈 강도를 통하여 기사들 중에서 주요 이슈, 다시 말해서, 클러스터에 존재하는 일부의 기사만 노출시킬 수 있다. 종래에는 기사의 개수를 기반하여 기사를 노출시키는 방식이었으나, 최신의 기사가 제대로 업데이트되지 않고, 그 날의 주요 이슈만이 계속 유지된다는 문제점을 보완하기 위하여, 최신의 기사에 대하여 가점을 부여하여 최신의 기사가 노출될 수 있도록 제공할 수 있다. 이에 따라 개인별 추천과 다르게 필터버블을 방지/보완할 수 있는 주요 이슈를 선별할 수 있다.

구체적으로, 랭킹 자동화부(320)는 이슈 강도를 적용하는 로직에 대하여 설명하기로 한다. 도 5를 참고하면, 이슈 강도를 적용하는 로직은 각각의 기사의 클러스터에 대한 롱텀(Long Term) 과 숏텀(Short Term)을 같이 고려하고, 단기기사나이를 절대 구간이 아닌 상대 구간으로 설정하여 기사량에 상관없이 일정한 퀄리티의 기사가 노출될 수 있도록 한다.

예를 들면, 제1 클러스터(510), 제2 클러스터(520)를 포함하는 두 개의 클러스터를 예를 들어 이슈 강도를 적용하는 방법을 설명하기로 한다. 이때, 두 개의 클러스터는 이슈 강도를 적용하는 방법을 설명하기 위한 예시일 뿐, 클러스터의 개수에 제한되는 것은 아니다. 도 5의 그래프에서 각각의 점이 기사(501), 점을 포함하고 있는 묶음이 클러스터(510, 520), x축의 기사 나이는 기사가 피딩된 시점으로부터 지난 시간, y축의 기사 분포는 기사가 분포되어 있는 위치를 볼 수 있도록 표시해 놓은 것으로, 기사 분포는 전체 클러스터 기사 중 특정 기간의 기사 개수(또는 점수) 총합에 대한 각각의 클러스터 기사 중 특정 기간 기사 개수(또는 점수) 총합의 비율, 단기기사나이는 클러스터 기사 풀에서 기 설정된 구간 또는 시간(예를 들면, 5%, 10%, 30분 등)에 해당하는 기사 중 가장 오래된 기사 나이를 의미한다. 이를 통하여, 단기기사나이1 Short Term 분포, 단기기사나이2 Short Term 분포, 단기기사나이3 Short Term 분포를 도출할 수 있다. 또한, Long Term 분포에서 단기기사나이1 Short Term 가점, 단기기사나이2 Short Term 가점, 단기기사나이3 Short Term 가점, Long Term 가점을 도출할 수 있다. 여기서, 롱텀 분포는 해당 클러스터의 기사 길이가 300자 초과인 기사 총합(개수 or 점수) / 클러스터 전체 기사 총합(개수 or 점수)를 계산하여 도출할 수 있다. 숏텀 분포는 기사가 분포하는 구간을 상대적으로 나눌 수 있다. 예를 들면, 기사가 10% 차지하는 구간을 각각 나눌 수 있다. 도 5에서는 단기기사나이 구간을 3개의 구간으로 나눈 것을 나타낸 것이다. 예를 들면, 특정 날짜의 총 기사 숫자 대비 일정 간격(예를 들면, 5일 30분 간격) 기사 피딩 개수에서 가장 큰 개수를 계산하여 단기기사나이를 선정할 수 있다.

아래의 표 1 및 도 6을 참고하면, 1주일 통계 데이터를 나타낸 것으로, 채널 연동 언론사 기사를 기준으로 1주일 비율 값을 나타낸 것이다. 이때, 1주일 비율 값의 평균은 4.75이다.

표 1: 채널 연동 언론사 기사의 1주일 통계 데이터

표 2 및 도 7을 참고하면, 전체 언론사 기사를 기준으로 1주일 비율 값을 나타낸 것이다. 이때, 1주일 비율 값의 평균은 4. 99 이다.

표 2: 전체 언론사 기사의 1주일 통계 데이터

이때, 기사가 차지하는 구간의 크기, 개수 등을 변경시킬 수 있으며, 최신의 기사가 위치하는 구간에 가중치를 부여할 수도 있다. 각각의 단기기사나이는 다음과 같이 계산될 수 있다. 단기기사나이1 동안 클러스터 전체 기사 총합 (개수 or 점수)에 대한 단기기사나이 1 동안 해당 클러스터의 기사 총합 (개수 or 점수), 단기기사나이2 동안 클러스터 전체 기사 총합 (개수 or 점수)에 대한 단기기사나이2 동안 해당 클러스터의 기사 총합 (개수 or 점수), 단기기사나이3 동안 클러스터 전체 기사 총합 (개수 or 점수)에 대한 단기기사나이3 동안 해당 클러스터의 기사 총합 (개수 or 점수)으로 계산될 수 있다. 이때, 각각의 구간에 가중치를 부여함으로써 최적의 값을 도출할 수 있다. 다시 말해서, 예를 들면, 초기값으로 a는 3, b는 2, c는 5, d는 10으로 계산할 수 있다. 이때, a, b, c 값 중 최신의 구간에 가중치를 더 부여할 수 있고, d는 전체의 기사량에 대한 값이기 때문에 분모의 수치가 크기 때문에 영향을 받게 하기 위하여 값이 설정될 수 있다. 예를 들면, d는 큰 클러스터가 노출되지 않는 경우가 발생하는 것, 다시 말해서, 최신 기사만 너무 빠르게 업데이트되는 것을 보완하고자 초기값을 10으로 설정할 수 있다. 추후에, 사용자 또는 관리자에 의하여 a, b, c, d 값 각각이 계속적으로 변동될 수 있다. 또한, 롱텀의 합이 숏텀의 합보다 클 경우, 강제로 롱텀의 값을 숏텀의 최대값보다 작거나 같도록 제한할 수도 있다.

한편, 기사 총합을 각 기사 점수의 총합으로 했을 경우, 기사가 하나인 클러스터가 상위에 노출되는 경우도 발생할 수 있다. 또는, 기사 총합을 각 기사의 개수로 했을 경우, 기사가 하나인 클러스터 아래에 노출될 수 있다. 이와 같이, 기사들의 클러스터를 롱텀과 숏텀을 함께 고려하고, 단기기사나이를 상대 구간으로 변경하여 평일이나 주말, 기사량에 상관없이 일정한 퀄리티의 이슈 및 대표 기사가 도출될 수 있도록 한다. 이때, 모니터링을 통하여 상대 구간을 변경할 수 있다. 또한, 각 섹터별로 최신성의 기사, 기사량에 등에 기초하여 가중치를 부여하여 상대 구간을 조정할 수 있도록 한다.

더 나아가, 랭킹 자동화부(320)는 인공지능에 기반하여 클러스터의 랭킹을 자동화하기 위한 사용자의 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 클러스터의 랭킹을 자동화할 수 있다. 이때, 랭킹 자동화부(320)는 사용자별 이슈 점수를 적용하여 개인별로 이슈의 순위를 다르게 제공할 수 있다.

도 8은 일 실시예에 따른 인공지능에 기반한 대표 기사를 제공하는 프로세스를 설명하기 위한 도면이다.

서버는 클러스터의 랭킹을 인공지능 기술과 접목하여 개인별 이슈 점수를 두어 개인별로 이슈의 순위를 다르게 제공할 수 있다. 또는, 서버는 인공지능에 기반하여 도출된 사용자의 기사 점수에 기초하여 사용자에 따라 클러스터들 각각으로부터 선정되는 대표 기사를 다르게 추출할 수 있다. 예를 들면, 서버는 개인별로 기사 점수를 차등적으로 적용할 수 있다. 또한, 서버는 개인별 이슈 점수 또는 개인별 기사 점수로 인한 개인별 이슈의 순위, 개인별 이슈에 대한 대표 기사도 다르게 제공할 수 있다. 예를 들면, 사용자가 기사를 제공하는 서비스에 로그인할 경우, 각각의 개인별 기사 점수 또는 개인별 이슈 점수에 기반하여 각각 다른 이슈 또는 각각의 다른 대표 기사를 제공할 수 있고, 기사를 제공하는 서비스에 로그인하지 않을 경우, 모든 사용자에게 동일하게 서버에 의하여 선정된 클러스터의 랭킹 또는 기사별 순위에 기반한 대표 기사를 제공할 수 있다. 이때, 인공신경망 기반의 학습을 수행하여 맞춤형 기사를 제공하기 위해 필요한 정보량이 풍부한 기사 및 사용자 만족도가 높은 기사를 분류하는 퀄리티(Quality) 모델을 생성할 수 있다. 예를 들면, 인공신경망은 CNN, RNN과 같은 신경망 모델에 기반하여 학습시킬 수 있다.

서버는 적어도 하나 이상의 클러스터에 포함된 컨텐츠(예를 들면, 기사)들로부터 컨텐츠들과 관련된 분석을 수행함에 따라 추출된 특징에 기반하여 정보량과 관련된 기사를 분류할 수 있다. 서버는 문서로부터 문서의 특징을 추출할 수 있다(810). 도 9을 참고하면, 특징을 추출하는 예를 설명하기 위한 도면이다. 구체적으로, 문서(900)로부터 특징을 추출할 수 있다. 예를 들면, 문서(Document)는 텍스트 또는 이미지로 구성된 컨텐츠(예를 들면, 기사)일 수 있다. 서버는 문서(900)로부터 문서(900)에 포함된 제목(헤드라인), 본문, 이미지, 바이라인, 작성 시간 등에 기초하여 특징을 추출할 수 있고, 추출된 특징에 기반하여 정보량이 풍부한 기사를 분류할 수 있다(811).

서버는 문서로부터 문서의 피드백 특징을 추출할 수 있다(820). 예를 들면, 도 9를 참고하면, 문서(900)로부터 사용자의 기사의 체류 시간, 조회수 등에 기초하여 특징을 추출할 수 있고, 추출된 특징에 기초하여 사용자 만족도 높은 기사를 예측할 수 있다. 서버는 추출된 피드백 특징에 대한 회귀(regression) 분석을 수행함에 따라 사용자 만족도가 높은 기사를 예측할 수 있다(821).

서버는 정보량이 풍부한 기사 및 사용자 만족도가 높은 기사를 인공 신경망 기반의 학습을 수행하기 위한 퀄리티 모델(830)을 구성할 수 있다. 서버는 퀄리티 모델(830)을 통하여 정보량이 풍부한 기사 및 사용자 만족도가 높은 기사에 대한 순위화하기 위한 학습을 수행함에 따라 자동으로 대표 기사를 선정할 수 있다. 서버는 선정된 대표 기사를 맞춤형 개인화/글로벌 뉴스로 추천할 수 있다.

도 10은 일 실시예에 따른 서버에서 대표 기사를 배열하는 것을 설명하기 위한 도면이다.

서버는 기사에 대한 분류(Classification) 또는 회귀(Regression) 모델을 통하여 전체 특징들을 실시간으로 예측할 수 있다. 특징들(feats)의 중요도는 Learning to Rank 모델을 통하여 자동으로 학습될 수 있다. 특징들의 중요도는 아래의 수학식 2로 나타낸 Learning to Rank 모델에 기반하여 각각의 특징에 대한 가중치와 가점의 곱을 합산함으로써 중요도가 도출될 수 있다.

수학식 2:

서버는 인공지능에 기반하여 자동으로 학습된 특징들을 퀄리티 모델을 통하여 모델링한 결과 배열된 대표 기사를 선정할 수 있다. 또한, 서버는 인공지능에 기반하여 기사의 헤드라인을 배열할 수 있다.

도 10을 참고하면, 기사를 제공하는 서비스 화면(1000)을 나타낸 것이다. 일례로, 서비스 화면(1000)에 인공지능에 기반하여 학습됨에 따라 선정된 대표 기사(1010)가 자동으로 배열될 수 있다. 예를 들면, 대표 기사의 헤드라인, 대표 기사가 피딩된 시간, 대표 기사를 업로드한 언론사를 포함하는 대표 기사가 표시될 수 있다. 이때, 대표 기사를 선별하기 위하여 분석된 기사에 대한 각각의 값들이 비교되어 대표 기사가 선정될 수 있다. 또한, 기 설정된 시간마다 분석된 기사에 대한 값들이 업데이트될 수 있고, 업데이트된 값들을 비교하여 대표 기사가 재선정될 수 있다. 또한, 인공지능에 기반하여 학습된 특징들에 기초하여 모델링한 결과 배열된 대표 기사의 헤드라인이 출력될 수도 있다. 더 나아가, 서비스 화면(1000)에 배열된 대표 기사(1010)가 선택됨에 따라 대표 기사(1010)와 관련된 기사들이 함께 제공될 수도 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

서버에서 수행되는 뉴스 기사 자동화 방법에 있어서,
컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계; 및
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 단계
를 포함하고,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반한 퀄리티 모델을 통하여 학습한 결과에 기초하여 대표 기사를 선정하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제1항에 있어서,
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는,
상기 생성된 적어도 하나 이상의 클러스터에 대한 시간 정보를 고려한 기사량 또는 기사 분포를 포함하는 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 상기 적어도 하나 이상의 클러스터의 랭킹을 결정하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제2항에 있어서,
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는,
기사가 피딩된 시점으로부터의 지난 시간을 의미하는 기사 나이에 상대 구간을 적용하고, 상기 상대 구간에 존재하는 상기 적어도 하나 이상의 클러스터에 포함된 기사들의 분포에 기초하여 클러스터의 랭킹을 결정하기 위한 점수를 부여하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제3항에 있어서,
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는,
상기 기사가 피딩 시간을 기준으로 상기 상대 구간에 시간대별 가중치를 부여하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제2항에 있어서,
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈를 고려하여 클러스터의 랭킹을 자동화하는 단계는,
인공지능에 기반하여 상기 클러스터의 랭킹을 자동화하기 위한 사용자의 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 클러스터의 랭킹을 자동화하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제1항에 있어서,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위한 기사 점수를 계산하여 클러스터 내의 기사들에 대한 우선순위를 결정하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제6항에 있어서,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위하여 새로운 팩터를 추가하고, 상기 새로운 팩터를 포함하는 팩터들에 기초하여 계산된 기사 점수를 일정 범주 내의 값으로 산출하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제6항에 있어서,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 생성된 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위하여 설정된 팩터들에 대한 가중치를 0 내지 1 사이의 값으로 부여하고, 팩터들 각각에 대한 가점과 상기 팩터들에 대하여 부여된 각각의 가중치에 기초하여 계산을 수행함에 따라 기사 점수를 획득하는 단계
를 포함하는 뉴스 기사 자동화 방법.
삭제
제1항에 있어서,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
사용자의 기사 점수에 기초하여 상기 적어도 하나 이상의 클러스터의 각각으로부터 대표 기사를 다르게 추출하는 단계
를 포함하는 뉴스 기사 자동화 방법.
삭제
제1항에 있어서,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들로부터 상기 기사들과 관련된 분석을 수행함에 따라 추출된 특징에 기반하여 정보량과 관련된 기사를 분류하고, 상기 기사들에 대한 피드백 특징을 추출하여 사용자와 관련된 기사를 예측하고, 상기 정보량과 관련된 기사 및 상기 사용자와 관련된 기사를 인공 신경망 기반하여 구성된 퀄리티 모델을 통하여 학습을 수행하는 단계
를 포함하는 뉴스 기사 자동화 방법.
제12항에 있어서,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 퀄리티 모델을 통하여 학습된 결과에 기초하여 순위화된 상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 정렬함에 따라 상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들로부터 각각의 대표 기사를 선정하는 단계
를 포함하는 뉴스 기사 자동화 방법.
서버에 의해 수행되는 뉴스 기사를 자동화하는 방법을 실행시키기 위하여 컴퓨터 판독 가능한 저장매체에 저장된 컴퓨터 프로그램에 있어서,
컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계; 및
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 단계
를 포함하고,
상기 컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 단계는,
상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반한 퀄리티 모델을 통하여 학습한 결과에 기초하여 대표 기사를 선정하는 단계
를 포함하는 컴퓨터 판독 가능한 저장매체에 저장된 컴퓨터 프로그램.
뉴스 기사를 자동화하는 서버에 있어서,
컨텐츠들의 클러스터링을 통하여 적어도 하나 이상의 클러스터를 생성하는 클러스터 생성부; 및
상기 생성된 적어도 하나 이상의 클러스터에 대한 이슈 정보를 고려하여 클러스터의 랭킹을 자동화하는 랭킹 자동화부
를 포함하고,
상기 클러스터 생성부는,
상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들에 대한 분석을 수행함에 따라 추출된 특징들을 인공 신경망에 기반한 퀄리티 모델을 통하여 학습한 결과에 기초하여 대표 기사를 선정하는 서버.
제15항에 있어서,
상기 랭킹 자동화부는,
상기 생성된 적어도 하나 이상의 클러스터에 대한 시간 정보를 고려한 기사량 또는 기사 분포를 포함하는 이슈 정보와 관련하여 판단된 이슈 강도에 기초하여 상기 적어도 하나 이상의 클러스터의 랭킹을 결정하는
것을 특징으로 하는 서버.
제16항에 있어서,
상기 랭킹 자동화부는,
기사가 피딩된 시점으로부터의 지난 시간을 의미하는 기사 나이에 상대 구간을 적용하고, 상기 상대 구간에 존재하는 상기 적어도 하나 이상의 클러스터에 포함된 기사들의 분포에 기초하여 클러스터의 랭킹을 결정하기 위한 점수를 부여하는
것을 특징으로 하는 서버.
제15항에 있어서,
상기 클러스터 생성부는,
상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위한 기사 점수를 계산하여 클러스터 내의 기사들에 대한 우선순위를 결정하는
것을 특징으로 하는 서버.
제18항에 있어서,
상기 클러스터 생성부는,
상기 적어도 하나 이상의 클러스터의 각각에 포함된 기사들을 순위화하기 위하여 설정된 팩터들에 대한 가중치를 0 내지 1 사이의 값으로 부여하고, 팩터들 각각에 대한 가점과 상기 팩터들에 대하여 부여된 각각의 가중치에 기초하여 계산을 수행함에 따라 기사 점수를 획득하는
것을 특징으로 하는 서버.
삭제