KR20150114087A - 업데이트된 뉴스 콘텐츠 제공 방법 및 장치 - Google Patents

업데이트된 뉴스 콘텐츠 제공 방법 및 장치 Download PDF

Info

Publication number
KR20150114087A
KR20150114087A KR1020140037804A KR20140037804A KR20150114087A KR 20150114087 A KR20150114087 A KR 20150114087A KR 1020140037804 A KR1020140037804 A KR 1020140037804A KR 20140037804 A KR20140037804 A KR 20140037804A KR 20150114087 A KR20150114087 A KR 20150114087A
Authority
KR
South Korea
Prior art keywords
content
updated
user
similar
information
Prior art date
Application number
KR1020140037804A
Other languages
English (en)
Other versions
KR101663359B1 (ko
Inventor
김상욱
황원석
박정
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020140037804A priority Critical patent/KR101663359B1/ko
Publication of KR20150114087A publication Critical patent/KR20150114087A/ko
Application granted granted Critical
Publication of KR101663359B1 publication Critical patent/KR101663359B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

사용자에 의해 열람되지 않은 업데이트된 콘텐츠와 유사한 유사 콘텐츠들을 식별하고, 업데이트된 콘텐츠 및 유사 콘텐츠들 간의 유사도들에 기반하여 콘텐츠의 사용 정보를 업데이트하고, 업데이트 콘텐츠에 대한 사용자의 선호도를 계산하는 방법 및 장치를 제공할 수 있다. 계산된 업데이트 콘텐츠에 대한 사용자의 선호도에 따라, 사용자의 선호도에 부합하는 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보가 사용자에게 제공될 수 있다.

Description

업데이트된 뉴스 콘텐츠 제공 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING UPDATED NEWS CONTENTS}
아래의 설명은 사용자에게 콘텐츠를 제공하는 방법에 관한 것으로, 특히, 업데이트된 콘텐츠 및 유사한 유사 콘텐츠 간의 유사도에 기반하여 계산된 업데이트된 콘텐츠에 대한 선호도를 사용하여 사용자에게 업데이트된 콘텐츠를 제공하는 방법과 관련된다.
최근, 스마트폰(smartphone) 및 태블릿 PC와 같은 스마트 디바이스들의 보급과 함께 인터넷과 같은 각종 통신망을 통한 사용자에의 콘텐츠의 제공 또한 활발해 지고 있다.
특히, 사용자들은 컴퓨터, 스마트폰 및 태블릿 PC와 같은 단말을 사용하여 포털 사이트 등을 통해 제공되는 뉴스 콘텐츠를 편리하게 열람할 수 있다. 그러나, 뉴스 콘텐츠들은 지속적으로 업데이트되며, 포털 사이트 등을 통해 제공되는 뉴스 콘텐츠의 양이 매우 방대하기 때문에 사용자가 관심 분야의 뉴스 콘텐츠만을 용이하게 이용하는 데에는 어려움이 있었다. 이에 따라, 포털 사이트들과 같은 뉴스 콘텐츠 제공자들은 뉴스 콘텐츠를 이용하는 사용자의 선호도 또는 관심 분야를 조사하여, 이에 기반하여 사용자의 선호도 또는 관심 분야에 부합하는 뉴스 콘텐츠들을 추천하는 서비스를 사용자에게 제공하고 있다.
그러나, 기존의 사용자에 대한 콘텐츠 제공 및 추천 방법은 실시간으로 업데이트되는 콘텐츠들를 사용자에게 빠른 시간 내에 효율적으로 추천할 수 없었다. 뉴스 콘텐츠의 경우 시간이 흐를수록 그 가치가 현저하게 감소하기 때문에, 실시간으로 업데이트된 뉴스 콘텐츠를 사용자에게 효율적으로 제공하는 것은 특히 중요하다.
따라서, 실시간으로 업데이트된 콘텐츠들 중 사용자의 선호도에 부합하는 콘텐츠를 효율적으로 사용자에게 제공할 수 있는 방법이 요구된다.
한국공개특허 제10-2013-0049253호(공개일 2013년 05월 14일)에는 스마트 단말기를 사용하는 사용자에게 기본 추천 콘텐츠를 제공하는 단계, 상기 사용자에게 기본 추천 콘텐츠가 제공된 후의 상기 사용자의 콘텐츠 이용 내역 정보를 포함한 사용자 정보를 수집하는 단계 및 상기 수집된 사용자 정보를 이용하여 상기 사용자에게 맞춤 추천 콘텐츠를 제공하는 단계를 포함하는 것을 특징으로 하는 콘텐츠 추천 서비스 방법이 개시되어 있다.
일 실시예는 사용자에 의해 열람되지 않은 업데이트된 콘텐츠 및 이와 유사한 유사 콘텐츠들 간의 유사도들에 기반하여 콘텐츠의 사용 정보를 업데이트하고 업데이트 콘텐츠에 대한 사용자의 선호도를 계산하는 방법 및 장치를 제공할 수 있다. 계산된 업데이트 콘텐츠에 대한 사용자의 선호도에 따라, 사용자의 선호도에 부합하는 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보가 사용자에게 제공될 수 있다.
일 실시예는 업데이트된 콘텐츠 및 이와 유사한 유사 콘텐츠들 간의 유사도들을 가중치로서 유사 콘텐츠들의 피처 벡터들의 가중 평균을 계산함으로써 업데이트된 콘텐츠의 피처 벡터를 계산하고, 업데이트된 콘텐츠의 피처 벡터 및 사용자의 피처 벡터를 내적함으로써 업데이트 콘텐츠에 대한 사용자의 선호도를 계산하는 방법 및 장치를 제공할 수 있다.
일 측면에 있어서, 적어도 하나의 콘텐츠의 내용과 관련된 정보에 기반하여 상기 적어도 하나의 콘텐츠로부터 상기 적어도 하나의 콘텐츠 중 업데이트된 콘텐츠와 유사한 하나 이상의 유사 콘텐츠들을 식별하는 단계, 상기 업데이트된 콘텐츠 및 상기 유사 콘텐츠들 간의 유사도들에 기반하여 상기 적어도 하나의 콘텐츠의 사용 정보를 업데이트하는 단계 및 상기 업데이트된 사용 정보에 기반하여 상기 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 단계를 포함하는, 콘텐츠 제공 방법이 제공된다.
상기 유사 콘텐츠들을 식별하는 단계는 상기 적어도 하나의 콘텐츠 중 상기 업데이트된 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 하나 이상의 후보 콘텐츠들을 식별하는 단계를 포함할 수 있다.
상기 유사 콘텐츠들을 식별하는 단계는 상기 후보 콘텐츠들의 각각 및 상기 업데이트된 콘텐츠 간의 유사도들을 계산함으로써 상기 업데이트된 콘텐츠와 유사한 유사 콘텐츠들을 식별할 수 있다.
상기 후보 콘텐츠들을 식별하는 단계는 상기 적어도 하나의 콘텐츠 및 상기 업데이트된 콘텐츠 간의 비교를 위해 사용되는 상기 내용과 관련된 정보를 포함하는 벡터들의 차원을 감소시키는 단계를 포함할 수 있다.
상기 후보 콘텐츠들을 식별하는 단계는 해쉬 함수를 사용하여 상기 차원이 감소된 벡터들 중 상기 업데이트된 콘텐츠의 내용과 관련된 정보를 포함하는 벡터들과 유사한 벡터들을 식별하는 단계를 포함할 수 있다.
상기 선호도를 계산하는 단계는 상기 업데이트된 사용 정보에 기반하여 상기 사용자의 피처 벡터 및 상기 유사 콘텐츠들의 각각의 피처 벡터를 계산하는 단계를 포함할 수 있다.
상기 선호도를 계산하는 단계는 상기 유사도들을 가중치로서 상기 유사 콘텐츠들의 피처 벡터들의 가중 평균을 계산함으로써 상기 업데이트된 콘텐츠의 피처 벡터를 계산하는 단계를 포함할 수 있다.
상기 선호도를 계산하는 단계는 상기 사용자의 피처 벡터 및 상기 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 상기 선호도를 계산하는 단계를 포함할 수 있다.
상기 콘텐츠 제공 방법은 상기 계산된 선호도가 소정의 값 이상인 경우, 상기 업데이트된 콘텐츠 또는 상기 업데이트된 콘텐츠와 관련된 정보를 상기 사용자에게 제공하는 단계를 더 포함할 수 있다.
상기 사용 정보는 상기 적어도 하나의 콘텐츠에 대한 하나 이상의 사용자들의 열람 정보를 포함할 수 있다.
상기 열람 정보는 상기 하나 이상의 사용자들의 상기 적어도 하나의 콘텐츠의 각각에 대한 열람 여부 또는 열람 횟수와 관련된 정보를 각 성분(element)으로서 포함하는 사용 정보 행렬일 수 있다.
상기 사용 정보를 업데이트하는 단계는 상기 사용 정보 행렬의 상기 하나 이상의 사용자들에 의해 콘텐츠가 열람되지 않은 것으로 나타나거나 열람 횟수가 소정의 값 이하인 것으로 나타나는 적어도 하나의 성분을 업데이트할 수 있다.
상기 선호도를 계산하는 단계는 상기 사용 정보 행렬에 기반하여 상기 적어도 하나의 콘텐츠를 열람한 사용자들의 각각의 피처 벡터를 각 행으로서 포함하는 사용자 피처 행렬 및 상기 유사 콘텐츠들의 각각의 피처 벡터를 각 열로서 포함하는 콘텐츠 피처 행렬을 획득하는 단계를 포함할 수 있다.
상기 선호도를 계산하는 단계는 상기 유사도들을 가중치로서 상기 콘텐츠 피처 행렬의 열들의 가중 평균을 계산함으로써 상기 업데이트된 콘텐츠의 피처 벡터를 계산하는 단계를 포함할 수 있다.
상기 선호도를 계산하는 단계는 상기 사용자의 피처 벡터를 나타내는 상기 사용자 피처 행렬의 행 벡터 및 상기 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 상기 선호도를 계산하는 단계를 포함할 수 있다.
상기 업데이트된 콘텐츠는 복수일 수 있다.
상기 유사 콘텐츠들을 식별하는 단계, 상기 사용 정보를 업데이트하는 단계 및 상기 선호도를 계산하는 단계는 상기 복수의 업데이트된 콘텐츠들의 각각에 대해 수행될 수 있다.
상기 콘텐츠 제공 방법은 상기 복수의 업데이트된 콘텐츠들 중 상기 사용자의 선호도가 소정의 값 이상인 업데이트된 콘텐츠 또는 상기 선호도가 소정의 값 이상인 업데이트된 콘텐츠와 관련된 정보를 상기 사용자에게 제공하는 단계를 더 포함할 수 있다.
상기 적어도 하나의 콘텐츠의 내용과 관련된 정보는 상기 적어도 하나의 콘텐츠가 포함하는 텍스트 정보를 포함할 수 있다.
상기 유사 콘텐츠들은 상기 적어도 하나의 콘텐츠가 포함하는 텍스트 정보 및 상기 업데이트된 콘텐츠의 텍스트 정보를 비교함으로써 식별될 수 있다.
상기 유사도들은 상기 업데이트된 콘텐츠의 텍스트 정보 및 상기 유사 콘텐츠들이 포함하는 텍스트 정보를 비교함으로써 계산될 수 있다.
상기 업데이트된 콘텐츠는 상기 식별하는 단계의 수행의 소정의 시간 이전에 생성된 콘텐츠로서 상기 사용자에 의해 열람되지 않은 콘텐츠일 수 있다.
상기 유사도들의 각각은 상기 업데이트된 콘텐츠에 대한 상기 유사 콘텐츠들의 각각의 상대적인 유사도 또는 유사 콘텐츠들 간의 상대적인 유사도일 수 있다.
상기 업데이트하는 단계는 상기 유사도들 및 기 저장된 상기 업데이트된 콘텐츠 및 상기 업데이트된 콘텐츠와 유사한 유사 콘텐츠들 간의 유사도들 중 적어도 하나에 기반하여 상기 사용 정보를 업데이트할 수 있다.
다른 일 측면에 있어서 적어도 하나의 콘텐츠의 내용과 관련된 정보에 기반하여 상기 적어도 하나의 콘텐츠로부터 상기 적어도 하나의 콘텐츠들 중 업데이트된 콘텐츠와 유사한 하나 이상의 유사 콘텐츠들을 식별하고, 상기 업데이트된 콘텐츠 및 상기 유사 콘텐츠들 간의 유사도들에 기반하여 상기 적어도 하나의 콘텐츠의 사용 정보를 업데이트하고, 상기 업데이트된 사용 정보에 기반하여 상기 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 제어부 및 출력부를 포함하고, 상기 제어부는 상기 계산된 선호도가 소정의 값 이상인 경우, 상기 출력부를 통해 상기 업데이트된 콘텐츠 또는 상기 업데이트된 콘텐츠와 관련된 정보를 상기 사용자에게 출력하는, 전자 장치가 제공된다.
사용자에 의해 열람되지 않은 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하고 계산된 사용자의 선호도에 기반하여 사용자의 선호도에 부합하는 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보가 사용자에게 제공됨으로써, 콘텐츠를 이용하는 사용자의 편의를 향상시킬 수 있는 방법 및 장치가 제공된다.
콘텐츠 제공자에 의해 제공되는 콘텐츠들 업데이트된 콘텐츠와 유사한 것으로 식별될 기대되는 후보 콘텐츠들을 식별하고 후보 콘텐츠들의 각각 및 업데이트된 콘텐츠 간의 유사도들 만을 계산함으로써, 사용자의 선호도에 부합하는 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 사용자에게 제공하는데 소요되는 시간을 줄일 수 있는 방법 및 장치가 제공된다.
도 1은 일 실시예에 따른 전자 장치를 나타낸다.
도 2는 일 예에 따른 콘텐츠 제공 방법을 나타내는 흐름도이다.
도 3은 일 예에 따른 업데이트된 콘텐츠와 유사한 유사 콘텐츠들을 식별하는 방법을 나타내는 흐름도이다.
도 4는 일 예에 따른 업데이트된 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 하나 이상의 후보 콘텐츠들을 식별하는 방법을 나타내는 흐름도이다.
도 5는 일 예에 따른 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 방법을 나타내는 흐름도이다.
도 6은 일 예에 따른 콘텐츠 제공자(140)로부터 제공되는 콘텐츠들 중 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 방법을 나타낸다.
도 7 및 도 8은 일 예에 따른 업데이트된 콘텐츠 제공 방법 및 기존 방법들 간의 시뮬레이션의 결과를 나타낸다.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 일 실시예에 따른 전자 장치를 나타낸다.
도 1에는 콘텐츠 제공자(140)로부터 콘텐츠 또는 콘텐츠와 관련된 정보를 수신하고 콘텐츠의 사용자(130)에게 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 제공하는 전자 장치(100)가 도시되었다.
콘텐츠 제공자(140)는 사용자(130)에게 적어도 하나의 콘텐츠를 제공할 수 있다. 콘텐츠 제공자(140)에 의해 제공되는 콘텐츠는 사용자(130)가 사용하는 콘텐츠로서 영상, 음성 및 화상의 정보를 포함하는 미디어 정보 또는 텍스트 정보를 포함하는 콘텐츠일 수 있다. 예컨대, 사용자(130)에게 제공되는 콘텐츠는 텍스트 정보를 포함하는 뉴스 콘텐츠일 수 있다. 텍스트 정보는 하나 이상의 형태소들로 구성된 문자 및 단어를 포함할 수 있다. 업데이트된 콘텐츠는 콘텐츠 제공자(140)에 의해 제공되는 콘텐츠들 중 최신의 콘텐츠일 수 있다. 또는, 업데이트된 콘텐츠는 사용자(130)에 의해 열람되지 않은 콘텐츠일 수 있다.
콘텐츠 제공자(140)는 예컨대, 콘텐츠를 제공하는 웹 사이트의 서버, 포털 사이트의 서버 또는 어플리케이션를 운영하는 서버일 수 있다.
사용자(130)에 대한 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보의 제공은 사용자(130)에 업데이트된 콘텐츠에 대한 접근의 허용 또는 제공일 수 있다. 예컨대, 사용자(130)는 전자 장치(100)로부터 업데이트된 콘텐츠에 대한 하이퍼링크를 수신할 수 있고, 수신된 하이퍼링크를 통해 업데이트된 콘텐츠를 열람할 수 있다.
사용자(130)는 콘텐츠 또는 콘텐츠와 관련된 정보를 수신하는 단말 또는 단말의 사용자일 수 있다. 단말은 유무선의 네트워크를 통해 콘텐츠 또는 콘텐츠와 관련된 정보를 수신할 수 있는 일체의 기기, 예컨대, 개인용 컴퓨터(personal computer), 노트북(notebook), 태블릿 PC 및 스마트폰 등을 포함할 수 있다.
전자 장치(100)는 콘텐츠 제공자(140)로부터 수신한 콘텐츠 또는 콘텐츠와 관련된 정보에 기반하여 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산하고 계산된 선호도를 사용하여 사용자(130)에게 업데이트된 콘텐츠 또는 업데이트된 콘텐츠에 대한 정보를 제공하는 장치일 수 있다. 예컨대, 전자 장치(100)는 콘텐츠 제공자(140)의 일부이거나, 콘텐츠에 대한 정보를 수집하는 장치로서 사용자(130)에게 업데이트된 콘텐츠에 대한 정보를 제공하는 장치일 수 있다. 또는, 전자 장치(100)는 사용자(130)에게 사용자(130)의 선호도에 부합하는 콘텐츠들을 추천하는 장치 또는 시스템일 수 있다. 말하자면, 전자 장치(100)에 의한 사용자(130)에의 콘텐츠의 제공 또는 콘텐츠와 관련된 정보의 제공은 사용자(130)에의 콘텐츠의 추천일 수 있다.
전자 장치(100)는 제어부(110) 및 출력부(120)를 포함할 수 있다.
제어부(110)는 전자 장치(100)의 구성 요소들을 관리할 수 있고, 전자 장치(100)가 사용하는 프로그램 또는 어플리케이션을 실행할 수 있다. 제어부(110)는 프로그램의 실행 및 데이터의 처리 등에 필요한 연산을 처리하는 장치로서 예컨대, 전자 장치(100)의 적어도 하나의 프로세서(processor) 또는 프로세서 내의 적어도 하나의 코어(core)일 수 있다. 제어부(110)는 콘텐츠 제공자(140)로부터 수신한 콘텐츠 또는 콘텐츠와 관련된 정보에 기반하여 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산할 수 있다. 예컨대, 제어부(110)는 콘텐츠 제공자(140)가 제공하는 콘텐츠들의 사용자들에 의한 사용 정보 및 콘텐츠들의 내용과 관련된 정보에 기반하여 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산할 수 있다.
제어부(110)는 출력부(120)를 통해 선호도가 소정의 값 이상인 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 출력함으로써 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 사용자(130)에게 제공할 수 있다. 예컨대, 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보는 사용자(130)의 단말 상에 사용자(130)가 식별 가능한 형태로 출력될 수 있다. 사용자(130)는 제공된 업데이트된 콘텐츠를 이용하거나, 제공된 콘텐츠과 관련된 정보를 통해 선호도가 높은 분야 또는 관심 있는 분야의 업데이트된 콘텐츠에 접근할 수 있다.
제어부(110)가 업데이트된 콘텐츠에 대한 사용자(130)의 선호도를 계산하고, 출력부(120)를 통해 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 사용자(130)에게 제공하는 방법에 대해서는 후술될 도 2 내지 도 6을 참조하여 더 자세하게 설명된다.
도 2는 일 예에 따른 콘텐츠 제공 방법을 나타내는 흐름도이다.
도 2에는 도 1을 참조하여 전술된 전자 장치(100)의 제어부(110)에 의해 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 중 업데이트된 콘텐츠에 대한 사용자(130)의 유사도가 계산되고, 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 사용자(130)에게 제공하는 방법이 도시되었다.
단계(210)에서, 제어부(110)는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠의 내용과 관련된 정보에 기반하여 적어도 하나의 콘텐츠로부터 적어도 하나의 콘텐츠 중 업데이트된 콘텐츠와 유사한 하나 이상의 유사 콘텐츠들을 식별할 수 있다. 예컨대, 제어부(110)는 콘텐츠 제공자(140)에 의해 제공되는 하나 이상의 콘텐츠들 및 업데이트 콘텐츠들 간의 유사성을 비교함으로써 이상의 유사 콘텐츠들을 식별할 수 있다. 유사 콘텐츠들의 식별은 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 중 유사 콘텐츠들의 추출일 수 있다.
콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠는 업데이트된 콘텐츠를 포함할 수 있다. 예컨대, 업데이트된 콘텐츠는 단계(210)의 수행의 소정의 시간 이전에 생성된 콘텐츠로서 사용자(130)에 의해 열람되지 않은 콘텐츠일 수 있다. 업데이트된 콘텐츠는 복수의 콘텐츠들일 수 있다. 말하자면, 업데이트된 콘텐츠는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 중 최신(latest)의 콘텐츠들일 수 있다.
콘텐츠의 내용과 관련된 정보는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠가 포함하는 화상 정보, 영상 정보, 음성 정보 및 텍스트 정보 중 적어도 하나를 포함할 수 있다. 예컨대, 제어부(110)에 의해 적어도 하나의 콘텐츠로부터 식별된 유사 콘텐츠들은 적어도 하나의 콘텐츠가 포함하는 텍스트 정보 및 업데이트된 콘텐츠의 텍스트 정보를 비교함으로써 식별될 수 있다. 말하자면, 제어부(110)는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠가 포함하는 단어 또는 형태소 및 업데이트된 콘텐츠가 포함하는 단어 또는 형태소를 비교함으로써 유사 콘텐츠들을 식별할 수 있다.
제어부(110)가 유사 콘텐츠들을 식별하는 방법에 대해서는 후술될 도 3 및 도 4를 참조하여 더 자세하게 설명된다.
단계(230)에서, 제어부(110)는 업데이트된 콘텐츠 및 유사 콘텐츠들 간의 유사도들에 기반하여 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠의 사용 정보를 업데이트할 수 있다. 상기 계산된 유사도들의 각각은 예컨대, 업데이트된 콘텐츠에 대한 각 유사 콘텐츠의 상대적인 유사도 또는 유사 콘텐츠들 간의 상대적인 유사도일 수 있다. 업데이트된 콘텐츠 및 유사 콘텐츠들 간의 유사도들은 업데이트된 콘텐츠의 텍스트 정보 및 유사 콘텐츠들이 포함하는 텍스트 정보를 서로 비교함으로써 계산될 수 있다. 예컨대, 유사도들은 자카드 유사도(jaccard similarity)를 사용하여 계산될 수 있다.
계산된 유사도들은 전자 장치(100)의 저장부(미도시)에 저장될 수 있다. 저장부는 데이터를 저장하기 위한 여하한 저장 장치일 수 있다. 저장부에 저장된 유사도들은 콘텐츠의 사용 정보를 업데이트하기 위해 사용될 수 있다. 예컨대, 제어부(110)는 계산된 업데이트된 콘텐츠 및 유사 콘텐츠들 간의 유사도들 및 저장부에 기 저장된 업데이트된 콘텐츠 및 유사 콘텐츠들 간의 유사도들 중 적어도 하나에 기반하여 콘텐츠의 사용 정보를 업데이트할 수 있다. 제어부(110)는 기 저장된 유사도들을 사용 정보의 업데이트에 활용함으로써 사용 정보의 업데이트에 요구되는 부하를 줄일 수 있다.
콘텐츠의 사용 정보는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠에 대한 하나 이상의 사용자들의 열람 정보를 포함할 수 있다. 열람 정보는 콘텐츠 제공자(140)에 의해 제공되는 각 콘텐츠가 사용자에 의해 열람되었는지 여부 및/또는 사용자들에 의해 열람된 횟수를 나타내는 정보를 포함할 수 있다. 예컨대, 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠에 대한 열람 정보는 하나 이상의 사용자들의 적어도 하나의 콘텐츠의 각각에 대한 열람 여부 또는 열람 횟수와 관련된 정보를 각 성분(element)으로서 포함하는 사용 정보 행렬일 수 있다. 또는, 사용 정보 행렬의 각 성분은 제공자(140)에 의해 제공되는 각 콘텐츠에 대한 사용자들의 클릭 정보(예컨대, 클릭 횟수 또는 클릭 로그)를 포함할 수 있다.
사용 정보 행렬 R은 예컨대, 하기의 수학식 1에 의해 표현될 수 있다.
Figure pat00001
사용 정보 행렬 RM*N 크기의 행렬일 수 있고, M은 사용자의 수로서 1 이상의 정수일 수 있고, N은 콘텐츠의 개수로서 1 이상의 정수일 수 있고, r ui 는 행렬 R의 1 이상 M이하의 정수 u 번째 행 및 i 번째 열의 성분의 값을 나타낼 수 있다. 예컨대, r ui u 번째 사용자의 i 번째 콘텐츠의 열람(또는 클릭) 여부 또는 열람 횟수를 나타낼 수 있다.
사용 정보 행렬의 성분들 중, 업데이트된 콘텐츠를 나타내는 성분 또는 사용자들에 의해 상대적으로 더 적게 열람된 콘텐츠를 나타내는 성분은 그 값이 0이거나 또는 상대적으로 더 많이 열람된 콘텐츠를 나타내는 성분의 값보다 더 작을 수 있다.
제어부(110)는 사용 정보 행렬의 하나 이상의 사용자들에 의해 콘텐츠가 열람되지 않은 것으로 나타나거나 열람 횟수가 소정의 값 이하인 것으로 나타나는 적어도 하나의 성분을 업데이트할 수 있다. 제어부(110)는 단계(230)의 유사 콘텐츠들의 유사도들 기반하여 사용 정보 행렬의 콘텐츠가 열람되지 않은 것으로 나타나거나 열람 횟수가 소정의 값 이하인 것으로 나타나는 성분의 값을 업데이트 할 수 있다. 임의의 사용자에 의해 열람된 콘텐츠와 유사한(유사도가 높은) 콘텐츠에 대한 선호도는 상기 열람된 콘텐츠의 선호도와 동일 또는 유사한 것으로 가정될 수 있고, 이러한 유사한 콘텐츠는 상기 사용자에 의해 상기 열람된 콘텐츠와 동일하게 열람될 것으로 가정될 수 있으므로, 제어부(110)는 예컨대, 사용 정보 행렬의 콘텐츠가 열람되지 않은 것으로 나타나거나 열람 횟수가 소정의 값 이하인 것으로 나타나는 성분의 값을 상기 성분에 대응하는 콘텐츠와 유사한(유사도가 소정의 값 이상인) 콘텐츠에 대응하는 다른 성분의 값으로서 업데이트할 수 있다.
단계(240)에서, 제어부(110)는 단계(230)에서 업데이트된 사용 정보에 기반하여 업데이트된 콘텐츠에 대한 사용자(130)의 선호도를 계산할 수 있다. 예컨대, 제어부(110)는 업데이트된 사용 정보 및 업데이트된 콘텐츠 및 상기 유사 콘텐츠들 간의 유사도들로부터 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산할 수 있다.
제어부(110)가 업데이트된 콘텐츠에 대한 사용자(130)의 선호도를 계산하는 방법에 대해서는 후술될 도 5 및 도 6을 참조하여 더 자세하게 설명된다.
단계(250)에서, 제어부(110)는 단계(240)에서 계산된 업데이트 콘텐츠에 대한 선호도가 소정의 값 이상인지 여부를 판단할 수 있다.
단계(260)에서, 제어부(110)는 단계(240)에서 계산된 업데이트 콘텐츠에 대한 선호도가 소정의 값 이상인 경우, 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 사용자(130)에게 제공할 수 있다. 예컨대, 제어부(110)는 업데이트 콘텐츠에 대한 사용자(130)의 선호도가 소정의 값 이상이면 사용자(130)의 단말로 출력부(120)를 통해 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 출력할 수 있다. 사용자(130)는 제공된 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 통해 콘텐츠를 식별 및 이용할 수 있다.
단계(240)에서 계산된 업데이트 콘텐츠에 대한 선호도가 소정의 값 미만인 경우 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보는 사용자(130)에게 제공되지 않을 수 있다.
업데이트된 콘텐츠가 복수인 경우, 전술된 단계들(210 내지 240)은 복수의 업데이트된 콘텐츠들의 각각에 대해 수행될 수 있다. 이 때, 복수의 업데이트된 콘텐츠들 중 사용자(130)의 선호도가 소정의 값 이상인 업데이트된 콘텐츠 또는 또는 사용자(130)의 선호도가 소정의 값 이상인 업데이트된 콘텐츠와 관련된 정보는 사용자(130)에게 제공될 수 있다.
앞서 도 1을 참조하여 설명된 기술적 내용들이 그대로 적용될 수 있으므로, 보다 상세한 설명은 이하 생략하기로 한다.
도 3은 일 예에 따른 업데이트된 콘텐츠와 유사한 유사 콘텐츠들을 식별하는 방법을 나타내는 흐름도이다.
도 3에는 도 2를 참조하여 전술된 콘텐츠 제공자(140)에 의해 제공되는 콘텐츠들의 내용과 관련된 정보에 기반하여 상기 콘텐츠들로부터 업데이트된 콘텐츠와 유사한 유사 콘텐츠들이 식별되는 방법이 도시되었다. 후술될 단계들(310 및 320)은 전술된 단계(210)에 포함될 수 있다.
단계(310)에서, 제어부(110)는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 중 데이트된 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 하나 이상의 후보 콘텐츠들을 식별할 수 있다. 제어부(110)는 예컨대, 민해쉬(Minhash)법 및 국소 민감 해슁(Locality Sensitive Hashing; LSH)법을 사용하여 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 중 업데이트 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 후보 콘텐츠들을 식별할 수 있다. 이 때, 콘텐츠 제공자(140)에 의해 제공되는 콘텐츠의 사용 정보는 예컨대, 후보 콘텐츠들 간의 유사도들에 기반하여 업데이트될 수 있다.
제어부(110)는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 후보 콘텐츠들을 식별하고, 식별된 후보 콘텐츠들에 대해서만 비교를 수행하여 유사도들을 계산함으로써 컨텐츠들 간의 유사도들을 계산하기 위해 요구되는 전자 장치(100)의 부하를 감소시킬 수 있다.
제어부(110)가 후보 콘텐츠들을 식별하는 방법에 대해서는 후술될 도 4를 참조하여 더 자세하게 설명된다.
단계(320)에서, 제어부(110)는 후보 콘텐츠들의 각각 및 업데이트된 콘텐츠 간의 유사도들을 계산함으로써 업데이트된 콘텐츠와 유사한 유사 콘텐츠들을 식별할 수 있다. 식별된 유사 콘텐츠들은 단계(210)을 참조하여 전술된 유사 콘텐츠들에 대응할 수 있다.
또는, 단계(310)의 후보 콘텐츠들은 단계(210)을 참조하여 전술된 유사 콘텐츠들에 대응할 수 있고, 단계(320)의 유사 콘텐츠들은 단계(210)를 참조하여 전술된 유사 콘텐츠들 중 유사도가 소정의 값 이상이거나 유사도가 높은 순서로 소정의 개수만큼 선택된 유사 콘텐츠들일 수 있다.
제어부(110)는 자카드 유사도를 사용하여 후보 콘텐츠들의 각각 및 업데이트된 콘텐츠 간의 유사도들을 계산함으로써 유사도가 소정의 값 이상인 유사 콘텐츠들을 식별할 수 있다. 또는, 제어부(110)는 자카드 유사도를 사용하여 후보 콘텐츠들의 각각 및 업데이트된 콘텐츠 간의 유사도들을 계산함으로써 유사도가 높은 순서로 소정의 개수의 유사 콘텐츠들을 선택할 수 있다. 식별 또는 선택된 유사 콘텐츠들 및 업데이트된 콘텐츠 간의 유사도들은 콘텐츠의 사용 정보를 업데이트하고 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산하기 위해 사용될 수 있다.
앞서 도 1 및 도 2를 참조하여 설명된 기술적 내용들이 그대로 적용될 수 있으므로, 보다 상세한 설명은 이하 생략하기로 한다.
도 4는 일 예에 따른 업데이트된 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 하나 이상의 후보 콘텐츠들을 식별하는 방법을 나타내는 흐름도이다.
도 4에는 도 3를 참조하여 전술된 단계(310)가 더 자세하게 설명된다. 후술될 단계들(410 및 420)은 단계(310)에 포함될 수 있다.
단계(410)에서, 제어부(110)는 콘텐츠 제공자(140)에 의해 제공되는 적어도 하나의 콘텐츠 및 업데이트된 콘텐츠 간의 비교를 위해 사용되는 콘텐츠의 내용과 관련된 정보를 포함하는 벡터들의 차원을 감소시킬 수 있다. 예컨대, 제어부(110)는 Minhash법을 사용하여 비교를 위해 사용되는 벡터들의 차원을 감소시킬 수 있다. 제어부(110)는 Minhash법을 사용하여 콘텐츠의 내용을 나타내는 벡터를 더 낮은 차원의 벡터로 변환할 수 있다.
콘텐츠의 내용을 나타내는 벡터
Figure pat00002
는 하기의 수학식 2에 의해 표현될 수 있고, 차원이 감소된 벡터
Figure pat00003
는 하기의 수학식 3에 의해 표현될 수 있다.
Figure pat00004
m은 콘텐츠 i가 포함하는 전체 단어의 개수일 수 있다. t j 는 예컨대, 단어 j가 콘텐츠 i에 포함되면 1의 값을 가질 수 있고, 단어 j가 콘텐츠 i에 포함되지 않으면 0의 값을 가질 수 있다.
Figure pat00005
차원이 감소된 벡터
Figure pat00006
는h 차원의 시그니처일 수 있다. hm 이하의 정수일 수 있다.
Figure pat00007
의 인자들을
Figure pat00008
의 인자들로 변환하기 위해서는, h가지의 임의의 치환 방법(random permutation)이 요구될 수 있다.
단계(420)에서, 제어부(110)는 해쉬 함수를 사용하여 단계(410)에서 차원이 감소된 벡터들 중 업데이트된 콘텐츠의 내용과 관련된 정보를 포함하는 벡터들과 유사한 벡터들을 식별할 수 있다. 예컨대, 제어부(110)는 LSH법을 사용하여 업데이트된 콘텐츠의 내용과 관련된 정보를 포함하는 벡터들과 유사한 벡터들을 식별할 수 있다. LSH 법은 벡터들 간의 유사도 계산 시, 유사할 가능성이 높은 벡터들의 집합을 해쉬 함수를 이용하여 빠르게 찾기 위한 근사(approximation)방법일 수 있다.
제어부(110)는 단계(410)에서 차원이 감소된 벡터들을 하나 이상의 밴드들로 분할할 수 있고, LSH법을 사용하여 각 밴드에 해쉬 함수를 적용함으로써 각 밴드를 해쉬 버켓(bucket)으로 매핑할 수 있다. 각 밴드는 차원이 감소된 벡터가 분할된 벡터일 수 있다. 이 때, 해쉬 함수는 동일한 값을 갖는 밴드들의 경우, 동일한 해쉬 버켓으로 매핑되도록 정의될 수 있다. 예컨대, 제어부(110)는 뉴스와 동일한 버켓에 포함된 밴드들이 나타내는 콘텐츠들을 유사한 콘텐츠들로서 간주할 수 있다. 제어부(110)는 업데이트된 콘텐츠와 유사한 콘텐츠들을 식별함으로써 후보 콘텐츠들을 식별할 수 있다.
앞서 도 1 내지 도 3을 참조하여 설명된 기술적 내용들이 그대로 적용될 수 있으므로, 보다 상세한 설명은 이하 생략하기로 한다.
도 5는 일 예에 따른 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 방법을 나타내는 흐름도이다.
도 4에는 도 2를 참조하여 전술된 단계(240)가 더 자세하게 설명된다. 후술될 단계들(510 및 530)은 단계(260)에 포함될 수 있다.
단계(510)에서, 제어부(110)는 단계(230)에서 업데이트된 사용 정보에 기반하여 사용자(130)의 피처 벡터 및 유사 콘텐츠들의 각각의 피처 벡터를 계산할 수 있다. 또는, 제어부(110)는 단계(230)에서 업데이트된 사용 정보 및 업데이트된 콘텐츠 및 유사 콘텐츠들의 각각 간의 유사도들로부터 사용자(130)의 피처 벡터 및 각 유사 콘텐츠의 피처 벡터를 계산할 수 있다. 피처 벡터는 사용자의 고유한 특징을 나타내는 벡터일 수 있고, 콘텐츠의 피처 벡터는 콘텐츠의 고유한 특징을 나타내는 벡터일 수 있다. 또는, 사용자(130)의 피처 벡터의 요소들의 값들 및 콘텐츠의 피처 벡터의 요소들의 값들은 사용자(130) 및 콘텐츠가 각각 사용자(130)의 잠재 인자(latent factor) 및 고유값과 연관된 정도 및 콘텐츠의 잠재 인자(latent factor) 및 고유값과 연관된 정도를 나타낼 수 있다.
또는, 제어부(110)는 사용 정보가 포함하는 사용 정보 행렬에 기반하여 콘텐츠 제공자(140)가 제공하는 콘텐츠를 열람한 사용자들의 각각의 피처 벡터를 각 행으로서 포함하는 사용자 피처 행렬 및 유사 콘텐츠들의 각각의 피처 벡터를 각 열로서 포함하는 콘텐츠 피처 행렬을 획득할 수 있다. 또는, 제어부(110)는 사용 정보 행렬 및 업데이트된 콘텐츠 및 유사 콘텐츠들의 각각 간의 유사도들로부터 콘텐츠 제공자(140)가 사용자 피처 행렬 및 콘텐츠 피처 행렬을 획득할 수 있다. 예컨대, 제어부(110)는 확률 행렬 인수분해(Probabilistic Matrix Factorization; PMF) 모델을 사용하여 사용자 피처 행렬 및/또는 콘텐츠 피처 행렬을 획득할 수 있다.
사용자 피처 행렬은 콘텐츠 제공자(140)가 제공하는 콘텐츠를 열람한 사용자들의 각각의 피처 벡터를 각 행으로서 포함할 수 있고, 콘텐츠 피처 행렬은 단계(210) 또는 단계(320)의 유사 콘텐츠들의 각각의 피처 벡터를 각 열로서 포함할 수 있다.
단계(520)에서, 제어부(110)는 업데이트된 콘텐츠 및 유사 콘텐츠들의 각각 간의 유사도들을 가중치로서 유사 콘텐츠들의 피처 벡터들의 가중 평균을 계산함으로써 업데이트된 콘텐츠의 피처 벡터를 계산할 수 있다. 또는, 제어부(110)는 업데이트된 콘텐츠 및 유사 콘텐츠들의 각각 간의 유사도들을 가중치로서 콘텐츠 피처 행렬의 열들의 가중 평균을 계산함으로써 업데이트된 콘텐츠의 피처 벡터를 계산할 수 있다. 예컨대, 업데이트된 콘텐츠의 피처 벡터 v l 은 하기의 수학식 4에 의해 계산될 수 있다.
Figure pat00009
여기서,
Figure pat00010
는 업데이트된 콘텐츠 l k 개의 유사 콘텐츠들의 집합일 수 있고, ii 번째 유사 콘텐츠를 나타낼 수 있고, v i i 번째 유사 콘텐츠의 피처 벡터일 수 있다. sim(i, l)은 업데이트된 콘텐츠 li 번째 유사 콘텐츠 간의 유사도를 나타낼 수 있다. sim(i, l)는 자카드 유사도에 의해 계산될 수 있다.
단계(530)에서, 제어부(110)는 사용자(130)의 피처 벡터 및 단계(520)에서 계산된 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산할 수 있다. 또는, 제어부(110)는 사용자(130)의 피처 벡터를 나타내는 사용자 피처 행렬의 행 벡터 및 단계(520)에서 계산된 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산할 수 있다.
제어부(110)는 피처 벡더들 간의 내적 값이 클수록 사용자(130)의 업데이트된 콘텐츠에 대한 선호도가 더 큰 것으로 간주할 수 있다.
제어부(110)는 내적 값의 크기가 소정의 값 이상이면 출력부(120)를 통해 사용자(130)에게 업데이트된 콘텐츠 또는 업데이트된 콘텐츠와 관련된 정보를 제공할 수 있다.
앞서 도 1 내지 도 4를 참조하여 설명된 기술적 내용들이 그대로 적용될 수 있으므로, 보다 상세한 설명은 이하 생략하기로 한다.
도 6은 일 예에 따른 콘텐츠 제공자(140)로부터 제공되는 콘텐츠들 중 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 방법을 나타낸다.
도 6에는 도 1 내지 도 5를 참조하여 전술된 콘텐츠 제공자(140) 및 전자 장치(100)가 도시되었다.
도시된 것처럼, 콘텐츠 제공자(140)에 의해 제공되는 콘텐츠들은 업데이트된 콘텐츠 및 기존 콘텐츠들을 포함할 수 있다. 또한, 콘텐츠 제공자(140)는 사용자들의 콘텐츠들에 대한 사용 정보(또는 열람 정보)를 저장할 수 있다.
전자 장치(100)의 제어부(110)는 Minhash법 및 LSH법을 사용하여 콘텐츠 제공자(140)에 의해 제공되는 콘텐츠들로부터 업데이트 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 후보 콘텐츠들을 식별할 수 있다. 또한, 제어부(110)는 후보 콘텐츠들 간의 유사도들을 계산할 수 있고, 계산된 유사도들을 전자 장치(100)의 저장부(미도시)에 저장할 수 있다. 제어부(110)는 기 계산되어 저장된 콘텐츠들 간의 유사도들 및 계산된 콘텐츠들 간의 유사도들을 사용하여 콘텐츠들에 대한 사용 정보 행렬을 업데이트할 수 있다. 콘텐츠들 간의 유사도들의 계산에는 자카드 유사도가 사용될 수 있다.
제어부(110)는 후보 콘텐츠들 중 업데이트된 콘텐츠와의 유사도가 소정의 값 이상인 k개의 유사 콘텐츠들을 식별할 수 있다.
제어부(110)는 PMF 모델을 사용하여 업데이트된 사용 정보 행렬로부터 사용자들의 각 피처 벡터를 각 행으로서 포함하는 사용자 피처 행렬 및 k개의 유사 콘텐츠들의 각 피처 벡터를 각 열로서 포함하는 콘텐츠 피처 행렬을 획득할 수 있다. 제어부(110)는 도 5를 참조하여 전술된 수학식 4를 사용하여 콘텐츠 피처 행렬의 열들의 가중 평균을 계산함으로써 업데이트된 콘텐츠의 피처 벡터를 획득할 수 있다.
제어부(110)는 사용자(130)의 피처 벡터를 나타내는 사용자 피처행렬의 행 벡터 및 계산된 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 사용자(130)의 업데이트된 콘텐츠에 대한 선호도를 계산할 수 있다.
앞서 도 1 내지 도 5를 참조하여 설명된 기술적 내용들이 그대로 적용될 수 있으므로, 보다 상세한 설명은 이하 생략하기로 한다.
도 7 및 도 8은 일 예에 따른 업데이트된 콘텐츠 제공 방법 및 기존 방법들 간의 시뮬레이션의 결과를 나타낸다.
도 7 및 도 8에는 뉴스 포탈 사이트인 Paoin.com으로부터 실제 뉴스 콘텐츠들을 수집함으로써, 실시예의 콘텐츠 제공 방법 및 기존의 방법들 간의 성능 평가를 위해 수행된 시뮬레이션의 결과가 도시되었다.
비교 대상인 기존의 방법들로는 구글 뉴스 개인화(Google News Personalization; GNP) 방법, MinHash법 및 LSH법을 사용한 방법 및 하이브리드 기반 뉴스 추천 방법인 SCENE가 사용되었다.
시뮬레이션에서는 4월 6일부터 5월 14일까지의 Paoin.com의 뉴스 콘텐츠들에 대해 슬라이딩 윈도우 방식으로 30개의 트레이닝 세트 및 테스트 세트를 구성하여 정밀도 평가가 수행되었다. 트레이닝 세트는 7일 동안 업데이트된 뉴스 콘텐츠들 및 그 뉴스 콘텐츠드을 클릭한 정보일 수 있고, 테스트 세트는 트레이닝 세트 다음 1일 동안 업데이트된 뉴스 콘텐츠들 및 그 뉴스 콘텐츠들을 클릭한 정보일 수 있다.
또한, 시뮬레이션에서는 5 또는 10개 이상의 뉴스 콘텐츠를 클릭한 사용자들에게 10, 20, 50 및 100개의 뉴스 콘텐츠가 제공되었다.
최종적으로는 30개의 세트들에 대해 획득된 정밀도들의 평균이 결과 값으로 사용되었다. 정밀도가 더 높을 수록 사용자의 선호도에 더 부합하는 업데이트된 뉴스 콘텐츠가 제공된 것으로 간주될 수 있다.
도 7 및 도 8의 X축은 사용자에게 제공된 업데이트된 뉴스 콘텐츠의 수를 나타낼 수 있고, Y축은 정밀도를 나타낼 수 있다.
도 7은 5개의 뉴스 콘텐츠를 클릭한 사용자에게 업데이트된 뉴스 콘텐츠를 제공한 경우의 결과를 나타내고, 도 8은 10개 이상의 뉴스 콘텐츠를 클릭한 사용자에게 업데이트된 뉴스 콘텐츠를 제공한 경우의 결과를 나타낸다.
도 7 및 도 8의 비교를 통해 사용자가 더 많은 뉴스 콘텐츠를 클릭할 수록 업데이트된 뉴스 콘텐츠의 제공의 정밀도가 높아질 수 있다.
도 7 및 도 8에서 모두 실시예의 콘텐츠 제공 방법의 정밀도가 기존의 방법들 보다 더 높음을 확인할 수 있다.
하기의 표 1은 실시예의 방법 및 기존의 방법들의 사용자에 대한 뉴스 콘텐츠의 제공에 소요된 시간을 측정한 결과를 나타낸다.
방법들 시간(초)
내용 기반 추천 시스템(CBR) 18.45
GNP -
SCENE 107.18
실시예의 방법 34.34
실시예의 방법이 SCENE에 비해 소요된 시간이 3배 적음을 확인할 수 있다. 내용 기반 추천 시스템(CBR)은 실시예의 방법의 일부를 구성하기 때문에 실시예의 방법보다 소요된 시간이 더 적을 수 있다.
GNP의 경우에는, 클릭이 없는 업데이트된 뉴스 콘텐츠가 사용자에게 추천될 수 없기 때문에 도 7 및 도 8에서 정밀도가 0으로 나타나고, 표 1에서 시간이 계산될 수 없었다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
100: 전자 장치
110: 제어부
120: 출력부
130: 사용자
140: 콘텐츠 제공자

Claims (16)

  1. 적어도 하나의 콘텐츠의 내용과 관련된 정보에 기반하여 상기 적어도 하나의 콘텐츠로부터 상기 적어도 하나의 콘텐츠 중 업데이트된 콘텐츠와 유사한 하나 이상의 유사 콘텐츠들을 식별하는 단계;
    상기 업데이트된 콘텐츠 및 상기 유사 콘텐츠들 간의 유사도들에 기반하여 상기 적어도 하나의 콘텐츠의 사용 정보를 업데이트하는 단계; 및
    상기 업데이트된 사용 정보에 기반하여 상기 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 단계
    를 포함하는, 콘텐츠 제공 방법.
  2. 제1항에 있어서,
    상기 유사 콘텐츠들을 식별하는 단계는
    상기 적어도 하나의 콘텐츠 중 상기 업데이트된 콘텐츠와 유사한 것으로 식별될 것으로 기대되는 하나 이상의 후보 콘텐츠들을 식별하는 단계; 및
    상기 후보 콘텐츠들의 각각 및 상기 업데이트된 콘텐츠 간의 유사도들을 계산함으로써 상기 업데이트된 콘텐츠와 유사한 유사 콘텐츠들을 식별하는 단계
    를 포함하는, 콘텐츠를 제공하는 방법.
  3. 제2항에 있어서,
    상기 후보 콘텐츠들을 식별하는 단계는
    상기 적어도 하나의 콘텐츠 및 상기 업데이트된 콘텐츠 간의 비교를 위해 사용되는 상기 내용과 관련된 정보를 포함하는 벡터들의 차원을 감소시키는 단계; 및
    해쉬 함수를 사용하여 상기 차원이 감소된 벡터들 중 상기 업데이트된 콘텐츠의 내용과 관련된 정보를 포함하는 벡터들과 유사한 벡터들을 식별하는 단계
    를 포함하는, 콘텐츠 제공 방법.
  4. 제1항에 있어서,
    상기 선호도를 계산하는 단계는
    상기 업데이트된 사용 정보에 기반하여 상기 사용자의 피처 벡터 및 상기 유사 콘텐츠들의 각각의 피처 벡터를 계산하는 단계;
    상기 유사도들을 가중치로서 상기 유사 콘텐츠들의 피처 벡터들의 가중 평균을 계산함으로써 상기 업데이트된 콘텐츠의 피처 벡터를 계산하는 단계; 및
    상기 사용자의 피처 벡터 및 상기 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 상기 선호도를 계산하는 단계
    를 포함하는, 콘텐츠 제공 방법.
  5. 제1항에 있어서,
    상기 계산된 선호도가 소정의 값 이상인 경우, 상기 업데이트된 콘텐츠 또는 상기 업데이트된 콘텐츠와 관련된 정보를 상기 사용자에게 제공하는 단계
    를 더 포함하는, 콘텐츠 제공 방법.
  6. 제1항에 있어서,
    상기 사용 정보는 상기 적어도 하나의 콘텐츠에 대한 하나 이상의 사용자들의 열람 정보를 포함하는, 콘텐츠 제공 방법.
  7. 제6항에 있어서,
    상기 열람 정보는 상기 하나 이상의 사용자들의 상기 적어도 하나의 콘텐츠의 각각에 대한 열람 여부 또는 열람 횟수와 관련된 정보를 각 성분(element)으로서 포함하는 사용 정보 행렬인, 콘텐츠 제공 방법.
  8. 제7항에 있어서,
    상기 사용 정보를 업데이트하는 단계는
    상기 사용 정보 행렬의 상기 하나 이상의 사용자들에 의해 콘텐츠가 열람되지 않은 것으로 나타나거나 열람 횟수가 소정의 값 이하인 것으로 나타나는 적어도 하나의 성분을 업데이트하는, 콘텐츠 제공 방법.
  9. 제7항에 있어서,
    상기 선호도를 계산하는 단계는
    상기 사용 정보 행렬에 기반하여 상기 적어도 하나의 콘텐츠를 열람한 사용자들의 각각의 피처 벡터를 각 행으로서 포함하는 사용자 피처 행렬 및 상기 유사 콘텐츠들의 각각의 피처 벡터를 각 열로서 포함하는 콘텐츠 피처 행렬을 획득하는 단계;
    상기 유사도들을 가중치로서 상기 콘텐츠 피처 행렬의 열들의 가중 평균을 계산함으로써 상기 업데이트된 콘텐츠의 피처 벡터를 계산하는 단계; 및
    상기 사용자의 피처 벡터를 나타내는 상기 사용자 피처 행렬의 행 벡터 및 상기 업데이트된 콘텐츠의 피처 벡터를 내적함으로써 상기 선호도를 계산하는 단계
    를 포함하는, 콘텐츠 제공 방법.
  10. 제1항에 있어서,
    상기 업데이트된 콘텐츠는 복수이고,
    상기 유사 콘텐츠들을 식별하는 단계, 상기 사용 정보를 업데이트하는 단계 및 상기 선호도를 계산하는 단계는 상기 복수의 업데이트된 콘텐츠들의 각각에 대해 수행되는, 콘텐츠 제공 방법.
  11. 제10항에 있어서,
    상기 복수의 업데이트된 콘텐츠들 중 상기 사용자의 선호도가 소정의 값 이상인 업데이트된 콘텐츠 또는 상기 선호도가 소정의 값 이상인 업데이트된 콘텐츠와 관련된 정보를 상기 사용자에게 제공하는 단계
    를 더 포함하는, 콘텐츠 제공 방법.
  12. 제1항에 있어서,
    상기 적어도 하나의 콘텐츠의 내용과 관련된 정보는 상기 적어도 하나의 콘텐츠가 포함하는 텍스트 정보를 포함하고,
    상기 유사 콘텐츠들은 상기 적어도 하나의 콘텐츠가 포함하는 텍스트 정보 및 상기 업데이트된 콘텐츠의 텍스트 정보를 비교함으로써 식별되고,
    상기 유사도들은 상기 업데이트된 콘텐츠의 텍스트 정보 및 상기 유사 콘텐츠들이 포함하는 텍스트 정보를 비교함으로써 계산되는, 콘텐츠 제공 방법.
  13. 제1항에 있어서,
    상기 업데이트된 콘텐츠는 상기 식별하는 단계의 수행의 소정의 시간 이전에 생성된 콘텐츠로서 상기 사용자에 의해 열람되지 않은 콘텐츠인, 콘텐츠 제공 방법.
  14. 제1항에 있어서,
    상기 유사도들의 각각은 상기 업데이트된 콘텐츠에 대한 상기 유사 콘텐츠들의 각각의 상대적인 유사도 또는 유사 콘텐츠들 간의 상대적인 유사도인, 콘텐츠 제공 방법.
  15. 제1항에 있어서,
    상기 업데이트하는 단계는
    상기 유사도들 및 기 저장된 상기 업데이트된 콘텐츠 및 상기 업데이트된 콘텐츠와 유사한 유사 콘텐츠들 간의 유사도들 중 적어도 하나에 기반하여 상기 사용 정보를 업데이트하는, 콘텐츠 제공 방법.
  16. 적어도 하나의 콘텐츠의 내용과 관련된 정보에 기반하여 상기 적어도 하나의 콘텐츠로부터 상기 적어도 하나의 콘텐츠 중 업데이트된 콘텐츠와 유사한 하나 이상의 유사 콘텐츠들을 식별하고, 상기 업데이트된 콘텐츠 및 상기 유사 콘텐츠들 간의 유사도들에 기반하여 상기 적어도 하나의 콘텐츠의 사용 정보를 업데이트하고, 상기 업데이트된 사용 정보에 기반하여 상기 업데이트된 콘텐츠에 대한 사용자의 선호도를 계산하는 제어부; 및
    출력부
    를 포함하고,
    상기 제어부는 상기 계산된 선호도가 소정의 값 이상인 경우, 상기 출력부를 통해 상기 업데이트된 콘텐츠 또는 상기 업데이트된 콘텐츠와 관련된 정보를 상기 사용자에게 출력하는, 전자 장치.
KR1020140037804A 2014-03-31 2014-03-31 업데이트된 뉴스 콘텐츠 제공 방법 및 장치 KR101663359B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140037804A KR101663359B1 (ko) 2014-03-31 2014-03-31 업데이트된 뉴스 콘텐츠 제공 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140037804A KR101663359B1 (ko) 2014-03-31 2014-03-31 업데이트된 뉴스 콘텐츠 제공 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20150114087A true KR20150114087A (ko) 2015-10-12
KR101663359B1 KR101663359B1 (ko) 2016-10-07

Family

ID=54346864

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140037804A KR101663359B1 (ko) 2014-03-31 2014-03-31 업데이트된 뉴스 콘텐츠 제공 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101663359B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182351A (zh) * 2020-09-28 2021-01-05 哈尔滨工业大学(深圳) 一种基于多特征融合的新闻推荐方法及装置
KR20210110934A (ko) * 2020-03-02 2021-09-10 주식회사 엘지유플러스 추천 장치 및 이의 동작 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090090840A (ko) * 2008-02-22 2009-08-26 주식회사 솔트룩스 사용자 맞춤형 정보 제공 시스템 및 그 방법
KR101013942B1 (ko) * 2008-12-18 2011-02-14 경기대학교 산학협력단 추천 항목 제공 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090090840A (ko) * 2008-02-22 2009-08-26 주식회사 솔트룩스 사용자 맞춤형 정보 제공 시스템 및 그 방법
KR101013942B1 (ko) * 2008-12-18 2011-02-14 경기대학교 산학협력단 추천 항목 제공 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210110934A (ko) * 2020-03-02 2021-09-10 주식회사 엘지유플러스 추천 장치 및 이의 동작 방법
CN112182351A (zh) * 2020-09-28 2021-01-05 哈尔滨工业大学(深圳) 一种基于多特征融合的新闻推荐方法及装置

Also Published As

Publication number Publication date
KR101663359B1 (ko) 2016-10-07

Similar Documents

Publication Publication Date Title
CN110825957B (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
JP6615362B2 (ja) ユーザー似顔絵を取得する方法及び装置
CN109819284B (zh) 一种短视频推荐方法、装置、计算机设备及存储介质
CN106326391B (zh) 多媒体资源推荐方法及装置
JP6211605B2 (ja) クリックスルー率に基づく検索結果の順位付け
WO2018121700A1 (zh) 基于已安装应用来推荐应用信息的方法、装置、终端设备及存储介质
CN109753601B (zh) 推荐信息点击率确定方法、装置及电子设备
CN107704560B (zh) 一种信息推荐的方法、装置及设备
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN105531701A (zh) 个性化趋势图像搜索建议
US10019419B2 (en) Method, server, browser, and system for recommending text information
KR20170140226A (ko) 정보 검색 내비게이션 방법 및 장치
CN110275952A (zh) 基于用户短期兴趣的新闻推荐方法、装置及介质
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
CN112307344A (zh) 对象推荐模型、对象推荐方法、装置及电子设备
CN106452809B (zh) 一种数据处理方法和装置
KR101873339B1 (ko) 관심사 및 콘텐츠를 제공하는 방법 및 시스템
CN113569129A (zh) 点击率预测模型处理方法、内容推荐方法、装置及设备
Wang et al. CROWN: a context-aware recommender for web news
CN115329131A (zh) 素材标签推荐方法、装置、电子设备及存储介质
CN108563648B (zh) 数据显示方法和装置、存储介质及电子装置
KR101663359B1 (ko) 업데이트된 뉴스 콘텐츠 제공 방법 및 장치
KR20140140267A (ko) 복수의 키워드 추출 기법들을 이용하는 광고 노출 방법 및 광고 제공 장치
KR102372432B1 (ko) 클릭 및 노출 정보를 활용한 추천 콘텐츠 제공 방법, 장치 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
FPAY Annual fee payment

Payment date: 20190910

Year of fee payment: 4