KR101705810B1 - 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법 - Google Patents

뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법 Download PDF

Info

Publication number
KR101705810B1
KR101705810B1 KR1020150161694A KR20150161694A KR101705810B1 KR 101705810 B1 KR101705810 B1 KR 101705810B1 KR 1020150161694 A KR1020150161694 A KR 1020150161694A KR 20150161694 A KR20150161694 A KR 20150161694A KR 101705810 B1 KR101705810 B1 KR 101705810B1
Authority
KR
South Korea
Prior art keywords
topic
news
semantic
distribution
user
Prior art date
Application number
KR1020150161694A
Other languages
English (en)
Inventor
이상근
류우종
Original Assignee
고려대학교 산학협력단
(주)삼부시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단, (주)삼부시스템 filed Critical 고려대학교 산학협력단
Priority to KR1020150161694A priority Critical patent/KR101705810B1/ko
Application granted granted Critical
Publication of KR101705810B1 publication Critical patent/KR101705810B1/ko

Links

Images

Classifications

    • G06F17/30731
    • G06F17/2745
    • G06F17/2785
    • G06F17/30011
    • G06F17/30705

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 복수의 뉴스 문서 및 토픽 모델을 저장하는 데이터베이스, 스마트 단말과의 데이터 통신을 수행하는 통신 모듈, 시맨틱 뉴스 추천 프로그램이 저장된 메모리 및 메모리에 저장된 프로그램을 실행하는 프로세서를 포함한다. 이때, 프로세서는 프로그램의 실행에 따라, 통신 모듈을 통하여 스마트 단말로부터 수신한 스마트 단말을 사용하는 사용자의 관심사에 기초하여, 데이터베이스에 저장된 복수의 뉴스 문서로부터 사용자의 관심사에 대응하는 뉴스 문서를 추출하고, 추출된 뉴스 문서를 스마트 단말로 전달한다. 그리고 사용자의 관심사는 스마트 단말이 토픽 모델에 기초하여 생성한 것이며, 복수의 뉴스 문서는 복수의 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후, 데이터베이스에 저장된 것이다.

Description

뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법{SERVER, SMART DEVICE AND METHOD FOR NEWS RECOMMENDATION}
본 발명은 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법에 관한 것이다.
최근 텔레비전, 종이 신문, 라디오 및 잡지와 같은 전통적인 미디어를 이용한 뉴스 이용률이 해마다 감소하고 있다. 그러나 스마트폰 및 태블릿 디바이스와 같은 스마트 단말을 통한 뉴스 이용률은 해마다 증가하는 추세이다. 이러한 추세에 따라, 뉴스 제공 업체에서는 사용자의 관심사에 기반한 뉴스 추천 서비스를 제공하기 위한 기술 개발이 활발하게 이루어지고 있다.
일반적인 뉴스 추천 서비스는 인구통계학적 정보(demographical information)에 기반한 뉴스를 추천하는 서비스 및 동시 발생 빈도를 고려하여 현재 보고 있는 뉴스와 연관된 뉴스를 추천하는 서비스 등이 있다. 그러나 이러한 뉴스 추천 서비스는 추천을 제공 받는 대상 사용자의 관심사가 반영되지 않을 수 있다. 그러므로 사용자의 만족도가 저하될 수 있다.
개인화된 뉴스 추천 서비스는 크게 두 가지 방법이 있다. 첫 번째는 대상 사용자와 유사한 일반 대중이 많은 관심을 가지는 뉴스 문서를 대상 사용자에게 추천하는 협력적 여과 기반 추천(recommendation based on collaborative filtering) 방법이다. 협력적 여과 기반 추천 방법은 이미 구독한 뉴스 문서에 대한 정보가 적은 초기 사용자에게 추천의 정확도가 떨어진다는 초기 사용자 문제(cold start problem) 및 사용자의 수가 늘어나는 경우, 추천을 수행하기 위한 계산량이 증가하는 범위성(scalability) 문제 등이 있다.
또한, 두 번째 방법은 대상 사용자의 관심사를 분석하고, 분석된 대상 사용자의 관심사를 기반으로 연관된 개인화된 뉴스를 추천해주는 내용 기반 추천(content based filtering) 방법이 있다. 이 방법은 협력적 여과 기반의 추천 방법의 초기 사용자 문제 및 범위성 문제를 해소할 수 있으나, 협력적 여과 기반 추천 방법에 비하여 추천 정확도가 떨어진다는 단점이 있다.
이와 관련되어, 한국 공개특허공보 제10-2013-0061233호(발명의 명칭: "개인화된 키워드 정보를 포함하는 뉴스 제공시스템, 방법 및 그에 대한 기록매체")는 사용자 정보에 따라 판단되는 사용자의 개인화 유형에 따라 뉴스에 포함된 키워드를 선별하여 키워드와 관련된 정보를 얻을 수 있는 하이퍼링크를 제공함으로써, 사용자가 뉴스 정보와 함께 개인화된 정보를 제공받는 방법을 개시하고 있다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 뉴스 문서에 포함된 시맨틱 토픽 및 시맨틱 감성에 기반하여 사용자 맞춤형 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법을 제공한다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면에 따른 스마트 단말에 시맨틱 뉴스를 추천하는 서버는 복수의 뉴스 문서 및 토픽 모델을 저장하는 데이터베이스, 스마트 단말과의 데이터 통신을 수행하는 통신 모듈, 시맨틱 뉴스 추천 프로그램이 저장된 메모리 및 메모리에 저장된 프로그램을 실행하는 프로세서를 포함한다. 이때, 프로세서는 프로그램의 실행에 따라, 통신 모듈을 통하여 스마트 단말로부터 수신한 스마트 단말을 사용하는 사용자의 관심사에 기초하여, 데이터베이스에 저장된 복수의 뉴스 문서로부터 사용자의 관심사에 대응하는 뉴스 문서를 추출하고, 추출된 뉴스 문서를 스마트 단말로 전달한다. 그리고 사용자의 관심사는 스마트 단말이 토픽 모델에 기초하여 생성한 것이며, 복수의 뉴스 문서는 복수의 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후, 데이터베이스에 저장된 것이다.
본 발명의 제 2 측면에 따른 뉴스를 추천하는 시맨틱 뉴스 추천 스마트 단말은 시맨틱 뉴스 추천 서버와 데이터 통신을 수행하는 통신 모듈, 뉴스를 추천하는 프로그램이 저장된 메모리 및 메모리에 저장된 프로그램을 실행하는 프로세서를 포함한다. 이때, 프로세서는 프로그램의 실행에 따라, 통신 모듈을 통하여, 시맨틱 뉴스 추천 서버로부터 수신한 토픽 모델 및 스마트 단말에서 수집된 스마트 단말을 사용하는 사용자의 데이터에 기초하여, 사용자의 관심사를 추출하고, 통신 모듈을 통하여 추출된 사용자의 관심사를 시맨틱 뉴스 추천 서버로 전송하고, 시맨틱 뉴스 추천 서버로부터 사용자의 관심사에 대응하는 뉴스 문서를 수신한다. 그리고 사용자의 데이터는 스마트 단말의 로그 데이터 및 메시지 데이터를 포함하고, 토픽 모델은 시맨틱 뉴스 추천 서버를 통하여, 뉴스 문서 집합에 포함된 복수의 뉴스 문서로부터 추출된 단어 및 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 생성된다.
본 발명의 제 3 측면에 따른 서버의 시맨틱 뉴스 추천 방법은 스마트 단말로부터 수신한 사용자의 관심사에 기초하여, 데이터베이스에 저장된 복수의 뉴스 문서로부터 사용자의 관심사에 대응하는 뉴스 문서를 추출하는 단계; 및 뉴스 문서를 추출하는 단계로부터 추출된 뉴스 문서를 스마트 단말로 전송하는 단계를 포함한다. 이때, 사용자의 관심사는 스마트 단말이 데이터베이스에 저장된 토픽 모델에 기초하여 생성한 것이며, 복수의 뉴스 문서는 뉴스 문서 집합에 포함된 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후, 데이터베이스에 저장된 것이다.
본 발명의 제 4 측면에 따른 스마트 단말의 시맨틱 뉴스 추천 방법은 시맨틱 뉴스 추천 서버로부터 수신한 토픽 모델 및 스마트 단말을 사용하는 사용자의 데이터에 기초하여, 사용자의 관심사를 추출하는 단계; 사용자의 관심사를 추출하는 단계 이후에, 추출된 사용자의 관심사를 시맨틱 뉴스 추천 서버로 전송하는 단계; 및 사용자의 관심사를 시맨틱 뉴스 추천 서버로 전송하는 단계 이후에, 사용자의 관심사에 대응하는 뉴스 문서를 수신하는 단계를 포함한다. 이때, 사용자의 데이터는 스마트 단말의 로그 데이터 및 메시지 데이터를 포함하고, 토픽 모델은 시맨틱 뉴스 추천 서버를 통하여, 뉴스 문서 집합에 포함된 복수의 뉴스 문서로부터 추출된 단어 및 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 생성된 것이다.
본 발명은 뉴스 문서에 포함된 시맨틱 토픽 및 시맨틱 감성에 기반하여 사용자에게 사용자의 관심사에 맞춤형 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법을 제공할 수 있다. 또한, 본 발명은 비대칭적 사전확률에 기반하여 더욱 정확하게 시맨틱 토픽 및 시맨틱 감성을 추출할 수 있다.
그러므로 본 발명은 스마트 단말 내부에서 사용자 관심사를 분석하고, 일반화함으로 사용자 개인 정보의 외부 유출을 최소화할 수 있다. 본 발명은 뉴스 문서를 시맨틱 토픽 및 시맨틱 감성에 따라 분류함으로써 사용자에게 사용자의 관심사와 연관된 뉴스를 긍정 또는 부정과 같은 감성으로 분류한 형태로 추천하는 효과를 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 시스템의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버의 블록도이다.
도 3은 본 개시에 사용된 표기를 도시한 것이다.
도 4는 본 발명의 일 실시예에 따른 분류된 뉴스 문서의 예시도이다.
도 5는 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 스마트 단말의 블록도이다.
도 6은 본 발명의 일 실시예에 따른 시맨틱 토픽의 예시도이다.
도 7은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버와 시맨틱 뉴스 추천 스마트 단말의 뉴스 추천 프로그램의 블록도이다.
도 8은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버 및 시맨틱 뉴스 추천 스마트 단말의 시맨틱 토픽 및 시맨틱 감성 추출의 차이를 설명하기 위한 예시도이다.
도 9는 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버의 시맨틱 뉴스 추천 방법에 대한 순서도이다.
도 10은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버의 시맨틱 토픽 및 시맨틱 감성 추출 방법에 대한 순서도이다.
도 11은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 스마트 단말의 시맨틱 뉴스 추천 방법에 대한 순서도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
다음은 도 1을 참조하여 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 시스템(100)을 설명한다.
도 1은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 시스템(100)의 블록도이다.
시맨틱 뉴스 추천 시스템(100)은 시맨틱 뉴스 스마트 단말(120)을 사용하는 사용자의 관심사를 추출하여, 시맨틱 뉴스 추천 서버(110)에 저장된 뉴스 문서 중 대상 사용자의 관심사에 대응하는 맞춤 뉴스를 사용자에게 제공한다. 이때, 시맨틱 뉴스 추천 시스템(100)은 시맨틱 뉴스 추천 서버(110) 및 시맨틱 뉴스 추천 스마트 단말(120)을 포함한다.
구체적으로 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)에 기저장된 토픽 모델에 기초하여, 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 관심사를 추출한다. 시맨틱 뉴스 추천 스마트 단말(120)은 추출된 대상 사용자의 관심사를 시맨틱 뉴스 추천 서버(110)로 전송하고, 시맨틱 뉴스 추천 서버(110)로부터 대상 사용자의 관심사에 대응하는 뉴스 문서를 수신하여 사용자 맞춤 뉴스로 대상 사용자에게 제공한다.
시맨틱 뉴스 추천 서버(110)는 복수의 뉴스 문서로부터 시맨틱 토픽 및 시맨틱 감성을 추출한다. 그리고 시맨틱 뉴스 추천 서버(110)는 시맨틱 뉴스 추천 스마트 단말(120)로부터 해당 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 관심사를 수신하면, 사용자의 관심에 대응하는 뉴스 문서를 추출한다. 시맨틱 뉴스 추천 서버(110)는 추출된 사용자의 관심사에 대응하는 뉴스 문서를 해당 사용자에게 제공하기 위하여, 해당 사용자의 관심사를 수신한 시맨틱 뉴스 추천 스마트 단말(120)로 전달한다.
이하에서는 도 2 내지 도 4를 참조하여, 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)를 상세하게 설명한다.
도 2는 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)의 블록도이다.
시맨틱 뉴스 추천 서버(110)는 시맨틱 뉴스 추천 스마트 단말(120)로부터 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 관심사를 수신하고, 데이터베이스(220)에 기저장된 뉴스 문서 중 수신된 사용자의 관심사에 대응하는 뉴스 문서를 추출한다. 그리고 시맨틱 뉴스 추천 서버(110)는 추출된 뉴스 문서를 시맨틱 뉴스 추천 스마트 단말(120)로 전달한다. 이때, 시맨틱 뉴스 추천 서버(110)는 통신 모듈(200), 메모리(210), 데이터베이스(220) 및 프로세서(230)를 포함한다.
통신 모듈(200)은 시맨틱 뉴스 추천 스마트 단말(120)과 데이터 통신을 수행한다. 또한, 통신 모듈(200)은 뉴스 문서를 제공하는 뉴스 문서 제공자 서버(미도시)와 데이터 통신을 통하여 하나 이상의 뉴스 문서를 수신할 수 있다.
데이터베이스(220)는 복수의 뉴스 문서를 저장한다. 또한, 데이터베이스(220)는 복수의 뉴스 문서로부터 추출된 토픽 모델 또는, 시맨틱 토픽 및 시맨틱 감성을 저장할 수 있다. 이때, 복수의 뉴스 문서는 뉴스 문서 제공자 서버(110)로부터 통신 모듈(200)을 통하여 수신한 것일 수 있다.
또한, 데이터베이스(220)는 시맨틱 토픽 및 시맨틱 감성을 추출하기 위하여 사용될 수 있는 감성어 집합을 저장할 수 있다. 그리고 데이터베이스(220)는 콘텐츠로부터 단어 및 감성을 추출하기 위하여 사용될 수 있는 단어 및 감성 사전 또는 문법 사전을 저장할 수 있다.
이때, 감성어 집합은 단어의 극성에 따라, 감성어를 구분하여 저장할 수 있다. 즉, 감성어 집합은 긍정의 의미를 가지는 단어 및 부정의 의미를 가지는 단어를 포함할 수 있다. 예를 들어, 감성어 사전에 포함되는 긍정의 의미를 가지는 단어는 "좋다", "훌륭하다", "예쁘다" 및 "최고" 등이 될 수 있다. 또한, 감성어 사전에 포함되는 부정의 의미를 가지는 단어는 "나쁘다", "싫다", "짜증" 및 "최악" 등이 될 수 있다.
메모리(210)는 시맨틱 뉴스 추천 프로그램이 저장된다. 이때, 메모리(210)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장장치 및 저장된 정보를 유지하기 위하여 전력이 필요한 휘발성 저장장치를 통칭하는 것이다.
프로세서(230)는 메모리(210)에 저장된 프로그램을 실행한다. 프로세서(230)는 프로그램의 실행에 따라, 통신 모듈(200)을 통하여, 시맨틱 뉴스 추천 스마트 단말(120)로부터 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 관심사를 수신한다. 이때, 사용자의 관심사는 시맨틱 뉴스 추천 스마트 단말(120)에서 생성된 후, 시맨틱 뉴스 추천 서버(110)로 전송된 것이다. 사용자의 관심사에 대한 상세한 내용은 추후에 도 4를 참조하여 설명한다.
그리고 프로세서(230)는 데이터베이스(220)에 저장된 복수의 뉴스 문서 중에서 사용자의 관심에 대응하는 뉴스 문서를 추출한다. 뉴스 문서가 추출되면 프로세서(230)는 추출된 뉴스 문서를 사용자 관심사를 전달한 시맨틱 뉴스 추천 스마트 단말(120)로 전달한다.
이때, 데이터베이스(220)에 저장된 복수의 뉴스 문서는 복수의 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후 데이터베이스(220)에 저장된 것이다.
이를 위하여, 먼저 프로세서(230)는 뉴스 문서에 포함된 복수의 문장으로부터 단어를 추출할 수 있다. 프로세서(230)는 문장으로부터 추출된 단어에 대응하는 감성을 추출할 수 있다.
이때, 프로세서(230)는 문장에서 단어 및 감성을 추출하기 위하여 데이터베이스(220)에 기저장된 단어 사전 및 감성 사전을 사용할 수 있다. 즉, 프로세서(230)는 뉴스 문서에 포함된 문장에 단어 사전 및 감성 사전에 포함된 단어 또는 감성이 있는 경우, 해당 단어 또는 감성을 해당 문장의 단어 또는 감성으로 추출할 수 있다. 또는 프로세서(230)는 형태소 분석기를 통하여 해당 문장의 구문 분석(parsing) 및 형태소 분석(morphological analysis)을 수행하여 단어 또는 감성을 추출할 수 있다. 그러나 단어 및 감성을 추출하는 방법은 이에 한정되지 않으며, 다양한 방법을 적용할 수 있다.
그리고 프로세서(230)는 뉴스 문서로부터 추출된 단어 및 감성에 기초하여 시맨틱 토픽 및 시맨틱 감성을 추출할 수 있다. 이때, 추출된 시맨틱 토픽 및 시맨틱 감성은 토픽-감성에 대한 어휘 분포, 각 뉴스 문서에 대한 토픽 분포, 토픽에 대한 감성 분포, 토픽의 문맥을 결정하기 위한 토픽 문맥 분포 및 각 문장에 대해 슬라이딩 윈도우 크기를 설정하기 위한 카테고리 분포를 포함할 수 있다.
구체적으로 프로세서(230)는 뉴스 문서로부터 단어 및 감성을 추출하면, 추출된 단어 및 감성에 기초하여 지역 토픽-감성에 대한 확률 분포 및 전역 토픽-감성에 대한 확률 분포를 산출할 수 있다. 프로세서(230)는 지역 토픽-감성에 대한 확률 분포 및 전역 토픽-감성에 대한 확률 분포를 산출하기 위하여, 토픽-감성에 대한 어휘 분포 및 토픽에 대한 감성 분포에 비대칭적 사전 확률(asymmetric prior)을 부여할 수 있다. 예를 들어, 토픽-감성에 대한 어휘 분포의 사전 확률(β prior )은 [수학식 1]과 같으며, 토픽에 대한 감성 분포의 사전 확률(δ prior )은 [수학식 2]와 같다.
Figure 112015112420954-pat00001
[수학식 1]에서 w는 단어이며, C bp 는 단어가 긍정의 감성어 집합에 포함되고, 단어의 감성도 긍정인 경우에 대한 사전 확률이다. C bn 는 단어가 부정의 감성어 집합에 포함되고, 단어의 감성도 부정이었으면 대한 사전 확률이며, C bo 는 그 외의 경우에 대한 사전 확률이다.
토픽-감성에 대한 어휘 분포에서 각각의 사전 확률은 비대칭적으로 부여될 수 있다. 이때, 각각의 사전 확률은 시맨틱 분류 장치의 관리자가 미리 정한 것일 수 있다. 또한, 각각의 사전 확률은 테스트 문서를 이용하여 실험적으로 산출된 것일 수 있으나 이에 한정된 것은 아니다.
Figure 112015112420954-pat00002
[수학식 2]에서 w는 단어이며, C dp 는 단어가 긍정의 감성어 집합에 포함되고, 단어의 감성도 긍정인 경우에 대한 사전 확률이다. C dn 는 단어가 부정의 감성어 집합에 포함되고, 단어의 감성도 부정이었으면 대한 사전 확률이며, C do 는 그 외는 대한 사전 확률이다. 토픽에 대한 감성 분포에서 각각의 사전 확률은 시맨틱 분류 장치의 관리자가 미리 정한 것일 수 있다.
토픽에 대한 감성 분포에서 각각의 사전 확률은 비대칭적으로 부여될 수 있다. 이때, 각각의 사전 확률은 토픽-감성에 대한 어휘 분포와 유사하게 시맨틱 분류 장치의 관리자가 미리 정한 것일 수 있다. 또한, 각각의 사전 확률은 테스트 문서를 이용하여 실험적으로 산출된 것일 수 있으나 이에 한정된 것은 아니다.
이와 같이, 프로세서(230)는 각각 문장에서 추출된 단어가 긍정 또는 부정 감성어 집합에 포함되는지와 단어의 감성이 긍정 또는 부정에 포함되는지에 따라, 토픽-감성에 대한 어휘 분포에 대한 사전 확률 및 토픽에 대한 감성 분포에 대한 사전 확률을 부여할 수 있다.
그리고 프로세서(230)는 토픽-감성에 대한 어휘 분포 및 토픽에 대한 감성 분포에 대한 사전 확률에 기초하여, 뉴스 문서에 포함된 각 문장에 대하여 전역 토픽-감성에 대한 확률 분포 및 지역 토픽-감성에 대한 확률 분포를 산출할 수 있다.
프로세서(230)는 전역 토픽-감성에 대한 확률 분포 및 지역 토픽-감성에 대한 확률 분포가 산출되면, 뉴스 문서에 포함된 복수의 토픽 및 복수의 감성에 대한 확률을 각각 계산할 수 있다. 그리고 프로세서(230)는 계산된 복수의 토픽에 대한 확률 및 복수의 감성에 대한 확률 중 적어도 하나에 기초하여, 뉴스 문서를 분류할 수 있다.
예를 들어, 프로세서(230)는 뉴스 문서에 포함된 각 토픽에 대한 확률에 따라, 토픽별로 뉴스 문서를 분류할 수 있다. 또한, 프로세서(230)는 뉴스 문서에 포함된 각 감성에 대한 확률에 따라, 감성별로 뉴스 문서를 분류하거나, 토픽 및 감성을 모두 고려하여 뉴스 문서를 분류할 수 있다.
뉴스 문서의 분류 과정을 토픽을 기준으로 상세하게 살펴보면, 프로세서(230)는 각 뉴스 문서가 각 토픽에 포함될 확률에 따라 각 뉴스 문서를 분류할 수 있다. 그리고 프로세서(230)는 토픽으로 분류된 뉴스 문서를 다시 각 뉴스 문서가 각 감성에 포함될 확률에 기초하여 2단계로 분류할 수 있다.
이를 위하여, 먼저 프로세서(230)는 [수학식 3] 및 [수학식 4]에 기초하여, 각 문장의 전역 토픽-감성에 대한 확률 분포 및 지역 토픽-감성에 대한 확률 분포를 산출할 수 있다.
Figure 112015112420954-pat00003
Figure 112015112420954-pat00004
도 3은 본 개시에 사용된 표기를 도시한 것이다. 즉, 다음의 [수학식 3] 내지 [수학식 7]에서 각 상수 및 변수의 상세한 설명은 도 3를 참조한다.
프로세서(230)는 [수학식 3]을 참조하여, 각 문장의 전역 토픽-감성에 대한 확률 분포를 산출할 수 있다. 또한, 프로세서(230)는 [수학식 3]을 통하여 산출된 전역 토픽-감성에 대한 확률 분포에 기초하여 [수학식 4]를 통하여, 각 뉴스 문서가 각 전역 토픽 및 각 감성에 해당할 확률을 산출할 수 있다.
또한, 프로세서(230)는 [수학식 5] 및 [수학식 6]에 기초하여, 각 뉴스 문서에서 각 문장의 지역 토픽-감성에 대한 확률 분포를 산출할 수 있다.
Figure 112015112420954-pat00005
Figure 112015112420954-pat00006
[수학식 5]는 각 뉴스 문서에서 각 문장의 지역 토픽-감성에 대한 확률 분포를 산출하는 수학식이다. 또한, [수학식 6]은 [수학식 5]를 통하여 산출된 지역 토픽-감성에 대한 확률 분포를 이용해 각 뉴스 문서가 각 지역 토픽과 각 감성에 해당할 확률을 산출하는 수식이다.
즉, 프로세서(230)는 [수학식 5]를 사용하여 주어진 뉴스 문서의 각 문장이 지역 토픽의 각 토픽에 해당할 확률을 산출할 수 있다. 그리고 프로세서(230)는 [수학식 5]를 통하여 산출된 각 문장이 지역 토픽의 각 토픽에 해당할 확률을 [수학식 6]에 적용해 주어진 뉴스 문서가 지역 토픽의 각 토픽에 해당할 확률을 산출할 수 있다.
프로세서(230)는 산출된 각 뉴스 문서가 각 토픽에 해당할 확률에 기초하여, 각 뉴스 문서의 시맨틱 토픽을 산출할 수 있다. 그리고 프로세서(230)는 산출된 시맨틱 토픽에 기반하여 뉴스 문서를 분류할 수 있다. 이때, 임의의 뉴스 문서로부터 복수의 시맨틱 토픽이 추출되는 경우, 프로세서(230)는 해당 뉴스 문서를 복수의 토픽으로 분류할 수 있다.
한편, 프로세서(230)는 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여, 뉴스 문서를 분류할 수 있다. 그리고 프로세서(230)는 분류된 뉴스 문서를 데이터베이스(220)에 저장할 수 있다.
구체적으로 프로세서(230)는 시맨틱 감성을 이용하여 각 토픽으로 분류된 뉴스 문서를 다시 토픽 내에서 긍정 및 부정의 감성에 따라 분류할 수 있다. 예를 들어, 프로세서(230)는 [수학식 7]에 기초하여, 주어진 뉴스 문서에 대해 긍정 및 부정의 감성에 대한 확률을 산출할 수 있다.
Figure 112015112420954-pat00007
즉, 프로세서(230)는 [수학식 7]을 사용하여, 각 뉴스 문서가 분류된 토픽 내에서 긍정의 의미를 가질 확률 및 부정의 의미를 가질 확률을 산출할 수 있다. 그리고 프로세서(230)는 긍정의 의미를 가질 확률이 부정의 의미를 가질 확률에 비하여 클 경우, 해당 뉴스 문서를 긍정으로 분류할 수 있다. 이와 반대로, 프로세서(230)는 부정의 의미를 가질 확률이 긍정의 의미를 가질 확률에 비하여 작은 경우, 해당 뉴스 문서를 부정으로 분류할 수 있다.
도 4는 본 발명의 일 실시예에 따른 분류된 뉴스 문서의 예시도이다.
도 4를 참조하면 프로세서(230)는 먼저, 토픽을 기준으로 뉴스 문서를 분류할 수 있다. 그리고 프로세서(230)는 각 토픽에 포함된 뉴스 문서를 다시 긍정 및 부정으로 감성에 따라 분류할 수 있다.
예를 들어, '토픽 1'에 포함된 '뉴스 문서 1'에 대하여, 수학식 7을 이용하여 도출된 긍정에 대한 확률이 부정에 대한 확률보다 크면 프로세서(230)는 도 4와 같이, '뉴스 문서 1'를 긍정에 해당하는 뉴스 문서로 분류할 수 있다. 또한, '토픽 1'에 포함된 '뉴스 문서 10'의 경우, 부정에 대한 확률이 긍정에 대한 확률보다 크면, 프로세서(230)는 도 4와 같이 '뉴스 문서 10'을 부정에 해당하는 뉴스 문서로 분류할 수 있다. 이렇게 프로세서(230)는 뉴스 문서를 분류하고, 분류된 뉴스 문서를 데이터베이스(220)에 저장할 수 있다.
이와 같이, 프로세서(230)는 시맨틱 토픽 및 시맨틱 감성을 고려하므로, 의미 및 감성적으로 연관된 뉴스 문서를 같은 그룹으로 분류할 수 있다.
프로세서(230)는 하나의 뉴스 문서를 여러 그룹에 포함되도록 분류할 수 있다. 이때, 프로세서(230)는 동일한 뉴스 문서의 토픽 및 감성을 각각 상이하게 분류할 수 있다. 즉, 프로세서(230)는 동일한 뉴스 문서를 상이한 토픽 및 상이한 감성의 그룹에 포함되도록 분류할 수 있다. 예를 들어, '뉴스 문서 10'은 '토픽 1' 및 '부정'으로 분류될 수 있으며, '토픽 3' 및 '긍정'으로 분류될 수도 있다.
위에서는 뉴스 문서로부터 시맨틱 토픽 및 시맨틱 감성을 추출하고, 추출된 시맨틱 토픽으로 뉴스 문서를 분류한 다음 다시 추출된 시맨틱 감성에 기초하여 뉴스 문서를 분류하는 과정을 설명하였다. 그러나 본 발명의 일 실시예에 따른 시맨틱 분류 장치는 이외에도 추출된 시맨틱 감성에 기초하여 뉴스 문서를 분류한 다음, 다시 추출된 시맨틱 감성에 기초하여 뉴스 문서를 분류하거나, 추출된 시맨틱 토픽 및 시맨틱 감성을 동시에 고려하여 뉴스 문서를 분류할 수 있다.
한편, 프로세서(230)는 스마트 단말(120)로부터 사용자의 관심사를 수신하면, 데이터베이스(220)에 저장된 복수의 뉴스 문서 중 사용자 관심사와 매칭되는 뉴스 문서를 추출할 수 있다. 그리고 프로세서(230)는 추출된 뉴스 문서를 시맨틱 뉴스 추천 스마트 단말(120)로 전송할 수 있다.
이때, 프로세서(230)는 유사도(similarity)에 기초하여, 데이터베이스(220)에 저장된 복수의 뉴스 문서 중 사용자 관심사와 매칭되는 뉴스 문서를 추출할 수 있다. 즉, 프로세서(230)는 복수의 뉴스 문서와 사용자의 관심사의 유사도를 산출할 수 있다. 그리고 프로세서(230)는 유사도를 산출한 복수의 뉴스 문서 중 유사도가 높은 미리 정해진 개수의 뉴스 문서를 사용자의 관심사에 대응하는 뉴스 문서로 추출할 수 있다.
예를 들어, 프로세서(230)는 [수학식 8]과 두 벡터(V x , V y ) 사이의 유사도를 산출하는 코사인 유사도(cosine similarity)를 사용할 수 있으나 이에 한정된 것은 아니다. 이때, V x 는 사용자의 관심사 벡터가 될 수 있으며, V y 는 복수의 뉴스 문서 중 유사도를 측정할 뉴스 문서로부터 추출된 토픽에 대한 벡터가 될 수 있다.
Figure 112015112420954-pat00008
다음은 도 5를 참조하여 본 발명의 일 실시예에 따른 뉴스를 추천하는 스마트 단말(120)을 설명한다.
도 5는 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 스마트 단말(120)의 블록도이다.
사용자 맞춤 뉴스를 추천하는 시맨틱 뉴스 추천 스마트 단말(120)은 사용자의 관심사를 추출하고, 추출된 사용자의 관심사를 시맨틱 뉴스 추천 서버(110)로 전송한다. 그리고 시맨틱 뉴스 추천 서버(110)로부터 사용자의 관심사에 대응하는 뉴스 문서를 수신하면, 수신된 뉴스 문서를 사용자에게 제공한다. 이때, 뉴스 추천 스마트 단말(120)은 통신 모듈(500), 메모리(510) 및 프로세서(520)를 포함한다.
통신 모듈(500)은 시맨틱 뉴스 추천 서버(110)와 데이터 통신을 수행한다.
메모리(510)는 시맨틱 뉴스 추천 프로그램이 저장된다. 이때, 메모리(510)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장장치 및 저장된 정보를 유지하기 위하여 전력이 필요한 휘발성 저장장치를 통칭하는 것이다.
프로세서(520)는 메모리(510)에 저장된 프로그램을 실행한다. 프로세서(520)는 프로그램의 실행에 따라, 사용자 데이터로부터 사용자의 관심사를 추출한다.
사용자 데이터는 시맨틱 뉴스 추천 스마트 단말(120)에 저장된 사용자의 로그 데이터 및 메시지 데이터를 포함한다. 예를 들어, 로그 데이터는 사용자가 스마트 단말(120)을 통하여 사용한 이메일, 북마크, 웹 방문 기록, 앱 사용 기록, 파일 사용 기록과 같은 스마트 단말(120)을 통하여 사용자가 사용한 모든 종류의 데이터가 될 수 있다. 또한, 메시지 데이터는 사용자가 시맨틱 뉴스 추천 스마트 단말(120)을 통하여 다른 사용자와 교환한 단문 메시지 서비스(small messaging service; SMS), 멀티미디어 메시지 서비스(multimedia messaging service; MMS) 또는 채팅 서비스 앱을 통하여 다른 사용자와 교환한 메시지 일 수 있다. 그러나 사용자 데이터는 이에 한정되지 않는다. 즉, 사용자 데이터는 로그 데이터 및 메시지 데이터 외에도 시맨틱 뉴스 추천 스마트 단말(120)을 통하여 생성된 다양한 데이터를 포함할 수 있다.
또한, 프로세서(520)는 사용자 데이터에서 사용자 관심사를 추출하기 위하여, 먼저, 통신 모듈(500)을 통하여 시맨틱 뉴스 추천 서버(110)로부터 토픽 모델을 수신한다. 수신하는 토픽 모델은 시맨틱 뉴스 추천 서버(110)가 시맨틱 토픽 및 시맨틱 감성을 추출하는 과정에서 생성한 후, 데이터베이스(220)에 저장한 것이다. 즉, 토픽 모델은 시맨틱 뉴스 추천 서버(110)를 통하여, 뉴스 문서 집합에 포함된 복수의 뉴스 문서로부터 추출된 단어 및 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 생성된 것이다.
프로세서(520)는 토픽 모델을 통하여, 사용자의 데이터가 토픽 모델에 포함된 각 시맥틱 토픽에 해당될 확률을 산출할 수 있다. 그리고 프로세서(520)는 확률 값이 가장 높은 시맨틱 토픽을 사용자의 관심사로 선택할 수 있다. 이때, 프로세서(520)는 시맨틱 뉴스 추천 서버(110)가 뉴스 문서로부터 시맨틱 토픽 및 시맨틱 감성을 추출하는 과정과 유사한 과정으로 사용자 관심사를 추출할 수 있다.
즉, 앞에서 설명한 시맨틱 뉴스 추천 서버(110)의 프로세서(230)가 뉴스 문서로부터 시맨틱 토픽 및 시맨틱 감성을 추출하는 과정과 유사한 방법으로, 시맨틱 뉴스 추천 스마트 단말(120)의 프로세서(520)는 [수학식 3] 내지 [수학식 6]을 이용하여 사용자의 관심사를 추출할 수 있다.
예를 들어, 프로세서(520)는 토픽-감성에 대한 어휘 분포 및 토픽에 대한 감성 분포에 비대칭적 사전 확률과 [수학식 3]을 이용하여 사용자 데이터에 포함된 하나 이상의 단어에 대하여 전역 토픽에 대한 확률을 산출할 수 있다.
구체적으로 프로세서(520)는 사용자 데이터에서 단어를 추출할 수 있다. 이때, 프로세서(520)는 시맨틱 뉴스 추천 서버(110)에서 뉴스 문서에 포함된 문장으로부터 단어를 추출하는 방법과 유사하게 사용자 데이터에 대하여 구문 분석 및 형태소 분석을 수행하여 단어를 추출할 수 있다. 그리고 프로세서(520)는 추출된 단어에 대하여 전역 토픽에 대한 확률을 산출할 수 있다.
프로세서(520)는 전역 토픽에 대한 확률이 산출되면, 산출된 전역 토픽에 대한 확률 및 [수학식 4]에 기초하여, 사용자 데이터가 각 전역 토픽에 해당할 확률을 산출할 수 있다.
또한, 프로세서(520)는 토픽-감성에 대한 어휘 분포 및 토픽에 대한 감성 분포에 비대칭적 사전 확률과 [수학식 5]를 이용하여 데이터에 포함된 하나 이상의 단어에 대하여 지역 토픽에 대한 확률을 산출할 수 있다. 그리고 프로세서(520)는 지역 토픽에 대한 확률 및 [수학식 6]에 기초하여, 사용자 데이터가 각 지역 토픽에 해당할 확률을 산출할 수 있다.
프로세서(520)는 사용자 데이터가 각 전역 토픽 및 각 지역 토픽에 해당할 확률을 산출한 다음, 산출된 각 전역 토픽 및 지역 토픽에 해당할 확률이 가장 높은 토픽을 선택하여, 시맨틱 토픽을 선택할 수 있다. 그리고 선택된 하나의 시맨틱 토픽을 사용자 관심사로 분석할 수 있다.
프로세서(520)는 사용자의 관심사를 추출한 다음, 통신 모듈(500)을 통하여 추출된 사용자의 관심사를 시맨틱 뉴스 추천 서버(110)로 전송한다. 그리고 프로세서(520)는 통신 모듈(500)을 통하여, 사용자 관심사에 대응하는 뉴스 문서를 시맨틱 뉴스 추천 서버(110)로부터 수신한다.
이때, 프로세서(520)는 사용자 관심사에 포함된 개인 정보의 외부 유출을 최소화 하기 위하여, 사용자 관심사를 일반화할 수 있다. 그리고 프로세서(520)는 일반화된 사용자 관심사를 시맨틱 뉴스 추천 서버(110)로 전송하고, 시맨틱 뉴스 추천 서버(110)로부터 일반화된 사용자 관심사에 대응하는 뉴스 문서를 수신하여 사용자에게 제공할 수 있다.
도 6은 본 발명의 일 실시예에 따른 시맨틱 토픽의 예시도이다.
프로세서(520)는 사용자의 관심사를 일반화하기 위하여 먼저, 도 6의 (A)와 같이 각각 관계가 정해지지 않은 시맨틱 토픽을 도 6의 (B)와 같은 텍사노미(taxonomy)형태로 구축할 수 있다.
예를 들어, 프로세서(520)는 각 시맨틱 토픽을 벡터 형태로 변환할 수 있다. 프로세서(520)는 벡터 형태의 시맨틱 토픽 간의 유사도를 산출할 수 있다. 그리고 프로세서(520)는 유사도에 기초하여 시맨틱 토픽의 텍사노미를 구축할 수 있다.
이때, 프로세서(520)는 두 시맨틱 토픽 간의 유사도가 미리 정해진 값 이상인 경우 두 시맨틱 토픽의 부모 노드를 생성하고, 두 시맨틱 토픽 벡터의 평균값으로 부모 노드의 시맨틱 토픽 벡터를 생성한다. 그리고 프로세서(520)는 부모 노드의 자식으로 유사도를 산출한 두 시맨틱 토픽을 추가하여 시맨틱 토픽의 텍사노미를 구축할 수 있다. 유사도는 [수학식 8]과 같은 코사인 유사도가 될 수 있다.
다음은 도 7 및 도 8을 참조하여 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)와 스마트 단말(120)을 비교 설명한다.
도 7은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)와 시맨틱 뉴스 추천 스마트 단말(120)의 뉴스 추천 프로그램의 블록도이다.
앞에서 설명한 바와 같이 시맨틱 뉴스 추천 서버(110)는 복수의 뉴스 문서로부터 시맨틱 토픽 및 시맨틱 감성을 추출하고, 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 뉴스 문서를 분류할 수 있다. 그리고 시맨틱 뉴스 추천 서버(110)는 시맨틱 뉴스 추천 스마트 단말(120)로부터 수신한 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 관심사에 대응하는 뉴스를 추출하여 시맨틱 뉴스 추천 스마트 단말(120)로 전송할 수 있다.
그리고 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 데이터에 기초하여, 사용자의 관심사를 추출하고, 추출된 사용자의 관심사를 시맨틱 뉴스 추천 서버(110)로 전송할 수 있다. 그리고 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)로부터 사용자의 관심사에 대응하는 뉴스 문서를 수신하여 사용자에게 제공할 수 있다.
이때, 시맨틱 뉴스 추천 서버(110) 및 시맨틱 뉴스 추천 스마트 단말(120)은 각각 설치된 시맨틱 뉴스 추천 프로그램(700, 710)에 기초하여 시맨틱 뉴스 추천 스마트 단말(120)의 사용자에게 뉴스 문서를 추천할 수 있다.
도 7을 참조하면 시맨틱 뉴스 추천 서버(110)에서 실행되는 뉴스 추천 프로그램(700)은 토픽 모델 저장 모듈(711), 시맨틱 뉴스 분석 모듈(712), 시맨틱 뉴스 추출 모듈(713) 및 시맨틱 뉴스 저장 모듈(714)을 포함할 수 있다.
이때, 시맨틱 뉴스 분석 모듈(712)은 복수의 뉴스 문서에 포함된 문장으로부터 시맨틱 토픽 및 시맨틱 감성을 추출할 수 있다. 이때, 추출된 시맨틱 토픽 및 시맨틱 감성은 앞에서 도 2를 참조하여 설명한 바와 같이, 토픽-감성에 대한 어휘 분포, 각 뉴스 문서에 대한 토픽 분포, 토픽에 대한 감성 분포, 토픽의 문맥을 결정하기 위한 토픽 문맥 분포 및 각 문장에 대해 슬라이딩 윈도우 크기를 설정하기 위한 카테고리 분포를 포함할 수 있다. 시맨틱 뉴스 분석 모듈(712)은 추출된 시맨틱 토픽 및 시맨틱 감성을 토픽 모델 저장 모듈(711)을 통하여, 데이터베이스(220)에 저장할 수 있다. 그리고 시맨틱 뉴스 분석 모듈(712)은 시맨틱 뉴스 저장 모듈(714)을 통하여, 복수의 뉴스 문서를 분류하고, 데이터베이스(220)에 저장할 수 있다.
또한, 토픽 모델 저장 모듈(711)은 시맨틱 뉴스 분석 모듈(712)로부터 추출된 시맨틱 토픽 및 시맨틱 감성을 데이터베이스(220)에 저장할 수 있다. 그리고 뉴스 추천 스마트 단말(120)의 요청에 따라, 시맨틱 토픽 및 시맨틱 감성에 포함된 토픽 분포를 시맨틱 뉴스 추천 스마트 단말(120)의 토픽 모델 저장 모듈(702)로 전송할 수 있다.
시맨틱 뉴스 저장 모듈(714)은 시맨틱 뉴스 분석 모듈(712)을 통하여, 추출된 시맨틱 토픽 및 시맨틱 감성에 따라, 뉴스 문서를 분류할 수 있다. 또한, 시맨틱 뉴스 저장 모듈(714)은 분류된 뉴스 문서를 데이터베이스(220)에 저장할 수 있다.
시맨틱 뉴스 추출 모듈(713)은 시맨틱 뉴스 추천 스마트 단말(120)의 사용자 관심사 일반화 모듈(703)로부터 사용자 관심사를 수신할 수 있다. 그리고 시맨틱 뉴스 추출 모듈(713)은 데이터베이스(220)에 저장된 뉴스 문서 중 수신된 사용자의 관심사에 대응하는 뉴스 문서를 추출할 수 있다. 시맨틱 뉴스 추천 모듈(713)은 추출된 사용자 관심사에 대응하는 뉴스 문서를 시맨틱 뉴스 추천 스마트 단말(120)로 전송할 수 있다.
한편, 시맨틱 뉴스 추천 스마트 단말(120)에서 실행되는 뉴스 추천 프로그램(700)은 사용자 관심사 분석 모듈(701), 토픽 모델 저장 모듈(702), 사용자 관심사 일반화 모듈(703) 및 맞춤형 뉴스 추천 모듈(704)을 포함할 수 있다.
사용자 관심사 분석 모듈(701)은 사용자의 데이터로부터 사용자의 관심사를 추출할 수 있다. 이때, 사용자 관심사를 추출하기 위하여, 사용자 관심사 분석 모듈(701)은 토픽 모델 저장 모듈(702)을 통하여 시맨틱 뉴스 추천 서버(110)의 토픽 모델 저장 모듈(711)로부터 기수신한 토픽 모델을 사용할 수 있다.
토픽 모델 저장 모듈(702)은 사용자 관심사 분석 모듈(701)의 요청에 따라, 시맨틱 뉴스 추천 스마트 서버(110)의 토픽 모델 저장 모듈(711)에 토픽 모델을 요청할 수 있다. 토픽 모델 저장 모듈(702)은 시맨틱 뉴스 추천 스마트 서버(110)의 토픽 모델 저장 모듈(711)로부터 토픽 모델을 수신할 수 있다.
사용자 관심사 일반화 모듈(703)은 사용자 관심사 분석 모듈(701)로부터 추출된 사용자 관심사를 일반화할 수 있다. 그리고 사용자 관심사 일반화 모듈(703)은 일반화된 사용자 관심사를 시맨틱 뉴스 추천 서버(110)의 시맨틱 뉴스 추출 모듈(713)로 전송할 수 있다. 사용자 관심사 일반화 모듈(703)은 시맨틱 뉴스 추천 서버(110)의 시맨틱 뉴스 추출 모듈(713)로부터 전송된 일반화된 사용자 관심사에 대응하는 뉴스 문서를 수신할 수 있다.
맞춤형 뉴스 추천 모듈(704)은 사용자 관심사 일반화 모듈(703)이 수신한 일반화된 사용자 관심사에 대응하는 뉴스 문서를 사용자에게 제공할 수 있다. 예를 들어, 맞춤형 뉴스 추천 모듈(704)은 시맨틱 뉴스 추천 스마트 단말(120)에 포함된 디스플레이 모듈(미도시)을 통하여, 뉴스 문서를 사용자에게 디스플레이할 수 있다.
도 8은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110) 및 시맨틱 뉴스 추천 스마트 단말(120)의 시맨틱 토픽 및 시맨틱 감성 추출의 차이를 설명하기 위한 예시도이다.
이와 같이, 시맨틱 뉴스 추천 서버(110) 및 시맨틱 뉴스 추천 스마트 단말(120)은 뉴스 문서 및 사용자 데이터에 포함된 시맨틱 토픽 및 시맨틱 감성에 기초하여 시맨틱 뉴스 추천 스마트 단말(120)의 사용자에게 맞춤형 뉴스를 추천할 수 있다. 이때, 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)에 비하여, 저사양의 리소스를 이용한다. 그러므로 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)에 비하여 시맨틱 토픽 및 시맨틱 감성을 추출하는 과정을 경량화 할 수 있다.
예를 들어, 도 8의 (a)와 같이, 시맨틱 뉴스 추천 서버(110)는 뉴스 문서의 시맨틱 토픽 및 시맨틱 감성을 동시에 고려하여 문서를 분류할 수 있다. 이와 달리, 시맨틱 뉴스 추천 스마트 단말(120)은 도 8의 (b)와 같이, 뉴스 문서에 대하여 시맨틱 토픽을 먼저 고려하여 분류하고, 이후에 시맨틱 감성을 고려하는 순차적인 방법으로 뉴스 문서를 분류할 수 있다.
앞에서 설명한 바와 같이, 시맨틱 뉴스 추천 스마트 단말(120)은 사용자 데이터로부터 시맨틱 토픽을 추출하고, 추출된 시맨틱 토픽에 기초하여 사용자의 관심사를 생성할 수 있다. 그리고 시맨틱 뉴스 추천 스마트 단말(120)은 생성된 사용자 관심사를 시맨틱 뉴스 추천 서버(110)로 전송하고, 사용자의 관심사에 대응하는 뉴스 문서를 시맨틱 뉴스 추천 서버(110)로부터 수신할 수 있다. 이때, 시맨틱 뉴스 추천 서버(110)가 전송하는 뉴스 문서는 시맨틱 토픽 및 시맨틱 감성으로 기분류된 뉴스 문서 중 시맨틱 토픽에 기초하여 생성된 사용자의 관심사에 대응하는 뉴스 문서이다. 즉, 최종적으로 추출되는 사용자의 관심사에 대응하는 뉴스 문서는 1차적으로 시맨틱 토픽에 의해 분류되며, 2차적으로 다시 시맨틱 감성으로 분류되어 사용자에게 제공될 수 있다.
이와 같이, 시맨틱 뉴스 추천 스마트 단말(120)은 사용자 관심사를 수신한 시맨틱 뉴스 추천 서버(110)로부터 기추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 뉴스 문서 중 사용자 관심사에 대응하는 뉴스 문서를 수신하는 방식으로 순차적으로 시맨틱 토픽 및 시맨틱 감성을 고려할 수 있다. 이때, 시맨틱 뉴스 추천 스마트 단말(120)에서 순차적으로 시맨틱 토픽 및 시맨틱 감성을 고려하는 순서는 이에 한정된 것이 아니다.
다음은 도 9 및 도 10을 참조하여 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)에서의 시맨틱 뉴스 추천 방법을 설명한다.
도 9는 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)의 시맨틱 뉴스 추천 방법에 대한 순서도이다.
시맨틱 뉴스 추천 서버(110)는 시맨틱 뉴스 추천 스마트 단말(120)로부터 사용자의 관심사를 수신할 수 있다(S900). 이때, 사용자 관심사는 시맨틱 뉴스 추천 스마트 단말(120)에서 데이터베이스(220)에 저장된 토픽 모델 및 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 데이터에 기초하여 추출된 것일 수 있다.
시맨틱 뉴스 추천 서버(110)는 시맨틱 뉴스 추천 스마트 단말(120)로부터 수신한 사용자의 관심사에 기초하여, 데이터베이스(220)에 저장된 복수의 뉴스 문서로부터 사용자의 관심사에 대응하는 뉴스 문서를 추출한다(S910).
그리고 시맨틱 뉴스 추천 서버(110)는 추출된 뉴스 문서를 시맨틱 뉴스 추천 스마트 단말(120)로 전달한다(S920). 이때, 추천 대상이 되는 복수의 뉴스 문서는 뉴스 문서 집합에 포함된 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후, 데이터베이스(220)에 저장된 것일 수 있다.
도 10은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 서버(110)의 시맨틱 토픽 및 시맨틱 감성 추출 방법에 대한 순서도이다.
구체적으로 시맨틱 뉴스 추천 서버(110)는 뉴스 문서 집합에 포함된 뉴스 문서 각각의 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포를 산출할 수 있다(S1000). 이때, 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포는 토픽-감성의 어휘 분포 및 토픽의 감성 분포에 기초하여 산출될 수 있다.
또한, 토픽-감성의 어휘 분포 및 토픽의 감성 분포는 각각 비대칭적으로 설정된 토픽-감성의 어휘 분포에 대한 사전확률 및 토픽의 감성 분포에 대한 사전확률에 기초하여 산출될 수 있다. 이때, 토픽-감성의 어휘 분포에 대한 사전확률 및 토픽의 감성 분포에 대한 사전확률은 복수의 뉴스 문서로부터 추출된 단어 및 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 산출될 수 있다.
그리고 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포가 산출된 다음 시맨틱 뉴스 추천 서버(110)는 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포에 기초하여 시맨틱 토픽 및 시맨틱 감성을 추출할 수 있다(S1010).
다음으로, 시맨틱 뉴스 추천 서버(110)는 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여, 토픽 모델을 생성할 수 있다(S1020).
시맨틱 뉴스 추천 서버(110)는 시맨틱 토픽 및 시맨틱 감성이 추출된 다음, 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여, 복수의 뉴스 문서를 분류할 수 있다(S1030).
그리고 시맨틱 뉴스 추천 서버(110)는 생성된 토픽 모델 및 분류된 복수의 뉴스를 데이터베이스(220)에 저장할 수 있다(S1040).
다음은 도 11을 참조하여 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 스마트 단말(120)의 시맨틱 뉴스 추천 방법을 설명한다.
도 11은 본 발명의 일 실시예에 따른 시맨틱 뉴스 추천 스마트 단말(120)의 시맨틱 뉴스 추천 방법에 대한 순서도이다.
시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)로부터 수신한 토픽 모델 및 시맨틱 뉴스 추천 스마트 단말(120)을 사용하는 사용자의 데이터에 기초하여, 사용자의 관심사를 추출한다(S1100). 이때, 사용자의 데이터는 시맨틱 뉴스 추천 스마트 단말(120)의 로그 데이터 및 메시지 데이터를 포함한다. 그리고 토픽 모델은 시맨틱 뉴스 추천 서버(110)를 통하여, 뉴스 문서 집합에 포함된 복수의 뉴스 문서로부터 추출된 단어 및 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 생성된 것이다.
그리고 시맨틱 뉴스 추천 스마트 단말(120)은 추출된 상기 사용자의 관심사를 상기 시맨틱 뉴스 추천 서버(110)로 전송한다(S1120). 이때, 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)로부터 수신한 토픽 모델과 사용자의 관심사를 일반화 할 수 있다.
그리고 시맨틱 뉴스 추천 스마트 단말(120)은 추출된 사용자 관심사를 시맨틱 뉴스 추천 서버(110)로 전송한다(S1120).
시맨틱 뉴스 추천 서버(110)가 사용자 관심사에 대응하는 뉴스 문서를 전송하면, 시맨틱 뉴스 추천 스마트 단말(120)은 시맨틱 뉴스 추천 서버(110)로부터 뉴스 문서를 수신한다(S1130).
그리고 시맨틱 뉴스 추천 스마트 단말(120)은 수신한 뉴스 문서를 사용자에게 제공할 수 있다.
본 발명의 일 실시예에 따른 시맨틱 뉴스를 추천하는 서버(110), 스마트 단말(120) 및 이를 이용한 뉴스 추천 방법은 뉴스 문서에 포함된 시맨틱 토픽 및 시맨틱 감성에 기반하여 사용자에게 사용자의 관심사에 맞춤형 뉴스를 추천하는 서버(110), 스마트 단말(120) 및 이를 이용한 뉴스 추천 방법을 제공할 수 있다. 또한, 시맨틱 뉴스를 추천하는 서버(110), 스마트 단말(120) 및 이를 이용한 뉴스 추천 방법비대칭적 사전확률에 기반하여 더욱 정확하게 시맨틱 토픽 및 시맨틱 감성을 추출할 수 있다.
그러므로 시맨틱 뉴스를 추천하는 서버(110), 스마트 단말(120) 및 이를 이용한 뉴스 추천 방법은 스마트 단말(120) 내부에서 사용자 관심사를 분석하고, 일반화함으로 사용자 개인 정보의 외부 유출을 최소화할 수 있다. 또한, 시맨틱 뉴스를 추천하는 서버(110), 스마트 단말(120) 및 이를 이용한 뉴스 추천 방법은 뉴스 문서를 시맨틱 토픽 및 시맨틱 감성에 따라 분류함으로써 사용자에게 사용자의 관심사와 연관된 뉴스를 긍정 또는 부정과 같은 감성으로 분류한 형태로 추천하는 효과를 얻을 수 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능한 기록 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독 가능한 기록 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 시맨틱 뉴스 추천 시스템
110: 시맨틱 뉴스 추천 서버
120: 시맨틱 뉴스 추천 스마트 단말
200: 통신 모듈
210: 메모리
220: 데이터베이스
230: 프로세서
500: 통신 모듈
510: 메모리
520: 프로세서

Claims (15)

  1. 스마트 단말에 시맨틱 뉴스를 추천하는 서버에 있어서,
    복수의 뉴스 문서 및 토픽 모델을 저장하는 데이터베이스,
    스마트 단말과의 데이터 통신을 수행하는 통신 모듈,
    시맨틱 뉴스 추천 프로그램이 저장된 메모리 및
    상기 메모리에 저장된 프로그램을 실행하는 프로세서를 포함하되,
    상기 프로세서는 상기 프로그램의 실행에 따라, 상기 통신 모듈을 통하여 상기 스마트 단말로부터 수신한 상기 스마트 단말을 사용하는 사용자의 관심사에 기초하여, 상기 데이터베이스에 저장된 복수의 뉴스 문서로부터 상기 사용자의 관심사에 대응하는 뉴스 문서를 추출하고, 상기 추출된 뉴스 문서를 상기 스마트 단말로 전달하되,
    상기 사용자의 관심사는 상기 스마트 단말이 상기 토픽 모델에 기초하여 생성한 이후, 상기 토픽 모델과의 유사도 분석을 통한 일반화를 수행한 것이며,
    상기 복수의 뉴스 문서는 상기 복수의 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후, 상기 데이터베이스에 저장된 것인, 시맨틱 뉴스 추천 서버.
  2. 제 1 항에 있어서,
    상기 프로세서는 상기 복수의 뉴스 문서 각각의 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포에 기초하여, 상기 시맨틱 토픽 및 시맨틱 감성을 추출하고,
    상기 추출된 시맨틱 토픽 및 상기 추출된 시맨틱 감성에 기초하여, 상기 토픽 모델을 생성하고 상기 복수의 뉴스 문서를 분류하며,
    상기 생성된 토픽 모델 및 상기 분류된 복수의 뉴스 문서를 상기 데이터베이스에 저장하되,
    상기 전역 토픽-감성에 대한 확률 분포 및 상기 지역 토픽-감성에 대한 확률 분포는 토픽-감성의 어휘 분포 및 토픽의 감성 분포에 기초하여 산출되며,
    상기 토픽-감성의 어휘 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률에 기초하여 산출되는 것이며,
    상기 토픽의 감성 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률과 상이한, 상기 토픽의 감성 분포에 대한 사전확률에 기초하여 산출되는 것인, 시맨틱 뉴스 추천 서버.
  3. 제 2 항에 있어서,
    상기 프로세서는 상기 복수의 뉴스 문서로부터 추출된 단어 및 상기 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여, 상기 토픽-감성의 어휘 분포에 대한 사전확률 및 상기 토픽의 감성 분포에 대한 사전확률을 산출하는 것인, 시맨틱 뉴스 추천 서버.
  4. 제 3 항에 있어서,
    상기 프로세서는 상기 복수의 뉴스 문서로부터 추출된 단어가 긍정 감성어 사전 및 부정 감성어 사전 중 어느 것에 포함되는지 여부와 상기 복수의 뉴스 문서로부터 추출된 단어에 대응하는 감성의 극성에 따라,
    상기 토픽-감성의 어휘 분포에 대한 사전확률을 결정하는, 시맨틱 뉴스 추천 서버.
  5. 제 3 항에 있어서,
    상기 프로세서는 상기 복수의 뉴스 문서로부터 추출된 단어가 긍정 감성어 사전 및 부정 감성어 사전 중 어느 것에 포함되는지 여부와
    상기 복수의 뉴스 문서로부터 추출된 단어에 대응하는 감성의 극성에 따라, 상기 토픽의 감성 분포에 대한 사전확률을 결정하는, 시맨틱 뉴스 추천 서버.
  6. 뉴스를 추천하는 시맨틱 뉴스 추천 스마트 단말에 있어서,
    시맨틱 뉴스 추천 서버와 데이터 통신을 수행하는 통신 모듈,
    뉴스를 추천하는 프로그램이 저장된 메모리 및
    상기 메모리에 저장된 프로그램을 실행하는 프로세서를 포함하되,
    상기 프로세서는 상기 프로그램의 실행에 따라, 상기 통신 모듈을 통하여, 상기 시맨틱 뉴스 추천 서버로부터 수신한 토픽 모델 및 상기 스마트 단말에서 수집된 상기 스마트 단말을 사용하는 사용자의 데이터에 기초하여, 상기 사용자의 관심사를 추출하고,
    상기 토픽 모델과 상기 추출된 사용자의 관심사에 대한 유사도 분석에 따라, 상기 추출된 사용자의 관심사를 일반화한 이후, 상기 통신 모듈을 통하여 상기 일반화된 사용자의 관심사를 상기 시맨틱 뉴스 추천 서버로 전송하고, 상기 시맨틱 뉴스 추천 서버로부터 상기 일반화된 사용자의 관심사에 대응하는 뉴스 문서를 수신하되,
    상기 사용자의 데이터는 상기 스마트 단말의 로그 데이터 및 메시지 데이터를 포함하고,
    상기 토픽 모델은 상기 시맨틱 뉴스 추천 서버를 통하여, 뉴스 문서 집합에 포함된 복수의 뉴스 문서로부터 추출된 단어 및 상기 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 생성된 것인, 시맨틱 뉴스 추천 스마트 단말.
  7. 제 6 항에 있어서,
    상기 프로세서는 전역 토픽에 대한 확률 분포 및 지역 토픽에 대한 확률 분포에 기초하여, 생성되는 상기 사용자의 데이터에 대응하는 시맨틱 토픽을 상기 사용자의 관심사로서 추출하되,
    상기 전역 토픽에 대한 확률 분포 및 상기 지역 토픽에 대한 확률 분포는 상기 토픽 모델에 포함된 토픽-감성의 어휘 분포 및 토픽의 감성 분포에 기초하여 산출되며,
    상기 토픽-감성의 어휘 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률에 기초하여 산출되는 것이며,
    상기 토픽의 감성 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률과 상이한, 상기 토픽의 감성 분포에 대한 사전확률에 기초하여 산출되는 것인, 시맨틱 뉴스 추천 스마트 단말.
  8. 삭제
  9. 서버의 시맨틱 뉴스 추천 방법에 있어서,
    스마트 단말로부터 수신한 사용자의 관심사에 기초하여, 데이터베이스에 저장된 복수의 뉴스 문서로부터 상기 사용자의 관심사에 대응하는 뉴스 문서를 추출하는 단계; 및
    상기 뉴스 문서를 추출하는 단계로부터 추출된 뉴스 문서를 상기 스마트 단말로 전송하는 단계를 포함하되,
    상기 사용자의 관심사는 상기 스마트 단말이 상기 데이터베이스에 저장된 토픽 모델에 기초하여 생성한 이후, 상기 토픽 모델과의 유사도 분석을 통한 일반화를 수행한 것이며,
    상기 복수의 뉴스 문서는 뉴스 문서 집합에 포함된 뉴스 문서로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여 분류된 후, 상기 데이터베이스에 저장된 것인, 서버의 시맨틱 뉴스 추천 방법.
  10. 제 9 항에 있어서,
    상기 사용자의 관심사에 대응하는 뉴스 문서를 추출하는 단계 이전에,
    상기 뉴스 문서 집합에 포함된 뉴스 문서 각각의 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포를 산출하는 단계;
    상기 확률 분포를 산출하는 단계를 통하여 산출된 전역 토픽-감성 확률 분포 및 지역 토픽-감성 확률 분포에 기초하여 시맨틱 토픽 및 시맨틱 감성을 추출하는 단계;
    상기 시맨틱 토픽 및 시맨틱 감성을 추출하는 단계로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여, 상기 토픽 모델을 생성하는 단계;
    상기 시맨틱 토픽 및 시맨틱 감성을 추출하는 단계로부터 추출된 시맨틱 토픽 및 시맨틱 감성에 기초하여, 상기 복수의 뉴스 문서를 분류하는 단계; 및
    상기 토픽 모델을 생성하는 단계로부터 생성된 토픽 모델 및 상기 분류하는 단계를 통하여 분류된 복수의 뉴스를 상기 데이터베이스에 저장하는 단계를 더 포함하되,
    상기 전역 토픽-감성에 대한 확률 분포 및 상기 지역 토픽-감성에 대한 확률 분포는 토픽-감성의 어휘 분포 및 토픽의 감성 분포에 기초하여 산출되며,
    상기 토픽-감성의 어휘 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률에 기초하여 산출되는 것이며,
    상기 토픽의 감성 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률과 상이한, 상기 토픽의 감성 분포에 대한 사전확률에 기초하여 산출되는 것인, 서버의 시맨틱 뉴스 추천 방법.
  11. 제 10 항에 있어서,
    상기 토픽-감성의 어휘 분포에 대한 사전확률 및 상기 토픽의 감성 분포에 대한 사전확률은 상기 복수의 뉴스 문서로부터 추출된 단어 및 상기 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 산출되는 것인, 서버의 시맨틱 뉴스 추천 방법.
  12. 스마트 단말의 시맨틱 뉴스 추천 방법에 있어서,
    시맨틱 뉴스 추천 서버로부터 수신한 토픽 모델 및 상기 스마트 단말을 사용하는 사용자의 데이터에 기초하여, 상기 사용자의 관심사를 추출하는 단계;
    상기 토픽 모델과 상기 추출된 사용자의 관심사에 대한 유사도 분석에 따라, 상기 추출된 사용자의 관심사를 일반화하는 단계;
    상기 사용자의 관심사를 일반화하는 단계 이후에, 상기 일반화된 사용자의 관심사를 상기 시맨틱 뉴스 추천 서버로 전송하는 단계; 및
    상기 일반화된 사용자의 관심사를 상기 시맨틱 뉴스 추천 서버로 전송하는 단계 이후에, 상기 일반화된 사용자의 관심사에 대응하는 뉴스 문서를 수신하는 단계를 포함하되,
    상기 사용자의 데이터는 상기 스마트 단말의 로그 데이터 및 메시지 데이터를 포함하고,
    상기 토픽 모델은 상기 시맨틱 뉴스 추천 서버를 통하여, 뉴스 문서 집합에 포함된 복수의 뉴스 문서로부터 추출된 단어 및 상기 복수의 뉴스 문서로부터 추출된 단어에 대한 감성에 기초하여 생성된 것인, 스마트 단말의 시맨틱 뉴스 추천 방법.
  13. 제 12 항에 있어서,
    상기 사용자의 관심사를 추출하는 단계는,
    전역 토픽에 대한 확률 분포 및 지역 토픽에 대한 확률 분포에 기초하여, 생성되는 상기 사용자의 데이터에 대응하는 시맨틱 토픽을 상기 사용자의 관심사로서 추출하되,
    상기 전역 토픽에 대한 확률 분포 및 상기 지역 토픽에 대한 확률 분포는 상기 토픽 모델에 포함된 토픽-감성의 어휘 분포 및 토픽의 감성 분포에 기초하여 산출되며,
    상기 토픽-감성의 어휘 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률에 기초하여 산출되는 것이며,
    상기 토픽의 감성 분포는 상기 토픽-감성의 어휘 분포에 대한 사전확률과 상이한, 상기 토픽의 감성 분포에 대한 사전확률에 기초하여 산출되는 것인, 스마트 단말의 시맨틱 뉴스 추천 방법.
  14. 삭제
  15. 제 9 항 내지 제 13 항 중 어느 한 항에 기재된 방법을 컴퓨터 상에서 수행하기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
KR1020150161694A 2015-11-18 2015-11-18 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법 KR101705810B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150161694A KR101705810B1 (ko) 2015-11-18 2015-11-18 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150161694A KR101705810B1 (ko) 2015-11-18 2015-11-18 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법

Publications (1)

Publication Number Publication Date
KR101705810B1 true KR101705810B1 (ko) 2017-02-10

Family

ID=58121407

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150161694A KR101705810B1 (ko) 2015-11-18 2015-11-18 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법

Country Status (1)

Country Link
KR (1) KR101705810B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190104745A (ko) * 2018-03-02 2019-09-11 국민대학교산학협력단 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체
KR20190107832A (ko) * 2018-03-13 2019-09-23 국민대학교산학협력단 불신지수 벡터 기반의 가짜뉴스 탐지 장치 및 방법, 이를 기록한 기록매체
CN113688225A (zh) * 2021-08-23 2021-11-23 平安国际智慧城市科技股份有限公司 基于大数据的新闻推荐方法、装置、终端设备及存储介质
CN115357785A (zh) * 2022-08-05 2022-11-18 山东省计算中心(国家超级计算济南中心) 一种基于语义交互和局部激活的企业资讯推荐方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224623A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd 関連記事推奨方法および関連記事推奨プログラム
KR20140073717A (ko) * 2012-12-06 2014-06-17 고려대학교 산학협력단 시맨틱 토픽 추출 장치 및 방법
JP2015032166A (ja) * 2013-08-02 2015-02-16 エヌ・ティ・ティ・コムウェア株式会社 分類装置、分類方法、および分類プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224623A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd 関連記事推奨方法および関連記事推奨プログラム
KR20140073717A (ko) * 2012-12-06 2014-06-17 고려대학교 산학협력단 시맨틱 토픽 추출 장치 및 방법
JP2015032166A (ja) * 2013-08-02 2015-02-16 エヌ・ティ・ティ・コムウェア株式会社 分類装置、分類方法、および分類プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190104745A (ko) * 2018-03-02 2019-09-11 국민대학교산학협력단 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체
KR102078541B1 (ko) * 2018-03-02 2020-02-19 국민대학교산학협력단 이슈 관심도 기반의 뉴스 가치 평가 장치 및 방법, 이를 기록한 기록매체
KR20190107832A (ko) * 2018-03-13 2019-09-23 국민대학교산학협력단 불신지수 벡터 기반의 가짜뉴스 탐지 장치 및 방법, 이를 기록한 기록매체
KR102053635B1 (ko) * 2018-03-13 2019-12-09 국민대학교산학협력단 불신지수 벡터 기반의 가짜뉴스 탐지 장치 및 방법, 이를 기록한 기록매체
CN113688225A (zh) * 2021-08-23 2021-11-23 平安国际智慧城市科技股份有限公司 基于大数据的新闻推荐方法、装置、终端设备及存储介质
CN113688225B (zh) * 2021-08-23 2024-03-15 平安国际智慧城市科技股份有限公司 基于大数据的新闻推荐方法、装置、终端设备及存储介质
CN115357785A (zh) * 2022-08-05 2022-11-18 山东省计算中心(国家超级计算济南中心) 一种基于语义交互和局部激活的企业资讯推荐方法

Similar Documents

Publication Publication Date Title
CN107220386B (zh) 信息推送方法和装置
US10515125B1 (en) Structured text segment indexing techniques
CN107256267B (zh) 查询方法和装置
US11599729B2 (en) Method and apparatus for intelligent automated chatting
US9948595B2 (en) Methods and apparatus for inserting content into conversations in on-line and digital environments
US11062086B2 (en) Personalized book-to-movie adaptation recommendation
Brody et al. Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! using word lengthening to detect sentiment in microblogs
US10929383B2 (en) Method and system for improving training data understanding in natural language processing
US20150213361A1 (en) Predicting interesting things and concepts in content
Lima et al. Automatic sentiment analysis of Twitter messages
US10839013B1 (en) Generating a graphical representation of relationships among a set of articles and information associated with the set of articles
US11361759B2 (en) Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media
KR101705810B1 (ko) 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법
US11416539B2 (en) Media selection based on content topic and sentiment
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
Feng et al. Question classification by approximating semantics
Wang et al. Can Authorship Representation Learning Capture Stylistic Features?
Nigam et al. Towards a robust metric of polarity
CN111930949B (zh) 搜索串处理方法、装置、计算机可读介质及电子设备
US20230090601A1 (en) System and method for polarity analysis
Urlana et al. Controllable Text Summarization: Unraveling Challenges, Approaches, and Prospects--A Survey
US11615245B2 (en) Article topic alignment
Timoney et al. Nostalgic sentiment analysis of youtube comments for chart hits of the 20th century
Mini Opinion Mining for monitoring social media communications for Brand Promotion.
Dey Aspect extraction and sentiment classification of mobile apps using app-store reviews

Legal Events

Date Code Title Description
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20200128

Year of fee payment: 4