KR101859620B1 - 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템 - Google Patents

온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템 Download PDF

Info

Publication number
KR101859620B1
KR101859620B1 KR1020160178210A KR20160178210A KR101859620B1 KR 101859620 B1 KR101859620 B1 KR 101859620B1 KR 1020160178210 A KR1020160178210 A KR 1020160178210A KR 20160178210 A KR20160178210 A KR 20160178210A KR 101859620 B1 KR101859620 B1 KR 101859620B1
Authority
KR
South Korea
Prior art keywords
user
content
reliability
analysis
data
Prior art date
Application number
KR1020160178210A
Other languages
English (en)
Inventor
유재수
고건식
임종태
복경수
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020160178210A priority Critical patent/KR101859620B1/ko
Application granted granted Critical
Publication of KR101859620B1 publication Critical patent/KR101859620B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0224Discounts or incentives, e.g. coupons or rebates based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0245Surveys
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명의 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에서의 콘텐츠 추천 방법에 있어서, 온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하는 단계, 온라인 소셜 네트워크에서 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하는 단계, 상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하는 단계, 상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하는 단계, 상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하는 단계 및 결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 단계를 포함한다.

Description

온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템 {Method and system for recommending content based on trust in online social network}
본 발명은 온라인 소셜 네트워크에 관한 것으로서, 더욱 상세하게는 온라인 소셜 네트워크에서 콘텐츠를 추천하는 기법에 관한 것이다.
최근 모바일 기기와 인터넷 기술의 발달로 개인의 취미 생활이나 의견을 온라인 공간에서 공유할 수 있는 온라인 소셜 네트워크 서비스가 발전하고 있다.
온라인 소셜 네트워크는 사용자 간의 자유로운 의사소통, 정보 공유, 그리고 사회적 관계를 생성해주는 온라인 플랫폼을 의미한다. 여기서, 소셜 네트워크 사용자는 시간, 공간에 상관없이 서비스를 이용할 수 있게 되었고, 인터넷 기술의 발달로 어디서든지 서비스에 빠르게 접속해서, 정보와 콘텐츠를 신속하게 생성하고, 공유할 수 있다.
콘텐츠는 음악, 영화, 드라마, 뉴스, 게임 등의 사람이 만든 각종 창작물을 의미한다. 초기의 온라인 소셜 네트워크 서비스는 주로 친목도모 용도로 활용이 되었으나, 점차적으로 단순히 사용자들 사이의 인맥 관계를 통한 정보 공유뿐만 아니라, 새로운 정보를 생성하고 소비하는 형태로 전환되고 있다.
이러한 온라인 소셜 네트워크 서비스에서, 정보 접근 방법이 검색뿐만 아니라 입 소문을 통한 방법으로 확장되고, 정보의 생산자 폭이 넓어졌으며, 정보의 신뢰도가 높아졌다.
대표적인 온라인 소셜 네트워크 서비스로 트위터, 페이스 북 등이 있다. 트위터는 간결한 인터페이스와 친구 맺기 기능, 메신저 기능을 한데 모아놓은 서비스로서, 계속해서 성장하고 있으며, 현재 월간 활성 사용자 수가 3억명 이상이며, 일일 트윗 수는 5억 건을 넘어선다.
페이스 북은 짧은 글과 함께 사용자의 사진이나 동영상 등을 게시할 수 있는 서비스를 제공하고, 2015년 2분기 기준으로 14억명 이상의 월 활동 사용자가 활동 중이다.
이처럼, 온라인 소셜 네트워크를 이용하는 사용자가 빠르게 증가하면서 사용자들은 다양한 경로로 수많은 정보를 습득할 수 있게 되었지만, 과도하게 많은 정보에 노출되면서, 사용자들은 수많은 정보들 중에서 자신에게 적합한 정보만을 습득하고자 하는 요구가 점점 커지고 있다. 이런 이유로 사용자에게 필요한 콘텐츠를 제공하는 콘텐츠 추천 기법에 대한 연구가 진행되고 있다.
콘텐츠 추천 기법에 가장 많이 사용되는 콘텐츠 추천 알고리즘은 내용 기반 추천 기법과 협업 필터링 기법이 있다.
내용 기반 추천 기법은 추천 할 콘텐츠의 내용을 분석해서 콘텐츠가 가진 특징에 따라서 추천하는 방식이다.
협업 필터링은 많은 사용자들로부터 수집한 기호정보에 따라 사용자들의 관심사를 자동적으로 예측하는 방식이다. 협업 필터링은 사용자의 프로필 정보가 필요 없고, 콘텐츠의 내용에 상관없이 추천을 할 수 있기 때문에 많은 추천 시스템에 사용된다.
협업 필터링은 사용자 기반의 협업 필터링과 아이템 기반의 협업 필터링으로 구분된다. 사용자 기반 협업 필터링은 사용자의 행위를 분석하고, 사용자 사이의 유사도를 측정해서 유사한 사용자를 찾고, 유사 사용자가 사용한 콘텐츠를 추천한다. 아이템 기반 협업 필터링은 사용자가 사용한 아이템과 유사도가 높은 다른 아이템을 추천한다. 콘텐츠 추천 기법을 활용한 온라인 소셜 네트워크 서비스에는 음악 서비스인 라스트에프엠, 온라인 소매 업체인 아마존, 동영상 추천 사이트인 유튜브 등이 있다.
협업 필터링 알고리즘을 추천 기법에 적용하면서 연구자들은 사용자의 데이터를 활용하고 있다.
이처럼, 온라인 소셜 네트워크에서 활동하는 사용자의 데이터를 사용하고, 그 데이터를 생성하는 주체인 사용자에 대한 연구가 진행되면서, 사용자의 신뢰도를 고려하는 추천 기법이 등장하였다. 사용자 신뢰도란 사용자를 신뢰할 수 있는지를 나타내는 척도로 사용자의 프로필 정보, 평점, 사용자의 전문성, 사용자간 관계로 표현 가능하다.
만약 사용자가 악의적으로 콘텐츠에 대해 부정적인 의견을 남기거나, 소비하지 않은 콘텐츠를 평가하는 활동을 할 경우에 신뢰도가 떨어지는 사용자의 데이터를 추천에 이용하게 되고, 이는 추천의 정확성을 감소시키는 결과를 가져온다. 이러한 문제를 해결하기 위하여 신뢰도가 낮은 사용자의 데이터를 필터링한 후 추천에 이용하는 연구가 등장하였다. 사용자의 신뢰도를 파악하기 위해서 보통 온라인 소셜 네트워크 환경에서 활동하는 사용자들의 행위를 이용한다. 기존의 추천 기법에서는 사용자 신뢰도를 계산할 때 콘텐츠의 이용 횟수, 사용자 사이의 관계 등을 사용하고 있지만, 현재 서비스되고 있는 온라인 소셜 네트워크에서 얻을 수 있는 사용자 행위를 모두 반영하고 있지는 않다는 문제점이 있다.
대한민국 공개특허 제10-2013-0062418호
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명은 온라인 소셜 네트워크에서 사용자 행위 외에 다른 사용자 행위들도 수집하여 사용자 신뢰도를 복합적으로 계산하는, 신뢰성 기반의 콘텐츠 추천 방법을 제공하는데 그 목적이 있다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
이와 같은 목적을 달성하기 위한 본 발명의 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에서의 콘텐츠 추천 방법에 있어서, 온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하는 단계, 온라인 소셜 네트워크에서 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하는 단계, 상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하는 단계, 상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하는 단계, 상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하는 단계 및 결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 단계를 포함한다.
상기 사용자 신뢰도를 계산하는 단계에서, 온라인 소셜 네트워크에서, 사용자의 행위를 분석하는 것인 소셜 행위 분석과, 사용자가 이용한 콘텐츠를 분석하는 것인 콘텐츠 이용 분석과, 다른 사용자와의 관계를 분석하는 것인 소셜 관계 분석을 통해 사용자 신뢰도를 계산할 수 있다.
상기 콘텐츠 신뢰도를 계산하는 단계에서, 사용자가 이용한 콘텐츠의 카테고리 별로 사용자의 전문성을 판별하여, 각 카테고리 별로 전문가로 선별된 사용자가 행한 콘텐츠에 대한 평가에 대해서 가중치를 부여하기 위한 사용자 전문성 분석과, 사용자가 콘텐츠를 이용하고 나서 해당 콘텐츠에 대해 행한 행위들에 대한 분석인 암시적 행위 분석을 통해 콘텐츠 신뢰도를 계산할 수 있다.
상기 사용자에게 추천할 콘텐츠를 결정하는 단계에서, 상기 전처리된 사용자 행위 데이터와, 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산하고, 이를 통해 상기 전처리된 사용자 행위 데이터 중에서 해당 사용자와 가장 유사한 사용자를 선별하고, 선별된 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행할 수 있다. 이때, 상기 유사도 계산에 있어서, 피어슨 유사도(Pearson Correlation)를 이용할 수 있다.
본 발명의 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에 있어서, 온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터 및 콘텐츠 데이터를 저장하고 있는 데이터베이스 및 상기 데이터베이스로부터 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하고, 상기 데이터베이스로부터 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하고, 상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하고, 상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하고, 상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하고, 결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 서버를 포함한다.
상기 서버는 상기 사용자 신뢰도를 계산함에 있어서, 온라인 소셜 네트워크에서, 사용자의 행위를 분석하는 것인 소셜 행위 분석과, 사용자가 이용한 콘텐츠를 분석하는 것인 콘텐츠 이용 분석과, 다른 사용자와의 관계를 분석하는 것인 소셜 관계 분석을 통해 사용자 신뢰도를 계산할 수 있다.
상기 서버는 상기 콘텐츠 신뢰도를 계산함에 있어서, 사용자가 이용한 콘텐츠의 카테고리 별로 사용자의 전문성을 판별하여, 각 카테고리 별로 전문가로 선별된 사용자가 행한 콘텐츠에 대한 평가에 대해서 가중치를 부여하기 위한 사용자 전문성 분석과, 사용자가 콘텐츠를 이용하고 나서 해당 콘텐츠에 대해 행한 행위들에 대한 분석인 암시적 행위 분석을 통해 콘텐츠 신뢰도를 계산할 수 있다.
상기 서버는 상기 사용자에게 추천할 콘텐츠를 결정함에 있어서, 상기 전처리된 사용자 행위 데이터와, 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산하고, 이를 통해 상기 전처리된 사용자 행위 데이터 중에서 해당 사용자와 가장 유사한 사용자를 선별하고, 선별된 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행할 수 있다. 이때, 상기 서버는 피어슨 유사도(Pearson Correlation)를 이용하여 유사도를 계산할 수 있다.
본 발명에 의하면, 온라인 소셜 네트워크에서 사용자의 행위를 바탕으로, 분석을 통해 사용자 신뢰도와 콘텐츠 신뢰도를 계산하고, 이를 이용하여 콘텐츠를 추천함으로써, 콘텐츠 추천의 정확성을 향상시킨다는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 시스템을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법의 전체 처리 절차를 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 사용자 신뢰도 계산 과정을 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 신뢰도 계산을 위한 사용자 행위를 나타낸 도표이다.
도 5는 사용자의 코멘트에 대해 다른 사용자들이 보낸 좋아요 수를 구하는 과정을 보여주는 도면이다.
도 6은 사용자의 팔로잉과 팔로워 수를 나타낸 도면이다.
도 7은 사용자 신뢰도를 계산하고 신뢰성이 떨어지는 사용자의 데이터를 필터링하는 알고리즘이다.
도 8은 콘텐츠 신뢰도를 계산하는 과정을 나타낸 도면이다.
도 9는 카테고리 전문가 계산을 위한 사용자 행위 데이터와 콘텐츠 데이터를 나타낸 도면이다.
도 10은 카테고리 전문가를 선별하는 알고리즘이다.
도 11은 사용자의 암시적 행위 점수를 나타낸 도표이다.
도 12는 소셜 행위에 대해 사용자의 적극성에 관한 설문조사 결과를 나타낸 도표이다.
도 13은 콘텐츠 추천 과정을 나타낸 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 갖는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 발명에서는 신뢰성이 떨어지는 사용자의 데이터를 제거하기 위해 사용자의 신뢰도를 계산한다. 사용자 신뢰도를 계산하기 위해서 소셜 행위 분석, 콘텐츠 이용 분석, 소셜 관계 분석을 수행한다. 또한 콘텐츠 추천 우선순위를 판정하기 위해서 콘텐츠가 지닌 신뢰도를 계산한다. 콘텐츠 신뢰도를 계산하기 위해서 사용자 전문성 분석, 암시적 행위 분석을 수행한다. 앞에서 계산된 각 신뢰도를 이용해서 협업 필터링을 실시하고 추천 콘텐츠를 선택한다. 그리고, 선택된 추천 콘텐츠가 지닌 콘텐츠 신뢰도에 따라서 해당 사용자에게 콘텐츠를 추천한다.
본 발명에서 제안하는 콘텐츠 추천 기법은 현재 서비스되고 있는 온라인 소셜 네트워크 서비스에서 활동하는 사용자 행위 데이터를 수집해서 사용자 신뢰도와 콘텐츠 신뢰도를 계산한다. 구체적으로는, 소셜 행위 분석, 콘텐츠 이용 분석, 소셜 관계 분석을 통해서 사용자 신뢰도를 계산하고, 사용자 전문성 분석과 암시적 행위 분석을 통해서 콘텐츠 신뢰도를 계산한다.
본 발명의 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에서의 콘텐츠 추천 방법에 있어서, 온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하는 단계, 온라인 소셜 네트워크에서 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하는 단계, 상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하는 단계, 상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하는 단계, 상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하는 단계 및 결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 단계를 포함한다.
상기 사용자 신뢰도를 계산하는 단계에서, 온라인 소셜 네트워크에서, 사용자의 행위를 분석하는 것인 소셜 행위 분석과, 사용자가 이용한 콘텐츠를 분석하는 것인 콘텐츠 이용 분석과, 다른 사용자와의 관계를 분석하는 것인 소셜 관계 분석을 통해 사용자 신뢰도를 계산할 수 있다.
상기 콘텐츠 신뢰도를 계산하는 단계에서, 사용자가 이용한 콘텐츠의 카테고리 별로 사용자의 전문성을 판별하여, 각 카테고리 별로 전문가로 선별된 사용자가 행한 콘텐츠에 대한 평가에 대해서 가중치를 부여하기 위한 사용자 전문성 분석과, 사용자가 콘텐츠를 이용하고 나서 해당 콘텐츠에 대해 행한 행위들에 대한 분석인 암시적 행위 분석을 통해 콘텐츠 신뢰도를 계산할 수 있다.
상기 사용자에게 추천할 콘텐츠를 결정하는 단계에서, 상기 전처리된 사용자 행위 데이터와, 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산하고, 이를 통해 상기 전처리된 사용자 행위 데이터 중에서 해당 사용자와 가장 유사한 사용자를 선별하고, 선별된 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행할 수 있다. 이때, 상기 유사도 계산에 있어서, 피어슨 유사도(Pearson Correlation)를 이용할 수 있다.
본 발명의 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에 있어서, 온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터 및 콘텐츠 데이터를 저장하고 있는 데이터베이스 및 상기 데이터베이스로부터 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하고, 상기 데이터베이스로부터 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하고, 상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하고, 상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하고, 상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하고, 결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 서버를 포함한다.
상기 서버는 상기 사용자 신뢰도를 계산함에 있어서, 온라인 소셜 네트워크에서, 사용자의 행위를 분석하는 것인 소셜 행위 분석과, 사용자가 이용한 콘텐츠를 분석하는 것인 콘텐츠 이용 분석과, 다른 사용자와의 관계를 분석하는 것인 소셜 관계 분석을 통해 사용자 신뢰도를 계산할 수 있다.
상기 서버는 상기 콘텐츠 신뢰도를 계산함에 있어서, 사용자가 이용한 콘텐츠의 카테고리 별로 사용자의 전문성을 판별하여, 각 카테고리 별로 전문가로 선별된 사용자가 행한 콘텐츠에 대한 평가에 대해서 가중치를 부여하기 위한 사용자 전문성 분석과, 사용자가 콘텐츠를 이용하고 나서 해당 콘텐츠에 대해 행한 행위들에 대한 분석인 암시적 행위 분석을 통해 콘텐츠 신뢰도를 계산할 수 있다.
상기 서버는 상기 사용자에게 추천할 콘텐츠를 결정함에 있어서, 상기 전처리된 사용자 행위 데이터와, 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산하고, 이를 통해 상기 전처리된 사용자 행위 데이터 중에서 해당 사용자와 가장 유사한 사용자를 선별하고, 선별된 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행할 수 있다. 이때, 상기 서버는 피어슨 유사도(Pearson Correlation)를 이용하여 유사도를 계산할 수 있다.
도 1은 본 발명의 일 실시예에 따른 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 시스템을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법의 전체 처리 절차를 나타낸 도면이다.
도 1 및 도 2를 참조하면, 서버(100)는 데이터베이스(200)를 이용해서 온라인 소셜 네트워크를 이용하는 사용자의 행위 데이터를 수집한다. 수집된 사용자 행위는 기존 기법에서 고려하지 않았던 사용자 행위를 포함한다. 본 발명에서는 신뢰성이 떨어지는 사용자의 데이터를 제거하기 위해서 수집된 사용자 행위를 이용한다.
도 2를 참조하면, 수집된 사용자 행위 데이터와 콘텐츠 데이터를 대상으로 사용자 신뢰도 계산 모듈(110)과 콘텐츠 신뢰도 계산 모듈(120)을 통해 데이터를 전처리한다.
사용자 신뢰도 계산 모듈(110)을 통해서 소셜 행위 분석(S210), 콘텐츠 이용 분석(S220), 소셜 관계 분석(S230)을 수행한다. 그리고, 계산된 사용자 신뢰도를 이용해서 신뢰성이 떨어지는 사용자의 데이터를 필터링한다.
콘텐츠 신뢰도 계산 모듈(120)에서는 사용자 전문성 분석(S310), 암시적 행위 분석(S320)을 통하여 추천할 콘텐츠의 신뢰도를 계산한다. 그리고, 계산된 콘텐츠 신뢰도를 이용해서 추천 콘텐츠의 추천 우선순위를 결정한다.
그리고, 전처리된 사용자 행위 데이터와 콘텐츠 데이터를 이용해서 협업 필터링을 수행한다(S410).
그리고, 협업 필터링을 통해서 추천 콘텐츠를 선별하고, 계산된 콘텐츠 신뢰도에 따라서 추천 우선순위를 결정하고, 순서대로 콘텐츠 추천을 실시한다(S420).
추천의 정확성을 향상시키기 위해서 신뢰도가 낮은 데이터를 필터링해야 한다. 필터링을 위해 사용자의 신뢰도를 우선 계산해야 한다. 사용자 신뢰도는 사용자 행위 분석을 통해서 도출하는데, 기존 기법에서는 온라인 소셜 네트워크 서비스 환경에서 수집할 수 있는 사용자 행위의 일부만 반영하고 있다. 따라서, 본 발명에서는 기존 기법에서 고려하지 않고 있는 행위를 포함한 5가지의 사용자의 행위를 수집해서 분석에 이용한다.
본 발명에서는 수집된 사용자 행위를 바탕으로 소셜 행위(S210), 콘텐츠 이용(S220), 소셜 관계(S230) 등의 3가지 측면으로 구분해서 사용자 신뢰도 분석을 실시한다.
도 3은 본 발명의 일 실시예에 따른 사용자 신뢰도 계산 과정을 나타낸 도면이다.
도 3을 참조하면, 각 분석에 이용되는 데이터는 중복되지 않고, 독립적으로 수행된다. 또한 결과에 대해서 서로 영향을 미치지 않는다. 3개의 분석을 수행할 시, 각 분석에 대한 중요도는, 분석을 수행하는 사용자와 제공하는 온라인 소셜 네트워크 서비스에 따라 다를 수 있다.
도 4는 본 발명의 일 실시예에 따른 신뢰도 계산을 위한 사용자 행위를 나타낸 도표이다.
도 4를 참조하면, 수집된 행위들은 각 코멘트가 받은 좋아요 수, 사용자가 쓴 코멘트 수, 영화 시청 수, 팔로잉 수, 팔로워 수 등 총 5가지이다.
도 4에서 제안하는 사용자 행위는 온라인 소셜 네트워크 서비스에서 사용자들이 영화를 시청하고 공유하는 활동을 통해서 자연스럽게 남겨진 활동들이기 때문에 수집하기 용이하다. A는 온라인 소셜 네트워크 사용자가 시청한 영화에 대한 코멘트를 남겼을 때 다른 사용자들이 코멘트에 대해 주는 '좋아요' 수를 의미한다. 여기서, '좋아요' 수를 많이 받은 사용자를 신뢰 수 있다고 가정한다. C는 사용자가 시청한 '시청한 영화 수'를 의미한다. Fing은 해당 사용자의 '팔로잉(Following) 수'를 의미하고, Fwer는 해당 사용자의 '팔로워(Follower) 수'를 의미한다.
온라인 소셜 네트워크 공간에서 활동하는 해당 사용자를 평가하기 위해서는, 해당 사용자가 온라인 소셜 네트워크 환경에서 어떤 행동들을 했는지를 파악해야 한다. 이런 이유 때문에 소셜 행위 분석을 통해서 사용자의 신뢰도를 계산한다. 소셜 행위 분석에는 '좋아요 수' A와 '코멘트 수' B를 이용한다. 본 발명에서는 사용자의 소셜 행위인 '좋아요 수'와 '코멘트 수'에 따라 사용자의 신뢰도 점수가 결정된다. 그리고, 소셜 행위를 통해 해당 사용자의 의견이 다른 사용자에게 어떻게 받아들여졌는지, 해당 사용자가 받은 평판은 어떠한지가 평가에 포함된다.
도 5는 사용자의 코멘트에 대해 다른 사용자들이 보낸 좋아요 수를 구하는 과정을 보여주는 도면이다.
사용자 신뢰도 점수 K는 다음 수학식 1로 표현한다.
Figure 112016126902988-pat00001
수학식 1에 의하면, 사용자 신뢰도 점수 K는 사용자가 받은 좋아요 수와 코멘트 수의 합에서 사용자가 받은 좋아요 수가 차지하는 비율을 나타낸다. 여기서, 사용자 신뢰도 점수 K는 0부터 1사이의 값을 가지게 된다. 즉, 사용자가 남긴 코멘트의 수가 적을수록, 그리고 받은 좋아요 수가 많을수록 사용자 신뢰도 점수 K의 값은 1에 근사한 값을 가진다. 계산된 사용자 신뢰도 값이 0에 가깝다면, 사용자의 소셜 행위가 다른 사람의 공감을 얻지 못했다는 의미를 뜻하기 때문에, 해당 사용자를 신뢰하지 못한다는 의미이다.
사용자가 지닌 신뢰성을 파악하기 위해서, 콘텐츠에 대해 얼마만큼 이용하였는지를 파악한다. 콘텐츠를 이용한 횟수를 파악한다면 콘텐츠에 대한 관심의 크기와 흥미를 파악할 수 있기 때문이다.
콘텐츠 이용 분석을 통해서 구한 사용자 신뢰도 점수 Co는 다음 수학식 2로 표현한다.
Figure 112016126902988-pat00002
여기서, Call은 모든 콘텐츠의 수이고, C는 해당 콘텐츠를 이용한 횟수를 나타낸다.
본 발명에서 소셜 네트워크에서 관련된 영화를 시청한 횟수가 적은 사용자보다는, 상대적으로 관련된 영화를 시청한 횟수가 많은 사용자가 더 높은 신뢰도를 가진다고 가정한다. 따라서, 사용자가 시청한 영화의 수가 높을수록 더 높은 신뢰도 점수를 가지게 된다.
본 발명에서는 온라인 소셜 네트워크 환경에서 해당 사용자의 신뢰성을 파악하기 위해서 다른 사용자와의 관계를 이용한다. 다른 사용자들이 해당 사용자를 얼마만큼 의지하는지, 또한 해당 사용자가 다른 사용자에 대해서 의지하는지를 파악하기 위해서 소셜 관계 분석을 실시한다.
사용자의 소셜 관계를 분석하기 위해서, 온라인 소셜 네트워크 사용자가 가지고 있는 Fing와 Fwer를 이용한다. Fing은 해당 사용자의 '팔로잉(Following) 수'를 의미한다. 여기서, 팔로잉이란 해당 사용자가 다른 사용자의 정보를 받아보겠다는 행위로서, 해당 사용자의 팔로잉 수가 높으면 다른 사용자의 정보를 많이 받아 보겠다는 의미이기 때문에, 해당 사용자의 의존성을 나타낸다고 할 수 있다.
Fwer는 해당 사용자의 '팔로워(Follower) 수'를 의미한다. 팔로워는 해당 사용자의 정보를 받아보기로 한 다른 사용자를 의미한다. 즉, 다른 사용자들로부터 받은 모든 팔로잉의 합으로 표현할 수 있고, 해당 사용자가 다른 사용자에게 미치는 영향력을 의미한다. 따라서, 상대적으로 팔로잉 수 보다 팔로워의 수가 많을 때, 해당 사용자는 온라인 소셜 네트워크 환경에서 다른 사용자에게 미치는 외부 영향력이 크다고 가정한다. 외부 영향력이란 사용자가 다른 사용자에게 주는 영향력의 크기를 의미한다. 외부 영향력이 클수록 다른 사용자에게 미치는 영향력이 크기 때문에 신뢰도 있는 사용자로 판단한다.
도 6은 사용자의 팔로잉과 팔로워 수를 나타낸 도면이다.
도 6의 실시예에서, 해당 사용자의 팔로잉 수는 4이고, 팔로워 수는 3이다.
소셜 관계 분석을 통해 구한 사용자 신뢰도 점수 F는 다음 수학식 3으로 표현한다.
Figure 112016126902988-pat00003
수학식 3에서 사용자 신뢰도 점수 F는 사용자의 팔로잉 수와 팔로워 수의 합에서 팔로워 수가 차지하는 비율을 나타낸다. 팔로워 수가 많을수록, 그리고 팔로잉 수가 적을수록, 사용자 신뢰도 점수 F의 값은 1에 가까워진다.
이제, 앞서 수행한 3가지 분석인 소셜 행위 분석, 콘텐츠 이용 분석, 소셜 관계 분석을 통합해서 사용자가 가지고 있는 최종적인 사용자 신뢰도를 종합한다. 즉, 계산된 3개의 사용자 신뢰도 점수 K, C, F를 종합해서 최종 사용자 신뢰도 점수 T를 계산한다. T는 다음 수학식 4로 표현한다.
Figure 112016126902988-pat00004
수학식 4의 α,β,γ는 각각 계산된 신뢰도 점수에 대해 부여한 가중치를 의미하며, α,β,γ의 합은 1이다.
본 발명에서 최종 계산된 사용자 신뢰도 T와 사용자가 정한 임계치 θt를 비교해서, 임계치보다 작은 신뢰도를 가진 사용자를 필터링한다. 그리고, 필터링 후 남은 사용자들을 신뢰할 수 있는 사용자로 선별한다. 선별된 사용자는 신뢰할 수 있는 사용자 그룹으로 구분된다.
도 7은 사용자 신뢰도를 계산하고 신뢰성이 떨어지는 사용자의 데이터를 필터링하는 알고리즘이다.
도 7을 참조하면, 입력인자 Ui는 신뢰성을 평가하기 위한 사용자들이다. 각 사용자의 행위 데이터와 콘텐츠 데이터를 이용하여, 3가지 분석을 통해서 사용자 신뢰도 점수를 계산한다. 그리고, 3개의 사용자 신뢰도 점수 K, C, F를 종합해서 최종 신뢰도 점수 T를 계산한다. 그리고, T와 임계치 θ를 비교하여 신뢰성이 떨어지는 사용자를 필터링한다. 출력인자 Ut는 신뢰성이 떨어지는 사용자를 필터링하고 남은 신뢰성 있는 사용자의 집합이다.
본 발명에서는 수집한 사용자의 행위 데이터와 콘텐츠 데이터를 이용해서 콘텐츠 신뢰도를 계산한다. 그리고, 계산된 콘텐츠 신뢰도를 이용해서 추천 콘텐츠의 추천 우선순위를 결정한다.
콘텐츠 신뢰도 계산은 2가지 요소를 고려하는데, 사용자 전문성 분석과 암시적 행위 분석이 그것이다.
도 8 은 콘텐츠 신뢰도를 계산하는 과정을 나타낸다.
도 8을 참조하면, 사용자 전문성 분석은 이용한 콘텐츠의 카테고리 별로 사용자의 카테고리에 대한 전문성을 판별해서, 전문가로 선별된 사용자가 매긴 콘텐츠에 대한 평가에 대해서 가중치를 주는 것이다.
그리고, 계산된 카테고리에 대한 전문성을 이용하여 일반 사용자와 카테고리 전문가로 구분하고, 암시적 행위 분석을 수행한다. 암시적 행위 분석은 사용자가 콘텐츠를 이용하고, 콘텐츠에 대해서 남긴 행위들에 대한 분석을 의미한다. 암시적 행위 분석을 통해서 콘텐츠의 신뢰도를 계산한다.
예를 들어, 영화에 대한 평가는 흔히 일반 사용자와 전문가들의 평가가 갈리는 경우가 많다. 일반 사용자는 친구의 평가나 정치적 견해, 입소문 등에 의해서 영화에 대한 평가가 바뀌는 반면, 전문가들은 좀 더 객관적으로 콘텐츠를 평가하는 경향을 지닌다. 따라서, 이용한 콘텐츠를 평가하기 위해서, 우선 온라인 소셜 네트워크 사용자 중에서 카테고리 전문가를 선별하는 과정을 실시한다. 카테고리 전문가는 사용자의 전문가 점수를 계산해서 도출한다.
도 9는 카테고리 전문가 계산을 위한 사용자 행위 데이터와 콘텐츠 데이터를 나타낸 도면이다.
도 9를 참조하면, 사용자가 이용한 콘텐츠의 정보를 바탕으로 카테고리 별 콘텐츠 이용 수 Nc와, 카테고리 별로 받은 좋아요 수 Ng를 이용한다.
Nc는 사용자가 이용한 콘텐츠를 카테고리 별로 구분하여, 카테고리 별로 시청한 영화의 총 합으로 계산한다.
Ng는 사용자가 이용한 콘텐츠에 대해서 남긴 코멘트에 대해 받은 좋아요 수의 합이다. 이때, 코멘트는 사용자가 시청한 영화의 카테고리를 기준으로 구분되어 계산한다.
본 발명에서 다음 수학식 5를 이용하여 카테고리 전문가를 선별한다.
Figure 112016126902988-pat00005
여기서, Ep는 카테고리 전문가 점수를 의미한다. 본 발명의 일 실시예에서, 계산된 카테고리 전문가 점수 Ep가 임계값 θe 보다 높을 경우, 카테고리 전문가 사용자로 선별한다. 그리고, 임계값을 넘기지 못한 사용자는 일반 사용자로 판단한다.
도 10은 카테고리 전문가를 선별하는 알고리즘이다.
도 10을 참조하면, 입력인자인 Ut는 신뢰성이 있는 사용자 집단을 의미하며, 각 사용자들의 사용자 행위데이터를 이용하여, 카테고리에 대한 이용 분석을 통해서 카테고리 전문가를 선별한다. 그리고, 출력 인자 Uex는 카테고리 전문가를 의미하고, 출력 인자 Ug는 일반 사용자를 의미한다.
본 발명에서 온라인 소셜 네트워크 사용자를 카테고리 전문가와 일반 사용자로 구분하면, 사용자의 암시적 행위 분석을 통해서 콘텐츠의 신뢰도를 계산한다.
사용자가 온라인 소셜 네트워크에서 행하는 암시적 행위들은, 사용자가 이용한 콘텐츠에 대해서 어떤 태도나 평가를 하고 있는지를 간접적으로 보여주는 척도이다. 따라서, 콘텐츠가 지니고 있는 사용자의 암시적 행위에 대한 계산을 통해 콘텐츠의 신뢰도를 계산할 수 있다.
사용자의 암시적 행위는 사용자 신뢰도를 계산하기 위해서 수집했던 사용자 행위에 포함되어 있다. 카테고리 별로 구분되어 있는 콘텐츠의 신뢰도를 계산 시, 동일한 사용자의 행위에 대해서 일반 사용자보다 카테고리 전문가의 점수를 높게 평가한다. 그리고, 사용자가 콘텐츠에 대해서 보여준 암시적 행위를 긍정적인 것과 부정적인 것으로 구분해서 계산한다. 도 11은 일반 사용자와 카테고리 전문가의 암시적 행위에 대한 점수를 나타낸 도표이다.
도 12는 소셜 행위에 대해 사용자의 적극성에 관한 설문조사 결과를 나타낸 도표이다. 즉, 도 12는 사용자의 암시적 행위에 대해서 부여한 점수를 의미한다.
도 12에서는 사용자 행위의 점수를 결정하기 위하여, 30명의 임의의 일반인을 대상으로 실시한 설문조사를 기반으로 점수를 부여하였으며, 그 결과를 나타낸 것이다. 본 발명에서는 사용자 행위에 해당하는 점수만을 가져와서 사용한다.
암시적 사용자 행위를 바탕으로 일반 사용자, 카테고리 전문가의 콘텐츠에 대한 긍정 점수와 부정 점수를 계산한다. 긍정적인 암시적 평가 Ip는 하나의 카테고리에 속한 영화에 대해서 n명의 사용자 j가 각각 m개의 소셜 행위 k의 점수를 각각 더해서 도출한다. 따라서 긍정적 암시적 평가 Ip는 다음 수학식 6과 같이 나타낼 수 있다.
Figure 112016126902988-pat00006
부정적인 암시적 평가 In은 긍정적인 암시적 평가 Ip와 같이 행위별 점수를 반영해서 계산한다. 부정적 암시적 평가 In은 다음 수학식 7과 같이 나타낼 수 있다.
Figure 112016126902988-pat00007
Ct는 사용자의 긍정적인 암시적 행위 점수와 부정적인 암시적 행위 점수를 종합한 콘텐츠의 신뢰도 점수를 의미한다. Ct는 다음 수학식 8과 같다.
Figure 112016126902988-pat00008
이제, 사용자 신뢰도 모듈(110)을 통해 얻은 사용자 신뢰도와, 콘텐츠 신뢰도 모듈(120)을 통해 얻은 콘텐츠 신뢰도를 이용하여, 콘텐츠 추천을 수행한다.
본 발명에서는 사용자에게 추천할 콘텐츠를 도출하기 위하여 협업 필터링을 실시한다.
도 13은 콘텐츠 추천 과정을 나타낸 도면이다.
도 13을 참조하면, 미리 계산된 사용자 신뢰도를 이용한 필터링을 통해서 신뢰성이 떨어지는 사용자의 데이터를 제거한다.
그리고, 필터링 후 남은 사용자들과 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산한다.
그리고, 유사도 계산을 통해 해당 사용자와 유사한 사용자를 선별하고, 두 사용자의 콘텐츠 이용 정보를 이용해서 협업 필터링을 수행한다.
협업 필터링을 통해 해당 사용자에게 추천할 콘텐츠를 결정하고, 결정된 추천 콘텐츠를 콘텐츠 신뢰도에 따라 추천 우선순위를 결정하고, 순서대로 추천을 실행한다.
본 발명의 일 실시예에서 유사도는 피어슨 유사도(Pearson Correlation)를 이용할 수 있다. 피어슨 유사도는 두 대상의 데이터 집합이 얼마나 한 직선으로 표현되는지에 대한 측정값이다. 이때, 두 대상 사이의 유사도는 피어슨 상관계수로 계산하는데, 두 사용자가 지닌 평점 이력을 바탕으로 피어슨 상관계수를 계산한다. 피어슨 유사도는 다음 수학식 9로 표현할 수 있다.
Figure 112016126902988-pat00009
여기서, u는 해당 사용자, e는 선별된 신뢰할 수 있는 사용자, i는 과거 평점을 준 콘텐츠 객체, I는 전체 콘텐츠의 집합을 의미한다. 본 발명에서는 이러한 유사도 계산을 통해 해당 사용자와 유사한 사용자를 선별한다.
그리고, 선별된 유사 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행한다. 본 발명에서는 협업 필터링을 통해서 해당 사용자에게 추천할 콘텐츠를 결정한다.
그리고, 결정된 추천 콘텐츠를 추천 우선순위에 따라서 추천을 실행한다. 이때, 우선순위 결정의 기준은 앞에서 구한 콘텐츠의 신뢰도에 따라서 결정한다.
그리고, 추천을 수행하면서 추천되는 콘텐츠에 대해서 해당 사용자가 줄 예측 평점을 계산한다. 여기서, 계산된 예측 평점은 해당 사용자가 추천된 콘텐츠를 이용하고 난 다음에 줄 예상 평점을 의미한다. 다음 수학식 10은 예측 평점을 계산하는 수학식이다.
Figure 112016126902988-pat00010
여기서, u는 해당 사용자, i는 추천 영화, E는 유사 사용자 그룹, e는 유사 사용자 객체를 의미한다. 이렇게 본 발명에서는 추천 받은 콘텐츠에 대한 예측 평점과 실제로 준 예상 평점 간의 비교를 통해서 추천의 정확성을 평가할 수 있다.
이처럼, 본 발명에서는 온라인 소셜 네트워크 사용자를 위한 협업 필터링 기반의 영화 추천 기법을 제안한다. 본 발명에서 제안하는 기법은 신뢰도가 떨어지는 사용자의 데이터를 제거하기 위하여, 신뢰도가 낮은 사용자의 데이터를 필터링한다.
그리고, 사용자 신뢰도를 계산하기 위해서 온라인 환경에서 사용자 행위를 이용해서 소셜 행위 분석, 콘텐츠 이용 분석, 소셜 관계 분석을 수행한다.
또한, 추천 콘텐츠의 우선순위를 판정하기 위해서 콘텐츠가 지닌 신뢰도를 계산한다. 콘텐츠 신뢰도를 계산하기 위해서 사용자 행위를 이용해서 사용자 전문성 분석과 암시적 행위 분석을 수행한다.
그리고, 계산된 사용자 신뢰도를 기반으로 유사 사용자를 선별하고 협업 필터링을 수행하여 해당 사용자에게 추천할 영화를 선별한다.
그리고, 선별된 영화의 콘텐츠 신뢰도를 바탕으로 추천 콘텐츠의 우선순위를 결정하고, 콘텐츠 추천을 수행한다.
이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.
100 서버 200 데이터베이스
110 사용자 신뢰도 모듈 120 콘텐츠 신뢰도 모듈

Claims (10)

  1. 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에서의 콘텐츠 추천 방법에 있어서,
    온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하는 단계;
    온라인 소셜 네트워크에서 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하는 단계;
    상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하는 단계;
    상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하는 단계;
    상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하는 단계; 및
    결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 단계를 포함하며,
    상기 사용자 신뢰도를 계산하는 단계에서, 온라인 소셜 네트워크에서, 사용자의 행위를 분석하는 것인 소셜 행위 분석과, 사용자가 이용한 콘텐츠를 분석하는 것인 콘텐츠 이용 분석과, 다른 사용자와의 관계를 분석하는 것인 소셜 관계 분석을 통해 사용자 신뢰도를 계산하며,
    A는 온라인 소셜 네트워크 사용자가 이용한 콘텐츠에 대한 코멘트를 남겼을 때 다른 사용자들이 해당 코멘트에 대해 표시한 호감의 수이고, B는 상기 사용자가 해당 콘텐츠에 대해 남긴 코멘트의 수를 의미한다고 할 때,
    상기 소셜 행위 분석을 통한 사용자 신뢰도 점수 K를,
    K=A/(A+B) (수학식 1)
    로 나타낼 수 있고,
    C는 온라인 소셜 네트워크 사용자가 이용한 콘텐츠의 수이고, Call은 모든 콘텐츠의 수를 의미한다고 할 때,
    상기 콘텐츠 이용 분석을 통한 사용자 신뢰도 점수 Co를,
    Figure 112017121485722-pat00024
    (수학식 2)
    로 나타낼 수 있고,
    팔로잉(Following)이란 온라인 소셜 네트워크 환경에서 어느 사용자가 다른 사용자의 정보를 받아보겠다는 행위이고, 팔로워(Follower)란 온라인 소셜 네트워크 환경에서 어느 사용자의 정보를 받아보기로 한 다른 사용자를 나타내며,
    Fwer는 온라인 소셜 네트워크 환경에서 사용자의 팔로워(Follower) 수이고, Fing은 온라인 소셜 네트워크 사용자의 팔로잉(Following) 수를 의미한다고 할 때,
    상기 소셜 관계 분석을 통한 사용자 신뢰도 점수 F를,
    Figure 112017121485722-pat00025
    (수학식 3)
    로 나타낼 수 있고,
    α는 상기 소셜 행위 분석을 통해 계산된 신뢰도 점수에 대한 가중치이고, β는 상기 콘텐츠 이용 분석을 통해 계산된 신뢰도 점수에 대한 가중치이고, γ는 상기 소셜 관계 분석을 통해 계산된 신뢰도 점수에 대한 가중치를 의미하며, α,β,γ의 합은 1이라고 할 때,
    상기 소셜 행위 분석, 상기 콘텐츠 이용 분석, 상기 소셜 관계 분석을 통한 사용자 신뢰도 점수를 통합한 최종적인 사용자 신뢰도 점수 T를,
    Figure 112017121485722-pat00026
    (수학식 4)
    로 나타낼 수 있으며,
    상기 사용자 행위 데이터를 전처리하는 단계에서, 상기 T와 미리 정해진 임계치 θt를 비교해서, 임계치 θt보다 작은 신뢰도를 가진 사용자를 필터링하고, 필터링 후 남은 사용자들을 신뢰할 수 있는 사용자로 선별하는 것을 특징으로 하는 콘텐츠 추천 방법.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 콘텐츠 신뢰도를 계산하는 단계에서,
    사용자가 이용한 콘텐츠의 카테고리 별로 사용자의 전문성을 판별하여, 각 카테고리 별로 전문가로 선별된 사용자가 행한 콘텐츠에 대한 평가에 대해서 가중치를 부여하기 위한 사용자 전문성 분석과, 사용자가 콘텐츠를 이용하고 나서 해당 콘텐츠에 대해 행한 행위들에 대한 분석인 암시적 행위 분석을 통해 콘텐츠 신뢰도를 계산하는 것을 특징으로 하는 콘텐츠 추천 방법.
  4. 청구항 1에 있어서,
    상기 사용자에게 추천할 콘텐츠를 결정하는 단계에서,
    상기 전처리된 사용자 행위 데이터와, 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산하고, 이를 통해 상기 전처리된 사용자 행위 데이터 중에서 해당 사용자와 가장 유사한 사용자를 선별하고, 선별된 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행하는 것을 특징으로 하는 콘텐츠 추천 방법.
  5. 청구항 4에 있어서,
    상기 유사도 계산에 있어서, 피어슨 유사도(Pearson Correlation)를 이용하는 것을 특징으로 하는 콘텐츠 추천 방법.
  6. 온라인 소셜 네트워크에서 콘텐츠 추천 시스템에 있어서,
    온라인 소셜 네트워크에서 활동하는 사용자의 행위 데이터 및 콘텐츠 데이터를 저장하고 있는 데이터베이스; 및
    상기 데이터베이스로부터 사용자의 행위 데이터를 수집하고, 수집된 사용자 행위 데이터를 이용하여 사용자 신뢰도를 계산하고, 상기 데이터베이스로부터 콘텐츠 데이터를 수집하고, 상기 사용자 행위 데이터와 수집된 콘텐츠 데이터를 이용하여 콘텐츠 신뢰도를 계산하고, 상기 사용자 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 사용자 행위 데이터를 제거하는 필터링을 수행하여 사용자 행위 데이터를 전처리하고, 상기 콘텐츠 신뢰도를 이용하여 상대적으로 신뢰성이 낮은 콘텐츠 데이터를 제거하는 필터링을 수행하여 콘텐츠 데이터를 전처리하고, 상기 전처리된 사용자 행위 데이터와 상기 전처리된 콘텐츠 데이터를 이용하여 협업 필터링을 수행하고, 이를 통해 사용자에게 추천할 콘텐츠를 결정하고, 결정된 추천할 콘텐츠에 대하여 상기 콘텐츠 신뢰도에 따라 우선 순위를 결정하고, 결정된 우선 순위에 따라 콘텐츠를 사용자에게 추천하는 서버를 포함하며,
    상기 서버는 상기 사용자 신뢰도를 계산함에 있어서, 온라인 소셜 네트워크에서, 사용자의 행위를 분석하는 것인 소셜 행위 분석과, 사용자가 이용한 콘텐츠를 분석하는 것인 콘텐츠 이용 분석과, 다른 사용자와의 관계를 분석하는 것인 소셜 관계 분석을 통해 사용자 신뢰도를 계산하며,
    A는 온라인 소셜 네트워크 사용자가 이용한 콘텐츠에 대한 코멘트를 남겼을 때 다른 사용자들이 해당 코멘트에 대해 표시한 호감의 수이고, B는 상기 사용자가 해당 콘텐츠에 대해 남긴 코멘트의 수를 의미한다고 할 때,
    상기 소셜 행위 분석을 통한 사용자 신뢰도 점수 K를,
    K=A/(A+B) (수학식 1)
    로 나타낼 수 있고,
    C는 온라인 소셜 네트워크 사용자가 이용한 콘텐츠의 수이고, Call은 모든 콘텐츠의 수를 의미한다고 할 때,
    상기 콘텐츠 이용 분석을 통한 사용자 신뢰도 점수 Co를,
    Figure 112017121485722-pat00027
    (수학식 2)
    로 나타낼 수 있고,
    팔로잉(Following)이란 온라인 소셜 네트워크 환경에서 어느 사용자가 다른 사용자의 정보를 받아보겠다는 행위이고, 팔로워(Follower)란 온라인 소셜 네트워크 환경에서 어느 사용자의 정보를 받아보기로 한 다른 사용자를 나타내며,
    Fwer는 온라인 소셜 네트워크 환경에서 사용자의 팔로워(Follower) 수이고, Fing은 온라인 소셜 네트워크 사용자의 팔로잉(Following) 수를 의미한다고 할 때,
    상기 소셜 관계 분석을 통한 사용자 신뢰도 점수 F를,
    Figure 112017121485722-pat00028
    (수학식 3)
    로 나타낼 수 있고,
    α는 상기 소셜 행위 분석을 통해 계산된 신뢰도 점수에 대한 가중치이고, β는 상기 콘텐츠 이용 분석을 통해 계산된 신뢰도 점수에 대한 가중치이고, γ는 상기 소셜 관계 분석을 통해 계산된 신뢰도 점수에 대한 가중치를 의미하며, α,β,γ의 합은 1이라고 할 때,
    상기 소셜 행위 분석, 상기 콘텐츠 이용 분석, 상기 소셜 관계 분석을 통한 사용자 신뢰도 점수를 통합한 최종적인 사용자 신뢰도 점수 T를,
    Figure 112017121485722-pat00029
    (수학식 4)
    로 나타낼 수 있으며,
    상기 서버는 상기 T와 미리 정해진 임계치 θt를 비교해서, 임계치 θt보다 작은 신뢰도를 가진 사용자를 필터링하고, 필터링 후 남은 사용자들을 신뢰할 수 있는 사용자로 선별하는 것을 특징으로 하는 콘텐츠 추천 시스템.
  7. 삭제
  8. 청구항 6에 있어서,
    상기 서버는 상기 콘텐츠 신뢰도를 계산함에 있어서, 사용자가 이용한 콘텐츠의 카테고리 별로 사용자의 전문성을 판별하여, 각 카테고리 별로 전문가로 선별된 사용자가 행한 콘텐츠에 대한 평가에 대해서 가중치를 부여하기 위한 사용자 전문성 분석과, 사용자가 콘텐츠를 이용하고 나서 해당 콘텐츠에 대해 행한 행위들에 대한 분석인 암시적 행위 분석을 통해 콘텐츠 신뢰도를 계산하는 것을 특징으로 하는 콘텐츠 추천 시스템.
  9. 청구항 6에 있어서,
    상기 서버는 상기 사용자에게 추천할 콘텐츠를 결정함에 있어서, 상기 전처리된 사용자 행위 데이터와, 콘텐츠 추천을 받고자 하는 해당 사용자 사이의 유사도를 계산하고, 이를 통해 상기 전처리된 사용자 행위 데이터 중에서 해당 사용자와 가장 유사한 사용자를 선별하고, 선별된 사용자와 해당 사용자의 콘텐츠 이용 정보를 이용하여 협업 필터링을 수행하는 것을 특징으로 하는 콘텐츠 추천 시스템.
  10. 청구항 9에 있어서,
    상기 서버는 피어슨 유사도(Pearson Correlation)를 이용하여 유사도를 계산하는 것을 특징으로 하는 콘텐츠 추천 시스템.
KR1020160178210A 2016-12-23 2016-12-23 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템 KR101859620B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160178210A KR101859620B1 (ko) 2016-12-23 2016-12-23 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160178210A KR101859620B1 (ko) 2016-12-23 2016-12-23 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR101859620B1 true KR101859620B1 (ko) 2018-05-18

Family

ID=62453601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160178210A KR101859620B1 (ko) 2016-12-23 2016-12-23 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101859620B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190140599A (ko) * 2018-06-12 2019-12-20 엔에이치엔 주식회사 비지니스 생산자에 의한 사용자 채널 컨텐츠 필터링 방법 및 시스템
KR102140325B1 (ko) * 2019-08-29 2020-07-31 유한회사 엘민벤처스 블록체인 기반의 팩트체킹과 검색 기능이 있는 컨텐츠 관리 방법 및 그 시스템
KR20210026959A (ko) * 2019-09-02 2021-03-10 (주)새움소프트 그룹 웨어 페이지에 사용자의 소속회사에 특화된 컨텐츠를 제공하는 방법 및 상기 방법을 실행하기 위하여 저장 매체에 저장된 컴퓨터 프로그램
KR20220094048A (ko) 2020-12-28 2022-07-05 동서대학교 산학협력단 협업 필터링 기반의 호스트-인플루언서 매칭 시스템 및 그 방법
KR20220135852A (ko) * 2021-03-31 2022-10-07 한양대학교 산학협력단 학습자 맞춤형 온라인 교육 프로그램 추천 방법 및 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101639987B1 (ko) * 2015-01-19 2016-07-18 배재대학교 산학협력단 혼합 필터링 기반의 영화추천 방법 및 장치
KR101677684B1 (ko) * 2015-09-18 2016-11-21 충북대학교 산학협력단 소셜 미디어에 대한 사용자 행위 분석을 기반으로 한 신뢰성 평가 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101639987B1 (ko) * 2015-01-19 2016-07-18 배재대학교 산학협력단 혼합 필터링 기반의 영화추천 방법 및 장치
KR101677684B1 (ko) * 2015-09-18 2016-11-21 충북대학교 산학협력단 소셜 미디어에 대한 사용자 행위 분석을 기반으로 한 신뢰성 평가 방법 및 장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190140599A (ko) * 2018-06-12 2019-12-20 엔에이치엔 주식회사 비지니스 생산자에 의한 사용자 채널 컨텐츠 필터링 방법 및 시스템
KR102072738B1 (ko) * 2018-06-12 2020-03-02 엔에이치엔 주식회사 비지니스 생산자에 의한 사용자 채널 컨텐츠 필터링 방법 및 시스템
KR102140325B1 (ko) * 2019-08-29 2020-07-31 유한회사 엘민벤처스 블록체인 기반의 팩트체킹과 검색 기능이 있는 컨텐츠 관리 방법 및 그 시스템
KR20210026959A (ko) * 2019-09-02 2021-03-10 (주)새움소프트 그룹 웨어 페이지에 사용자의 소속회사에 특화된 컨텐츠를 제공하는 방법 및 상기 방법을 실행하기 위하여 저장 매체에 저장된 컴퓨터 프로그램
KR102332536B1 (ko) * 2019-09-02 2021-11-30 (주)새움소프트 그룹 웨어 페이지에 사용자의 소속회사에 특화된 컨텐츠를 제공하는 방법 및 상기 방법을 실행하기 위하여 저장 매체에 저장된 컴퓨터 프로그램
KR20220094048A (ko) 2020-12-28 2022-07-05 동서대학교 산학협력단 협업 필터링 기반의 호스트-인플루언서 매칭 시스템 및 그 방법
KR20220135852A (ko) * 2021-03-31 2022-10-07 한양대학교 산학협력단 학습자 맞춤형 온라인 교육 프로그램 추천 방법 및 장치
KR102616803B1 (ko) * 2021-03-31 2023-12-20 한양대학교 산학협력단 학습자 맞춤형 온라인 교육 프로그램 추천 방법 및 장치

Similar Documents

Publication Publication Date Title
KR101859620B1 (ko) 온라인 소셜 네트워크에서 신뢰성 기반의 콘텐츠 추천 방법 및 시스템
US9934515B1 (en) Content recommendation system using a neural network language model
Sen et al. A total error framework for digital traces of human behavior on online platforms
Cantador et al. Cross-domain recommender systems
KR101871747B1 (ko) 유사성향 기반 사용자-관광상품 추천 방법 및 시스템
US9467744B2 (en) Comment-based media classification
US9965776B2 (en) Digital content recommendations based on user comments
US20140122405A1 (en) Information processing apparatus, information processing method, and program
US9070140B2 (en) System and method for measuring and improving the efficiency of social media campaigns
CN112395489B (zh) 一种推荐方法及装置、设备和计算机存储介质
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
TW201447797A (zh) 內容個人化之多相排序方法和系統
CN110717093B (zh) 一种基于Spark的电影推荐系统及方法
US20160335704A1 (en) Method, Apparatus and System for Content Recommendation
Anand et al. Folksonomy-based fuzzy user profiling for improved recommendations
KR20130062442A (ko) 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템
US20160012454A1 (en) Database systems for measuring impact on the internet
KR101725510B1 (ko) 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치
Dickinger et al. Significant word items in hotel guest reviews: A feature extraction approach
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
Ashraf et al. Personalized news recommendation based on multi-agent framework using social media preferences
CN109118243B (zh) 一种产品分享、有用评价识别、推送方法和服务器
Wang et al. Towards effective recommendation of social data across social networking sites
Thaipisutikul et al. Beyond the tweets: Discovering factors that influence TV series preferences from ubiquitous social networks
KR20170079423A (ko) 콘텐츠 추천을 위한 동적인 노이즈 제거 방법 및 콘텐츠 추천 시스템

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant