KR20200066447A - 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법 - Google Patents

딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법 Download PDF

Info

Publication number
KR20200066447A
KR20200066447A KR1020180152506A KR20180152506A KR20200066447A KR 20200066447 A KR20200066447 A KR 20200066447A KR 1020180152506 A KR1020180152506 A KR 1020180152506A KR 20180152506 A KR20180152506 A KR 20180152506A KR 20200066447 A KR20200066447 A KR 20200066447A
Authority
KR
South Korea
Prior art keywords
news
residence time
preference
subscriber
score
Prior art date
Application number
KR1020180152506A
Other languages
English (en)
Other versions
KR102126796B1 (ko
Inventor
강명주
곽지훈
노형민
김현욱
서현
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020180152506A priority Critical patent/KR102126796B1/ko
Publication of KR20200066447A publication Critical patent/KR20200066447A/ko
Application granted granted Critical
Publication of KR102126796B1 publication Critical patent/KR102126796B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0263Targeted advertisements based upon Internet or website rating

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 딥러닝을 이용하여 뉴스 구독자가 읽은 뉴스에 대한 선호도를 판단하는 기술에 관한 것으로, 체류 시간 정보 수집부, 정규 분포 함수 매칭부, 체류시간 분포 추정부, 맞춤형 점수 계산부, 개인 선호도 판단부를 포함할 수 있으며, 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고, 이를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하여 뉴스 선호도를 제공함으로써 더욱 정확한 개인별 선호도를 제공할 수 있다는 효과가 존재한다.

Description

딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법{news preference determining apparatus based on staying time using deep running and method therefor}
본 발명은 딥러닝을 이용하여 뉴스 구독자가 읽은 뉴스에 대한 선호도를 판단하는 기술에 대한 것으로, 더 자세하게는 각 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고 수집된 체류 시간을 상대 점수로 환산하여 해당 뉴스의 개인 선호도를 판단하여 개인별 뉴스 선호도를 제공하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법을 제공하는 것을 목적으로 한다.
온라인 뉴스의 폭발적인 증가에 따라 사용자가 뉴스를 찾는 요구 역시 비례적으로 증가하고 있다.
특히, 온라인 상에 발생하는 뉴스에서 각 개인 사용자가 원하는 정보를 찾아 주거나 여과시켜 주는 정보 여과는 정보 과부하가 발생하는 현 시점에서 중요한 기술이다.
종래의 뉴스 추천 시스템은 사용자가 온라인 상에서 읽은 문서를 바탕으로 사용자 프로파일을 구축하고, 구축한 프로파일에서 문서 추천에 사용할 용어를 분석하며, 분석된 용어와 의 유사도가 높은 문서를 사용자에게 추천한다.
종래의 뉴스 추천 시스템은 뉴스 구독자가 뉴스 기사에 대한 체류 시간을 기반으로 뉴스 구독자별 뉴스 선호도를 산정하는 것에는 뉴스 구독자마다 뉴스를 읽은 속도가 달라 절대 시간을 기준으로 선호도를 산정하는 경우 선호도 판단에 오류가 발생하는 문제점이 존재 하였다.
본 발명은 뉴스 구독자가 뉴스 기사에 대한 체류 시간을 기반으로 뉴스 구독자별 뉴스 선호도를 산정하는 것에는 뉴스 구독자마다 뉴스를 읽은 속도가 달라 절대 시간을 기준으로 선호도를 산정하는 경우 선호도 판단에 오류가 발생하는 문제점을 해결하기 위하여 각 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고 수집된 체류 시간을 상대 점수로 환산하여 해당 뉴스의 개인 선호도를 판단하여 개인별 뉴스 선호도를 제공하는 것에 그 목적이 있다.
본 발명의 실시 예에 따르면 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치는 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여, 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 체류 시간 정보 수집부; 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 정규 분포 함수 매칭부; 상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 체류시간 분포 추정부; 상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 맞춤형 점수 계산부; 및 상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 개인 선호도 판단부를 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 체류시간 분포 추정부는, 상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 갈 수 있다.
본 발명의 일 실시 예에 따르면 상기 맞춤형 점수 계산부는, 상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.
본 발명의 일 실시 예에 따르면 상기 개인 선호도 판단부는, 상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.
본 발명의 일 실시 예에 따르면 상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공할 수 있다.
본 발명의 실시 예에 따르면 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여, 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 단계; 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 단계; 상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 단계; 상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 단계; 및 상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 단계를 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 체류시간 분포를 추정하는 단계는, 상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 가는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 갈수 있다.
본 발명의 일 실시 예에 따르면 상기 맞춤형 점수를 계산하는 단계는, 상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.
본 발명의 일 실시 예에 따르면 상기 개인 선호도를 판단하는 단계는, 상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.
본 발명의 일 실시 예에 따르면 상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공할 수 있다.
본 발명에 따르면 딥러닝을 이용하여 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고, 이를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하여 뉴스 선호도를 제공함으로써 더욱 정확한 개인별 선호도를 제공할 수 있다는 효과가 존재한다.
도 1은 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치의 구성도이다.
도 2는 본 발명의 실시 예에 따른 뉴스 선호도 판단 장치에서의 데이터 흐름을 나타내는 도면이다.
도 3은 본 발명의 실시 예에 따라 히스토그램을 스무딩하여 산출된 각 기사별 체류시간 분포 추정 그래프를 나타낸 도면이다.
도 4는 본 발명의 실시 예에 따라 추정된 체류시간 분포를 누적하여 생성한누적 분포 함수 그래프를 나타낸 도면이다.
도 5는 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법의 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하, 도면을 참조하여 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법에 대하여 설명한다.
도 1은 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치(1000)의 구성도이다.
도 1을 참조하면 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 (1000)는 체류 시간 정보 수집부(100), 정규 분포 함수 매칭부(200), 체류시간 분포 추정부(300), 맞춤형 점수 계산부(400), 개인 선호도 판단부(500)를 포함할 수 있다.
본 발명의 일 실시 예에 따르면 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치(1000) 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여 각 구성요소의 동작을 수행할 수 있다.
체류 시간 정보 수집부(100)는 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집할 수 있다.
본 발명의 일 실시 예에 따르면 한 명의 뉴스 구독자가 뉴스 기사를 읽기 위해 해당 웹페이지에 체류한 체류 시간을 측정하여 체류 시간 정보로 정의할 수 있다.
상기 실시 예에 따르면 뉴스 구독자가 구독한 복수의 뉴스 기사에 포함된 각 뉴스 기사 별로 체류 시간을 측정할 수 있으며, 이렇게 측정된 체류 시간을 기준으로 체류 시간 정보를 생성할 수 있다.
이때 생성된 체류 시간 정보에 포함된 시간 정보는 절대적인 시간에 대한 것으로 뉴스 구독자별 구독 속도 및 구독 습관에 대하여 전혀 고려가 되어 있지 않아 이를 기반으로 선호도를 산정하는 경우 개인차로 인하여 정확도가 감소하는 문제점이 존재한다.
따라서 본 발명과 같이 측정된 체류 시간을 바탕으로 개인별 상대 시간을 산정할 필요성이 존재한다.
정규 분포 함수 매칭부(200)는 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.
본 발명의 일 실시 예에 따르면 뉴스 구독자 A가 뉴스기사 1, 2, 3,…을 읽었다고 가정하면, 수 많은 뉴스 시가 중에서 특정한 기사를 읽었다는 희박한 확률의 사건이 일어난 것이므로 각각의 사건이 중요한 의미를 가질 수 있다.
본 발명이 일 실시 예에 따르면 뉴스 구독자 A에게 뉴스기사 1과 취향적으로 비슷한 다른 특정 뉴스기사를 보여준다면 뉴스기사 1을 읽었을 때와 비슷한 체류시간을 가질 것임을 가정하면, 비슷한 체류시간은 정규분포를 따를 것이라고 추정할 수 있으며, 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.
체류시간 분포 추정부(300)는 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여, 뉴스 구독자의 체류시간 분포를 추정할 수 있다.
본 발명의 일 실시 예에 따르면 뉴스 구독자 A가 뉴스를 읽은 사건 하나(뉴스 기사, 체류시간)에 정규 분포 함수를 하나를 대응시키고, 대응된 정규분포함수들을 선형 결합해 뉴스 구독자 A의 체류시간 분포를 추정할 수 있다.
상기 일 실시 예에 따르면 각각의 정규분포 함수는 기사 N에 대한 체류시간
Figure pat00001
, 뉴스 구독자 A의 사건 개수
Figure pat00002
, 뉴스 구독자 A의 체류시간 표준편차
Figure pat00003
일 때 평균 및 표준 편차는 아래와 같다.
본 발명의 일 실시 예에 따르면 상술한 변수에 근거하여 아래의 수학식 1을 이용함으로써 뉴스 구독자의 체류시간 분포(pdf)를 추정할 수 있다.
[수학식 1]
Figure pat00004
본 발명의 일 실시 예에 따르면 체류시간 분포에 대한 체류시간 평균은 기록된 뉴스 구독자의 체류시간 평균과 같다고 가정될 수 있으며, 체류시간 분포(pdf)에 대한 체류시간 분산은 아래 수학식 2와 같다
[수학식 2]
Figure pat00005
본 발명의 일 실시 예에 따르면 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 갈 수 있다.
즉, 뉴스 구독자가 읽은 뉴스 기사 수가 늘어날수록 체류시간 분포(pdf)는 실제 결과에 대한 정확도를 상승시킬 수 있다.
맞춤형 점수 계산부(400)는 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산할 수 있다.
여기서 맞춤형 점수는 일정한 만점 단위를 가지는 점수가 아니고, 상대적인 크기를 통해 선호도 여부를 판정할 수 있는 수치를 의미할 수 있으나, 이에 한정되지 않고 상대적인 크기를 나타낼 수 있는 수치라면 제한 없이 사용될 수 있다.
본 발명의 일 실시 예에 따르면 아래 수학식 3을 이용하여 누적 분포 함수(cdf)를 계산할 수 있다.
[수학식 3]
Figure pat00006
본 발명의 일 실시 예에 따르면 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.
본 발명의 일 실시 예에 따르면 이상적인 점수의 분포를 가정한 후 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있으며, 일 실시 예에 따르면 아래 수학식 4와 같은 사분위 변환을 수행하여 맞춤형 점수를 계산할 수 있다.
[수학식 4]
Figure pat00007
개인 선호도 판단부(500)는 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단할 수 있다.
본 발명의 일 실시 예에 따르면 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프는 X축을 체류 시간 Y축을 맞춤형 점수로 하여 각 기사별 맞춤형 점수를 한눈에 볼 수 있게 그려질 수 있으며, 이를 통해 각 뉴스 별 개인의 선호도를 판단할 수 있다.
본 발명의 일 실시 예에 따르면 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.
본 발명의 일 실시 예에 따르면 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공할 수 있다.
본 발명의 일 실시 예에 따르면 미리 설정한 일정한 수치 이상의 맞춤형 점수에 해당하는 기사를 개인별 선호 기사로 선정하여 이와 유사한 기사를 뉴스 구독자에게 제공할 수 있다.
도 2는 본 발명의 실시 예에 따른 뉴스 선호도 판단 장치에서의 데이터 흐름을 나타내는 도면이다.
도 2를 참조하면 뉴스 선호도 판단 장치에서의 데이터 흐름이 나타나 있으며, 크게 2 단계의 산술적 연산을 거쳐 정규 분포 함수에 대응된 체류시간 정보를 이용하여 누적 분포 함수(cdf)를 산출할 수 있다.
본 발명의 일 실시 예에 따르면 제1 단계의 산술적 연산으로 체류 시간 분포를 추정하기 위하여 파첸의 창(Parzen Windows, 수학식 1)이 사용될 수 있다.
여기서 파첸의 창은 커널밀도추정(Kernel Density Estimation)이라고 표현되기도 하며, 특정 함수에 합성곱하기 위한 마스크 역할을 수행하며, 가우시안(gaussian) 또는 유니폼(uniform) 필터의 종류마다 마스크 값이 다를 수 있다.
본 발명의 일 실시 예에 따르면 제2 단계의 산술적 연산으로 누적분포 함수(cdf)를 산출 하기 위하여 수학식 3과 같은 사용될 수 있다.
이렇게 산출된 누적분포 함수(cdf)를 이용하여 맞춤형 점수를 산출할 수 있다.
도 3은 본 발명의 실시 예에 따라 히스토그램을 스무딩하여 산출된 각 기사별 체류시간 분포 추정 그래프를 나타낸 도면이다.
본 발명의 일 실시 예에 따르면 본 발명의 일 실시 예에 따르면 파첸의 창(Parzen Windows, 수학식 1)을 이용해 추정된 체류 시간 분포는 도 3과 같이 표현될 수 있다.
도 4는 본 발명의 실시 예에 따라 추정된 체류시간 분포를 누적하여 생성한누적 분포 함수 그래프를 나타낸 도면이다.
본 발명의 일 실시 예에 따르면 수학식 3을 이용하여 제2 단계의 산술적 연산을 수행해 누적분포 함수(cdf)를 산출하고, 이를 통해 맞춤형 점수를 산출하여 도 4의 그래프와 같이 나타낼 수 있다.
도 4의 (1)~(5)의 선은 각 뉴스 기사 1~5에 대한 맞춤형 점수를 나타낼 수 있고, 이중 맞춤형 점수가 미리 설정된 일정 값보다 큰 뉴스 기사를 구독자가 선호하는 기사로 판단할 수 있다.
도 5는 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법의 흐름도이다.
뉴스 기사에 대한 체류 시간 정보를 수집한다(510).
본 발명의 일 실시 에 따르면 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집할 수 있다.
본 발명의 일 실시 예에 따르면 한 명의 뉴스 구독자가 뉴스 기사를 읽기 위해 해당 웹페이지에 체류한 체류 시간을 측정하여 체류 시간 정보로 정의할 수 있다.
상기 실시 예에 따르면 뉴스 구독자가 구독한 복수의 뉴스 기사에 포함된 각 뉴스 기사 별로 체류 시간을 측정할 수 있으며, 이렇게 측정된 체류 시간을 기준으로 체류 시간 정보를 생성할 수 있다.
이때 생성된 체류 시간 정보에 포함된 시간 정보는 절대적인 시간에 대한 것으로 뉴스 구독자별 구독 속도 및 구독 습관에 대하여 전혀 고려가 되어 있지 않아 이를 기반으로 선호도를 산정하는 경우 개인차로 인하여 정확도가 감소하는 문제점이 존재한다.
따라서 본 발명과 같이 측정된 체류 시간을 바탕으로 개인별 상대 시간을 산정할 필요성이 존재한다.
체류 시간 정보에 정규분포 함수를 대응한다(520).
본 발명의 일 실시 예에 따르면 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.
본 발명의 일 실시 예에 따르면 뉴스 구독자 A가 뉴스기사 1, 2, 3,…을 읽었다고 가정하면, 수 많은 뉴스 시가 중에서 특정한 기사를 읽었다는 희박한 확률의 사건이 일어난 것이므로 각각의 사건이 중요한 의미를 가질 수 있다.
본 발명이 일 실시 예에 따르면 뉴스 구독자 A에게 뉴스기사 1과 취향적으로 비슷한 다른 특정 뉴스기사를 보여준다면 뉴스기사 1을 읽었을 때와 비슷한 체류시간을 가질 것임을 가정하면, 비슷한 체류시간은 정규분포를 따를 것이라고 추정할 수 있으며, 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.
뉴스 구독자의 체류시간 분포를 추정한다(530).
본 발명의 일 실시 예에 따르면 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여, 뉴스 구독자의 체류시간 분포를 추정할 수 있다.
본 발명의 일 실시 예에 따르면 뉴스 구독자 A가 뉴스를 읽은 사건 하나(뉴스 기사, 체류시간)에 정규 분포 함수를 하나를 대응시키고, 대응된 정규분포함수들을 선형 결합해 뉴스 구독자 A의 체류시간 분포를 추정할 수 있다.
본 발명의 일 실시 예에 따르면 상술한 변수에 근거하여 수학식 1을 이용함으로써 뉴스 구독자의 체류시간 분포(pdf)를 추정할 수 있다.
본 발명의 일 실시 예에 따르면 체류시간 분포에 대한 체류시간 평균은 기록된 뉴스 구독자의 체류시간 평균과 같다고 가정될 수 있으며, 체류시간 분포(pdf)에 대한 체류시간 분산은 수학식 2와 같다.
본 발명의 일 실시 예에 따르면 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 갈 수 있다.
즉, 뉴스 구독자가 읽은 뉴스 기사 수가 늘어날수록 체류시간 분포(pdf)는 실제 결과에 대한 정확도를 상승시킬 수 있다.
맞춤형 점수를 계산한다(540).
본 발명의 일 실시 예에 따르면 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산할 수 있다.
여기서 맞춤형 점수는 일정한 만점 단위를 가지는 점수가 아니고, 상대적인 크기를 통해 선호도 여부를 판정할 수 있는 수치를 의미할 수 있으나, 이에 한정되지 않고 상대적인 크기를 나타낼 수 있는 수치라면 제한 없이 사용될 수 있다.
본 발명의 일 실시 예에 따르면 수학식 3을 이용하여 누적 분포 함수(cdf)를 계산할 수 있다.
본 발명의 일 실시 예에 따르면 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.
본 발명의 일 실시 예에 따르면 이상적인 점수의 분포를 가정한 후 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있으며, 일 실시 예에 따르면 아래 수학식 4와 같은 사분위 변환을 수행하여 맞춤형 점수를 계산할 수 있다.
해당 뉴스의 개인 선호도를 판단한다(550).
본 발명의 일 실시 예에 따르면 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단할 수 있다.
본 발명의 일 실시 예에 따르면 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프는 X축을 체류 시간 Y축을 맞춤형 점수로 하여 각 기사별 맞춤형 점수를 한눈에 볼 수 있게 그려질 수 있으며, 이를 통해 각 뉴스 별 개인의 선호도를 판단할 수 있다.
본 발명의 일 실시 예에 따르면 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.
본 발명의 일 실시 예에 따르면 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공할 수 있다.
본 발명의 일 실시 예에 따르면 미리 설정한 일정한 수치 이상의 맞춤형 점수에 해당하는 기사를 개인별 선호 기사로 선정하여 이와 유사한 기사를 뉴스 구독자에게 제공할 수 있다.
본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
100 : 체류 시간 정보 수집부 200 : 정규 분포 함수 매칭부
300 : 체류시간 분포 추정부 400 : 맞춤형 점수 계산부
500 : 개인 선호도 판단부 1000 : 뉴스 선호도 판단 장치

Claims (10)

  1. 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여,
    뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 체류 시간 정보 수집부;
    수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 정규 분포 함수 매칭부;
    상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 체류시간 분포 추정부;
    상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 맞춤형 점수 계산부; 및
    상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 개인 선호도 판단부를 포함하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
  2. 제 1 항에 있어서 상기 체류시간 분포 추정부는,
    상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 가는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
  3. 제 1 항에 있어서 상기 맞춤형 점수 계산부는,
    상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
  4. 제 1 항에 있어서 상기 개인 선호도 판단부는,
    상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
  5. 제 1 항에 있어서,
    상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
  6. 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여,
    뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 단계;
    수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 단계;
    상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 단계;
    상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 단계; 및
    상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 단계를 포함하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
  7. 제 6 항에 있어서 상기 체류시간 분포를 추정하는 단계는,
    상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 가는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
  8. 제 6 항에 있어서 상기 맞춤형 점수를 계산하는 단계는,
    상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
  9. 제 6 항에 있어서 상기 개인 선호도를 판단하는 단계는,
    상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
  10. 제 6 항에 있어서,
    상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
KR1020180152506A 2018-11-30 2018-11-30 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법 KR102126796B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180152506A KR102126796B1 (ko) 2018-11-30 2018-11-30 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180152506A KR102126796B1 (ko) 2018-11-30 2018-11-30 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20200066447A true KR20200066447A (ko) 2020-06-10
KR102126796B1 KR102126796B1 (ko) 2020-06-26

Family

ID=71087095

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180152506A KR102126796B1 (ko) 2018-11-30 2018-11-30 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR102126796B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102284769B1 (ko) * 2021-01-28 2021-07-30 정진희 3d 컨텐츠를 제공하는 서버 및 그 동작 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090051540A (ko) * 2007-11-19 2009-05-22 주식회사 코아로직 태그 클라우드를 이용한 콘텐츠 추천 장치 및 방법
JP2014158628A (ja) * 2013-02-20 2014-09-04 Univ Of Tokushima 画像処理装置、画像処理方法、制御プログラム、および記録媒体
KR20180049852A (ko) * 2016-11-03 2018-05-14 세종대학교산학협력단 뉴스 추천 서버 및 이를 이용한 뉴스 추천 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090051540A (ko) * 2007-11-19 2009-05-22 주식회사 코아로직 태그 클라우드를 이용한 콘텐츠 추천 장치 및 방법
JP2014158628A (ja) * 2013-02-20 2014-09-04 Univ Of Tokushima 画像処理装置、画像処理方法、制御プログラム、および記録媒体
KR20180049852A (ko) * 2016-11-03 2018-05-14 세종대학교산학협력단 뉴스 추천 서버 및 이를 이용한 뉴스 추천 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102284769B1 (ko) * 2021-01-28 2021-07-30 정진희 3d 컨텐츠를 제공하는 서버 및 그 동작 방법
KR102405385B1 (ko) * 2021-01-28 2022-06-07 정진희 3d 컨텐츠를 위한 여러 오브젝트를 생성하는 방법 및 시스템

Also Published As

Publication number Publication date
KR102126796B1 (ko) 2020-06-26

Similar Documents

Publication Publication Date Title
US11443015B2 (en) Generating prediction models in accordance with any specific data sets
KR101524971B1 (ko) 개인 성향 예측 방법 및 그 장치
KR101708444B1 (ko) 키워드 및 자산 가격 관련성 평가 방법 및 그 장치
WO2015192667A1 (zh) 推荐广告的方法及广告推荐服务器
US20080126538A1 (en) Event type estimation system, event type estimation method, and event type estimation program stored in recording media
CN109561052B (zh) 网站异常流量的检测方法及装置
CN106611023B (zh) 网站访问异常的检测方法及装置
CN107153656B (zh) 一种信息搜索方法和装置
CN107896153B (zh) 一种基于移动用户上网行为的流量套餐推荐方法及装置
CN106951527B (zh) 一种歌曲推荐方法及装置
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
CN105335518A (zh) 生成用户偏好信息的方法及装置
CN108460025A (zh) 刑事案件自动化量刑方法、装置及计算机可读存储介质
CN110598126B (zh) 基于行为习惯的跨社交网络用户身份识别方法
CN108171570B (zh) 一种数据筛选方法、装置及终端
CN107798457B (zh) 投资组合方案推荐方法、装置、计算机设备和存储介质
KR102126796B1 (ko) 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법
Mehta et al. Collaborative personalized web recommender system using entropy based similarity measure
WO2022111095A1 (zh) 一种产品推荐方法、装置、计算机存储介质及系统
CN112565422B (zh) 一种对电力物联网故障数据的识别方法、系统和存储介质
CN105893515B (zh) 一种信息处理方法及服务器
CN112686690A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
US20160307223A1 (en) Method for determining a user profile in relation to certain web content
KR101708440B1 (ko) 분산 환경에서 lda 및 능동 학습 기법을 융합한 적응형 아이템 추천 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
G170 Publication of correction