KR20200066447A

KR20200066447A - 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법

Info

Publication number: KR20200066447A
Application number: KR1020180152506A
Authority: KR
Inventors: 강명주; 곽지훈; 노형민; 김현욱; 서현
Original assignee: 서울대학교산학협력단
Priority date: 2018-11-30
Filing date: 2018-11-30
Publication date: 2020-06-10
Also published as: KR102126796B1

Abstract

본 발명은 딥러닝을 이용하여 뉴스 구독자가 읽은 뉴스에 대한 선호도를 판단하는 기술에 관한 것으로, 체류 시간 정보 수집부, 정규 분포 함수 매칭부, 체류시간 분포 추정부, 맞춤형 점수 계산부, 개인 선호도 판단부를 포함할 수 있으며, 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고, 이를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하여 뉴스 선호도를 제공함으로써 더욱 정확한 개인별 선호도를 제공할 수 있다는 효과가 존재한다.

Description

딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법{news preference determining apparatus based on staying time using deep running and method therefor}

본 발명은 딥러닝을 이용하여 뉴스 구독자가 읽은 뉴스에 대한 선호도를 판단하는 기술에 대한 것으로, 더 자세하게는 각 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고 수집된 체류 시간을 상대 점수로 환산하여 해당 뉴스의 개인 선호도를 판단하여 개인별 뉴스 선호도를 제공하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법을 제공하는 것을 목적으로 한다.

온라인 뉴스의 폭발적인 증가에 따라 사용자가 뉴스를 찾는 요구 역시 비례적으로 증가하고 있다.

특히, 온라인 상에 발생하는 뉴스에서 각 개인 사용자가 원하는 정보를 찾아 주거나 여과시켜 주는 정보 여과는 정보 과부하가 발생하는 현 시점에서 중요한 기술이다.

종래의 뉴스 추천 시스템은 사용자가 온라인 상에서 읽은 문서를 바탕으로 사용자 프로파일을 구축하고, 구축한 프로파일에서 문서 추천에 사용할 용어를 분석하며, 분석된 용어와 의 유사도가 높은 문서를 사용자에게 추천한다.

종래의 뉴스 추천 시스템은 뉴스 구독자가 뉴스 기사에 대한 체류 시간을 기반으로 뉴스 구독자별 뉴스 선호도를 산정하는 것에는 뉴스 구독자마다 뉴스를 읽은 속도가 달라 절대 시간을 기준으로 선호도를 산정하는 경우 선호도 판단에 오류가 발생하는 문제점이 존재 하였다.

본 발명은 뉴스 구독자가 뉴스 기사에 대한 체류 시간을 기반으로 뉴스 구독자별 뉴스 선호도를 산정하는 것에는 뉴스 구독자마다 뉴스를 읽은 속도가 달라 절대 시간을 기준으로 선호도를 산정하는 경우 선호도 판단에 오류가 발생하는 문제점을 해결하기 위하여 각 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고 수집된 체류 시간을 상대 점수로 환산하여 해당 뉴스의 개인 선호도를 판단하여 개인별 뉴스 선호도를 제공하는 것에 그 목적이 있다.

본 발명의 실시 예에 따르면 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치는 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여, 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 체류 시간 정보 수집부; 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 정규 분포 함수 매칭부; 상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 체류시간 분포 추정부; 상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 맞춤형 점수 계산부; 및 상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 개인 선호도 판단부를 포함할 수 있다.

본 발명의 일 실시 예에 따르면 상기 체류시간 분포 추정부는, 상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 갈 수 있다.

본 발명의 일 실시 예에 따르면 상기 맞춤형 점수 계산부는, 상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.

본 발명의 일 실시 예에 따르면 상기 개인 선호도 판단부는, 상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.

본 발명의 일 실시 예에 따르면 상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공할 수 있다.

본 발명의 실시 예에 따르면 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여, 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 단계; 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 단계; 상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 단계; 상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 단계; 및 상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면 상기 체류시간 분포를 추정하는 단계는, 상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 가는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 갈수 있다.

본 발명의 일 실시 예에 따르면 상기 맞춤형 점수를 계산하는 단계는, 상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.

본 발명의 일 실시 예에 따르면 상기 개인 선호도를 판단하는 단계는, 상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.

본 발명에 따르면 딥러닝을 이용하여 뉴스 구독자가 구독한 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하고, 이를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하여 뉴스 선호도를 제공함으로써 더욱 정확한 개인별 선호도를 제공할 수 있다는 효과가 존재한다.

도 1은 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치의 구성도이다.
도 2는 본 발명의 실시 예에 따른 뉴스 선호도 판단 장치에서의 데이터 흐름을 나타내는 도면이다.
도 3은 본 발명의 실시 예에 따라 히스토그램을 스무딩하여 산출된 각 기사별 체류시간 분포 추정 그래프를 나타낸 도면이다.
도 4는 본 발명의 실시 예에 따라 추정된 체류시간 분포를 누적하여 생성한누적 분포 함수 그래프를 나타낸 도면이다.
도 5는 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법의 흐름도이다.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.

그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

이하, 도면을 참조하여 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 및 그 방법에 대하여 설명한다.

도 1은 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치(1000)의 구성도이다.

도 1을 참조하면 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치 (1000)는 체류 시간 정보 수집부(100), 정규 분포 함수 매칭부(200), 체류시간 분포 추정부(300), 맞춤형 점수 계산부(400), 개인 선호도 판단부(500)를 포함할 수 있다.

본 발명의 일 실시 예에 따르면 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치(1000) 프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여 각 구성요소의 동작을 수행할 수 있다.

체류 시간 정보 수집부(100)는 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집할 수 있다.

본 발명의 일 실시 예에 따르면 한 명의 뉴스 구독자가 뉴스 기사를 읽기 위해 해당 웹페이지에 체류한 체류 시간을 측정하여 체류 시간 정보로 정의할 수 있다.

상기 실시 예에 따르면 뉴스 구독자가 구독한 복수의 뉴스 기사에 포함된 각 뉴스 기사 별로 체류 시간을 측정할 수 있으며, 이렇게 측정된 체류 시간을 기준으로 체류 시간 정보를 생성할 수 있다.

이때 생성된 체류 시간 정보에 포함된 시간 정보는 절대적인 시간에 대한 것으로 뉴스 구독자별 구독 속도 및 구독 습관에 대하여 전혀 고려가 되어 있지 않아 이를 기반으로 선호도를 산정하는 경우 개인차로 인하여 정확도가 감소하는 문제점이 존재한다.

따라서 본 발명과 같이 측정된 체류 시간을 바탕으로 개인별 상대 시간을 산정할 필요성이 존재한다.

정규 분포 함수 매칭부(200)는 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.

본 발명의 일 실시 예에 따르면 뉴스 구독자 A가 뉴스기사 1, 2, 3,…을 읽었다고 가정하면, 수 많은 뉴스 시가 중에서 특정한 기사를 읽었다는 희박한 확률의 사건이 일어난 것이므로 각각의 사건이 중요한 의미를 가질 수 있다.

본 발명이 일 실시 예에 따르면 뉴스 구독자 A에게 뉴스기사 1과 취향적으로 비슷한 다른 특정 뉴스기사를 보여준다면 뉴스기사 1을 읽었을 때와 비슷한 체류시간을 가질 것임을 가정하면, 비슷한 체류시간은 정규분포를 따를 것이라고 추정할 수 있으며, 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.

체류시간 분포 추정부(300)는 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여, 뉴스 구독자의 체류시간 분포를 추정할 수 있다.

본 발명의 일 실시 예에 따르면 뉴스 구독자 A가 뉴스를 읽은 사건 하나(뉴스 기사, 체류시간)에 정규 분포 함수를 하나를 대응시키고, 대응된 정규분포함수들을 선형 결합해 뉴스 구독자 A의 체류시간 분포를 추정할 수 있다.

상기 일 실시 예에 따르면 각각의 정규분포 함수는 기사 N에 대한 체류시간

, 뉴스 구독자 A의 사건 개수

, 뉴스 구독자 A의 체류시간 표준편차

일 때 평균 및 표준 편차는 아래와 같다.

본 발명의 일 실시 예에 따르면 상술한 변수에 근거하여 아래의 수학식 1을 이용함으로써 뉴스 구독자의 체류시간 분포(pdf)를 추정할 수 있다.

[수학식 1]

본 발명의 일 실시 예에 따르면 체류시간 분포에 대한 체류시간 평균은 기록된 뉴스 구독자의 체류시간 평균과 같다고 가정될 수 있으며, 체류시간 분포(pdf)에 대한 체류시간 분산은 아래 수학식 2와 같다

[수학식 2]

본 발명의 일 실시 예에 따르면 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 갈 수 있다.

즉, 뉴스 구독자가 읽은 뉴스 기사 수가 늘어날수록 체류시간 분포(pdf)는 실제 결과에 대한 정확도를 상승시킬 수 있다.

맞춤형 점수 계산부(400)는 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산할 수 있다.

여기서 맞춤형 점수는 일정한 만점 단위를 가지는 점수가 아니고, 상대적인 크기를 통해 선호도 여부를 판정할 수 있는 수치를 의미할 수 있으나, 이에 한정되지 않고 상대적인 크기를 나타낼 수 있는 수치라면 제한 없이 사용될 수 있다.

본 발명의 일 실시 예에 따르면 아래 수학식 3을 이용하여 누적 분포 함수(cdf)를 계산할 수 있다.

[수학식 3]

본 발명의 일 실시 예에 따르면 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있다.

본 발명의 일 실시 예에 따르면 이상적인 점수의 분포를 가정한 후 사분위(quantile) 변환하여 맞춤형 점수를 계산할 수 있으며, 일 실시 예에 따르면 아래 수학식 4와 같은 사분위 변환을 수행하여 맞춤형 점수를 계산할 수 있다.

[수학식 4]

개인 선호도 판단부(500)는 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단할 수 있다.

본 발명의 일 실시 예에 따르면 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프는 X축을 체류 시간 Y축을 맞춤형 점수로 하여 각 기사별 맞춤형 점수를 한눈에 볼 수 있게 그려질 수 있으며, 이를 통해 각 뉴스 별 개인의 선호도를 판단할 수 있다.

본 발명의 일 실시 예에 따르면 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단할 수 있다.

본 발명의 일 실시 예에 따르면 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공할 수 있다.

본 발명의 일 실시 예에 따르면 미리 설정한 일정한 수치 이상의 맞춤형 점수에 해당하는 기사를 개인별 선호 기사로 선정하여 이와 유사한 기사를 뉴스 구독자에게 제공할 수 있다.

도 2는 본 발명의 실시 예에 따른 뉴스 선호도 판단 장치에서의 데이터 흐름을 나타내는 도면이다.

도 2를 참조하면 뉴스 선호도 판단 장치에서의 데이터 흐름이 나타나 있으며, 크게 2 단계의 산술적 연산을 거쳐 정규 분포 함수에 대응된 체류시간 정보를 이용하여 누적 분포 함수(cdf)를 산출할 수 있다.

본 발명의 일 실시 예에 따르면 제1 단계의 산술적 연산으로 체류 시간 분포를 추정하기 위하여 파첸의 창(Parzen Windows, 수학식 1)이 사용될 수 있다.

여기서 파첸의 창은 커널밀도추정(Kernel Density Estimation)이라고 표현되기도 하며, 특정 함수에 합성곱하기 위한 마스크 역할을 수행하며, 가우시안(gaussian) 또는 유니폼(uniform) 필터의 종류마다 마스크 값이 다를 수 있다.

본 발명의 일 실시 예에 따르면 제2 단계의 산술적 연산으로 누적분포 함수(cdf)를 산출 하기 위하여 수학식 3과 같은 사용될 수 있다.

이렇게 산출된 누적분포 함수(cdf)를 이용하여 맞춤형 점수를 산출할 수 있다.

도 3은 본 발명의 실시 예에 따라 히스토그램을 스무딩하여 산출된 각 기사별 체류시간 분포 추정 그래프를 나타낸 도면이다.

본 발명의 일 실시 예에 따르면 본 발명의 일 실시 예에 따르면 파첸의 창(Parzen Windows, 수학식 1)을 이용해 추정된 체류 시간 분포는 도 3과 같이 표현될 수 있다.

도 4는 본 발명의 실시 예에 따라 추정된 체류시간 분포를 누적하여 생성한누적 분포 함수 그래프를 나타낸 도면이다.

본 발명의 일 실시 예에 따르면 수학식 3을 이용하여 제2 단계의 산술적 연산을 수행해 누적분포 함수(cdf)를 산출하고, 이를 통해 맞춤형 점수를 산출하여 도 4의 그래프와 같이 나타낼 수 있다.

도 4의 (1)~(5)의 선은 각 뉴스 기사 1~5에 대한 맞춤형 점수를 나타낼 수 있고, 이중 맞춤형 점수가 미리 설정된 일정 값보다 큰 뉴스 기사를 구독자가 선호하는 기사로 판단할 수 있다.

도 5는 본 발명의 실시 예에 따른 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법의 흐름도이다.

뉴스 기사에 대한 체류 시간 정보를 수집한다(510).

본 발명의 일 실시 에 따르면 뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집할 수 있다.

체류 시간 정보에 정규분포 함수를 대응한다(520).

본 발명의 일 실시 예에 따르면 수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응할 수 있다.

뉴스 구독자의 체류시간 분포를 추정한다(530).

본 발명의 일 실시 예에 따르면 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여, 뉴스 구독자의 체류시간 분포를 추정할 수 있다.

본 발명의 일 실시 예에 따르면 상술한 변수에 근거하여 수학식 1을 이용함으로써 뉴스 구독자의 체류시간 분포(pdf)를 추정할 수 있다.

본 발명의 일 실시 예에 따르면 체류시간 분포에 대한 체류시간 평균은 기록된 뉴스 구독자의 체류시간 평균과 같다고 가정될 수 있으며, 체류시간 분포(pdf)에 대한 체류시간 분산은 수학식 2와 같다.

맞춤형 점수를 계산한다(540).

본 발명의 일 실시 예에 따르면 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산할 수 있다.

본 발명의 일 실시 예에 따르면 수학식 3을 이용하여 누적 분포 함수(cdf)를 계산할 수 있다.

해당 뉴스의 개인 선호도를 판단한다(550).

본 발명의 일 실시 예에 따르면 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단할 수 있다.

본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

100 : 체류 시간 정보 수집부 200 : 정규 분포 함수 매칭부
300 : 체류시간 분포 추정부 400 : 맞춤형 점수 계산부
500 : 개인 선호도 판단부 1000 : 뉴스 선호도 판단 장치

Claims

프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여,
뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 체류 시간 정보 수집부;
수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 정규 분포 함수 매칭부;
상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 체류시간 분포 추정부;
상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 맞춤형 점수 계산부; 및
상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 개인 선호도 판단부를 포함하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
제 1 항에 있어서 상기 체류시간 분포 추정부는,
상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 가는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
제 1 항에 있어서 상기 맞춤형 점수 계산부는,
상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
제 1 항에 있어서 상기 개인 선호도 판단부는,
상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
제 1 항에 있어서,
상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 장치.
프로세서에 의하여 동작하는 신경망으로 이루어진 딥러닝 모델을 이용하여,
뉴스 구독자가 구독한 복수의 웹 페이지 상의 뉴스 기사에 대한 체류 시간 정보를 수집하는 단계;
수집된 뉴스 기사 별 체류 시간 정보 각각에 정규분포 함수를 대응시키는 단계;
상기 대응된 복수의 체류 시간 정보에 대한 정규분포 함수를 선형적으로 결합하여 상기 뉴스 구독자의 체류시간 분포를 추정하는 단계;
상기 추정된 체류시간 분포를 누적하여 누적 분포 함수를 계산하고, 상기 계산된 누적 분포 함수를 이용하여 체류 시간을 각 구독자별 상대 점수로 환산한 맞춤형 점수를 계산하는 단계; 및
상기 계산된 맞춤형 점수를 기반으로 각 뉴스 구독자별 복수의 뉴스 기사에 대한 선호도 그래프를 생성하여 해당 뉴스의 개인 선호도를 판단하는 단계를 포함하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
제 6 항에 있어서 상기 체류시간 분포를 추정하는 단계는,
상기 뉴스 구독자가 구독한 뉴스 기사의 수가 늘어날수록 추정된 체류시간 분포는 실제 결과에 부합되는 분포를 따라 가는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
제 6 항에 있어서 상기 맞춤형 점수를 계산하는 단계는,
상기 계산된 누적 분포 함수를 사분위(quantile) 변환하여 맞춤형 점수를 계산하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
제 6 항에 있어서 상기 개인 선호도를 판단하는 단계는,
상기 계산된 맞춤형 점수가 높을수록 각 뉴스 구독자가 선호하는 뉴스 기사로 판단하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.
제 6 항에 있어서,
상기 판단된 개인 선호도를 이용하여 높은 개인 선호도를 보인 뉴스 기사와 유사한 뉴스를 상기 뉴스 구독자에게 제공하는 것을 특징으로 하는 딥러닝을 이용한 체류시간을 기반의 뉴스 선호도 판단 방법.