KR20210066754A

KR20210066754A - 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법

Info

Publication number: KR20210066754A
Application number: KR1020200164303A
Authority: KR
Inventors: 홍충선; 김유준
Original assignee: 경희대학교 산학협력단
Priority date: 2019-11-28
Filing date: 2020-11-30
Publication date: 2021-06-07
Also published as: KR102592402B1

Abstract

본 발명의 일 실시예에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법은 사용자 단말이 서버로부터 압축된 CNN 모델 및 VAE 모델을 수신하는 단계, 상기 사용자 단말이 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 상기 압축된 CNN을 통해 예측하는 단계, 상기 사용자 단말이 상기 VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지에 제공하는 단계, 상기 에지가 상기 사용자 단말 VAE 손실 값을 이용하여 상기 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 상기 서버에 제공하는 단계 및 상기 서버가 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하는 단계를 포함한다.

Description

연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법{METHOD OF GENERATING DEEP LEARNING MODEL FOR USER CHARACTERISTIC ANALYSIS USING FEDERATED LEARNING}

본 발명은 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법 관한 것으로서, 보다 구체적으로는 중앙 서버에서 하나의 딥 러닝 모델을 분석하는 것이 아닌, 사용자 개인 단말에서 딥 러닝 모델을 생성하는 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법에 관한 것이다.

사용자의 선호도 유사성을 분석하여 사용자의 선호도를 예측 및 추천하는 방법은 최근 AI의 발전으로 인해 많은 발전이 진행되고 있다. 사용자의 선호도 및 특성을 예측하기 위해서는 방대한 양의 사용자 데이터가 필요하다. 또한 데이터를 통해 학습된 딥 러닝 모델도 필요하다.

종래 딥 러닝 모델을 학습하려면, 중앙 서버에서 사용자 데이터를 집계하여 분석하는 방법을 활용하였다. 나아가 이러한 데이터가 집계되려면, 사용자가 자발적으로 자신의 데이터를 제공해야 하는 문제가 있었다.

따라서 이러한 데이터 집계 방법은 생산적인 측면에서 비효율적이며, 개인의 프라이버시가 유출될 수 있는 문제도 해결해야 할 과제였다. 나아가, 방대한 양의 사용자 데이터를 하나의 딥 러닝 모델로 분석한다면 정확성 및 속도 측면에서도 비효율적이었다.

이에, 사용자 개인이 자신의 정보를 자발적으로 제공하지 않아도, 자동으로 자신의 정보가 집계될 수 있다면, 개인의 프라이버시 문제 및 데이터 생산 한계 문제를 해결할 수 있다.

또한, 중앙 서버에서 딥 러닝 모델을 분석할 시 상이한 목적에 따라 방법을 달리하여 모델을 통합할 수 있다면 보다 정확하고 빠른 분석이 가능하다.

본 발명은 중앙 서버에서 하나의 딥 러닝 모델을 분석하는 것이 아닌, 사용자 개인 단말에서 딥 러닝 모델을 생성하는 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법을 제공하는 것을 목적으로 한다.

또한, 본 발명은 하나의 딥 러닝 모델을 생성하는 것이 아니라, 복수의 딥 러닝 모델을 통합하여 사용자 특성을 분석하여 사용자의 특성을 정확하게 분석할 수 있는 정교한 딥 러닝 모델을 생성할 수 있도록 하는 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법을 제공하는 것을 목적으로 한다.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

이러한 목적을 달성하기 위한 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법은 사용자 단말이 서버로부터 압축된 CNN 모델 및 VAE 모델을 수신하는 단계, 상기 사용자 단말이 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 상기 압축된 CNN을 통해 예측하는 단계, 상기 사용자 단말이 상기 VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지에 제공하는 단계, 상기 에지가 상기 사용자 단말 VAE 손실 값을 이용하여 상기 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 상기 서버에 제공하는 단계 및 상기 서버가 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하는 단계를 포함한다.

또한 이러한 목적을 달성하기 위한 사용자 단말, 서버 및 에지를 포함하는 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템은 상기 서버로부터 압축된 CNN 모델 및 VAE 모델을 수신하고, 상기 사용자 단말이 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 상기 압축된 CNN을 통해 예측하고, 상기 VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지에 제공하는 사용자 단말, 상기 사용자 단말 VAE 손실 값을 이용하여 상기 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 상기 서버에 제공하는 에지 및 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하는 서버를 포함한다.

전술한 바와 같은 본 발명에 의하면, 중앙 서버에서 하나의 딥 러닝 모델을 분석하는 것이 아닌, 사용자 개인 단말에서 딥 러닝 모델을 생성할 수 있다는 장점이 있다.

또한 본 발명에 의하면, 하나의 딥 러닝 모델을 생성하는 것이 아니라, 복수의 딥 러닝 모델을 통합하여 사용자 특성을 분석하여 사용자의 특성을 정확하게 분석할 수 있는 정교한 딥 러닝 모델을 생성할 수 있다는 장점이 있다.

도 1은 본 발명의 일 실시예에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 시스템을 설명하기 위한 네트워크 구성도이다.
도 2는 본 발명의 일 실시예에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템의 내부 구조를 설명하기 위한 블록도이다.
도 3은 본 발명에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법의 일 실시예를 설명하기 위한 흐름도이다.

전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다. 도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용된다.

본 명세서에서 사용된 용어 중 “VAE(Variational Autoencoder)”는 변분 추론의 접근법과 심층 학습법을 결합한 잠재 변수 생성 모델이다.

본 명세서에서 사용된 용어 중 “CNN(Convolutional Neural Network)”는 합성곱 신경망을 의미한다.

도 1은 본 발명의 일 실시예에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템을 설명하기 위한 네트워크 구성도이다.

도 1을 참조하면, 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템은 서버(100), 에지(200) 및 사용자 단말(300)을 포함한다.

먼저, 서버(100)는 감정 인식을 위한 CNN 모델을 학습시키고, CNN 모델이 컴퓨팅 능력이 낮은 사용자 단말에서 잘 구동될 수 있도록 네트워크 플루닝(Network pruning), 강화학습 기반 자동 모델압축(AutoML for Model Compression)등의 방법을 통하여 모델을 압축한 후 압축된 CNN 모델을 저장한다.

상기의 압축된 CNN 모델은 사용자 단말(300)에 제공됨으로써 사용자 단말(300)의 내부에서 압축된 CNN 모델을 이용하여 영상 데이터에 대한 사용자의 행동에 따른 선호도를 예측할 수 있도록 한다.

또한, 서버(100)는 영상 데이터의 선호도 예측을 위한 변분 오토인코더를 생성한 후, VAE 통합 모델 저장소(135)에 저장한다. 이때, VAE(Variational Autoencoder)는 변분 추론의 접근법과 심층 학습법을 결합한 잠재 변수 생성 모델이다.

에지(200)는 사용자 단말(300)로부터 수신된 사용자 단말 VAE 손실 값을 이용하여 상기 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 상기 서버(100)에 제공함으로써 서버(100)가 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하도록 한다.

사용자 단말(300)은 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 서버(100)로부터 수신된 압축된 CNN을 통해 예측하고, VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지(200)에 제공함으로써 VAE 모델이 업데이트되도록 한다.

이하에서는, 도 2를 참조하여 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템의 각 구성요소에 대해서 보다 구체적으로 설명하기로 한다.

도 2는 본 발명의 일 실시예에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템의 내부 구조를 설명하기 위한 블록도이다.

도 2는 참조하면, 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 시스템은 서버(100), 에지(200) 및 사용자 단말(300)을 포함한다.

서버(100)는 CNN 모델을 생성한 후 압축하여 생성된 압축된 CNN 모델 및 VAE 모델을 사용자 단말(300)에 제공한 후, 에지(200)를 통해 사용자 단말(300)로부터 수신된 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하여 관리한다.

이러한 서버(100)는 CNN 모델 학습 모듈(105), CNN 모델 압축 모듈(110), VAE 모델 생성 모듈(115), VAE 모델 통합 모듈(120), 영상 데이터 저장소(125), CNN 모델 저장소(130), VAE 통합 모델 저장소(135), 에지의 VAE 모델 저장소(140), CNN 모델 전송 모듈(145), 에지 선택 모듈(150), VAE 모델 전송 모듈(155) 및 에지의 VAE 모델 수신 모듈(160)을 포함한다.

CNN 모델 학습 모듈(105)은 감정 인식을 위한 CNN 모델을 학습시킨 후 CNN 모델을 CNN 모델 저장소(130)에 저장한다.

CNN 모델 압축 모듈(110)은 CNN 모델이 컴퓨팅 능력이 낮은 사용자 단말에서 잘 구동될 수 있도록 네트워크 플루닝(Network pruning), 강화학습 기반 자동 모델압축(AutoML for Model Compression)등의 방법을 통하여 모델을 압축한 후 압축된 CNN 모델을 CNN 모델 저장소(130)에 저장한다.

이러한 압축된 CNN 모델은 사용자 단말(300)에 제공됨으로써 사용자 단말(300)의 내부에서 압축된 CNN 모델을 이용하여 영상 데이터에 대한 사용자의 행동에 따른 선호도를 예측할 수 있도록 한다.

VAE 모델 생성 모듈(115)은 영상 데이터 선호도 예측을 위한 변분 오토인코더를 생성한 후, VAE 통합 모델 저장소(135)에 저장한다.

이때, VAE(Variational Autoencoder)는 변분 추론의 접근법과 심층 학습법을 결합한 잠재 변수 생성 모델이다.

여기서, 관측된 변수 x에 대한 잠재 변수 생성 모델

(디코더라고도 함)은 매개 변수

를 갖는 심층 신경 네트워크에 의해 매개 변수화된다. 추론 모델

(인코더라고도 함)은 매개 변수

를 갖는 두 번째 심층 신경망에 의해 매개 변수화된다.

잠재 변수 z는 데이터 x의 압축 정보를 임베딩하도록 정의되며, 인코더는 데이터 공간을 대응하는 잠재 공간에 맵핑한다.

디코더는 잠재적 공간의 샘플 지점으로부터 데이터를 재구성한다. 매개 변수

및

는 [수학식 1]과 같이 로그 한계 우도의 변분 하한

을 최대화함으로써 통합 훈련된다.

[수학식 1]

본 발명의 VAE 프레임 워크에서, 인코더와 디코더는 대각선 가우시안 분포를 사용하여 파라미터화된다. 사전 확률은 자유 매개 변수가 없는 등방성 가우스 분포 p(z) =

로 가정한다.

표본 추출 후 차별화 가능한 네트워크를 산출하기 위해, 확률 변수 z ~ q

(z|x)가 결정 변수

로 재매개화(reparametrization) 되는 재매개화 트릭(reparametrization trick)을 사용한다.

[수학식 2]

[수학식 2]에서,

가 1이 아닌 경우는 더 이상 로그 한계 우도의 하한을 최적화하지 않겠다는 것을 의미하고,

이 1보다 작은 경우(

<1)는 이전의 제약 조건

의 영향력도 약화시키고 있다는 것을 의미한다. 이것은 모델이 조상 샘플리에 의해 새로운 사용자 이력을 생성하지 못함을 의미한다.

그러나, 본 발명의 목적은 좋은 권고안을 만드는 것이지, 가능성을 극대화하거나 상상된 사용자 기록을 생성하는 것이 아니다. 따라서,

를 자유 정규화 매개 변수로 취급함으로써 성능에서 상당한 개선을 산출한다.

이하에서는, 자유 정규화 매개 변수(

)의 설정을 위한 간단한 휴리스틱을 설명한다. 먼저, 자유 정규화 매개 변수(

)=0으로 설정하여 훈련을 시작하고 점차적으로 자유 정규화 매개 변수(

)를 1로 증가시킨다.

본 발명에서는 매개 변수(

및

)를 업데이트하는 과정에서 그 성능이 최고에 도달했을 때의 최적의 자유 정규화 매개 변수(

)를 기록한다.

한편, 본 발명에서는 비선형 생성 모델에 따라 대략적인 베이지안 추론을 사용한 베이지안 최대 한계우도 추정치를 적용하였다. 일반적으로, 오토인코더는 하기의 [수학식 3]와 같다.

[수학식 3]

이하에서는, 오토인코더가

(즉, VAE처럼 어떤 사전 분포에 대해서도

을 정규화하지 않음)를 이용하여 VAE 오브젝트([수학식 1] 및 [수학식 2])의 첫 번째 텀을 효과적으로 최적화하는 과정에 대해서 설명하기로 한다.

에서

은

의 출력 시에만 질량이 있는 분포를 의미한다.

이러한 VAE와 대조적으로, VAE의 학습은 가변 분포를 사용하여 수행된다. 예를 들어,

는 가우스 분포의 매개 변수(예를 들어, 평균 및 분산)를 출력한다. 이것은 VAE가 잠재 상태(

)에서 데이터 포인트 당 분산을 캡쳐할 수 있다는 것을 의미한다.

상기와 같은 과정을 통해 VAE 모델 생성 모듈(115)은 영상 데이터 선호도 예측을 위한 변분 오토인코더를 생성한 후, VAE 통합 모델 저장소(135)에 저장한다.

VAE 모델 통합 모듈(120)은 에지의 VAE 모델 저장소(140)로부터 수신된 VAE 모델을 통합한다. 이때, VAE 모델 통합 모듈(120)은 하기의 [수학식 4] 또는 [수학식 5]을 참조로 에지(200)의 에지의 VAE 모델 저장소(140)로부터 수신된 VAE 모델을 통합한다.

[수학식 4]

:n번째 사용자 단말이 학습시킨 모델을 통합한 모델,

n: 사용자 단말,

w: 가중치,

P: 연합 학습 에폭스,

a: 전체 로컬 디바이스들이 가지고 있는 데이터의 총 개수,

: n번째 사용자 단말이 학습시킨 모델

[수학식 4]에서 사용자 단말에서 현재 에폭스에 참여하였으면 연합 학습 에폭스(P)가 1이되고, 사용자 단말에서 현재 에폭스에 참여하지 않았으면 연합 학습 에폭스(P)가 0이 된다. [수학식 4]은 현재 학습에 참여한 에지의 모델만을 통합하는 식으로써 학습속도가 굉장히 빠르지만 학습이 진행될수록 과적합(overfitting)에 빠질 위험이 크다.

[수학식 5]

: n번째 사용자 단말이 학습시킨 모델을 통합한 모델,

P: 연합 학습에 한번이라도 참여한 적이 있는 사용자 단말이 학습시킨 모델을 통합하기 위한 변수,

n: 사용자 단말,

w: 가중치,

a: 전체 로컬 디바이스들이 가지고 있는 데이터의 총 개수,

: n번째 사용자 단말이 학습시킨 모델

[수학식 5]에서 사용자 단말에서 현재 에폭스에 참여하였으면 연합 학습 에폭스(P)가 1이되고, 사용자 단말에서 현재 에폭스에 참여하지 않았으면 연합 학습 에폭스(P)가 0이 된다.

[수학식 5]는 과거에 학습에 참여를 한 이력이 있는 에지의 모델과 현재 학습에 참여한 에지지의 모델들을 통합하는 방법으로써 [수학식 4]보다는 느리게 학습하지만 기존 연합 학습 방법보다 빠른 학습이 가능하며 과적합(overfitting)위험이 없다.

영상 데이터 저장소(125)에는 레이블링이 완료된 영상 데이터가 저장된다.

CNN 모델 저장소(130)에는 CNN 모델 학습 모듈(105)에 의해 학습된 CNN 모델 및 CNN 모델 압축 모듈(110)에 의해 압축된 CNN 모델이 저장된다.

VAE 통합 모델 저장소(135)에는 VAE 모델 통합 모듈(120)에 의해 통합된 VAE 모델이 수신되어 저장된다.

에지의 VAE 모델 저장소(140)에는 에지에서 학습된 VAE 모델이 저장된다.

CNN 모델 전송 모듈(145)은 CNN 모델 저장소(130)에 저장된 CNN 모델을 전송한다.

에지 선택 모듈(150)은 VAE 모델 전송 모듈(155)로부터 수신된 VAE 통합 모델 중 학습 관리자 및 통신 관리자의 결정에 따라 학습에 참여하게 되는 에지를 선택한 후 선택된 에지를 에지의 VAE 모델 수신 모듈(160)을 통해 에지(200)의 VAE 모델 저장소(130)에 저장되도록 한다.

VAE 모델 전송 모듈(155)은 VAE 통합 모델 저장소(135)에 저장된 VAE 모델을 에지 선택 모듈(150)에 제공한다.

에지의 VAE 모델 수신 모듈(160)은 에지의 VAE 모델 수신 모듈(160) 및 VAE 모델 전송 모듈(155)을 통해 에지의 VAE 모델 저장소(140)에 저장된 VAE 모듈을 수신하여 에지의 VAE 모델 저장소(140)에 저장되도록 한다.

에지(200)는 사용자 단말(300)로부터 수신된 사용자 단말 VAE 손실 값을 이용하여 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 서버(100)에 제공한다.

이러한 에지(200)는 CNN 모델 저장소(205), CNN 모델 수신 모듈(210), CNN 모델 전송 모듈(215), VAE 모델 수신 모듈(225), VAE 모델 학습 모듈(230), VAE 모델 저장소(235), 단말의 VAE 손실 저장소(240), 사용자 단말 선택 모듈(245) 및 사용자 단말의 VAE 손실 수신 모듈(250)을 포함한다.

CNN 모델 저장소(205)에는 CNN 모델 수신 모듈(210) 및 서버(100)의 CNN 모델 전송 모듈(145)를 통해 수신된 CNN 모델이 저장된다.

CNN 모델 수신 모듈(210)은 서버(100)의 CNN 모델 전송 모듈(145)로부터 CNN 모델을 수신하여 CNN 모델을 CNN 모델 저장소(205)에 저장한다.

CNN 모델 전송 모듈(215)은 CNN 모델 저장소(205)에 저장된 CNN 모델을 독출한 후, 독출된 CNN 모델을 사용자 단말(300)의 CNN 모델 교체 모듈(320)에 제공한다.

VAE 모델 수신 모듈(225)은 VAE 모델 전송 모듈(155)을 통해서 VAE 통합 모델 저장부(135)에 저장된 VAE 모델을 수신한다.

VAE 모델 학습 모듈(230)은 사용자 단말(300)의 VAE 손실 수신 모듈(250)을 통해 사용자 단말(300)에서 수집된 사용자 단말 VAE 손실 값을 배치 크기에 맞게 평균 내어 모델을 학습한다.

VAE 모델 저장소(235)에는 VAE 모델 학습 모듈(230)에 의해 학습된 VAE 모델이 저장된다.

단말의 VAE 손실 저장소(240)에는 사용자 단말(300)에서 수집된 사용자 단말 VAE 손실 값이 저장된다.

사용자 단말 선택 모듈(245)은 학습 관리자 및 통신 관리자에 의해 결정된 학습에 참여하게 되는 사용자 단말을 결정한다.

사용자 단말의 VAE 손실 수신 모듈(250)은 사용자 단말(300)에서 사용자 단말 VAE 손실 값을 수신하여 단말의 VAE 손실 저장소(240)에 저장되도록 한다. 이러한 사용자 단말 VAE 손실 값은 VAN 모델을 학습하는데 사용된다.

사용자 단말(300)은 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 상기 압축된 CNN을 통해 예측한 후, 상기 VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지에 제공하는 단말이다. 이러한 사용자 단말(300)은 스마트폰, PDA, 테블릿 PC등으로 구현될 수 있다.

이러한 사용자 단말(300)은 컨텐츠 시청 판별 모듈(305), 영상 데이터 저장 모듈(310), CNN 선호도 예측 모듈(315), CNN 모델 교체 모듈(320), VAE 손실 계산 모듈(325), VAE 모델 교체 모듈(330), VAE 선호도 예측 모듈(335), CNN 저장소(340) 및 VAE 저장소(350)를 포함한다.

CNN 저장소(340)는 영상 데이터 저장소(341), CNN 예측 선호도 저장소(342) 및 CNN 모델 저장소(343)를 포함하고, VAE 저장소(350)는 VAE 모델 저장소(351) 및 VAE 예측 선호도 저장소(352)를 포함한다.

컨텐츠 시청 판별 모듈(305)은 사용자가 컨텐츠를 시청하고 있는지 여부를 판단하고, 상기 판단 결과에 따라 컨텐츠를 영상 데이터 저장 모듈(310)을 통해 영상 데이터 저장소(125)에 저장한다.

영상 데이터 저장 모듈(310)은 컨텐츠 시청 판별 모듈(305)로부터 사용자가 컨텐츠를 시청하는 영상 데이터를 수신하면 영상 데이터 저장소(125)에 영상 데이터를 저장한다. 그 후, 영상 데이터 저장 모듈(310)은 영상 데이터를 CNN 선호도 예측 모듈(315)에 제공한다.

CNN 선호도 예측 모듈(315)은 영상 데이터 저장 모듈(310)로부터 영상 데이터를 수신하고, 카메라 모듈로부터 사용자의 행동을 수신하며 영상 데이터에 대한 사용자의 행동에 따른 선호도를 CNN을 통해 예측한다.

예를 들어, CNN 선호도 예측 모듈(315)은 재미있는 컨텐츠를 보고 있는 사용자의 행동이“ 웃는다면 행동”인 경우 CNN을 통해 선호도를 1로 예측할 수 있고, “무표정 행동”인 경우 CNN을 통해 선호도를 0으로 예측할 수 있다.

이를 위해, CNN 선호도 예측 모듈(315)은 CNN 모델 저장소(343)로부터 영상 데이터에 대한 사용자의 행동에 따른 선호도를 예측하는데 사용되는 CNN 모델을 수신한다.

상기와 같이, CNN 선호도 예측 모듈(315)은 영상 데이터에 대한 사용자의 행동에 따른 선호도를 CNN을 통해 예측한 후, CNN을 통해 예측된 영상 데이터에 대한 사용자의 행동에 따른 선호도를 CNN 예측 선호도 저장소(342)에 저장한다.

CNN 모델 교체 모듈(320)은 서버(100)의 CNN 모델 전송 모듈(145)로부터 CNN 모델을 수신하면, CNN 모델 저장소(343)에 저장된 CNN 모델을 서버(100)의 CNN 모델 전송 모듈(145)로부터 수신된 CNN 모델로 교체하기 위해 CNN 모델 저장소(343)에 서버(100)의 CNN 모델 전송 모듈(145)로부터 수신된 CNN 모델을 저장한다.

VAE 손실 계산 모듈(325)은 사용자 단말(300) 내의 데이터에 따른 사용자 단말 VAE 손실 값을 계산한다. 이때, VAE 손실 계산 모듈(325)은 [수학식 5]을 기초로 사용자 단말(300) 내의 데이터에 따른 사용자 단말 VAE 손실 값을 계산할 수 있다.

[수학식 5]

L: 딥러닝 학습을 위한 사용자 단말 VAE 손실 값,

U: 사용자,

E: 평균,

p(x|z): 이후 확률,

q(z|x): 이전 확률,

B: 사용자 지정 변수로써

의 크기를 조절하여 학습이 잘 되도록 하는 변수,

p(z): z의 확률 분포,

Θ: 오토인코더의 인코더 부분의 가중치,

Φ: 오토인코더의 디코더 부분의 가중치

VAE 모델 교체 모듈(330)은 연합 학습 과정에서의 변분 오토인코더를 수신하면 변분 오토인코더를 기초로 모델을 교체한다.

VAE 선호도 예측 모듈(335)은 사용자 단말 내의 데이터를 인풋으로 하여 사용자 단말에서 소비하지 않은 컨텐츠에 대한 선호도를 예측한다.

도 3은 본 발명에 따른 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법의 일 실시예를 설명하기 위한 흐름도이다.

도 3을 참조하면, 사용자 단말(300)은 서버(100)로부터 압축된 CNN 모델 및 VAE 모델을 수신한다(단계 S310). 이때, 압축된 CNN 모델은 영상 데이터에 대한 사용자의 행동에 따른 선호도를 산출하는데 사용되며, VAE 모델은 사용자 단말 VAE 손실 값을 계산하는데 사용된다.

상기 사용자 단말이 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 상기 압축된 CNN을 통해 예측한다(단계 S320).

상기 사용자 단말이 상기 VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지에 제공한다(단계 S330). 이러한 사용자 단말 VAE 손실 값은 에지가 VAE 모델을 학습시키는데 사용되는 값이다.

상기 에지가 상기 사용자 단말 VAE 손실 값을 이용하여 상기 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 상기 서버에 제공한다(단계 S340).

상기 서버가 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합한다(단계 S350).

한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.

100: 서버,
105: CNN 모델 학습 모듈,
110: CNN 모델 압축 모듈,
115: VAE 모델 생성 모듈,
120: VAE 모델 통합 모듈,
125: 영상 데이터 저장소,
130: CNN 모델 저장소,
135: VAE 통합 모델 저장소,
140: 에지의 VAE 모델 저장소,
145: CNN 모델 전송 모듈,
150: 에지 선택 모듈,
155: VAE 모델 전송 모듈,
160: 에지의 VAE 모델 수신 모듈,
200: 에지,
205: CNN 모델 저장소,
210: CNN 모델 수신 모듈,
215: CNN 모델 전송 모듈,
225: VAE 모델 수신 모듈
230: VAE 모델 학습 모듈,
235: VAE 모델 저장소,
240: 단말의 VAE 손실 저장소,
245: 사용자 단말 선택 모듈,
250: 사용자 단말의 VAE 손실 수신 모듈,
300: 사용자 단말,
305: 컨텐츠 시청 판별 모듈,
310: 영상 데이터 저장 모듈
315: CNN 선호도 예측 모듈
320: CNN 모델 교체 모듈
325: VAE 손실 계산 모듈
330: VAE 모델 교체 모듈
335: VAE 선호도 예측 모듈
340: CNN 저장소
350: VAE 저장소

Claims

사용자 단말이 서버로부터 압축된 CNN 모델 및 VAE 모델을 수신하는 단계;
상기 사용자 단말이 영상 데이터를 사용자가 시청하고 있다고 판단되는 경우 카메라 모듈로부터 사용자의 행동을 수신하고, 상기 영상 데이터에 대한 사용자의 행동에 따른 선호도를 상기 압축된 CNN을 통해 예측하는 단계;
상기 사용자 단말이 상기 VAE 모델 및 상기 CNN 예측 선호도를 이용하여 사용자 단말 VAE 손실 값을 계산한 후, 상기 계산된 사용자 단말 VAE 손실 값을 에지에 제공하는 단계;
상기 에지가 상기 사용자 단말 VAE 손실 값을 이용하여 상기 VAE 모델을 학습시킨 후 상기 학습된 VAE 모델을 상기 서버에 제공하는 단계;
상기 서버가 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하는 단계를 포함하는 것을 특징으로 하는
연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법.
제1항에 있어서,
상기 서버가 감정 인식을 위한 CNN 모델을 학습시키고, 상기 CNN 모델이 컴퓨팅 능력이 낮은 사용자 단말에서 잘 구동될 수 있도록 네트워크 플루닝(Network pruning), 강화학습 기반 자동 모델압축(AutoML for Model Compression)등의 방법을 통하여 모델을 압축하여 상기 압축된 CNN 모델을 생성하는 단계를 더 포함하는 것을 특징으로 하는
연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법.
제1항에 있어서,
상기 서버가 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하는 단계는
상기 서버가 연합 학습에 한번이라도 참여한 적이 있는 사용자 단말 또는 현재 에폭스에서 사용자 단말 각각이 학습시킨 모델, 전체 로컬 디바이스들이 가지고 있는 데이터의 총 개수, 가중치 및 사용자 단말의 수를 이용하여 상기 학습된 VAE 모델 및 미리 생성된 VAE 모델을 통합하는 단계를 더 포함하는 것을 특징으로 하는
연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법.