KR20230030947A - 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말 - Google Patents

연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말 Download PDF

Info

Publication number
KR20230030947A
KR20230030947A KR1020210113236A KR20210113236A KR20230030947A KR 20230030947 A KR20230030947 A KR 20230030947A KR 1020210113236 A KR1020210113236 A KR 1020210113236A KR 20210113236 A KR20210113236 A KR 20210113236A KR 20230030947 A KR20230030947 A KR 20230030947A
Authority
KR
South Korea
Prior art keywords
neural network
network models
data
user terminal
user
Prior art date
Application number
KR1020210113236A
Other languages
English (en)
Inventor
박현빈
양승진
이준혁
최진
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020210113236A priority Critical patent/KR20230030947A/ko
Publication of KR20230030947A publication Critical patent/KR20230030947A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

일 실시예에 따른 사용자 단말은 사용자 데이터를 수집하는 하나 이상의 센서, 복수의 신경망 모델들을 포함하는 메모리, 사용자 데이터 중 유효한 데이터를 이용하여 트레이닝한 복수의 신경망 모델들의 정확도들에 기초하여 트레이닝된 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터를 전송하고, 사용자 단말들 각각으로부터 전송된 제1 파라미터들을 이용하여 서버에서 생성된 신경망 모델들의 제2 파라미터들에 기초하여 사용자 데이터를 처리하는 프로세서, 및 제1 파라미터를 서버로 전송하고, 서버로부터 제2 파라미터들을 수신하는 통신 인터페이스를 포함할 수 있다. 그 밖에 다양한 실시예들이 가능하다.

Description

연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말{OPERATION METHOD OF USER TERMINAL AND SERVER FOR FEDERATED LEARNING, AND USER TERMINAL THEREOF}
본 개시의 다양한 실시예들은 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말에 관한 것이다.
딥러닝(deep learning)은 심층 신경망 구조를 이용하여 트레이닝 데이터에서 유용하고 대표적인 특징들을 스스로 발견하고 학습해가는 기계 학습 기법을 의미한다. 딥러닝의 정확도를 높이는 효과적인 방법 중 하나는 다양한 종류의 다수의 데이터를 확보하는 것이다.
사용자 단말에서 더 나은 딥러닝 기반의 서비스를 제공하기 위해서는 다양한 환경에서의 다수의 사용자 데이터를 확보하는 것이 중요하지만, 사용자 관련 정보가 단말 밖으로 유출되는 것은 사용자 프라이버시 보호 및/또는 단말 보안 유지에 취약할 수 있다.
실시예들에 따르면, 사용자 단말에서의 사용자 데이터의 직접적인 유출없이 방대한 데이터를 트레이닝할 수 있다.
실시예들에 따르면, 사용자 단말에 포함되는 신경망 모델들의 정확도를 향상시킬 수 있다.
일 실시예에 따르면, 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)은 사용자 데이터를 수집하는 하나 이상의 센서(176, 310), 복수의 신경망 모델들을 포함하는 메모리(134, 320, 825), 상기 사용자 데이터 중 유효한 데이터를 이용하여 트레이닝한 상기 복수의 신경망 모델들의 정확도들에 기초하여 상기 트레이닝된 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터를 전송하고, 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들 각각으로부터 전송된 제1 파라미터들을 이용하여 서버(108, 210, 810)에서 생성된 상기 신경망 모델들의 제2 파라미터들에 기초하여 상기 사용자 데이터를 처리하는 프로세서(120, 330, 822, 930), 및 상기 제1 파라미터를 상기 서버(108, 210, 810)로 전송하고, 상기 서버(108, 210, 810)로부터 상기 제2 파라미터들을 수신하는 통신 인터페이스(190, 340)를 포함할 수 있다.
일 실시예에 따르면, 하나 이상의 센서(176, 310) 및 복수의 신경망 모델들을 포함하는 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)의 동작 방법은 상기 하나 이상의 센서(176, 310)로부터 수집한 사용자 데이터 중 유효한 데이터를 이용하여 상기 복수의 신경망 모델들을 트레이닝하는 동작, 상기 트레이닝된 복수의 신경망 모델들의 정확도들에 기초하여 상기 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택하는 동작, 상기 선택된 신경망 모델의 제1 파라미터를 서버(108, 210, 810)로 전송하는 동작, 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들 각각으로부터 전송된 제1 파라미터들에 기초하여 상기 서버(108, 210, 810)에서 생성된 상기 신경망 모델들의 제2 파라미터들을 수신하는 동작, 및 상기 제2 파라미터들에 의해 상기 복수의 신경망 모델들의 파라미터들을 갱신하여 상기 사용자 데이터를 처리하는 동작을 포함할 수 있다.
일 실시예에 따르면, 서버(108, 210, 810)의 동작 방법은 복수의 신경망 모델들을 포함하는 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들 각각으로부터, 상기 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터들을 수집하는 동작, 상기 제1 파라미터들을 상기 복수의 신경망 모델들 별로 분류하는 동작, 상기 신경망 모델들 별로 분류된 제1 파라미터들에 기초하여 상기 복수의 신경망 모델들의 제2 파라미터들을 생성하는 동작, 및 상기 제2 파라미터들을 상기 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들에게 전송하는 동작을 포함할 수 있다.
일 실시예에 따른 사용자 단말은 사용자 데이터 자체가 아니라 사용자 단말에서 트레이닝된 신경망 모델들의 파라미터들을 서버로 전송함으로써 직접적인 사용자 데이터의 유출을 방지할 수 있다.
일 실시예에 따른 서버는 다수의 사용자 단말들에서 수집된 파라미터들을 이용하여 연합 학습을 통해 신경망 모델들을 트레이닝함으로써 신경망 모델들의 정확도를 향상시킬 수 있다.
일 실시예에 따른 사용자 단말 및 서버는 연합 학습을 통해 다양한 특징들을 갖는 방대한 사용자 데이터에 대한 추론을 정확하게 수행할 수 있다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 일 실시예에 따른 연합 학습을 수행하기 위한 시스템 구성을 도시한 도면이다.
도 3은 일 실시예에 따른 사용자 단말의 블록도이다.
도 4는 일 실시예에 따른 사용자 단말의 동작 방법을 나타낸 흐름도이다.
도 5는 다른 실시예에 따른 사용자 단말의 동작 방법을 나타낸 흐름도이다.
도 6은 다른 실시예에 따른 사용자 단말의 동작 방법을 나타낸 흐름도이다.
도 7은 일 실시예에 따른 서버의 동작 방법을 나타낸 흐름도이다.
도 8은 일 실시예에 따른 서버 및 사용자 단말들 간의 동작을 설명하기 위한 도면이다.
도 9은 일 실시예에 따른 사용자 단말의 동작 방법을 설명하기 위한 도면이다.
이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 지문 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다.
일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 2는 일 실시예에 따른 연합 학습을 수행하기 위한 시스템 구성을 도시한 도면이다. 도 2를 참조하면, 일 실시예에 따른 서버(210)(예: 도 1의 서버(108)) 및 사용자 단말들(220,230,340,250)(예: 도 1의 전자 장치(101))이 도시된다. 이하, 설명의 편의를 위하여, 연합 학습에 이용되는 사용자 단말들(220,230,340,250)의 개수가 4개인 경우를 일 예로 들어 설명하지만, 사용자 단말들의 개수가 반드시 이에 한정되는 것은 아니다.
일 실시예에 따른 연합 학습(federated learning)은 서버(210)가 각 사용자 단말들(220,230,340,250)의 데이터를 취합하여 학습(예: 딥 러닝)을 수행하는 방식과 달리, 사용자 단말들(220,230,340,250) 각각이 사용자 단말들(220,230,340,250)에 포함된 복수의 신경망 모델들에 대한 학습을 수행하는 방식일 수 있다.
학습의 정확도를 향상시키기 위해서는 다양한 유형의 다수의 사용자 데이터를 확보하는 것이 중요할 수 있다. 사용자 데이터는 사용자 단말들(220,230,340,250) 각각에서 수집되어 서버(210)로 전송되고, 서버(210)는 사용자 단말들(220,230,340,250) 각각으로부터 수신한 사용자 데이터로 신경망 모델들을 트레이닝할 수 있다.
연합 학습은 사용자 데이터 자체가 아니라 사용자 단말에서 트레이닝된 신경망 모델들의 파라미터들을 서버로 전송함으로써 직접적인 사용자 데이터의 유출없이 방대한 데이터를 트레이닝할 수 있는 방식일 수 있다.
사용자 단말들(220,230,340,250) 각각은 복수의 신경망 모델들을 포함할 수 있으며, 연합 학습에 의해 복수의 신경망 모델들에 대한 온-디바이스 트레이닝(on-device training)을 수행할 수 있다. 사용자 단말들(220,230,340,250) 각각은 예를 들어, 사용자 데이터를 b개로 배치(batch)화하고, 신경망 모델들의 파라미터(예: 가중치)에서 신경망 모델의 가중치 변화량에 해당하는 그래디언트(gradient)에 학습율(learning rate)을 곱한 값을 빼서 파라미터를 업데이트함으로써 신경망 모델들을 트레이닝할 수 있다. 사용자 단말들(220,230,340,250) 각각은 트레이닝된 파라미터들 중 어느 하나의 파라미터를 서버(210)로 전송하고, 서버(210)는 모든 사용자 단말들(220,230,340,250)이 전송한 파라미터들을 수집할 수 있다. 이때, 사용자 단말들(220,230,340,250)이 서버(210)로 전송한 어느 하나의 파라미터는 사용자 단말들(220,230,340,250) 각각에서 트레이닝된 복수의 신경망 모델들의 정확도를 기초로 선택된 어느 하나의 신경망 모델의 파라미터에 해당할 수 있다. 예를 들어, 사용자 단말들(220,230,340,250)이 신경망 모델 1, 신경망 모델 2, 신경망 모델 3, 및 신경망 모델 4의 4개의 신경망 모델들을 포함한다고 하자. 이 경우, 사용자 단말(220)이 서버(210)로 전송하는 파라미터는 신경망 모델 1의 파라미터이고, 사용자 단말(230)이 서버(210)로 전송하는 파라미터는 신경망 모델 2의 파라미터이며, 사용자 단말(240)과 사용자 단말(250) 각각이 전송하는 파라미터는 신경망 모델 4의 파라미터일 수 있다.
이와 같이, 각 사용자 단말이 전송하는 파라미터는 서로 동일한 신경망 모델의 파라미터일 수도 있고, 서로 다른 신경망 모델의 파라미터일 수도 있다.
서버(210)는 예를 들어, 사용자 단말들(220,230,340,250) 각각으로부터 수집한 파라미터들에 nk/n을 곱한 결과를 모든 사용자 단말들(220,230,340,250)에 대해서 합산한 가중합(weighted sum)에 의해 신경망 모델들을 트레이닝할 수 있다. 여기서, nk는 k번째 단말에서 트레이닝에 사용된 데이터('트레이닝 데이터')의 개수에 해당하고, n은 전체 사용자 단말들(220,230,340,250)에서 트레이닝에 사용된 데이터의 개수에 해당할 수 있다. 서버(210)는 트레이닝된 신경망 모델들의 파라미터들은 모든 사용자 단말들(220,230,340,250)에게 전송할 수 있다. 이때, 서버(210)에서 모든 사용자 단말들(220,230,340,250)에게 전송하는 파라미터들은 동일할 수 있다.
일 실시예에서는 전술한 동작과 같이 연합 학습을 통해 직접적인 사용자 데이터의 유출을 차단할 수 있다.
도 3은 일 실시예에 따른 사용자 단말의 블록도이다. 도 3을 참조하면, 일 실시예에 따른 사용자 단말(300)(예: 도 1의 전자 장치(101), 도 2의 사용자 단말들(220, 230, 240, 250) 각각)은 센서(310), 메모리(320), 프로세서(330), 및 통신 인터페이스(340)를 포함할 수 있다. 사용자 단말(300)은 터치 IC(350)를 더 포함할 수 있다.
센서(310)(예: 도 1의 센서 모듈(176)), 메모리(320)(예: 도 1의 메모리(134)), 프로세서(330)(예: 도 1의 프로세서(120)), 통신 인터페이스(340)(예: 도 1의 통신 모듈(190)) 및 터치 IC(350)는 통신 버스(305)를 통해 서로 연결될 수 있다.
센서(310)는 사용자 데이터를 수집할 수 있다. 센서(310)의 개수는 하나 또는 그 이상일 수 있다. 센서(310)는 예를 들어, 터치 센서, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 및/또는 지문 센서 중 적어도 하나를 포함할 수 있으며, 반드시 이에 한정되는 것은 아니다. 사용자 데이터는 예를 들어, 센서(310)에 의해 감지된 터치 입력, 및/또는 터치 IC(350)를 통해 생성되는 터치 입력을 포함하는 사용자 데이터로부터 시간차를 가진 복수의 프레임들에 대응하는 터치 픽셀 데이터를 포함할 수 있으며, 반드시 이에 한정되지는 않는다.
메모리(320)는 복수의 신경망 모델들을 포함할 수 있다. 신경망 모델들은 예를 들어, 딥러닝(deep learning) 기반의 심층 신경망 일수도 있고, 리커런트(recurrent) 신경망 또는 컨볼루션(convolutional) 신경망일 수도 있으며, 반드시 이에 한정되지는 않는다.
프로세서(330)는 센서(310)로부터 수집한 사용자 데이터 중 유효한 데이터를 이용하여 트레이닝한 복수의 신경망 모델들의 정확도들에 기초하여 트레이닝된 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터를 서버(예: 도 1의 서버(108), 도 2의 서버(210))로 전송할 수 있다. 이하, '제1 파라미터'는 사용자 단말(300)이 서버(210)로 전송하는 파라미터를 의미하는 것으로 이해될 수 있다.
프로세서(330)는 사용자 데이터에 대한 유효성 검사 결과에 기초하여, 사용자 데이터 중 유효한 데이터를 결정할 수 있다. 예를 들어, 사용자 데이터가 터치 입력인 경우, 유효성 검사는 센서(310)에 터치된 터치 입력의 형태가 원형인지, 터치 입력의 크기가 미리 설정된 크기에 부합하는 지, 터치 입력이 지문의 형태를 선명하게 포함하는지, 터치 입력의 세기가 미리 설정된 세기보다 큰지 또는 작은 지와 같이 해당 터치 입력이 유효한 지문인지 여부를 판단할 수 있는 다양한 검사 항목들 중 적어도 일부 의해 수행될 수 있으며, 반드시 이에 한정되지는 않는다.
프로세서(330)는 사용자 데이터 중 유효성 검사를 통과한 유효한 데이터를 메모리(320)의 사용자 데이터 베이스(DB)에 저장할 수 있다. 여기서, 메모리(320)는 사용자 단말(300)의 주 저장 장치로서, 예를 들어, UFS(universal flash storage) 또는 NAND Flash 메모리일 수 있으며, 반드시 이에 한정되지는 않는다.
프로세서(330)는 사용자 데이터 베이스(DB)에 저장된 유효한 데이터 중 일부를 트레이닝 데이터로 분류하고, 유효한 데이터 중 트레이닝 데이터를 제외한 나머지를 테스트 데이터로 분류할 수 있다. 프로세서(330)는 예를 들어, 사용자 데이터 베이스(DB)에 저장된 유효한 데이터 중 80%를 트레이닝 데이터로 분류하고, 나머지 20%를 테스트 데이터로 분류할 수 있다. 또는 프로세서(330)는 유효한 데이터를 70%:30%의 비율로 트레이닝 데이터와 테스트 데이터로 분류할 수 있다. 분류 비율은 실시예에 따라 다양하게 변경될 수 있으며, 유효한 데이터 중 분류되는 트레이닝 데이터와 테스트 데이터는 랜덤(random)하게 결정될 수 있다. 트레이닝 데이터는 트레이닝 세트(training set)에 포함되고, 테스트 데이터는 테스트 세트(test set)에 포함될 수 있다.
프로세서(330)는 유효한 데이터 중 일부의 트레이닝 데이터를 이용하여 복수의 신경망 모델들 각각에 대한 트레이닝을 수행할 수 있다. 프로세서(330)는 예를 들어, 미리 설정된 제1 시나리오 상황이 발생함에 응답하여, 트레이닝 데이터를 이용하여 복수의 신경망 모델들 각각에 대한 트레이닝을 수행할 수 있다. 제1 시나리오 상황은 예를 들어, 사용자 단말(300)의 충전이 일정 퍼센트 이상 수행된 상황, 사용자 단말(300)의 충전이 완료된 상황, 또는 사용자 단말(300)이 유휴(idle) 상태에 있는 상황 중 적어도 일부를 포함할 수 있으며, 반드시 이에 한정되지는 않는다.
프로세서(330)는 유효한 데이터 중 트레이닝 데이터를 제외한 나머지의 테스트 데이터에 기초하여, 트레이닝된 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택할 수 있다. 프로세서(330)는 테스트 데이터에 의해 트레이닝된 복수의 신경망 모델들의 정확도들을 산출할 수 있다. 프로세서(330)는 정확도들에 기초하여 어느 하나의 신경망 모델을 선택할 수 있다. 프로세서(330)는 예를 들어, 트레이닝된 복수의 신경망 모델들의 정확도들 중 가장 높은 정확도를 갖는 어느 하나의 신경망 모델을 선택할 수 있다.
프로세서(330)는 트레이닝된 복수의 신경망 모델들의 정확도들 중 가장 높은 정확도를 갖는 신경망 모델들이 복수 개인 경우, 가장 높은 정확도를 갖는 복수 개의 신경망 모델들에서 테스트 데이터를 이용하여 추론한 결과에 대한 소프트맥스(softmax) 확률 값에 기초하여, 어느 하나의 신경망 모델을 선택할 수 있다.
예를 들어, 사용자 단말(300)에 포함된 신경망 모델들이 신경망 모델 A, 신경망 모델 B, 신경망 모델 C 및 신경망 모델 D 와 같이 4개이고, 테스트 데이터가 10개이며, 4개의 신경망 모델들 중 신경망 모델A 와 신경망 모델 B가 정답을 8개 맞춰 정확도가 80%로 동일할 수 있다. 이 경우, 프로세서(330)는 신경망 모델 A와 신경망 모델 B의 10개의 테스트 데이터에 대한 추론 결과를 소프트맥스 결과값에 대한 평균값을 구하고, 신경망 모델 A와 신경망 모델 B 중 평균값이 가장 큰 하나의 신경망 모델을 선택할 수 있다.
프로세서(330)는 예를 들어, 미리 설정된 제2 시나리오 상황에 발생함에 응답하여, 제1 파라미터를 통신 인터페이스(340)를 통해 서버(210)로 전송할 수 있다. 제2 시나리오 상황은 예를 들어, 와이파이가 연결된 상황, 사용자 단말(300)이 서버(210)로부터의 전송 요청을 수신한 상황 중 적어도 하나를 포함할 수 있으며, 반드시 이에 한정되지는 않는다.
프로세서(330)는 사용자 단말들(예: 도 2의 사용자 단말들(220,230,240,250)) 각각으로부터 전송된 제1 파라미터들을 이용하여 서버(210)에서 생성된 신경망 모델들의 제2 파라미터들에 기초하여 사용자 데이터를 처리할 수 있다. 프로세서(330)는 제2 파라미터들에 의해 복수의 신경망 모델들의 파라미터들을 업데이트하여 사용자 데이터를 처리할 수 있다. 이하, '제2 파라미터들'은 서버(210)에서의 트레이닝 이후에 서버(210)가 사용자 단말(300)을 포함하는 사용자 단말들(220,230,240,250)로 전송하는 파라미터들을 의미하는 것으로 이해될 수 있다.
통신 인터페이스(340)는 제1 파라미터를 서버(210)로 전송하고, 서버(210)로부터 제2 파라미터들을 수신할 수 있다.
터치 IC(350)는 예를 들어, 도 1의 디스플레이 모듈(160)에 포함되거나 연결될 수 있다. 터치 IC(350)는 디스플레이 모듈(160)에 포함된 터치 스크린을 통해 수신되는 터치 입력을 처리할 수 있다. 터치 IC(350)는 센서(310)에 의해 감지된 터치 입력을 포함하는 사용자 데이터로부터 시간차를 가진 복수의 프레임들에 대응하는 터치 픽셀 데이터를 생성할 수 있다.
도 4는 일 실시예에 따른 사용자 단말의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 4를 참조하면, 일 실시예에 따른 사용자 단말(예: 도 1의 전자 장치(101), 도 2의 사용자 단말들(220, 230, 240, 250) 각각, 도 3의 사용자 단말(300))이 동작(410) 내지 동작(450)을 통해 사용자 데이터를 처리하는 동작이 도시된다. 다양한 실시예들에 따르면, 동작(410) 내지 동작(450)은 단말(300)의 프로세서(예: 도 1의 프로세서(120), 도 3의 프로세서(430))에서 수행될 수 있다.
동작(410)에서, 사용자 단말(300)은 하나 이상의 센서(예: 도 1의 센서 모듈(176), 도 3의 센서(310))로부터 수집한 사용자 데이터 중 유효한 데이터를 이용하여 복수의 신경망 모델들을 트레이닝할 수 있다. 사용자 단말(300)은 유효한 데이터 중 결정된 트레이닝 데이터를 이용하여 복수의 신경망 모델들 각각을 트레이닝할 수 있다.
동작(420)에서, 사용자 단말(300)은 동작(410)을 통해 트레이닝된 복수의 신경망 모델들의 정확도들에 기초하여 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택할 수 있다. 사용자 단말(300)은 유효한 데이터 중 트레이닝 데이터를 제외한 나머지의 테스트 데이터에 기초하여, 트레이닝된 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택할 수 있다. 사용자 단말(300)은 테스트 데이터에 의해, 동작(410)을 통해 트레이닝한 복수의 신경망 모델들의 정확도들을 산출하고, 정확도들에 기초하여 어느 하나의 신경망 모델을 선택할 수 있다.
동작(420)에서, 사용자 단말(300)은 예를 들어, 정확도들 중 가장 높은 정확도를 갖는 어느 하나의 신경망 모델을 선택할 수 있다. 또는 사용자 단말(300)은 정확도들 중 가장 높은 정확도를 갖는 신경망 모델들이 복수 개인 경우, 가장 높은 정확도를 갖는 복수 개의 신경망 모델들에서 테스트 데이터를 이용하여 추론한 결과에 대한 소프트맥스 확률 값에 기초하여, 어느 하나의 신경망 모델을 선택할 수도 있으며, 반드시 이에 한정되지는 않는다.
동작(430)에서, 사용자 단말(300)은 동작(420)에서 선택된 신경망 모델의 제1 파라미터를 서버로 전송할 수 있다.
동작(440)에서, 사용자 단말(300)은, 사용자 단말들(220, 230, 240, 250) 각각으로부터 전송된 제1 파라미터들에 기초하여 서버(예: 도 1의 서버(108), 도 2의 서버(210))에서 생성된 신경망 모델들의 제2 파라미터들을 수신할 수 있다.
동작(450)에서, 사용자 단말(300)은 동작(440)에서 수신한 제2 파라미터들에 의해 복수의 신경망 모델들의 파라미터들을 갱신하여 사용자 데이터를 처리할 수 있다.
도 5는 다른 실시예에 따른 사용자 단말의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 5를 참조하면, 일 실시예에 따른 사용자 단말(예: 도 1의 전자 장치(101), 도 2의 사용자 단말들(220, 230, 240, 250) 각각, 도 3의 사용자 단말(300))이 동작(510) 내지 동작(570)을 통해 제2 파라미터를 서버(예: 도 1의 서버(108), 도 2의 서버(210))로 전송하는 동작이 도시된다. 다양한 실시예들에 따르면, 동작(510) 내지 동작(570)은 단말(300)의 프로세서(예: 도 1의 프로세서(120), 도 3의 프로세서(430))에서 수행될 수 있다.
동작(510)에서, 사용자 단말(300)은 사용자 데이터를 수집할 수 있다.
동작(520)에서, 사용자 단말(300)은 동작(510)에서 수집한 사용자 데이터가 유효한지 여부를 전술한 유효성 검사를 통해 결정할 수 있다. 동작(520)에서 사용자 데이터가 유효하지 않은 것으로 결정된 경우(동작(520)의 '아니오'에 해당), 사용자 단말(300)은 유효한 데이터가 수집될 때까지 동작(510)에서 사용자 데이터를 수집할 수 있다.
이와 달리, 동작(520)에서 사용자 데이터가 유효한 것으로 결정된 경우(동작(520)의 '예'에 해당), 동작(530)에서 사용자 단말(300)은 사용자 데이터 베이스(DB)에 유효한 데이터를 추가하고, 유효한 데이터를 트레이닝 세트와 테스트 세트로 분류할 수 있다.
동작(540)에서, 사용자 단말(300)은 미리 설정된 제1 시나리오 상황이 발생하면, 동작(530)에서 분류한 트레이닝 세트로 복수의 신경망 모델들을 트레이닝할 수 있다.
동작(550)에서, 사용자 단말(300)은 동작(540)에서 트레이닝한 복수의 신경망 모델들의 정확도들을, 동작(530)에서 분류한 테스트 세트로 산출할 수 있다.
동작(560)에서, 사용자 단말(300)은 동작(550)에서 산출한 정확도들 중 가장 정확도가 높은 하나의 신경망 모델을 선택할 수 있다.
동작(570)에서, 사용자 단말(300)은 미리 설정된 제2 시나리오 상황이 발생하면, 동작(560)에서 선택된 신경망 모델의 제1 파라미터를 서버(210)로 전송할 수 있다.
도 6은 다른 실시예에 따른 사용자 단말의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 6을 참조하면, 일 실시예에 따른 사용자 단말(예: 도 1의 전자 장치(101), 도 2의 사용자 단말들(220, 230, 240, 250) 각각, 도 3의 사용자 단말(300))이 동작(610) 내지 동작(690)을 통해 사용자 데이터를 처리하는 동작이 도시된다. 다양한 실시예들에 따르면, 동작(610) 내지 동작(690)은 단말(300)의 프로세서(예: 도 1의 프로세서(120), 도 3의 프로세서(430))에서 수행될 수 있다.
동작(610)에서, 사용자 단말(300)은 하나 이상의 센서로부터 수집된 사용자 데이터에 대한 유효성을 검사할 수 있다.
동작(620)에서, 사용자 단말(300)은 동작(610)의 유효성 검사 결과에 기초하여, 사용자 데이터 중 유효한 사용자 데이터를 저장할 수 있다.
동작(630)에서, 사용자 단말(300)은 동작(620)에서 저장된 유효한 사용자 데이터를 테스트 세트와 트레이닝 세트로 분류할 수 있다.
동작(640)에서, 사용자 단말(300)은 동작(630)에서 분류된 트레이닝 세트에 의해 복수의 신경망 모델들 각각에 대한 트레이닝을 수행할 수 있다.
동작(650)에서, 사용자 단말(300)은 동작(630)에서 분류된 테스트 세트에 의해, 동작(640)에서 트레이닝된 복수의 신경망 모델들의 정확도들을 산출할 수 있다.
동작(660)에서, 사용자 단말(300)은 동작(650)에서 산출한 정확도들에 기초하여, 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택할 수 있다.
동작(670)에서, 사용자 단말(300)은 동작(660)에서 선택된 신경망 모델의 제1 파라미터를 서버(예: 도 1의 서버(108), 도 2의 서버(210))로 전송할 수 있다.
동작(680)에서, 사용자 단말(300)은 사용자 단말들 각각으로부터 전송된 제1 파라미터들에 기초하여 서버(210)에서 생성된 신경망 모델들의 제2 파라미터들을 수신할 수 있다.
동작(690)에서, 사용자 단말(300)은 동작(680)에서 수신한 제2 파라미터들에 의해 복수의 신경망 모델들의 파라미터들을 갱신하여 사용자 데이터를 처리할 수 있다.
도 7은 일 실시예에 따른 서버의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 7을 참조하면, 일 실시예에 따른 서버(예: 도 1의 서버(108), 도 2의 서버(210))가 동작(710) 내지 동작(740)을 통해 사용자 단말들(예: 도 2의 사용자 단말들(220, 230, 240, 250))에게 제2 파라미터들을 전송하는 동작이 도시된다. 다양한 실시예들에 따르면, 동작(710) 내지 동작(740)은 서버(210)의 프로세서에서 수행될 수 있다.
동작(710)에서, 서버(210)는 복수의 신경망 모델들을 포함하는 사용자 단말들(220, 230, 240, 250) 각각으로부터, 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터들을 수집할 수 있다.
동작(720)에서, 서버(210)는 동작(710)을 통해 수집한 제1 파라미터들을 복수의 신경망 모델들 별로 분류할 수 있다.
동작(730)에서, 서버(210)는 동작(720)을 통해 신경망 모델들 별로 분류된 제1 파라미터들에 기초하여 복수의 신경망 모델들의 제2 파라미터들을 생성할 수 있다. 서버(108,210)는 제1 파라미터들을 연합 학습(federated learning) 알고리즘에 의해 학습하여 제2 파라미터들을 생성할 수 있다. 서버(108,210)는 예를 들어, 제1 파라미터들에 nk/n을 곱한 결과를 모든 사용자 단말들(220,230,340,250)에 대해서 합산한 가중합(weighted sum)에 의해 신경망 모델들을 학습하여 사용자 단말들(220, 230, 240, 250) 각각에 포함된 복수의 신경망 모델들과 구조는 동일하고, 파라미터들은 상이한 새로운 신경망 모델들을 생성할 수 있다. 여기서, nk는 k번째 단말에서 트레이닝에 사용된 트레이닝 데이터의 개수에 해당하고, n은 전체 사용자 단말들(220,230,340,250)에서 트레이닝에 사용된 트레이닝 데이터의 개수에 해당할 수 있다. 서버(108,210)는 새로운 신경망 모델들의 파라미터들을 제2 파라미터들로 설정할 수 있다.
사용자 단말들(220,230,340,250)로부터 수집한 가중치들에 nk/n을 곱한 결과를 모든 사용자 단말들(220,230,340,250)에 대해서 합산하여 가중합(weighted sum)할 수 있다.
동작(740)에서, 서버(108,210)는 동작(730)에서 생성한 제2 파라미터들을 사용자 단말들(220, 230, 240, 250)에게 전송할 수 있다.
도 8은 일 실시예에 따른 서버 및 사용자 단말들 간의 동작을 설명하기 위한 도면이다. 도 8을 참조하면, 일 실시예에 따른 서버(810)과 사용자 단말들(820, .. , 850) 간의 동작이 도시된다.
일 실시예에서 신경망 모델은 A, B, C의 3개가 존재한다고 가정한다. 여기서, 신경망 A'와 신경망 모델 A"는 신경망 모델 A와 신경망 구조는 동일하고, 파라미터(예: 가중치(weight), 또는 그래디언트)가 다른 신경망 모델을 의미할 수 있다. 이하, 설명의 편의를 위하여, 사용자 단말(820)의 동작을 위주로 설명하지만, 나머지 사용자 단말(850)에서도 사용자 단말(820)과 동일한 동작이 함께 수행될 수 있다.
사용자 단말(820)은 센서부(821)(예: 도 1의 센서 모듈(176)), AP(application processor)(822) 및 주 저장 장치(825)(예: 도 1의 메모리(130), 비휘발성 메모리(134))를 포함할 수 있다. AP(822)는 예를 들어, 모뎀(824), 및 CPU(830)를 포함할 수 있다. 모뎀(824)은 도 8에 도시된 것과 같이 AP(822) 내부에 있을 수도 있고, 또는 AP(822) 외부의 별도 모듈, 예를 들어, 통신 프로세서 칩(communication processor chip; CP)에 포함될 수도 있다.
CPU(830)는 예를 들어, 드라이버(driver)(831), 데이터 유효성 검사부(832), On-device 학습부(833), 모델 선택부(834), 파라미터 전송부(835), 및 모델 업데이트부(836)를 포함할 수 있으며, 반드시 이에 한정되지는 않는다. 도 8에서는 드라이버(831), 데이터 유효성 검사부(832), On-device 학습부(833), 모델 선택부(834), 파라미터 전송부(835), 및 모델 업데이트부(836)가 CPU(830)에 포함되는 것으로 도시하였으나, 이는 해당 구성들의 동작들이 CPU(830)에 의해 실행됨을 나타내기 위한 것일 수 있다. 드라이버(831), 데이터 유효성 검사부(832), On-device 학습부(833), 모델 선택부(834), 파라미터 전송부(835), 및 모델 업데이트부(836)는 소프트웨어로 구성되어 도 1의 메모리(130)에 저장, 또는 프로그램 모듈(140)에 포함되며, CPU(830)에 의해 호출되어 실행될 수 있다. 다양한 실시예에 따르면, On-device 학습부(833)는 AP(822) 안의 NPU(neural processing unit)에 의해 실행될 수도 있다. AP(822)는 드라이버(driver)(831)를 통해 센서부(821)(예: 도 1의 센서 모듈(176), 도 3의 센서(310))로부터 사용자 데이터를 수집할 수 있다. 사용자 단말(820)은 데이터 유효성 검사부(832)을 통해 사용자 데이터의 유효성을 검사한 후, 유효한 것으로 결정된 데이터('유효한 데이터')을 주 저장 장치(825) 내의 사용자 DB(827)에 추가할 수 있다.
사용자 단말(820)은 사용자 DB(827)에 저장된 유효한 데이터 중 예를 들어, 20%는 테스트 세트로, 나머지 80%는 트레이닝 세트로 나눌 수 있다.
사용자 단말(820)에서 미리 설정된 시나리오 상황(예: 단말의 충전 완료, 또는 유효 상태 진입)이 발생하는 경우, On-device 학습부(833)는 사용자 DB(827)에 저장된 트레이닝 세트 및 신경망 모델 A, B, C을 호출하고, 호출한 트레이닝 세트에 의해 신경망 모델 A, B, C에 대한 트레이닝을 수행할 수 있다.
모델 선택부(834)는 트레이닝 세트에 의해 트레이닝된 신경망 모델 A', B', C'의 정확도를 테스트 세트로 측정하고, 신경망 모델 A', B', C' 중 가장 높은 정확도를 가진 어느 하나의 신경망 모델을 선택할 수 있다. 이때, 신경망 모델들 간의 정확도가 동일하다면, 모델 선택부(834)는 소프트맥스(Softmax) 확률 값이 가장 큰 값을 보이는 어느 하나의 신경망 모델을 선택할 수 있다.
예를 들어, 테스트 세트에 포함된 테스트 데이터의 개수가 10개이고, 신경망 모델 A'와 신경망 모델 B'가 정답을 8개 맞춰서 정확도가 80%로 동일하다고 하자. 이 경우, 모델 선택부(834)는 신경망 모델 A'와 신경망 모델 B' 각각에서 10개 테스트 데이터에 대한 추론 결과의 소프트 맥스 확률 값의 평균값을 구할 수 있다. 모델 선택부(834)는 신경망 모델 A'와 신경망 모델 B' 중 소프트 맥스 확률 값의 평균값이 가장 큰 하나의 신경망 모델을 선택할 수 있다. 이때, 모델 선택부(834)에 의해 최종적으로 선택된 신경망 모델을 model X'라고 정의할 수 있다.
AP(822)는 model X'를 주 저장 장치(825)에 저장하고, model X'의 파라미터를 파라미터 전송부(835) 및 모뎀(824)을 거쳐 서버(810)로 전송할 수 있다. 파라미터 전송부(835)는 예를 들어, model X'의 파라미터와 서버(810)에게 전송하는 신경망 모델이 어떤 모델인지에 대한 태그(tag), 다시 말해 model X'에 대응하는 붙여 서버(810)로 전송할 수 있다. 파라미터 전송부(835)는 미리 설정된 제2 시나리오 상황(예: 와이파이 연결, 서버에서 전송 요청 수신)이 발생하면, model X'의 파라미터 및/또는 model X'에 대응하는 태그를 서버(810)로 전송할 수 있다.
서버(810)는 예를 들어, CPU(811), GPU(815) 및 모뎀(816)을 포함할 수 있다. CPU(811)은 예를 들어, 파라미터 수집 및 모델별 분류부(812), 연합 학습(federated learning) 구동부(813), 및 모델 전송부(814)를 포함할 수 있다.
파라미터 수집 및 모델별 분류부(812)는 복수의 사용자 단말들에서 선택된 어느 하나의 신경망 모델의 파라미터(예를 들어, 제1 파라미터)를 수집한 후, 수집한 파라미터를 신경망 모델들 별로 분류하여 서버(810)의 주 저장 장치에 저장할 수 있다. 파라미터 수집 및 모델별 분류부(812)는 복수의 사용자 단말들로부터 수집한 파라미터들 각각에 대응하는 태그에 의해, 수집한 파라미터들을 신경망 모델들 별로 분류할 수 있다. 서버(810)는 파라미터 수집 및 모델별 분류부(812)에서 분류된 모델 별 파라미터들을 GPU(815)로 전달할 수 있다.
GPU(815)는 분류된 모델 별 파라미터들을 연합 학습 알고리즘으로 학습하여 신경망 모델 A", B", C"를 생성할 수 있다. GPU(815)는 예를 들어, 모델 A'로 분류된 파라미터들에 대한 가중합(weighted sum)을 수행하여 신경망 모델 A"를 생성할 수 있다. 마찬가지로, GPU(815)는 모델 B' 및 모델 C'로 분류된 파라미터들 각각에 대한 가중합을 수행하여 신경망 모델 B" 및 C"를 생성할 수 있다.
모델 전송부(814)는 신경망 모델 A", B", C"의 파라미터들을 모뎀(816)을 통해 단말들(820, 850)에게 전송할 수 있다.
사용자 단말(820)의 모뎀(824)은 서버의 모델(816)으로부터 신경망 모델 A", B", C"의 파라미터들을 수신하여 모델 업데이트부(835)로 전달할 수 있다. 모델 업데이트부(835)는 주 저장 장치(825)에 저장된 사용자 단말(820)의 신경망 모델 A, B, C의 파라미터들을 신경망 모델 A", B", C"의 파라미터들로 대체할 수 있다.
도 9은 일 실시예에 따른 사용자 단말의 동작 방법을 설명하기 위한 도면이다. 도 9를 참조하면, 일 실시예에 따른 터치 IC(910)(예: 도 3의 터치 IC(350)) 및 AP(930)(예: 도 1의 프로세서(120), 도 3의 프로세서(330), 도 8의 AP(822))를 포함하는 사용자 단말(900)(도 1의 전자 장치(101), 도 2의 사용자 단말들 각각(220, 230, 240, 250), 도 3의 사용자 단말(300), 도 8의 사용자 단말(820, 850))의 동작이 도시된다.
일 실시예에 따른 사용자 단말(900)은 별도의 압력 센서 없이, AI를 기반으로 디스플레이(예: 도 1의 디스플레이 모듈(160))를 길게 누르는 롱 프레스 입력과 터치 디스플레이에 힘을 강하게 주고 길게 누르는 포스 터치(force touch) 입력을 구분할 수 있다. 디스플레이(160)는 예를 들어, 터치 센서와 결합된 터치 스크린, 플렉서블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 및 3차원 디스플레이(3D display)에 의해 구현될 수 있으며, 반드시 이에 한정되지는 않는다.
예를 들어, 사용자 단말(900)에서 디스플레이(160)의 구동 전극(Drive Electrodes)과 감지 전극(Sense Electrodes)의 교차 영역인 셀(Cell)이 캐패시터(Capacitor) 역할을 수행할 수 있다. 이때, 사용자 단말900)에 포함된 신경망 모델이 셀의 어레이 값의 패턴을 읽어 포스 터치 입력과 롱 터치 입력을 구분할 수 있다.
포스 터치 입력과 롱 터치 입력은 사용자들에 따라 다양한 형태를 나타낼 수 있다. 예를 들면, 남성, 여성, 어린이, 손가락에 살이 많은 사람, 특이한 방식으로 디스플레이(160)를 누르는 사람, 포스 터치 입력을 롱 터치 입력처럼 누르는 사람과 같이 디스플레이(160)를 터치하는 다양한 입력 패턴들이 존재할 수 있다. 또한, 다양한 입력 패턴들을 대표하는 하나의 신경망 모델을 찾는 것은 용이하지 않다. 이와 같이, 전세계 사람들의 입력의 패턴들은 매우 다양하므로 다양한 입력 패턴들에 대응하는 다수의 신경망 모델들을 위해서는 다수의 다양한 사용자 입력 데이터가 사용될 수 있다.
따라서, 일 실시예에서는 사용자들의 패턴 별로 최적화되어 있는 다수의 신경망 모델들을 사용하여 포스 터치 입력과 롱 터치 입력을 구분할 수 있다. 또한, 다수의 신경망 모델들을 기반으로 연합 학습 방법을 통해 다수의 사용자 입력 데이터를 제공함으로써 포스 터치 입력과 롱 터치 입력을 구분하는 정확도를 향상시킬 수 있다.
보다 구체적으로, 터치 IC(910)는 예를 들어, 디스플레이(160)에서 발생한 t 초 동안의 터치 입력이 감지되면, 감지된 터치 입력으로부터 시간차를 가진 N개의 프레임들에 대응하는 (H(height) x W(width) x N) 터치 픽셀 데이터를 생성할 수 있다. 터치 IC(910)는 (H x W x N) 터치 픽셀 데이터를 AP(930)로 전송할 수 있다.
AP(930)는 AP(930)에 포함된 신경망 모델들들을 이용하여 (H x W x N) 터치 픽셀 데이터에 대한 추론(inference) 연산을 수행하여, 터치 입력이 포스 터치 입력인지 또는 롱 프레스 입력인지를 구분할 수 있다.
AP(930)는 터치 입력의 구분 결과에 따라 해당 터치 입력에 대응하는 기능을 수행하고, 수행 결과를 사용자 인터페이스(user interface; UI)를 통해 출력할 수 있다.
일 실시예에 따르면, 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)은 사용자 데이터를 수집하는 하나 이상의 센서(176, 310), 복수의 신경망 모델들을 포함하는 메모리(134, 320, 825), 상기 사용자 데이터 중 유효한 데이터를 이용하여 트레이닝한 상기 복수의 신경망 모델들의 정확도들에 기초하여 상기 트레이닝된 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터를 전송하고, 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들 각각으로부터 전송된 제1 파라미터들을 이용하여 서버(108, 210,810)에서 생성된 상기 신경망 모델들의 제2 파라미터들에 기초하여 상기 사용자 데이터를 처리하는 프로세서(120, 330, 822, 930), 및 상기 제1 파라미터를 상기 서버(108, 210,810)로 전송하고, 상기 서버(108, 210,810)로부터 상기 제2 파라미터들을 수신하는 통신 인터페이스(190, 340)를 포함할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 유효한 데이터 중 일부의 트레이닝 데이터를 이용하여 상기 복수의 신경망 모델들 각각에 대한 트레이닝을 수행하고, 상기 유효한 데이터 중 상기 트레이닝 데이터를 제외한 나머지의 테스트 데이터에 기초하여, 상기 트레이닝된 복수의 신경망 모델들 중 상기 어느 하나의 신경망 모델을 선택할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 미리 설정된 제1 시나리오 상황이 발생함에 응답하여, 상기 트레이닝 데이터를 이용하여 상기 복수의 신경망 모델들 각각에 대한 트레이닝을 수행할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 테스트 데이터에 의해 상기 트레이닝된 복수의 신경망 모델들의 정확도들을 산출하고, 상기 정확도들에 기초하여 상기 어느 하나의 신경망 모델을 선택할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 정확도들 중 가장 높은 정확도를 갖는 상기 어느 하나의 신경망 모델을 선택할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 정확도들 중 가장 높은 정확도를 갖는 신경망 모델들이 복수 개인 경우, 상기 가장 높은 정확도를 갖는 복수 개의 신경망 모델들에서 상기 테스트 데이터를 이용하여 추론한 결과에 대한 소프트맥스(softmax) 확률 값에 기초하여, 상기 어느 하나의 신경망 모델을 선택할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 제2 파라미터들에 의해 상기 복수의 신경망 모델들의 파라미터들을 업데이트하여 상기 사용자 데이터를 처리할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 미리 설정된 제2 시나리오 상황에 발생함에 응답하여, 상기 제1 파라미터를 상기 통신 인터페이스(190, 340)를 통해 상기 서버(108, 210,810)로 전송할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 사용자 데이터에 대한 유효성 검사 결과에 기초하여, 상기 사용자 데이터 중 상기 유효한 데이터를 결정하고, 상기 유효한 데이터를 사용자 데이터 베이스(DB)에 저장할 수 있다.
일 실시예에 따르면, 상기 프로세서(120, 330, 822, 930)는 상기 유효한 데이터 중 일부를 트레이닝 데이터로 분류하고, 상기 유효한 데이터 중 상기 일부를 제외한 나머지를 테스트 데이터로 분류할 수 있다.
일 실시예에 따르면, 상기 사용자 데이터는 상기 하나 이상의 센서(176, 310)에 의해 감지된 터치 입력을 포함할 수 있다.
일 실시예에 따르면, 상기 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)은 상기 하나 이상의 센서(176, 310)에 의해 감지된 터치 입력을 포함하는 사용자 데이터로부터 시간차를 가진 복수의 프레임들에 대응하는 터치 픽셀 데이터를 생성하는 터치 IC(350, 910)를 더 포함할 수 있다.
일 실시예에 따르면, 하나 이상의 센서(176, 310) 및 복수의 신경망 모델들을 포함하는 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)의 동작 방법은 상기 하나 이상의 센서(176, 310)로부터 수집한 사용자 데이터 중 유효한 데이터를 이용하여 상기 복수의 신경망 모델들을 트레이닝하는 동작 410, 상기 트레이닝된 복수의 신경망 모델들의 정확도들에 기초하여 상기 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택하는 동작 420, 상기 선택된 신경망 모델의 제1 파라미터를 서버(108, 210,810)로 전송하는 동작 430, 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들 각각으로부터 전송된 제1 파라미터들에 기초하여 상기 서버(108, 210,810)에서 생성된 상기 신경망 모델들의 제2 파라미터들을 수신하는 동작 440, 및 상기 제2 파라미터들에 의해 상기 복수의 신경망 모델들의 파라미터들을 갱신하여 상기 사용자 데이터를 처리하는 동작 450을 포함할 수 있다.
일 실시예에 따르면, 상기 복수의 신경망 모델들을 트레이닝하는 동작은 상기 유효한 데이터 중 일부의 트레이닝 데이터를 이용하여 상기 복수의 신경망 모델들 각각을 트레이닝하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 어느 하나의 신경망 모델을 선택하는 동작은 상기 유효한 데이터 중 상기 트레이닝 데이터를 제외한 나머지의 테스트 데이터에 기초하여, 상기 트레이닝된 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 어느 하나의 신경망 모델을 선택하는 동작은 상기 테스트 데이터에 의해 상기 트레이닝된 복수의 신경망 모델들의 정확도들을 산출하는 동작, 및 상기 정확도들에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 정확도들에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작은 상기 정확도들 중 가장 높은 정확도를 갖는 상기 어느 하나의 신경망 모델을 선택하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 정확도들에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작은 상기 정확도들 중 가장 높은 정확도를 갖는 신경망 모델들이 복수 개인 경우, 상기 가장 높은 정확도를 갖는 복수 개의 신경망 모델들에서 상기 테스트 데이터를 이용하여 추론한 결과에 대한 소프트맥스(softmax) 확률 값에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작을 포함할 수 있다.
일 실시예에 따르면, 서버(108, 210,810)의 동작 방법은 복수의 신경망 모델들을 포함하는 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들 각각으로부터, 상기 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터들을 수집하는 동작 710, 상기 제1 파라미터들을 상기 복수의 신경망 모델들 별로 분류하는 동작 720, 상기 신경망 모델들 별로 분류된 제1 파라미터들에 기초하여 상기 복수의 신경망 모델들의 제2 파라미터들을 생성하는 동작 730, 및 상기 제2 파라미터들을 상기 사용자 단말(101, 220, 230, 240, 250, 300, 820, 850, 900)들에게 전송하는 동작 740을 포함할 수 있다.

Claims (20)

  1. 사용자 데이터를 수집하는 하나 이상의 센서;
    복수의 신경망 모델들을 포함하는 메모리;
    상기 사용자 데이터 중 유효한 데이터를 이용하여 트레이닝한 상기 복수의 신경망 모델들의 정확도들에 기초하여 상기 트레이닝된 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터를 전송하고, 사용자 단말들 각각으로부터 전송된 제1 파라미터들을 이용하여 서버에서 생성된 상기 신경망 모델들의 제2 파라미터들에 기초하여 상기 사용자 데이터를 처리하는 프로세서; 및
    상기 제1 파라미터를 상기 서버로 전송하고, 상기 서버로부터 상기 제2 파라미터들을 수신하는 통신 인터페이스
    를 포함하는, 사용자 단말.
  2. 제1항에 있어서,
    상기 프로세서는
    상기 유효한 데이터 중 일부의 트레이닝 데이터를 이용하여 상기 복수의 신경망 모델들 각각에 대한 트레이닝을 수행하고,
    상기 유효한 데이터 중 상기 트레이닝 데이터를 제외한 나머지의 테스트 데이터에 기초하여, 상기 트레이닝된 복수의 신경망 모델들 중 상기 어느 하나의 신경망 모델을 선택하는, 사용자 단말.
  3. 제2항에 있어서,
    상기 프로세서는
    미리 설정된 제1 시나리오 상황이 발생함에 응답하여, 상기 트레이닝 데이터를 이용하여 상기 복수의 신경망 모델들 각각에 대한 트레이닝을 수행하는, 사용자 단말.
  4. 제2항에 있어서,
    상기 프로세서는
    상기 테스트 데이터에 의해, 상기 트레이닝된 복수의 신경망 모델들의 정확도들을 산출하고, 상기 정확도들에 기초하여 상기 어느 하나의 신경망 모델을 선택하는, 사용자 단말.
  5. 제4항에 있어서,
    상기 프로세서는
    상기 정확도들 중 가장 높은 정확도를 갖는 상기 어느 하나의 신경망 모델을 선택하는, 사용자 단말.
  6. 제4항에 있어서,
    상기 프로세서는
    상기 정확도들 중 가장 높은 정확도를 갖는 신경망 모델들이 복수 개인 경우, 상기 가장 높은 정확도를 갖는 복수 개의 신경망 모델들에서 상기 테스트 데이터를 이용하여 추론한 결과에 대한 소프트맥스(softmax) 확률 값에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는, 사용자 단말.
  7. 제1항에 있어서,
    상기 프로세서는
    상기 제2 파라미터들에 의해 상기 복수의 신경망 모델들의 파라미터들을 업데이트하여 상기 사용자 데이터를 처리하는, 사용자 단말.
  8. 제1항에 있어서,
    상기 프로세서는
    미리 설정된 제2 시나리오 상황에 발생함에 응답하여, 상기 제1 파라미터를 상기 통신 인터페이스를 통해 상기 서버로 전송하는, 사용자 단말.
  9. 제1항에 있어서
    상기 프로세서는
    상기 사용자 데이터에 대한 유효성 검사 결과에 기초하여, 상기 사용자 데이터 중 상기 유효한 데이터를 결정하고, 상기 유효한 데이터를 사용자 데이터 베이스(DB)에 저장하는, 사용자 단말.
  10. 제1항에 있어서
    상기 프로세서는
    상기 유효한 데이터 중 일부를 트레이닝 데이터로 분류하고, 상기 유효한 데이터 중 상기 일부를 제외한 나머지를 테스트 데이터로 분류하는, 사용자 단말.
  11. 제1항에 있어서,
    상기 사용자 데이터는
    상기 하나 이상의 센서에 의해 감지된 터치 입력을 포함하는, 사용자 단말.
  12. 제1항에 있어서,
    상기 하나 이상의 센서에 의해 감지된 터치 입력을 포함하는 사용자 데이터로부터 시간차를 가진 복수의 프레임들에 대응하는 터치 픽셀 데이터를 생성하는 터치 IC
    를 더 포함하는, 사용자 단말.
  13. 하나 이상의 센서 및 복수의 신경망 모델들을 포함하는 사용자 단말의 동작 방법에 있어서,
    상기 하나 이상의 센서로부터 수집한 사용자 데이터 중 유효한 데이터를 이용하여 상기 복수의 신경망 모델들을 트레이닝하는 동작;
    상기 트레이닝된 복수의 신경망 모델들의 정확도들에 기초하여 상기 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택하는 동작;
    상기 선택된 신경망 모델의 제1 파라미터를 서버로 전송하는 동작;
    사용자 단말들 각각으로부터 전송된 제1 파라미터들에 기초하여 상기 서버에서 생성된 상기 신경망 모델들의 제2 파라미터들을 수신하는 동작; 및
    상기 제2 파라미터들에 의해 상기 복수의 신경망 모델들의 파라미터들을 갱신하여 상기 사용자 데이터를 처리하는 동작
    을 포함하는, 사용자 단말의 동작 방법.
  14. 제13항에 있어서,
    상기 복수의 신경망 모델들을 트레이닝하는 동작은
    상기 유효한 데이터 중 결정된 트레이닝 데이터를 이용하여 상기 복수의 신경망 모델들 각각을 트레이닝하는 동작
    을 포함하는, 사용자 단말의 동작 방법.
  15. 제13항에 있어서,
    상기 어느 하나의 신경망 모델을 선택하는 동작은
    상기 유효한 데이터 중 상기 트레이닝 데이터를 제외한 나머지의 테스트 데이터에 기초하여, 상기 트레이닝된 복수의 신경망 모델들 중 어느 하나의 신경망 모델을 선택하는 동작
    을 포함하는, 사용자 단말의 동작 방법.
  16. 제15항에 있어서,
    상기 어느 하나의 신경망 모델을 선택하는 동작은
    상기 테스트 데이터에 의해 상기 트레이닝된 복수의 신경망 모델들의 정확도들을 산출하는 동작; 및
    상기 정확도들에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작
    을 포함하는, 사용자 단말의 동작 방법.
  17. 제16항에 있어서,
    상기 정확도들에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작은
    상기 정확도들 중 가장 높은 정확도를 갖는 상기 어느 하나의 신경망 모델을 선택하는 동작
    을 포함하는, 사용자 단말의 동작 방법.
  18. 제16항에 있어서,
    상기 정확도들에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작은
    상기 정확도들 중 가장 높은 정확도를 갖는 신경망 모델들이 복수 개인 경우, 상기 가장 높은 정확도를 갖는 복수 개의 신경망 모델들에서 상기 테스트 데이터를 이용하여 추론한 결과에 대한 소프트맥스(softmax) 확률 값에 기초하여, 상기 어느 하나의 신경망 모델을 선택하는 동작
    을 포함하는, 사용자 단말의 동작 방법.
  19. 복수의 신경망 모델들을 포함하는 사용자 단말들 각각으로부터, 상기 복수의 신경망 모델들 중 선택된 어느 하나의 신경망 모델의 제1 파라미터들을 수집하는 동작;
    상기 제1 파라미터들을 상기 복수의 신경망 모델들 별로 분류하는 동작;
    상기 신경망 모델들 별로 분류된 제1 파라미터들에 기초하여 상기 복수의 신경망 모델들의 제2 파라미터들을 생성하는 동작; 및
    상기 제2 파라미터들을 상기 사용자 단말들에게 전송하는 동작
    을 포함하는, 서버의 동작 방법.
  20. 하드웨어와 결합되어 제13항 내지 제19항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
KR1020210113236A 2021-08-26 2021-08-26 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말 KR20230030947A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210113236A KR20230030947A (ko) 2021-08-26 2021-08-26 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210113236A KR20230030947A (ko) 2021-08-26 2021-08-26 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말

Publications (1)

Publication Number Publication Date
KR20230030947A true KR20230030947A (ko) 2023-03-07

Family

ID=85513059

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210113236A KR20230030947A (ko) 2021-08-26 2021-08-26 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말

Country Status (1)

Country Link
KR (1) KR20230030947A (ko)

Similar Documents

Publication Publication Date Title
KR102408462B1 (ko) 뉴럴 네트워크를 이용한 의상 추천 방법 및 장치
KR20220135914A (ko) 학습 기반의 필기 입력을 처리하는 전자 장치, 그 동작 방법 및 저장매체
KR20220102715A (ko) 전자 장치 및 밝기 조절 방법
US20230232075A1 (en) Electronic device for providing content recommendation service, and method therefor
US11669201B2 (en) Electronic device and method for input coordinate prediction
US20230070539A1 (en) Electronic device for obtaining user input through virtual keyboard and method of operating the same
US11929079B2 (en) Electronic device for managing user model and operating method thereof
KR20230030947A (ko) 연합 학습을 위한 사용자 단말 및 서버의 동작 방법, 및 그 사용자 단말
US20240077970A1 (en) Electronic device and learning model determination method for learning of electronic device
KR20210142535A (ko) 전자 장치 및 전자 장치에서 키보드의 입력을 이용하여 사용자 인증을 수행하는 방법
US20220343106A1 (en) Electronic device for processing data based on artificial intelligence model and method for operating the same
US20230260439A1 (en) Method, electronic device, and storage medium for controlling optical sensor on basis of tensile information of stretchable display
US11955074B2 (en) Electronic device and method for calibrating image data in electronic device
US11899852B2 (en) Electronic device and operation method thereof
US20230342209A1 (en) Service operation method and electronic device supporting same
US20220311636A1 (en) Electronic device and method for determining device for performing task by electronic device
KR20230086533A (ko) 사용자를 인증하기 위한 클라우드 서버 및 이의 동작 방법
KR20230068936A (ko) 디바이스 위치 결정 방법 및 상기 방법을 수행하는 전자 장치
KR20230105049A (ko) 사용자의 머리에 장착 가능한 전자 장치 및 상기 전자 장치에서 생체 정보를 이용한 기능을 제공하는 방법
KR20220151483A (ko) 전자 장치 및 전자 장치의 동작 방법
KR20230046701A (ko) 포스 터치를 확인하는 전자 장치와 이의 동작 방법
KR20220144996A (ko) 터치 데이터를 양자화하기 위한 방법 및 이를 지원하는 전자 장치
KR20220045489A (ko) 보행에 관한 정보를 확인하는 전자 장치 및 보행에 관한 정보를 확인하는 전자 장치의 동작 방법
KR20230040557A (ko) 전자 장치 및 전자 장치의 터치 인식 방법
KR20230036021A (ko) 가상 키보드를 통하여 사용자 입력을 획득하는 전자 장치와 이의 동작 방법