WO2017043680A1

WO2017043680A1 - 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 방법

Info

Publication number: WO2017043680A1
Application number: PCT/KR2015/009565
Authority: WO
Inventors: 황상흠; 김효은; 이정인
Original assignee: 주식회사 루닛
Priority date: 2015-09-11
Filing date: 2015-09-11
Publication date: 2017-03-16

Abstract

본 발명은 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 방법에 관한 것으로서, 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값 또는 그래디언트값에 의해 업데이트되는 매개 변수 중 어느 하나를 매개 변수 서버로 전송하는 적어도 하나 이상의 컴퓨팅 서버; 및 컴퓨팅 서버와 네트워크를 통해 연결되며, 컴퓨팅 서버 사이에서 그래디언트값 또는 매개 변수를 송수신하는 매개 변수 서버를 포함하되, 상기 컴퓨팅 서버는, 매개 변수 서버로부터 수신되는 그래디언트값 또는 매개 변수에 기초하여 학습을 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 이를 이용한 방법을 제공한다.

Description

의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 방법

본 발명은 인공 신경망의 분산 학습 시스템 및 방법에 관한 것으로서 보다 상세하게는 의료 데이터를 이용한 학습 시스템에서 의료 데이터에 연관된 개인 정보를 보호하면서 방대한 양의 의료 데이터를 효과적으로 학습할 수 있도록 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 방법에 관한 것이다.

영상의학이란, 각종 의료 영상의 촬영, 판독, 진단 및 진료 자문의 역할을 하는 의학의 분야이다. 예컨대, 정밀 진단 여부를 위해서는 해당 환자의 의료 영상을 영상의학 의사가 X-ray, CT, MRI 등의 장비를 이용하여 촬영하고 촬영된 영상을 판독함으로써 진단 및 추가 검사의 필요 유무를 판단하게 된다.

이러한 영상의학적 진단을 컴퓨터 등의 장비에 의해 자동적으로 수행하기 위해서는, 입력되는 쿼리 영상을 비교 분석할 기존의 영상 및 그에 해당하는 병리 진단결과가 데이터베이스화된 영상 및 진단 데이터가 필요하다.

이러한 영상의학적 진단을 컴퓨터 등의 장비에 의해 자동적으로 수행하기 위해서는, 입력되는 쿼리 영상을 비교 분석할 기존의 영상 및 그에 해당하는 병리 진단결과가 데이터베이스화된 영상 및 병리 진단 데이터가 필요하다.

이러한 병리학적 진단을 머쉰 러닝(machine learning)에 기초한 학습을 통해 수행하도록 하는 방안이 제시되고 있다. 이러한 의료 영상을 학습에는 인공 신경망이 사용되는데, 예측력 높은 인공 신경망을 학습하기 위해서는 대량의 의료 데이터가 필요하다.

한편, 인공 신경망의 경우, 데이터의 모든 정보를 학습의 주체가 가지고 있을 필요가 없다. 다시 말하면 데이터로부터 추출된(원본 데이터로 복원 불가능한) 요약 정보만을 가지고도 학습이 가능하다.

그런데, 데이터의 보안이 중요하고 서로 다른 주체가 서로 다른 데이터를 각각 소유하고 있는 경우 모든 데이터를 활용하여 학습하기에는 여러가지 어려움이 따른다. 예를 들어, 의료 관련 데이터의 경우 환자의 개인 정보를 포함할 수 있고 이러한 데이터가 외부에 무방비로 노출될 경우 데이터로부터 특정 환자를 특징지을 수 있기 때문에 함부로 외부에 데이터를 공개할 수 없다. 따라서, 의료 영상과 같은 데이터를 병원 외부의 주체가 소유하기 위해서는 데이터에 내재되어 있는 환자의 개인 정보를 삭제한 후 병원 내의 심의회를 거치는 등의 엄격한 절차를 거쳐야 하는 문제가 있어서 의료 데이터의 수집 자체가 어렵다는 문제가 있다.

본 발명은 상기한 바와 같은 한계점을 해결하기 위한 것으로서, 의료 데이터의 개인 정보의 노출 등과 같은 이슈를 회피하면서 각각의 의료 기관에 분산되어 있는 의료 영상 데이터를 활용할 수 있도록 하는 시스템 및 방법을 제공하는 것을 목적으로 한다.

즉, 본 발명은 의료 데이터를 제공하는 주체 측면에서 데이터 제공에 대한 위험을 감수할 필요가 없이 의료 데이터 자체는 각각의 주체가 소유한 상태에서 모든 데이터의 정보를 활용하여 학습할 수 있도록 함으로써 학습의 효율성을 높이고 나아가 분석 정확도를 높일 수 있는 시스템 및 방법을 제공하는 것을 목적으로 한다.

상기한 바와 같은 과제를 해결하기 위하여 본 발명은, 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템으로서, 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값 또는 그래디언트값에 의해 업데이트되는 매개 변수 중 어느 하나를 매개 변수 서버로 전송하는 적어도 하나 이상의 컴퓨팅 서버; 및 컴퓨팅 서버와 네트워크를 통해 연결되며, 컴퓨팅 서버 사이에서 그래디언트값 또는 매개 변수를 송수신하는 매개 변수 서버를 포함하되, 상기 컴퓨팅 서버는, 매개 변수 서버로부터 수신되는 그래디언트값 또는 매개 변수에 기초하여 학습을 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템을 제공한다.

여기에서, 상기 컴퓨팅 서버는, 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 매개 변수 서버로 전송하고, 상기 매개 변수 서버는 수신되는 그래디언트값을 다른 컴퓨팅 서버로 전송하고, 매개 변수 서버로부터 그래디언트값을 수신한 컴퓨팅 서버는 수신된 그래대언트값에 의해 매개 변수를 업데이트하도록 구성할 수도 있다.

또한, 상기 컴퓨팅 서버는, 의료 데이터의 묶음으로 구성된 배치 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하는 컴퓨팅 유닛; 및 의료 데이터의 묶음으로 구성된 배치 데이터를 저장하는 데이터 저장부를 포함할 수 있다.

또한, 상기 컴퓨팅 유닛은 계산된 그래디언트값을 매개 변수 서버로 전송하고, 매개 변수 서버로부터 다른 컴퓨팅 유닛에서 전송된 그래디언트값을 수신하여 매개 변수를 업데이트하도록 구성할 수 있다.

또한, 상기 컴퓨팅 유닛은 계산된 그래디언트값에 의해 매개 변수를 업데이트하도록 구성할 수도 있다.

또한, 하나의 컴퓨팅 서버에서 배치 데이터에 대해서 그래디언트값을 구하고 이를 매개 변수 서버로 전송하고, 매개 변수 서버는 수신된 그래디언트값을 다른 컴퓨팅 서버로 전송하고, 다른 컴퓨팅 서버는 전송된 그래디언트값에 기초하여 매개 변수를 업데이트하는 과정을 모든 배치 데이터에 대해서 순차적으로 수행하되, 상기 과정을 모든 컴퓨팅 서버에 대해 수행할 수도 있다.

또한, 각각의 컴퓨팅 서버에서 병렬적으로 배치 데이터에 대해서 그래디언트값을 구하고 이를 매개 변수 서버로 전송하고, 매개 변수 서버는 수신된 그래디언트값을 다른 컴퓨팅 서버로 전송하고, 다른 컴퓨팅 서버는 전송된 그래디언트값에 기초하여 매개 변수를 업데이트하는 과정을 모든 배치 데이터에 대해서 순차적으로 수행하도록 할 수도 있다.

또한, 상기 컴퓨팅 서버는, 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 의해 매개 변수를 업데이트하고 업데이트된 매개 변수를 매개 변수 서버로 전송하고, 상기 매개 변수 서버는 수신되는 매개 변수를 다른 컴퓨팅 서버로 전송하고, 매개 변수 서버로부터 매개 변수를 수신한 컴퓨팅 서버는 수신된 매개 변수에 의해 학습 과정을 수행하도록 할 수도 있다.

또한, 상기 컴퓨팅 서버는, 의료 데이터의 묶음으로 구성된 배치 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 의해 매개 변수를 업데이트하는 컴퓨팅 유닛; 및 의료 데이터의 묶음으로 구성된 배치 데이터를 저장하는 데이터 저장부를 포함할 수 있다.

또한, 상기 컴퓨팅 유닛은 업데이트된 매개 변수를 매개 변수 서버로 전송하고, 매개 변수 서버로부터 다른 컴퓨팅 유닛에서 전송된 매개 변수를 수신하여 학습 과정을 수행하도록 구성할 수도 있다.

또한, 상기 매개 변수 서버는 수신되는 매개 변수를 매개 변수를 전송한 컴퓨팅 서버에 인접한 컴퓨팅 서버로 전송하도록 할 수도 있다.

또한, 상기 매개 변수는 상태 정보에 기초하여 수신되는 매개 변수를 전송할 컴퓨팅 서버를 선정하여 전송하도록 할 수도 있다.

또한, 상기 매개 변수 서버는 상태 정보를 고려하여 컴퓨팅 서버에서 학습할 배치 데이터의 양인 배치 연산 주기를 결정하고, 상기 컴퓨팅 서버는 상기 배치 연산 주기에 기초하여 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 의해 매개 변수를 업데이트하고 업데이트된 매개 변수를 매개 변수 서버로 전송하도록 할 수도 있다.

본 발명의 다른 측면에 의하면, 전술한 바와 같은 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템에서 수행되는 분산 학습 방법으로서, 컴퓨팅 서버가 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값 또는 그래디언트값에 의해 업데이트되는 매개 변수 중 어느 하나를 매개 변수 서버로 전송하는 제1 단계; 매개 변수 서버가 그래디언트값 또는 매개 변수를 수신하고 그래디언트값 또는 매개 변수를 전송한 컴퓨팅 서버 이외의 다른 컴퓨팅 서버로 전송하는 제2 단계; 및 컴퓨팅 서버가 매개 변수 서버로부터 수신되는 그래디언트값 또는 매개 변수에 기초하여 학습을 수행하는 제3 단계를 포함하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 방법을 제공한다.

본 발명에 의하면, 의료 데이터의 개인 정보의 노출 등과 같은 이슈를 회피하면서 각각의 의료 기관에 분산되어 있는 의료 영상 데이터를 활용할 수 있도록 하는 시스템 및 방법을 제공할 수 있다.

즉, 본 발명은 의료 데이터를 제공하는 주체 측면에서 데이터 제공에 대한 위험을 감수할 필요가 없이 의료 데이터 자체는 각각의 주체가 소유한 상태에서 모든 데이터의 정보를 활용하여 학습할 수 있도록 함으로써 학습의 효율성을 높이고 나아가 분석 정확도를 높일 수 있는 시스템 및 방법을 제공할 수 있다.

도 1은 일반적인 인공 신경망에서의 학습 과정을 설명하기 위한 도면이다.

도 2는 본 발명에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템(100)의 전체적인 구성을 나타낸 도면이다.

도 3은 환자의 유방 X-선 촬영 영상을 나타낸 것이다.

도 4는 컴퓨팅 서버(20,30,40)의 내부 구성을 나타낸 도면이다.

도 5는 도 2 내지 도 4를 참조하여 설명한 시스템(100)에 의해 수행되는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 방법의 일실시예를 나타낸 흐름도이다.

도 6은 본 발명에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 방법의 다른 실시예를 나타낸 흐름도이다.

도 7은 본 발명에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 방법의 또 다른 실시예를 나타낸 흐름도이다.

도 8은 본 발명에 다른 실시예에 의한 시스템(100A)의 구성을 나타낸 도면이다.

이하, 첨부 도면을 참조하여 본 발명에 의한 실시예를 상세하게 설명하기로 한다.

우선, 본 발명에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 방법을 설명하기에 앞서서 도 1을 참조하여 인공 신경망에서의 일반적인 학습 과정에 대해 간략하게 설명하기로 한다.

알려져 있는 바와 같이, 인공 신경망에서의 학습(learning)이라 함은, 특정한 인공 신경망 모델이 주어져 있고 주어진 모델의 최적의 매개 변수(parameter, 신경망의 노드(node)간의 웨이트(weight))를 찾는 과정이라고 할 수 있다.

도 1은 인공 신경망 모델과 해당 모델에서의 학습 과정을 나타낸 것으로서, 이 모델에서의 매개 변수(parameter)는 초기에 주어진 값을 가진다. 다만, 이 때의 초기값은 랜덤하게 주어질 수도 있고 특정값을 입력할 수도 있다. 또한, 특정 분포나 사전에 학습된 모델로부터 가져올 수도 있다.

도 1의 모델에서의 학습 과정은 에러 역전파(error backpropagation) 방식을 사용하는데, 도 1의 모델에서, 입력 레이어(input layer)에서 데이터가 입력되면 히든 레이어(Hidden 1, Hidden 2)를 거쳐서 출력 노드(output)로 전달되고, 출력 레이어(output layer)에서 출력값(o_i,output value)을 얻을 수 있다. 그리고 출력값(O_i)과 타겟값(t_i, target value)과의 에러(error)를 계산한다. 즉, 데이터를 신경망 모델에 피드포워드(feedforward) 시켜서 출력 레이어에서 에러를 계산한다.

그리고, 계산된 에러를 도 1의 모델에 출력 레이어로부터 입력 레이어로 역전파(backpropagation) 시키면서 해당 모델의 각각의 매개 변수(parameter)의 그래디언트(gradient)값을 계산한다. 그리고 나서 계산된 그래디언트값을 바탕으로 매개 변수를 업데이트(update)한다.

이러한 과정을 반복함으로써 도 1의 인공 신경망 모델은 학습을 수행할 수 있고 출력값은 점차 타겟값에 가까운 결과를 제공할 수 있게 된다.

가장 간단한 형태의 인공 신경망 모델은 아래와 같은 함수로 표현할 수 있다.

f(x,w₁,w₀) = σ(w₁x+w₀)

여기에서, σ는 비선형 활성함수를 나타내고 x는 입력값, w_i는 신경망의 매개 변수(parameter)를 의미한다.

신경망의 학습이란 신경망에 입력을 넣어 나오는 출력값이 실제 데이터 라벨(label)과 같아지도록 신경망의 매개 변수를 조정하는 과정이다. 예를 들어, {x₁,x₂,....,x_n)의 데이터와 각 데이터의 라벨(label) {y₁,y₂,...,y_n}이 주어져 있을 때, 신경망의 출력값과 실제 라벨간의 에러(error) 함수는 다음과 같이 squared error 함수로 정의할 수 있다(에러 함수는 신경망의 목적에 따라 달라질 수 있으며 여기서는 예시를 위해 squared error 함수를 이용함).

이러한 에러 함수를 최소화시키는 신경망 모델의 매개 변수를 찾기 위해 최적화 방법으로서 예컨대 gradient descent 방식을 활용할 수 있다. 따라서, 신경망의 학습의 최적화 문제로 볼 수 있는데 이 때 목적 함수는 E(w₁,w₀)이 되고 최적화시킬 매개 변수는 w₁,w₀가 된다.

그래디언트(gradient)는 목적 함수를 각 매개 변수로 편미분한 방향을 나타내는데 이를 수식으로 표현하면 다음과 같다.

따라서, 신경망의 매개 변수는 위의 그래디언트 방향으로 일정량(learning rate: α)만큼 변화하도록 아래와 같이 업데이트(update)된다.

이러한 방식으로 에러 함수를 이용하여 그래디언트 값에 의해 신경망 모델에서의 매개 변수를 조정함으로써 신경망 모델을 학습시킬 수 있게 된다.

다음으로, 도 2 이하를 참조하여 본 발명에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템 및 방법에 대해 상세하게 설명하기로 한다.

도 2를 참조하면, 본 발명에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템(100,이하, 간단히 "시스템(100)"이라 한다)은 매개 변수 서버(parameter server, 10) 및 적어도 하나 이상의 컴퓨팅 서버(computing server, 20,30,40)를 구비한다.

매개 변수 서버(10)는 네트워크(미도시)를 통해 적어도 하나 이상의 컴퓨팅 서버(20,30,40)과 연결되며, 컴퓨팅 서버(20,30,40) 사이에서 그래디언트값 또는 매개 변수를 송수신하도록 동작한다. 한편, 매개 변수 서버(10)와 컴퓨팅 서버(20,30,40)는 그래디언트값이나 매개 변수 이외에도 상태 정보를 송수신할 수 있다. 상태 정보는 예컨대 네트워크의 상태, 각 컴퓨팅 서버(20,30,40)의 신경망 모델의 학습 상태, 컴퓨팅 서버(20,30,40)의 부하(load) 상태 등과 같은 정보를 의미한다.

컴퓨팅 서버(20,30,40)는 예컨대 원격지에 분산되어 있는 병원 등과 같은 의료 기관에 배치된 서버로서, 각각의 의료 기관이 보유하고 있는 의료 데이터에 기초하여 학습(learning)을 수행하면서 주어진 인공 신경망의 에러 함수에 대한 그래디언트값 또는 그래디언트값에 의해 업데이트되는 매개 변수 중 어느 하나를 매개 변수 서버(10)로 전송하며, 매개 변수 서버(10)로부터 전송되는 그래디언트값 또는 매개 변수를 수신하여 학습 과정을 수행하는 것을 특징으로 한다.

한편, 본 발명에서 "의료 데이터"라 함은, 환자의 병변 부위를 촬영한 X-ray, CT, MRI 영상 등과 같은 영상 데이터와 영상 이외의 병변과 관련된 내용이 포함된 텍스트 데이터 등을 포함하는 개념이다. 즉, 본 발명에서 "의료 데이터"는 병변과 관련된 학습을 수행할 수 있도록 하는 모든 종류의 데이터를 포함한다.

도 3은 영상 의료 데이터의 일예를 나타낸 것으로서, 환자의 유방 X-선 촬영 영상을 나타낸 것이며, 도 3에서 흰색 사각형으로 나타낸 부분이 암세포 조직(병변)을 나타낸다.

이러한 의료 데이터는 학습 수행시 연속적인 배치(batch) 작업을 위하여 각각의 의료 데이터의 묶음인 배치(batch) 데이터의 집합으로 구성되며, 각각의 컴퓨팅 서버(20,30,40)는 각각의 의료 데이터의 묶음인 배치 데이터의 집합에 의해 학습을 수행하게 된다. 여기서 각각의 컴퓨팅 서버(20,30,40)에서의 단위 배치 데이터의 양은 서로 같을 필요는 없으며 서로 독립적이다.

전술한 바와 같이 의료 데이터의 개인 정보 이슈로 인하여 의료 기관은 자신들이 보유하고 있는 의료 데이터를 외부로 제공하기를 꺼리기 때문에 컴퓨팅 서버(20,30,40)는 병원 등과 같은 의료 기관에 배치되어 해당 의료 기관에서 보유하고 있는 의료 데이터에 기초하여 학습을 수행하면서 그래디언트값 또는 매개 변수를 매개 변수 서버(10)로 전송하고 이를 다른 컴퓨팅 서버(20,30,40)에서 공유하도록 함으로써 개인 정보 이슈를 해결하면서 방대한 양의 의료 데이터를 효율적으로 이용하여 학습을 수행할 수 있도록 한다.

즉, 각각의 컴퓨팅 서버(20,30,40)에서 외부로 전송되는 그래디언트값이나 매개 변수는 원본 의료 데이터를 복원 불가능하도록 인코딩된 데이터나 마찬가지이므로 원본 의료 데이터의 보안 문제를 원천적으로 차단할 수 있다.

컴퓨팅 서버(20,30,40)는 특정한 인공 신경망 모델을 가지고 있으며 해당 신경망 모델의 구조에 의한 학습을 수행하는데, 여기서 학습 과정이라 함은 도 1을 참조하여 설명한 바와 같이 해당 신경망 모델의 에러 함수, 그래디언트값을 이용하여 매개 변수를 조절하는 과정을 의미한다.

도 4는 컴퓨팅 서버(20,30,40)의 내부 구성을 나타낸 도면이다.

도 4에 나타낸 바와 같이, 컴퓨팅 서버(20,30,40)는 적어도 하나 이상의 k개일 수 있으며, 이들은 원격지에 분산된 예컨대 병원 등과 같은 의료 기관에 배치된다.

컴퓨팅 서버(20,30,40)는 각각 컴퓨팅 유닛(21,31,41), 데이터 저장부(22,32,42) 및 배치 데이터(23,33,43)를 포함한다.

컴퓨팅 유닛(21,31,41)은 앞서 설명한 바와 같이 주어진 인공 신경망 모델의 매개 변수를 조절하는 과정 즉, 학습 과정을 수행하는데 이러한 과정 도중 각각의 컴퓨팅 유닛(21,31,41)에서의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 기초하여 매개 변수를 업데이트하고 또한 다른 컴퓨팅 유닛에도 반영될 수 있도록 매개 변수 서버(10)로 그래디언트값 또는 매개 변수를 전송한다.

또한, 컴퓨팅 유닛(21,31,41)은 다른 컴퓨팅 유닛으로부터 매개 변수 서버(10)를 통해 전송되는 그래디언트값 또는 매개 변수를 수신하고 이에 기초하여 학습 과정을 다시 수행한다.

데이터 저장부(22)는 전술한 바와 같은 의료 데이터를 묶음 단위로 구성한 배치 데이터(23,33,43)의 형태로 저장하고 있으며 이를 하나의 배치 데이터 단위로 컴퓨팅 유닛(21)으로 전송하여 단위 배치 데이터에 대해 그래디언트값을 계산하면서 매개 변수를 업데이트함으로써 학습 과정을 수행하도록 한다.

그래디언트값을 계산하는 방법과 이에 의해 매개 변수를 업데이트하는 과정은 앞서 도 1을 참조하여 설명한 바와 같은 방식이나 기타 종래 알려져 있는 방식을 사용할 수 있으며 이들은 본 발명의 직접적인 목적은 아니므로 여기서는 상세 설명은 생략한다.

도 5는 도 2 내지 도 4를 참조하여 설명한 시스템(100)에 의해 수행되는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 방법의 일실시예를 나타낸 흐름도로서, 도 5의 실시예는 그래디언트값에 기초하여 분산 학습을 실시하는 경우를 나타낸 것이다.

도 5를 참조하면, 어느 하나의 컴퓨팅 서버 예를 들어 컴퓨팅 서버(20)의 컴퓨팅 유닛(21)은 첫번째(i=1) 배치 데이터에 대해서 앞서 설명한 바와 같은 방식으로 학습 과정을 수행하면서 에러 함수를 계산하고 이에 의해 그래디언트값을 계산한다(S100).

그래디언트값이 계산되면 컴퓨팅 유닛(21)은 계산된 그래디언트값에 기초하여 자신의 매개 변수를 업데이트하고 계산된 그래디언트값을 매개 변수 서버(10)로 전송한다(S110).

매개 변수 서버(10)는 컴퓨팅 서버(20)로부터 전송된 그래디언트값을 컴퓨팅 서버(20) 이외의 다른 컴퓨팅 서버 즉, 도 2의 경우 컴퓨팅 서버(30,40)로 전송한다(S120).

컴퓨팅 서버(30,40)의 컴퓨팅 유닛(31,41)은 그래디언트값을 수신하고 이에 기초하여 각각 자신의 매개 변수를 업데이트한다(S130).

그리고 i값을 1씩 증가시키면서 다음 배치 데이터에 대해서 단계(S100) 내지 단계(S130)를 반복수행하는 과정을 마지막 배치 데이터까지 수행한다.

그리고, 이와 같은 과정이 컴퓨팅 서버(20)에서 완료되면 다음 컴퓨팅 서버 즉 컴퓨팅 서버(30)에서 상기 설명한 바와 같이 컴퓨팅 서버(30)의 배치 데이터들에 대해서 단계(S100) 내지 단계(S130)를 반복 수행한다.

이와 같은 과정을 마지막 컴퓨팅 서버(40)까지 반복하게 되면 모든 컴퓨팅 서버(20,30,40)의 모든 배치 데이터에 대해서 학습을 수행하고 각 과정에서 그래디언트값을 계산하고 이에 기초하여 매개 변수를 조절하는 과정을 모든 컴퓨팅 서버(20,30,40)에 대해서 수행할 수 있다.

도 5의 실시예는 모든 의료 데이터가 마치 한 곳에 저장되어 있는 것과 같은 학습 효과를 얻을 수 있다는 장점을 갖는다. 다만, 도 5의 실시예는 하나의 컴퓨팅 서버가 계산을 수행하는 동안 다른 컴퓨팅 서버들은 특별한 연산 없이 대기 상태로 있어야 하며, 그래디언트값의 전송 횟수가 많아져서 네트워크 비용(network cost)이 크다는 문제점이 있다.

도 6의 실시예는 모든 컴퓨팅 서버(20,30,40)에서 각각 병렬적으로 도 5와 같은 과정을 수행한다는 점에 특징이 있다.

우선, 모든 컴퓨팅 서버(20,30,40)에서 각각 자신이 가지고 있는 첫번째(i=1) 배치 데이터에 대해서 독립적으로 그래디언트값을 각각 계산한다(S200).

그래디언트값이 계산되면 각 컴퓨팅 서버(20,30,40)는 자신의 매개 변수를 업데이트하고 그래디언트값을 매개 변수 서버(10)로 전송한다(S210).

매개 변수 서버(10)는 전송된 그래디언트값을 다른 컴퓨팅 서버로 전송하고(S220), 다른 컴퓨팅 서버는 수신한 그래디언트값에 기초하여 매개 변수를 업데이트한다(S230).

이와 같은 과정을 각 컴퓨팅 서버(20,30,40)는 자신이 가지고 있는 모든 배치 데이터들에 대해서 순차적으로 수행함으로써 학습 과정 즉, 그래디언트값에 의한 매개 변수를 업데이트할 수 있게 된다.

도 6의 실시예는 동시에 각 컴퓨팅 서버(20,30,40)에서 각각의 배치 데이터를 학습할 수 있기 때문에 도 5의 실시예에 비교하여 학습 속도가 빠르다는 장점이 있다. 다만, 모든 컴퓨팅 서버(20,30,40)의 모든 배치 데이터에 대해서 학습이 완료될 때까지 주고 받아야 할 그래디언트값의 총량은 동일하므로 네트워크 비용은 도 5의 경우와 동일하다.

한편, 도 2 내지 도 6에서 설명한 실시예들은 모두 그래디언트값이 매개 변수 서버(10)를 통해 컴퓨팅 서버(20,30,40) 사이에서 공유되고 이에 기초하여 매개 변수를 업데이트한다는 점을 특징으로 한다. 그러나, 이러한 그래디언트 전송 방식은 각각의 컴퓨팅 서버(20,30,40)에 구축된 신경망 모델이 모두 동일한 구조(architecture)를 가져야 한다는 한계가 있다. 따라서, 서로 다른 신경망 모델을 갖는 컴퓨팅 서버(20,30,40)의 경우에도 적용할 수 있는 학습 방법이 필요하다.

한편, 도 2 내지 도 6에서 설명한 그래디언트 전송 방식의 실시예의 경우에는, 네트워크 비용(cost)를 줄이기 위해서는 네트워크 상의 데이터의 송수신 횟수를 줄여야 한다. 이를 위해서는 각 컴퓨팅 서버(20,30,40)에서 어느 정도의 배치 데이터를 연산한 후 매개 변수 서버(10)와 통신하는 방법을 생각할 수 있다.

이 경우 그래디언트값의 통신은 의미가 없다. 왜냐하면, 그래디언트값은 현재의 신경망 모델의 매개 변수(parameter)에 영향을 받기 때문에 이미 독립적으로 매개 변수가 연산된 상태에서는 다른 컴퓨팅 서버의 모델 입장에서는 그래디언트값은 전혀 유용한 정보가 아니기 때문이다.

따라서, 이 경우에는 각 컴퓨팅 서버(20,30,40)에서 배치 데이터를 연산한 정보(즉, 그래디언트값)이 누적 반영되어 있는 매개 변수값 자체를 공유하는 것이 중요하다.

매개 변수를 공유하는 경우에는 각 컴퓨팅 서버(20,30,40)의 신경망 모델이 모두 같은 아키텍쳐를 가질 필요가 없기 때문에 이는 예컨대 앙상블-예측(ensemble-prediction)을 할 수 있는 매우 중요한 장점을 갖는다.

이러한 배경에 기초하여, 본 발명의 다른 실시예로서 매개 변수를 공유하는 방식에 대해서 설명한다.

도 7을 참조하면, 우선 각각의 컴퓨팅 서버(20,30,40)는 자신이 가지고 있는 배치 데이터들에 기초하여 순차적으로 학습 과정을 수행하면서 그래디언트값을 계산하고 이에 의해 매개 변수를 업데이트한다(S300).

그리고, 각 컴퓨팅 서버(20,30,40)는 업데이트된 매개 변수를 매개 변수 서버(10)로 전송한다(S310).

매개 변수 서버(10)는 수신된 매개 변수를 매개 변수를 전송한 컴퓨팅 서버 이외의 다른 컴퓨팅 서버 중 어느 하나로 전송한다(S320). 이 때, 매개 변수를 전송할 컴퓨팅 서버를 선택하는 것은 예컨대 다음과 같은 방식을 사용할 수 있다. 즉, 컴퓨팅 서버(20)로부터 수신된 매개 변수는 컴퓨팅 서버(30)로 전송하고, 컴퓨팅 서버(30)로부터 수신된 매개 변수는 컴퓨팅 서버(40)로 전송하는 방식과 같이 바로 옆의 인접한 컴퓨팅 서버로 매개 변수를 전달하는 방법을 사용할 수 있다.

다른 방법으로서 매개 변수 서버(10)가 각 컴퓨팅 서버(20,30,40)의 부하나 연산 진행 상황을 고려하여 매개 변수를 전송할 컴퓨팅 서버(20,30,40)를 선정할 수도 있다. 이 때 전술한 바와 같이 컴퓨팅 서버(20,30,40)에서 수신되는 상태 정보를 활용할 수 있다.

이와 같이 컴퓨팅 서버(20,30,40)가 다른 컴퓨팅 서버(20,30,40)의 매개 변수를 수신하면, 다시 단계(S300)으로 복귀하여 그래디언트값을 계산하고 이에 기초하여 매개 변수를 다시 업데이트하는 과정 즉, 학습 과정을 반복 수행한다.

이러한 방식은 매개 변수를 공유하기 때문에 전술한 바와 같이 컴퓨팅 서버(20,30,40)들이 서로 다른 아키텍쳐를 가져도 무방하다는 장점과 매개 변수를 전송하는 주기를 조절함으로써 네트워크 비용을 조정할 수 있다는 장점을 갖는다.

한편, 도 7의 실시예에서 각각의 컴퓨팅 서버(20,30,40)는 자신이 가지고 있는 배치 데이터를 일정량 학습한 후 매개 변수를 공유하지만 각 컴퓨팅 서버(20,30,40)에서 학습해야 할 배치 데이터들의 양(배치 연산 주기)을 동적으로 결정하도록 할 수도 있다.

즉, 각 컴퓨팅 서버(20,30,40)별로 연산 부하와 매개 변수 서버(10)와의 네트워크 부하를 고려하여 각 컴퓨팅 서버(20,30,40) 별로 최적화된 배치 연산 주기를 결정하는 방식을 사용할 수도 있다. 배치 연산 주기는 변화하는 이러한 부하 요소들을 고려하여 가변적으로 결정할 수 있는데 매개 변수 서버(10)가 상태 정보를 참조하여 결정하는 것이 바람직하다.

예컨대, 매개 변수 서버(10)와의 네트워크 비용(cost)가 큰 컴퓨팅 서버의 경우 네트워크 전송 횟수를 더 줄일 수 있도록 좀 더 많은 배치 데이터를 연산(즉, 배치 연산 주기를 길게)한 후 매개 변수를 업데이트하고 이를 매개 변수 서버(10)로 전송할 수 있다.

도 8에서 좌측의 컴퓨팅 서버의 그룹은 네트워크 상태가 상대적으로 좋고 우측의 컴퓨팅 서버의 그룹은 네트워크 상태가 상대적으로 좋지 않은 경우로서, 이러한 경우 좌측의 그룹은 도 5 및 도 6에서 설명한 그래디언트값 전송 방식, 우측의 그룹은 도 7에서 설명한 매개 변수 전송 방식을 사용하여 학습 과정을 수행하도록 할 수 있다.

또한, 이러한 컴퓨팅 서버의 그룹은 각각 복수개로 군집화하여 구성할 수도 있다.

또한, 매개 변수 서버(10)도 계층적으로 구성할 수 있는데, 각 컴퓨팅 서버의 그룹이 중앙의 매개 변수 서버와 네트워크 상태가 좋지 않은 경우 하나의 그룹을 관장하는 매개 변수 서버가 따로 존재하도록 하여 그 그룹에서 학습된 최종 결과를 중앙의 매개 변수 서버와 공유하도록 구성할 수도 있다.

이상 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시하였으나, 본 발명은 특정 실시예에 한정되는 것은 아니며 당업자라면 다양한 변경 및 수정이 가능할 것이다.

Claims

의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템으로서,

의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값 또는 그래디언트값에 의해 업데이트되는 매개 변수 중 어느 하나를 매개 변수 서버로 전송하는 적어도 하나 이상의 컴퓨팅 서버; 및

컴퓨팅 서버와 네트워크를 통해 연결되며, 컴퓨팅 서버 사이에서 그래디언트값 또는 매개 변수를 송수신하는 매개 변수 서버

를 포함하되,

상기 컴퓨팅 서버는, 매개 변수 서버로부터 수신되는 그래디언트값 또는 매개 변수에 기초하여 학습을 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제1항에 있어서,

상기 컴퓨팅 서버는, 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 매개 변수 서버로 전송하고,

상기 매개 변수 서버는 수신되는 그래디언트값을 다른 컴퓨팅 서버로 전송하고,

매개 변수 서버로부터 그래디언트값을 수신한 컴퓨팅 서버는 수신된 그래대언트값에 의해 매개 변수를 업데이트하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제2항에 있어서,

상기 컴퓨팅 서버는,

의료 데이터의 묶음으로 구성된 배치 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하는 컴퓨팅 유닛; 및

의료 데이터의 묶음으로 구성된 배치 데이터를 저장하는 데이터 저장부

를 포함하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제3항에 있어서,

상기 컴퓨팅 유닛은 계산된 그래디언트값을 매개 변수 서버로 전송하고,

매개 변수 서버로부터 다른 컴퓨팅 유닛에서 전송된 그래디언트값을 수신하여 매개 변수를 업데이트하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제4항에 있어서,

상기 컴퓨팅 유닛은 계산된 그래디언트값에 의해 매개 변수를 업데이트하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제5항에 있어서,

하나의 컴퓨팅 서버에서 배치 데이터에 대해서 그래디언트값을 구하고 이를 매개 변수 서버로 전송하고, 매개 변수 서버는 수신된 그래디언트값을 다른 컴퓨팅 서버로 전송하고, 다른 컴퓨팅 서버는 전송된 그래디언트값에 기초하여 매개 변수를 업데이트하는 과정을 모든 배치 데이터에 대해서 순차적으로 수행하되, 상기 과정을 모든 컴퓨팅 서버에 대해 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제5항에 있어서,

각각의 컴퓨팅 서버에서 병렬적으로 배치 데이터에 대해서 그래디언트값을 구하고 이를 매개 변수 서버로 전송하고, 매개 변수 서버는 수신된 그래디언트값을 다른 컴퓨팅 서버로 전송하고, 다른 컴퓨팅 서버는 전송된 그래디언트값에 기초하여 매개 변수를 업데이트하는 과정을 모든 배치 데이터에 대해서 순차적으로 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제1항에 있어서,

상기 컴퓨팅 서버는, 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 의해 매개 변수를 업데이트하고 업데이트된 매개 변수를 매개 변수 서버로 전송하고,

상기 매개 변수 서버는 수신되는 매개 변수를 다른 컴퓨팅 서버로 전송하고,

매개 변수 서버로부터 매개 변수를 수신한 컴퓨팅 서버는 수신된 매개 변수에 의해 학습 과정을 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제8항에 있어서,

상기 컴퓨팅 서버는,

의료 데이터의 묶음으로 구성된 배치 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 의해 매개 변수를 업데이트하는 컴퓨팅 유닛; 및

의료 데이터의 묶음으로 구성된 배치 데이터를 저장하는 데이터 저장부

를 포함하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제9항에 있어서,

상기 컴퓨팅 유닛은 업데이트된 매개 변수를 매개 변수 서버로 전송하고,

매개 변수 서버로부터 다른 컴퓨팅 유닛에서 전송된 매개 변수를 수신하여 학습 과정을 수행하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제8항에 있어서,

상기 매개 변수 서버는 수신되는 매개 변수를 매개 변수를 전송한 컴퓨팅 서버에 인접한 컴퓨팅 서버로 전송하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제8항에 있어서,

상기 매개 변수는 상태 정보에 기초하여 수신되는 매개 변수를 전송할 컴퓨팅 서버를 선정하여 전송하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제8항에 있어서,

상기 매개 변수 서버는 상태 정보를 고려하여 컴퓨팅 서버에서 학습할 배치 데이터의 양인 배치 연산 주기를 결정하고,

상기 컴퓨팅 서버는 상기 배치 연산 주기에 기초하여 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값을 계산하고 계산된 그래디언트값에 의해 매개 변수를 업데이트하고 업데이트된 매개 변수를 매개 변수 서버로 전송하는 것을 특징으로 하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템.
제1항 내지 제13항 중 어느 한 항에 의한 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 시스템에서 수행되는 분산 학습 방법으로서,

컴퓨팅 서버가 의료 데이터에 기초한 학습 과정을 수행하면서 인공 신경망의 에러 함수에 의한 그래디언트값 또는 그래디언트값에 의해 업데이트되는 매개 변수 중 어느 하나를 매개 변수 서버로 전송하는 제1 단계;

매개 변수 서버가 그래디언트값 또는 매개 변수를 수신하고 그래디언트값 또는 매개 변수를 전송한 컴퓨팅 서버 이외의 다른 컴퓨팅 서버로 전송하는 제2 단계; 및

컴퓨팅 서버가 매개 변수 서버로부터 수신되는 그래디언트값 또는 매개 변수에 기초하여 학습을 수행하는 제3 단계

를 포함하는 의료 데이터의 개인 정보 보호를 위한 인공 신경망의 분산 학습 방법.