KR20230104211A - 인공 지능 도구 개발에 사용되는 대상체 데이터에 대한 프라이버시 보호 컴퓨팅 - Google Patents

인공 지능 도구 개발에 사용되는 대상체 데이터에 대한 프라이버시 보호 컴퓨팅 Download PDF

Info

Publication number
KR20230104211A
KR20230104211A KR1020237018546A KR20237018546A KR20230104211A KR 20230104211 A KR20230104211 A KR 20230104211A KR 1020237018546 A KR1020237018546 A KR 1020237018546A KR 20237018546 A KR20237018546 A KR 20237018546A KR 20230104211 A KR20230104211 A KR 20230104211A
Authority
KR
South Korea
Prior art keywords
data
cloud server
treatment
versioned
production model
Prior art date
Application number
KR1020237018546A
Other languages
English (en)
Inventor
니아즈 아산 잘랄
아브데쓸렘 드리디
Original Assignee
제넨테크, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제넨테크, 인크. filed Critical 제넨테크, 인크.
Publication of KR20230104211A publication Critical patent/KR20230104211A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Abstract

본 개시는 인공 지능 도구의 훈련 및 배치와 같은 2차적 목적을 위해 대상체의 데이터를 사용하면서 대상체의 프라이버시를 보호하기 위한 프라이버시 보호 컴퓨팅 기술에 관한 것이다. 특히, 양태는 로컬 서버에서 제1 대상체에 관한 대상체 데이터를 수신하는 단계, 로컬 서버에 의해 대상체 데이터에 대한 비-식별화 작업, 익명화 작업, 또는 비-식별화 작업 및 익명화 작업을 수행하는 단계, 대상체 데이터를 원격 서버로 전송하는 단계, 처리 대상체 데이터로부터 부분적으로 도출된 파라미터를 포함하는 생산 모델을 원격 서버로부터 수신하는 단계, 로컬 서버에서, 제2 대상체에 관한 후속 데이터를 수신하는 단계, 로컬 서버에 의해, 후속 데이터를 생산 모델에 입력하여, 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 단계; 그리고 로컬 서버에 의해, 추론 또는 예측을 컴퓨팅 장치로 전송하는 단계에 관한 것이다.

Description

인공 지능 도구 개발에 사용되는 대상체 데이터에 대한 프라이버시 보호 컴퓨팅
우선권 주장
본 출원은 2020년 11월 10일에 출원된 미국 가출원 번호 제63/111,993호의 이익 및 우선권을 주장하며, 모든 목적을 위해 그 전문이 참조로 포함된다.
기술분야
본 개시는 디지털 및 개인화된 보건에 관한 것으로, 특히 인공 지능 도구의 훈련 및 배치와 같은 2차 목적을 위해 대상체의 데이터를 사용하면서 대상체의 프라이버시를 보호하기 위한 프라이버시-보호 컴퓨팅 기술에 관한 것이다.
클라우드 컴퓨팅, 데이터 병렬 클러스터 컴퓨팅 및 고성능 컴퓨팅을 포함하는 현대 컴퓨팅 패러다임은 광범위하게 이용 가능한 다양한 머신 러닝 및 딥 러닝 알고리즘 아키텍처와 결합되어, 방대한 배열의 인공 지능(AI) 기본 알고리즘을 적절하게 최적화할 수 있는 충분한 데이터를 사용할 수 있는 경우 거의 모든 산업에서 문제를 해결하기 위해 응용 프로그램을 개발할 수 있다. 이제 데이터에 대한 액세스가 AI 애플리케이션 개발의 주요 장벽이라는 것이 분명해졌다. 실제로 많은 산업에서, 강력하고 일반화 가능하며 편향되지 않은 AI를 만들기 위해 다양한 소스의 데이터를 사용해야 한다. 구체적인 문제는 일반적으로 데이터 소유자가 데이터를 공유할 수 없거나 공유하지 않거나 데이터가 통제권을 벗어나도록 허용하지 않는 경우가 많다는 것이다. 데이터에는 종종 매우 민감한 사적 및/또는 개인 데이터가 포함되어 있고 공유를 어렵거나 불가능하게 만드는 방식으로 규제될 수 있기 때문에 이는 이해할 수 있다. 이러한 과제는 특히 의료 AI 개발에서 극복하기 어렵다.
보건 AI에서 비용을 줄이면서 보건을 더욱 개인화하기 위해 데이터 기반 기술 솔루션이 개발되고 있다. 의료서비스 제공자는 의학적 예측을 결정하기 위해 대상체 데이터를 분석하는 프로세스를 자동화하고 능률화하기 위한 솔루션을 혁신하고 있다. 머신 러닝(ML) 기술은 질병 진단 및 예후와 같은 여러 의료 관련 예측 및 치료 효능 예측에 사용될 수 있다. 의료 데이터에는 일반적으로 데이터가 생성된 대상체에 대한 개인/식별 데이터가 포함되어 있기 때문에, 정부 규정(예: HIPAA(Health Insurance Portability and Accountability Act), "우수 사례" 품질 지침 및 규정(GxP) 및 일반 데이터 보호 규정(GDPR) 규정 준수는 의료 분석을 위해 머신 러닝을 고려하는 의료 제공자에게 고유한 문제가 된다. ML 모델 훈련에는 많은 양의 데이터가 포함될 수 있으므로, 효과적인 ML 모델 훈련을 위해 식별되지 않거나 익명화되는 충분한 양의 데이터에 액세스하기 어려울 수 있다. 따라서 보호되는 의료 정보의 기밀성, 가용성 및 무결성을 보장하면서 정확한 의료 예측을 제공하도록 구축된 규정 준수 소프트웨어 플랫폼의 발전이 필요하다.
다양한 실시예에서, 컴퓨터-구현 방법이 제공되며, 이는: 제1 대상체와 연관된 제1 컴퓨팅 장치로부터 제1 대상체에 관한 대상체 데이터를 수신하는 단계; 처리 대상체 데이터를 생성하기 위해 대상체 데이터에 대해 비-식별화 작업, 또는 익명화 작업, 또는 비-식별화 작업 및 익명화 작업을 수행하는 단계; 처리 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장하는 단계; 처리 대상체 데이터를 포함하는 데이터 배치를 원격 클라우드 서버에 전송하는 단계; 원격 클라우드 서버로부터 생산 모델을 수신하는 단계 - 생산 모델은 처리 대상체 데이터로부터 부분적으로 도출된 파라미터를 포함함; 제2 대상체와 관련된 제2 컴퓨팅 장치로부터 제2 대상체에 관한 후속 데이터를 수신하는 단계; 후속 데이터를 생산 모델에 입력하여 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 단계; 및 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 이들의 조합에 의해 수행되는 하나 이상의 동작에서 사용하기 위해 추론 또는 예측을 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 모두에 전송하는 단계를 포함한다.
일부 실시예에서, 로컬 클라우드 서버는 대상체와 동일한 지리적 영역에 물리적으로 위치한다.
일부 실시예에서, 동일한 지리적 영역은 동일한 국가이다.
일부 실시예에서, 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고, 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터이다.
일부 실시예에서, 동일한 지리적 영역은 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유한다.
일부 실시예에서, 비-식별화 작업, 익명화 작업, 또는 두가지 모두가 데이터 규정 세트에 기초하여 대상체 데이터의 개별적으로 식별가능한 건강 정보에 대해 수행된다.
일부 실시예에서, 제1 컴퓨팅 장치는 제2 컴퓨팅 장치와 동일하거나 상이한 장치이다.
일부 실시예에서, 제1 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합이다.
일부 실시예에서, 제2 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합이다.
일부 실시예에서, 제1 대상체는 제2 대상체와 동일하거나 상이한 대상체다.
일부 실시예에서, 처리 데이터 저장소는 원격 클라우드 서버에 액세스할 수 없다.
일부 실시예에서, 데이터 배치의 일부로서 처리 대상체 데이터를 원격 클라우드 서버에 전송하는 것은 처리 대상체 데이터를 전송하기 전에 처리 대상체 데이터의 삭제 요청을 로컬 클라우드 서버가 수신하지 않음에 응답하여 이루어진다.
일부 실시예에서, 이 방법은 대상체 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 모두를 수행하기 전에, 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 원시 데이터 저장소에 저장하는 단계; 상기 원격 클라우드 서버로부터 상기 대상체 데이터의 삭제 요청을 수신하는 단계; 및 상기 대상체 데이터 삭제 요청 수신에 응답하여, 원시 데이터 저장소에서 대상체 데이터를 삭제하는 단계를 더 포함한다.
일부 실시예에서, 처리 대상체 데이터는 처리 데이터 저장소에서 삭제되지 않는다.
일부 실시예에서, 데이터의 배치의 일부로서 처리 대상체 데이터를 전송하는 것은 주기적인 또는 확률적 타이밍에서 발생하여, 데이터 배치는 이전에 원격 클라우드 서버에 장치에 데이터를 전송한 이후에 캡처된 다수의 다른 대상체로부터의 데이터를 포함한다.
일부 실시예에서, 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 행정 작업의 자동화, 의료 절차 지원 또는 이들의 조합과 관련하여 생성된다.
일부 실시예에서, 하나 이상의 동작은 추론 또는 예측의 전달 또는 표시, 추론 또는 예측의 분석, 치료 또는 요법 제공, 치료 또는 요법 프로토콜 개시, 바이오마커 측정, 치료 또는 요법에 대한 알림 또는 리마인더, 보건 데이터 획득, 진단 또는 예후 보고, 이미지 분석, 치료 또는 요법에 관한 마케팅 제공, 의료 기기 또는 의료 절차 제어, 또는 이들의 조합을 포함한다.
일부 실시예에서, 이 방법은 추론 또는 예측을 포함하는 후속 데이터 배치를 원격 클라우드 서버로 전송하는 단계를 더 포함한다.
일부 실시예에서, 이 방법은 처리된 후속 데이터를 생성하기 위해 후속 데이터에 대해 비-식별화 동작, 익명화 동작, 또는 둘 모두를 수행하는 단계; 처리된 후속 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계; 및 처리된 후속 데이터를 포함하는 데이터 배치를 원격 클라우드 서버에 전송하는 단계를 포함한다.
일부 실시예에서, 이 방법은 처리된 출력 데이터를 생성하기 위해 추론 또는 예측에 대해 비-식별화 동작, 익명화 동작, 또는 둘 모두를 수행하는 단계; 처리된 출력 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계; 및 처리된 출력 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계를 포함한다.
일부 실시예에서, 이 방법은 하나 이상의 동작에서 추론 또는 예측을 수신하거나 추론 또는 예측을 사용하는 것에 응답하여 생성된 응답 데이터를 제2 컴퓨팅 장치, 제3 컴퓨팅 장치 또는 둘 모두로부터 로컬 클라우드 서버에서 수신하는 단계; 처리된 응답 데이터를 생성하기 위해 응답 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 모두를 수행하는 단계; 처리된 응답 데이터를 처리 데이터 저장소에 저장하는 단계; 및 처리된 응답 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계를 더 포함한다.
일부 실시예에서, 이 방법은 원격 클라우드 서버로부터 새로운 생산 모델을 수신하는 단계 - 새로운 생산 모델은 처리된 응답 데이터로부터 부분적으로 도출된 파라미터를 포함함; 및 생산 모델을 새로운 생산 모델로 교체하는 단계를 더 포함하며, 교체하는 단계는 로컬 클라우드 서버로부터 생산 모델을 삭제하는 것을 포함한다.
다양한 실시예에서, 컴퓨터-구현 방법이 제공되며, 이는: 로컬 클라우드 서버로부터 복수의 상이한 대상체와 연관된 처리 대상체 데이터를 수신하는 단계 - 상기 처리 대상체 데이터는 비-식별화, 익명화 또는 둘 모두로 처리되어 있음; 처리 대상체 데이터세트를 버전화된 데이터세트와 연관시키는 단계; 버전화된 데이터세트에 대한 만료 일자를 결정하는 단계; 원격 클라우드 서버에 액세스할 수 있는 버전 데이터 저장소에 버전화된 데이터세트를 저장하는 단계 - 버전화된 데이터세트는 만료 일자와 관련하여 저장됨; 버전화된 데이터세트를 사용하여 생산 모델을 훈련하는 단계; 버전화된 데이터세트와 버전화된 데이터세트로 훈련된 생산 모델 사이의 연관성을 버전화된 데이터 저장소에 저장하는 단계; 및 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 생산 모델을 로컬 클라우드 서버로 전송하는 단계를 포함한다.
일부 실시예에서, 로컬 클라우드 서버는 대상체와 동일한 지리적 영역에 물리적으로 위치한다.
일부 실시예에서, 동일한 지리적 영역은 동일한 국가이다.
일부 실시예에서, 처리 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고, 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터이다.
일부 실시예에서, 원격 클라우드 서버는 로컬 클라우드 서버와 동일하거나 상이한 지리적 영역에 물리적으로 위치한다.
일부 실시예에서, 동일하거나 상이한 지리적 영역은 동일하거나 상이한 국가이다.
일부 실시예에서, 버전 데이터 저장소는 로컬 클라우드 서버에 액세스할 수 없다.
일부 실시예에서, 동일한 지리적 영역은 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유한다.
일부 실시예에서, 처리 대상체 데이터의 개별적으로 식별가능한 건강 정보는 데이터 규정 세트에 기초하여 비-식별화, 익명화 또는 둘 모두로 처리되어 있다.
일부 실시예에서, 만료 일자는 버전화된 데이터세트의 생성 일자, 처리 대상체 데이터의 수신 일자, 처리 대상체 데이터세트와 관련된 사전 동의 양식의 만료, 또는 이들의 임의의 조합을 기반으로 결정된다.
일부 실시예에서, 이 방법은 원격 클라우드 서버에 액세스할 수 있는 버전화된 데이터 저장소에 생산 모델을 저장하는 단계; 및 만료 일자가 경과함에 따라 버전화된 데이터 저장소로부터 버전화된 데이터세트 및 생산 모델을 삭제 또는 제거하는 단계를 포함한다.
일부 실시예에서, 이 방법은 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트를 사용하여 다른 생산 모델을 훈련시키는 단계; 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트와 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트로 훈련된 다른 생산 모델 사이의 연관성을 버전화된 데이터 저장소에 저장하는 단계; 및 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 다른 생산 모델을 로컬 클라우드 서버로 전송하는 단계를 더 포함하며, 상기 다른 생산 모델은 생산 모델을 다른 생산 모델로 교체하라는 명령어와 함께 로컬 클라우드 서버로 전달된다.
일부 실시예에서, 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 행정 작업의 자동화, 의료 절차 지원, 또는 이들의 조합과 관련하여 생성된다.
본 개시의 일부 실시예는 하나 이상의 데이터 프로세서를 포함하는 시스템을 포함한다. 일부 실시예에서, 시스템은 하나 이상의 데이터 프로세서에서 실행될 때, 하나 이상의 데이터 프로세서로 하여금 여기서 개시되는 하나 이상의 방법의 일부 또는 전부 및/또는 하나 이상의 프로세스의 일부 또는 전부를 수행하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함한다. 본 개시의 일부 실시예는 비일시적 기계 판독 가능 저장 매체에 유형적으로 구현된 컴퓨터 프로그램 제품을 포함하며, 이는 하나 이상의 데이터 프로세서가 여기에서 개시되는 하나 이상의 방법의 일부 또는 전부 및/또는 하나 이상의 프로세스의 일부 또는 정부를 수행하도록 구성된 명령어를 포함한다.
사용된 용어 및 표현은 제한이 아닌 설명의 용어로 사용되었으며, 그러한 용어 및 표현의 사용에 있어서 도시 및 설명된 특징 또는 그 일부의 등가물을 배제하려는 의도는 없다. 청구된 발명의 범위 내에서 다양한 수정이 가능하다는 것이 인정된다. 따라서, 청구된 본 발명이 실시예 및 선택적인 특징에 의해 구체적으로 개시되었지만, 본 명세서에 개시된 개념의 수정 및 변형이 당업자에 의해 이루어질 수 있고, 그러한 수정 및 변형이 첨부된 청구범위에 의해 정의된 바와 같이 본 발명의 범위 내에 있어야 한다고 고려됨을 이해해야 한다.
본 개시는 첨부된 도면과 함께 설명된다:
도 1은 다양한 실시예에 따른 데이터 기반 기술 솔루션을 제공하기 위한 디지털 건강 플랫폼의 다이어그램을 도시한다.
도 2는 다양한 실시예에 따른 모델 시스템의 다이어그램을 도시한다.
도 3은 다양한 실시예에 따른 디지털 건강 플랫폼에서 프라이버시 보호 컴퓨팅을 위한 프로세스를 나타내는 스윔 레인 다이어그램을 도시한다.
도 4는 다양한 실시예에 따라 인공 지능 도구를 개발하기 위해 사용되는 대상체 데이터에 대해 로컬 클라우드 서버에 의해 수행되는 프라이버시 보호 컴퓨팅을 나타내는 흐름도를 도시한다. 그리고
도 5는 다양한 실시예에 따라 인공 지능 도구를 개발하는 데 사용되는 대상체 데이터에 대해 원격 클라우드 서버에 의해 수행되는 프라이버시 보호 컴퓨팅을 나타내는 흐름도를 도시한다.
첨부된 도면에서, 유사한 구성요소 및/또는 특징은 동일한 참조 라벨을 가질 수 있다. 또한 동일한 유형의 다양한 구성요소는 참조 레이블 뒤에 대시(-) 및 유사한 구성요소를 구분하는 제2 레이블을 사용하여 구분할 수 있다. 본 명세서에서 제1 참조 표지만을 사용하는 경우에는 제2 참조 표지와 상관없이 동일한 제1 참조 표지를 갖는 유사한 구성요소 중 어느 하나에 대하여도 그 기재를 적용할 수 있다.
I. 개요
본 개시내용은 인공 지능 도구의 훈련 및 배치와 같은 2차 목적을 위해 대상체의 데이터를 사용하면서 대상체의 프라이버시를 보호하기 위한 프라이버시 보호 컴퓨팅을 위한 기술을 설명한다. 보다 구체적으로, 본 개시의 실시예는 프라이버시 보호 방식으로 애플리케이션 및/또는 알고리즘 개발 및 배치를 용이하게 하는 디지털 및 개인화된 보건 플랫폼을 제공한다. 보건 산업의 문제를 해결하기 위해 AI 및 ML 모델(이하 간단히 모델이라고 함)이 개발되는 머신 러닝 및 알고리즘 아키텍처의 다양한 실시예가 본 명세서에 개시되어 있지만, 이러한 아키텍처 및 기술은 다른 유형의 시스템 및 설정으로 구현될 수 있음을 이해해야 한다. 예를 들어, 이러한 아키텍처와 기술은 데이터의 민감도(포함 여부에 관계없이 예를 들어 개인에 대한 영업 비밀 또는 개인 데이터) 보호를 담당하는 조직의 경계 외부에서 데이터 공유를 금지하는 많은 산업들의 모델 개발 과정에서 구현될 수 있다.
보건 데이터를 다룰 때 중요한 문제는 프라이버시 문제이다. 보건 데이터는 임상 데이터, 임상 시험 데이터, 게놈 데이터, 대상체 생성 데이터, 사물 인터넷(IoT) 데이터, 소셜 미디어 데이터, 레지스트리 데이터, 설문 조사 데이터, 의료 기기 데이터 등과 같은 다양한 형태로 제공된다. 보건 데이터에는 일반적으로 개별적으로 식별가능한 건강 정보를 포함하는 정부 규정(예: HIPAA, GxP 및 GDPR)이 적용되는 엔티티 중 하나에 의해 전송되거나 유지될 수 있는 정보인 피보호 건강 정보가 포함된다. 개별적으로 식별가능한 건강 정보에는 이름, 주소, 생년월일, 주민등록번호 등과 같이 대상체를 개인으로 식별할 수 있는 모든 정보가 포함된다. 또한 현재, 과거 또는 미래에 대상체의 신체적 또는 정신적 건강, 개인에 대한 보건 서비스 제공, 또는 환자에 대한 보건 서비스 제공에 대한 지불에 관한 정보와 관련된 모든 정보를 포함할 수 있다. 인공 지능 도구의 훈련 및 배포와 같은 보조 목적으로 보건 데이터를 수집, 공유 및 처리하는 것과 관련된 수많은 법적, 문화적, 기술적 문제가 있다. 예를 들어, 많은 국가에는 개인 대상체의 식별가능한 건강 정보를 다룰 때 준수해야 하는 엄격한 프라이버시 보호 법률 및 규정이 있다. 이로 인해 보건 데이터 수집, 공유 및 이러한 데이터 처리가 중요한 문제가 될 수 있다.
이러한 문제를 극복하기 위해, 프라이버시 보호 컴퓨팅을 위한 종래의 기술은 보건 데이터 및 관련 모델을 보호하는 데 집중한다. 이 조합은 입력 데이터 및 모델에 대한 제어, 계산 프로세스 및 결과의 무결성을 보장하고 신뢰가능하고 투명하게 감사 가능한 기술 구현(구조화된 투명성)을 제공하는 것을 목표로 한다. 이러한 시스템은 신원 또는 멤버십 추론/추적(개인이 주어진 데이터세트에 있는지 여부 결정) 및 기능/속성 재파생/재식별(예를 들어, 링크 공격에 의한, 데이터세트 내로부터의 개인의 특성 추출)과 같은 데이터세트에 대한 공격에 견디도록 구성된다. 또한 시스템은 알고리즘 또는 계산 프로세스에 대한 공격(예: 알고리즘 파라미터 수정(예: 포이즈닝)) 또는 데이터세트에 대한 정보 파생(모델 반전/재구성)을 견디도록 구성된다. 마지막으로, 시스템은 저장 시와 네트워크를 통한 전송 시 도난으로부터 데이터와 알고리즘을 보호하도록 구성된다(자산/무결성 보호).
수집, 훈련 및 배포를 수행하는 동안 보건 데이터를 보호하기 위한 전술한 기술에도 불구하고, 많은 조직은 출시 시간 증가, 비용 및 모델 개발의 복잡성 증가로 인해 보건 데이터를 모두 함께 사용하는 것을 피한다. 예를 들어, 모델 개발을 위해 프라이버시 보호 데이터를 보호하고 사용하는 데 필요한 단계를 완료하는 일정은 일반적인 연구 및 개발 투자 수익 기대치를 초과한다.
이러한 제한 및 문제를 해결하기 위해, 본 개시의 프라이버시 보호 컴퓨팅 기술은 로컬 서버와 원격 서버 사이에서 모델의 훈련 및 배포를 분할하는 최적화된 데이터 흐름을 활용한다. 로컬 서버는 데이터(예: 보건 데이터)의 출처 지역(예: 국가 또는 주) 내에 물리적으로 위치한 컴퓨팅 장치(예: 클라우드 서버)에 저장된다. 반면 원격 서버는 데이터의 출처 지역에 관계없이 유지된다. 경우에 따라 원격 서버는 로컬 서버와 동일한 지역에 있지만 서로 분리되어 있다. 다른 경우에는 원격 서버가 로컬 서버와 다른 지역에 있다. 로컬 서버는 데이터를 수신하고 프라이버시 보호 데이터를 생성하기 위해 데이터에 대한 비-식별화 및/또는 익명화 작업을 수행하도록 구성된다.
여기에서 사용된 "익명화"는 개인 식별 정보를 집계 데이터(aggregated data)로 변환하는 것과 같이, 데이터에서 개인 식별자를 영구적으로 그리고 완전하게 제거하는 행위이다. 익명화된 데이터는 어떤 방식으로도 더 이상 개인과 연관될 수 없는 데이터이다. 이 데이터에서 개인 식별 요소가 제거되면 해당 요소는 해당 데이터 또는 그 근본의 개인과 다시 연결될 수 없다. 반대로, 여기에서 사용된 "비-식별화"는 개인 프라이버시를 보호하기 위해 개인 식별 정보를 제거하는 행위이다. 비-식별화된 데이터는 반드시 익명화된 데이터일 필요는 없다. 즉, 비-식별화된 데이터의 경우, 개인 식별 정보는 나중에 데이터 또는 그 근본의 개인과 다시 연계될 수 있다. 그 후, 로컬 서버는 다운스트림 처리를 위해 프라이버시 보호 데이터를 포함하는 데이터 배치(batch)를 원격 서버로 전송하도록 추가로 적응된다.
원격 서버는 프라이버시 보호 데이터가 이제 버전 제어를 받도록 프라이버시 보호 데이터를 버전화된 데이터세트와 연관시키도록 적응된다. 원격 서버는 버전화된 데이터세트의 만료 일자를 결정하고, 만료 일자와 함께 버전화된 데이터세트를 데이터 저장소에 저장하도록 추가로 적응된다. 원격 서버는 버전화된 데이터세트를 사용하여 모델을 훈련하도록 추가로 조정된다. 모델은 하나 이상의 손실 함수를 최소화함에 기초하여 학습되거나 파생되는 파라미터를 포함한다. 원격 서버는 모델이 이제 버전화된 데이터세트와 연결되고 따라서 또한 버전 제어의 대상체가 되도록 버전화된 데이터세트와 모델 사이의 매핑을 생성하고 데이터 저장소에 저장하도록 추가로 적응된다. 원격 서버는 배포를 위해 모델을 로컬 서버로 보내도록 추가로 조정된다. 그 후, 모델은 데이터에 적용하기 위해 로컬 서버에서 구현될 수 있다(예: 보건 데이터 처리에 응답하여 분석 또는 예측 제공).
본 개시내용의 하나의 예시적인 실시예는 로컬 서버에 의해 수행되는 방법에 관한 것으로, 이는: 제1 대상체에 관한 대상체 데이터를 제1 대상체와 관련된 제1 컴퓨팅 장치로부터 수신하는 단계; 처리 대상체 데이터를 생성하기 위해 대상체 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 비-식별화 작업 및 익명화 작업을 수행하는 단계; 처리 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장하는 단계; 처리 대상체 데이터를 포함하는 데이터 배치(batch)를 원격 클라우드 서버에 전송하는 단계; 처리 대상체 데이터로부터 부분적으로 도출된 파라미터를 포함하는 생산 모델을 원격 클라우드 서버로부터 수신하는 단계; 제2 대상체와 관련된 제2 컴퓨팅 장치로부터 제2 대상체에 관한 후속 데이터를 수신하는 단계; 후속 데이터를 생산 모델에 입력하여 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 단계; 및 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 이들의 조합에 의해 수행되는 하나 이상의 연산에서 사용하기 위해 추론 또는 예측을 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 제2 컴퓨팅 장치 및 제3 컴퓨팅 장치에 전송하는 단계를 포함한다.
본 개시내용의 다른 예시적인 실시예는 원격 서버에 의해 수행되는 방법에 관한 것으로, 이는: 로컬 클라우드 서버로부터 복수의 상이한 대상체와 연관된 처리 대상체 데이터를 수신하는 단계 - 처리 대상체 데이터는 비-식별화, 익명화 또는 비-식별화 및 익명화됨; 처리 대상체 데이터세트를 버전화된 데이터세트와 연관시키는 단계; 버전화된 데이터세트에 대한 만료 일자를 결정하는 단계; 원격 클라우드 서버에 액세스할 수 있는 버전 데이터 저장소에 버전화된 데이터세트를 저장하는 단계 - 버전화된 데이터세트는 만료 일자와 연계하여 저장됨; 버전화된 데이터세트를 사용하여 생산 모델을 훈련하는 단계; 버전화된 데이터세트와 버전 데이터세트로 훈련된 생산 모델 사이의 연관성을 버전 데이터 저장소에 저장하는 단계; 및 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 생산 모델을 로컬 클라우드 서버로 전송하는 단계를 포함한다.
II. 디지털 건강 플랫폼
도 1은 다양한 실시예에 따라 데이터 기반 기술 솔루션을 제공하기 위한 디지털 건강 플랫폼(100)의 단순화된 도면을 도시한다. 예시된 실시예에서, 디지털 건강 플랫폼(100)은 네트워크 게이트웨이(120) 및 네트워크 메시(125)를 포함하는 네트워크(115)를 통해 클라우드 기반 인프라(110)에 연결된 클라이언트 컴퓨팅 장치(105)를 포함한다. 인프라(110)는 다양한 하드웨어 및 클라우드 인프라(예를 들어, 프라이빗 클라우드 또는 온-프레미스 클라우드 인프라 및 퍼블릭 클라우드 인프라)를 사용하여 클라우드 서비스 제공자(140)(예를 들어, 분산 컴퓨팅 환경)에 의해 배치 링(135) 내에 프로비저닝된 리소스를 사용하여 서비스 팟(130) 내에서 서비스 또는 소프트웨어 애플리케이션을 실행하도록 적응된다. 이러한 서비스 또는 소프트웨어 애플리케이션은 클라이언트 컴퓨팅 장치(105)의 사용자에게 AaaS 또는 SaaS 모델과 같은 웹 기반 또는 클라우드 서비스로 제공될 수 있다. 여러 제공자는 Amazon, Google 및 Oracle과 같은 클라우드 서비스를 제공한다. 클라우드 서비스라는 용어는 일반적으로 정부 규제 엔티티와 같은 서비스 제공자의 시스템(예: 인프라(110))에 의해 인터넷과 같은 통신 네트워크를 통해 주문형으로 사용자에게 제공되는 서비스를 지칭하는 데 사용된다. 따라서 소비자는 별도의 라이센스, 지원 또는 서비스를 지원하는 하드웨어 및 소프트웨어 리소스를 구매하지 않고도 서비스 공급자가 제공하는 클라우드 서비스를 이용할 수 있다. 예를 들어, 클라우드 서비스 제공자의 시스템은 하나 이상의 프로그램을 호스팅할 수 있으며, 사용자는 인터넷을 통해 주문형으로 하나 이상의 프로그램을 실행하기 위해 인프라 리소스를 구입하지 않고도 하나 이상의 프로그램을 사용할 수 있다. 클라우드 서비스는 애플리케이션, 리소스 및 서비스에 대한 쉽고 확장 가능한 액세스를 제공하도록 설계되었다.
일부 경우에, 클라이언트 컴퓨팅 장치(105)를 작동하는 사용자(예를 들어, 소프트웨어 또는 서비스 소비자)는 인프라(110)의 다양한 구성요소(145)에 의해 제공되는 소프트웨어 제품, 서비스 또는 시스템을 소비하기 위해 하나 이상의 클라이언트 애플리케이션을 활용한다. 예를 들어, 클라이언트 컴퓨팅 장치(105)를 작동하는 사용자(예를 들어, 개발자)는 인프라(110)의 다양한 구성요소(145)에 의해 제공될 소프트웨어 제품, 서비스 또는 시스템에 대한 소스 코드를 업로드하기 위해 하나 이상의 클라이언트 애플리케이션을 활용한다. 구성요소(145)는 하나 이상의 프로세서, 하드웨어 구성요소 또는 이들의 조합에 의해 실행될 수 있는 소프트웨어 구성요소를 포함한다. 디지털 건강 플랫폼(100)에 대해 예시된 것과 상이할 수 있는 다양한 상이한 시스템 구성이 가능하다는 것을 이해해야 한다. 따라서 도 1에 도시된 실시예는 디지털 건강 플랫폼을 구현하기 위한 분산 컴퓨팅 환경의 한 예이며 제한하려는 의도가 아니다.
클라이언트 컴퓨팅 장치(105)는 휴대용 핸드헬드 장치, 개인용 컴퓨터 및 랩탑과 같은 범용 컴퓨터, 워크스테이션 컴퓨터, 웨어러블 장치, 게임 시스템, 씬 클라이언트, 다양한 메시징 장치, 센서 또는 기타 감지 장치, 등과 같은 다양한 유형의 컴퓨팅 시스템을 포함한다. 이러한 컴퓨팅 장치는 다양한 모바일 운영 체제(예: Microsoft Windows Mobile®, iOS®, Windows Phone®, Android™, BlackBerry®, Palm OS®)을 포함한, 다양한 유형 및 버전의 소프트웨어 애플리케이션 및 운영 체제(예: Microsoft Windows®, Apple Macintosh®, UNIX® 또는 UNIX 유사 운영 체제, Linux 또는 Linux 유사 운영 체제, 가령, Google Chrome™ OS)를 실행할 수 있다. 휴대용 핸드헬드 장치에는 휴대폰, 스마트폰(예: iPhone®), 태블릿(예: iPad®), PDA(Personal Digital Assistants) 등을 포함할 수 있다. 웨어러블 장치에는 Fitbit VersaTM 스마트 워치, Magic Leap 1® 및 Oculus®와 같은 가상 현실(VR) 또는 증강 현실(AR) 시스템, 및 기타 장치가 포함될 수 있다. 게임 시스템에는 다양한 핸드헬드 게임 장치, 인터넷 지원 게임 장치(예: Kinect® 제스처 입력 장치가 있거나 없는 Microsoft Xbox® 게임 콘솔, Sony PlayStation® 시스템, Nintendo®에서 제공하는 다양한 게임 시스템, 등), 등이 포함될 수 있다. 클라이언트 장치(105)는 다양한 인터넷 관련 앱, 통신 애플리케이션(예를 들어, 이메일 애플리케이션, 단문 메시지 서비스(SMS) 애플리케이션)과 같은 다양한 상이한 애플리케이션을 실행할 수 있고, 다양한 통신 프로토콜을 사용할 수 있다.
네트워크(115)는, 제한 없이, TCP/IP(전송 제어 프로토콜/인터넷 프로토콜), SNA(시스템 네트워크 아키텍처), IPX(인터넷 패킷 교환), AppleTalk® 등을 포함한, 임의의 다양한 이용 가능한 프로토콜을 사용하여 데이터 통신을 지원할 수 있는, 당업자에게 친숙한 임의 유형의 네트워크이다. 단지 예로서, 네트워크(115)는 근거리 통신망(LAN), 이더넷 기반 네트워크, 토큰링, 광역 통신망(WAN), 인터넷, 가상 네트워크, 가상 사설망(VPN), 인트라넷, 엑스트라넷, PSTN(Public Switched Telephone Network), 적외선 네트워크, 무선 네트워크(예: IEEE(Institute of Electrical and Electronics) 1002.11 프로토콜 제품군에서 작동하는 네트워크, Bluetooth® 및/또는 기타 무선 프로토콜) 및/또는 이들 및/또는 기타 네트워크의 임의의 조합일 수 있다.
네트워크 게이트웨이(120)는 동일하거나 상이한 프로토콜에서 동작하는 둘 이상의 네트워크(115) 사이에 보안 통로를 형성하는 네트워크 노드이다. 네트워크 게이트웨이(120)는 들어오고 나가는 네트워크 트래픽을 모니터링하기 위한 방화벽, 사설 보안 통신 채널을 제공하기 위한 가상 사설망, 네트워크 내의 보안 결함을 식별하기 위한 보안 스캐닝, 인증 및 권한 부여 서비스 등을 위한 액세스 관리자, 등의 기술 중 하나 이상을 이용하여 네트워크 보안을 제공할 수 있다. 네트워크 게이트웨이(120)는 다양한 소프트웨어 제품, 서비스 또는 시스템에 대한 액세스를 관리하는 서비스 커넥터 및 라우터를 사용하여(예를 들어, 서비스 가입 비즈니스 모델을 사용하여) 네트워크 트래픽을 라우팅한다. 네트워크 메시(125)는 인프라(110)(예를 들어, 브리지, 스위치 및 기타 인프라 장치)가 가능한 한 많은 다른 노드에 직접, 동적으로 및 비계층적으로 연결하고 서로 협력하여 장치와 노드들 간에 데이터를 효율적으로 라우팅하는 로컬 네트워크 토폴로지이다. 네트워크 메시(125)는 로드 밸런싱, 제품, 서비스 또는 시스템 발견, 네트워크 액세스, 라우팅 및 피어링, 트래픽 미러링 등의 기술 중 하나 이상을 사용하여 연결을 관리한다. 네트워크(115), 네트워크 게이트웨이(120) 및 네트워크 메시(125)는 서로 결합하여 인프라(110)로부터 유입 또는 유출되는 모든 데이터를 관리한다.
구성요소(145)는 하나 이상의 범용 컴퓨터, 특수 서버 컴퓨터(예를 들어, PC(퍼스널 컴퓨터) 서버, 애플리케이션 전용 서버, 중급 서버, 메인프레임 컴퓨터, 랙 장착형 서버 등을 포함함), 서버 팜, 서버 클러스터, 또는 네트워크(115)를 통해 클라이언트 컴퓨팅 장치(105)에 리소스, 데이터, 서비스 또는 프로그램을 제공하기 위해 개별적으로 또는 조합하여 작동하는 임의의 다른 적절한 배열 및/또는 조합의 컴퓨터 또는 시스템을 포함한다. 구성요소(145)는 가상 운영 체제, 또는 가상 저장 장치를 유지하기 위해 가상화될 수 있는 논리적 저장 장치의 하나 이상의 유연한 풀과 같은 가상화를 수반하는 다른 컴퓨팅 아키텍처를 실행하는 하나 이상의 가상 머신을 더 포함할 수 있다. 다양한 실시예에서, 구성요소(145)는 본 개시 내용에 설명된 기능을 제공하는 하나 이상의 서비스 또는 소프트웨어 애플리케이션을 실행하도록 적응된다.
구성요소(145)는 또한 하나 이상의 데이터 리포지토리(data repositories)를 포함한다. 이러한 데이터 리포지토리는 다양한 실시예에서 데이터 및 기타 정보를 저장하는 데 사용될 수 있다. 예를 들어, 하나 이상의 데이터 리포지토리는 SAMD(Software as a Medical Device)와 같은 데이터 기반 기술 솔루션을 제공하기 위한 정보를 저장하고, 데이터 기반 기술 솔루션을 구현하기 위한 소스 코드의 검증 및 배포를 위한 정보를 저장하는 데 사용될 수 있다. 데이터 리포지토리는 다양한 위치에 상주할 수 있다. 예를 들어, 구성요소에 의해 사용되는 데이터 리포지토리는 구성요소에 로컬이거나, 구성요소에서 멀리 떨어져 네트워크 기반 또는 전용 연결을 통해 구성요소와 통신할 수 있다. 데이터 리포지토리들이 서로 상이한 유형일 수 있다. 특정 실시예에서, 구성요소에 의해 사용되는 데이터 리포지토리는 데이터베이스, 예를 들어 중앙 데이터베이스, 분산 데이터베이스, NoSQL 데이터베이스, 관계형 데이터베이스 등일 수 있다. 이러한 데이터베이스 중 하나 이상은 SQL 형식 명령에 대한 응답으로 데이터베이스에서 데이터를 저장, 업데이트 및 불러오도록 조정될 수 있다. 특정 실시예에서, 하나 이상의 데이터 리포지토리는 또한 애플리케이션 데이터를 저장하기 위해 애플리케이션에 의해 사용될 수 있다. 응용 프로그램에서 사용하는 데이터 리포지토리는 예를 들어 키-값 저장 리포지토리, 개체 저장 리포지토리 또는 파일 시스템에서 지원하는 일반 저장 리포지토리와 같은, 상이한 유형의 것일 수 있다.
구성요소(145)는 또한 본 개시에서 기술되는 기능을 제공하는 서비스 또는 소프트웨어 애플리케이션(예를 들어, 웹 기반 또는 클라우드 서비스로 제공되는 서비스 또는 소프트웨어 애플리케이션, 또는 지속적 통합 및 지속적 배포(CICD) 시스템을 구현하기 위한 애플리케이션)과 같은 하나 이상의 프로그램을 실행하도록 구성된 컴퓨팅 노드를 포함한다. 각 노드는 노드 클러스터 내에서 선택적으로 구현되는 단일 시스템을 나타낸다. 단일 머신은 물리적 머신(예: 데이터 센터의 서버)이거나, 사용할 수 있는 일련의 CPU 및 RAM 리소스 세트를 가진 Amazon Web ServicesTM(AWS)와 같은 클라우드 제공자에서 호스팅되는 가상 머신일 수 있다. 클러스터에서, 노드는 리소스를 함께 풀링하여 보다 강력한 시스템을 형성한다. 하나 이상의 프로그램이 클러스터에 배포되면, 클러스터는 개별 노드에 대한 분산 작업을 지능적으로 처리한다. 노드가 추가되거나 제거되면, 클러스터는 필요에 따라 작업을 이동할 수 있다. 어떤 개별 머신이 실제로 코드를 실행하고 있는지는 하나 이상의 프로그램 또는 인프라(110)에 중요하지 않다.
하나 이상의 클러스터에 배포되는 하나 이상의 프로그램은 컨테이너로 패키징된다. 컨테이너는 널리 받아들여지는 표준이며, 인프라(110)에 하나 이상의 프로그램을 배포하기 위해 다양한 이미지가 정의될 수 있다. 컨테이너화는 인프라(110)가 자체 포함된 실행 환경을 생성할 수 있도록 한다. 임의의 프로그램과 그 모든 종속성을 단일 파일로 묶은 다음, 인프라(110)에서 공유할 수 있다. 컨테이너 생성은 프로그램방식으로 이루어져서, 강력한 완전 자동화 CI/CD 파이프라인을 코드 검증에 사용할 수 있고, 인프라(110) 상의 코드 배포에 사용할 수 있다. 컨테이너는 팟(pod)(130)으로 알려진 상위 레벨 구조로 래핑된다. 동일한 팟(130)의 컨테이너는 동일한 리소스 및 로컬 네트워크를 공유할 수 있다. 일부 경우에, 컨테이너는 다른 컨테이너로부터 어느 정도의 격리를 유지하면서 동일한 머신에 있는 것처럼 동일한 팟(130)의 다른 컨테이너와 통신할 수 있다. 팟(130)은 인프라(110)에서 복제 단위로 사용된다. 프로그램 또는 리소스가 처리로 압도되고 단일 팟(130) 인스턴스가 로드(load)를 지닐 수 없는 경우, 인프라(110)는 필요에 따라 클러스터에 팟(130)의 새로운 복제본을 배포하도록 구성될 수 있다. 과부하 상태가 아닐 때에도, 로드 밸런싱 및 장애 저항을 허용하기 위해 생산 시스템에서 언제든지 실행 중인 팟(130)의 여러 복사본을 갖는 것이 유리할 수 있다. 팟(130)의 하나 이상의 인스턴스가 하나 이상의 클라우드 서비스 제공자(140)에 의해 제공되는 클라우드 인프라 시스템 상에 프로비저닝된다.
하나 이상의 클라우드 서비스 제공자(140)에 의해 제공되는 클라우드 인프라 시스템은 인프라(110)에 의해 제공되는 다양한 클라우드 서비스를 지원하는 팟(130)의 하나 이상의 인스턴스의 제공을 용이하게 하기 위해 활용되는 인프라 리소스를 포함한다. 팟(130)의 하나 이상의 인스턴스를 프로비저닝하기 위한 이러한 리소스의 효율적 활용을 돕기 위해, 리소스는 리소스 세트 또는 리소스 모듈 세트("배치 링(135)"이라고도 함)로 묶일 수 있다. 각각의 리소스 모듈 또는 배치 링(135)은 하나 이상의 유형의 리소스들의 미리 통합된, 그리고 최적화된 조합을 포함할 수 있다. 특정 예에서, 상이한 배치 링(135)은 상이한 유형의 클라우드 서비스에 대해 미리 프로비저닝될 수 있다. 예를 들어, 배치 링(135)의 제1 세트가 SAMD 서비스를 위해 프로비저닝될 수 있고, 배치 링(135)의 제1 세트의 배치 링(135)과 상이한 리소스 조합을 포함할 수 있는 배치 링(135)의 제2 세트가 데이터 분석 서비스를 위해 프로비저닝될 수 있으며, 등등이다. 일부 클라우드 서비스의 경우, 서비스 프로비저닝을 위해 할당된 리소스를 서비스 간에 공유할 수 있다.
디지털 건강 플랫폼(100)은 하나 이상의 커널(150)을 더 포함한다. 커널(150)은 하나 이상의 클라우드 서비스 제공자(140)가 제공하는 각각의 클라우드 인프라 시스템에서 실행되도록 적응된다. 커널(150)은 리소스 할당 및 전체 디지털 건강 플랫폼(100)에 걸친 분산된 애플리케이션 또는 프레임워크에 걸친 격리를 제공하는 클러스터 관리자다. 커널(150)은 리소스 관리 및 스케줄링을 포함한, 서비스 및 소프트웨어의 오케스트레이션을 위한 애플리케이션 프로그래밍 인터페이스(API)를 하나 이상의 프로그램에 제공한다. 커널(150)의 아키텍처는 작업을 실행하기 위한 에이전트 노드, 작업을 에이전트 노드로 전송하기 위한 마스터 노드, 선정 및 마스터 노드의 주소 조회를 위한 주키퍼(zookeeper), 그리고 마스터 노드와 협력하여 에이전트 노드에 대한 작업을 예약하기 위한 프레임워크를 포함한다.
디지털 건강 플랫폼(100)은 CI/CD 시스템(155)을 더 포함한다. CI/CD 시스템(155)은 클라우드 인프라 시스템 내에서 구현되며, 디지털 건강 플랫폼(100)이 소프트웨어 제품, 서비스 또는 시스템에 대한 소스 코드 내의 변경 사항을 자주 업데이트, 테스트 및 전달할 수 있게 한다. 여기에서 자세히 논의한 바와 같이 보건 분야에서, 소프트웨어가 준수해야 하는 데이터 보안(예: 데이터 무결성 및 데이터 프라이버시)에 관한 정부 규정이 있다. CI/CD 시스템(155)에서, 이러한 정책 규정은 코드에 포함될 수 있어, 적합성을 자동으로 추적, 검증 및 재구성할 수 있다. SAMD의 예에서, 데이터 저장 위치, 서버 액세스 제어, 및 활동 로깅이 소스 코드에 포함될 수 있으므로, 소프트웨어를 사용하는 동안 사용자 데이터를 보호하고 관리할 수 있다. 지속적인 통합 중에 암호화 및 패스워드 보호 작업을 추가로 포함할 수 있다. 지속적 전달 중에, 보안 및 모니터링 도구를 사용하여 사용자 활동을 추적하고 보안 위협으로 이어질 수 있는 오류를 감지할 수 있다.
CI/CD 시스템(155)은 또한 모델 프로비저닝에 사용될 수 있다. 모델은 처음에는 데이터세트를 사용하여 훈련되지만 시간이 지남에 따라 모델이 드리프트되거나 데이터가 변경되어 업데이트된 모델이 필요하다. 모델이 소프트웨어 애플리케이션 내에서 실행되는 경우, 소프트웨어 애플리케이션과 연결된 코드에는 모델을 재훈련해야 하는 시기에 대한 트리거가 포함될 수 있다. 예를 들어, 코드는 새로운 훈련 데이터를 사용할 수 있을 때 또는 모델의 성능이 임계값 아래로 떨어지는 것으로 결정될 때, 미리 정의된 시간 간격으로 모델을 재훈련하라는 명령을 포함할 수 있다. 또한 소프트웨어 개발자는 생산 환경에서 모델의 성능을 모니터링함에 기초하여, 또는, 모델 최적화를 위한 예상 개선 사항에 기초하여, 테스트 환경에서 모델 아키텍처 및 하이퍼파라미터의 변형을 탐색할 수 있다. CI/CD 시스템(155)은 모델이 성능 요구 사항을 충족하는 것으로 결정될 때 용이한 구축, 테스트 및 생산 환경으로의 배포를 허용한다.
III. 모델 시스템
도 2는 다양한 실시예에 따른 프라이버시 보호 컴퓨팅을 위한 모델 시스템(200)(도 1과 관련하여 설명된 인프라(110)의 다양한 구성요소(145) 포함)의 단순화된 다이어그램을 도시한다. 예시된 실시예에서, 모델 시스템(200)은 사용자(205)(예를 들어, 대상체 및/또는 조작자), 다양한 장치(210)(예를 들어, 개인용 컴퓨터, 의료 장치, IoT 장치 등), 로컬 서버(215) 및 원격 서버를 포함한다. 로컬 서버(215) 및 원격 서버(220)는 도 1과 관련하여 설명된 인프라(110)의 구성요소의 다양한 확장 가능 인스턴스를 나타낸다. 로컬 서버(215)는 데이터(예: 보건 데이터)의 출처 지역(예: 국가 또는 주) 내에 유지된다. 반면, 원격 서버(220)는 데이터의 출처 지역에 관계없이 어디에나 유지된다. 일부 경우에, 원격 서버(220)는 로컬 서버(215)와 동일한 영역에 위치한다(그러나 서로 분리됨). 다른 경우에, 원격 서버(220)는 로컬 서버(215)와 상이한 영역에 위치한다. 로컬 서버(215) 및 원격 서버(220) 각각의 단일 인스턴스만이 도시되어 있지만, 다수의 인스턴스가 디지털 건강 플랫폼 내에서 구현될 수 있고 각각의 로컬 서버(215) 및 원격 서버가 도 2에 도시된 자체 구성요소 세트를 가질 것임을 이해해야 한다.
다양한 장치(210)는 사용자(205)에 의해 능동적으로 또는 수동적으로 작동될 수 있고, 그렇게 함으로써 데이터를 생성 및/또는 수집할 수 있다(예를 들어, 보건 데이터가 모바일 장치에서 실행되는 SAMD 애플리케이션으로부터 생성 및/또는 수집될 수 있고, 또는 보건 데이터가 대상체에게 이식된 신경조절 장치로부터 생성 및/또는 수집될 수 있다). 일부 경우에, 장치(210) 상의 하나 이상의 애플리케이션과 연관된 소프트웨어 개발 키트는 데이터를 보안 통신을 통해 로컬 서버(215)로 전송하기 전에 하나 이상의 애플리케이션에 의해 생성된 데이터의 수집 및 처리를 허용하도록 적응된다. 예를 들어 소프트웨어 개발 키트는 데이터 수집 및 비-식별화를 허용하는 일련의 도구를 제공할 수 있다. 다른 경우에, 장치(210) 또는 장치(210) 상의 하나 이상의 애플리케이션으로부터 생성된 원시 데이터는 사전 수집 및/또는 처리(예를 들어, 비-식별화) 없이 보안 통신을 통해 로컬 서버(215)로 전송된다.
장치(210)는 분산 컴퓨팅 환경 커넥터 및 DNS를 통해 디지털 건강 플랫폼과 안전하게 통신(즉, 도청 또는 가로채기에 민감하지 않은 방식으로 통신)할 수 있다. DNS는 IP 주소 및 기타 데이터를 저장하는, 그리고 IP 주소로 호출을 전달하기 위해 IP 주소를 이름으로 조회할 수 있는, 계층적 분산 데이터베이스이다. 예를 들어, 디지털 건강 플랫폼에 의해 장치(210)로부터 데이터 전송을 위한 보안 통신이 수신되면, 분산 컴퓨팅 환경 커넥터는 데이터를 처리할 수 있는 로컬 서버(215)의 인스턴스를 식별하고, 데이터를 처리할 수 있는 로컬 서버(215)의 인스턴스의 식별자 및 이러한 보안 통신을 DNS에 전달하며, DNS는 로컬 서버(215)의 인스턴스와 관련된 IP 주소 및 기타 데이터를 조회하고, 보안 통신을 로컬 서버(215)의 인스턴스와 관련된 게이트웨이(예: 도 1과 관련하여 설명된 게이트웨이(120))의 게이트웨이 엔드 포인트에 이러한 보안 통신을 전달한다.
게이트웨이 엔드 포인트에 연결되면, 장치(210)는 로컬 서버(215)와 보안 통신에 관여하고, 저장 및 처리를 위해 데이터를 전송할 수 있다. 어떤 경우에는 신원 인식을 사용하여, 로컬 서버(215)와의 통신 및 데이터 트래픽을 모니터링할 수 있다. 이를 통해, 로컬 서버(215)가 신원에 기초하여 액세스를 시행하고 데이터를 감사할 수 있다. 신원 인식은 신원 정책에 따라 데이터 전송 및 액세스를 허용하거나 거부할 수 있도록 사용자 및 장치 식별자를 매핑한다.
로컬 서버(215)는 로컬 서버에 의해 제공되는 하나 이상의 동작 또는 서비스의 일부로서 데이터를 비-식별화, 익명화, 저장 및/또는 처리하도록 구성된 데이터 프로세서(225)를 포함한다. 로컬 서버(215)에 의해 수신된 데이터는 수신된 데이터의 유형과, 데이터의 저장을 관리하는 하나 이상의 정책 또는 규칙(예를 들어, 데이터 규정 세트)에 따라 저장될 수 있다. 예를 들어 스트리밍 데이터는 비-식별화되어 원시 데이터 저장소에 저장될 수 있는 반면, 배치(batch) 및 처리된 데이터는 익명화되어 처리 데이터 저장소에 저장될 수 있다. 유사하게, 로컬 서버(215)에 의해 수신된 데이터는 수신된 데이터의 유형 및 데이터 처리를 관리하는 하나 이상의 정책 또는 규칙(예를 들어, 데이터 규정 세트)에 따라 처리될 수 있다. 예를 들어, 스트리밍 데이터는 스트리밍 프로그램(예를 들어, DAG 파이프라인)에 관한 하나 이상의 동작에 따라 비-식별화 및 처리될 수 있고, SAMD 배치 데이터는 SAMD 프로그램에 관한 하나 이상의 동작에 따라 익명화 및 처리될 수 있다(예: AI 또는 ML 모델 수집을 위한 의료 이미지 표준화 및 개인 식별자의 비-식별화).
비-식별화는 직접 및 알려진 간접 개인 식별자와 실세계 신원(개인 식별 정보) 간의 연결을 끊기 위해 제거 또는 조작하는 하나 이상의 동작을 포함한다. 하나 이상의 동작은 가역적이며, 따라서 데이터를 재식별할 수 있다. 익명화에는 개인 식별 정보를 제거하거나 조작하기 위한 하나 이상의 동작이 포함되며, 이로 인해 실제 신원과 다시 연결할 수 없는 익명 데이터가 생성된다. 익명화를 위한 하나 이상의 동작은 데이터 마스킹, 가명화(pseudonymization), 일반화, 데이터 스와핑, 데이터 섭동, 합성 데이터 또는 이들의 조합을 포함한다. 데이터 마스킹은 변경된 값으로 데이터를 숨기는 기술이다. 예를 들어, 데이터 내의 하나의 값 문자(a value character)가 "*" 또는 "x"와 같은 기호로 대체될 수 있다. 가명화는 개인 식별자를 가짜 식별자 또는 가명으로 대체하는 데이터 관리 및 비-식별화 기술이다. 예를 들어 식별자 "Bob Crown"을 "John Duke"로 대체한다. 일반화는 데이터의 일부를 제거하거나 데이터의 일부를 공통 값으로 대체하는 기술이다. 예를 들어 일반화를 사용하여 모든 주민등록번호 또는 의료보험 번호의 세그먼트를 제거하거나 동일한 번호 순서로 대체할 수 있다. 데이터 스와핑(셔플링 및 순열이라고도 함)은 원래 레코드와 일치하지 않도록 데이터세트 속성 값을 재정렬하는 데 사용되는 기술이다. 데이터 섭동은 숫자를 반올림하고 임의 노이즈를 추가하는 기술을 적용하여 원본 데이터세트를 약간 수정하는 기술이다. 합성 데이터는 실제 사건과 관련 없는 정보를 알고리즘적으로 제조하는 기술이다. 합성 데이터는 원래 데이터세트를 변경하거나 그대로 사용하면서 프라이버시 및 보안을 위험에 빠뜨리는 대신, 인공 데이터세트를 만드는 데 사용된다.
데이터 프로세서(225)는 또한 데이터를 분할하고 유사한 데이터를 갖는 데이터 파티션에 데이터를 저장하도록 적응된다. 데이터는 장치 ID, 원산지 국가, 원산지 보건 시스템, 등과 관련된 서비스/애플리케이션/SAMD에 의해 함께 저장될 수 있다. 데이터 프로세서(225)는 원격 서버(220)의 인스턴스와 연관된 게이트웨이(예를 들어, 도 1과 관련하여 설명된 게이트웨이(120))의 게이트웨이 엔드 포인트와 안전하게 통신할 수 있다. 일단 게이트웨이 엔드 포인트에 연결되면, 로컬 서버(215)는 원격 서버(220)와 보안 통신에 참여할 수 있고, 애플리케이션 프로그래밍 인터페이스를 통해 추출, 변환, 로드 기술을 사용하여 추가 처리를 위해 데이터를 전송할 수 있다. 원격 서버(220)에 의해 수신된 데이터는 하나 이상의 데이터 저장소(예를 들어, 원격 서버(220)에 로컬 또는 원격인 데이터 레이크 또는 리포지토리)에 저장된다.
원격 서버(220)는 하나 이상의 알고리즘 및/또는 모델(235)을 훈련하고 생산 모델(245)의 지식 베이스(240)를 생성하도록 적응된 훈련 AI 엔진(230)을 포함한다. 훈련 AI 엔진(230)은 알고리즘 및/또는 모델(235)을 통해 하나 이상의 데이터 저장소에 저장된 데이터를 실행하도록 적응될 수 있다. 일부 실시예에서, 실행은 알고리즘 및/또는 모델(235)의 하나 이상의 로컬 인스턴스를 생성하는 것, 데이터를 하나 이상의 훈련 데이터 세트 및 하나 이상의 테스트 데이터 세트로 분할하는 것, 생산 모델(245)을 생성하기 위해 훈련 데이터세트에 대한 알고리즘 및/또는 모델(235)의 하나 이상의 로컬 인스턴스를 훈련하는 것, 선택적으로 알고리즘 및/또는 모델(235)의 하나 이상의 로컬 인스턴스 각각의 훈련으로부터의 결과를 완전 연합 생산 모델(245)에 통합하는 것, 생산 모델(245)을 통해 하나 이상의 테스트 데이터세트를 실행하는 것, 그리고 하나 이상의 테스트 데이터 세트의 실행에 기초하여 생산 모델(245)의 성능을 연산하는 것을 포함하는 훈련 워크플로를 실행하는 것을 포함한다. 일부 실시예에서, 실행은 데이터를 하나 이상의 검증 데이터세트로 분할, 결합 및/또는 변환하는 것, 생산 모델(245)을 통해 하나 이상의 검증 데이터세트를 실행하는 것, 및 하나 이상의 검증 데이터세트의 실행에 기초하여 생산 모델(245)의 성능을 컴퓨팅하는 것을 포함하는 검증 워크플로의 실행을 포함한다.
일단 생산 모델(245)이 훈련 및/또는 검증되면, 생산 모델(245)은 지식 베이스(240)에 저장되고, 장치(210)에 의해 전달된 데이터의 런타임 분석을 위해 로컬 서버(215)에 배치될 수 있다(즉, 생성된 데이터 및/또는 생산 모델의 훈련에 사용되지 않은 장치(210)에 의해 수집 및 전송된 데이터 - 설명의 단순화를 위해 이 데이터는 본 명세서에서 후속 데이터로 지칭됨). 로컬 서버에 생산 모델(245)을 배치하는 것은 배치 스케줄, 규칙 또는 정책 기반 또는 일부 다른 유사한 배치 수단을 통해 구현될 수 있다. 배치되면, 생산 모델(245)은 생산 모델(245)의 사용을 포함하는 서비스 또는 소프트웨어 애플리케이션을 오케스트레이션하도록 적응된 런타임 AI 엔진(250)을 통해 저장 및 구현된다. 이러한 서비스 또는 소프트웨어 애플리케이션은 AssS 또는 SaaS 모델과 같은 웹 기반 또는 클라우드 서비스로 클라이언트 컴퓨팅 장치의 사용자에게 제공될 수 있다.
서비스 또는 소프트웨어 애플리케이션의 일부로서, 생산 모델(245)은 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하기 위해 런타임 AI 엔진(250)에 의해 사용된다. 추론은 데이터 생성 프로세스에 대해 학습하기 위해 생산 모델(245)을 사용하는 것을 의미하고(예를 들어, 대상체의 질병 상태가 종양의 크기 및 위치에 의해 어떻게 영향을 받는지 추론); 반면, 예측은 생산 모델(245)을 사용하여 새로운 데이터 포인트에 대한 결과를 예측하는 것(예를 들어, 현재 바이탈 및 호흡기 설정으로부터 부분적인 산소 값을 예측)을 의미한다. 그 후, 장치(210)에 의해 수행되는 하나 이상의 동작에서 사용하기 위해 추론 또는 예측이 장치(210)로 전달된다. 하나 이상의 동작은 장치(210)에 대한 추론 또는 예측의 저장 또는 디스플레이만큼 간단할 수도 있고, 장치(210)의 하나 이상의 파라미터를 제어하는 데 사용(예를 들어, 호흡보호구의 파라미터를 제어하기 위해 예측된 부분 산소 값을 사용)하거나 진단 및 진단에 기초한 치료의 권장 또는 관리에 사용하는 것과 같은 보다 복잡한 동작일 수 있다.
IV. 디지털 건강 플랫폼에 서비스를 배포하는 기술
도 3-5는 대상체의 데이터를 인공 지능 도구의 훈련 및 배포와 같은 2차 목적으로 사용하면서 대상체의 개인 정보를 보호하기 위한 프라이버시 보호 컴퓨팅의 프로세스 및 작업을 보여준다. 개별 실시예는 순서도, 흐름도, 데이터 흐름도, 구조도 또는 블록도로서 묘사되는 프로세스로서 기술될 수 있다. 순서도는 동작들을 순차적 프로세스로 설명할 수 있지만, 동작들 중 다수가 병렬로 또는 동시에 수행될 수 있다. 또한 동작 순서를 다시 정렬할 수 있다. 동작이 완료되면 프로세스가 종료되지만 도면에 포함되지 않은 추가 단계가 있을 수 있다. 프로세스는 방법, 함수, 절차, 서브루틴, 서브프로그램 등에 해당할 수 있다. 프로세스가 함수에 해당하는 경우, 프로세스 종료는 호출 함수 또는 메인 함수로의 함수 복귀에 해당할 수 있다.
도 3-5에 도시된 프로세스 및/또는 동작은 하나 이상의 처리 장치(예: 프로세서 코어), 하드웨어 또는 이들의 조합에 의해 실행되는 소프트웨어(예: 코드, 명령어, 프로그램)로 구현될 수 있다. 소프트웨어는 메모리(예를 들어, 메모리 장치, 비일시적 컴퓨터 판독 가능 저장 매체)에 저장될 수 있다. 도 3-5의 특정 일련의 처리 단계들은 제한하려는 의도가 아니다. 대안적인 실시예에 따라 다른 순서의 단계들이 또한 수행될 수 있다. 예를 들어, 대안적인 실시예에서, 위에서 설명한 단계들이 상이한 순서로 수행될 수 있다. 또한, 도 3-5에 도시된 개별 단계들이 개별 단계에 적합한 다양한 순서로 수행될 수 있는 다수의 하위 단계를 포함할 수 있다. 또한 특정 응용 프로그램에 따라 추가 단계가 추가되거나 제거될 수 있다. 당업자는 많은 변형, 수정 및 대안을 인식할 것이다.
도 3은 디지털 건강 플랫폼에서 프라이버시 보호 컴퓨팅을 위한 흐름도(300)를 도시한다. 흐름도(300)에 도시된 프로세스는 도 1 및 도 2에 도시된 아키텍처, 시스템 및 기술에 의해 구현된다.
단계(305)에서, 데이터(예를 들어, 보건 데이터)는 장치(예를 들어, 도 2와 관련하여 설명된 장치(210))에 의해 수집된다. 경우에 따라 데이터에는 개별적으로 식별가능한 건강 정보가 포함된다. 장치는 사용자에 의해 능동적으로 또는 수동적으로 작동될 수 있으며 그렇게 함으로써 데이터를 생성 및/또는 수집한다. 경우에 따라 데이터는 장치에 의해 비-식별화된다. 경우에 따라 데이터는 하나 이상의 장치(예: 상이한 사용자들 중 동일한 사용자에 의해 작동되는 여러 장치)에 의해 수집된다.
단계(310)에서, 데이터는 장치에 의해 로컬 서버(예를 들어, 도 2와 관련하여 설명된 로컬 서버(215))로 전송된다. 로컬 서버는 로컬 클라우드 서버와 같은 분산 컴퓨팅 환경(예: 클라우드 컴퓨팅 환경)의 일부이다. 로컬 서버는 데이터 출처 영역 내에서 유지 관리된다. 이 영역은 지리적 영역(예: 국가 또는 주)일 수 있으며 로컬 서버는 데이터를 생성하고 수집하는 사용자 또는 장치와 동일한 영역에 물리적으로 위치할 수 있다. 경우에 따라 하나 이상의 장치가 동일한 영역 내에 있으며, 수집된 데이터를 동일한 로컬 서버(지역적으로 - 다수:1)로 전송한다. 다른 경우에는 하나 이상의 장치가 여러 영역에 분산되어, 수집된 데이터를 각 영역에 할당된 로컬 서버로 전송한다(지역적으로 다수: 1 및 전역적으로 다수: 다수). 각 영역은 대상체의 데이터 사용 및 저장에 관한 데이터 규정 세트를 공동으로 공유하며, 로컬 서버 처리는 데이터 규정 세트에 따라 적합한 데이터를 사용 및 저장하도록 조정된다.
단계 315에서, 로컬 서버는 하나 이상의 로컬 데이터 저장소에 데이터(장치로부터의 원시 데이터)를 저장한다. 로컬 서버는 데이터 규정 세트를 준수하여 데이터를 저장한다. 예를 들어, 데이터 규정 세트에 개별적으로 식별가능한 건강 정보가 저장시 비-식별화되어야 한다고 명시되어 있는 경우, 로컬 서버는 저장 전에 데이터에 대해 비-식별화 동작을 수행한다. 추가로 또는 대안적으로, 데이터 규정 세트에 개별적으로 식별가능한 건강 정보를 저장하기 전에 익명화해야 한다고 명시된 경우 로컬 서버는 저장하기 전에 데이터에 대해 익명화 동작을 수행한다. 데이터는 로컬 서버에서 제공하는 하나 이상의 동작 또는 서비스의 일부로 후속 처리 또는 전송을 위해 저장될 수 있다. 예를 들어, 데이터는 로컬 서버에 의해 제공되는 서비스의 적어도 일부를 제공하도록 적응된 하나 이상의 알고리즘 또는 모델에 입력되기 전에 데이터 저장소에 저장될 수 있다.
단계 320에서, 로컬 서버는 데이터를 처리하고 처리된 데이터(예를 들어, 분석 데이터 또는 익명화된 데이터)를 생성한다. 로컬 서버는 데이터 규정 세트에 따라 데이터를 처리한다. 예를 들어 데이터 규정 세트에 개별적으로 식별가능한 건강 정보를 처리 또는 전송 전에 비-식별화해야 한다고 명시되어 있는 경우, 로컬 서버는 처리 또는 전송 전에 데이터에 대해 비-식별화 작업을 수행한다. 추가적으로 또는 대안적으로 데이터 규정 집합에 개별적으로 식별가능한 건강 정보가 처리 또는 전송 전에 익명화되어야 한다고 명시되어 있는 경우 로컬 서버는 처리 또는 전송 전에 데이터에 대해 익명화 작업을 수행한다. 데이터는 로컬 서버에서 제공하는 하나 이상의 동작 또는 서비스의 일부로 로컬 서버에서 처리될 수 있다. 예를 들어, 처리는 (i) 로컬 서버에 의해 제공되는 서비스의 적어도 일부로서 제공될 분석 데이터를 생성하도록 구성된 하나 이상의 알고리즘 또는 모델에 데이터를 입력하는 단계; 및/또는 (ii) 비-식별화되거나 익명화된 데이터를 저장 및/또는 다운스트림 처리(예: 하나 이상의 알고리즘 또는 모델 훈련)를 위해 하나 이상의 원격 서버로 전송하는 단계를 포함할 수 있다.
단계(325)에서, 로컬 서버는 처리된 데이터(예를 들어, 분석 데이터 또는 익명화된 데이터)를 하나 이상의 로컬 데이터 저장소에 저장한다. 로컬 서버는 데이터 규정 세트에 따라 처리된 데이터를 저장한다. 데이터는 로컬 서버에서 제공하는 하나 이상의 동작 또는 서비스의 일부로 후속 처리 또는 전송을 위해 저장될 수 있다. 예를 들어, 데이터는 저장 및/또는 다운스트림 처리를 위해 하나 이상의 원격 서버로 전송하기 전에 데이터 저장소에 저장될 수 있다.
단계(330)에서, 처리된 데이터는 로컬 서버에 의해 원격 서버(예를 들어, 도 2와 관련하여 설명된 원격 서버(220))로 전송된다. 원격 서버는 원격 클라우드 서버와 같은, 분산 컴퓨팅 환경(예: 클라우드 컴퓨팅 환경)의 일부이다. 원격 서버는 데이터 원본과 같거나 상이한 영역 내에서 유지 관리된다. 영역은 지리적 영역(예: 국가 또는 주)일 수 있으며 원격 서버는 데이터를 생성하고 수집하는 사용자 또는 장치와 동일하거나 상이한 지역에 물리적으로 위치할 수 있다. 경우에 따라, 하나 이상의 로컬 서버는 동일한 영역 내에 위치하고 처리된 데이터를 하나 이상의 로컬 서버 중 하나와 동일하거나 상이한 지역 내에 위치한 단일 원격 서버로 전송한다(지역적으로 - 다수:1). 다른 경우에는 하나 이상의 로컬 서버가 여러 영역에 분산되어, 프로세스 데이터를 하나 이상의 영역에 할당된 하나 이상의 원격 서버로 전송한다(지역적으로 - 다수: 1 및 전역적으로 다수: 다수). 각 영역은 대상체의 데이터 사용 및 저장에 관한 데이터 규정 세트를 공동으로 공유하며, 원격 서버 처리는 데이터 규정 세트에 따라 데이터를 사용 및 저장하도록 조정된다.
단계(335)에서, 원격 서버는 처리된 데이터의 버전을 식별하고, 식별된 버전에 기초하여 프로세스 데이터를 버전화된 데이터세트와 연관시킨다. 버전화된 데이터세트를 연결할 수 없는 경우, 식별된 버전에 대해 새 버전화된 데이터세트가 생성되고, 처리된 데이터가 새 버전화된 데이터세트와 연결된다. 처리된 데이터를 버전화된 데이터세트와 연결하면 처리된 데이터에 버전 제어가 적용된다. 버전 제어의 일부로, 원격 서버는 버전화된 데이터세트의 만료 일자를 결정하고, 만료 일자와 함께 버전화된 데이터세트를 저장한다. 만료 일자는 버전화된 데이터세트의 생성 일자, 처리된 데이터의 수신 일자, 처리된 데이터와 관련된 사전 동의 양식의 만료, 또는 이들의 조합을 기반으로 결정될 수 있다. 버전화된 데이터세트는 원격 서버에 대해 로컬 또는 원격인 하나 이상의 데이터 저장소에 저장된다.
단계(340)에서, 원격 서버는 버전화된 데이터세트(예를 들어, 버전화된 데이터세트의 훈련 서브세트)를 사용하여 하나 이상의 알고리즘 및/또는 모델을 훈련한다.
모델에 대한 훈련 프로세스는 하이퍼파라미터를 선택하고 하나 이상의 훈련 데이터세트로부터 모델에 데이터를 입력하여 모델에 대한 하나 이상의 손실 또는 오류 함수를 최소화시키는 모델 파라미터 세트(예를 들어, 가중치 및/또는 바이어스)를 찾는 반복 동작을 수행하는 것을 포함할 수 있다. 하이퍼파라미터는 모델의 거동을 제어하기 위해 조정하거나 최적화할 수 있는 설정이다. 대부분의 모델은 메모리 또는 실행 비용과 같은 알고리즘 및/또는 모델의 다양한 양태를 제어하는 하이퍼파라미터를 명시적으로 정의한다. 그러나 모델을 특정 시나리오에 맞게 조정하기 위해 추가 하이퍼파라미터를 정의할 수 있다. 예를 들어, 하이퍼파라미터는 모델의 은닉 유닛의 수, 모델의 학습률, 컨볼루션 커널의 폭, 또는 모델의 커널의 수를 포함할 수 있다. 훈련의 각 반복에는 모델 파라미터 세트를 사용하는 하나 이상의 손실 또는 오류 함수의 값이 이전 반복에서 상이한 모델 파라미터 세트를 사용하는 하나 이상의 손실 또는 오류 함수의 값보다 작도록, 모델에 대한 모델 파라미터 세트를 찾는 과정을 수반할 수 있다. 하나 이상의 손실 또는 오류 함수는 모델을 사용하여 추론된 출력(예: 관심 객체의 하나 이상의 인스턴스 주변의 분할 경계)과 지상 실측(예: 라벨을 사용하여 이미지에 주석이 달린 분할 경계) 사이의 차이를 측정하도록 구성될 수 있다.
일단 모델 파라미터 세트가 식별되면, 모델은 훈련되었고, 버전화된 데이터세트(예를 들어, 버전화된 데이터세트의 테스트 또는 검증 서브세트)를 사용하여 검증될 수 있다. 검증 프로세스에는 하이퍼파라미터를 조정하고 궁극적으로 최적의 하이퍼파라미터 세트를 찾기 위해 K-Fold Cross-Validation, Leave-one-out Cross-Validation, Leave-one-group-out Cross-Validation, Nested Cross-Validation, 등과 같은 검증 기술을 사용하여 버전화된 데이터세트의 데이터를 모델에 입력하는 반복 동작이 포함된다. 최적의 하이퍼파라미터 세트를 얻으면, 버전화된 데이터세트에서 예약된 테스트 데이터세트를 모델에 입력하여 출력(예: 하나 이상의 관심 객체 주변의 분절화 경계)을 얻고, Bland-Altman 방법 및 Spearman의 순위 상관 계수와 같은 상관 기술을 사용하여, 그리고 오류, 정확도, 정밀도, 재현율, 수신자 동작 특성 곡선(ROC) 등과 같은 성능 메트릭을 계산하여, 지상 실측 분절화 경계에 대해 출력이 평가된다.
단계(345)에서, 일단 알고리즘 및/또는 모델이 훈련되고 검증되면, 원격 서버는 알고리즘 및/또는 모델의 버전을 식별하고, 식별된 버전에 기초하여 알고리즘 및/또는 모델을 버전화된 알고리즘 및/또는 모델 세트와 연관시킨다. 예를 들어, 원격 서버는 알고리즘 및/또는 모델의 버전을 버전 X로 식별할 수 있다. 원격 서버는 알고리즘 및/또는 모델을 버전 X의 알고리즘 및/또는 모델 세트와 연관시킨다. 버전화된 알고리즘 및/또는 모델 세트가 연결에 사용 가능하지 않은 경우, 식별된 버전에 대해 새로운 버전의 알고리즘 및/또는 모델 세트가 생성되고 알고리즘 및/또는 모델이 새로운 버전의 알고리즘 및/또는 모델 세트와 연결된다. 새로운 버전의 알고리즘 및/또는 모델 세트와 버전화된 알고리즘 및/또는 모델 세트를 연관시킴으로써, 알고리즘 및/또는 모델을 버전 제어를 받게 된다. 버전 제어의 일부로서, 원격 서버는 버전화된 알고리즘 및/또는 모델 집합의 만료 일자를 결정하고, 버전화된 알고리즘 및/또는 모델 세트를 만료 일자와 함께 저장한다. 버전 제어의 추가 부분으로, 버전화된 알고리즘 및/또는 모델 세트는 버전화된 알고리즘 및/또는 모델 세트를 훈련 및 검증하는 데 사용되는 버전화된 데이터세트에 매핑된다. 그런 다음 이 매핑 또는 연결은 버전화된 데이터세트 및/또는 버전화된 알고리즘 및/또는 모델 세트와 함께 저장된다. 만료 일자는 버전화된 알고리즘 및/또는 모델 세트의 훈련 일자, 버전화된 알고리즘 및/또는 모델 세트의 검증 일자, 관련 버전화된 데이터세트의 만료 또는 이들의 조합을 기반으로 결정될 수 있다. 버전화된 알고리즘 및/또는 모델 세트는 원격 서버에 대해 로컬 또는 원격인 하나 이상의 데이터 저장소에 저장된다.
단계 350에서, 버전 제어의 추가 부분으로서, 원격 서버는 관련된 각각의 만기 일자에 기초하여 하나 이상의 데이터 저장소로부터 기존의 버전화된 데이터세트 및 버전화된 알고리즘 및/또는 모델 세트를 제거하거나 삭제한다. 이해해야 하는 바와 같이, 원격 서버에 의해 구현되는 버전 제어는, 알고리즘 및/또는 모델을 훈련하고 검증하는 데 사용되는 관련 버전화된 데이터세트 없이 하나 이상의 데이터 저장소에 존재하는 알고리즘 및/또는 모델이 없도록, 연관된 만료 일자에 기초하여 기존의 연관된 버전화된 데이터세트 및 버전화된 알고리즘 및/또는 모델 세트를 동시에 제거 또는 삭제하도록 적응될 수 있다.
단계 355에서, 알고리즘 및/또는 모델의 버전화 세트로부터 선택된 훈련되고 검증된(생산이라고 함) 알고리즘 및/또는 모델은 배포를 위해 하나 이상의 로컬 서버로 전송된다.
단계 360에서, 로컬 서버는 생산 알고리즘 및/또는 모델을 하나 이상의 로컬 데이터 스토어에 저장한다.
단계 365에서, 후속 데이터(예를 들어, 보건 데이터)는 단계 305에 대해 설명된 바와 같이 장치에 의해 수집된다. 후속 데이터는 생산 알고리즘 및/또는 모델을 훈련하거나 검증하는 데 사용되지 않는 데이터이지만, 데이터가 나중에 추론 또는 예측을 생성하는 데 사용될 수 있다(단계 375에서 논의된 바와 같이). 후속 데이터는 단계 305에서 생성 및/또는 수집된 데이터와 동일하거나 상이한 사용자 및 장치로부터 생성 및/또는 수집될 수 있다. 이해해야하다시피, 후속 데이터는, 단계 305와 관련하여 설명된 바와 같이, 사용자에 의해 사용되는 장치들에 의해 수집되는 임의의 데이터일 수 있다.
단계 370에서, 후속 데이터는 단계 310과 관련하여 기술된 바와 같이, 장치에 의해 로컬 서버로 전송된다.
단계 375에서, 로컬 서버는 단계 315-335와 관련하여 설명된 바와 같이, 후속 데이터(장치로부터의 원시 데이터 및 연산 또는 프로세서로부터 처리된 데이터)를 저장하고 처리한다. 일부 경우에, 처리는 하나 이상의 생산 알고리즘 및/또는 모델 중 하나 이상에 후속 데이터를 입력하는 것을 포함한다. 예를 들어, 로컬 서버에 의해 제공되는 서비스 또는 소프트웨어 애플리케이션의 일부로서, 하나 이상의 생산 알고리즘 및/또는 모델이 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용된다.
단계 380에서, 후속 데이터의 분석으로부터의 추론 또는 예측이 하나 이상의 데이터 저장소에 저장된다.
단계 385에서, 장치에 의해 수행되는 하나 이상의 동작에서 사용하기 위해 추론 또는 예측이 장치에 전달된다. 장치는 후속 데이터를 생성 및/또는 수집한 장치와 동일한 장치일 수도 있고 다른 장치일 수도 있다.
단계 390에서, 장치는 추론 또는 예측을 사용하여 하나 이상의 동작을 수행한다. 하나 이상의 동작은 장치 상에 추론 또는 예측의 저장 또는 디스플레이와 같이 간단한 것이거나, 장치의 하나 이상의 파라미터를 제어하는 용도(예를 들어 예측된 부분 산소 값을 사용하여 호흡보호구의 파라미터를 제어하는 것) 또는 진단 및 진단에 기초한 치료의 권장 또는 관리의 용도와 같은 보다 복잡한 동작일 수 있다. 어떤 경우에는 하나 이상의 동작이 추론 또는 예측에 관한 피드백 데이터의 생성을 트리거하거나 유발한다. 예를 들어, 추론 또는 예측의 긍정적인 예측 값은 하나 이상의 동작에서 추론 또는 예측을 사용한 결과로 생성될 수 있다.
단계 395에서, 피드백은 장치에 의해 수집되고, 로컬 서버로 전송되고, 로컬 서버에 의해 하나 이상의 데이터 저장소에 저장된다. 피드백 자체가 대상체 데이터의 한 형태일 수 있다. 추론 또는 예측에 더하여, 피드백은 단계 390의 하나 이상의 동작에 기초하여 트리거된 임의의 응답 또는 활동에 대한 데이터를 포함할 수 있다. 예를 들어, 피드백은 추론 또는 예측에 기초하여 대상체 또는 제공자에 의해 취해질 작용을 포함할 수 있다. 일부 경우에, 피드백은 대상체가 디지털 테스트(예: 시력 검사)를 받거나, 식단을 조정하거나, 약물을 복용하거나, 혈압을 기록해야 함을 나타낼 수 있다. 피드백은 측정 값(예: O2 포화도)을 자동으로 기록하기 위해 추가로 기계를 트리거할 수 있다. 피드백은 생산 알고리즘 및/또는 모델의 효율성 및/또는 생산 알고리즘 및/또는 모델의 후속 훈련을 결정하기 위해 다운스트림 처리에서 사용될 수 있다.
도 4는 인공 지능 도구를 개발하는 데 사용되는 대상체 데이터에 대해 로컬 클라우드 서버에 의해 수행되는 프라이버시 보호 컴퓨팅을 위한 프로세스(400)를 도시한다. 단계 405에서, 제1 대상체에 관한 대상체 데이터가 제1 대상체와 관련된 제1 컴퓨팅 장치로부터 수신된다. 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터일 수 있다. 제1 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합일 수 있다. 로컬 클라우드 서버는 대상체와 동일한 지리적 영역에 물리적으로 위치할 수 있다. 동일한 지리적 영역은 동일한 국가일 수 있다. 어떤 경우에는 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유한다.
단계 410에서, 처리 대상체 데이터를 생성하기 위해 대상체 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 두가지 모두가 수행된다. 비-식별화 작업, 익명화 작업, 또는 두가지 모두는 데이터 규정 세트(예: HIPAA 규정)에 기초하여 대상체 데이터의 개별적으로 식별가능한 건강 정보에 대해 수행될 수 있다. 어떤 경우에는, 대상체 데이터에 대한 비-식별화 작업, 익명화 작업, 또는 두가지 모두를 수행하기 전에, 대상체 데이터는 로컬 클라우드 서버에 액세스할 수 있는 원시 데이터 저장소에 저장된다.
단계 415에서, 처리 대상체 데이터는 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장된다. 처리 데이터 저장소는 원격 클라우드 서버에 액세스할 수 없다.
단계 420에서, 처리 대상체 데이터를 포함하는 데이터 배치(batch)가 원격 클라우드 서버로 전송된다. 배치 데이터의 전송은 데이터 배치가 이전에 데이터를 원격 클라우드 서버로 전송한 이후에 캡처된 다수의 다른 대상체로부터의 데이터를 포함하도록 주기적 또는 확률적 타이밍에서 발생할 수 있다. 경우에 따라, 처리 대상체 데이터를 전송하기 전에 처리 대상체 데이터의 삭제 요청을 로컬 클라우드 서버가 수신하지 않음에 응답하여 전송이 이루어진다. 경우에 따라 원격 클라우드 서버로부터 대상체 데이터를 삭제하라는 요청이 수신되고, 요청 수신에 대한 응답으로 원시 데이터 저장소에서 대상체 데이터가 삭제된다. 다만, 처리 대상체 데이터는 처리 데이터 저장소에서 삭제되지 않을 수 있다. 다른 경우에, 처리 대상체 데이터를 삭제하라는 요청이 원격 클라우드 서버로부터 수신되고, 요청 수신에 응답하여 처리 대상체 데이터가 처리 데이터 저장소에서 삭제된다.
단계 425에서, 생산 모델이 원격 클라우드 서버로부터 수신된다. 생산 모델은 처리 대상체 데이터에서 부분적으로 파생된 파라미터를 포함한다. 파라미터는 하나 이상의 손실 함수를 최소화하는 것에 기초하여 유도될 수 있다.
단계 430에서, 제2 대상체에 관한 후속 데이터가 제2 대상체와 연관된 제2 컴퓨팅 장치로부터 수신된다. 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터일 수 있다. 제1 컴퓨팅 장치는 제2 컴퓨팅 장치와 동일하거나 상이한 장치이다. 제2 컴퓨팅 장치는 임상 장치 센서 및 핸드헬드 휴대용 장치, 또는 이들의 조합일 수 있다. 제1 사용자는 제2 사용자와 동일하거나 다른 사용자이다. 경우에 따라 비-식별화 작업, 익명화 작업, 또는 두가지 모두가 후속 데이터에 대해 수행되어, 처리된 후속 데이터를 생성하고, 처리된 후속 데이터는 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장되며, 처리된 후속 데이터를 포함하는 데이터 배치가 원격 클라우드 서버로 전송된다.
단계 435에서, 후속 데이터는 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하기 위해 생산 모델에 입력된다. 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법의 불이행 감소, 운영 비용 절감, 이미지 분석, 치료 또는 요법의 마케팅, 행정 작업의 자동화, 의료 절차 지원 또는 이들의 조합과 관련하여 생성될 수 있다. 추론 또는 예측을 포함하는 후속 데이터 배치는 원격 클라우드 서버로 전송될 수 있다. 어떤 경우에는, 비-식별화 작업, 익명화 작업, 또는 두가지 모두가 추론 또는 예측에 대해 수행되어 처리된 출력 데이터를 생성하고, 처리된 출력 데이터는 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장되며, 처리된 출력 데이터를 포함하는 데이터 배치는 원격 클라우드 서버로 전송된다.
단계 440에서, 추론 또는 예측은 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 이들의 조합에 의해 수행되는 하나 이상의 동작에서 사용하기 위해 제2 컴퓨팅 장치, 제3 컴퓨팅 장치 또는 둘 모두에게로 전송된다. 하나 이상의 동작은 추론 또는 예측의 전달 또는 표시, 추론 또는 예측의 분석, 치료 또는 요법의 제공, 치료 또는 요법 프로토콜의 개시, 바이오마커 측정, 치료 또는 요법에 대한 알림 또는 리마인더 제공, 보건 데이터 획득, 진단 또는 예후 보고, 이미지 분석, 치료 또는 요법에 관한 마케팅 제공, 의료 기기 또는 의료 절차 제어, 또는 이들의 조합을 포함할 수 있다. 어떤 경우에는 응답 데이터가 제2 컴퓨팅 장치, 제3 컴퓨팅 장치 또는 둘 모두로부터 로컬 클라우드 서버에서 수신된다. 응답 데이터는 추론 또는 예측을 수신하거나 하나 이상의 작업에서 추론 또는 예측을 사용하는 것에 응답하여 생성된다. 비-식별화 작업, 익명화 작업, 또는 둘 모두가 응답 데이터에 대해 수행되어 처리된 응답 데이터를 생성한다. 처리된 응답 데이터는 처리 데이터 저장소에 저장되고, 처리된 응답 데이터를 포함하는 데이터 배치가 원격 클라우드 서버로 전송된다. 경우에 따라 원격 클라우드 서버에서 새 생산 모델을 수신하고(새 생산 모델이 처리 응답 데이터로부터 부분적으로 유도된 파라미터를 포함함), 생산 모델이 새 생산 모델로 대체된다. 이러한 대체에는 로컬 클라우드 서버에서 생산 모델을 삭제하는 것이 포함될 수 있다.
도 5는 인공 지능 도구를 개발하는 데 사용되는 대상체 데이터에 대해 원격 클라우드 서버에 의해 수행되는 프라이버시 보호 컴퓨팅을 위한 프로세스(500)를 도시한다. 단계 505에서, 복수의 상이한 대상체와 연관된 처리 대상체 데이터가 로컬 클라우드 서버로부터 수신되며, 처리 대상체 데이터는 비-식별화, 익명화 또는 둘 모두로 처리되어 있다. 처리 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터일 수 있다. 로컬 클라우드 서버는 대상체와 동일한 지리적 영역에 물리적으로 위치할 수 있다. 원격 클라우드 서버는 로컬 클라우드 서버와 동일하거나 다른 지리적 영역에 물리적으로 위치한다. 동일한 지리적 영역은 동일한 국가일 수 있다. 어떤 경우에 동일한 지리적 영역은 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유한다. 처리 대상체 데이터의 개별적으로 식별가능한 건강 정보는 데이터 규정 세트에 따라 비-식별화, 익명화 또는 둘 모두로 처리되었을 수 있다.
단계 510에서, 처리 대상체 데이터세트는 버전화된 데이터세트와 연관된다. 일부 경우에, 연관은 처리 대상체 데이터세트의 버전을 식별하는 것과, 처리 대상체 데이터세트의 식별된 버전에 기초하여 처리 대상체 데이터세트를 버전화된 데이터세트와 연관시키는 것을 포함한다. 버전화된 데이터세트를 연결할 수 없는 경우 처리 대상체 데이터세트의 식별된 버전에 대해 새 버전화된 데이터세트가 생성되고, 처리 대상체 데이터세트는 새 버전화된 데이터세트와 연결된다.
단계 515에서, 버전화된 데이터세트에 대한 만료 일자가 결정된다. 만료 일자는 버전화된 데이터세트의 생성 일자, 처리 대상체 데이터의 수신 일자, 처리 대상체 데이터세트와 관련된 사전 동의 양식의 만료, 또는 이들의 조합을 기반으로 결정된다.
단계 520에서, 원격 클라우드 서버에 액세스할 수 있는 버전 데이터 저장소에 만료일과 관련하여 버전화된 데이터세트를 저장한다. 버전 데이터 저장소는 로컬 클라우드 서버에 액세스할 수 없다.
단계 525에서, 생산 모델은 버전화된 데이터세트를 사용하여 훈련된다. 생산 모델은 하나 이상의 손실 함수를 최소화함에 기초하여 훈련에서 파생된 파라미터를 포함한다.
단계 530에서, 버전화된 데이터세트와 생산 모델 사이의 연관이 버전화된 데이터 저장소에 저장된다. 생산 모델이 버전화된 데이터 저장소에 저장될 수도 있다. 경우에 따라, 만료 일자가 지나면 버전화된 데이터세트와 생산 모델이 버전화된 데이터 저장소로부터 삭제되거나 제거된다.
단계 535에서, 생산 모델은 후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는데 사용하기 위해 로컬 클라우드 서버로 전송된다. 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터일 수 있다. 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 불이행의 감소, 운영 비용 절감, 이미지 분석, 치료 또는 요법의 마케팅, 행정 작업의 자동화, 의료 절차 지원 또는 이들의 조합과 관련하여 생성될 수 있다.
일부 예에서, 다른 생산 모델은 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트를 사용하여 훈련되고, 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트와 다른 생산 모델 사이의 연관성이 버전화된 데이터 저장소에 저장되며, 다른 생산 모델은 후속 데이터를 분석하고 후속 데이터 분석에서 추론 또는 예측을 생성하는 데 사용하기 위해 로컬 클라우드 서버로 전송된다. 다른 생산 모델은 생산 모델을 다른 생산 모델로 교체하라는 명령과 함께 로컬 클라우드 서버로 전송될 수 있다.
V. 추가 고려 사항
본 개시의 일부 실시예는 하나 이상의 데이터 프로세서를 포함하는 시스템을 포함한다. 일부 실시예에서, 시스템은 하나 이상의 데이터 프로세서에서 실행될 때 하나 이상의 데이터 프로세서로 하여금 여기서 개시되는 하나 이상의 방법의 일부 또는 전부 및/또는 하나 이상의 프로세스의 일부 또는 전부를 수행하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함한다. 본 개시의 일부 실시예는 비일시적 기계 판독 가능 저장 매체에 유형적으로 구현된 컴퓨터 프로그램 제품을 포함하며, 이는 하나 이상의 데이터 프로세서로 하여금 여기서 개시되는 하나 이상의 방법의 일부 또는 전부 및/또는 하나 이상의 프로세스의 일부 또는 전부를 수행하게 하도록 구성되는 명령어를 포함한다.
사용된 용어 및 표현은 제한이 아닌 설명의 용어로 사용되었으며, 그러한 용어 및 표현의 사용에서 도시되고 설명된 특징 또는 그 일부의 등가물을 배제하려는 의도가 없으며, 청구된 발명의 범위 내에서 다양한 수정이 가능하다는 것이 인정된다. 따라서, 청구된 본 발명이 실시예 및 선택적인 특징에 의해 구체적으로 개시되었지만, 본 명세서에 개시된 개념의 수정 및 변형이 당업자에 의해 이루어질 수 있고, 그러한 수정 및 변형이 첨부된 청구범위에 의해 정의된 바와 같이 본 발명의 범위 내에 있어야 한다고 고려됨을 이해해야 한다.
이어지는 설명은 단지 바람직한 예시적 실시예를 제공하며, 본 개시의 범위, 적용 가능성 또는 구성을 제한하려는 의도가 아니다. 오히려, 바람직한 예시적 실시예의 이어지는 설명은 당업자에게 다양한 실시예를 구현하기 위한 가능한 설명을 제공할 것이다. 첨부된 특허청구범위에 기재된 정신 및 범위를 벗어나지 않고 구성요소의 기능 및 배열에 다양한 변경이 이루어질 수 있음을 이해해야 한다.
구체적인 세부사항은 실시예의 완전한 이해를 제공하기 위해 다음 설명에서 제공된다. 그러나, 실시예는 이러한 특정 세부 사항 없이 실시될 수 있음을 이해할 것이다. 예를 들어, 회로, 시스템, 네트워크, 프로세스 및 기타 구성요소는 불필요한 세부 사항으로 실시예를 모호하게 하지 않기 위해 블록 다이어그램 형식의 구성요소로 표시될 수 있다. 다른 경우에, 잘 알려진 회로, 프로세스, 알고리즘, 구조 및 기술은 실시예를 모호하게 하는 것을 피하기 위해 불필요한 세부 사항 없이 표시될 수 있다.

Claims (108)

  1. 로컬 클라우드 서버에 의해 수행되는 컴퓨터-구현 방법으로서,
    제1 대상체와 관련된 제1 컴퓨팅 장치로부터 제1 대상체에 관한 대상체 데이터를 수신하는 단계,
    처리 대상체 데이터(processed subject data)를 생성하기 위해 대상체 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장하는 단계,
    처리 대상체 데이터를 포함하는 데이터 배치(batch of data)를 원격 클라우드 서버에 전송하는 단계,
    원격 클라우드 서버로부터, 처리 대상체 데이터로부터 부분적으로 도출된 파라미터를 포함하는 생산 모델을 수신하는 단계,
    제2 대상체와 관련된 제2 컴퓨팅 장치로부터 제2 대상체에 관한 후속 데이터를 수신하는 단계,
    상기 후속 데이터를 상기 생산 모델에 입력하여 후속 데이터를 분석하고, 상기 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 단계, 및
    제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 이들의 조합에 의해 수행되는 하나 이상의 연산에 사용하기 위해 추론 또는 예측을 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 다에 전송하는 단계
    를 포함하는 컴퓨터-구현 방법.
  2. 제1항에 있어서, 상기 로컬 클라우드 서버는 물리적으로 상기 대상체와 동일한 지리적 영역에 위치하는 것인 컴퓨터-구현 방법.
  3. 제2항에 있어서, 상기 동일한 지리적 영역은 동일한 국가인 컴퓨터-구현 방법.
  4. 제2항 또는 제3항에 있어서,
    상기 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터(health care data)이고,
    상기 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터인 컴퓨터-구현 방법.
  5. 제4항에 있어서, 상기 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유하는 것인 컴퓨터-구현 방법.
  6. 제4항에 있어서, 상기 비-식별화 작업, 익명화 작업, 또는 둘 다는 데이터 규정 세트에 기초하여 대상체 데이터의 개별적으로 식별가능한 건강 정보에 대해 수행되는 것인 컴퓨터-구현 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 제1 컴퓨팅 장치는 상기 제2 컴퓨팅 장치와 동일하거나 상이한 장치인 컴퓨터-구현 방법.
  8. 제7항에 있어서, 상기 제1 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합인 컴퓨터-구현 방법.
  9. 제7항 또는 제8항에 있어서, 상기 제2 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합인 컴퓨터-구현 방법.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 제1 대상체는 상기 제2 대상체와 동일하거나 상이한 대상체인 컴퓨터-구현 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 처리 데이터 저장소는 원격 클라우드 서버에 액세스할 수 없는 것인 컴퓨터-구현 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 처리 대상체 데이터를 데이터 배치의 일부로서 원격 클라우드 서버로 전송하는 단계는, 처리 대상체 데이터를 전송하기 전에 로컬 클라우드 서버가 처리 대상체 데이터 삭제 요청을 수신하지 않음에 응답하여 이루어지는 것인 컴퓨터-구현 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    대상체 데이터에 대한 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하기 전에, 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 원시 데이터 저장소에 저장하는 단계,
    상기 원격 클라우드 서버로부터 상기 대상체 데이터 삭제 요청을 수신하는 단계, 및
    상기 대상체 데이터 삭제 요청을 수신함에 응답하여, 원시 데이터 저장소에서 대상체 데이터를 삭제하는 단계
    를 더 포함하는 컴퓨터-구현 방법.
  14. 제13항에 있어서, 상기 처리 대상체 데이터는 상기 처리 데이터 저장소에서 삭제되지 않는 것인 컴퓨터-구현 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 처리 대상체 데이터를 데이터 배치의 일부로서 전송하는 단계는, 데이터를 원격 클라우드 서버로 이전에 전송한 이래 캡처된 다수의 다른 대상체로부터의 데이터가 상기 데이터 배치에 포함되도록 주기적 또는 확률적 타이밍으로 발생하는 것인 컴퓨터-구현 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 관리 작업의 자동화, 의료 절차 지원, 또는 이들의 임의의 조합과 관련하여 생성되는 것인 컴퓨터-구현 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 하나 이상의 연산은 추론 또는 예측의 전달 또는 표시, 추론 또는 예측의 분석, 치료 또는 요법의 제공, 치료 또는 요법 프로토콜 개시, 바이오마커 측정, 치료 또는 요법에 대한 알림 또는 리마인더 제공, 보건 데이터 획득, 진단 또는 예후 보고, 이미지 분석, 치료 또는 요법에 관한 마케팅 제공, 의료 장치 또는 의료 절차 제어, 또는 이들의 임의의 조합을 포함하는 것인 컴퓨터-구현 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    추론 또는 예측을 포함하는 후속 데이터 배치를 원격 클라우드 서버에 전송하는 단계
    를 더 포함하는 컴퓨터-구현 방법.
  19. 제1항 내지 제17항 중 어느 한 항에 있어서,
    처리 후속 데이터를 생성하기 위해 후속 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 후속 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계, 및
    처리 후속 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 컴퓨터-구현 방법.
  20. 제1항 내지 제17항 중 어느 한 항에 있어서,
    처리 출력 데이터를 생성하기 위해 추론 또는 예측에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 출력 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계, 및
    처리 출력 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 컴퓨터-구현 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서,
    추론 또는 예측을 수신함에 응답하여 또는 상기 하나 이상의 연산에서 추론 또는 예측을 사용하는 것에 응답하여 생성된 응답 데이터를 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 다로부터 로컬 클라우드 서버에서 수신하는 단계,
    처리 응답 데이터를 생성하기 위해 응답 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 응답 데이터를 처리 데이터 저장소에 저장하는 단계, 및
    처리 응답 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 컴퓨터-구현 방법.
  22. 제21항에 있어서,
    처리 응답 데이터로부터 부분적으로 도출된 파라미터를 포함하는 새로운 생산 모델을 원격 클라우드 서버로부터 수신하는 단계, 및
    생산 모델을 새로운 생산 모델로 교체하는 단계이며, 상기 교체는 로컬 클라우드 서버로부터 생산 모델을 삭제하는 것을 포함하는 것인 단계
    를 더 포함하는 컴퓨터-구현 방법.
  23. 로컬 클라우드 서버의 하나 이상의 데이터 프로세서, 및
    상기 하나 이상의 데이터 프로세서에서 실행될 때, 상기 하나 이상의 데이터 프로세서로 하여금 다음을 포함하는 작용들을 수행하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독가능 저장 매체
    를 포함하는 시스템:
    제1 대상체와 관련된 제1 컴퓨팅 장치로부터 제1 대상체에 관한 대상체 데이터를 수신하는 단계,
    처리 대상체 데이터를 생성하기 위해 대상체 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장하는 단계,
    처리 대상체 데이터를 포함하는 데이터 배치를 원격 클라우드 서버에 전송하는 단계,
    원격 클라우드 서버로부터, 처리 대상체 데이터로부터 부분적으로 도출된 파라미터를 포함하는 생산 모델을 수신하는 단계,
    제2 대상체와 관련된 제2 컴퓨팅 장치로부터 제2 대상체에 관한 후속 데이터를 수신하는 단계,
    상기 후속 데이터를 상기 생산 모델에 입력하여 후속 데이터를 분석하고, 상기 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 단계, 및
    제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 이들의 조합에 의해 수행되는 하나 이상의 연산에 사용하기 위해 추론 또는 예측을 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 다에 전송하는 단계.
  24. 제23항에 있어서, 상기 로컬 클라우드 서버는 물리적으로 상기 대상체와 동일한 지리적 영역에 위치하는 것인 시스템.
  25. 제24항에 있어서, 상기 동일한 지리적 영역은 동일한 국가인 시스템.
  26. 제24항 또는 제25항에 있어서,
    상기 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고,
    상기 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터인 시스템.
  27. 제26항에 있어서, 상기 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유하는 것인 시스템.
  28. 제26항에 있어서, 상기 비-식별화 작업, 익명화 작업, 또는 둘 다는 데이터 규정 세트에 기초하여 대상체 데이터의 개별적으로 식별가능한 건강 정보에 대해 수행되는 것인 시스템.
  29. 제23항 내지 제28항 중 어느 한 항에 있어서, 상기 제1 컴퓨팅 장치는 상기 제2 컴퓨팅 장치와 동일하거나 상이한 장치인 시스템.
  30. 제29항에 있어서, 상기 제1 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합인 시스템.
  31. 제29항 또는 제30항에 있어서, 상기 제2 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합인 시스템.
  32. 제29항 내지 제31항 중 어느 한 항에 있어, 상기 제1 대상체는 상기 제2 대상체와 동일하거나 상이한 대상체인 시스템.
  33. 제23항 내지 제32항 중 어느 한 항에 있어서, 상기 처리 데이터 저장소는 원격 클라우드 서버에 액세스할 수 없는 것인 시스템.
  34. 제23항 내지 제33항 중 어느 한 항에 있어서, 상기 처리 대상체 데이터를 데이터 배치의 일부로서 원격 클라우드 서버로 전송하는 단계는, 처리 대상체 데이터를 전송하기 전에 로컬 클라우드 서버가 처리 대상체 데이터 삭제 요청을 수신하지 않음에 응답하여 이루어지는 것인 시스템.
  35. 제23항 내지 제34항 중 어느 한 항에 있어서, 상기 작용들은:
    대상체 데이터에 대한 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하기 전에, 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 원시 데이터 저장소에 저장하는 단계,
    상기 원격 클라우드 서버로부터 상기 대상체 데이터 삭제 요청을 수신하는 단계, 및
    상기 대상체 데이터 삭제 요청을 수신함에 응답하여, 원시 데이터 저장소에서 대상체 데이터를 삭제하는 단계
    를 더 포함하는 것인 시스템.
  36. 제35항에 있어서, 상기 처리 대상체 데이터는 상기 처리 데이터 저장소에서 삭제되지 않는 것인 시스템.
  37. 제23항 내지 제36항 중 어느 한 항에 있어서, 상기 처리 대상체 데이터를 데이터 배치의 일부로서 전송하는 단계는, 데이터를 원격 클라우드 서버로 이전에 전송한 이래 캡처된 다수의 다른 대상체로부터의 데이터가 상기 데이터 배치에 포함되도록 주기적 또는 확률적 타이밍으로 발생하는 것인 시스템.
  38. 제23항 내지 제37항 중 어느 한 항에 있어서, 상기 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 관리 작업의 자동화, 의료 절차 지원, 또는 이들의 임의의 조합과 관련하여 생성되는 것인 시스템.
  39. 제23항 내지 제38항 중 어느 한 항에 있어서, 상기 하나 이상의 연산은 추론 또는 예측의 전달 또는 표시, 추론 또는 예측의 분석, 치료 또는 요법의 제공, 치료 또는 요법 프로토콜 개시, 바이오마커 측정, 치료 또는 요법에 대한 알림 또는 리마인더 제공, 보건 데이터 획득, 진단 또는 예후 보고, 이미지 분석, 치료 또는 요법에 관한 마케팅 제공, 의료 장치 또는 의료 절차 제어, 또는 이들의 임의의 조합을 포함하는 것인 시스템.
  40. 제23항 내지 제39항 중 어느 한 항에 있어서, 상기 작용들은
    추론 또는 예측을 포함하는 후속 데이터 배치를 원격 클라우드 서버에 전송하는 단계
    를 더 포함하는 것인 시스템.
  41. 제23항 내지 제39항 중 어느 한 항에 있어서, 상기 작용들은,
    처리 후속 데이터를 생성하기 위해 후속 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 후속 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계, 및
    처리 후속 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 것인 시스템.
  42. 제23항 내지 제39항 중 어느 한 항에 있어서, 상기 작용들은,
    처리 출력 데이터를 생성하기 위해 추론 또는 예측에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 출력 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계, 및
    처리 출력 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 것인 시스템.
  43. 제23항 내지 제42항 중 어느 한 항에 있어서, 상기 작용들은,
    추론 또는 예측을 수신함에 응답하여 또는 상기 하나 이상의 연산에서 추론 또는 예측을 사용하는 것에 응답하여 생성된 응답 데이터를 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 다로부터 로컬 클라우드 서버에서 수신하는 단계,
    처리 응답 데이터를 생성하기 위해 응답 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 응답 데이터를 처리 데이터 저장소에 저장하는 단계, 및
    처리 응답 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 것인 시스템.
  44. 제43항에 있어서, 상기 작용들은,
    처리 응답 데이터로부터 부분적으로 도출된 파라미터를 포함하는 새로운 생산 모델을 원격 클라우드 서버로부터 수신하는 단계, 및
    생산 모델을 새로운 생산 모델로 교체하는 단계이며, 상기 교체는 로컬 클라우드 서버로부터 생산 모델을 삭제하는 것을 포함하는 것인 단계
    를 더 포함하는 것인 시스템.
  45. 로컬 클라우드 서버의 하나 이상의 데이터 프로세서로 하여금 다음을 포함하는 작용들을 수행하도록 구성되는 명령어를 포함하는, 비일시적 기계 판독가능 저장 매체에 유형적으로 구현된 컴퓨터 프로그램 제품:
    제1 대상체와 관련된 제1 컴퓨팅 장치로부터 제1 대상체에 관한 대상체 데이터를 수신하는 단계,
    처리 대상체 데이터를 생성하기 위해 대상체 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 처리 데이터 저장소에 저장하는 단계,
    처리 대상체 데이터를 포함하는 데이터 배치를 원격 클라우드 서버에 전송하는 단계,
    원격 클라우드 서버로부터, 처리 대상체 데이터로부터 부분적으로 도출된 파라미터를 포함하는 생산 모델을 수신하는 단계,
    제2 대상체와 관련된 제2 컴퓨팅 장치로부터 제2 대상체에 관한 후속 데이터를 수신하는 단계,
    상기 후속 데이터를 상기 생산 모델에 입력하여 후속 데이터를 분석하고, 상기 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 단계, 및
    제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 이들의 조합에 의해 수행되는 하나 이상의 연산에 사용하기 위해 추론 또는 예측을 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 다에 전송하는 단계.
  46. 제45항에 있어서, 상기 로컬 클라우드 서버는 물리적으로 상기 대상체와 동일한 지리적 영역에 위치하는 것인 컴퓨터 프로그램 제품.
  47. 제46항에 있어서, 상기 동일한 지리적 영역은 동일한 국가인 컴퓨터 프로그램 제품.
  48. 제46항 또는 제47항에 있어서,
    상기 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고,
    상기 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터인 컴퓨터 프로그램 제품.
  49. 제48항에 있어서, 상기 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유하는 것인 컴퓨터 프로그램 제품.
  50. 제48항에 있어서, 상기 비-식별화 작업, 익명화 작업, 또는 둘 다는 데이터 규정 세트에 기초하여 대상체 데이터의 개별적으로 식별가능한 건강 정보에 대해 수행되는 것인 컴퓨터 프로그램 제품.
  51. 제45항 내지 제50항 중 어느 한 항에 있어서, 상기 제1 컴퓨팅 장치는 상기 제2 컴퓨팅 장치와 동일하거나 상이한 장치인 컴퓨터 프로그램 제품.
  52. 제51항에 있어서, 상기 제1 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합인 컴퓨터 프로그램 제품.
  53. 제51항 또는 제52항에 있어서, 상기 제2 컴퓨팅 장치는 임상 장치 센서, 핸드헬드 휴대용 장치, 또는 이들의 조합인 컴퓨터 프로그램 제품.
  54. 제51항 내지 제53항 중 어느 한 항에 있어서, 상기 제1 대상체는 상기 제2 대상체와 동일하거나 상이한 대상체인 컴퓨터 프로그램 제품.
  55. 제45항 내지 제54항 중 어느 한 항에 있어서, 처리 데이터 저장소는 원격 클라우드 서버에 액세스할 수 없는 것인 컴퓨터 프로그램 제품.
  56. 제45항 내지 제55항 중 어느 한 항에 있어서, 상기 처리 대상체 데이터를 데이터 배치의 일부로서 원격 클라우드 서버로 전송하는 단계는, 처리 대상체 데이터를 전송하기 전에 로컬 클라우드 서버가 처리 대상체 데이터 삭제 요청을 수신하지 않음에 응답하여 이루어지는 것인 컴퓨터 프로그램 제품.
  57. 제45항 내지 제56항 중 어느 한 항에 있어서, 상기 작용들은:
    대상체 데이터에 대한 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하기 전에, 대상체 데이터를 로컬 클라우드 서버에 액세스할 수 있는 원시 데이터 저장소에 저장하는 단계,
    상기 원격 클라우드 서버로부터 상기 대상체 데이터 삭제 요청을 수신하는 단계, 및
    상기 대상체 데이터 삭제 요청을 수신함에 응답하여, 원시 데이터 저장소에서 대상체 데이터를 삭제하는 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  58. 제57항에 있어서, 상기 처리 대상체 데이터는 상기 처리 데이터 저장소에서 삭제되지 않는 것인 컴퓨터 프로그램 제품.
  59. 제45항 내지 제58항 중 어느 한 항에 있어서, 상기 처리 대상체 데이터를 데이터 배치의 일부로서 전송하는 단계는, 데이터를 원격 클라우드 서버로 이전에 전송한 이래 캡처된 다수의 다른 대상체로부터의 데이터에 상기 데이터 배치에 포함되도록 주기적 또는 확률적 타이밍으로 발생하는 것인 컴퓨터 프로그램 제품.
  60. 제45항 내지 제59항 중 어느 한 항에 있어서, 상기 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 관리 작업의 자동화, 의료 절차 지원, 또는 이들의 임의의 조합과 관련하여 생성되는 것인 컴퓨터 프로그램 제품.
  61. 제45항 내지 제60항 중 어느 한 항에 있어서, 상기 하나 이상의 연산은 추론 또는 예측의 전달 또는 표시, 추론 또는 예측의 분석, 치료 또는 요법의 제공, 치료 또는 요법 프로토콜 개시, 바이오마커 측정, 치료 또는 요법에 대한 알림 또는 리마인더 제공, 보건 데이터 획득, 진단 또는 예후 보고, 이미지 분석, 치료 또는 요법에 관한 마케팅 제공, 의료 장치 또는 의료 절차 제어, 또는 이들의 임의의 조합을 포함하는 것인 컴퓨터 프로그램 제품.
  62. 제45항 내지 제61항 중 어느 한 항에 있어서, 상기 작용들은
    추론 또는 예측을 포함하는 후속 데이터 배치를 원격 클라우드 서버에 전송하는 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  63. 제45항 내지 제61항 중 어느 한 항에 있어서, 상기 작용들은,
    처리 후속 데이터를 생성하기 위해 후속 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 후속 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계, 및
    처리 후속 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  64. 제45항 내지 제61항 중 어느 한 항에 있어서, 상기 작용들은,
    처리 출력 데이터를 생성하기 위해 추론 또는 예측에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 출력 데이터를 로컬 클라우드 서버에 액세스가능한 처리 데이터 저장소에 저장하는 단계, 및
    처리 출력 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  65. 제45항 내지 제64항 중 어느 한 항에 있어서, 상기 작용들은,
    추론 또는 예측을 수신함에 응답하여 또는 상기 하나 이상의 연산에서 추론 또는 예측을 사용하는 것에 응답하여 생성된 응답 데이터를 제2 컴퓨팅 장치, 제3 컴퓨팅 장치, 또는 둘 다로부터 로컬 클라우드 서버에서 수신하는 단계,
    처리 응답 데이터를 생성하기 위해 응답 데이터에 대해 비-식별화 작업, 익명화 작업, 또는 둘 다를 수행하는 단계,
    처리 응답 데이터를 처리 데이터 저장소에 저장하는 단계, 및
    처리 응답 데이터를 포함하는 데이터 배치를 원격 클라우드 서버로 전송하는 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  66. 제65항에 있어서, 상기 작용들은,
    처리 응답 데이터로부터 부분적으로 도출된 파라미터를 포함하는 새로운 생산 모델을 원격 클라우드 서버로부터 수신하는 단계, 및
    생산 모델을 새로운 생산 모델로 교체하는 단계이며, 상기 교체는 로컬 클라우드 서버로부터 생산 모델을 삭제하는 것을 포함하는 것인 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  67. 원격 클라우드 서버에 의해 수행되는 컴퓨터-구현 방법으로서,
    로컬 클라우드 서버로부터 복수의 상이한 대상체와 연관된 처리 대상체 데이터를 수신하는 단계이며, 상기 처리 대상체 데이터는 비-식별화되거나, 익명화되거나, 또는 둘 다인 단계,
    상기 처리 대상체 데이터세트를 버전화된 데이터세트와 연관시키는 단계,
    상기 버전화된 데이터세트에 대한 만료 일자를 결정하는 단계,
    상기 원격 클라우드 서버에 액세스할 수 있는 버전 데이터 저장소에 버전화된 데이터세트를 저장하는 단계이며, 상기 버전화된 데이터세트는 만료 일자와 연관하여 저장되는 것인 단계,
    상기 버전화된 데이터세트를 사용하여 생산 모델을 훈련하는 단계,
    상기 버전화된 데이터세트 및 상기 버전화된 데이터세트로 훈련된 생산 모델 간의 연관성을 상기 버전화된 데이터 저장소에 저장하는 단계, 및
    후속 데이터를 분석하고 후속 데이터 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 생산 모델을 로컬 클라우드 서버로 전송하는 단계
    를 포함하는 컴퓨터-구현 방법.
  68. 제67항에 있어서, 상기 로컬 클라우드 서버는 물리적으로 상기 대상체와 동일한 지리적 영역에 위치하는 것인 컴퓨터-구현 방법.
  69. 제68항에 있어서, 상기 동일한 지리적 영역은 동일한 국가인 컴퓨터-구현 방법.
  70. 제68항 또는 제69항에 있어서,
    상기 처리 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고,
    상기 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터인 컴퓨터-구현 방법.
  71. 제67항 내지 제70항 중 어느 한 항에 있어서, 상기 원격 클라우드 서버는 상기 로컬 클라우드 서버와 동일하거나 상이한 지리적 영역에 물리적으로 위치하는 것인 컴퓨터-구현 방법.
  72. 제71항에 있어서, 상기 동일하거나 상이한 지리적 영역은 동일하거나 상이한 국가인 컴퓨터-구현 방법.
  73. 제67항 내지 제72항 중 어느 한 항에 있어서, 상기 버전 데이터 저장소는 로컬 클라우드 서버에 액세스할 수 없는 것인 컴퓨터-구현 방법.
  74. 제70항 내지 제73항 중 어느 한 항에 있어서, 상기 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유하는 것인 컴퓨터-구현 방법.
  75. 제74항에 있어서, 처리 대상체 데이터의 개별적으로 식별가능한 건강 정보는 데이터 규정 세트에 기초하여 비-식별화되었거나, 익명화되었거나, 또는 둘 다인 컴퓨터-구현 방법.
  76. 제67항 내지 제75항 중 어느 한 항에 있어서, 상기 만료 일자는 버전화된 데이터세트의 생성 일자, 처리 대상체 데이터의 수신 일자, 처리 대상체 데이터세트와 관련된 동의서 양식의 만료, 또는 이들의 임의의 조합에 기초하여 결정되는 것인 컴퓨터-구현 방법.
  77. 제67항 내지 제76항 중 어느 한 항에 있어서,
    원격 클라우드 서버에 액세스할 수 있는 버전화된 데이터 저장소에 생산 모델을 저장하는 단계, 및
    만료 일자를 거쳐감에 응답하여, 버전화된 데이터 저장소로부터 버전화된 데이터세트 및 생산 모델을 삭제 또는 제거하는 단계
    를 더 포함하는 컴퓨터-구현 방법.
  78. 제67항 내지 제77항 중 어느 한 항에 있어서,
    버전화된 데이터세트 및/또는 다른 버전화된 데이터세트를 사용하여 다른 생산 모델을 훈련하는 단계,
    버전화된 데이터세트 및/또는 다른 버전화된 데이터세트와, 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트로 훈련된 다른 생산 모델 간의 연관성을 버전화된 데이터 저장소에 저장하는 단계, 및
    후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 로컬 클라우드 서버에 다른 생산 모델을 전송하는 단계이며, 상기 다른 생산 모델은 생산 모델을 다른 생산 모델로 교체하라는 지시와 함께 로컬 클라우드 서버에 전송되는 것인 단계
    를 더 포함하는 컴퓨터-구현 방법.
  79. 제67항 내지 제78항 중 어느 한 항에 있어서, 상기 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 관리 작업의 자동화, 의료 절차 지원, 또는 이들의 임의의 조합과 관련하여 생성되는 것인 컴퓨터-구현 방법.
  80. 제67항 내지 제79항 중 어느 한 항에 있어서, 상기 생산 모델은 하나 이상의 손실 함수의 최소화에 기초하여 훈련에서 도출되는 파라미터를 포함하는 것인 컴퓨터-구현 방법.
  81. 원격 클라우드 서버의 하나 이상의 데이터 프로세서, 및
    상기 하나 이상의 데이터 프로세서에서 실행될 때, 상기 하나 이상의 데이터 프로세서로 하여금 다음을 포함하는 작용들을 수행하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독가능 저장 매체
    를 포함하는 시스템:
    로컬 클라우드 서버로부터 복수의 상이한 대상체와 연관된 처리 대상체 데이터를 수신하는 단계이며, 상기 처리 대상체 데이터는 비-식별화되거나, 익명화되거나, 또는 둘 다인 단계,
    상기 처리 대상체 데이터세트를 버전화된 데이터세트와 연관시키는 단계,
    상기 버전화된 데이터세트에 대한 만료 일자를 결정하는 단계,
    상기 원격 클라우드 서버에 액세스할 수 있는 버전 데이터 저장소에 버전화된 데이터세트를 저장하는 단계이며, 상기 버전화된 데이터세트는 만료 일자와 연관하여 저장되는 것인 단계,
    상기 버전화된 데이터세트를 사용하여 생산 모델을 훈련하는 단계,
    상기 버전화된 데이터세트 및 상기 버전화된 데이터세트로 훈련된 생산 모델 간의 연관성을 상기 버전화된 데이터 저장소에 저장하는 단계, 및
    후속 데이터를 분석하고 후속 데이터 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 생산 모델을 로컬 클라우드 서버로 전송하는 단계.
  82. 제81항에 있어서, 상기 로컬 클라우드 서버는 물리적으로 상기 대상체와 동일한 지리적 영역에 위치하는 것인 시스템.
  83. 제82항에 있어서, 상기 동일한 지리적 영역은 동일한 국가인 시스템.
  84. 제82항 또는 제83항에 있어서,
    상기 처리 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고,
    상기 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터인 시스템.
  85. 제81항 내지 제84항 중 어느 한 항에 있어서, 상기 원격 클라우드 서버는 상기 로컬 클라우드 서버와 동일하거나 상이한 지리적 영역에 물리적으로 위치하는 것인 시스템.
  86. 제85항에 있어서, 상기 동일하거나 상이한 지리적 영역은 동일하거나 상이한 국가인 시스템.
  87. 제81항 내지 제86항 중 어느 한 항에 있어서, 상기 버전 데이터 저장소는 로컬 클라우드 서버에 액세스할 수 없는 것인 시스템.
  88. 제84항 내지 제87항 중 어느 한 항에 있어서, 상기 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유하는 것인 시스템.
  89. 제88항에 있어서, 처리 대상체 데이터의 개별적으로 식별가능한 건강 정보는 데이터 규정 세트에 기초하여 비-식별화되었거나, 익명화되었거나, 또는 둘 다인 시스템.
  90. 제81항 내지 제89항 중 어느 한 항에 있어서, 상기 만료 일자는 버전화된 데이터세트의 생성 일자, 처리 대상체 데이터의 수신 일자, 처리 대상체 데이터세트와 관련된 동의서 양식의 만료, 또는 이들의 임의의 조합에 기초하여 결정되는 것인 시스템.
  91. 제81항 내지 제90항 중 어느 한 항에 있어서, 상기 작용들은,
    원격 클라우드 서버에 액세스할 수 있는 버전화된 데이터 저장소에 생산 모델을 저장하는 단계, 및
    만료 일자를 거쳐감에 응답하여, 버전화된 데이터 저장소로부터 버전화된 데이터세트 및 생산 모델을 삭제 또는 제거하는 단계
    를 더 포함하는 것인 시스템.
  92. 제81항 내지 제91항 중 어느 한 항에 있어서, 상기 작용들은,
    버전화된 데이터세트 및/또는 다른 버전화된 데이터세트를 사용하여 다른 생산 모델을 훈련하는 단계,
    버전화된 데이터세트 및/또는 다른 버전화된 데이터세트와, 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트로 훈련된 다른 생산 모델 간의 연관성을 버전화된 데이터 저장소에 저장하는 단계, 및
    후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 로컬 클라우드 서버에 다른 생산 모델을 전송하는 단계이며, 상기 다른 생산 모델은 생산 모델을 다른 생산 모델로 교체하라는 지시와 함께 로컬 클라우드 서버에 전송되는 것인 단계
    를 더 포함하는 것인 시스템.
  93. 제81항 내지 제92항 중 어느 한 항에 있어서, 상기 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 관리 작업의 자동화, 의료 절차 지원, 또는 이들의 임의의 조합과 관련하여 생성되는 것인 시스템.
  94. 제81항 내지 제93항 중 어느 한 항에 있어서, 상기 생산 모델은 하나 이상의 손실 함수의 최소화에 기초하여 훈련에서 도출되는 파라미터를 포함하는 것인 시스템.
  95. 원격 클라우드 서버의 하나 이상의 데이터 프로세서로 하여금 다음을 포함하는 작용들을 수행하도록 구성되는 명령어를 포함하는, 비일시적 기계 판독가능 저장 매체에 유형적으로 구현된 컴퓨터 프로그램 제품:
    로컬 클라우드 서버로부터 복수의 상이한 대상체와 연관된 처리 대상체 데이터를 수신하는 단계이며, 상기 처리 대상체 데이터는 비-식별화되거나, 익명화되거나, 또는 둘 다인 단계,
    상기 처리 대상체 데이터세트를 버전화된 데이터세트와 연관시키는 단계,
    상기 버전화된 데이터세트에 대한 만료 일자를 결정하는 단계,
    상기 원격 클라우드 서버에 액세스할 수 있는 버전 데이터 저장소에 버전화된 데이터세트를 저장하는 단계이며, 상기 버전화된 데이터세트는 만료 일자와 연관하여 저장되는 것인 단계,
    상기 버전화된 데이터세트를 사용하여 생산 모델을 훈련하는 단계,
    상기 버전화된 데이터세트 및 상기 버전화된 데이터세트로 훈련된 생산 모델 간의 연관성을 상기 버전화된 데이터 저장소에 저장하는 단계, 및
    후속 데이터를 분석하고 후속 데이터 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 생산 모델을 로컬 클라우드 서버로 전송하는 단계.
  96. 제95항에 있어서, 상기 로컬 클라우드 서버는 물리적으로 상기 대상체와 동일한 지리적 영역에 위치하는 것인 컴퓨터 프로그램 제품.
  97. 제96항에 있어서, 상기 동일한 지리적 영역은 동일한 국가인 컴퓨터 프로그램 제품.
  98. 제96항 또는 제97항에 있어서,
    상기 처리 대상체 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 보건 데이터이고,
    상기 후속 데이터는 개별적으로 식별가능한 건강 정보를 포함하는 후속 보건 데이터인 컴퓨터 프로그램 제품.
  99. 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 원격 클라우드 서버는 상기 로컬 클라우드 서버와 동일하거나 상이한 지리적 영역에 물리적으로 위치하는 것인 시스템.
  100. 제99항에 있어서, 상기 동일하거나 상이한 지리적 영역은 동일하거나 상이한 국가인 컴퓨터 프로그램 제품.
  101. 제95항 내지 제100항 중 어느 한 항에 있어서, 상기 버전 데이터 저장소는 로컬 클라우드 서버에 액세스할 수 없는 것인 컴퓨터 프로그램 제품.
  102. 제98항 내지 제101항 중 어느 한 항에 있어서, 상기 동일한 지리적 영역이 개별적으로 식별가능한 건강 정보의 사용 및 저장에 관한 데이터 규정 세트를 집합적으로 공유하는 것인 컴퓨터 프로그램 제품.
  103. 제102항에 있어서, 처리 대상체 데이터의 개별적으로 식별가능한 건강 정보는 데이터 규정 세트에 기초하여 비-식별화되었거나, 익명화되었거나, 또는 둘 다인 컴퓨터 프로그램 제품.
  104. 제95항 내지 제103항 중 어느 한 항에 있어서, 상기 만료 일자는 버전화된 데이터세트의 생성 일자, 처리 대상체 데이터의 수신 일자, 처리 대상체 데이터세트와 관련된 동의서 양식의 만료, 또는 이들의 임의의 조합에 기초하여 결정되는 것인 컴퓨터 프로그램 제품.
  105. 제95항 내지 제104항 중 어느 한 항에 있어서, 상기 작용들은,
    원격 클라우드 서버에 액세스할 수 있는 버전화된 데이터 저장소에 생산 모델을 저장하는 단계, 및
    만료 일자를 거쳐감에 응답하여, 버전화된 데이터 저장소로부터 버전화된 데이터세트 및 생산 모델을 삭제 또는 제거하는 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  106. 제95항 내지 제105항 중 어느 한 항에 있어서, 상기 작용들은,
    버전화된 데이터세트 및/또는 다른 버전화된 데이터세트를 사용하여 다른 생산 모델을 훈련하는 단계,
    버전화된 데이터세트 및/또는 다른 버전화된 데이터세트와, 버전화된 데이터세트 및/또는 다른 버전화된 데이터세트로 훈련된 다른 생산 모델 간의 연관성을 버전화된 데이터 저장소에 저장하는 단계, 및
    후속 데이터를 분석하고 후속 데이터의 분석으로부터 추론 또는 예측을 생성하는 데 사용하기 위해 로컬 클라우드 서버에 다른 생산 모델을 전송하는 단계이며, 상기 다른 생산 모델은 생산 모델을 다른 생산 모델로 교체하라는 지시와 함께 로컬 클라우드 서버에 전송되는 것인 단계
    를 더 포함하는 것인 컴퓨터 프로그램 제품.
  107. 제95항 내지 제106항 중 어느 한 항에 있어서, 상기 추론 또는 예측은 진단, 예후, 치료 또는 요법, 치료 또는 요법 프로토콜의 식별, 질병 상태의 검출 또는 결정, 바이오마커의 식별 또는 검출, 치료 또는 요법 비순응성 감소, 운영 비용 감소, 이미지 분석, 치료 또는 요법의 마케팅, 관리 작업의 자동화, 의료 절차 지원, 또는 이들의 임의의 조합과 관련하여 생성되는 것인 컴퓨터 프로그램 제품.
  108. 제95항 내지 제107항 중 어느 한 항에 있어서, 상기 생산 모델은 하나 이상의 손실 함수의 최소화에 기초하여 훈련에서 도출되는 파라미터를 포함하는 것인 컴퓨터 프로그램 제품.
KR1020237018546A 2020-11-10 2021-11-08 인공 지능 도구 개발에 사용되는 대상체 데이터에 대한 프라이버시 보호 컴퓨팅 KR20230104211A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063111993P 2020-11-10 2020-11-10
US63/111,993 2020-11-10
PCT/US2021/058413 WO2022103686A1 (en) 2020-11-10 2021-11-08 Privacy-preserving computing on subject data used to develop artificial intelligence tools

Publications (1)

Publication Number Publication Date
KR20230104211A true KR20230104211A (ko) 2023-07-07

Family

ID=78709565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237018546A KR20230104211A (ko) 2020-11-10 2021-11-08 인공 지능 도구 개발에 사용되는 대상체 데이터에 대한 프라이버시 보호 컴퓨팅

Country Status (6)

Country Link
US (1) US20230259654A1 (ko)
EP (1) EP4244867A1 (ko)
JP (1) JP2023551381A (ko)
KR (1) KR20230104211A (ko)
CN (1) CN116529836A (ko)
WO (1) WO2022103686A1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8553965B2 (en) * 2012-02-14 2013-10-08 TerraRecon, Inc. Cloud-based medical image processing system with anonymous data upload and download

Also Published As

Publication number Publication date
CN116529836A (zh) 2023-08-01
EP4244867A1 (en) 2023-09-20
JP2023551381A (ja) 2023-12-08
US20230259654A1 (en) 2023-08-17
WO2022103686A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
US10719625B2 (en) Dynamic management of data with context-based processing
CN110730156B (zh) 用于异常检测的分布式机器学习
Tuli et al. Next generation technologies for smart healthcare: challenges, vision, model, trends and future directions
Xu et al. Distilling at the edge: A local differential privacy obfuscation framework for IoT data analytics
US11647034B2 (en) Service access data enrichment for cybersecurity
AlZubi et al. Cyber-attack detection in healthcare using cyber-physical system and machine learning techniques
Perera et al. Big data privacy in the internet of things era
Lo et al. Architectural patterns for the design of federated learning systems
Prabhu Fog computing, deep learning and big data analytics-research directions
Mukherjee et al. Leveraging big data analytics in 5G‐enabled IoT and industrial IoT for the development of sustainable smart cities
US20210073393A1 (en) Encryption for machine learning model inputs
Washizaki et al. Software engineering patterns for machine learning applications (sep4mla) part 2
Barati et al. Enhancing user privacy in IoT: Integration of GDPR and blockchain
Majeed et al. A comprehensive analysis of privacy protection techniques developed for COVID-19 pandemic
Rahimi et al. Cloud healthcare services: A comprehensive and systematic literature review
US20210104326A1 (en) Detecting prescription drug abuse using a distributed ledger and machine learning
Grana et al. Electronic health record: A review
Singh et al. TrIDS: an intelligent behavioural trust based IDS for smart healthcare system
Gavai et al. Applying federated learning to combat food fraud in food supply chains
EP4200774A1 (en) Data analytics privacy platform with quantified re-identification risk
Samad et al. Mobile cloud computing
Shirvanian et al. Internet of Things data management: A systematic literature review, vision, and future trends
Roy et al. Towards a Unified Pandemic Management Architecture: Survey, Challenges, and Future Directions
Sadique et al. Enhancing data privacy in the Internet of Things (IoT) using edge computing
US20220318389A1 (en) Transforming dataflows into secure dataflows using trusted and isolated computing environments