KR20230088912A - 인공 지능을 이용해 척수근위축증과 관련된 예측 결과를 생성하기 위한 기법 - Google Patents

인공 지능을 이용해 척수근위축증과 관련된 예측 결과를 생성하기 위한 기법 Download PDF

Info

Publication number
KR20230088912A
KR20230088912A KR1020237016972A KR20237016972A KR20230088912A KR 20230088912 A KR20230088912 A KR 20230088912A KR 1020237016972 A KR1020237016972 A KR 1020237016972A KR 20237016972 A KR20237016972 A KR 20237016972A KR 20230088912 A KR20230088912 A KR 20230088912A
Authority
KR
South Korea
Prior art keywords
subject
sma
data
record
treatment
Prior art date
Application number
KR1020237016972A
Other languages
English (en)
Inventor
실비아 엘레나 몰레로 레온
헬레네 잔느 사리
시그뎀 투어크멘
투랍 타소글루
Original Assignee
에프. 호프만-라 로슈 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에프. 호프만-라 로슈 아게 filed Critical 에프. 호프만-라 로슈 아게
Publication of KR20230088912A publication Critical patent/KR20230088912A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4082Diagnosing or monitoring movement diseases, e.g. Parkinson, Huntington or Tourette
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Neurology (AREA)
  • Computational Linguistics (AREA)
  • Neurosurgery (AREA)
  • Physiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Developmental Disabilities (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Veterinary Medicine (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

척수근위축증(SMA)로 진단된 대상체의 치료를 촉진시키기 위해 인공 지능(AI)을 이용하기 위한 기법이 개시된다. 본 명세서에 개시된 방법 및 시스템은 AI를 이용해 SMA로 진단된 대상체에서 질병 진행을 예측하고, SMA를 앓는 대상체들 간 잠재적 공통점을 검출하여 새로운 또는 기존의 임상 연구를 위한 후보 대상체를 식별하고, SMA를 치료하기 위한 대상체-특이적 치료를 지능적으로 선택하기 위한 기법과 관련된다.

Description

인공 지능을 이용해 척수근위축증과 관련된 예측 결과를 생성하기 위한 기법
관련 출원의 교차 참조
이 출원은 그 전체가 모든 목적으로 참조로서 본 명세서에 포함되는, 2020년11월24일에 출원된 유럽 특허 출원 번호 20211555.6, 발명의 명칭 "Techniques for Generating Predictive Outcomes Relating to Spinal Muscular Atrophy using Artificial Intelligence"의 우선권 및 이익을 주장한다.
기술분야
본 명세서에 개시된 방법 및 시스템은 일반적으로 척수근위축증(SMA: spinal muscular atrophy)로 진단된 대상체의 치료를 촉진시키기 위해 인공 지능(AI: artificial intelligence)을 이용하기 위한 기법과 관련된다. 더 구체적으로, 본 명세서에 개시된 방법 및 시스템은 AI를 이용해 SMA로 진단된 대상체에서 질병 진행을 예측하고, SMA를 앓는 대상체들 간 숨겨진 공통점을 검출하여 새로운 또는 기존의 임상 연구를 위한 후보 대상체를 식별하고, SMA를 치료하기 위한 대상체-특이적 치료를 지능적으로 선택하기 위한 기법과 관련된다.
배경기술
뇌에는 몸 전체의 500개 이상의 근육에서 자발적인 움직임을 제어하는 운동 뉴런이라고 하는 특수 세포가 있다. 운동 뉴런은 척수를 따라 뇌에서 표적 근육으로 신호를 전달하는 긴 섬유인 축삭을 포함한다. 그러나 운동 뉴런의 건강은 생존 운동 뉴런(SMN: survival motor neuron) 단백질이라고 불리는 단백질의 존재에 크게 좌우된다. 5번 염색체에 위치한 유전자인 SMN1은 건강한 운동 뉴런을 유지하기에 충분한 양의 SMN 단백질을 생산한다.
척수근위축증(SMA)이라는 신경근질환이 있는 사람은 SMN1 유전자의 돌연변이로 인해 부족한 양의 SMN 단백질을 생성한다. SMN 단백질의 결핍은 운동 뉴런을 점진적으로 퇴화시킨다. 그러나 퇴행성 운동 뉴런은 수의 운동을 제어하는 뇌 신호가 표적 근육에 도달하는 것을 방해한다. SMN1이 충분한 양의 SMN 단백질을 생산하지 않을 수 있지만 대부분의 사람들은 SMN2 유전자라고 하는 SMN1의 적어도 하나의 기능적 복제본을 가지고 있다. SMN2는 정상 수준의 SMN 단백질의 약 10-20%를 생산할 수 있으므로 적어도 일부 운동 뉴런이 생존할 수 있다. SMA 환자는 일반적으로 주로 근위 근육의 진행성 근육 위축을 경험하여 근력 약화와 쇠퇴를 일으킨다.
SMA는 다양한 고유한 과제를 제시한다. 예를 들어, SMA를 앓는 대상체 전체에 걸쳐 다양한 증상과 증상 중증도가 있다. 따라서 대상체를 치료하기 위한 치료 작업흐름을 정의하는 것은 SMA로 진단된 대상체의 경우 특히 어렵다. SMA-관련 치료는 대상체가 경험하는 질병 진행 상황과 매우 관련이 있을 수 있으므로 특정 치료 일정으로 치료 작업흐름을 정의하는 것은 어렵고 복잡한 작업이다.
종종 대상체를 치료하기 위한 스케줄을 정의하는 것은 예측보다는 증상에 반응한다. 예를 들어, 질병이 진행되는 동안 어떤 근육 그룹이 초기에 약해지고 어느 정도로 약화되는지에 대해 대상체들 간에 큰 변동성이 있다. 대상체는 일반적으로 호흡기에 부담을 주는, 척추를 지탱하는 근육 그룹의 약화를 경험한다. 그러나 일부 대상체의 경우 이 근육 그룹의 위축 진행이 빠른 반면 다른 대상체의 경우 진행이 점진적이다. 또한 특정 대상체는 일상적인 식사 활동에 부담을 주는, 연하를 지원하는 근육 그룹의 약화를 경험한다. 일부 대상체의 경우 연하를 지원하는 근육군이 척추를 지지하는 근육군보다 먼저 약해지는 반면, 다른 대상체의 경우 근육군 퇴행의 순서가 반대이다. 연하를 지원하는 근육이 약해진 환자를 치료하는 것은 척추를 지지하는 근육이 약해진 환자를 치료하는 것과 매우 상이하다. 일반적으로 개별 대상체에 대한 치료를 정의하는 것은 대상체의 증상을 면밀히 모니터링하고 그에 따라 치료로 대응하는 것을 포함한다.
SMA에 고유한 문제를 설명하는 또 다른 예에서, 한 가지 치료는 유전자 대체 요법을 사용하여 SMN 단백질의 발현을 증가시키는 것과 관련된다. 그러나 SMN 단백질 발현의 증가는 치료 창 내에서 수행될 때에만 대상체의 운동 기능을 향상시킨다. 예를 들어, 동물 모델에서 SMN 복원 요법을 수행하는 것은 출생 후 첫 3일 이내에 치료제가 전달되는 경우에만 운동 기능 개선에 효과적이다. 동일한 요법을 출생 후 10일 이상 경과하면 전혀 효과가 없을 수 있다. 운동 기능을 개선하기 위한 특정 SMN 요법을 전달할 수 있는 시간 창이 좁으며 해당 창은 각 대상체의 상황과 관련이 있다. 새로운 대상체(가령, 환자)의 경우 SMN 단백질 발현을 위한 치료 창을 식별하는 것이 기술적으로 어렵고 복잡한 작업이다. 종종, 새로운 대상체에 대한 치료 및 치료 스케줄을 식별하는 것은 새로운 대상체의 많은 상이하고 복잡한 속성을 이전에 치료된 동일한 대상체와 수동으로 비교하는 것을 포함한다.
SMA를 앓는 대상체들 전체에서 증상의 중증도도 매우 다양하다. 증상 중증도는 예를 들어, 증상 개시와 진단 또는 치료 사이의 시간, SMA 유형, 대상체의 일상 활동 등을 포함하는 다양한 인자에 기초할 수 있다. 진단된 SMA 유형의 주어진 대상체의 가능한 중증도 및/또는 향후 SMA-관련 이벤트의 타이밍에 대한 통찰력을 얻는 것은 어렵다. 이러한 이유로 치료가 너무 늦게 수행될 수 있다. 연구에 따르면 평균적으로 SMA 1형 환자는 진단되고 증상 발현 후 4개월 동안 치료를 받으며, SMA 3형 환자는 진단되고 증상 발현 후 10개월 동안 치료를 받는 것으로 나타났다.
또한 데이터 가용성 부족은 SMA 상황에서 또 다른 고유한 문제이다. SMA는 출생 10,000명당 1명꼴로 발생하기 때문에 희귀 질환으로 특징지어진다. 숙련된 의사는 자신의 전체 경력에 걸쳐 SMA를 앓는 대상체를 치료할 기회가 없을 수도 있다. 지역 수준에서도 이전에 치료 받은 SMA 대상체의 수가 적을 수 있다. 새로 SMA로 진단된 대상체를 치료하는 의사는 새로운 대상체에 대한 새로운 치료 스케줄을 알리기에 충분한 양의 데이터에 액세스하지 못할 수 있다. 또한, 임상 연구를 사용하여 SMA 대상체에 대한 새로운 치료법을 테스트하는 것은 병원 또는 지역 수준에서 대상체의 가용성이 희박할 수 있다는 점을 감안할 때 어려운 일이다.
Bai Tian외 ("EHR phenotyping via jointly embedding medical concepts and words into a unified vector space", BMC Medical Informatics and Decision Making, vol. 18, no. S4, 1 December 2018 (2018-12-01 ), page 13, XP055804407, DOI: 10.1186/s12911-018-0672-0)이 전자 건강 기록(EHR) 데이터의 이종 속성을 해결하고 (1) 진단 의료 코드 및 (2) 임상 메모로부터의 단어 모두를 동일한 연속 벡터 공간에 포함시켜 이들 간 연결을 구축함으로써 환자 표현형에 대한 통찰을 획득하기 위한 예측 모델링을 개시한다. 이의 벡터 표현의 품질을 평가하기 위해 Tian외는 두 가지 유형의 실험을 개시한다: (1) 벡터 공간에서 코드와 단어 사이의 연관성을 평가함에 의한 표현형 및 치료법 발견, 및 (2) 첫 진료에서 벡터 공간 내 코드와 단어 사이의 연관관계를 평가함에 의한 두 번째 진료 동안 환자에게 할당될 코드 예측. Tian외는 기본 방법으로 6가지 질병, 즉, 급성 간부전, 여성 유방암, 정신분열증, 뇌의 병태, 우울증 및 HIV를 평가했는데, 그 중 어느 것도 SMA만큼 희귀하거나 치료하기 어려운 것이 아니다.
따라서 SMA로 진단된 개별 대상체의 치료 효능을 향상시키기 위해서는 SMA 치료의 개별화된 선택, 치료 스케줄의 개별화된 식별 및 새로운 임상 연구를 위한 대상체 군의 형성을 개선할 필요가 있다.
일부 실시예에서, 컴퓨터로 구현되는 방법이 제공된다. 컴퓨터로 구현되는 방법은 대상체와 연관된 대상체 레코드를 불러오고 대상체 레코드에 포함된 특징의 세트의 서브세트를 추출하는 단계를 포함할 수 있다. 예를 들어, 대상체 레코드는 대상체를 특징짓는 특징의 세트를 포함할 수 있다. 대상체는 이전에 척수근위축증(SMA)으로 진단된 적이 있을 수 있다. 또한, 특징의 세트의 서브세트의 각각의 특징이 SMA 특성과 연관될 수 있다. 컴퓨터로 구현된 방법은 또한 특징의 세트의 서브세트를 하나 이상의 단어의 시퀀스로 조합함으로써 부분 단어 시퀀스를 생성하는 단계를 더 포함할 수 있다. 상기 하나 이상의 단어의 각각의 단어는 특징의 서브세트의 하나씩의 특징을 나타낸다. 컴퓨터로 구현되는 방법은 훈련된 단어-벡터 모델(word-to-vector model)을 사용하여 부분 단어 시퀀스를 숫자 표현으로 변환하는 단계를 포함할 수 있다. 컴퓨터로 구현되는 방법은 부분 단어 시퀀스를 완성하기 위한 완성 단어 또는 구를 예측하도록 훈련된 자연어 처리(NLP: natural language processing) 모델에 부분 단어 시퀀스의 숫자 표현을 입력하는 단계를 더 포함할 수 있다. 컴퓨터로 구현된 방법은 NLP 모델에 의해 출력된 완성 단어 또는 구에 기초하여, 일정 기간 동안 대상체에 특이적인 하나 이상의 SMA 표현형의 예측된 진행을 나타내는 질병 진행을 생성하는 단계를 더 포함할 수 있다. 컴퓨터로 구현된 방법은 대상체가 질병 진행에 포함된 하나 이상의 SMA 표현형을 보인다고 예측된다는 지시자를 출력하는 단계를 더 포함할 수 있다.
일부 실시예에서, 하나 이상의 데이터 프로세서 및 하나 이상의 데이터 프로세서 상에서 실행될 때, 상기 하나 이상의 데이터 프로세서로 하여금 본 명세서에 개시된 하나 이상의 방법 중 일부 또는 전부를 수행하게 하는 명령을 포함하는 비일시적 컴퓨터 판독형 저장 매체를 포함하는 시스템이 제공된다.
일부 실시예에서, 하나 이상의 프로세서로 하여금 본 명세서에 개시된 하나 이상의 방법 중 일부 또는 전부를 수행하게 하도록 구성된 명령을 포함하며, 비일시적 기계 판독형 저장 매체 내에 유형적으로(tangibly) 구현되는 컴퓨터 프로그램 프로덕트가 제공된다.
본 개시내용의 일부 실시예는 하나 이상의 프로세서를 포함하는 시스템을 포함한다. 일부 실시예에서, 시스템은 하나 이상의 데이터 프로세서 상에서 실행될 때, 상기 하나 이상의 프로세서로 하여금 본 명세서에 개시된 하나 이상의 방법 중 일부 또는 전부 및/또는 하나 이상의 프로세스 중 일부 또는 전부를 수행하게 하는 명령을 포함하는 비일시적 컴퓨터 판독형 저장 매체를 포함한다. 본 개시내용의 일부 실시예는 비일시적 기계 판독형 저장 매체 내에 유형적으로 구현되며, 하나 이상의 데이터 프로세서로 하여금 본 명세서에 개시된 하나 이상의 방법 중 일부 또는 전부 및/또는 하나 이상의 프로세스 중 일부 또는 전부를 수행하게 하도록 구성된 명령을 포함하는 컴퓨터-프로그램 프로덕트를 포함한다.
채용된 용어 및 표현은 한정이 아닌 설명 측면에서 사용되며, 이러한 용어 및 표현의 사용에 도시되고 기재된 특징부 또는 이의 일부분의 임의의 균등물을 배제하는 어떠한 의도도 없고, 청구된 발명의 범위 내에서 다양한 수정이 가능함이 자명하다. 따라서, 본 발명이 실시예 및 선택적 특징으로 특정하게 개시되었지만 본 명세서에 개시된 개념의 수정, 및 변형이 해당 분야의 통상의 기술자에 의해 이용될 수 있고, 이러한 수정 및 변형이 첨부된 청구항에 의해 정의된 본 발명의 범위 내에 있는 것으로 간주됨이 이해될 것이다.
본 개시내용은 첨부된 도면과 함께 설명된다:
도 1은 본 개시내용의 일부 양태에 따른 클라우드-기반 애플리케이션이 호스팅되는 네트워크 환경을 예시한다.
도 2는 본 개시의 일부 양태에 따른, 대상체 치료에 대한 지원을 요청하는 상담 방송과 연관하여 요약 대상체 레코드를 사용자 장치로 배포하기 위해 클라우드-기반 애플리케이션에 의해 수행되는 프로세스의 예를 예시하는 흐름도이다.
도 3은 본 개시내용의 일부 양태에 따라, 치료-계획 정의(가령, 의사 결정 트리 또는 치료 작업흐름)의 사용자 통합을 모니터링하고 모니터링의 결과에 기초하여 치료-계획 형성을 자동으로 업데이트하기 위한 프로세스의 예를 나타내는 흐름도이다.
도 4는 본 개시내용의 일부 양태에 따른, 대상체에 대한 치료를 추천하기 위한 프로세스의 예를 예시하는 흐름도이다.
도 5는 본 개시내용의 일부 양태에 따른, 데이터-프라이버시 규칙을 준수하기 위해 쿼리 결과를 난독화하기 위한 프로세스의 예를 예시하는 흐름도이다.
도 6은 본 개시내용의 일부 양태에 따른, 봇 스크립트, 가령, 챗봇을 이용해 사용자와 통신하기 위한 프로세스의 예를 예시하는 흐름도이다.
도 7은 본 개시내용의 일부 양태에 따라, 대상체에 대한 치료 및 치료 스케줄의 대상체-특이적 식별을 용이하게 하기 위해 훈련된 인공 지능 모델을 배치하기 위한 네트워크 환경의 예를 도시하는 블록도이다.
도 8은 본 개시내용의 일부 양태에 따라, SMA로 진단된 대상체에 대한 질병 진행을 예측하기 위해 훈련된 인공 지능 모델을 배치하기 위한 네트워크 환경의 예를 예시하는 블록도이다.
도 9는 본 개시내용의 일부 양태에 따라, 새로운 또는 기존 임상 훈련에 대한 후보 대상체를 지능적으로 식별하기 위한 네트워크 환경의 예를 예시하는 블록도이다.
도 10은 본 개시내용의 일부 양태에 따라, 치료를 지능적으로 선택하기 위해 훈련된 인공 지능 모델을 배치하기 위한 네트워크 환경의 예를 나타내는 블록도이다.
도 11은 본 개시내용의 일부 양태에 따라, SMA로 진단된 대상체의 질병 진행을 예측하기 위한 프로세스의 예를 예시하는 흐름도이다.
도 12는 본 개시내용의 일부 양태에 따라, 새로운 또는 기존 임상 연구에 대한 후보 대상체를 지능적으로 식별하기 위한 프로세스의 예를 예시하는 흐름도이다.
도 13은 본 개시내용의 일부 양태에 따라, SMA로 진단된 대상체에 수행될 치료의 선택을 촉진시키기 위해 인공 지능 모델을 배치하기 위한 프로세스의 예를 예시하는 흐름도이다.
첨부된 도면에서, 유사한 구성요소 및/또는 특징이 동일한 참조 라벨을 가질 수 있다. 또한, 동일한 유형의 다양한 구성요소는 참조 라벨 뒤의 대시와 유사한 구성 요소를 구별하는 두 번째 라벨로 구분할 수 있다. 명세서에서 첫 번째 참조 라벨만 사용되는 경우 두 번째 참조 라벨과 관계없이 동일한 첫 번째 참조 라벨을 가진 유사한 구성요소 중 하나에 설명이 적용된다.
I. 개요
유럽에서 희귀 질환은 2,000명 중 1명 미만이 발병하는 질병으로 정의된다. SMA는 유럽에서 영아 사망의 주요 유전적 원인 중 하나이지만 SMA는 유럽에서 약 10,000명의 개인이 SMA의 영향을 받는 것을 감안할 때 여전히 희귀 질환이다. SMA로 진단된 대상체의 모집단은 몇 가지 고유한 과제를 제시한다. 우선, 숙련된 의사가 자신의 전체 경력에 걸쳐 SMA를 앓는 대상체를 치료할 기회가 없을 수도 있다. 병원 또는 지역 수준에서도 이전에 치료 받은 SMA 대상체의 수가 적을 수 있다. SMA을 앓는 대상체를 진단하고 치료한 경험이 없으면 대상체를 올바르게 치료하는 것이 어려울 수 있다. 소수의 대상체가 SMA에 의해 영향을 받기 때문에, SMA의 병태생리학적 메커니즘에 대한 통찰력을 얻고 새로운 치료법을 검사하는 것이 제한적이다.
둘째, SMA는 질병 진행과 표현형의 중증도가 각 SMA 유형 내에서 광범위하게 다르다는 점에서 고유하다. SMA는 일반적으로 근위 근육의 퇴화를 유발하지만 SMA의 영향을 받을 수 있는 골격근은 500개가 넘는다. 따라서 SMA의 표현형과 표현형의 중증도는 대상체들에 걸쳐 광범위한 스펙트럼에 있다. 예를 들어, 특정 대상체는 처음에 연하 동작을 돕는 인두 근육의 퇴행을 경험하는 반면, 다른 대상체는 처음에 보행 동작 동안 무릎 확장을 돕는 허벅지 주변 근육의 퇴행을 경험한다. 이 두 대상체 그룹에 대한 초기 치료는 매우 다르다. 연하 곤란을 겪는 대상체는 영양사에 의해 반고형식으로 치료받을 수 있으며, 보행 곤란을 겪는 대상체는 허벅지 근육의 피로를 줄이기 위한 치료로 휠체어나 지팡이를 제공받을 수 있다. 따라서, 치료 및 치료 스케줄을 식별하는 것은 종종 증상 발현에 앞서 또는 증상의 중증도가 증가하기 전에 예측하는 대신 증상의 발현에 반응하여 알려진다.
본 발명의 특정 양태는 SMA 특이적 과제를 해결하기 위해 AI 시스템으로 구성된 클라우드 기반 애플리케이션을 제공한다. AI-기반 기법은 최근 희귀 질병의 진단 및 치료를 변화시키는 데 사용되었다. AI 기법이 사용되어 상이한 소스로부터 다양한 유형의 데이터 세트(가령, 구조화된 데이터 세트, 비구조화된 데이터 세트, 스트리밍 데이터 등) 간의 패턴 및 상관관계를 학습할 수 있다. 예를 들어, 희귀 질환은 제한된 수의 대상체가 지리적으로 분산되어 있는 것이 특징이지만 AI 기법이 실행되어 SMA에 대한 케어 라인 개선과 새로운 치료법 개발을 촉진할 수 있다.
본 개시내용의 특정 양태는 특정 예측 기능, 가령, SMA를 앓는 특정 대상체에 대한 질병 진행 예측, 새로운 또는 기존 임상 연구를 평가 또는 등록하기 위한 후보 대상체 그룹 예측, 또는 특정 대상체에 특이적인 콘텍스트 치료 스케줄을 예측하는 기능을 수행하도록 구성된 AI 시스템에 관한 것이다.
도 8 및 11과 관련하여 더 상세히 기재된 바와 같이, 본 개시내용의 특정 양태는 SMA로 진단된 특정 대상체의 질병 진행을 예측하기 위한 기법과 관련된다. AI 시스템은 AI 모델, 가령, 자연어 처리(NLP) 모델 또는 SMA 환자의 질병 진행을 나타내는 단어 시퀀스(가령, 문장)에서 훈련할 수 있다. 이전에 치료 받은 SMA 환자의 질병 진행을 나타내는 단어 시퀀스에서 NLP 모델을 훈련함으로써 AI 모델이 해당 단어 시퀀스의 다양한 단어 조합 내 패턴을 학습할 수 있다. 그런 다음 훈련된 AI 모델은 특정 대상체의 현재 건강 상태를 입력으로서 수신할 수 있다. 일부 구현예에서, 훈련된 AI 모델은 특정 대상체의 현재 건강 상태를 부분 단어 시퀀스로 처리한 다음, 부분 단어 시퀀스를 완성할 가능성이 있는 다음 단어의 예측을 생성한다. 예측된 다음 단어는 특정 대상체에 대한 예측된 미래 질병 진행을 나타낸다. 예를 들어, 예측된 질병 진행은 SMA-특이적 표현형, 증상, 또는 특정 대상체가 질병의 과정에 걸쳐 나타날 것으로 예측되는 다른 질병 관련 이벤트의 변화를 나타낼 수 있다.
도 9 및 12와 관련하여 더 상세히 기재되는 바와 같이, 본 개시내용의 특정 양태는 새로운 또는 기존 임상 연구에 등록하기에 적합한 후보로 예측되는 대상체의 그룹을 지능적으로 식별하는 기법에 관한 것이다. 예를 들어, 임상 연구에서 조사되고 있는 치료가 대상체에게 효과적일 것으로 예상될 때 대상체는 임상 연구에 등록하기에 적합한 후보이다. 일부 구현에서, 고차원 대상체 레코드에 기초하여 대상체 그룹을 지능적으로 식별하는 것은 대상체 레코드의 하위공간 클러스터링(예를 들어, k-평균 클러스터링의 경우에서와 같이 단지 1차원 또는 2차원만이 아닌 많은 차원을 따른 클러스터링)의 계산 효율성을 개선하기 위해 대상체 레코드의 차원을 선택적으로 줄이는 것을 포함한다. 감소된-차원 대상체 레코드가 사용되어 새로운 또는 기존 임상 연구에 적합한 후보가 될 수 있는 대상체의 새로운 그룹을 자동으로 예측할 수 있다. 예를 들어, 특정 구현예에 따르면, 이탈리아의 한 병원에서 SMA 치료를 받고 있는 40명의 대상체가 특정 물리 치료 후 운동 기능의 개선을 경험하고, 보고타의 연구 시설에서 SMA 치료를 받고 있는 17명의 대상체가 동일한 물리 치료 후 또한 운동 기능의 유사한 개선을 경험한다면, AI 시스템은 대상체에 대응하는 데이터 레코드를 처리하여 대상체의 이들 두 그룹에 공통적인 잠재 특징을 검출할 수 있다. 또한 AI 시스템이 공유되는 잠재 특징, 가령, 대상체 간에 공유되는 특정 바이오마커를 검출한 후, 대상체의 두 그룹이 특정 바이오마커를 조사하는 기존 임상 연구에서 등록될 수 있고, 기존 임상 연구가 존재하지 않는 경우 새로운 임상 연구가 특정 바이오마커를 조사하도록 제안될 수 있다.
도 10 및 13과 관련하여 더 상세히 기재될 바와 같이, 본 개시내용의 특정 양태가 치료를 선택할 때 대상체-특이적 데이터 세트(가령, 특정 대상체의 대상체 레코드)에 상황적으로 기초하는 지정 보상 기능을 최대화하도록 훈련된 치료 선택 시스템을 이용해 가용 치료의 그룹 중에서 치료를 지능적으로 선택하기 위한 기법과 관련된다. 훈련된 AI 모델의 출력은 특히 SMA를 앓는 특정 대상체에 대해 치료 효능의 가장 높은 확률, 질병 진행 속도 저하, 생존 기간 연장 등을 달성하기 위해 어떤 치료를 선택해야 하는지 예측할 수 있다.
애플리케이션(가령, 장치에서 로컬로 작동 및/또는 하나 이상의 원격 및/또는 클라우드 서버에서 수행된 계산 결과를 적어도 부분적으로 사용)은 (예를 들어) SMA를 앓는 대상체 및/또는 SMA를 앓는 대상체에게 치료를 제공하는 의료 제공자에 의해 사용될 수 있다. 애플리케이션은 본 명세서에 개시된 하나 이상의 동작을 수행할 수 있다. 일부 경우에서, 하나 이상의 애플리케이션이 SMA를 앓는 대상체와 의료 제공자 간 통신을 촉진시킬 수 있다. 그러한 통신은 (예를 들어) 의료 제공자에게 비정상적인 척추 지지 근육 약화를 경고하는 것을 용이하게 할 수 있고/있거나 원격 의료를 용이하게 할 수 있다(예를 들어, 이는 대상체 또는 지역 사회의 일부가 전염병에 걸렸을 때, 대상체가 이동 장애를 가질 때 및/또는 대상체가 의료 제공자의 사무실에서 물리적으로 멀리 떨어져 있는 경우에 특히 유용할 수 있다).
II. 척수근위축증(SMA) 아형, 진단 프로토콜, 관련 의학적 검사, 진행 평가 및 가용한 치료의 요약
II.A. SMA의 유전적 원인
SMA는 자발적 운동에 사용되는 골격근의 위축을 특징으로 하는 신경근 질병이다. SMA를 앓는 대상체는 척수 전각에 위치한 특정 신경 세포의 진행성 퇴화를 경험한다. 척수 운동 뉴런이라고 하는 이들 신경 세포는 근육의 움직임을 제어한다. 운동 뉴런의 퇴화는 골격근을 약화시키고 대상체에서의 전반적인 약화를 유발한다.
SMA의 유전적 원인은 5번 염색체에 위치한 생존 운동 뉴런 1(SMN1) 유전자의 돌연변이이다. 건강한 개체에서 SMN1 유전자는 운동 뉴런의 생존에 필요한 단백질인 생존 운동 뉴런(SMN) 단백질을 생성한다. SMN1 유전자는 운동 뉴런이 생존하는 데 필요한 전체 양의 SMN 단백질을 생산한다. 그러나 SMA의 영향을 받는 개체의 경우 SMN1 유전자는 엑손 7 또는 다른 점 돌연변이에서 발생하는 결실로 인해 돌연변이된다. SMN1 유전자 5번 염색체의 엑손 7에서의 결실은 SMN1 유전자가 생산하는 SMN 단백질의 양을 감소시키거나 SMN 단백질의 생산을 아예 막는 원인이 된다.
SMN1은 건강한 운동 뉴런을 지원하는 SMN 단백질을 비효율적으로 생산하는 생존 운동 뉴런 2(SMN2) 유전자라고 하는 적어도 하나의 기능적 본제본을 가지고 있다. 예를 들어, SMN2 유전자는 운동 뉴런 생존에 필요한 정상 수준의 SMN 단백질의 약 10-20%를 생산할 수 있다. SMN1과 SMN2는 엑손 7의 단일 뉴클레오티드를 제외하고 거의 동일하기 때문에 SMN1과 SMN2는 동일한 SMN 단백질을 다른 양으로 생산한다. 그러나 궁극적으로 충분한 SMN 단백질이 없으면 운동 뉴런이 제대로 기능할 수 없고 결국 수축하고 죽기 때문에 쇠약해지고 때로는 치명적인 근육 약화로 이어진다.
경우에 따라 SMA는 5번 염색체에 있는 SMN1 유전자의 돌연변이 결과가 아니라 다른 염색체에 있는 다른 유전자의 돌연변이 결과일 수 있다. 예를 들어, 상염색체 열성 원위 척수근위축증(DSMA1)으로 지칭될 수 있는, 호흡 곤란을 동반한 척수근위축증(SMARD)은 SMN1 유전자의 돌연변이에 의해 발생하지 않는다. 대신, SMARD는 11번 염색체의 장완에 위치한 IGHMBP2 유전자의 돌연변이로 인해 발생한다. SMARD를 앓는 대상체는 심각한 호흡 곤란과 근육 약화를 겪는다.
SMA의 대부분의 형태, 가령, 염색체 5 돌연변이와 관련된 형태가 근위 근육에 영향을 미치지만, 다른 형태의 SMA가 원위 근육에 영향을 미친다. 원위 근육의 위축의 유전적 원인으로는 X 염색체에 위치한 UBA1 유전자, 14번 염색체에 위치한 DYNC1H1 유전자, 12번 염색체에 위치한 TRPV4 유전자, 1번 염색체에 위치한 PLEKHG5 유전자, 7번 염색체에 위치한 GARS 유전자, 및 5번 염색체에 위치한 FBXO38 유전자의 돌연변이를 포함할 수 있다. 앞서 나열된 UBA1 유전자는 X-연결 SMA(가령, XL-SMA 또는 SMAX2)를 유발할 수 있다. X-연결 SMA는 SMA 1형과 유사하지만 X-연결 SMA에서는 관절도 영향을 받을 수 있다. X-연결 SMA의 다른 증상으로는 저긴장, 자극에 대한 반응 결여, 선천성 구축 등이 있다.
II.B. SMA의 유형
SMA는 일반적으로 대상체의 생애 초기에 나타나며 영유아 사망의 주요 유전적 원인이며, 출생 10,000건 중 약 1건에 영향을 미친다. 대략 40-60명 중 한 명은 SMA를 유발하는 SMN1 유전자 돌연변이의 보인자이다. SMA는 상염색체 열성 패턴으로 유전되며 인종 간 발생률에는 큰 차이가 없다. 부모 모두 SMN1 유전자 돌연변이의 보인자인 경우 신생아가 SMA를 앓을 확률은 대략 25%이다.
SMA에는 네 가지 기본 유형이 있다: 1형, 2형, 3형 및 4형, 그리고 매우 드물고 심각한 추가적인 0형. SMA 유형은 증상이 시작되는 연령과 운동 발달에서 가장 높은 달성 이정표에 따라 상이하다.
II.B.1. SMA 0형
SMA 0형은 SMA 질병의 매우 드문 산전 형태이다. SMA 0형은 대상체 태아가 출생 전에 심각한 SMA 증상을 보이기 때문에 자궁 내에서 검출 가능하다. 예를 들어, 0형으로 진단된 대상체 태아는 하지에 전반적인 골감소증을 나타냈다.
SMA 0형은 일반적으로 증상이 자궁 내에서 시작되어 저긴장증, 안면 쇠약으로 이어지는 치명적인 예후를 가지며 대상체 영아는 생후 처음 몇 주에서 3개월 이내에 사망에 이를 수 있다. SMN1 유전자의 동형접합 돌연변이가 SMA 0형의 원인일 수 있다. 이용 가능한 진단 테스트가 SMN1 유전자의 동형접합 결실을 입증하는 SMN1 엑손 7의 부재를 보여줄 수 있다.
또한, SMA 0형 대상체는 자궁 내 근육 운동 감소, 중증 질식, 심한 근긴장저하, 출생 시 호흡 부전, 소생술 및 인공호흡기 지원의 필요성을 나타냈다. 또한 대상체의 긴장하는 모습이 일관되게 관찰되었다.
II.B.2. SMA 1형
베르드니히-호프만(Werdnig-Hoffman)병으로도 알려진 SMA 1형은 일반적으로 생후 첫 몇 달 동안 나타난다. SMA 1형의 가장 중증의 형태는 빠르고 예상치 못한 발병이 있다. 질병이 진행됨에 따라 급속한 운동 뉴런 사망이 주요 신체 기관, 특히 호흡기 시스템의 무능을 유발한다. 폐렴으로 인한 호흡 부전이 가장 흔한 사망 원인이다. 치료하지 않고 호흡 지원이 없다면 SMA 1형으로 진단된 영아는 일반적으로 2세 이상 생존하지 못한다. 적절한 호흡 지원을 받으면 경미한 SMA 1형 표현형을 가진 대상체는 청소년기와 성인기까지 생존할 수 있다.
II.B.3. SMA 2형
두보위츠(Dubowitz)병이라고도 알려진 SMA 2형은 생애의 어느 시점에서 앉은 자세를 유지할 수 있었지만 지지 없는 보행을 학습한 적이 없는 개체에게 영향을 미친다. SMA 2형의 발병은 일반적으로 생후 6개월에서 18개월 사이에 발생하며 어떤 소아는 점차 약해지고 또 다른 소아는 상대적으로 안정적으로 유지되기 때문에 진행이 크게 다르다. 척추측만증이 일반적으로 이러한 소아에게 나타나며 척추 교정이 호흡을 개선할 수 있다. 기대 수명은 감소하지만 대부분의 SMA 2형 환자는 성인기까지 잘 산다.
II.B.4. SMA 3형
쿠겔베르그-벨란데르(Kugelberg-Welander) 질병으로도 알려진 SMA 3형은 일반적으로 생후 12개월 이후에 나타나는 유형(juvenile form)의 질병이다. SMA 3형 환자는 나중에 이 능력을 상실하더라도 적어도 평생 동안은 지지 없이 걸을 수 있는 능력이 있는 것으로 특징지어진다. 이 형태의 질병에서는 호흡기 침범이 덜 빈번하며 기대 수명은 정상이거나 정상에 가깝다.
II.B.5. SMA 4형
SMA 4는 일반적으로 30세 이후에 다리 근육이 점차적으로 약해지며 이동 보조 장치를 사용해야 하는 성인 발병 형태의 질병이다. 다른 합병증은 드물고 평균 수명은 정상이다.
II.B.6. SMA 아형에 걸친 표현형의 중증도
SMA를 앓는 모든 대상체는 SMN1 유전자의 SMN2 복제본을 적어도 하나 가지고 있다. 주어진 대상체에 대해, 대상이 갖는 SMN2 유전자 복제 수가 SMA 표현형의 중증도와 상관관계가 있기 때문에 SMN2 복제 수가 대상체의 예후에 영향을 미친다. 예를 들어, 대상체가 가진 SMN2 유전자 복제 수가 많을수록 증상이 경미하고 증상의 발병이 늦다. 더 많은 수의 SMN2 유전자 복제가 존재할수록 더 많은 기능적 SMN 단백질을 사용할 수 있으므로 운동 뉴런의 생존 증가로 인해 질병 증상의 발병이 늦어진다.
따라서 SMA 아형들에 걸친 SMA의 중증도는 대상체가 가진 SMN2 본사본의 수에 의해 영향을 받는다. 예를 들어, SMA-1 대상체의 약 70%는 2개의 SMN2 복제본을 가지고 있고 SMA-2 대상체의 82%는 3개의 SMN2 복제본을 가지고 있다. 그러나 SMA-3을 앓는 대상체는 압도적으로 최소 3~4개의 SMN2 복제를 가지고 있다. SMN1 유전자는 SMN 단백질의 전장 mRNA의 대략 100%를 생성한다. 그러나 SMN2 유전자는 엑손 7이 없는 SMN 단백질의 전사체를 생성한다. 그 결과, SMN2 유전자에 의해 암호화하는 SMN 단백질의 약 10%가 정확하게 스플라이싱되어 SMN1과 동일한 단백질을 암호화한다. 따라서 더 많은 SMN2 복제본이 SMN 단백질의 결핍을 감소시킨다.
II.C. SMA 아형의 진단
SMA를 진단하는 것은 일련의 단계를 포함한다. 초기에 의사는 원내 신체 검사를 수행하고 대상체의 가족력을 검토할 수 있다. 유전자 검사가 수행되어야 하는지 여부를 결정하기 위해 특정 비침습적 검사가 수행될 수 있다. 비침습적 검사는 의사가 SMA를 다른 신경근 상태(가령, 근이영양증)와 구별하는 데 도움이 된다. 예를 들어, 대상체가 걸을 수 있는 경우 의사는 해머스미스 운동 기능 척도 확장판(HFMSE: Hammersmith Functional Motor Scale-Expanded) 검사 및 6분 걷기 검사(6MWT: 6-Minute Walking Test)와 같은 운동 기능 검사를 수행할 수 있다. HFMSE 및 6MWT 운동 기능 테스트는 SMA 표현형 중증도 예측과 높은 상관관계가 있다. 또한, 의사는 SMA와 연관된 운동 기능 문제의 존재에 대한 조기 지시자인 근력 약화 및 근력 저하를 평가할 수 있다. 그 밖의 다른 평가는 운동 기능 장애, 운동 기능 상실, 근위 근육 약화, 반사의 부재, 혀 다발수축 및 그 밖의 다른 운동 뉴런 퇴화 지시자에 대해 대상체를 평가하는 것을 포함할 수 있다. 또한, SMA에 대한 진단적 유전자 검사를 촉구하는 가장 흔한 증상은 진행성 양측 근력 약화(보통 상완 및 다리), 종 모양의 흉부 및 반사 부재와 연관된 근력 저하를 포함한다. 이들 증상은 SMA 0형 및 SMA 1형 대상체에서 더 흔하고 종종 심각하다.
크레아틴 키나제에 대한 혈액 검사는 크레아틴 키나제가 약화된 근육에서 배출되는 효소이기 때문에 SMA의 가능성을 나타낼 수 있다. 크레아틴 키나제 효소 수준이 다중 신경근 질병에 대한 역치 수준 이상이더라도, 그러한 혈액 검사의 결과는 그럼에도 불구하고 대상체를 진단하는 의사에게 유익하다. 크레아틴 키나제 효소의 수치는 SMA 1형을 앓는 특정 대상체에 대해 정상일 수 있지만, 크레아틴 키나제 수치는 SMA 2형 및 3형을 진단하는 데 유익할 수 있다.
대상체의 증상에 대한 조기 평가가 SMA와 연관된 운동 기능 문제를 나타내는 경우 대상체에 대해 유전자 검사가 수행될 수 있다. SMA 진단은 유전자 검사를 통해서만, 가령, 예를 들어, 엑손 7의 이중 대립유전자 결실 또는 SMN1 유전자의 그 밖의 다른 다른 점 돌연변이를 검출함으로써, 확인될 수 있다. 유전자 검사에 그 밖의 다른 방법이 사용될 수 있지만 MLPA(Multiplex ligation-dependent probe amplification)가 종종 사용되는데, 이 방법은 대상체에서 SMN2 유전자 복제의 수를 검출할 수도 있기 때문이다. 여러 MLPA 유전자 검사 키트, 예를 들어 Asuragen의 Amplidex PCT/CE SMN1/2 키트, 및 SMN1 및 SMN2 검사의 MLPA를 통한 예방 유전학의 척추 근육 위축(Prevention Genetics' Spinal Muscular Atrophy)이 상업적으로 이용 가능하다.
유전자 검사에 추가하여 또는 이를 대신하여 근전도 검사(EMG) 검사가 수행될 수 있다. EMG 검사는 근육 또는 근육 군의 전기적 활동을 측정하며, 필요에 따라 근육 생검 및/또는 크레아틴 키나제(CPK) 검사가 또한 SMA를 진단하고 다른 유형의 신경근 질병과 진단을 구별하는 데 사용될 수 있다.
중증 SMA, 가령, SMA 0형 및 SMA 1형의 조기 단계를 진단하기 위해 증상이 있는 개체의 진단 검사 외에도 산전 유전자 검사 및 신생아 선별검사를 수행할 수 있다.
II.D. SMA에 대한 신생아 선별검사
SMA에 대한 신생아 선별검사는 영아의 생후 처음 며칠 동안 신생아에 대한 일상적인 선별검사의 일부가 될 수 있다. SMA에 대한 신생아 선별검사는 신생아의 혈액에 대한 유전자 검사다. 유전자 검사는 SMN1 유전자와 연관된 이상이 있는지 신생아 대상체의 혈액 샘플을 평가하는 것을 포함한다. 혈액에 대한 유전자 검사는 침습적이지만 SMA에 대한 신생아 선별검사는 다른 장애 선별을 위해 이미 수집된 동일한 혈액 샘플을 사용한다. 신생아의 혈액 샘플 분석의 결과가 신생아가 5번 염색체에 위치한 SMN1 유전자의 일부가 결손된 것으로 나타나면 신생아가 SMA를 가질 가능성이 높거나 그럴 위험이 있다. 영아 대상체가 SMA를 가지고 있는지 여부를 결정하고, 그렇다면 영아 대상체를 위한 표적 치료를 식별하기 위해 추가 테스트가 수행될 수 있다.
특정 연구에 따르면, 예를 들어 SMA에 대해 미국에서 모든 신생아를 선별하면 매년 장애가 있는 약 364명의 신생아를 발견할 수 있었다. 또한 광범위한 신생아 선별검사를 통해 약 50명의 신생아가 인공호흡기가 필요하지 않고 SMA 1형으로 인한 약 30명의 사망을 예방할 수 있다. 또한, 증상 발병과 관련된 조기 치료가 증상 발병과 관련된 늦은 치료보다 더 효과적이기 때문에 신생아 선별검사는 중요하다.
신생아 선별검사 프로그램은 또한 전증상 신생아를 식별하는 데 사용할 수 있다. 대부분의 경우 증상이 나타나기 전에 치료를 시작하면 돌이킬 수 없는 운동 신경 손상을 예방할 수 있다. SMN1 유전자의 동형접합 돌연변이는 신생아의 혈액 샘플에서 정확하게 검출될 수 있는 것으로 보였으며, 이는 출생일에 채취한 혈액 샘플을 사용하여 SMA에 대한 신생아 선별검사가 유용한 선별 접근법임을 입증한다.
SMA에 대한 신생아 선별검사에는 한계가 있다. 예를 들어, 특정 대상체에 대한 SMN1 유전자의 점 돌연변이는 검출되기 어렵다. 산전 선별검사 및 치료는 특정 대상체에게 적합할 수 있다. 예를 들어, 뮤린 세포 모델에서 SMN 단백질은 신경 세포 분화와 자궁 내 신경근 연결부의 형성을 돕는다. SMN 단백질은 또한 신경 발달 및 시냅스 생성에 관여한다. 따라서, 특정 대상체에 대한 SMA에 대한 산전 선별검사 및 잠재적으로 SMA 0형으로 진단된 대상체의 산전 또는 신생아 치료가 조기 검출 및 치료에 적합하고 유용할 수 있다. 특정 대상체의 경우 SMA에 대한 산전 선별검사가 가능할 수 있는데, 특히 태아 유전자 대체 요법, 가령, SMN1 유전자를 감염시켜 대상체의 세포에 전달할 수 있는 아데노-연관 바이러스(AAV)를 투여하는 것이 제공된다. 또한 특정 대상체의 경우, 임신 10-14주 또는 15-20주에 융모막 융모 검체 채취 또는 양수천자가 수행될 수 있다. 이 샘플링은 SMA가 있는 태아의 가능성 또는 위험을 식별하는 것으로 나타났다. 그러나 산전 선별검사에도 고유한 문제와 한계가 있다. 산전 선별검사는 침습적이며 산모와 태아에게 위험을 초래할 수 있다. SMA에 대한 비침습적 산전 선별검사가 가능하다. 특정 연구에서는 산모의 혈액 샘플에서 태아 영양막 세포 또는 무세포 태아 DNA를 분리하여 SMA 검출을 위해 평가했다.
II.E. SMA의 임상 증상
증상은 SMA의 유형, 질병의 단계 및 개별 요인에 따라 다르지만 SMA의 징후 및 증상은 지연된 총 운동 능력, 서기, 앉기 또는 걷기 어려움, 앉을 때 개구리 다리 자세 채택, 무반사(특히 사지에서), 전반적인 근쇠약, 근긴장 저하, 축 늘어짐, 넘어지는 경향, 호흡근의 근력 상실, 위장 문제, 기침, 폐나 목에 분비물 축적, 호흡 곤란, 종 모양의 몸통, 척추 측만증, 혀의 떨림(연축), 빨거나 삼키기 어려움, 음식 섭취 부족을 포함한다.
II.F. SMA 치료
SMA의 치료는 중증도와 유형에 따라 달라진다. 가장 중증 형태(SMA 0 및 SMA 1)에서 개체는 가장 큰 근력 약화를 나타내므로 즉각적인 개입이 필요하다. 대조적으로, SMA 4 또는 성인 발병 SMA가 있는 개체는 훨씬 더 늦게까지 치료가 필요하지 않을 수 있다. 환자의 나이나 현재 건강 상태로 인해 진단 및 치료에 대한 타임라인이 매우 짧을 수 있기 때문에 중증 SMA의 치료는 어려운 경우가 많다. SMA는 연하, 호흡 및 급식과 관련된 근육에 영향을 미치는 빠르게 진행되는 질병이기 때문에 매우 빠르게 생명을 위협할 수 있다. 따라서 SMA 0 및 SMA 1을 가진 개체의 조기 진단과 적극적인 치료가 중요하다.
현재, SMN2 유전자의 선택적 스플라이싱을 변형시키는 안티센스 올리고뉴클레오티드인 뉴시너센(Spinraza®)이 SMA 치료에 사용된다. SMN2 스플라이싱 변조는 SMN2 유전자가 전장 SMN 단백질의 양을 증가시키도록 강제한다. 뉴시너센은 경막내 주사를 통해 중추신경계에 직접 투여되어 SMA가 있는 영아의 생존을 연장하고 운동 기능을 향상시킨다. 운동 뉴런에서 SMN 단백질의 가용성을 증가시키는 다른 SMN2 유전자 스플라이스 조절제는 경구 투여되는 소분자, 가령, Branaplam(LMI070, NVS-SM1) 및 Evrysdi(리스디플람, RG7916, R07034067)(F. Hoffman-La Roche AG)를 포함한다. Evrysdi는 성인과 생후 2개월 이상의 소아에서 SMA 1, 2, 및 3형을 치료하기 위해 투여될 수 있다. Zolgensma®(오나셈노겐 아베파르보벡(onasemnogene abeparvovec))은 자가 보완적 아데노-연관 바이러스 9형(scAAV-9)을 벡터로 사용하여 SMN1 도입 유전자를 전달하는 유전자 치료제이다. 이 치료법은 미국에서 2세 미만의 소아를 치료하기 위한 정맥 주사 제제로 승인되었다.
그 밖의 다른 치료법으로는 신경보호 화합물인 올레속심(F. Hoffman-La Roche AG)과 SMN2 유전자 활성화제인 알부테롤이 있다.
SMA의 중증도 및 유형에 따라 SMA를 관리하기 위해 호흡 지원이 종종 사용된다. 어떤 경우에는 기도 분비물 축적으로 인해 호흡기 문제가 발생한다. 체위 배액을 이용한 수동 또는 기계적 흉부 물리 요법을 사용하여 분비물이 제거될 수 있다. 또한 수동 또는 기계식 기침 보조 장치 또는 비침습적 환기(BiPAP)가 사용될 수 있다. 더 심한 경우에는 기관절개술이 수행될 수 있다.
SMA로 인해 급식, 턱 열기, 씹기 및 연하가 힘들 수 있으므로 영양 지원도 필수적일 수 있다. 그 밖의 다른 영양 문제로는 음식이 위를 충분히 빨리 통과하지 못하는 것, 위 역류, 변비, 구토, 팽만감 등이 있다. 따라서 SMA 환자, 특히 SMA 1 환자는 영양관이나 위루술이 필요한 경우가 있다. SMA로 인한 대사 이상은 근육 내 지방산의 β-산화를 손상시키고, 특히 단식 시 유기산혈증 및 그에 따른 근육 손상을 유발할 수 있다. SMA를 앓는 개체, 특히 보다 중증 형태의 질병이 있는 개체는 흡인을 피하고 지방 섭취를 줄이고 장기간의 단식을 피하기 위해 부드러운 음식을 선택해야 한다.
SMA 관리는 질병 진행으로 인한 정형외과적 문제의 치료도 포함할 수 있다. SMA의 약한 근육과 연관된 골격 문제는 단단한 관절, 고관절 탈구, 척추 기형, 골감소증, 골절 위험 증가 및 통증을 포함한다. 약한 근육은 후만증, 척추측만증 및/또는 관절 구축으로 이어질 수 있다. 척추 유합술은 SMA 1/2형 환자에서 변형된 척추가 폐에 가하는 압력을 완화하기 위해 때때로 수행된다. 또한 이동 장치(가령, 휠체어, 목발, 지팡이, 보행기), 운동 범위 운동 및 뼈 강화는 정형외과적 합병증을 예방하는 데 도움이 될 수 있다. 작업 치료와 물리 치료도 도움이 된다. 보조 장치, 예를 들어 발목 발 보조기 및 흉추 요추 천골 보조기도 신체를 지지하고 보행을 돕기 위해 사용될 수 있다.
최근 몇 년 동안 SMA 환자의 생존율은 약물 치료와 적극적인 호흡기, 정형외과 및 영양 지원으로 증가했다.
II.F.1 SMN 단백질 수준의 효과적인 회복을 위한 치료 창
SMA의 조기 치료는 매우 중요하다. 예를 들어, 연구에 따르면 증상이 시작되기 전이나 그 즈음에 SMA 대상체를 선제적으로 치료하면 운동 기능과 삶의 질이 향상될 수 있다. SMN 단백질 수치를 조기에, 예를 들어 어떤 경우에는 생후 1-3일 사이에 회복시키는 것이 생후 5일 후에 SMN 단백질 수치를 회복시키는 것보다 운동 기능을 증가시키는 데 더 효과적이다.
II.G. SMA의 질병 진행
다양한 유형의 SMA는 퇴행성이다. SMA는 다양한 유형의 SMA에서 상이하게 나타날 수 있다.
II.G.1. SMA 1형에 대한 질병 진행
주어진 SMA 유형에 대해 대상체의 근위 근육이 먼저 퇴화된다. 그런 다음 대상체의 근위 근육의 퇴화에 따라 원위 근육이 긴장된다. 예를 들어, 대상체의 허벅지 근육이 먼저 약화될 수 있으며, 이는 대상체의 발 근육을 긴장시킨다. SMA를 앓는 대부분의 대상체의 경우 손이 가장 오래 유지되어 질병이 진행되는 동안에도 일상적인 작업(가령 컴퓨터 사용)을 수행할 수 있다.
SMA는 척추를 지지하는 대상체의 근육이 시간이 지남에 따라 약해지기 때문에 척추측만증(가령, 척추의 "S"자 모양 만곡)을 유발할 수 있다. 척추측만증이 있는 대상체는 고르지 않은 어깨와 엉덩이를 보일 수 있거나 한쪽의 엉덩이나 어깨가 대상체의 다른 쪽 엉덩이나 어깨보다 클 수 있다. 척추를 지지하는 근육의 약화로 인해 SMA를 앓는 대상체는 종종 생명을 위협할 수 있는 호흡기 문제를 경험한다.
SMA 1형의 소아의 경우 이 질병은 SMA의 중증 형태인 베르드니히-호프만(Werdnig-Hoffmann)병이라고도 한다. 베르드니히-호프만병은 생후 6개월까지 출생 시 진단될 수 있다. 특정 소아에서 SMA 1형은 상당한 근력 약화를 초래하여, 소아가 스스로 앉거나 서지 못할 수 있다. 소아는 또한 빨거나 삼키는 데 어려움을 겪을 수 있으며, 이는 영양실조를 유발할 수 있다.
II.G.2. SMA 2형에 대한 질병 진행
SMA 2형의 소아의 질병 진행은 상당히 다양하다. 일부 소아는 초기에는 혼자 앉을 수 있지만 나중에, 가령, 십대에서는 그렇지 않을 수 있다. 또한 보행이 가능한 2형 대상체가 보조 없이 몇 발자국을 걷는 데 어려움을 겪을 수 있다. 손가락이 떨리기 시작할 수 있다. 힘줄 반사도 감소할 수 있다. 10대 중반 또는 그 이후에 SMA 2형 대상체는 일반적으로 독립적으로 앉을 수 없다. 다른 SMA 유형과 마찬가지로 2형 가진 대상체는 종종 척추 근처 근육의 근력 약화를 경험하여 잠재적으로 생명을 위협하는 호흡 문제를 일으킨다.
II.G.3. SMA 3형에 대한 질병 진행
쿠겔베르그-벨란더(Kugelberg-Welander) 증후군으로도 알려진 SMA 3형은 생후 18개월에 진단될 수 있다. 증상이 조기에 검출될 수 있다. 예를 들어 3형 소아는 걸을 수 있지만 오르내리거나 계단을 오르는 데 어려움을 겪을 수 있다. 소아는 또한 앙와위 자세에서 앉는 데 어려움을 겪는다. 또한 다른 형태의 SMA와 유사하게 3형 대상체는 척추를 지지하는 근육이 퇴화함에 따라 숨쉬기 또는 그 밖의 다른 호흡 문제에 문제를 나타낼 수 있다. 일부 대상체에서 SMA 3형은 20-30세 사이에 진단될 수 있으며 이러한 상황에서는 질병 진행이 느릴 수 있다. SMA 3형 성인은 일반적으로 걸을 수 있지만 나이가 들면 걷기가 더 어려워진다.
III. 지능형 기능 배포를 위한 클라우드 기반 네트워크 아키텍처의 개요
기법은 개체의 사용자(가령, 의사)가 대상체 레코드를 사용하여 머신 러닝 또는 인공 지능 기법을 실행할 수 있게 하는 코드를 실행하도록 서버를 구성하는 것과 관련된다. 대상체 레코드는 대상체를 특징짓는 데이터 요소의 복잡한 조합을 포함한다. 예를 들면, 대상체 레코드는 수천 개의 데이터 필드 조합을 포함할 수 있다. 일부 데이터 필드는 고정된 비숫자 값(가령, 대상체의 민족)을 포함할 수 있고, 그 밖의 다른 데이터 필드는 비구조화 텍스트 데이터(가령, 의사가 작성한 메모)를 포함할 수 있으며, 그 밖의 다른 데이터 필드는 수집된 측정치의 시변 시리즈(예를 들어, 1년에 2-4회 수행되는 당화 헤모글로빈 측정치) 및 그 밖의 다른 데이터 필드는 영상(가령, 대상체 뇌의 MRI)을 포함할 수 있다. 머신 러닝 및 인공 지능 모델은 종종 숫자 또는 벡터 형식으로 데이터를 처리하도록 구성되기 때문에, 대상체 레코드의 데이터 유형 및 포맷의 복잡성과 다양성으로 인해 대상체 레코드 처리가 불가능하지는 않더라도 기술적으로 까다롭다. 이러한 객관적인 기술적 문제에 비추어, 본 발명의 특정 양태 및 특징은 대상체 레코드를 대상체 레코드의 다양한 데이터 요소를 특징짓는 벡터 표현과 같은 변환된 표현으로 변환하는 것과 관련이 있다.
기법은 대상체 레코드에 포함된 비숫자 값을 예측 출력을 생성하기 위해 머신 러닝 또는 인공 지능 모델에 입력할 수 있는 숫자 표현(가령, 특징 벡터)으로 변환하는 것과 관련된다. 코드를 실행하는 서버는 대상체 레코드를 머신 러닝 또는 인공 지능 모델에서 사용할 수 있는 변환된 표현으로 변환함으로써, 객관적인 기술 문제를 해결하는 기술적 효과를 제공한다. "소모품"은 머신 러닝 또는 인공 지능 모델이 예측 출력을 생성하기 위해 처리하도록 구성된 포맷 또는 형식의 데이터를 지칭할 수 있다. 머신 러닝 또는 인공 지능 모델은 여러 상이한 데이터 포맷의 데이터 요소와 각 개별 대상체 레코드에 포함된 데이터 유형의 복잡한 조합으로 인해 대상체 레코드(데이터 레지스트리에 저장된 상태로 존재함)를 처리하도록 구성되지 않는다. 예를 들어, 주어진 대상체 레코드에 대해 데이터 요소는 종적인 시퀀스의 이벤트(가령, 예방 접종 레코드)을 포함할 수 있고, 또 다른 데이터 요소는 대상체로부터 얻어진 측정치(가령, 바이탈)를 포함할 수 있으며, 또 다른 데이터 요소는 사용자에 의해 입력된 텍스트(가령, 의사가 작성한 메모)를 포함할 수 있으며, 또 다른 데이터 요소는 영상(가령, X-선)일 수 있다. 제한된 또는 단순한 분석이 (임의의 변환 전) 대상체 레코드에서 수행될 수 있는데, 가령, 데이터 요소(가령, 나이 그룹)의 값에 기초하여 대상체들을 그룹 짓는 것이 있다. 그러나 대상체 레코드의 복잡성과 크기가 빅데이터 규모에 도달함에 따라 제한적이거나 단순한 분석이 문제가 되거나 실행 불가능해진다. 대상체 레코드에서 분석 평가를 처리하고 빅데이터 규모로 추출하기 위해, 머신 러닝 또는 인공 지능 기법이 사용하여 대상체 레코드를 데이터 마이닝할 수 있다. 그러나 머신 러닝 또는 인공 지능 모델은 숫자 또는 벡터 입력을 받도록 구성된다. 예를 들어, 클러스터링 작업, 가령, k-평균 클러스터링이 벡터를 입력으로서 수신하도록 구성된다. 따라서, 대상체 레코드에 대해 클러스터링 작업을 수행하기 위해, 본 개시내용은 대상체 레코드를 머신 러닝 또는 인공 지능 모델에서 사용할 수 있는 변환된 표현, 가령, 숫자 벡터 표현으로 변환함으로써, 객관적인 기술 문제를 해결하는 기술적 효과를 제공한다. 변환된 표현 상태의 대상체 레코드에 대해 지능형 분석이 수행될 수 있다. 지능형 분석(코드를 실행하는 서버에서 수행됨)의 비제한적 예는 자동으로, 클러스터링 기법을 사용하고, 대상체 레코드 내 데이터 요소의 값에 기초하여 특정 결과를 예측하는 출력을 생성하며, 주어진 또는 새로운 대상체 레코드와 유사한 기존 대상체 레코드를 식별하는 것을 포함할 수 있다.
단지 비제한적 예로서 설명하기 위해, 대상체의 대상체 레코드는 4개의 데이터 요소를 포함한다. 제1 데이터 요소는 상태 진단을 나타내는 고유 코드를 포함한다. 제2 데이터 요소는 대상체의 뇌 MRI를 포함한다. 제3 데이터 요소는 1년 동안의 혈압 판독값과 같은 측정치의 시변 시리즈를 포함한다. 제4 데이터 요소는 비구조화 메모, 가령, 하나 이상의 검사를 심사 또는 실행함으로써 검출된 상태의 메모를 포함한다. 특정 구현예에 따르면, 제1 데이터 요소, 제2 데이터 요소, 제3 데이터 요소 및 제4 데이터 요소 각각은 변환된 표현(가령, 벡터)으로 변환될 수 있다. 4개의 데이터 요소에 포함된 값을 변환하는 데 사용되는 기법은 데이터 요소에 포함된 데이터의 유형에 따라 달라질 수 있다. 예를 들어, 제1 데이터 요소에 대해, 진단을 나타내는 고유 코드가 고정된 길이의 벡터로 표현될 수 있으며, 이로써 벡터의 크기는 코드의 어휘의 크기에 의해 결정되며, 어휘 내 각 코드는 고정 길이 벡터의 벡터 요소에 의해 표현된다. 제1 데이터 요소에 포함된 하나 이상의 고유 코드는 코드의 어휘와 비교될 수 있다. 고유 코드가 어휘의 코드와 매칭되는 경우, 고유 코드에 대응하는 벡터의 위치의 벡터 요소에 "1"이 할당될 수 있고 벡터의 나머지 모든 요소에 "0"이 할당될 수 있다. 위의 관점에서, 제1 데이터 요소의 값을 나타내기 위해 제1 벡터가 생성될 수 있다. 또 다른 예로서, 제2 데이터 요소에 대해, 영상의 잠재 공간 표현은 훈련된 자동 인코더 신경망을 사용하여 생성될 수 있다. 입력 영상의 잠재 공간 표현은 입력 영상의 축소된 차원 버전일 수 있다. 훈련된 자동 인코더 신경망은 두 개의 모델, 즉, 인코더 모델과 디코더 모델을 포함할 수 있다. 인코더 모델은 영상 내에서 검출된 특징의 세트로부터 두드러진 특징(salient feature)의 서브세트를 추출하도록 훈련될 수 있다. 두드러진 특징(salient feature)(가령, 키 포인트)은 영상 내에서 강도가 높은 영역(가령, 객체의 가장자리)일 수 있다. 인코더 모델의 출력은 입력 영상의 잠재 공간 표현일 수 있다. 잠재 공간 표현은 훈련된 자동 인코더 모델의 은닉 층에 의해 출력될 수 있고 따라서 잠재 공간 표현은 서버에 의해서만 해석 가능할 수 있다. 디코더 모델은 두드러진 특징의 추출된 서브세트로부터 원본 입력 영상을 재구성하도록 훈련될 수 있다. 인코더 모델의 출력은 제2 데이터 요소에 포함된 영상의 픽셀 값을 나타내는 특징 벡터로 사용될 수 있다. 위의 관점에서, 제2 데이터 요소에 포함된 영상을 나타내기 위해 제2 벡터(예를 들어, 잠재 공간 표현)가 생성될 수 있다. 또 다른 예로서, 제3 데이터 요소의 경우, 측정치의 시변 시퀀스가 숫자로 나타내어질 수 있다. 일부 구현예에서, 시변 시퀀스는 대상체로부터 측정치가 취해진 총 인스턴스로 표현될 수 있다. 또 다른 구현예에서, 시변 시퀀스는 일정 기간(예를 들어, 1년) 동안 발생한 측정의 인스턴스에 걸쳐 취해진 측정 값의 평균(average), 평균(mean) 또는 중앙값을 사용하여 숫자로 표현될 수 있다. 또 다른 구현예에서, 측정 빈도가 계산되고 측정의 시변 시퀀스를 숫자로 표현하는 데 사용될 수 있다. 위의 관점에서, 제3 데이터 요소 내에 포함된 값의 시변 시퀀스를 나타내기 위해 제3 벡터가 생성될 수 있다. 또 다른 예로서, 제4 데이터 요소에 대해, 사용자에 의해 입력된 메모가 임의의 수의 자연어 처리(NLP) 텍스트 벡터화 기법을 사용하여 처리되고 벡터화될 수 있다. 일부 구현예에서, 워드-벡터 머신-러닝 모델, 가령, Word2Vec 모델이 실행되어 제4 데이터 요소에 포함된 메모를 단일 벡터 표현으로 변환할 수 있다. 또 다른 구현예에서, 콘볼루션 신경망이 제4 데이터 요소에 포함된 메모로부터 증상, 치료 또는 진단을 나타내는 텍스트 내의 단어 또는 숫자를 검출하도록 훈련될 수 있다. 위의 관점에서, 제4 데이터 요소에 포함된 메모의 텍스트를 벡터 표현으로 표현하기 위해 제4 벡터가 생성될 수 있다. 따라서, 전체 대상체 레코드를 나타내는 최종 특징 벡터는 제1 벡터, 제2 벡터, 제3 벡터 및 제4 벡터의 연결(concatenation)을 포함하는 벡터들의 벡터일 수 있다. 또 다른 예에서, 제1 벡터, 제2 벡터, 제3 벡터 및 제4 벡터의 평균은 전체 대상체 레코드를 숫자로 나타내는 데 사용될 수 있다. 제1 벡터, 제2 벡터, 제3 벡터 및 제4 벡터의 다른 조합을 사용하여 전체 대상체 레코드를 숫자로 나타내는 최종 특징 벡터를 생성할 수 있다.
일부 구현예에서, 대상체 레코드의 각 데이터 요소를 숫자로 표현하기 위해 벡터를 생성하는 대신에, 데이터 요소 세트로부터 데이터 요소의 서브세트를 식별하고 선택함으로써 대상체 레코드의 차원을 감소시키는 기법이 실행될 수 있다. 데이터 요소의 서브세트는 "중요한" 데이터 요소를 나타낼 수 있으며, 여기서 데이터 요소의 "중요도"는 특징 추출 기법, 가령, SVD(Singular Value Decomposition)을 이용한 예측에 기초하여 결정된다. 예를 들어, 대상체 레코드를 머신 러닝 및 인공 지능 모델에 의해 사용될 수 있는 변환된 표현으로 변환하는 것은 비숫자 값의 분해된 버전을 숫자로 나타내는 특징 벡터를 생성하기 위해 대상체 레코드의 데이터 요소에 포함된 비숫자 값에 하나 이상의 특징 추출 기법을 수행하는 것을 포함할 수 있다. 일부 구현예에서, 특징 추출 기법은 예를 들어 대상체 레코드의 데이터 요소의 세트(가령, 대상체의 특징 또는 차원을 나타내는 각 데이터 요소)의 차원을, 예를 들어, 결과 또는 이벤트를 예측하기 위해 사용될 수 있는 특징의 최적 서브세트로 감소시키는 것을 포함할 수 있다. 데이터 요소의 세트의 차원을 감소시키는 것은 N개의 데이터 요소를 M개의 요소의 서브세트로 감소시키는 것을 포함할 수 있으며, 여기서 M은 N보다 작다. 이러한 구현예에서, M개의 요소의 서브세트의 각 요소는 숫자 값으로 변환될 수 있다. 일부 구현예에서, 대상체 레코드의 N개의 데이터 요소를 나타내기 위해 특징 벡터가 생성될 수 있다. 특징 벡터는 데이터 요소의 세트의 각 데이터 요소에 대한 벡터를 포함할 수 있다. 예를 들어, 특징 벡터는 대상체 레코드의 데이터 요소의 복잡한 조합을 숫자 표현일 수 있다. 대상체 레코드의 데이터 요소 내 각 비숫자 값이 벡터화되어 대표 벡터를 생성할 수 있다. 대상체 레코드 내 데이터 요소의 세트를 나타내는 벡터는 (가령, 평균 또는 가중 평균으로서) 연결 또는 조합되어 대상체 레코드의 데이터 요소의 전체 세트를 숫자로 특징 짓는 특징 벡터를 생성할 수 있다. 특징 벡터는 훈련된 머신 러닝 또는 인공 지능 모델에 의해 사용될 수 있다. 대상체 레코드에 대한 특징 벡터가 생성되면, 대상체 레코드가 머신 러닝 및 인공 지능 기법을 사용하여 개별적으로 또는 다른 대상체 레코드의 그룹으로 평가될 수 있다. 각 대상체 레코드를 나타내는 특징 벡터가 생성 및 저장된 후, 중앙 데이터 저장소에 저장된 대상체 레코드의 특징 벡터가 머신 러닝 또는 인공 지능 모델로 입력될 수 있거나, 그 밖의 다른 향상된 분석이 대상체 레코드의 숫자 표현에 대해 수행될 수 있다. 예를 들어 하나 이상의 차원과 관련하여 두 개의 상이한 대상체 레코드가 비교될 수 있다. 차원은 둘 이상의 대상체 레코드 간의 비교가 이루어지는 대상체 레코드의 특징 또는 데이터 요소를 나타낼 수 있다. 예를 들어, 제1 대상체 레코드의 데이터 요소는 제1 대상체의 증상을 설명하는 제1 사용자(가령, 의사)가 입력한 텍스트를 포함한다. 텍스트(가령, 제1 대상체 레코드의 데이터 요소의 값)는 데이터 요소와 연관된 텍스트를 숫자로 나타내도록 제1 벡터를 생성하기 위해 앞서 기재된 텍스트 벡터화 기법(예를 들어, Word2Vec)을 사용하여 벡터화될 수 있다. 텍스트 벡터화 기법은 텍스트에 포함된 각 단어에 대해 N차원 단어 벡터를 생성할 수 있다. 제2 대상체 레코드의 매칭 데이터 요소(가령, 다른 대상체의 증상을 설명하는 의사가 입력한 텍스트도 포함하는 다른 대상체 레코드의 데이터 요소)는 제2 대상체의 증상을 설명하는 제2 사용자가 입력한 텍스트를 포함할 수 있다. 텍스트(가령, 제2 대상체 레코드의 데이터 요소의 값)는 데이터 요소와 연관된 텍스트를 나타내기 위해 제2 벡터(예를 들어, N차원 단어 벡터)를 생성하기 위해 앞서 기재된 텍스트 벡터화 기법을 사용하여 벡터화될 수 있다. 서버는 유클리드 또는 코사인 공간에서 제1 벡터를 제2 벡터와 비교하여 적어도 대상체의 증상 발현의 차원과 관련하여 제1 대상체 레코드와 제2 대상체 레코드 사이의 유사도 또는 비유사도를 정량화할 수 있다. 유클리드 공간에서 제1 벡터와 제2 벡터가 서로 가까이(또는 임계 거리 이내) 있는 경우(가령, 제1 벡터와 제2 벡터 사이의 유클리드 거리가 작다면), 제1 대상체가 경험한 증상(데이터 요소의 텍스트에 기재됨)은 제2 대상체가 경험한 증상(데이터 요소의 텍스트에 기재됨)과 유사할 가능성이 높다. 그러나, 제1 벡터와 제2 벡터 사이의 유클리드 거리가 크거나 임계 거리를 초과하는 경우(가령, 유클리드 거리가 임계값을 초과하는 경우), 제1 대상체가 경험하는 증상은 제2 대상체가 경험하는 증상과 상이한 것으로 예측될 수 있다.
일부 구현예에서, 서버는 개체의 사용자가 후속 처리를 위해 대상체 레코드를 저장하도록 역할 하는 데이터 레지스트리를 구축할 수 있게 하는 애플리케이션을 실행하도록 구성될 수 있다. 대상체 레코드의 데이터는 의사 레코드의 전자 사본 및/또는 개방형 질문에 대한 응답과 같은 구조화되지 않은 데이터를 포함할 수 있다. 비구조화 데이터는 구조화된 데이터 레코드의 고정된 부분(가령, 데이터 요소)에 비구조화 데이터의 부분을 매핑함으로써 데이터 레지스트리로 입수될 수 있다. 구조화된 데이터 레코드의 구조는 (예를 들어) 특정 사용 사례(가령, 특정 질병, 특정 시험 등)에 대응하는 모듈로부터의 명세를 이용해 정의될 수 있다. 예를 들어, 비구조화 메모 데이터(가령, 텍스트)의 각 단어는 숫자 표현으로 변환될 수 있고 비구조화 메모 데이터와 연관된 다양한 숫자 표현은 대상체가 보여준 증상의 특정 세트를 설명하는 단어를 검출하도록 (예를 들어, SVD를 사용하여) 분해될 수 있다. 비구조화 메모 데이터의 숫자 표현을 분해하면 비정보성 단어, 가령, "및(and)", "상기(the)", "또는(or)" 등이 제거될 수 있다. 나머지 단어는 특정 증상 집합을 나타낸다. 메모 데이터의 일부는 구조화된 데이터의 데이터 요소와 관련이 없을 수 있고 및/또는 데이터 요소에 포함된 데이터보다 다소 구체적일 수 있다. 어떤 경우에는 다양한 매핑(가령, "균형 불량" 증상을 "신경학적" 증상으로 매핑), 자연어 처리 또는 인터페이스 기반 접근법(가령, 사용자로부터 새로운 정보를 요청하는 방식)을 사용하여 구조화된 데이터 레코드를 얻을 수 있다. 새로운 또는 기존 대상체에 대한 새로운 정보를 식별하는 입력을 수신하는 데 인터페이스가 사용될 수도 있으며, 인터페이스는 데이터 레코드의 구조에 매핑되는 입력 구성요소 및 선택 옵션을 포함할 수 있다.
또한, 기법은 대상체 레코드의 데이터 요소에 포함된 비숫자 값을 숫자 표현으로 변환하도록 클라우드 기반 애플리케이션을 구성하는 것과 관련되며, 이로써, 클라우드 기반 애플리케이션이 데이터 레지스트리에 저장된 대상체 레코드의 숫자 표현(가령, 변환된 표현)을 사용하여 지능형 분석 기능을 실행할 수 있다. 대상체 레코드의 데이터 요소의 비숫자 값을 숫자 표현으로 변환하는 것은 데이터 요소에 포함된 데이터 유형에 따라 달라질 수 있다. 예를 들어, 사용자가 작성한 메모와 같이 텍스트를 포함하는 데이터 요소의 경우 텍스트는 자연어 처리 기법, 가령, Word2Vec 또는 그 밖의 다른 텍스트 벡터화 기법을 이용해 텍스트의 숫자 표현으로 변환될 수 있다. 또 다른 예로서, 영상(가령, MRI) 또는 비디오(가령, 초음파 비디오)의 영상 프레임을 포함하는 데이터 요소의 경우, 각 영상 또는 영상 프레임은 입력 영상의 잠재-공간 표현을 생성하도록 훈련된 훈련된 자동-인코더 신경망을 이용해 숫자 표현(가령, 벡터)으로 변환될 수 있다. 입력 영상의 압축 표현(가령, 잠재 공간 표현)은 입력 영상을 숫자로 표현하는 벡터 역할을 할 수 있다. 또 다른 예로서, 정보의 시변 시퀀스(예를 들어, 일정 기간 동안 발생하는 이벤트)를 포함하는 데이터 요소에 대해, 시변 정보는 몇 가지 예시적인 변환을 사용하여 숫자 표현으로 표현될 수 있다. 어떤 경우에는, 이벤트의 카운트가 시변 정보를 나타내는 벡터로 사용될 수 있다. 다른 경우에, 발생하는 이벤트의 빈도 또는 비율(예를 들어, 매주, 매월, 매년 등)이 시변 정보를 나타내는 벡터로서 사용될 수 있다. 또 다른 경우에, 시변 정보 내 각 이벤트와 연관된 측정 값의 평균 또는 조합이 시변 정보를 나타내는 벡터로서 사용될 수 있다. 본 발명은 이러한 예에 한정되지 않으며, 따라서 시변 정보의 그 밖의 다른 숫자 표현이 숫자 표현을 나타내는 벡터로서 사용될 수 있다. 데이터 레코드를 사용하여 훈련된 머신 러닝 또는 인공 지능 모델을 실행함으로써 지능적 분석 기능이 수행될 수 있다. 모델 출력은 데이터 레코드로부터 추출된 특정 분석을 나타내는 데 사용될 수 있다.
경우에 따라, 개별 대상체에 대한 치료 계획을 개발하기 위해 대상체 레코드로부터의 데이터의 전송이 제공될 수 있다. 예를 들어, (예를 들어, 선택 생략 및/또는 데이터 가림을 통해 데이터 프라이버시 제한을 준수하는) 대상체 레코드 정보는 사용자 장치의 선택된 그룹으로 방송 및/또는 전송될 수 있다. 예를 들어, 유사한 대상체와 연관된 사용자와의 상담을 개시하라는 요청에 대응하는 사용자의 입력에 응답하여 유사한 데이터 레코드와 연관된 사용자 장치에게 방송이 전송될 수 있다. 방송을 수신하는 사용자가 (대응하는 입력의 제공을 통해) 상담 요청을 수락하면, 보안 데이터 채널이 사용자 간에 설정될 수 있으며 (가령, 두 명의 사용자에게 적용 가능한 데이터-프라이버시 제한을 준수하면서) 잠재적으로 더 많은 대상체 레코드가 공유될 수 있다. 주어진 대상체와 유사한 대상체 레코드는 둘 이상의 대상체 레코드의 벡터 표현을 사용하여 최근접 이웃 기법을 수행함으로써 식별될 수 있다. 최근접 이웃 기법은 여러 대상체 레코드에 걸쳐 개별 데이터 요소의 벡터를 비교함으로써 수행할 수 있다(가령, 최근접 이웃은 대상체 레코드의 차원 또는 특징과 관련하여 결정될 수 있음). 또는, 최근접 이웃 기법은 전체 대상체 레코드를 특징짓는 전체 벡터를 또 다른 전체 대상체 레코드를 특징짓는 전체 벡터와 비교함으로써 수행될 수 있다. 전체 벡터는 데이터 요소의 값을 나타내는 개별 벡터들의 연결이거나 데이터 요소의 값을 나타내는 개별 벡터들의 평균 또는 조합일 수 있다.
다른 예로서, 특정 제약조건과 일치하는 대상체 레코드에 대한 쿼리에 대한 응답으로 하나 이상의 처리된 데이터 레코드가 반환될 수 있다. 일부 경우, 제1 사용자가 제1 대상체 레코드를 식별하는 쿼리를 제출할 수 있다. 쿼리는 제1 대상체 레코드와 유사한 다른 대상체 레코드를 식별하기 위한 요청에 대응할 수 있다. 서버는 상기 및 본 명세서에서 논의된 특정 변환 기법을 사용하여 제1 대상체 레코드를 변환된 표현으로 변환할 수 있다. 대안으로, 제1 대상체 레코드의 변환된 표현은 이전에 생성되어 데이터베이스에 저장되었을 수 있다. 제1 대상체 레코드의 변환된 표현이 쿼리가 수신되기 전 또는 후에 생성되었는지 여부에 관계없이, 제1 대상체 레코드를 제1 대상체 레코드의 변환된 표현으로 변환하는 것은 제1 대상체 레코드의 데이터 요소의 하나 이상의 비숫자 값의 벡터화를 생성하는 것을 포함할 수 있다. 제1 대상체 레코드 내에 포함된 하나 이상의 비숫자 값을 벡터화하는 것은 제1 대상체 레코드의 각 데이터 요소에 포함된 각 값(가령, 비숫자 텍스트, 가령, 메모)에 대한 숫자 벡터 표현을 생성하는 것을 포함할 수 있다. 다양한 벡터 표현은 전체 제1 대상체 레코드를 나타내는 특징 벡터를 생성하기 위해 연결(concatenate)되거나 그 밖의 다른 방식으로 조합될 수 있다(예를 들어, 평균이 계산될 수 있다). 제1 대상체 레코드를 숫자로 나타내는 벡터 표현은 도메인 공간(가령, 유클리드 공간 또는 코사인 공간)에서 다른 대상체 레코드의 벡터 표현과 비교할 수 있다. 예를 들어, 2개의 벡터 표현 사이의 유클리드 거리가 임계 거리 내에 있을 때, 2개의 벡터 표현과 연관된 2개의 대상체 레코드는 적어도 하나 이상의 차원과 유사한 것으로 (가령, 서버에 의해) 표현될 수 있다.
대상체 레코드의 각 데이터 요소에 대해 데이터 요소와 연관된 값의 벡터 표현을 생성하는 데 사용되는 기법은 데이터 요소와 연관된 데이터의 유형에 따라 달라질 수 있다. 일부 예에서, 대상체 레코드의 데이터 요소는 하나 이상의 영상, 가령, 대상체의 X-선과 연관될 수 있다. 데이터 요소와 연관된 각 영상의 벡터 표현을 생성하기 위해 특징 추출 기법이 실행될 수 있다. 예를 들어, 서버는 훈련된 자동 인코더 신경망을 실행하여 영상의 축소된 차원 버전을 생성하도록 구성될 수 있다. 훈련된 자동 인코더 신경망은 두 개의 모델, 즉, 인코더 모델과 디코더 모델을 포함할 수 있다. 인코더 모델은 영상 내에서 검출된 특징의 세트로부터 두드러진 특징(salient feature)의 서브세트를 추출하도록 훈련될 수 있다. 두드러진 특징(salient feature)(가령, 키포인트)은 영상 내에서 강도가 높은 영역(가령, 객체의 가장자리)일 수 있다. 인코더 모델의 출력은 입력 영상의 잠재 공간 표현일 수 있다. 잠재 공간 표현은 훈련된 자동 인코더 모델의 은닉 층에 의해 출력될 수 있고 따라서 잠재 공간 표현은 서버에 의해서만 해석 가능할 수 있다. 대상체 레코드를 특징짓는 잠재 공간 표현의 두드러진 특징의 서브세트가 다른 대상체 레코드를 특징 짓는 잠재 공간 표현의 두드러진 특징의 서브세트에 비교되어 특정 분석 통찰력을 얻을 수 있다. 디코더 모델은 두드러진 특징의 추출 서브세트로부터 원본 입력 영상을 재구성하도록 훈련될 수 있다. 인코더 모델의 출력은 대상체 레코드에 포함된 영상과 연관된 데이터 요소의 벡터 표현일 수 있다. 또 다른 예에서, 키포인트 매칭 기법은 제1 대상체 레코드의 데이터 요소에 포함된 영상의 키포인트를 제2 대상체 레코드의 데이터 요소에 포함된 또 다른 영상의 키포인트와 일치시키기 위해 실행될 수 있다. 입력 영상의 벡터 표현(가령, 잠재 공간 표현)은 머신 러닝 또는 인공 지능 모델에 의해 소비될 수 있으므로 두 개의 상이한 대상체 레코드(각각 영상 포함)가 두 개의 상이한 대상체 레코드 간 유사도 또는 비유사도를 결정할 수 있다.
단지 비제한적인 예로서 설명하기 위해, 대상체의 뇌의 자기 공명 영상(MRI)이 촬영된다. MRI는 대상체와 연관된 대상체 레코드에 저장된다. 서버는 키 추출 기법, 가령, 키포인트 검출, 잠재 공간 표현으로의 자동-인코딩, SVD, 및 그 밖의 다른 적합한 컴퓨터-비전 기법을 이용해 대상체 레코드에 포함된 MRI의 변환된 표현, 가령, 벡터 표현을 생성하도록 구성된다. MRI를 포함하는 데이터 요소의 벡터 표현은 데이터 요소의 세트의 각 나머지 데이터 요소의 벡터 표현과 연결되거나 그 밖의 다른 방식으로 조합(가령, 평균화)되어 전체 대상체 레코드를 특징 짓는 특징 벡터를 생성할 수 있다. 사용자는 애플리케이션에 액세스하여 대상체의 뇌의 MRI와 유사한 MRI를 포함하는 서브세트 다른 대상체 레코드의 세트를 불러오기 위해 다른 대상체 레코드에 대해 데이터베이스에 쿼리할 수 있다. 대상체 레코드와 유사한 다른 대상체 레코드를 식별하는 것은(적어도 MRI들 간 유사도와 관련하여) 대상체 레코드의 k-최근접 이웃을 계산하는 것을 포함할 수 있다. 예를 들어, 변환된 표현은 도메인 공간, 가령, 유클리드 공간 또는 코사인 공간 상에 (시각적으로 컴퓨팅 시스템에 의해 내부적으로) 플롯팅될 수 있다. 각각의 다른 대상체 레코드의 변환된 표현은 또한 (시각적으로 컴퓨팅 시스템에 의해 내부적으로) 플롯팅될 수 있다. 최근접 이웃 기법이 실행되어 대상체 레코드의 벡터 표현을 다른 대상체 레코드의 벡터 표현과 비교하여 대상체 벡터에 대한 k-최근접 이웃을 식별할 수 있다. 식별된 k-최근접 이웃은 대상체의 뇌의 MRI와 유사한 MRI를 가질 것으로 예측될 수 있다. 최근접 이웃으로 식별된 각각의 다른 대상체 레코드는 애플리케이션을 이용해 추가 평가 또는 처리를 위해 식별되고 불러와질 수 있다.
일부 구현예에서 컴퓨팅 시스템은 유사한 대상체 레코드를 식별하기 위해 데이터 처리 기법(가령, 최근접 이웃 기법)을 수행할 수 있다. 다양한 데이터 요소는 이 검색에서 (예를 들어, 지정 데이터 요소 가중치, 매칭되는 다양한 데이터 요소의 중요성을 나타내는 사용자 입력 및/또는 대상체 레코드 세트에 걸친 특정 데이터 요소 값의 출현율에 따라) 차등적으로 가중될 수 있다.매칭 가능성이 있는 레코드의 세트에서 검색할 때 일부 레코드에는 다양한 데이터 요소에 대한 값이 없을 수 있다. 이러한 경우에, (예를 들어) 데이터 요소 값이 매칭되지 않는 것으로 결정 및/또는 잠재적 매칭을 평가할 때 데이터 요소에 가중치가 없을 수 있다. 누락된 값의 처리는 레코드의 세트에 걸친 데이터 요소의 값의 분포 및/또는 쿼리 내 데이터 요소의 값에 따라 달라질 수 있다.
또한, 일부 기법은 대상체 레코드에서 식별된 증상의 세트로서 주어진 대상체에 대한 가능한 치료 요법을 식별하도록 사용된 규칙의 세트를 정의하고 사용하는 것과 관련된다. 예를 들어, 표적 대상체 레코드는 최근에 상기도 감염, 발열 및 인후염의 세 가지 증상을 경험한 표적 대상체를 나타낼 수 있다. 세 가지 증상은 표적 대상체 레코드의 데이터 요소 내에 텍스트로 레코드될 수 있다(가령, 세미콜론과 같은 태그로 표시되는 단어 사이의 구분). 서버, 가령, 클라우드 서버(135)는 "상기도 감염", "열" 및 "인후통"이라는 텍스트를 훈련된 Word2Vec 모델 또는 그 밖의 다른 텍스트-벡터 모델, 가령, 어휘 매핑에 개별적으로 입력할 수 있다. Word2Vec 모델은 증상을 나타내는 각 단어에 대한 벡터 표현을 생성하도록 훈련될 수 있다. 3가지 증상에 대한 벡터 표현은 평균화되어 표적 대상체 레코드의 "증상" 데이터 요소에 대한 단일 벡터 표현을 생성할 수 있다. 표적 대상체 레코드의 "증상" 데이터 요소에 대한 단일 벡터 표현은 "증상" 데이터 요소 내 유사한 단어를 포함하는 다른 대상체 레코드를 식별하기 위해 처리될 수 있다. 데이터베이스에 저장된 각 대상체 레코드는 숫자 표현, 가령, 벡터로 변환된 기존 "증상" 데이터 요소와 연관될 수 있다. "증상" 데이터 요소에 대한 벡터를 플롯팅하고 표적 대상체 레코드의 "증상" 데이터 요소에 대한 벡터와 비교할 수 있다. 서버는 "증상" 데이터 요소를 특징짓는 벡터에 가장 가까운 벡터를 식별할 수 있다. 표적 대상체 레코드의 벡터와 최근접(nearest)인 "증상" 데이터 요소의 벡터는 대상체와 유사하다고 예측될 수 있다. 표적 대상체 레코드의 벡터에 최근접인 벡터와 연관된 대상체 레코드가 해당 대상체에게 제공된 치료 요법을 결정하도록 식별 및 추가 평가될 수 있다. 표적 대상체 레코드에 대한 벡터에 최근접인 벡터와 연관된 대상체에게 제공된 치료는 표적 대상체를 치료하기 위한 잠재적인 치료 요법으로서 사용될 수 있다. 또한, 각각의 잠재적인 치료 요법은 다른 대상체가 경험한 반응도에 의해 가중될 수 있다. 잠재적 치료 요법은 다른 대상체가 경험한 반응도에 따라 분류될 수 있다.
규칙의 세트는 사용자 인터페이스와의 사용자 상호작용에 기초하여 정의될 수 있으며, 이는 특정 기준 및 연관된 특정 의료 치료의 명세 및/또는 (기준 및 치료를 특정하는) 하나 이상의 이전에 정의된 규칙의 선택을 포함할 수 있다. 예를 들어, 하나 이상의 기존 규칙이 인터페이스를 통해 표시될 수 있고, 사용자는 사용자와 연관된 계정과 관련된 규칙 베이스에 통합될 규칙을 선택할 수 있다. 하나 이상의 규칙은 (예를 들어, 하나 이상의 기관과 연관된) 다수의 사용자에 의해 정의된 규칙의 세트 중에서 선택될 수 있거나, 및/또는 다수의 사용자에 의해 생성되는 규칙에 기초하여 생성될 수 있다. 사용자가 규칙 베이스에 통합하기 위한 규칙을 선택할 때, 애플리케이션은 클라우드 서버(135)로의 피드백 신호를 생성할 수 있다. 피드백 신호는 사용자의 선택과 연관된 메타데이터를 포함할 수 있다. 메타데이터는 규칙이 수정되지 않은 상태로 또는 수정된 상태로 규칙 베이스에 통합되었는지 여부를 나타낼 수 있다. 규칙 베이스가 수정된 경우 메타데이터는 규칙에 어떤 수정이 이루어졌는지를 나타낸다. 메타데이터는 또한 규칙이 거부되었는지, 삭제되었는지 또는 사용자에게 유용하지 않은 것으로 결정되었는지 여부를 나타낼 수 있다. 비제한적 예를 들어, 컴퓨팅 시스템은 하나 이상의 특정 유형의 증상 및/또는 검사 결과를 주어진 치료와 관련시키는 규칙이 비교적 자주 사용자에 의해 정의 및/또는 선택된다는 것을 검출할 수 있으며, 그렇다면 컴퓨팅 시스템은 특정 유형의 증상 및/또는 검사 결과 및 치료와 관련된 일반 규칙을 생성할 수 있다. 일반 규칙은 (예를 들어) 가장 제한적이거나 가장 포괄적이거나 중간 기준을 갖도록 정의될 수 있다. 어떤 경우에는, 사용자의 규칙 베이스가 처리되어 규칙들 간에 겹쳐지는 임의의 기준을 검출할 수 있다. 겹침을 식별하면 겹침을 식별하는 경고가 표시될 수 있다. 규칙 베이스의 규칙은 대상체 레코드와 연관된 모집단을 정의하기 위해 분류하기 위해 대상체 레코드를 평가하는 데 사용될 수 있다. 규칙을 사용하여 대상체 레코드를 평가하는 것은 예를 들어 규칙의 첫 번째 기준이 대상체 레코드에 포함된 속성과 비교된다는 점에서 결정 트리로 수행될 수 있다. 첫 번째 기준이 충족되면 다음 기준은 대상체 레코드에 포함된 속성과 비교된다. 다음 기준이 충족되면, 규칙에 포함된 각각의 기준에 대해 비교가 계속된다. 다음 기준이 충족되지 않더라도 비교는 계속될 수 있다. 이 경우, 기준(및 규칙에 포함된 다른 모든 항목)의 미충족이 저장되어 충족된 기준과 함께 사용자 장치에 표시된다.
따라서, 본 개시의 실시예는 데이터-프라이버스 규칙 위반 없이 외부 개체와 대상체 정보를 교환하도록 구성된 클라우드-기반 애플리케이션을 제공한다. 클라우드-기반 애플리케이션은 다양한 관할 구역에 걸쳐 대상체 정보를 공유하는 것과 관련된 데이터-프라이버시 규칙을 자동으로 평가하도록 구성된다. 클라우드-기반 애플리케이션은 대상체 정보를 난독화하거나 그 밖의 다른 방식으로 수정하는 프로토콜을 실행하도록 구성되어 데이터-프라이버시 규칙의 준수를 알고리즘에 의해 보장할 수 있다.
IV. 지능형 기능으로 구성된 클라우드 기반 애플리케이션을 호스팅하기 위한 네트워크 환경
도 1은 클라우드-기반 애플리케이션의 실시예가 호스팅되는 네트워크 환경(100)을 도시한다. 네트워크 환경(100)은 클라우드 서버(135), 데이터 레지스트리(140), 및 AI 시스템(145)을 포함하는 클라우드 네트워크(130)를 포함할 수 있다. 클라우드 서버(135)는 클라우드-기반 애플리케이션의 기반이 되는 소스 코드를 실행할 수 있다. 데이터 레지스트리(140)는 하나 이상의 사용자 장치, 가령, 컴퓨터(105), 랩톱(110) 및 모바일 장치(115)로부터 수집되거나 식별된 데이터 레코드를 저장할 수 있다.
데이터 레지스트리(140)에 저장된 데이터 레코드는 고정된 부분(예를 들어, 데이터 요소)의 골격 구조에 따라 구조화될 수 있다. 컴퓨터(105), 랩톱(110), 및 모바일 장치(115)는 각각 다양한 사용자에 의해 작동될 수 있다. 예를 들어, 컴퓨터(105)는 의사에 의해 작동될 수 있고, 랩톱(110)은 개체의 관리자에 의해 작동될 수 있으며, 모바일 장치(115)는 대상체에 의해 작동될 수 있다. 모바일 장치(115)는 게이트웨이(120) 및 네트워크(125)를 사용하여 클라우드 네트워크(130)에 연결할 수 있다. 일부 예에서, 컴퓨터(105), 랩톱(110), 및 모바일 디바이스(115) 각각은 동일한 개체(가령, 동일한 병원)와 연관된다. 또 다른 예에서, 컴퓨터(105), 랩톱(110), 및 모바일 디바이스는 상이한 개체(예를 들어, 상이한 병원들)와 연관된다. 컴퓨터(105), 랩톱(110) 및 모바일 장치(115)의 사용자 장치는 설명을 위한 예시이므로, 본 발명이 이에 한정되지는 않는다. 네트워크 환경(100)은 임의의 장치 유형의 임의의 수 또는 구성의 사용자 장치를 포함할 수 있다.
일부 실시예에서, 클라우드 서버(135)는 컴퓨터(105), 랩톱(110) 또는 모바일 장치(115) 중 임의의 것과 상호작용함으로써 데이터 레지스트리(140)에 저장되기 위한 데이터(가령, 대상체 레코드)를 획득할 수 있다. 예를 들어, 데이터 레지스트리(140)로 수집되도록 로컬하게 저장된(예를 들어, 컴퓨터(105)의 로컬 네트워크에 저장된) 대상체 레코드 또는 또 다른 데이터 레코드를 선택하기 위해 인터페이스를 사용함으로써 컴퓨터(105)는 클라우드 서버(135)와 상호대화한다. 또 다른 예를 들어, 컴퓨터(105)는 인터페이스와 상호작용하여 클라우드 서버(135)에 대상체 레코드 또는 그 밖의 다른 데이터 레코드를 저장하는 데이터베이스의 주소(가령, 네트워크 위치)를 제공할 수 있다. 그런 다음 클라우드 서버(135)는 데이터베이스로부터 데이터 레코드를 불러오고 데이터 레코드를 데이터 레지스트리(140)에 수집한다.
일부 실시예에서, 컴퓨터(105), 랩톱(110), 및 모바일 장치(115)는 상이한 개체(예를 들어, 의료 센터)와 연관된다. 클라우드 서버(135)가 컴퓨터(105), 랩톱(110), 및 모바일 장치(115)로부터 획득하는 데이터 레코드는 상이한 데이터 레지스트리에 저장될 수 있다. 컴퓨터(105), 랩톱(110), 및 모바일 장치(115) 각각으로부터의 데이터 레코드가 클라우드 네트워크(130) 내에 저장될 수 있지만, 데이터 레코드는 혼합되지 않는다. 예를 들어, 컴퓨터(105)는 데이터-프라이버시 규칙에 의해 부과된 제약조건으로 인해 랩톱(110)으로부터 획득된 데이터 레코드를 액세스할 수 없다. 그러나, 클라우드 서버(135)는 데이터 레코드가 다른 개체에 의해 쿼리될 때 데이터 레코드의 일부분을 자동으로 난독화, 추상화, 또는 마스킹하도록 구성될 수 있다. 따라서 개체로부터 수집된 데이터 레코드는 데이터-프라이버시 규칙을 준수하기 위해 난독화, 모호화 또는 마스킹된 형태로 다른 개체에게 노출될 수 있다.
데이터 레코드가 컴퓨터(105), 랩톱(110), 및 모바일 장치(115)로부터 수집되면, 데이터 레코드는 본 명세서에 기술된 지능형 분석 기능을 제공하기 위해 머신-러닝 또는 인공-지능 모델을 훈련시키기 위한 훈련 데이터로서 사용될 수 있다. 개체와 연관된 사용자 장치가 데이터 레지스트리(140)에 쿼리하고 쿼리 결과가 다른 개체로부터 기원한 데이터 레코드를 포함할 때 이들 데이터 레코드가 데이터-프라이버시 규칙을 준수하는 난독화된 형태로 사용자 장치로 제공 또는 노출될 수 있다고 가정하면, 데이터 레코드가 또한 임의의 개체에 의해 쿼리되도록 이용 가능해 질 수 있다.
클라우드 서버(135)는 실행될 때 대상체 레코드의 변환된 표현(가령, 대상체 레코드에 저장된 정보를 숫자로 나타내는 벡터)을 사용하여 지능형 기능이 수행되게 하는 코드를 실행하도록 특수한 방식으로 구성될 수 있다. 예를 들어, 지능형 기능은 클라우드 서버(135)를 사용하여 코드를 실행함으로써 수행될 수 있다. 실행된 코드는 훈련된 신경망 모델을 나타낼 수 있다. 신경망 모델은 치료 요법에 대한 대상체의 반응 예측, 유사한 환자 식별, 환자에 대한 치료 요법 추천 생성 및 기타 지능형 기능과 같은 지능형 기능을 수행하도록 훈련되었을 수 있다. 신경망 모델은 이전에 병태에 대해 치료를 받았고 결과(가령, 병태 극복, 병태의 중증도 증가, 병태의 중증도 감소 등)를 경험한 대상체의 대상체 레코드를 포함하는 훈련 데이터 세트를 사용하여 훈련될 수 있다. 추가로, 실행된 코드는 클라우드 서버(135)가 기존 대상체 레코드의 비숫자 값을 훈련된 신경망 모델에 의해 처리될 수 있는 숫자 표현(예를 들어, 변환된 표현)으로 변환하도록 구성될 수 있다. 예를 들어, 클라우드 서버(135)에 의해 실행되는 코드는 대상체 레코드의 세트의 각 대상체 레코드를 입력으로 수신하도록 구성될 수 있으며, 각 대상체 레코드에 대해 코드는 실행될 때 클라우드 서버(135)로 하여금 각 대상체 레코드의 각 데이터 요소를 변환된 표현, 가령, 벡터 표현으로 변환하기 위한 본 명세서에 기재된 작업을 수행하게 할 수 있다. 지능형 기능을 실행하는 것은 데이터 레지스트리(140)에 저장된 데이터 레코드의 적어도 일부분을 훈련된 머신 러닝 또는 인공 지능 모델에 입력하여 추가 분석을 위한 출력을 생성하는 것을 포함할 수 있다. 일부 실시예에서, 출력은 데이터 레코드 내의 패턴을 추출하거나 데이터 레코드의 데이터 필드와 연관된 값 또는 결과를 예측하는 데 사용될 수 있다. 클라우드 서버(135)에 의해 실행되는 지능형 기능의 다양한 실시예가 이하에서 기재된다.
일부 실시예에서, 클라우드 서버(135)는 (예를 들어, 의사에 의해 작동되는) 사용자 장치가 상담 방송(consult broadcast)을 목적지 장치의 세트로 전송하기 위해 클라우드-기반 애플리케이션을 액세스할 수 있게 하도록 구성된다. 상담 방송은 대상체 레코드와 연관된 대상체의 치료에 관한 지원 또는 보조 요청일 수 있다. 목적지 장치는 다른 개체(예를 들어, 다른 의료 센터의 의사)와 연관된 또 다른 사용자에 의해 작동되는 사용자 장치일 수 있다. 목적지 장치가 상담 방송과 연관된 지원 요청을 수락하면 클라우드-기반 애플리케이션은 대상체 레코드의 특정 데이터 필드를 생략하거나 추상화한 대상체 레코드의 요약된 표현을 생성할 수 있다. 요약된 표현은 데이터-프라이버시 규칙을 준수할 수 있으므로, 대상체 레코드와 연관된 대상체를 고유하게 식별하기 위해 대상체 레코드의 요약된 표현이 사용될 수 없다. 클라우드-기반 애플리케이션은 대상체 레코드의 요약된 표현을 지원 요청을 수락한 목적지 장치로 전송할 수 있다. 목적지 장치를 작동하는 사용자는 요약된 표현을 평가하고 대상체를 치료하기 위한 옵션을 논의하기 위해 통신 채널을 사용하여 사용자 장치와 통신할 수 있다. 예를 들어, 통신 채널은 사용자 장치(가령, 상담을 요청하는 의사에 의해 운영되는 것)가 목적지 장치(가령, 상담을 제공하는 다른 의사에 의해 운영되는 것)와 안전하게 통신할 수 있게 하는 보안 챗룸으로 구성될 수 있다.
일부 실시예에서, 클라우드 서버(135)는 치료-계획 형성 인터페이스를 사용자 장치에 제공하도록 구성된다. 치료-계획 형성 인터페이스를 통해 사용자 장치는 병태에 대한 치료 계획을 정의할 수 있다. 예를 들어, 치료 계획은 병태가 있는 대상체를 치료하기 위한 작업흐름일 수 있다. 작업흐름은 대상체의 모집단을 병태를 갖는 것으로 정의하기 위한 하나 이상의 기준을 포함할 수 있다. 작업흐름은 또한 병태에 대한 특정 유형의 치료제를 포함할 수 있다. 클라우드 서버(135)는 사용자 장치의 세트의 각각의 사용자 장치로부터 특정 병태에 대한 치료-계획 정의를 수신하고 저장한다. 클라우드-기반 애플리케이션은 사용자 장치의 세트에 주어진 병태에 대한 치료 계획을 배포할 수 있다. 사용자 장치의 세트의 둘 이상의 사용자 장치가 상이한 개체와 연관될 수 있다. 둘 이상의 사용자 장치 각각에는 임의의 부분 또는 전체 치료 계획을 고객 규칙 세트에 통합하는 옵션이 제공될 수 있다. 클라우드 서버(135)는 사용자 장치가 공유된 치료 계획을 전체적으로 통합하는지 또는 치료 계획의 일부를 통합하는지 모니터링할 수 있다. 사용자 장치와 공유된 치료 계획 간의 상호대화가 사용되어 치료 계획 또는 치료 계획을 기반으로 생성된 규칙을 업데이트할지 여부를 결정할 수 있다.
일부 실시예에서, 클라우드 서버(135)는 사용자 장치를 작동하는 사용자가 클라우드-기반 애플리케이션을 액세스하여 병태가 있는 대상체에 대한 제안된 치료를 결정할 수 있게 한다. 사용자 장치는 클라우드-기반 애플리케이션과 연관된 인터페이스를 로드한다. 인터페이스는 사용자 장치를 작동하는 사용자가 사용자에 의해 치료되는 대상체과 연관된 대상체 레코드를 선택할 수 있게 한다. 클라우드-기반 애플리케이션은 사용자가 치료하는 대상체와 유사한 이전에 치료를 받은 대상체를 식별하기 위해 다른 대상체 레코드를 평가할 수 있다. 예를 들어, 대상체들 간의 유사도는 대상체 레코드의 어레이 표현을 사용하여 결정될 수 있다. 어레이 표현(가령, 변환된 표현, 가령, 벡터, N-차원 행렬, 또는 비숫자 값의 임의의 숫자 표현)은 대상체 레코드의 데이터 필드의 값에 대한 임의의 숫자 및/또는 범주 표현일 수 있다. 예를 들어, 대상체 레코드의 어레이 표현은 유클리드 공간과 같은 도메인 공간에서의 대상체 레코드의 벡터 표현일 수 있다. 일부 경우에, 클라우드 서버(135)는 전체 대상체 레코드를 숫자 표현, 가령, 벡터로 변환하도록 구성될 수 있다. 주어진 대상체 레코드에 대해, 클라우드 서버(135)는 각 데이터 요소를 평가하여 해당 데이터 요소에 담기거나 포함된 데이터의 유형을 결정할 수 있다. 데이터의 유형은 그 데이터 요소의 숫자 또는 비숫자 값을 숫자 표현으로 변환하기 위해 수행할 프로세스 또는 기술을 클라우드 서버(135)에 알릴 수 있다. 예를 들어, 클라우드 서버(135)는 대상체 레코드의 데이터 요소의 비숫자 값(예를 들어, 의사의 메모의 텍스트)을 숫자 표현(예를 들어, 벡터)으로 변환할 수 있다. 변환은, 자연어 처리 기법, 가령, Word2Vec 또는 그 밖의 다른 텍스트 벡터화 기법을 사용해, 텍스트의 각 단어를 나타내는 숫자 값을 생성하는 것을 포함할 수 있다. 생성된 숫자 값은 훈련된 신경망에 입력되어 지능형 분석을 수행할 수 있는 벡터로서 역할할 수 있다. 또 다른 예로서, 영상(가령, MRI) 또는 비디오의 영상 프레임(가령, 초음파의 비디오 데이터)을 포함하는 데이터 요소의 경우, 각 영상 또는 영상 프레임은 입력 영상의 잠재-공간 표현을 생성하도록 훈련된 훈련된 자동-인코더 신경망을 이용해 숫자 표현(가령, 벡터)으로 변환될 수 있다. 입력 영상의 압축 표현(가령, 잠재 공간 표현)은 입력 영상의 숫자 표현으로서 역할 할 수 있다. 이 숫자 표현은 신경망 또는 그 밖의 다른 머신 러닝 모델에 입력되어 연관된 대상체 레코드의 지능형 분석을 수행할 수 있다. 또 다른 예로서, 정보의 시변 시퀀스(예를 들어, 일정 기간 동안 발생하는 이벤트 또는 대상체로부터 취해진 측정치)를 포함하는 데이터 요소에 대해, 시변 정보는 몇 가지 예시적인 변환을 사용하여 숫자 표현으로 표현될 수 있다. 어떤 경우에는, 이벤트의 카운트가 시변 정보를 나타내는 벡터로 사용될 수 있다. 예를 들어, 대상체에 대해 1년에 4번 측정한 경우 숫자 표현은 "4"가 될 수 있다. 다른 경우에, 발생하는 이벤트의 빈도 또는 비율(예를 들어, 매주, 매월, 매년 등)이 시변 정보를 나타내는 벡터로서 사용될 수 있다. 또 다른 경우에, 시변 정보 내 각 이벤트와 연관된 측정 값의 평균 또는 조합이 시변 정보를 나타내는 벡터로서 사용될 수 있다. 본 발명은 이러한 예에 한정되지 않으며, 따라서 시변 정보의 그 밖의 다른 숫자 표현이 숫자 표현을 나타내는 벡터로서 사용될 수 있다.
AI 시스템(145)은 빅데이터 규모로 데이터 세트를 수집하고, 수집된 데이터 세트를 큐레이트된 훈련 데이터로 변환하고, 큐레이트된 훈련 데이터를 사용하여 학습 알고리즘을 실행하고, 훈련 데이터의 검출된 패턴, 상관관계 및/또는 관계를 하나 이상의 훈련된 AI 모델에 저장하도록 구성될 수 있다. 일부 구현예에서, AI 시스템(145)은 특정 예측 기능, 가령, SMA를 앓는 특정 대상체에 대한 질병 진행 예측, 새로운 또는 기존 임상 연구에 포함될 후보 대상체 그룹을 예측, 또는 특정 대상체에 특이적인 콘텍스트 치료 스케줄을 예측하는 기능을 수행하도록 구성될 수 있다. 일부 구현예에서, 도 8 및 11과 관련하여 더 상세히 기재될 바와 같이, AI 시스템(145)의 출력은 SMA로 진단된 특정 대상체에 대한 질병 진행을 예측할 수 있다. 일부 구현예에서, 도 9 및 12과 관련하여 더 상세히 기재될 바와 같이, AI 시스템(145)의 출력은 새로운 임상 연구에 대한 적절한 후보가 될 수 있는 대상체의 새로운 그룹을 예측할 수 있다. 일부 구현예에서, 도 10 및 13과 관련하여 더 상세히 기재될 바와 같이, AI 시스템(145)의 출력은 SMA를 앓는 특정 대상체에 대한 치료 선택을 예측할 수 있다.
경우에 따라, 어레이 표현의 복수 값이 단일 필드에 대응한다. 예를 들어, 데이터 요소의 값은 원-핫 인코딩을 통해 생성된 다수의 이진 값으로 표현될 수 있다. 또 다른 예로서, 대상체 레코드의 단일 데이터 요소에 있는 다수의 값의 각 값은 위에서 설명한 것처럼 개별적으로 숫자 표현으로 변환될 수 있다. 다수의 값의 각 값을 나타내는 숫자 표현은 데이터 요소에 대응하는 단일 숫자 표현으로 조합될 수 있다. 다수의 숫자 표현을 조합하는 것은 임의의 벡터 조합 기법, 가령, 벡터 크기의 평균화, 벡터 추가 또는 다수의 벡터를 단일 벡터로 연결하는 것을 이용해 수행될 수 있다. 일부 예에서, 클라우드-기반 애플리케이션은 대상체 레코드의 그룹의 각각의 대상체 레코드에 대한 어레이 표현을 생성할 수 있다. 두 개의 대상체 레코드 간 유사도는 두 개의 어레이 표현을 비교하여 이들 간 거리를 결정함으로써 표현될 수 있다. 대상체 레코드는 전체 대상체 레코드의 숫자 표현을 다른 대상체 레코드의 다른 숫자 표현과 비교하는 대신 차원(가령, 데이터 요소)을 따라 비교될 수도 있다. 예를 들어, 차원을 따라 두 개의 대상체 레코드를 비교하는 것은 대상체 레코드의 데이터 요소의 숫자 표현을 다른 대상체 레코드의 매칭되는 데이터 요소의 다른 숫자 표현과 비교하는 것을 포함할 수 있다. 또한, 클라우드-기반 애플리케이션은 인터페이스를 사용하여 사용자 장치에 의해 선택된 대상체 레코드에 가장 가까운 이웃인 대상체를 식별하도록 구성될 수 있다. 최근접 이웃은 다양한 대상체 레코드의 숫자 표현을 표적 대상체 레코드의 숫자 표현과 비교함으로써 결정될 수 있다. 클라우드-기반 애플리케이션은 최근접 이웃인 대상체에 대해 이전에 수행된 치료를 식별할 수 있다. 클라우드-기반 애플리케이션은 최근접 이웃에 대해 이전에 수행된 처리를 인터페이스에서 사용 가능하게 할 수 있다.
일부 실시예에서, 클라우드 서버(135)는 이전에 치료된 대상체의 데이터베이스를 검색하는 쿼리를 생성하도록 구성된다. 클라우드 서버(135)는 쿼리를 실행하고 쿼리의 제약조건을 만족하는 대상체 레코드를 검색할 수 있다. 그러나 쿼리 결과를 표시할 때, 클라우드-기반 애플리케이션은 쿼리를 생성한 사용자가 치료했거나 치료 중인 대상체에 대해서만 대상체 레코드 전체를 표시할 수 있다. 클라우드-기반 애플리케이션은 쿼리를 생성하는 사용자가 치료하지 않는 대상체에 대한 대상체 레코드의 일부분을 마스킹하거나 그 밖의 다른 방식으로 난독화한다. 쿼리 결과에 포함된 대상체 레코드의 일부분의 마스킹 또는 난독화를 통해 사용자는 데이터-프라이버시 규칙을 준수할 수 있다. 일부 실시예에서, 쿼리 결과(쿼리 결과가 난독화되었는지 여부에 관계없이)는 대상체 레코드 내의 패턴 또는 공통 속성에 대해 자동으로 평가될 수 있다.
일부 실시예에서, 클라우드 서버(135)는 챗봇을 클라우드-기반 애플리케이션에 내장한다. 챗봇은 사용자 장치와 자동으로 통신하도록 구성된다. 챗봇은 사용자 장치와 챗봇 간에 메시지가 교환되는 통신 세션에서 사용자 장치와 통신할 수 있다. 챗봇은 사용자 장치로부터 수신된 질문에 대한 답을 선택하도록 구성될 수 있다. 챗봇은 클라우드-기반 애플리케이션에 의해 액세스될 수 있는 지식 베이스에서 답을 선택할 수 있다. 사용자 장치가 챗봇에 질문을 전송하고 해당 챗봇에 지식 베이스에 저장된 기존 답이 없는 경우, 지식 베이스에 저장된 기존 답변이 있는 질문의 다른 표현이 제공된다. 챗봇과 통신하는 사용자는 챗봇이 제공한 답변이 정확하거나 도움이 되는지 여부를 묻는 메시지를 받을 수 있다.
임의의 머신-러닝 또는 인공-지능 알고리즘이 본 명세서에서 기재된 훈련된 머신-러닝 모델 중 임의의 것을 생성하기 위해 실행될 수 있음이 이해될 것이다. 다양한 유형 및 기술의 인공 지능 기반 및 머신 러닝 모델이 훈련되고 실행되어 프로토콜 또는 기능을 수행하기 위한 사용자 결과를 예측하는 하나 이상의 출력을 생성할 수 있다. 모델의 비제한적인 예로는 나이브 베이즈(
Figure pct00001
) 모델, 랜덤 포레스트 또는 구배 부스팅 모델, 로지스틱 회귀 모델, 딥 러닝 신경망, 앙상블 모델, 지도 학습 모델, 비지도 학습 모델, 협업 필터링 모델 및 그 밖의 다른 임의의 적절한 머신 러닝 또는 인공 지능 모델을 포함한다.
클라우드-기반 애플리케이션은 외부 의사와 상담하는 것, 진단을 결정하는 것, 및 비제한적으로 다음을 포함하는 임의의 질환, 병태, 연구 분야, 질병에 대한 치료를 제안하는 것과 관련하여 지능형 기능을 수행하도록 구성될 수 있음을 알아야 한다: COVID-19, 종양학, 가령, 다음의 암: 폐, 유방, 결장직장, 전립선, 위, 간, 자궁경부(경부), 식도, 방광, 신장, 췌장, 자궁내막, 구강, 갑상선, 뇌, 난소, 피부 및 담낭의 암; 고형종양, 가령, 육종 및 암종, 면역계의 암, 가령, 림프종(가령, 호지킨(Hodgkin) 또는 비-호지킨), 및 혈액의 암(혈액암) 및 골수 암, 가령, 백혈병(가령, 급성 림프구성 백혈병(ALL) 및 급성 골수성 백혈병(AML)), 림프종 및 골수종. 추가 장애에는 혈액 장애, 가령, 빈혈, 출혈 장애, 가령, 혈우병, 혈전, 안과 장애, 가령, 당뇨병성 망막병증, 녹내장 및 황반 변성, 신경계 장애, 가령, 다발성 경화증, 파킨슨병, 척수성 근위축증, 헌팅턴병, 근위축성 측삭 경화증(ALS) 및 알츠하이머병, 자가면역 질환, 가령, 다발성 경화증, 당뇨병, 전신성 홍반성 루푸스, 중증 근무력증, 염증성 장 질환(IBD), 건선, 길랑-바레 증후군, 만성 염증성 탈수초 다발신경병증(CIDP), 그레이브스병, 하시모토병, 습진, 혈관염, 알레르기 및 천식이 있다.
다른 질병 및 장애의 비제한적 예를 들면, 신장 질환, 간 질환, 심장 질환, 뇌졸중, 위장 질환, 가령, 셀리악병, 크론병, 게실 질환, 과민성 장 증후군(IBS), 위식도 역류 질환(GERD) 및 소화성 궤양, 관절염, 성병, 고혈압, 세균 및 바이러스 감염, 기생충 감염, 결합 조직 질환, 셀리악병, 골다공증, 당뇨, 루푸스, 중추 및 말초 신경계 질환, 가령, 주의력 결핍/과잉행동 장애(ADHD), 강경증, 뇌염, 뇌전증 및 경련, 말초 신경병증, 뇌수막염, 편두통, 척수병증, 자폐증, 양극성 장애 및 우울증이 있다.
IV.A. 클라우드-기반 애플리케이션을 통해 사용자 장치가 다른 사용자 장치에 대한 상담 방송을 요청하고 데이터-프라이버시 규칙을 준수하기 위해 대상체 레코드를 자동으로 요약할 수 있음
도 2는 대상체 치료에 대한 지원을 요청하는 상담 방송과 연관하여 압축된 대상체 레코드를 사용자 장치에 배포하기 위해 클라우드-기반 애플리케이션에 의해 수행되는 프로세스(200)를 예시하는 흐름도이다. 프로세스(200)는 클라우드 서버(135)에 의해 수행되어 데이터-프라이버시 규칙을 준수하면서 상이한 개체(예를 들어, 병원)와 연관된 사용자 장치가 대상체에 대한 치료에 관해 협력하거나 상담하게 할 수 있다.
프로세스(200)는 클라우드 서버(135)가 사용자 장치로부터 속성 세트를 수신하는 블록(210)에서 시작한다. 속성 세트의 각각의 속성은 대상체(가령, 환자)의 모든 특성을 나타낼 수 있다. 속성 세트는 클라우드 서버(135)에 의해 제공되는 인터페이스를 사용하여 사용자에 의해 식별될 수 있다. 예를 들어, 속성 세트는 대상체의 인구 통계학적 정보 및 대상체가 경험한 최근 증상을 식별한다. 인구통계학적 정보의 비제한적 예로는 나이, 성별, 민족성, 거주하는 주 또는 도시, 소득 범위, 교육 수준 또는 기타 적절한 정보가 포함된다. 최근 증상의 비제한적인 예로는 현재 또는 최근에(가령, 마지막 방문 시, 섭취 시, 24시간 이내, 일주일 이내) 겪은 특정 증상(가령, 호흡 곤란, 임계 온도 이상의 발열, 임계 혈압 이상의 혈압 등)을 포함한다.
블록(220)에서, 클라우드 서버(135)는 대상체에 대한 레코드를 생성한다. 레코드는 하나 이상의 데이터 필드를 포함하는 데이터 요소일 수 있다. 레코드는 대상체와 연관된 속성 세트의 각각의 속성을 나타낸다. 레코드는 중앙 데이터 저장소, 가령, 데이터 레지스트리(140) 또는 임의의 다른 클라우드-기반 데이터베이스에 저장될 수 있다. 블록(230)에서, 클라우드 서버(135)는 인터페이스를 사용하여 사용자에 의해 제출된 요청을 수신한다. 요청은 상담 방송을 개시하는 것일 수 있다. 예를 들어, 개체와 연관된 사용자는 대상체를 치료하는 의료 센터의 의사이다. 사용자는 대상체 치료에 대한 지원 요청을 방송하기 위해 클라우드-기반 애플리케이션을 액세스하기 위해 사용자 장치를 작동할 수 있다. 방송은 상이한 개체와 연관된 다른 사용자 장치의 세트로 전송될 수 있다.
블록(240)에서, 클라우드 서버(135)는 대상체과 연관된 속성의 세트에 포함된 하나 이상의 최근 증상을 사용하여 중앙 데이터 저장소에 쿼리한다. 쿼리 결과에는 다른 레코드의 세트가 포함된다. 다른 레코드의 세트의 각각의 레코드는 다른 대상체와 연관된다. 일부 예에서, 클라우드 서버(135)는 대상체 레코드와 유사한 다른 대상체 레코드를 식별하기 위해 중앙 데이터 저장소에 쿼리할 수 있다. 유사도는 전체 대상체 레코드의 변환된 표현을 각각의 다른 대상체 레코드의 변환된 표현과 비교함으로써 결정될 수 있다. 변환된 표현의 비교는 두 대상체 레코드 사이의 유사도 정도를 나타내는 거리(가령, 유클리드 거리)를 도출할 수 있다. 다른 경우에, 유사도는 데이터 요소에 포함된 값에 기초하여 결정될 수 있다. 예를 들어, 표적 대상체 레코드는 대상체가 경험한 증상을 나타내는 텍스트를 포함하는 표적 데이터 요소를 포함할 수 있다. 중앙 데이터 저장소에 저장된 각각의 다른 대상체 레코드는 연관된 대상체의 증상을 나타내는 텍스트를 포함하는 데이터 요소를 포함할 수도 있다. 클라우드 서버(135)는 앞서 기재된 기법(가령, 훈련된 콘볼루션 신경망, 텍스트 벡터화 기법, 가령, Word2Vec 등)을 사용하여 표적 데이터 요소에 포함된 텍스트를 숫자 표현으로 변환할 수 있다. 표적 데이터 요소에 포함된 텍스트의 숫자 표현은 각각의 다른 대상체 레코드의 매칭되는 데이터 요소에 포함된 텍스트의 숫자 표현에 비교될 수 있다. (가령, 유클리드 공간과 같은 도메인 공간에서) 두 숫자 표현 간의 비교 결과는 표적 데이터 요소에 포함된 텍스트가 다른 대상체 레코드의 데이터 요소에 포함된 텍스트와 유사한 정도를 나타낼 수 있다. 블록(250)에서, 클라우드 서버(135)는 목적지 주소의 세트(예를 들어, 다른 개체와 연관된 다른 사용자 장치)를 식별한다. 목적지 주소의 세트의 각각의 목적지 주소는 블록(240)에서 식별된 다른 레코드의 세트의 하나 이상의 다른 레코드와 연관된 또 다른 대상체에 대한 의료 제공자와 연관된다. 블록(260)에서, 클라우드 서버(135)는 대상체에 대한 레코드의 요약 표현(condensed representation)을 생성한다. 레코드의 요약 표현은 레코드의 적어도 일부를 생략하거나, 모호하게 하거나, 난독화한다. 레코드의 요약 표현은 레코드와 연관된 대상체를 고유하게 식별하는 데 사용될 수 없기 때문에 데이터-프라이버시 규칙을 위반하지 않고 외부 시스템 간에 레코드의 요약 표현을 교환할 수 있다. 클라우드 서버(135)는 레코드의 요약 표현을 생성하기 위해 임의의 마스킹 또는 난독화 기술을 실행할 수 있다.
블록(270)에서, 클라우드 서버(135)는 목적지 주소의 세트의 각각의 목적지 주소에 대한 연결 입력 구성요소(가령, 통신 채널이 설정되게 하는 선택 가능한 링크, 가령, 하이퍼링크)에 의해 레코드의 요약 표현을 이용 가능하게 한다. 연결 입력 구성요소는 각각의 목적지 주소에 제시되는 선택 가능한 요소일 수 있다. 연결 입력 구성요소의 비제한적인 예는 버튼, 링크, 입력 요소 및 그 밖의 다른 적절한 선택 가능한 요소를 포함한다. 블록(280)에서, 클라우드 서버(135)는 목적지 주소와 연관된 목적지 장치로부터 통신을 수신한다. 통신은 목적지 장치를 작동하는 사용자가 레코드의 요약된 표현과 연관된 연결 입력 구성요소를 선택했다는 지시자를 포함한다. 블록(290)에서, 클라우드 서버(135)는 연결 입력 구성요소가 선택되었던 목적지 장치와 사용자 장치 사이의 통신 채널을 확립한다. 통신 채널은 사용자 장치(가령, 대상체를 치료하는 의사)를 작동하는 사용자가 메시지 또는 그 밖의 다른 데이터(가령, 비디오 피드)를 연결 입력 구성요소가 선택된 목적지 주소와 연관된 목적지 장치(예를 들어, 환자의 치료를 지원하기로 동의한 다른 병원의 의사)와 교환할 수 있도록 한다.
일부 실시예에서, 클라우드 서버(135)는 사용자 장치의 위치 및 연결 입력 구성요소가 선택되었던 목적지 장치의 위치를 자동으로 결정하도록 구성된다. 클라우드 서버(135)는 또한 위치를 비교하여 레코드의 요약 표현을 생성할지 여부를 결정할 수 있다. 예를 들어, 블록(260)에서, 클라우드 서버(135)가 목적지 주소의 세트의 각각의 목적지 주소가 상담 방송을 개시한 사용자 장치와 함께 배치되지 않는다고 결정하기 때문에, 클라우드 서버(135)는 레코드의 요약 표현을 생성할 수 있다. 이 경우에, 클라우드 서버(135)는 데이터-프라이버시 규칙을 준수하기 위해 레코드의 요약 표현을 생성할 것을 자동으로 결정할 수 있다. 또 다른 예로서, 목적지 주소의 세트가 상담 방송을 개시한 사용자 장치와 동일한 개체와 연관되는 경우, 클라우드 서버(135)는 데이터-프라이버시 규칙을 준수하면서, 목적지 주소와 연관된 목적지 장치로 레코드를 완전히(예를 들어, 레코드의 일부를 난독화하지 않고) 전송할 수 있다.
일부 실시예에서, 클라우드 서버(135)는 복수의 다른 압축된 레코드 표현을 생성한다. 복수의 다른 요약 레코드 표현 각각이 다른 대상체와 연관된다. 클라우드 서버(135)는 사용자 장치에 복수의 다른 요약된 레코드 표현을 전송하고, 사용자 디바이스로부터, 복수의 다른 요약된 레코드 표현의 서브세트의 선택을 식별하는 통신을 수신한다. 목적지 주소의 세트 의 각각의 목적지 주소는 요약된 레코드 표현 중 하나씩으로 표현된다. 예를 들어, 요약된 레코드 표현을 생성하는 것은 요약된 레코드 표현과 연관된 다른 대상체의 관할 구역을 결정하고, 관할 구역 내에서 대상체 레코드의 교환을 관리하는 데이터-프라이버시 규칙을 결정하며, 데이터-프라이버시 규칙을 준수하기 위해 요약된 레코드 표현을 생성하는 것을 포함한다. 복수의 다른 요약된 레코드 표현의 첫 번째 다른 요약된 레코드 표현은 특정 유형의 데이터를 포함할 수 있다. 복수의 다른 요약된 레코드 표현의 두 번째 다른 요약된 레코드 표현은 특정 유형의 데이터를 생략하거나 추상화할 수 있다. 예를 들어, 특정 유형의 데이터는 연락처 정보, 식별 정보, 가령, 이름, 사회 보장 번호, 및 다른 대상체를 고유하게 식별하는 데 사용될 수 있는 그 밖의 다른 적절한 정보일 수 있다.
일부 구현예에서, 통신은 중앙 데이터 저장소에서 수신될 수 있다. 통신은 사용자에 의해 작동되는 사용자 장치에 의해 전송될 수 있고 표적 대상체의 표적 대상체 레코드의 식별자를 포함할 수 있다. 통신은 중앙 데이터 저장소에서 수신될 때 중앙 데이터 저장소로 하여금 대상체 레코드의 세트의 불완전한 서브세트를 식별하기 위해 대상체 레코드의 저장된 세트를 쿼리하게 할 수 있다. 불완전한 서브세트의 각 대상체 레코드는 식별되고 불완전한 서브세트에 포함될 수 있는데, 이는 대상체 레코드가 적어도 하나의 차원에서 대상 대상체 레코드와 유사한 것으로 결정되기 때문이다. 차원을 따른 두 대상체 레코드 간의 유사도는 대상체 레코드의 데이터 요소에 관련된 유사도, 가령, 증상, 진단, 치료 또는 그 밖의 다른 임의의 적절한 데이터 요소에 대한 유사도를 나타낼 수 있다. 유사도 또는 비유사도가 결정되는 하나 이상의 차원은 자동으로 정의되거나 사용자가 정의할 수 있다. 표적 대상체 레코드와 중앙 데이터 저장소에 저장된 대상 대상체 레코드 세트의 각 대상체 레코드 간의 유사도 또는 비유사도를 결정하는 것은 적어도 적어도 다음 작업을 포함할 수 있다: 통신에 포함된 식별자에 기초하여 표적 대상체 레코드를 불러오는 것, 표적 대상체 레코드의 변환된 표현을 생성하는 것(또는 표적 대상체 레코드의 기존의 변환된 표현을 불러오는 것), 및 표적 대상체 레코드의 변환된 표현 및 대상체 레코드의 세트의 각 대상체 레코드의 변환된 표현을 사용하여 클러스터링 작업을 수행하는 것. 클러스터링 작업은 하나 이상의 차원(가령, 대상체 레코드의 하나 이상의 특징)에 대해 수행될 수 있다. 예를 들어, 클러스터링 작업은 대상체의 증상을 나타내는 값을 포함하는 데이터 요소에 기초하여 중앙 데이터 저장소에 저장된 대상체 레코드의 세트를 클러스터링할 수 있다. 표적 대상체 레코드의 변환된 표현은 대상체의 증상을 나타내는 값을 포함하는 데이터 요소의 벡터 표현을 포함할 수 있다. 표적 대상체 레코드의 이 데이터 요소의 벡터 표현과 대상체 레코드의 세트의 각 대상체 레코드 내 대응하는 데이터 요소의 벡터 표현이 비교되어 대상체 레코드의 클러스터를 정의할 수 있다. 대상체 레코드의 각 클러스터는 유사도 차원으로 선택된 데이터 요소와 연관된 공통 특성을 공유하는 하나 이상의 대상체 레코드의 그룹을 정의할 수 있다. 대상체 레코드의 각 클러스터에서 표적 대상체 레코드의 변환된 표현과 대상체 레코드의 세트의 다른 변환된 표현 간 유클리드 거리가 계산될 수 있다. 예를 들어, 대상체 레코드의 변환된 표현과 표적 대상체 레코드의 변환된 표현 사이의 유클리드 거리가 임계값 내에 있을 때 대상체 레코드는 표적 대상체 레코드와 유사한 것으로 결정될 수 있다.
IV.B. 집계된 사용자 통합을 기반으로 공유 가능한 치료-계획 정의 업데이트
도 3은 치료-계획 정의(가령, 결정 트리 또는 치료 작업흐름)의 사용자 통합을 모니터링하고 모니터링의 결과에 기초하여 치료-계획 형성을 자동으로 업데이트하기 위한 프로세스(300)를 예시하는 흐름도이다. 프로세스(300)는 클라우드 서버(135)에 의해 수행되어 사용자 디바이스가 병태를 가진 대상체의 모집단을 치료하기 위한 치료 계획을 정의할 수 있게 할 수 있다. 사용자 장치는 내부 또는 외부 네트워크에 연결된 사용자 장치에 치료-계획 정의를 배포할 수 있다. 치료-계획 정의를 수신하는 사용자 장치는 치료-계획 정의를 커스텀 규칙 베이스에 통합할지 여부를 결정할 수 있다. 커스텀 규칙 베이스로의 통합이 모니터링되고 치료-계획 정의를 자동으로 수정하기 위해 사용될 수 있다.
블록(310)에서, 클라우드 서버(135)는 사용자 장치가 인터페이스 데이터를 로드할 때 치료-계획 정의 인터페이스가 디스플레이되게 하는 인터페이스 데이터를 저장한다. 치료-계획 정의 인터페이스는 사용자 장치가 치료-계획 정의 인터페이스로 이동하기 위해 클라우드 서버(135)를 액세스할 때 사용자 장치의 세트의 각각의 사용자 장치에 제공된다. 일부 실시예에서, 치료-계획 정의 인터페이스에 의해 사용자가 병태(예를 들어, 림프종)를 갖는 대상체의 모집단을 치료하기 위한 치료 계획을 정의할 수 있게 한다.
블록(320)에서, 클라우드 서버(135)는 통신 세트를 수신한다. 통신 세트의 각각의 통신은 사용자 장치의 세트의 사용자 장치로부터 수신되고 사용자 장치와 치료-계획 정의 인터페이스 간의 상호작용에 응답하여 생성되었다. 일부 실시예에서, 통신은, 예를 들어, 대상체 레코드의 모집단을 정의하기 위한 하나 이상의 기준을 포함한다. 각각의 기준은 변수 유형으로 나타낼 수 있다. 예를 들어, 변수 유형은 기준의 조건으로 사용되는 값 또는 변수일 수 있다. 규칙의 기준의 변수 유형은 또한 대상체의 집단을 불완전한 서브-그룹으로 제한하는 조건의 임의의 값일 수 있다. 예를 들어, 임산부의 모집단을 정의하는 규칙의 변수 유형은 "IF '대상체가 임신 상태임'"이다. 기준은 대상체 레코드의 풀을 필터링하기 위한 필터 조건일 수 있다. 예를 들어, 림프종이 발생할 수 있는 대상체와 연관된 대상체 레코드의 모집단을 정의하기 위한 기준에는 "역형성 림프종 키나아제(ALK)의 이상" 및 "60세 이상"이라는 필터 조건이 포함될 수 있다. 통신은 상태에 대한 특정 유형의 치료를 포함할 수도 있다. 특정 유형의 치료는 대상체 레코드의 모집단으로 대표되는 대상체와 연관된 병태를 치료하기 위해 제안된 특정 동작을 수행하는 것(가령, 수술 받기) 또는 특정 동작을 하지 않는 것(가령, 염분 섭취 줄이기)과 연관될 수 있다.
블록(330)에서, 클라우드 서버(135)는 중앙 데이터 저장소, 가령, 데이터 레지스트리(140) 또는 클라우드 네트워크(130) 내의 임의의 다른 중앙 서버에 규칙의 세트를 저장한다. 규칙 세트의 각각의 규칙은 하나 이상의 기준 및 사용자 장치로부터의 통신에 포함된 특정 치료 유형을 포함한다. 예를 들면, 규칙은 대상체의 림프종을 치료하기 위한 치료 작업흐름을 나타낸다. 규칙은 다음 기준(가령, "IF" 문 다음에 오는 조건) 및 다음 작업(가령, 사용자가 정의하거나 선택한 특정 치료 유형, "THEN" 문 다음에 따라옴)을 포함한다. "IF '림프절의 생검이 림프종 세포가 있음을 나타냄' AND '혈액 검사에서 림프종 세포가 있음을 나타냄' THEN '화학요법으로 치료' AND '능동 감시'". 또한 규칙 세트의 각각의 규칙은 통신이 수신된 사용자 장치에 대응하는 식별자와 연관되어 저장된다.
블록(340)에서, 클라우드 서버(135)는 치료-계획 정의 인터페이스를 통해 개체들에 걸쳐 이용가능한 규칙 세트의 서브세트를 식별한다. 규칙의 서브세트는 병태와 연관되고 평가를 위해 다른 의료 센터와 같은 외부 시스템에 배포되는 규칙 세트의 서브세트를 포함할 수 있다. 예를 들어, 규칙의 특성 또는 규칙과 연관된 식별자를 평가하여 규칙의 서브세트에 포함할 규칙을 선택할 수 있다. 규칙의 특성은 저장된 규칙에 저장되거나 추가된 코드 또는 플래그를 포함할 수 있다. 코드 또는 플래그는 규칙이 일반적으로 외부 시스템에 의해 사용 가능함(가령, 개체에 의해 이용됨)을 나타낸다.
블록(350)에서, 블록(340)에서 식별된 규칙의 서브세트의 각각의 규칙에 대해, 클라우드 서버(135)는 규칙과의 상호대화를 모니터링한다. 상호대화는 규칙을 커스텀 규칙 베이스에 통합하는 외부 개체(가령, 규칙과 연관된 치료-계획을 정의한 사용자와 연관된 개체 외부의 개체)를 포함할 수 있다. 예를 들어, 외부 개체(가령, 상이한 병원)와 연관된 사용자 장치는 외부 개체에 의해 이용되는 규칙을 평가한다. 평가는 규칙이 외부 개체에 의해 정의된 규칙 세트에 통합하기에 적합한지 여부를 결정하는 것을 포함한다. 규칙은 외부 개체와 연관된 사용자 장치가 규칙을 사용하여 정의된 치료 작업흐름이 규칙에 대응하는 병태를 치료하는 데 적합하다고 지시할 때 적합할 수 있다. 위의 예시를 계속해서 설명하면 림프종 치료 규칙을 외부 의료 센터에서 사용할 수 있다. 외부 의료 센터와 연관된 사용자는 림프종 치료에 대한 규칙이 외부 의료 센터에서 정의한 규칙 세트에 통합되기에 적합하다고 결정한다. 따라서, 규칙이 외부 의료 센터에서 정의한 커스텀 규칙 베이스로 통합된 후, 외부 의료 센터와 연관된 다른 사용자가 사용자 규칙 베이스로부터 통합 규칙을 선택함으로써 통합된 규칙을 실행할 수 있을 것이다. 추가로, 클라우드 서버(135)는 치료-계획 정의 인터페이스가 외부 개체와 연관된 사용자 장치로부터 커스텀 규칙 베이스로의 규칙의 통합에 대응하는 입력을 수신할 때 생성되거나 생성된 신호를 검출함으로써 사용된 규칙의 통합을 모니터링한다.
다른 예로서, 외부 개체와 연관된 사용자 장치는 치료-계획 정의를 사용하여 상호대화-특정적 수정된 버전의 규칙을 커스텀 규칙 베이스에 통합한다. 상호 대화-특정적 수정 버전의 규칙은 커스텀 규칙 베이스에 통합되기 위해 선택된 규칙의 일부이다. 통합을 위해 규칙의 일부를 선택하는 것은 커스텀 규칙 베이스에 통합하기 위해 규칙에 포함된 모든 기준보다 적게 선택하는 것을 포함한다. 위의 예시를 계속 들면, 외부 개체와 연관된 사용자 장치는 "IF '림프절 생검이 림프종 세포가 있음을 지시함'"의 기준을 커스텀 규칙 베이스에 통합되도록 선택하지만, 사용자 장치는 "혈액 검사에서 림프종 세포가 있음이 나타남"의 기준을 커스텀 규칙 베이스에 통합되도록 선택하지 않는다. 따라서, 커스텀 규칙 베이스에 통합된 규칙의 상호 대화-특정적 수정 버전의 규칙은 "IF '림프절 생검에서 림프종 세포가 있음을 지시함' THEN '화학요법으로 치료' AND '능동 감시'"이다. "혈액 검사에서 림프종 세포가 있음이 나타남"의 기준이 규칙으로부터 제거되어 커스텀 규칙 베이스로 통합되는 상호대화-특정적 수정 버전의 규칙을 생성할 수 있다.
블록(360)에서, 클라우드 서버(135)는 상호대화-특정적 수정 버전의 규칙이 외부 개체에 의해 정의된 커스텀 규칙 베이스로 통합되었음을 검출할 수 있다. 일단 검출되면, 클라우드 서버(135)는 클라우드 네트워크(130)의 중앙 데이터 저장소에 저장된 규칙을 업데이트할 수 있다. 규칙은 모니터링된 상호대화(들)에 기초하여 업데이트될 수 있다. 이 예에서 "~에 기초하여"라는 용어는 모니터링된 상호대화(들)의 "평가 후" 또는 "평가 결과를 사용하는 것"에 대응한다. 예를 들어, 클라우드 서버(135)는 외부 개체와 연관된 사용자 장치가 규칙의 상호대화-특정적 수정 버전의 규칙을 통합했음을 검출한다. 상호대화-특정적 수정 버전의 규칙을 검출하는 것에 응답하여, 클라우드 서버(135)는 중앙 데이터 저장소에 저장된 규칙을 기존 규칙에서 상호대화-특정적 수정 버전의 규칙으로 업데이트할 수 있다.
일부 실시예에서, 클라우드 서버(135)는 외부 개체에 걸쳐 이용될 업데이트된 버전을 생성함으로써 규칙을 업데이트한다. 또 다른 원본 버전은 업데이트되지 않은 상태로 남아 있을 수 있으며 치료의 기준 및 특정 유형을 식별하는 하나 이상의 통신이 수신된 사용자 장치와 관련된 사용자에게 제공된다. 예를 들어, 클라우드 서버(135)는 중앙 데이터 저장소에 저장된 규칙을 업데이트하지만, 클라우드 서버(135)는 중앙 데이터 저장소에 저장된 규칙 세트의 다른 규칙을 업데이트하지 않는다.
일부 실시예에서, 클라우드 서버(135)는 업데이트 조건이 충족되었을 때 규칙을 업데이트할 수 있다. 업데이트 조건은 임계값일 수 있다. 예를 들어, 임계값은 수정 버전의 규칙을 커스텀 규칙 베이스에 통합한 외부 개체의 수 또는 퍼센티지일 수 있다. 또 다른 예로, 훈련된 머신 러닝 모델의 출력을 이용하여 업데이트 조건이 결정될 수 있다. 설명을 위해, 클라우드 서버(135)는 외부 개체로부터 수신된 검출된 신호를, 규칙을 사용할지 여부 및/또는 사용할 때 및/또는 업데이트된 버전의 규칙을 사용할지 여부 및 사용할 때를 자동으로 결정하는 다중 무장 도적 모델(multi-armed bandit model)에 입력할 수 있다. 단지 비제한적 예로서 설명하기 위해, 실행 시 규칙이 자동으로 중앙 데이터 저장소에 쿼리하여 추가로 분석할 대상체 레코드 세트의 서브세트를 식별하도록 규칙이 실행형 코드로서 정의될 수 있다. 또한, 규칙은 대상체 레코드의 식별된 서브세트와 연관된 대상체를 치료하기 위한 하나 이상의 치료 프로토콜을 포함할 수 있다. 규칙은 대상체 레코드 세트의 서브세트를 정의하고 대상체 레코드의 서브세트와 연관된 서브세트를 처리하기 위한 작업흐름으로서 정의될 수 있다. 예를 들어, 규칙은 대상체 레코드의 세트에서 대상체 레코드를 필터링하고 나머지 대상체 레코드(가령, 필터링이 완료된 후 남아 있는 대상체 레코드)와 연관된 대상체에 대해 특정 치료 프로토콜을 수행하기 위한 하나 이상의 기준을 포함할 수 있다. 규칙이 제1 개체의 사용자에 의해 정의되지만, 규칙은 제2 개체의 외부 사용자(가령, 상이한 병원에 근무하는 의사)에 의해 수용(가령, 제2 개체의 규칙 베이스에 포함)되거나, 수정되거나, 전체적으로 거절될 수 있다(가령, 제1 개체와 제2 개체는 두 개의 다른 의료 시설임). 일부 예에서, 제2 개체의 외부 사용자가 규칙을 수용함으로써 규칙을 코드베이스에 완전히 포함시킬 때마다 피드백 신호가 클라우드 서버(135)로 전송될 수 있다. 다른 예로, 제2 개체의 사용자가 규칙을 수정할 때마다 피드백 신호가 클라우드 서버(135)로 전송될 수 있다. 다른 예로, 제2 개체의 사용자가 규칙을 완전히 거절할 때마다 피드백 신호가 클라우드 서버(135)로 전송될 수 있다. 각각의 위의 예에서, 피드백 신호는 규칙(가령, 규칙 식별자)를 나타내고 규칙이 수용, 수정 또는 거부되었는지 여부를 나타내는 데이터를 포함할 수 있다. (클라우드 서버(135)에 의해 실행 가능한) 멀티 암드 밴딧(multi-armed bandit) 모델이 다른 개체의 외부 사용자에게 방송하기 위한 본래 규칙, 수정된 규칙 또는 완전히 상이한 규칙 중 하나를 지능적으로 선택하도록 구성될 수 있다. 본래 규칙, 수정된 규칙 또는 상이한 규칙의 선택은 멀티 암드 밴딧의 구성에 적어도 부분적으로 기초할 수 있다. 일부 예에서, 멀티 암드 밴딧은 입실론 그리디 탐색(epsilon greedy search) 기법과 함께 구성될 수 있다. 입실론 그리디 탐색 기법에서 멀티 암드 밴딧 모델은 "1-입실론"의 확률로 다른 개체의 외부 사용자에게 방송하기 위한 본래 규칙을 선택할 수 있으며, 여기서 입실론은 새로운 또는 수정된 규칙의 확률을 나타낸다. 따라서, 멀티 암드 밴딧 모델은 본래 규칙의 수정된 버전 또는 정의된 입실론의 확률로 완전히 새로운 규칙을 선택할 수 있다. 멀티 암드 밴딧 모델은 다른 개체로부터 수신된 피드백 신호에 기초하여 입실론을 변경할 수 있다. 예를 들어, 피드백 신호가 규칙이 임계값 횟수에 걸쳐 상이한 외부 사용자에 의해 특정 방식으로 수정되었음을 나타내는 경우, 멀티 암드 밴딧 모델은, 특정 방식으로 수정된 바와 같이, 본래 규칙을 방송하는 대신, 외부 사용자에게 방송하기 위한 규칙을 선택하는 것을 학습할 수 있다.
일부 실시예에서, 클라우드 서버(135)는 동일한 변수 유형에 대응하는 기준을 포함하고 동일하거나 유사한 유형의 치료를 식별하는 규칙의 세트의 복수의 규칙을 식별한다. 변수 유형은 기준의 조건으로 사용되는 값 또는 변수일 수 있다. 규칙의 기준의 변수 유형은 또한 대상체의 집단을 서브-그룹으로 제한하는 조건의 임의의 값일 수 있다. 예를 들어, 임산부의 모집단을 정의하는 규칙의 변수 유형은 "IF '대상체가 임신 상태임'"이다. 클라우드 서버(135)는 새로운 규칙이 일반적으로 다른 개체에 의해 운영된 서버로 전송될 때 다수의 규칙의 요약 표현인 새로운 규칙을 결정한다.
일부 실시예에서, 클라우드 서버(135)는 대상체의 속성의 세트를 수신하도록 구성된 또 다른 인터페이스를 제공한다. 예를 들어, 사용자 장치를 작동하여 다른 인터페이스에 액세스하고 다른 인터페이스를 사용하여 속성의 집합을 포함하는 대상체 레코드를 선택한다. 대상체 레코드의 선택은 클라우드 서버(135)가 대상체의 속성의 세트를 수신하게 할 수 있다. 클라우드 서버(135)는 대상체의 속성의 세트에 기초하여 기준이 충족되는 특정 규칙을 식별(예를 들어, 결정)한다. 예를 들어, 중앙 데이터 저장소에 저장된 규칙의 기준에 대해 대상체 레코드의 속성 집합을 평가한다. 설명을 위해, 속성의 세트가 "임신" 값을 포함하는 데이터 필드를 포함하고, 규칙이 "IF '대상체가 임신 상태임"이라는 단일 기준을 포함하는 경우, 클라우드 서버(135)는 이 규칙을 식별한다. 클라우드 서버(135)는 특정 규칙 및 특정 규칙과 연관된 각각의 특정 유형의 치료를 제시하도록 다른 인터페이스를 업데이트한다.
일부 실시예에서, 규칙의 기준은 특정 인구통계학적 변수 및/또는 특정 증상-유형 변수와 관련된 변수 유형이다. 인구통계학적 변수의 비제한적인 예로는 대상체의 인구통계학적 정보, 가령, 나이, 성별, 민족성, 인종, 소득 수준, 교육 수준, 위치 및 기타 적절한 인구통계학적 정보 항목을 특징짓는 정보 항목이 포함된다. 증상 유형 변수의 비제한적인 예는 대상체가 특정 증상(가령, 호흡 곤란, 실신, 임계 온도를 넘는 발열, 임계 혈압을 넘는 혈압 등)을 현재 또는 최근에(가령, 마지막 방문 시, 섭취 시, 24시간 이내, 일주일 이내) 경험했는지 여부를 지시한다.
일부 실시예에서, 클라우드 서버(135)는 대상체 레코드의 레지스트리의 데이터, 가령, 데이터 레지스트리(140)에 저장된 대상체 레코드를 모니터링한다. 클라우드 서버(135)는 (블록(340)에서 식별된) 규칙의 서브세트의 각각의 규칙에 대해 대상체 레코드의 레지스트리의 데이터를 모니터링한다. 클라우드 서버(135)는 규칙의 기준이 만족되고 특정 치료제가 대상체에 대해 처방된 대상체의 세트를 식별한다. 클라우드 서버(135)는 대상체의 세트의 각각에 대해, 평가 또는 검사로부터 또는 이를 사용하여 지시되는 대상체의 보고된 상태를 식별한다. 예를 들어, 보고된 상태는 대상체의 상태, 가령, 대상체의 퇴원 여부, 대상체의 생존 여부, 대상체의 혈압 측정치, 대상체가 수면 동안 깨어난 횟수, 및 그 밖의 다른 적절한 상태를 특성화하는 모든 정보이다. 클라우드 서버(135)는 보고된 상태에 기초하여 특정 치료제에 대한 대상체의 세트의 추정된 반응 메트릭을 결정한다. 예를 들어, 규칙의 특정 치료가 약물을 처방하는 것인 경우, 추정된 반응 메트릭은 약물이 대상체가 경험한 증상 또는 병태를 해결한 정보를 나타낸다. 비제한적인 예로서, 대상체 세트의 추정된 반응 메트릭은 평균, 가중 평균, 또는 대상체 세트의 각각의 대상체에 할당된 점수의 임의의 합계일 수 있다. 점수는 치료에 대한 대상체의 반응을 나타내거나 측정할 수 있다. 일부 경우, 클라우드 서버(135)는 클러스터링 기법을 이용함으로써 치료에 대한 대상체의 반응의 효과를 나타내는 점수를 생성할 수 있다. 단지 비제한적인 예로서 설명하기 위해, 대상체 레코드의 세트는 병태를 치료하기 위해 이전에 특정 치료 프로토콜을 이전에 겪었던 대상체를 나타낼 수 있다. 대상체 레코드의 세트의 각 대상체 레코드는 특정 치료 프로토콜에 대한 긍정적인 반응성, 특정 치료 프로토콜에 대한 중립적 반응성, 또는 특정 치료 프로토콜에 대한 부정적인 반응성 중 하나를 갖는 것으로 (예를 들어, 사용자에 의해) 라벨링될 수 있다. 대상체 레코드의 세트는 다음의 3개의 서브세트(가령, 클러스터)로 나눌 수 있다: 대상체 레코드의 제1 서브세트는 특정 치료 프로토콜에 대해 긍정적인 반응성을 보인 대상체에 대응할 수 있고, 대상체 레코드의 제2 서브세트는 특정 치료 프로토콜에 대한 중립적 반응성을 갖는 대상체에 대응할 수 있으며, 대상체 레코드의 제3 서브세트는 특정 치료 프로토콜에 대한 중립적 반응성을 갖는 대상체에 대응할 수 있다. 클라우드 서버(135)는 전술한 구현에 따라 대상체 레코드의 제1 서브세트의 각 대상체 레코드를 변환된 표현으로 변환할 수 있다. 클라우드 서버(135)는 또한 위에서 설명한 기법을 사용하여 대상체 레코드의 제2 서브세트의 각 대상체 레코드를 변환된 표현으로 변환할 수 있다. 마지막으로, 클라우드 서버(135)는 위에서 설명한 기법을 사용하여 대상체 레코드의 제3 대상체의 각 대상체 레코드를 변환된 표현으로 변환할 수 있다. 일부 구현예에서, 특정 치료 프로토콜에 대한 새로운 대상체의 예측된 반응성을 결정하는 것은 새로운 대상체의 새로운 대상체 레코드를 새로운 변환된 표현으로 변환하는 것을 포함할 수 있다. 새로운 변환된 표현은 각각의 클러스터 또는 대상체 레코드의 서브세트의 변환된 표현과 도메인 공간(가령, 유클리드 공간)에서 비교될 수 있다. 새로운 변환된 표현이 제1 서브세트와 연관된 변환된 표현의 중심에 가장 가까운 경우, 새로운 대상체가 특정 치료에 대한 긍정적인 반응성을 갖는 것으로 예측된다. 새로운 변환된 표현이 제1 서브세트의 변환된 표현의 중심에 가장 가까운 경우, 새로운 대상체는 특정 치료에 대한 중립 반응성을 갖는 것으로 예측된다. 마지막으로, 새로운 변환된 표현이 제3 서브세트의 변환된 표현의 중심에 가장 가까운 경우, 새로운 대상체는 특정 치료 프로토콜에 대한 부정적인 반응성을 갖는 것으로 예측된다. 중심은 서브세트와 연관된 변환된 표현의 다차원 평균일 수 있다. 클라우드 서버(135)는 규칙 세트의 서브세트 및 대상체 세트의 추정된 반응 메트릭이 치료-계획 정의 인터페이스에서 디스플레이되거나 그 밖의 다른 방식으로 표시되게 할 수 있다.
IV.C. 유사한 대상체에게 처방된 치료제를 사용하여 연관 효능이 있는 권장되는 치료제 제공
도 4는 대상에 대한 치료제를 추천하기 위한 프로세스(400)를 예시하는 흐름도이다. 프로세스(400)는 클라우드 서버(135)에 의해 수행되어 의료 개체와 연관된 사용자 장치에 대상체에 대한 권장 치료제 및 각각의 권장 치료의 효능을 디스플레이할 수 있다. 권장되는 치료제는 기존에 유사한 대상체에게 처방된 치료제의 효능을 평가한 결과를 통해 식별될 수 있다.
블록(410)에서, 클라우드 서버(135)는 대상체의 양태를 특징짓는 대상체 레코드에 대응하는 입력을 수신한다. 입력은 개체와 연관된 사용자 장치로부터 수신된다. 또한, 사용자 장치가 대상체 레코드의 레지스트리를 관리하도록 구성된 플랫폼의 인스턴스와 연관된 인터페이스를 사용하여 대상체 레코드를 선택하거나 그 밖의 다른 방식으로 식별하는 것에 응답하여 입력이 수신된다. 사용자 장치는 클라우드 네트워크(130) 내에 연결된 웹 서버(도시되지 않음)에 저장된 인터페이스 데이터를 로딩함으로써 인터페이스를 액세스할 수 있다. 웹 서버는 클라우드 서버(135) 상에 포함되거나 실행될 수 있다.
블록(420)에서, 클라우드 서버(135)는 블록(410)에서 수신된 대상체 레코드로부터 대상체 속성의 세트를 추출한다. 대상체 속성은 대상체의 양태를 특징짓는다. 대상체 속성의 비제한적인 예는 전자 의료 레코드에서 발견된 임의의 정보, 임의의 인구 통계학적 정보, 나이, 성별, 민족성, 최근 또는 과거 증상, 병태, 병태의 중증도, 및 대상체를 특징 짓는 그 밖의 다른 임의의 적절한 정보를 포함한다.
블록(430)에서, 클라우드 서버(135)는 대상체 속성의 세트를 사용하여 대상체 레코드의 어레이 표현을 생성한다. 예를 들어, 어레이 표현은 대상체 레코드에 포함된 값의 벡터 표현이다. 벡터 표현은 도메인 공간에서, 가령, 유클리드 공간에서의 벡터일 수 있다. 그러나 어레이 표현은 대상체 레코드의 데이터 필드의 값에 대한 임의의 숫자 표현일 수 있다. 일부 실시예에서, 클라우드 서버(135)는 특징 분해 기법, 가령, 특이값 분해(SVD)를 수행하여 대상체 레코드의 어레이 표현의 대상체 속성의 세트를 나타내는 값을 생성할 수 있다.
블록(440)에서, 클라우드 서버(135)는 다수의 다른 대상체를 특징 짓는 다른 어레이 표현의 세트를 액세스한다. 다른 어레이 표현의 세트에 포함된 어레이 표현은 다른 대상체(가령, 여러 다른 대상체 중 하나)를 특징 짓는 대상체 레코드의 벡터 표현일 수 있다.
블록(450)에서, 클라우드 서버(135)는 대상체를 나타내는 어레이 표현과 다른 대상체 각각의 어레이 표현 사이의 유사도를 나타내는 유사도 점수를 결정한다. 예를 들어, 유사도 점수는 대상체를 나타내는 어레이 표현과 다른 대상체를 나타내는 어레이 표현 사이의 거리(도메인 공간에서의 거리)의 함수를 사용하여 계산된다. 설명을 위해 그리고 비제한적 예를 들면, 유사도 점수가 "0" 내지 "1"의 범위를 사용하여 계산될 수 있으며, 이때 "0"은 정의된 임계값을 초과하는 거리를 나타내고 "1"은 어레이 표현들 사이에 거리가 없음을 나타낸다. 단지 비제한적 예시로서 예시하기 위해, 유사도 점수는 2개의 어레이 표현(가령, 벡터) 간 유클리드 거리에 기초할 수 있다.
블록(460)에서, 클라우드 서버(135)는 다수의 다른 대상체의 제1 서브세트를 식별한다. 대상체와 연관된 유사도 점수가 지정된 절대적 또는 상대적 범위 내에 있을 때 대상체는 제1 서브세트에 포함될 수 있다. 마찬가지로, 블록(470)에서, 클라우드 서버는 다수의 다른 대상체의 제2 서브세트를 식별한다. 그러나, 이 대상체의 유사도 점수가 또 다른 지정 범위 내에 있는 경우 대상체는 제2 서브세트에 포함될 수 있다.
블록(480)에서, 클라우드 서버(135)는 다수의 다른 대상체의 제1 서브세트 및 제2 서브세트에서 각각의 대상체에 대한 레코드 데이터를 검색한다. 레코드 데이터는 대상체를 특징 짓는 대상체 레코드에 포함된 속성을 포함한다. 예를 들어, 대상체 레코드 데이터는 대상체가 받은 치료제와 치료제에 대한 대상체의 반응을 식별한다. 치료제에 대한 반응은 텍스트(가령, "대상체가 치료제에 긍정적으로 반응함") 또는 대상체가 치료제에 대해 긍정적 또는 부정적으로 반응한 정도를 지시하는 점수(가령, "0" 내지 "1"의 점수이며, 이때 "0"은 부정적인 반응을 지시하고 "1"은 긍정적인 반응을 지시함)로 나타내어질 수 있다. 일부 경우에, 치료 반응성은 대상체에 대해 이전에 수행된 치료에 대해 대상체가 긍정적으로 반응한 정도를 나타낼 수 있다. 예를 들어, 치료 반응성은 숫자 값(가령, "0"에서 "10"까지의 점수) 또는 비숫자 값(가령, "긍정적", "중립적", " 또는 "부정적")일 수 있다. 일부 예에서, 이전에 치료된 대상체에 대한 치료 반응성은 사용자 정의될 수 있다. 다른 예에서, 치료 반응성은 테스트의 결과 또는 사용자로부터 취한 측정치에 기초하여 자동으로 결정될 수 있다. 예를 들어, 대상체에 대해 수행된 혈액 검사에 포함된 값에 기초하여 치료 반응성이 자동으로 결정될 수 있다.
블록(490)에서, 클라우드 서버(135)는 사용자 장치 상의 인터페이스에서 표시되도록 출력을 생성한다. 출력은 예를 들어 대상체에 대한 하나 이상의 치료의 권장사항을 나타낼 수 있다. 하나 이상의 치료의 권장사항은 예를 들어 제1 및 제2 서브세트의 다른 대상체가 받은 치료제, 제1 및 제2 서브세트의 대상체의 치료 반응, 및 제2 서브세트의 대상체의 대상체 속성과 대상체의 대상체 속성 간 차이에 기초하여 결정될 수 있다.
일부 실시예에서, 클라우드 서버(135)는 상기 대상체 및 제1 또는 제2 서브세트로부터의 대상체 중 하나가 동일한 의료 개체에 의해 치료 받고 있거나 치료를 받았었음을 결정한다. 클라우드 서버(135)는 상기 대상체 및 제1 또는 제2 서브세트의 다른 대상체가 상이한 의료 개체에 의해 치료 받고 있거나 치료를 받았었음을 결정한다. 클라우드 서버(135)는 인터페이스를 통해 대상체의 레코드의 상이하게 난독화된 버전을 이용할 수 있다. 클라우드-기반 애플리케이션은 상이한 관할권의 데이터-프라이버시 규칙에 의해 데이터 공유에 부과되는 다양한 제약조건을 기반으로 개체에게 상이하게 난독화된 레코드 버전을 자동으로 제공할 수 있다. 일부 실시예에서, 클라우드 서버(135)는 대상체 레코드의 세트의 변환된 표현에 대해 클러스터링 작업을 수행함으로써 대상체 레코드의 제1 서브세트 및 제2 서브세트를 식별한다.
IV.D. 외부 개체로부터의 쿼리 결과의 자동 난독화
도 5는 데이터-프라이버시 규칙을 준수하기 위해 쿼리 결과를 난독화하기 위한 프로세스(500)를 예시하는 흐름도이다. 프로세스(500)는 외부 개체와의 대상체 레코드의 데이터 공유가 데이터-프라이버시 규칙을 준수함을 보장하는 실행 규칙으로서 클라우드 서버(135)에 의해 수행될 수 있다. 클라우드-기반 애플리케이션에 의해 사용자 디바이스가 데이터 레지스트리(140)에서 쿼리 제약조건을 만족하는 대상체 레코드를 쿼리할 수 있다. 그러나 쿼리 결과는 외부 개체로부터 기원한 데이터 레코드를 포함할 수 있다. 따라서, 프로세스(500)에 의해 클라우드 서버(135)는 데이터-프라이버시 규칙을 준수하면서 외부 개체로부터 치료제에 대한 추가 정보를 사용자 장치에 제공할 수 있다.
블록(510)에서, 클라우드 서버(135)는 제1 개체와 연관된 사용자 장치로부터 쿼리를 수신한다. 예를 들어, 제1 개체는 대상체 레코드의 제1 세트와 연관된 의료 센터이다. 쿼리는 의학적 병태 또는 데이터 레지스트리(140)의 쿼리 검색을 제한하는 임의의 다른 정보와 연관된 증상의 세트를 포함할 수 있다.
블록(520)에서, 클라우드 서버(135)는 사용자 장치로부터 수신된 쿼리를 사용하여 데이터베이스에 쿼리한다. 블록(530)에서, 클라우드 서버(135)는 증상의 세트에 대응하고 의학적 병태와 연관된 쿼리 결과의 데이터 세트를 생성한다. 예를 들어, 사용자 장치는 림프종 진단을 받은 대상체의 대상체 레코드에 대한 쿼리를 전송한다. 쿼리 결과는 (제1 개체로부터 기원하거나 거기서 생성된) 대상체 레코드의 제1 세트로부터의 적어도 하나의 대상체 레코드 및 제2 개체(가령, 제1 개체와 상이한 의료 센터)와 연관된 대상체 레코드의 제2 세트로부터의 적어도 하나의 대상체 레코드를 포함한다. 대상체 레코드의 제1 세트로부터의 대상체 레코드와 대상체 레코드의 제2 세트로부터의 대상체 레코드 각각은 대상체 속성의 세트를 포함할 수 있다. 대상체 속성은 대상체의 임의의 양태를 특징 지을 수 있다.
블록(540)에서, 클라우드 서버(135)는 대상체 레코드의 제1 세트에 포함된 대상체 레코드에 대한 대상체 속성의 세트를 전부 사용자 장치로 제공하는데(가령, 사용자 장치가 이용하게 하거나 그 밖의 다른 방식으로 이용 가능하게 함), 이는 이들 레코드가 제1 개체로부터 기원한 것이기 때문이다. 대상체 레코드를 전부 제공하는 것은 대상체 레코드에 포함된 속성의 세트를 인터페이스를 이용해 평가 또는 상호대화를 위해 사용자 장치에 의해 이용 가능하게 만드는 것을 포함한다. 블록(550)에서, 클라우드 서버(135)는, 추가로 또는 대안으로, 대상체 레코드의 제2 세트에 포함된 각각의 대상체 레코드에 대한 대상체 속성의 세트의 불완전한 서브세트를 사용자 디바이스에 제공한다. 대상체 속성의 세트의 불완전한 서브세트를 제공하는 것은, 대상체 속성의 불완전한 서브세트가 대상체를 고유하게 식별하는 데 사용될 수 없기 때문에 대상체에게 익명성을 제공한다. 예를 들어, 불완전한 서브세트를 제공하는 것은 10개의 대상체 속성과 연관된 대상체를 익명화하기 위해 10개의 대상체 속성 중 4개의 사용 가능한 것을 포함할 수 있다. 일부 실시예에서, 블록(550)에서, 클라우드 서버(135)는 제2 대상체에 포함된 각각의 대상체 레코드에 대한 대상체 속성의 난독화된 세트를 이용한다. 속성의 세트를 난독화하는 것은 제공된 정보의 세분성을 줄이는 것을 포함한다. 예를 들어, 대상체의 주소의 대상체 속성을 사용하는 대신, 난독화된 속성은 대상체가 거주하는 곳의 우편 번호 또는 주일 수 있다. 불완전한 대상체 또는 난독화된 대상체가 이용 가능한지에 무관하게, 클라우드 서브(135)는 대상체 레코드와 연관된 대상체를 익명화한다.
IV.E. 자체-학습 지식 베이스와 챗봇의 통합
도 6은 봇 스크립트, 가령, 챗봇을 이용해 사용자와 통신하기 위한 프로세스(600)를 예시하는 흐름도이다. 프로세스(600)는 새로운 질문에 대한 응답을 제공하기 위해 지식 베이스 내 기존 질문으로 사용자에 의해 제공된 새로운 질문을 자동으로 연결하기 위해 클라우드 서버(135)에 의해 수행될 수 있다. 챗봇은 병태와 연관된 질문에 답을 제공하도록 구성될 수 있다.
블록(605)에서, 클라우드 서버(135)는 답의 세트를 포함하는 지식 베이스를 정의한다. 지식 베이스는 메모리에 저장된 데이터 구조일 수 있다. 데이터 구조는 정의된 질문에 대한 답의 세트를 나타내는 텍스트를 저장한다. 각각의 답은 통신 세션 동안 사용자 장치로부터 수신된 질문에 대한 응답으로 챗봇에 의해 선택될 수 있다. 지식 베이스는 (가령, 데이터 소스에서 텍스트를 검색하고 자연어 처리 기술을 사용하여 텍스트를 구문 분석함으로써) 자동으로 정의되거나 (가령, 연구원 또는 의사에 의해) 사용자 정의될 수 있다.
블록(610)에서, 클라우드 서버(135)는 특정 사용자 장치로부터 통신을 수신한다. 통신은 특정 챗봇과의 통신 세션을 개시하라는 요청에 대응한다. 예를 들어, 의사 또는 대상체는 채팅 세션에서 챗봇과 통신하기 위해 사용자 장치를 작동시킬 수 있다. 클라우드 서버(135)(또는 클라우드 서버(135) 내에 저장된 모듈)는 사용자 장치와 챗봇 간의 통신 세션을 관리하거나 수립할 수 있다. 블록(615)에서, 클라우드 서버(135)는 통신 세션 동안 특정 사용자 장치로부터 특정 질문을 수신한다. 질문은 자연어 처리 기술을 사용하여 처리되는 텍스트 문자열일 수 있다.
블록(620)에서, 클라우드 서버(135)는 특정 질문으로부터 추출된 적어도 일부 단어를 사용하여 지식 베이스에 쿼리한다. 자연어 처리 기술을 사용하여 특정 질문을 나타내는 텍스트 문자열로부터 단어가 추출될 수 있다. 블록(625)에서, 클라우드 서버(135)는 지식 베이스가 특정 질문의 표현을 포함하지 않는다고 결정한다. 이 경우, 수신된 질문이 챗봇에 새롭게 제기될 수 있다. 블록(630)에서, 클라우드 서버(135)는 지식 베이스로부터 또 다른 질문 표현을 식별한다. 클라우드 서버(135)는 사용자 장치로부터 수신된 질문을 지식 베이스에 저장된 다른 질문 표현과 비교함으로써 다른 질문 표현을 식별할 수 있다. 예를 들어, 자연어 처리 기술을 사용한 질문 표현의 분석에 기초하여 유사도가 결정되는 경우, 클라우드 서버(135)는 다른 질문 표현을 식별한다.
블록(635)에서, 클라우드 서버(135)는 지식 베이스에서 다른 질문 표현과 연관된 답 세트 중 한 답을 검색한다. 블록(640)에서, 지식 베이스가 수신된 질문의 표현을 포함하지 않더라도, 블록(635)에서 검색된 답이 수신된 질문에 대한 답으로서 특정 사용자 장치로 전송된다. 블록(645)에서, 클라우드 서버(135)는 특정 사용자 장치로부터 지시자를 수신한다. 예를 들어, 지시자는 챗봇에 의해 제공된 답변이 특정 질문에 대한 응답이었음을 지시하면서 사용자 장치에 대한 응답으로 수신될 수 있다.
블록(650)에서, 클라우드 서버(135)는 특정 질문의 표현 또는 특정 질문의 상이한 표현을 포함하도록 지식 베이스를 업데이트한다. 예를 들어, 질문의 표현을 저장하는 것은 질문에 포함된 키워드를 데이터 구조에 저장하는 것을 포함한다. 클라우드 서버(135)는 또한 특정 질문의 동일하거나 상이한 표현을 특정 사용자 장치에 전송된 더 많은 답과 연관시킬 수 있다.
일부 실시예에서, 클라우드 서버(135)는 특정 사용자 장치와 연관된 대상체 레코드를 액세스한다. 클라우드 서버(135)는 특정 질문에 대한 복수의 답을 결정한다. 그런 다음 클라우드 서버(135)는 답의 세트로부터 하나의 답을 선택한다. 그러나 답의 선택은 특정 사용자 장치와 연관된 대상체 레코드에 포함된 하나 이상의 값에 적어도 부분적으로 기초한다. 예를 들어, 대상체 레코드에 포함된 값은 대상체가 최근에 경험한 증상을 나타낼 수 있다. 챗봇은 대상체가 최근에 경험한 증상에 따라 답변을 선택하도록 구성될 수 있다. 일부 경우에, 클라우드 서버(135)는 답변 세트의 각 답변에 대한 순서를 예측하도록 훈련된 순위 학습(learn-to-rank) 머신 러닝 모델을 액세스할 수 있다. 순위 학습 머신 러닝 모델은 답변의 훈련된 세트를 사용하여 훈련될 수 있다. 답변의 훈련된 세트의 각 답변은 하나 이상의 증상과 해당 증상에 대한 관련성 점수로 라벨링될 수 있다. 관련성 점수는 하나 이상의 증상의 주어진 증상에 대한 연관된 답변의 관련성을 나타낼 수 있다. 관련성 점수는 특정 요인, 가령, 훈련 답변에서 단어(가령, 증상에 대한 단어(들))의 빈도에 기초하여 사용자 정의 또는 자동으로 결정될 수 있다. 답변의 훈련 세트는 챗봇이 생산 환경에서 작동할 때 사용되는 답변의 세트와 상이할 수 있다. 순위 학습 머신 러닝 모델은 순위 학습 모델에 의해 학습된 패턴(가령, 답변의 라벨링된 훈련 세트와 하나 이상의 증상의 각각의 증상에 대한 관련성 점수 간 패턴)에 기초하여 (대상체 프로파일로부터 검출된) 증상에 대한 관련성 측면에서 (생산 환경에서 사용되는) 답변의 세트를 순위화하는 방식을 학습할 수 있다. 챗봇은 답변의 세트의 예상 순서에 기초하여 생산 환경에서 사용되는 답변의 세트에서 답변을 선택할 수 있다. 일부 경우에, 답변의 세트의 각 답변은 답변과 연관된 하나 이상의 증상을 나타내는 태그 또는 코드와 연관될 수 있다. 클라우드 서버(135)는 대상체가 최근에 경험한 증상을 나타내는 값을 각 답변과 연관된 태그 또는 코드와 비교할 수 있다.
V. SMA로 진단된 대상체를 치료하기 위한 지능적 치료 선택을 용이하게 하도록 구성된 네트워크 환경
도 7은 본 개시내용의 일부 양태에 따라, SMA를 앓는 대상체를 치료하기 위한 치료 및 치료 스케줄의 대상체-특이적 식별을 용이하게 하기 위해 훈련된 인공 지능 모델을 배치하기 위한 네트워크 환경의 예를 도시하는 블록도이다. 네트워크 환경(700)은 사용자 장치(110) 및 AI 시스템(702)을 포함할 수 있다. 사용자 장치(110)는 사용자 장치(110)와 AI 시스템(702) 간의 통신 교환을 용이하게 하는 네트워크(736)(예를 들어, 임의의 공개 또는 사설 네트워크)를 사용하여 AI 시스템(702)과 상호 작용할 수 있다. AI 시스템(702)은 도 1과 관련하여 기재된 AI 시스템(145)의 또 다른 구현일 수 있다. 사용자 장치(110)는 사용자, 가령, SMA로 진단된 대상체를 치료하는 의사 또는 다른 의료 전문가에 의해 작동될 수 있다. 사용자 장치(110)는 특정 기능(가령, 클라우드-기반 서비스)을 트리거하기 위해 애플리케이션 프로그래밍 인터페이스(API)(704)를 사용하여 AI 시스템(702)에 요청을 전송할 수 있다. 도 7은 단일 사용자 장치(110)를 도시하지만, 임의의 수의 사용자 장치 또는 그 밖의 다른 컴퓨팅 장치, 가령, 클라우드-기반 서버가 AI 시스템(702)과 상호작용할 수 있음을 알 것이다.
AI 시스템(702)은 특정 예측 기능, 가령, 임상 연구를 위한 적절한 후보 예측, SMA를 앓는 특정 대상체에 대한 질병 진행 예측, 또는 특정 대상체에 특이적인 콘텍스트 치료 스케줄을 예측하는 기능을 수행하도록 구성될 수 있다. AI 시스템(702)은 예를 들어 AI 모델 실행 시스템(710)을 사용하여 예측 기능을 수행할 수 있다. 데이터를 저장하기 위한 다수의 데이터 구조(예를 들어, 데이터베이스)는 AI 시스템(702)이 수행할 수 있는 예측 기능을 촉진시킬 수 있다. 일부 구현예에서, 데이터 구조는 훈련 데이터(716), 검증 데이터(718), 테스트 데이터(720), 데이터 레지스트리(722)로부터의 대상체 레코드, AI 모델(724), 치료(726), 치료 스케줄(728), 임상 연구(730) 및 대상체 그룹 식별자(732)를 저장할 수 있다. AI 시스템(702)의 다양한 구성요소는 통신 네트워크(734)를 사용하여 서로 통신할 수 있다.
AI 모델 훈련 시스템(708)은 훈련 데이터(716)를 사용하여 AI 모델의 훈련을 촉진시킬 수 있다. 예를 들어, AI 모델 훈련 시스템(708)은 훈련 데이터(716)가 학습 알고리즘에 입력되게 하는 (가령, 클라우드-기반 서버의 프로세서, 가령, 물리적 또는 가상 CPU에 의해 실행되는) 코드를 실행할 수 있다. 학습 알고리즘은 훈련 데이터(716)에 포함된 데이터 포인트들 사이의 패턴 또는 상관관계를 검출하기 위해 실행될 수 있다. 검출된 패턴 또는 상관관계는 입력(예를 들어, 새로운, 이전에 보이지 않는 입력 데이터의 입력, 가령, 훈련 데이터(716)에 포함되지 않은 대상체에 대한 대상체 레코드)을 수신하는 것에 응답하여 저장된 패턴 또는 상관관계에 기초하여 결과를 예측하는 출력을 생성하도록 훈련된 AI 모델로서 저장될 수 있다.
일부 구현예에서, 도 8 및 11과 관련하여 더 상세히 기재될 바와 같이, 훈련된 AI 모델의 출력은 SMA로 진단된 특정 대상체에 대한 질병 진행을 예측할 수 있다. 또 다른 구현에서, 도 9 및 12에 대해 더 상세히 설명된 바와 같이, 훈련된 AI 모델의 출력은 새로운 임상 연구 및 새로운 임상 연구에 적합한 후보 대상체를 사용하여 조사하기 위해 새로운 또는 이전에 조사되지 않은 표적을 예측할 수 있다. 또 다른 구현예에서, 도 10 및 13과 관련하여 더 상세히 기재될 바와 같이, 훈련된 AI 모델의 출력은 SMA를 앓는 특정 대상체에 대한 치료 선택을 예측할 수 있다.
AI 시스템(702)에 의해 실행되는 학습 알고리즘은 임의의 지도, 비지도, 반지도, 강화 및/또는 앙상블 학습 알고리즘을 포함할 수 있다. AI 시스템(702)에 의해 실행될 수 있는 학습 알고리즘의 비제한적 예는 아래 표 1에 포함되어 있다. AI 모델을 훈련하기 위해 AI 시스템(702)에 의한 학습 알고리즘의 선택은 예를 들어 훈련 데이터(716)의 적어도 일부분의 유형 및 크기와 AI 시스템(702)이 수행할 수 있는 예측 기능에 대해 의도된 표적 예측 결과에 기초할 수 있다. 표 1에 제공된 학습 알고리즘은 본 명세서에 기재된 임의의 방법에 대해 사용될 수 있다.
표 1
Figure pct00002
또한, 다양한 AI 모델을 훈련하는 프로세스 동안 AI 모델 훈련 시스템(708)은 훈련 데이터(716), 검증 데이터(718) 및 테스트 데이터(720)와 상호 작용할 수 있다. 훈련 데이터(716)는 학습 알고리즘으로 입력되는 데이터 세트이다. 학습 알고리즘은 훈련 데이터(716) 내의 데이터 포인트들 사이의 패턴, 상관관계 또는 관계를 검출한다. 그러나, 학습 알고리즘에 의해 검출된 패턴, 상관관계 또는 관계(가령, 파라미터)는 훈련 데이터(716)에 과적합될 수 있다. 과적합은 학습 알고리즘에 의해 실행된 분석(가령, 패턴, 상관 관계 또는 관계를 생성함)이 훈련 데이터(716)에 정확히 또는 실질적으로 정확히 대응할 때 발생한다. 이 경우 학습 알고리즘에 의해 실행된 분석은 이전에 본 적이 없는 새로운 입력 데이터를 예측하는 것의 기반으로 정확하게 역할 하지 않을 수 있다. 따라서 검증 데이터(718)는 훈련 데이터(716)와 상이한 데이터 세트이며 훈련 데이터(716)의 과적합을 방지하기 위해 패턴, 상관관계 또는 관계를 수정하는 데 사용된다. 다수의 학습 알고리즘이 훈련 데이터(716)에 대해 실행되는 경우, 검증 데이터(718)는 새로운 입력 데이터(예를 들어, 훈련 데이터(716)에 포함되지 않은 입력 데이터)에 대해 가장 높은 성능을 가진 학습 알고리즘을 식별하는 데 사용될 수 있다. 검증 데이터(718)는 새로운 입력 데이터에 대한 각 학습 알고리즘의 성능을 결정하기 위해 평가될 수 있는 오차 함수를 생성하는 데 사용될 수 있다. 예를 들어, 다양한 학습 알고리즘 각각에 의해 훈련 데이터(716) 내에서 검출된 패턴, 상관관계 또는 관계는 다양한 AI 모델에 저장될 수 있다. 새로운 입력 데이터에 대한 각 AI 모델의 오차 함수는 검증 데이터(718)를 사용하여 평가될 수 있다. 오차 함수가 가장 낮은 AI 모델이 선택될 수 있다. 마지막으로, 테스트 데이터(720)는 훈련 데이터(716) 및 검증 데이터(718) 각각과 독립적인 또 다른 데이터 세트이다. 테스트 데이터(720)는 선택된 AI 모델의 전반적인 성능을 테스트하기 위해 선택된 AI 모델에 입력될 수 있다.
일부 구현예에서, 훈련 데이터(716), 검증 데이터(718) 및 테스트 데이터(720)는 단일의 더 큰 데이터 세트에 걸친 세그먼트일 수 있다. 예를 들어, 데이터 세트는 세 개의 데이터 서브세트로 분할될 수 있다. 훈련 데이터(716)는 3개의 데이터 서브세트 중 하나일 수 있고, 검증 데이터(718)는 3개의 데이터 서브세트 중 다른 하나일 수 있으며, 테스트 데이터(720)는 3개의 데이터 서브세트 중 마지막 데이터일 수 있다. 일부 구현예에서 셋 이상의 서브세트로 분할된 데이터 세트는 임의의 데이터 또는 데이터 유형을 포함할 수 있다. 훈련 데이터(716), 검증 데이터(718) 및/또는 테스트 데이터(720)가 생성되는 데이터 세트에 포함될 수 있는 데이터 또는 데이터 유형의 비제한적인 예는 방사선 영상 데이터, MRI 데이터, 게놈 프로파일 데이터, 임상 데이터(가령, 측정치, 치료, 치료 반응, 진단, 중증도, 병력), 대상체-생성 데이터(가령, SMA를 앓는 대상체가 입력한 메모), 의사 또는 의료 전문가가 생성한 데이터(가령, 의사 메모), 환자와 의사 또는 기타 의료 전문가 간의 전화 녹음을 나타내는 오디오 데이터, 관리 데이터, 청구 데이터, 건강 조사(가령, 건강 위험 평가(HRS) 조사), 제3자 또는 공급업체 정보(가령, 네트워크 외부 실험실 결과), 대상체와 관련된 공개 데이터베이스(가령, 대상체의 병태와 관련된 의학 저널), 대상체의 인구 통계, 예방 접종, 방사선 보고서, 병리학 보고서, 활용 정보, 생물학적 샘플을 나타내는 메타데이터, 사회적 데이터(가령, 교육 수준, 고용 상태), 커뮤니티 사양 등을 포함한다. 일부 예에서, 대상체 레코드의 적어도 일부는 초기에 대상에 의해 작동되는 장치로부터의 통신(가령, 의료 제공자 장치 및/또는 원격 서버에서 수신)을 통해 식별될 수 있다. 일부 구현예에서, 대상체 레코드의 적어도 일부 특징은 하나 이상의 사진(예를 들어, 대상체의 장치에서 수집됨)을 포함하거나 이를 기반으로 한다. 일부 경우에는, 대상체-특이적 데이터의 적어도 일부가 초기에 대상체에 대응하는 전자 의료 레코드를 통해 식별 및/또는 수신되었다.
AI 모델 실행 시스템(710)은 프로세서(예를 들어, 클라우드-기반 네트워크, 가령, 클라우드 네트워크(130)의 물리적 또는 가상 CPU)에 의해 실행될 때 특정 훈련된 AI 모델의 인스턴스를 실행하여 출력을 생성하는 실행형 코드를 이용해 구현될 수 있다. 출력은 AI 모델 때문에 SMA와 관련된 특정 결과를 예측할 수 있다.
단지 비제한적 예로서 설명하기 위해, AI 모델 실행 시스템(710)은 쿼리 해결기(706)로부터 요청(사용자, 가령, 의사에 의해 작동되는 사용자 장치(110)로부터 기원함)을 수신한다. 요청은 SMA를 앓는 특정 대상체에 대한 질병 진행을 예측하는 것이다. 요청은 특정 대상체를 특징짓는 대상체 레코드의 적어도 일부(또는 다른 구성요소에 의한 대상체 레코드의 검색을 가능하게 하는 대상체 레코드의 식별자)를 포함한다. AI 모델 실행 시스템(710)은 요청을 평가하고 대상체의 질병 진행의 예측을 생성하도록 구성된 훈련된 단어-벡터 모델(Word-to-Vector model)(AI 모델 데이터 저장소(724)에 저장됨)을 선택한다. AI 모델 실행 시스템(710)은 AI 모델 데이터 저장소(724)로부터 단어-벡터 모델을 불러오거나 액세스한 다음 입력 데이터(가령, 특정 대상체의 현재 상태의 수치 표현)를 불러와진 AI 모델로 전달한다. AI 모델 실행 시스템(710)은 특정 대상체의 질병 진행을 결정하는 데 사용될 수 있는 출력(예를 들어, 어레이에서와 같은 값 또는 값들)을 생성한다. 이 예에서 설명된 예측 기능은 도 8 및 11과 관련하여 더 설명된다.
또 다른 예시로서 그리고 단지 비제한적인 예로서, 사용자 장치(110)는 어떤 대상체 그룹이 새로운 임상 연구에 등록하기에 적절한 후보인지에 대한 예측을 생성하기 위한 요청을 AI 시스템(702)에 전송한다. AI 시스템(702)은 훈련된 특징 선택 모델 및 자동 그룹화 모델을 불러오거나 액세스한다. 그런 다음 AI 시스템(702)은 대상체 레코드의 숫자 표현의 세트를 특징 선택 모델로 입력하고, 그런 다음 자동 그룹화 모델에 입력하여, 새로운 임상 연구(가령, 임상 연구 데이터 저장소(730)에 저장된 새로운 임상 연구)에 대한 적절한 후보자일 대상체의 그룹의 예측을 생성할 수 있다. 새로운 임상 연구에 등록하기에 적절한 후보로 예측되는 대상체 그룹의 식별자는 대상체 그룹 데이터 저장소(732)에 저장될 수 있다. 일부 예에서, AI 시스템(702)은 사용자 장치(110)로부터 요청을 수신할 필요 없이 임상 연구에 적절한 후보가 될 대상체의 그룹을 자동으로 식별할 수 있다. 다른 예에서, AI 시스템(702)은 대상체 레코드의 그룹의 공통 특징에 기초하여 대상체의 그룹을 자동으로 식별할 수 있고, 아직 존재하지 않는 경우 공통 특징과 연관된 새로운 임상 연구를 제안할 수 있다. 이 예에서 기재된 예측 기능은 도 9 및 12와 관련하여 더 기재된다.
또 다른 예시로서 그리고 단지 비제한적인 예로서, 사용자 장치(110)는 특정 대상체에 대한 치료 선택 및 치료 스케줄을 예측하기 위해 AI 시스템(702)에 요청을 전송한다. AI 시스템(702)은 최적 치료 작업흐름, 가령, 다단계 치료 및 다단계 치료 스케줄을 선택하도록 구성된 훈련된 강화 모델을 불러오거나 액세스한다. AI 시스템(702)은 특정 대상체의 특성을 나타내는 벡터를 훈련된 강화 모델에 입력하여 (치료 데이터 저장소(726) 및 치료 스케줄 데이터 저장소(728)에 저장된 복수의 단일 또는 다단계 치료 중에서) 특정 다단계 치료 및 사기 다단계 치료를 수행하기 위한 스케줄을 나타내는 출력을 생성할 수 있다. 이 예에서 설명된 예측 기능은 도 10 및 13와 관련하여 추가로 설명된다.
특정 AI 모델은 훈련 프로세스 동안 훈련 데이터(716)의 일부를 기억하는 기술적 문제를 나타낼 수 있다. 훈련 데이터(716)의 일부를 기억하는 것은 훈련된 AI 모델이 수신된 입력 데이터에 응답하여 훈련 데이터(716)에 포함된 데이터 요소를 그대로 출력할 때 발생할 수 있다. 데이터 누출은 AI 모델이 이전에 보지 못한 새로운 데이터가 입력되는 것에 응답하여 훈련 데이터에서 데이터 요소를 그대로 출력하는 것을 지칭한다. 경우에 따라 AI 모델이 훈련 데이터에 과적합될 때 AI 모델이 훈련 데이터를 기억한다. 과적합된 AI 모델은 훈련 데이터에 포함된 노이즈를 기억한다(가령, 훈련 데이터에서 학습 작업과 관련되지 않은 데이터 요소를 기억한다). 따라서 AI 모델이 데이터 유출을 나타낼 때 AI 모델은 이전에 볼 수 없었던 새로운 입력 데이터에 대한 예측을 일반화하지 않는다.
훈련 데이터가 대상체에 대한 민감하거나 개인적인 데이터를 포함한 경우 데이터 누출은 프라이버시 규정을 위반할 수 있다. 단지 비제한적 예로서 설명하기 위해, 훈련 데이터(716)는 대상체(대상체 레코드로 특징지어짐)가 알츠하이머병의 초기 발병과 관련된 유전자 돌연변이를 가지고 있음을 나타내는 값을 포함하는 대상체 레코드를 포함한다. 알츠하이머병에 대한 유전자 돌연변이의 존재를 나타내는 값은 민감하거나 개인적인 데이터이다. 따라서 다양한 프라이버시 법 및 규정(가령, HIPAA(Health Insurance Portability and Accountability Act))이 대상체의 민감하거나 개인적인 데이터의 무단 공개를 금지한다. 그러나 훈련된 AI 모델이 훈련 데이터(716)에 과적합된 경우, 훈련된 AI 모델이 대상체가 알츠하이머병에 대한 유전자 돌연변이를 가지고 있음을 나타내는 값을 누출(가령, 의도하지 않게 외부에 공개하거나 승인되지 않은 사용자에게 공개)할 수 있다는 점에서 기술적 문제가 발생한다. 일부 시나리오에서는 적대적인 사용자 장치(가령, AI 모델로부터 민감한 정보를 의도적으로 추출하려는 사용자가 작동하는 것)가 훈련된 AI 모델에 입력을 전송하고 상기 AI 모델에 의해 생성된 대응하는 출력을 수신할 수 있는 경우 프라이버시 위반이 발생할 수 있다. 예를 들어 적대적 사용자 장치가 공개 API를 사용하여 훈련된 AI 모델에 액세스하는 경우 적대적 사용자 장치는 훈련된 AI 모델로 입력을 전송하고 훈련된 AI 모델에 의해 생성된 출력을 수신할 수 있다. 그런 다음 적대적인 사용자 장치는 훈련된 AI 모델로부터 수신된 다양한 출력을 평가하여 AI 모델을 훈련하는 데 사용되는 훈련 데이터에 대한 민감하거나 개인적인 데이터를 추론할 수 있다. 추론될 수 있는 민감하거나 개인적인 데이터의 비제한적 예는 특정 대상체에서 특정 유전적 돌연변이의 존재를 나타내는 값, 훈련 데이터 내 대상체 레코드의 존재 또는 부재, 특정 임상 연구에서 특정 대상체의 존재 또는 부재, 특정 대상체에 의해 제시된 표현형과 특정 질병, 가령, SMA을 발생시키는 특정 대상체의 유전적 소인 사이의 상관관계, 특정 대상체의 유전적 프로파일의 특성, 및 그 밖의 다른 민감하거나 개인적인 데이터를 포함한다.
전술한 바와 같은 데이터 누출에 관한 기술적 문제를 해결하기 위해, 본 발명의 특정 양태 및 특징은 AI 모델 실행 시스템(710)이 훈련된 AI 모델 데이터 저장소(724)에 저장된 훈련된 AI 중 임의의 것을 실행할 때 데이터 누출을 검출하고 방지하도록 데이터 누출 검출기(712)를 구성하는 것과 관련된다. 일부 구현예에서, 데이터 누출 검출기(712)는 훈련 데이터(716), 검증 데이터(718), 테스트 데이터(720) 및/또는 AI 모델(724)에 대해 특정 데이터 누출 방지 프로토콜을 수행할 수 있다. 훈련 데이터(716), 검증 데이터(718), 테스트 데이터(720) 및/또는 AI 모델(724)에 대한 데이터 누출 방지 프로토콜을 수행하면 훈련된 AI 모델에 의한 민감한 데이터의 누출이 억제되거나 방지될 수 있다. 데이터에 대해 수행되는 데이터 누출 방지 프로토콜의 비제한적인 예로는 대상체 레코드에 포함된 민감하거나 개인적인 데이터를 암호화하는 것, 데이터 위생처리(data sanitization), 데이터 정규화, 강건한 통계, 적대적 훈련, 차등 프라이버시, 연합 학습, 동형 암호화 및 대상체를 특징 짓는 민감한 데이터의 누출을 금지하거나 방지하기 위한 그 밖의 다른 적합한 기법을 포함한다.
다시 도 7을 참조하면, 대상체 레코드는 다수의 차원(예를 들어, 수백 또는 수천 개의 특징 차원)을 사용하여 대상체 특징을 특징짓는 데이터 요소를 포함할 수 있다. 대상체 레코드의 특정 특징 차원은 목표 작업에 유용할 수 있지만 대상체 레코드 내 다른 특징 차원이 노이즈 데이터(가령, 표적 작업에 유용하지 않는 특징)를 나타낼 수 있다. 대상체 레코드의 고차원성은 AI 시스템(702)과 연관된 다양한 AI 모델에 의해 제공되는 예측 기능의 일부로서 대상체 레코드(또는 그 숫자 표현)를 입력하는 것과 관련하여 기술적 도전을 만든다. 본 개시의 특정 양태 및 특징은 앞서 기재된 기술적 과제들에 대한 솔루션을 제공하는 노이즈 특징 검출기(714)에 관한 것이다. 일부 구현예에서, 노이즈 특징 검출기(714)는 대상체 레코드에 포함된 대상체 특징의 세트의 대상체 특징의 서브세트를 노이즈로 분류함으로써 고차원 대상체 레코드를 차원 감소된 대상체 레코드로 변환하도록 구성될 수 있다. 예를 들어, 노이즈 특징 검출기(714)는 대상체 특징을 목표 작업에 대한 예측 또는 노이즈로 분류하도록 훈련된 2-클래스 분류 모델을 실행할 수 있다. 노이즈 특징 검출기(714)는 또한 대상체 레코드의 대상체 특징을 하나 이상의 다중 클래스(예를 들어, 노이즈 데이터, 대상체 작업에 유용하지만 예측할 수 없는 것, 및 목표 작업에 유용하고 예측할 수 있는 것) 중 하나 이상으로 분류할 수 있는 다중-클래스 분류 모델일 수 있다. 대상체 레코드의 차원 감소는 예측 기능을 제공할 때 AI 모델 실행 시스템(710)이 처리하는 대상체 레코드의 특징 차원의 수를 줄임으로써 AI 시스템(702)의 계산 효율성을 개선한다. 대상체 레코드의 차원을 줄이기 위한 기법의 비제한적 예에는 기준에 기초한 특징 감소, 특징 범주에 기반한 특징 감소, 특징 선택 기법, 훈련된 분류기 모델에 의해 노이즈로 분류된 특징 제거, 및 그 밖의 다른 적절한 기법을 포함한다.
VI. 인공지능 기법을 이용한 SMA를 앓는 대상체에 대한 질병 진행을 예측하도록 구성된 네트워크 환경
도 8은 본 개시내용의 일부 양태에 따라, SMA로 진단된 대상체에 대한 질병 진행을 예측하는 출력을 생성하기 위해 훈련된 인공 지능 모델을 배치하기 위한 네트워크 환경의 예를 예시하는 블록도이다. 네트워크 환경(800)은 사용자 장치(110) 및 AI 시스템(802)을 포함할 수 있다. AI 시스템(802)은 도 7에 도시된 AI 시스템(702)과 유사할 수 있지만, AI 시스템(802)의 구성요소는 AI 시스템(702)의 구성 요소와 상이할 수 있다. 일부 구현예에서, AI 시스템(802)은 API(808), 쿼리 해결기(810), 쿼리 텍스트 문자열(812), 훈련된 단어-벡터 모델(814), 진행 예측 시스템(816) 및 통신 네트워크(818)를 포함할 수 있다. 도 8에 도시된 AI 시스템(802)의 구성요소는 도 7에 도시된 AI 시스템(702)의 임의의 구성요소에 추가되거나, 이를 대신하거나, 그 일부일 수 있다. API(808)는 도 7에 도시된 API(704)와 동일할 수 있고 쿼리 해결기(810)는 도 7에 도시된 쿼리 해결기(706)와 동일할 수 있다.
AI 시스템(802)은 SMA로 진단된 대상체에 대한 질병 진행을 예측하는 출력을 생성하도록 구성될 수 있다. 일부 예에서, AI 시스템(802)은 사용자 장치(110)로부터의 요청에 의해 프롬프트될 필요 없이 자동으로 출력을 생성한다. 또 다른 예에서, AI 시스템(802)은 사용자 장치(110)로부터의 요청의 수신에 응답하여 출력을 생성한다. 예를 들어, 사용자 장치(110)(가령, 의사 또는 그 밖의 다른 의료 전문가에 의해 작동됨)는 AI 시스템(802)에 요청을 전송할 수 있다. 요청은 특정 대상체가 경험할 가능성이 높은 질병 진행의 예측을 생성하도록 구성된 예측 기능을 AI 시스템(802)이 실행하기 위한 요청일 수 있다. 일부 예에서, 요청은 특정 대상체의 특징을 특징짓는 대상체 레코드(804)를 포함한다. 다른 예에서, 요청은 특정 대상체의 특징을 특징짓는 대상체 레코드(804)를 불러오기 위해 나중에 식별자가 사용되도록 특정 대상체의 식별자를 포함한다. 대상체 레코드(804)가 액세스 또는 불러와지는 방식에 무관하게, 대상체 레코드(804)는 특정 대상체의 상태를 나타내는 데이터 요소를 포함할 수 있다. 비제한적 예로서, 특정 대상체의 상태는 텍스트 값, 가령, 대상체의 진단, 진단의 SMA 유형, 의사가 관찰한 표현형, 특정 대상체에 대해 수행된 임의의 단일 단계 치료 , 대상체에 대해 수행된 임의의 다단계 치료, 임의의 종류의 치료들 사이에 경과된 시간, 특정 대상체의 유전자 프로파일, 특정 대상체를 특징짓는 임상 정보, 및 그 밖의 다른 적절한 텍스트 값을 포함할 수 있다. 또한, 특정 대상체의 상태는 특정 대상체의 현재 상태(가령, 요청이 사용자 장치(110)에 의해 전송되는 때 또는 그 즈음의 특정 대상체의 상태)를 나타낼 수 있다.
API(808)는 사용자 장치(110)가 AI 시스템(802)과 상호 작용할 수 있도록 구성될 수 있다. 따라서, 사용자 장치(110)는 API(808)를 사용하여 AI 시스템(802)에 요청(대상체 레코드(804)를 포함)을 전송할 수 있다. 쿼리 해결기(810)는 API(808)로부터 요청을 수신하고, 요청을 해결할 수 있는 훈련된 AI 모델을 식별한 다음 식별된 AI 모델에 대한 쿼리를 구성할 수 있다. 쿼리 해결기(810)는 입력을 단어-벡터 모델(814)로 전송하고 출력을 사용자 장치(110)에 제공함으로써 SMA로 진단된 특정 대상체의 질병 진행을 예측하기 위한 요청이 해결될 수 있음을 식별할 수 있다.
일부 구현예에서, 쿼리 해결기(810)가 사용자 장치(110)로부터 요청을 수신할 때, 요청이 대상체 레코드(804)를 포함하는 경우 쿼리 해결기(810)는 요청으로부터 대상체 레코드(804)를 추출할 수 있다. 요청이 대상체 레코드(804)를 식별하는 고유 식별자를 포함하는 예에서, 쿼리 해결기는 대상체 레코드(804)의 식별자를 추출하고 데이터 소스, 가령, 도 7에 도시된 데이터 레지스트리(722)로부터 대상체 레코드(804)를 불러올 수 있다. 일부 구현예에서, 대상체 레코드(804)는 AI 시스템(802)이 대상체 레코드(804)에 의해 특징지어지는 대상체의 신원을 식별하는 것을 방지하기 위해 익명화될 수 있다. AI 시스템 쿼리 해결기(810)는 불러와진 대상체 레코드(804)를, 대상체 레코드(804)에 포함된 하나 이상의 특징을 사용하여 부분 단어 시퀀스를 생성하도록 구성된 쿼리 텍스트 문자열(812)로 전송할 수 있다.
단지 비제한적인 예로서 설명하기 위해, 대상체 레코드(804)는 적어도 4개의 데이터 요소를 포함한다. 제1 데이터 요소는 SMA에 대한 양성 진단을 나타내는 "SMA 양성"의 제1 텍스트 값을 포함한다. 제2 데이터 요소는 진단된 SMA 유형을 나타내는 "3형"의 제2 텍스트 값을 포함한다. 제3 데이터 요소는 특정 대상체의 관찰 가능한 표현형을 나타내는 "근위 근육 약화"의 제3 텍스트 값을 포함한다. 제4 데이터 요소는 "6개월"의 제4 텍스트 값을 포함하며, 특정 대상체가 경험한 첫 번째 증상 발병과 주어진 시간(가령, 요청 수신 시간, 이번 달 1일) 사이의 시간을 나타낸다. 일부 예에서, 4개의 데이터 요소 각각은 SMA 관련 데이터 요소를 나타내는 태그를 포함하거나 이와 연관될 수 있고, 이들 4개의 데이터 요소에 포함된 4개의 텍스트 값만이 쿼리 텍스트 문자열(812)에 의해 처리될 수 있다. 다른 예에서, 4개의 데이터 요소는 특정 대상체의 건강 상태와 연관될 수 있고, 이들 4개의 데이터 요소는 쿼리 텍스트 문자열(812)에 의해 처리될 수 있다. 쿼리 텍스트 문자열(812)은 4개의 데이터 요소를 "[SMA 양성],[3형],[근위 근육 약화],[6개월]"의 부분 단어 시퀀스로 변환할 수 있다. 부분 단어 시퀀스는 단어-벡터 모델(814)로 전달되도록 쿼리 해결기(810)로 전송될 수 있거나, 단어-벡터 모델(814)로 직접 전송될 수 있다.
단어-벡터 모델(814)은 AI 모델이 단어 시퀀스를 처리할 수 있도록 하기 위해 텍스트 기반 단어 시퀀스를 숫자 표현으로 변환하도록 훈련된 머신 러닝 모델일 수 있다. 단어-벡터 모델은 단어 시퀀스의 각 단어에 대한 숫자 표현을 제공할 수 있다. 단어 시퀀스의 단어의 단어 임베딩은 단어 시퀀스를 숫자로 나타내기 위해 집계될 수 있다. 단어 시퀀스 내 다수의 단어의 숫자 표현들이 비교되어 다수 단어 간의 관계를 결정할 수 있다. 또한, 둘 이상의 단어 시퀀스 중 한 단어 시퀀스 내 단어의 집계된 숫자 표현들이 비교되어 상기 둘 이상의 단어 시퀀스들 간 관계를 결정할 수 있다. 단어-벡터 모델(814)은 신경망을 사용하여 단어 시퀀스 내 단어의 숫자 표현을 학습하도록 훈련될 수 있다. 따라서, 단어-벡터 모델(814)에 "[SMA 양성],[3형],[근위 근육 약화],[6개월]"의 부분 단어 시퀀스가 입력된다. 일부 구현예에서, 단어-벡터 모델(814)은 부분 단어 시퀀스를 숫자 표현(가령, N차원 단어 벡터)으로 변환한다. 부분 단어 시퀀스의 숫자 표현은 부분 단어 시퀀스의 나머지 단어를 예측하도록 훈련된 진행 예측 시스템(816)에 입력될 수 있다. 진행 예측 시스템(816)이 질병 관련 이벤트의 진행의 예측된 시퀀스를 나타내는 출력으로서 생성한 나머지 단어, 가령, 표현형 또는 증상이 특정 대상체가 경험할 것으로 예측된다.
일부 구현예에서, 진행 예측 시스템(816)은 특정 언어 관련 작업, 가령, 언어 모델링 및 예측 문장 완성을 수행하도록 훈련된 생성적 시퀀스 모델일 수 있다. 생성적 시퀀스 모델은 가능한 모든 영어 단어 시퀀스를 사용하여 훈련된 후 자연스러운 영어를 모델링할 수 있다. 생성적 시퀀스 모델은 해당 단어가 나타난 문장을 기반으로 단어에 확률을 할당하도록 훈련될 수 있다. 할당된 확률을 사용하여 생성적 시퀀스 모델은 나머지 단어 또는 부분 단어 시퀀스를 완성하는(가령, 부분 문장을 완성하는) 단어를 예측하도록 구성될 수 있다. 예를 들어, 생성적 시퀀스 모델은, 영어 문법이 부분 단어 시퀀스 뒤에 명사가 올 것을 요구하기 때문에 단어 "hill"이 "Jack and Jill went up the"의 부분 단어 시퀀스를 완성하는 다음 단어가 될 확률이 높고 단어 "there"은 부분 단어 시퀀스를 완성할 다음 단어가 될 낮은 확률을 가짐을 예측하도록 훈련될 수 있다.
SMA로 진단된 특정 대상체의 질병 진행을 예측하는 맥락에서, 진행 예측 시스템(816)은 훈련된 생성적 시퀀스 모델을 실행하여 특정 단어 시퀀스를 완성하기 위한 다음 단어의 예측을 생성할 수 있으며, 여기서 예측된 다음 단어는 특정 대상체의 예측된 질병 진행을 나타낸다. 진행 예측 시스템(816)은 단어 시퀀스의 세트를 포함하는 훈련 데이터 세트를 사용해 훈련될 수 있다. 단어 시퀀스의 세트 내 각 단어 시퀀스는 SMA를 앓는 대상체가 이전에 경험한, 예측된 질병-관련 이벤트, 가령, 표현형 또는 증상을 나타낸다. 아래의 표 2는 단어 시퀀스의 세트의 예시를 제공한다. 표 2의 각 단어 시퀀스는 SMA로 이전에 진단된 대상체의 질병 이벤트의 진행을 나타내는 단일 또는 다수 단어(가령, 단일 단어, 가령, "[척추측만증]") 또는 다수 단어의 그룹, 가령, "[지팡이를 이용해 보행]"의 시퀀스이다.
표 2
Figure pct00003
진행 예측 시스템(816)은 (예를 들어, 표 2에 나타낸 바와 같이) 이전에 SMA로 진단된 대상체의 추적된 질병 진행을 사용하여 대상체의 질병 진행의 종방향 차원을 따라 사건들 간 상관관계를 학습하도록 훈련될 수 있다. 예를 들어, 진행 예측 시스템(816)은 보행 상실을 경험한 대상체는 질병이 호흡기 감염으로 진행될 높은 확률(예를 들어, 역치 확률을 초과하는 확률)을 가지며, 이는 척추를 지지하는 근육의 약화로 촉발될 수 있음을 학습할 수 있다. 따라서, 특정 대상체의 현재 상태가 보행 장애일 때, 진행 예측 시스템(816)은 특정 대상체의 질병 진행이 적어도 "보행 상실"의 부분 단어 시퀀스를 완성하는 단어들을 예측함으로써 호흡기 감염을 포함할 가능성이 높음을 예측할 수 있다. 질병 진행이 단어 시퀀스로 정의될 때 - 단어 시퀀스의 각 단어 또는 단어 그룹은 질병 관련 이벤트의 진행 시퀀스에서 질병 관련 이벤트를 나타냄 - , 특정 대상체의 질병 진행에서의 다음 질병-관련 이벤트가 주어진 부분 단어 시퀀스를 완성하는 다음 단어를 예측함으로써 예측될 수 있다.
대상체 레코드(804)의 4개 데이터 요소의 상기 비제한적인 예를 계속 들면, 진행 예측 시스템(816)은 "[SMA 양성],[3형],[근위 근육 약화],[6개월]" (또는 부분 단어 시퀀스의 숫자 표현)의 입력 부분 단어 시퀀스를 수신한다. 진행 예측 시스템(816)은 입력 부분 단어 시퀀스를 완성할 것으로 예측되는 출력 부분 단어 시퀀스를 생성할 수 있다. 출력 부분 단어 시퀀스는 이전에 SMA로 치료 받은 대상체의 과거의 질병 진행에 기초하여 "[SMA 양성],[3형],[근위 근육 약화],[6개월]"의 입력 부분 단어 시퀀스를 완성하도록 예측된 단어의 시퀀스이다. 이 비제한적인 예에서 출력 부분 단어 시퀀스는 "[대퇴골을 지지하는 근육의 약화],[지팡이를 이용한 보행],[앉은 자세에서 일어나 앉기 어려움],[휠체어 의존]"이다. 즉, 출력 부분 단어 시퀀스는 특정 대상체의 예측된 질병 진행이 다음을 포함한다: (1) 대퇴골을 지지하는 근육의 약화, 그런 다음 (2) 보행에 도움이 되는 지팡이가 필요함, 그런 다음 (3) 보조 없이는 앉기 어려움, 그리고 (4) 남은 생애 동안 이동을 위해 휠체어가 필요함. 쿼리 해결기(810)는 대상체 레코드(804)에 의해 특징지어지는 특정 대상체에 특이적인 예측된 질병 진행(806)을 사용자에 의한 추가 평가를 위해 사용자 장치(110)에 전송할 수 있다.
VII. 인공 지능 기법을 이용한 새로운 임상 연구를 제안하기 위한 대상체 그룹을 자동으로 정의하도록 구성된 네트워크 환경
SMA를 앓는 대상체의 대상체 레코드를 클러스터링하는 것은 공통 대상체 특징을 공유하는 대상체 레코드의 클러스터를 식별하는 것을 포함한다. 대상체 레코드를 클러스터링하는 것은 일부 양태, 특성 또는 특징으로 서로 유사한 대상체의 그룹을 식별할 수도 있다. 그러나 대상체 레코드의 클러스터링은 대상체 레코드의 고차원성을 고려할 때 기술적으로 어렵다. 예를 들어, 대상체 레코드는 수백 개의 개별 대상체 특징(가령, 차원)을 가질 수 있다. 따라서, 고차원 대상체 레코드를 클러스터링하는 것은 특정 클러스터링 기법, 가령, k-평균 클러스터링에서 문제가 된다. 본 개시내용의 특정 양태 및 특징은 예를 들어 신규한 또는 기존 임상 연구에 적합한 후보인 대상체 그룹을 정의하기 위해 SMA를 앓는 대상체를 특징짓는 고차원 대상체 레코드의 클러스터링을 가능하게 하는 기술적 솔루션을 제공한다.
도 9는 본 개시내용의 일부 양태에 따라, 새로운 또는 기존 임상 훈련에 대한 대상체 그룹을 지능적으로 형성하기 위한 네트워크 환경의 예를 예시하는 블록도이다. 네트워크 환경(900)은 AI 시스템(902) 및 대상체를 특징짓는 고차원 대상체 레코드를 저장하기 위한 데이터 저장소(904 내지 908)를 포함할 수 있다. 도 9는 3개의 데이터 저장소(가령, 데이터 저장소(904 내지 908))를 도시하지만, 도 9는 예시적이며, 따라서 임의의 수의 데이터 저장소가 네트워크 환경(900)에 포함될 수 있음을 알 것이다. AI 시스템(902)은 도 7에 도시된 AI 시스템(702)과 유사할 수 있지만, AI 시스템(902)의 구성요소는 AI 시스템(702)의 구성 요소와 상이할 수 있다. 도 9에 도시된 AI 시스템(902)의 구성요소는 도 7에 도시된 AI 시스템(702)의 임의의 구성요소에 추가되거나, 이를 대신하거나, 그 일부일 수 있다. API(910)는 도 7에 도시된 API(704)와 동일할 수 있다. 또한, 특징 선택 모델(912) 및 하위공간 클러스터링 시스템(914)은 AI 모델 데이터 저장소(724)에 저장될 수 있고 도 7에 도시된 AI 모델 실행 시스템(710)에 의해 실행될 수 있다.
일부 구현예에서, AI 시스템(902)은 기존 임상 연구의 후보인 SMA로 진단된 대상체의 그룹을 자동으로 검출하도록 구성될 수 있다. 또 다른 구현예에서, AI 시스템(902)은 이전에 존재하지 않았던 새로운 치료 흔적의 예측을 생성하고 새로운 임상 연구를 위한 표적 후보가 될 대상체를 식별하도록 구성될 수 있다. 예를 들어, 기존 또는 새로운 임상 연구는 새로운 치료 또는 진단 검사의 효과를 결정하기 위해 새로운 치료 또는 진단 검사의 임상 결과를 연구하도록 설계된 임상 시험일 수 있다. 예를 들어, SMA에 대한 기존 임상 연구는 SMA를 앓는 대상체에서 SMN2 발현에 대한 저용량 셀레콕시브의 효과를 연구하는 임상 시험일 수 있다.
고차원 대상체 레코드 데이터 저장소(904-908)는 여러 개체에 걸쳐 대상체 레코드를 저장할 수 있다. 비제한적 예로서, 대상체 레코드 데이터 저장소(904)는 미국의 의료 시설에서 운영하고, 대상체 레코드 데이터 저장소(906)는 이탈리아의 의료 연구 시설에서 운영하며, 대상체 레코드 데이터 저장소(908)는 캐나다의 병원에서 운영한다. 대상체 레코드 데이터 저장소(904)에 저장된 대상체 레코드는 미국의 의료 시설에서 치료받은 대상체의 제1 그룹을 특징으로 한다. 또한, 대상체 레코드 데이터 저장소(906)에 저장된 대상체 레코드는 이탈리아의 의료 연구 시설에서 수행되는 임상 연구에 참여하는 대상체의 제2 그룹을 특징짓는다. 마지막으로, 대상체 레코드 데이터 저장소(908)에 저장된 대상체 레코드는 캐나다의 병원에서 치료를 받은 대상체의 제3 그룹을 특징짓는다. 데이터 저장소(904 내지 908)가 지리적으로 여러 시설에 분산되어 있는지 또는 단일 시설에 같은 위치에 있는지에 상관없이, 여기에 저장된 대상체 레코드는 기존 또는 새로운 임상 연구에 적합한 후보 대상체를 정의하기 위해 AI 기반 특징 선택 기법을 사용하여 그룹화될 수 있다.
특징 선택 모델(912)은 AI 기반 특징 선택 모델, 가령, 희소 로지스틱 회귀, 최소 절대 축소 및 선택 연산자(LASSO), 단변량 임계값(예를 들어, l 0 -놈 최소화, l 1 -놈 최소화), LASSO에 대한 최소 각도 회귀, 좌표 하강법, 근위 기법(proximal technique), 엘라스틱 넷(Elastic Net), 융합 또는 그룹화 LASSO 및 그 밖의 다른 적합한 특징 선택 기법의 인스턴스를 나타내는 실행 코드일 수 있다. 특징 선택 모델(912)은 대상체 레코드의 대상체 특징의 세트의 대상체 특징의 불완전한 서브세트가 표적 작업과 관련이 있는지 식별하도록 훈련될 수 있다. 예를 들어, 표적 작업은 Evrysdi™(리스디플람, F. Hoffman-La Roche AG)과 관련된 임상 연구에 포함할 후보가 될 대상체를 식별하는 것이다. 임상 연구에 대한 적합성의 검출은 특징 선택 모델(912)의 훈련된 특성일 수 있다. 예를 들어, 특징 선택 모델(912)은 각각 임상 연구를 위해 "등록" 또는 "등록하지 않음"의 라벨을 각각 포함하는 대상체 레코드의 훈련 데이터 세트를 사용하여 훈련될 수 있다. 특징 선택 모델(912)의 훈련에 기초하여, 특징 선택 모델(912)은 대상체 특징의 세트의 불완전한 서브세트가 임상 연구와 관련이 있음을 학습할 수 있다. 예를 들어, 특징 선택 모델(912)은 SMA 2형으로 진단되었고 2세에서 25세 사이인 대상체가 훈련 데이터 세트에서 검출된 패턴, 상관관계 및 관계에 기초하여 임상 연구에 적합한 후보임을 학습하도록 훈련될 수 있다. 따라서, 특징 선택 모델(912)은 대상체 특징의 세트의 불완전한 서브세트에 "나이"와 관련된 대상체 특징 및 "SMA 유형"에 관련된 대상체 특징을 포함할 수 있다. 대상체 특징의 불완전한 서브세트는 고차원으로 간주될 수도 있고 그렇지 않을 수도 있다. 관련 특징이 특징 선택 모델(912)을 사용하여 자동으로 추출되면 대상체 특징의 불완전한 서브세트가 하위공간 클러스터링 시스템(914)에 입력될 수 있다.
하위공간 클러스터링 시스템(914)은 하위공간 클러스터링 기법을 실행하여 상이한 하위공간 내의 대상체 레코드의 클러스터(가령, 하나 이상의 차원의 선택)를 식별하도록 구성될 수 있다. 하위공간 클러스터링 기법을 실행하면 대상체 레코드의 클러스터가 형성될 수 있다. 클러스터는 대상체 특징의 서브세트(가령 대상체의 차원적 양태를 나타내는 대상체 특징)에 의해 정의될 수 있다. 단지 비제한적 예로서, 대상체 레코드의 대상체 특징의 불완전한 서브세트는 치료가 대상체에게 수행된 후 SMN2 유전자를 포함하여 75개 유전자의 유전자 발현 수준이 포함된다. 하위공간 클러스터링 시스템(914)은 대상체 특징의 불완전한 서브세트의 75개 유전자에 걸쳐(예를 들어, 75차원에 걸쳐) 대상체를 클러스터링하도록 훈련된다. 75개 유전자에 걸친 대상체 클러스터링의 일부로서, 하위공간 클러스터링 시스템(914)은 SMN2 유전자의 발현과 관련된 대상체의 3개의 클러스터를 형성한다: "임계값을 초과하는 SMN2 발현", "임계값 미만 SMN2 발현" 및 "SMN2 발현 없음". 예를 들어, 하위공간 클러스터링 시스템(914)은 임계값을 초과하는 수준에서 SMN2 유전자의 발현을 경험한 대상체의 클러스터를 식별할 수 있으며, 이로써 잠재적으로 성공적인 치료를 나타낼 수 있다. 그 후 대상체의 식별된 클러스터는 대상체 그룹 식별자 시스템(916)에 저장된 그룹 식별자와 연관될 수 있다. 또한, 대상체의 식별된 클러스터는 SMN2 유전자의 발현이 임계값을 초과하는 수준이기 때문에 추가적인 기존 임상 연구에 적합하다고 결정된다. 다른 예로서, 하위공간 클러스터링 시스템(914)은 "SMN2 발현 없음" 클러스터의 서브클러스터를 식별할 수 있다. 서브클러스터는 치료가 수행된 후 운동 기능의 관찰 가능한 개선이 눈에 띄고 치료 후 SMN2 발현 증가가 감지되지 않은 대상체가 포함된다. 대상체의 이 서브클러스터에 대한 기존 임상 연구가 존재하지 않는 경우, 하위공간 클러스터링 시스템(914)은 치료 후 개선된 운동 기능을 경험하고 치료 후 SMN2 유전자의 발현 증가가 없는 대상체를 연구하도록 생성될 새로운 임상 연구에 대한 제안을 생성할 수 있다.
VIII. 클라우드 기반 애플리케이션이 대상체 레코드의 콘텍스트를 고려하여 SMA를 앓는 대상체에 대한 최적의 치료를 선택할 수 있다
도 10은 본 발명의 일부 양태에 따라 치료를 선택하기 위해 훈련된 강화 학습자를 배치하기 위한 네트워크 환경의 예를 나타내는 블록도이다. 네트워크 환경(1000)은 AI 시스템(1002)을 포함할 수 있다. AI 시스템(1002)은 도 7에 도시된 AI 시스템(702)과 유사할 수 있지만, AI 시스템(1002)의 구성요소는 AI 시스템(702)의 구성 요소와 상이할 수 있다. 도 10에 도시된 AI 시스템(1002)의 구성요소는 도 7에 도시된 AI 시스템(702)의 임의의 구성요소에 추가되거나, 이를 대신하거나, 그 일부일 수 있다. API(1008)는 도 7에 도시된 API(704)와 동일할 수 있고 쿼리 분해기(1010)는 도 7에 도시된 쿼리 분해기(706)와 동일할 수 있다. 치료 선택 시스템(1032)은 AI 모델 데이터 저장소(724)에 저장될 수 있고 도 7에 도시된 AI 모델 실행 시스템(710)에 의해 실행될 수 있다.
일부 구현예에서, AI 시스템(1002)은 치료(1012 내지 1030)의 그룹으로부터 특정 대상체에 대한 최적의 치료를 선택하도록 구성될 수 있다. 치료(1012 내지 1030)는 의사가 특정 대상체를 치료하는 동안 수행할 수 있는 잠재적인 조치를 나타낼 수 있다. 단지 비제한적인 예로서, 치료(1012)는 뉴시너센(SPINRAZA)일 수 있고, 치료(1014)는 지팡이를 제공하는 것일 수 있고, 치료(1016)는 휠체어를 제공하는 것일 수 있으며, 치료(1018)는 턱 근육이 약화된 대상체에게 적절한 식이 계획을 제공하는 것일 수 있고, 치료(1020)는 오나셈노겐 아베파르보벡(Onasemnogene abeparvovec-xioi)(Zolgensma)일 수 있고, 치료(1022)는 약화된 호흡기 근육을 지원하기 위한 특수 마스크 또는 호흡 장치일 수 있으며, 치료(1024)는 급식관일 수 있고, 치료(1026)는 물리 치료일 수 있고, 치료(1028)는 등 브레이스일 수 있고, 치료(1030)는 다리 브레이스일 수 있다. 치료는 여러 단계 또는 단계에 걸쳐 순차적으로 발생할 수 있는 다단계 치료일 수 있다. 도 10은 치료(1012 내지 1030)를 예시하지만, 임의의 수의 치료가 치료하는 의사에 의한 또는 치료하는 의사의 지시에 따라 수행될 수 있음을 이해할 것이다.
치료 관찰(1034)은 각각의 치료(1012 내지 1030)에 대한 반응으로 결과의 이전 치료 대상체에 걸친 이력 관찰을 저장하는 데이터 저장소일 수 있다. 예를 들어, 대상체에게 치료(1012)를 수행하는 치료 관찰은 SMN2 유전자 발현이 증가한 것일 수 있다. 다른 예로서, 치료(1014)를 수행하는 치료 관찰은 환자의 허벅지 근육(예를 들어, 대퇴직근)의 퇴행 진행을 고려할 때 지팡이에 의해 제공되는 지지가 환자의 보행을 보조하기에 불충분하다는 것일 수 있다. 일부 예에서, 각각의 치료(1012 내지 1030)와 연관된 생존 확률은 치료 관찰(1034)에 저장될 수 있다. 각각의 치료(1012 내지 1030)에 대해, 생존 확률은 대상체가 치료를 받은 후 생존할 확률을 나타내는 값(예를 들어, 백분율)일 수 있다. 다른 예에서, 생존 확률은 또한 치료를 받은 후 대상체의 삶의 질을 나타내는 값을 포함할 수 있다. 일부 구현예에서, 새로운 치료 관찰이 치료 관찰 데이터 저장소(1034)에 저장됨에 따라 생존 확률이 자동으로 결정되고 업데이트된다. 예를 들어, 생존 확률은 수술과 같은 치료에서 수술 후 30일 후에 생존하는 대상체의 수이다. 일부 구현에서, 생존 확률은 대상체의 건강 평가 후 의사 또는 대상체에 의해 입력될 수 있다. 다른 예에서, 치료 관찰 데이터 저장소(1034)는 또한 각각의 치료(1012 내지 1030)와 연관된 임의의 부작용을 저장할 수 있다.
치료 선택 시스템(1032)은 각각의 치료(1012 내지 1030)와 데이터 저장소(1034)에 저장된 치료 관찰 사이의 패턴, 상관관계 또는 관계를 학습하도록 훈련될 수 있다. 각각의 치료(1012 내지 1030)와 연관된 치료 관찰은 치료와 연관된 보상 기능을 나타낼 수 있다. 보상 기능은 "보상 값", 가령, "5" 만점에서, 치료가 대상체에게 강한 긍정적 반응을 가지고 있음을 나타내는 "5"의 점수를 생성할 수 있다. "보상 값"은 부정적인 값, 가령, "5" 만점에서, 치료가 대상체에게 강한 부정적인 반응을 나타냄을 나타내는 "-3"일 수 있다. 일부 구현예에서, 보상 값은 유전자 요법을 받는 것에 대한 반응으로 SMN2의 발현 증가일 수 있다. 보상 기능은 단기 치료 관찰과 장기 치료 관찰의 균형을 맞추도록 설계할 수 있다. 단기 치료 관찰 및 장기 치료 관찰은 수치 또는 벡터로 변환될 수 있다(예를 들어, 단어-벡터 모델을 사용함). 단기 및 장기 치료 관찰은 단기 관찰 가능한 결과와 장기 관찰 가능한 결과 사이의 균형을 반영하기 위해 개별적으로 가중치를 부여할 수 있다. 치료 선택 시스템(1032)은 치료가 보상 기능을 최대화하도록 선택되도록 치료(1012 내지 1030) 중에서 치료를 선택하도록 훈련될 수 있다. 치료 선택 시스템(1032)은 임의의 강화 학습 모델, 가령, 무모델 강화 학습, 정책 최적화, 정책 구배, 모델 기반 강화 학습, Q-함수, Q-테이블, 중요도 샘플링, U-곡선, 심층 강화, 반복 신경망을 사용한 지도 강화 학습 및 그 밖의 다른 적절한 강화 학습 기법일 수 있다.
단지 비제한적 예로서 설명하기 위해, 대상체의 상태는 대상체 레코드(1004)에 의해 특징지어질 수 있고, 관찰 가능한 표현형(1006)은 SMA로 진단된 대상체에서 관찰되는 SMA의 표현형일 수 있다. 대상체 레코드(1004) 및 표현형(1006)은 특정 대상체의 현재 건강 상태를 나타낼 수 있다. 대상체 레코드(1004) 및 표현형(1006)은 AI 시스템(1002)에 입력된다. API(1008)는 AI 시스템(1002)과 외부 시스템 사이에서 특정 데이터의 교환을 가능하게 하도록 구성될 수 있다. 쿼리 해결기(1010)는 특정 대상체의 대상체 레코드(1004) 또는 표현형(1006)을 최적의 행동의 선택을 위한 치료 선택 시스템(1032)으로 전송할 수 있다. 치료 선택 시스템(1032)은 보상 기능에 기초하여 치료(1012 내지 1030)로부터 치료를 선택하도록 실행될 수 있다. 치료, 가령, 치료(1018)가 선택되면, AI 시스템(1002)은 추가 평가를 위해 선택된 치료(1018)를 컴퓨팅 장치로 전송할 수 있다.
IX. 클라우드 기반 애플리케이션이 인공 지능 기법을 사용하여 SMA를 앓는 대상체에 대한 질병 진행을 예측할 수 있음
도 11은 본 개시내용의 일부 양태에 따라, SMA로 진단된 대상체의 질병 진행을 예측하기 위한 프로세스의 예를 예시하는 흐름도이다. 프로세스(1100)는 도 1 및 7-10에 예시된 임의의 구성요소에 의해 수행될 수 있다. 예를 들어, 프로세스(1100)는 AI 시스템(802)에 의해 수행될 수 있다. 또한, 프로세스(1100)는 SMA로 진단된 특정 대상체에 대한 표현형, 증상, 또는 그 밖의 다른 질병 관련 이벤트의 진행을 예측하는 출력을 생성하는 AI 모델을 실행하기 위해 수행될 수 있다.
프로세스(1100)는 블록(1105)에서 시작하는데, 여기서 AI 시스템(802)은 예를 들어 특정 대상체(가령, 병원에서 치료 중인 대상체)에 대응하는 대상체 레코드를 액세스하거나 불러온다. 대상체 레코드(가령, 전자 의료 레코드 또는 전자 건강 레코드)는 대상체로부터 또는 대상체를 대신하여 수집된 여러 특징(가령, 값을 포함하는 데이터 요소, 가령, 예방 접종, 투약 이력, 나이, 인구 통계)을 포함할 수 있다. 대상체 레코드는 대상체의 측면을 특징짓는 특징의 세트를 포함할 수 있다. 예를 들어, 대상체 레코드는 다른 많은 특징 중에서 대상체가 SMA 3형으로 진단되었음을 나타내는 특징을 포함할 수 있다.
대상체 레코드에 포함될 수 있는 특징의 비제한적 예는 방사선 영상 데이터, MRI 데이터, 게놈 프로파일 데이터, 임상 데이터(가령, 측정치, 치료, 치료 반응, 진단, 중증도, 병력), 대상체-생성 데이터(가령, SMA를 앓는 대상체가 입력한 메모), 의사 또는 의료 전문가가 생성한 데이터(가령, 의사 메모), 환자와 의사 또는 기타 의료 전문가 간의 전화 녹음을 나타내는 오디오 데이터, 관리 데이터, 청구 데이터, 건강 조사(가령, 건강 위험 평가(HRS) 조사), 제3자 또는 공급업체 정보(가령, 네트워크 외부 실험실 결과), 대상체와 관련된 공개 데이터베이스(가령, 대상체의 병태와 관련된 의학 저널), 대상체의 인구 통계, 예방 접종, 방사선 보고서, 병리학 보고서, 활용 정보, 생물학적 샘플을 나타내는 메타데이터, 사회적 데이터(가령, 교육 수준, 고용 상태), 커뮤니티 사양 등을 포함한다.
블록(1110)에서, AI 시스템(802)은 SMA 또는 대상체의 SMA 진단과 관련된 특징을 추출할 수 있다. 일부 구현예에서, SMA를 앓는 대상체의 진단 또는 치료와 관련된 임의의 특징이 SMA와 관련된 것으로 태깅될 수 있다. 예를 들어, 운동 기능 검사, 가령, 6분 걷기 검사 또는 울프 운동 기능(Wolf Motor Function) 검사의 결과와 관련된 특징이 SMA 진단 또는 치료와 관련된 것으로 태깅될 수 있다. 대상체 레코드의 특징을 태깅하는 것은 데이터 요소 내에 코드(가령, "0000" 또는 "SMA-TAG")를 저장하는 것을 포함할 수 있으며, 이로써 코드는 AI 시스템(802)에 의해 검출 및 판독 가능하다. 코드는 AI 시스템(802)에 의해 SMA 특성과 관련된 특징으로 해석될 수 있다. 사용자(가령, 의사)가 특징을 개별적으로 태깅하거나, 특징에 데이터가 입력되면 특징이 자동으로 태깅될 수 있다.
일부 구현예에서, 특징은 SMA 진단 또는 치료와 관련된 것으로 태깅되지 않을 수 있지만, 대신 AI 시스템(802)은 SMA 진단 또는 치료와 관련된 특징을 자동으로 분류할 수 있다. 예를 들어, AI 시스템(802)은 SMA 진단 또는 치료(또는 SMA에 대한 임의의 다른 관계)와 관련된 특징을 인식하도록 훈련된 분류 모델을 저장할 수 있다. 임의의 분류자 모델, 예를 들어 로지스틱 회귀, 나이브 베이즈(Na
Figure pct00004
ve Bayes), 확률적 경사 하강, K-최근접 이웃, 결정 트리 모델, 랜덤 포레스트 모델, 서포트 벡터 머신(SVM: Support Vector Machine) 및 그 밖의 다른 적절한 모델이 사용될 수 있다.
블록(1115)에서, AI 시스템(802)은 블록(1110)에서 식별된 SMA-관련 특징을 사용하여 부분 단어 시퀀스를 생성할 수 있다. 예를 들어, (블록(1110)에서) SMA에 대응하는 것으로 식별되는 특징은 다음을 포함한다: ["SMA 2형"],["증상 발병 후 4개월"],["2세에 보행 장애"] ,["현재 나이 3"],["똑바로 앉기 곤란"]. AI 시스템(802)은 쿼리 텍스트 문자열(812)을 실행하여 대상체 레코드의 특징을 부분 단어 시퀀스, 가령 [SMA 2형, 증상 발병 후 4개월, 2세에 보행 장애, 현재 3세, 똑바로 앉기 곤란]으로 변환할 수 있다. 부분 단어 시퀀스는 쉼표로 구분된, 블록(1110)에서 식별된 SMA 관련 특징을 포함하는 문장이다.
부분 단어 시퀀스는 대상체의 SMA 진단과 관련하여 대상체의 현재 건강 상태를 나타내기 때문에 부분적이다. 블록(1120)에서, AI 시스템(802)은 부분 단어 시퀀스를 입력으로서 수신하고 부분 단어 시퀀스를 단어-벡터 모델(예를 들어, Word2Vec)을 사용하여 벡터 표현으로 변환한다.
부분 단어 시퀀스가 벡터 표현으로 변환되면, 부분 단어 시퀀스를 사용하여 특정 예측 기능이 수행될 수 있다. 블록(1125)에서, SMA로 진단된 특정 대상체에 대한 질병 진행(예를 들어, SMA 표현형의 진행)을 예측하는 맥락에서, AI 시스템(802)은 부분 단어 시퀀스의 벡터 표현을 훈련된 생성적 시퀀스 모델(예를 들어, 자연어 처리(NLP) 모델)로 입력할 수 있다. 블록(1130)에서, 생성적 시퀀스 모델은 부분 단어 시퀀스를 따르기 위해 (예를 들어, 부분 단어 시퀀스를 완성하기 위해) 예측되는 하나 이상의 다음 단어(예를 들어, 완성 단어 또는 구문)의 예측을 생성할 수 있다. 예측된 다음 단어는 일정 기간 동안 SMA 표현형, 증상, 진단 또는 치료의 대상체의 예측된 질병 진행을 나타낸다. 부분 단어 시퀀스를 완성할 가능성이 높은 다음 단어의 예측은 대상체가 나타낼 것으로 예측되는 다음 SMA 표현형을 나타낸다. 예를 들어, 생성적 시퀀스 모델에 의해 출력되는 각각의 다음 단어는 대상체가 경험하거나 나타낼 것으로 예상되는 예측된 표현형, 증상, 치료 및/또는 질병 관련 이벤트를 나타낸다. 다음 단어의 예측은 이전에 치료받은 SMA를 앓는 대상체의 표현형 또는 증상의 예측된 변화와 같은 질병 관련 이벤트의 진행을 나타내는 단어 시퀀스를 포함하는 훈련 데이터 세트에 기초한다.
블록(1135)에서, 동일하거나 유사한 질병 진행을 경험한 이전에 치료 받은 대상체를 식별하기 위해 예측된 완성된 단어 시퀀스를 기존 질병 진행에 적합화하기 위해 단어 매칭과 같은 매칭 기법이 수행될 수 있다. 또한, 예측된 완성된 단어 시퀀스를 다른 대상체의 기존 질병 진행에 적합화하는 것은 동일하거나 유사한 질병 진행을 보인 다른 대상체를 치료하는 의사를 식별하기 위해 수행될 수도 있다. 블록(1140)에서, 예측된 질병 진행이 조기 치료 조건을 만족하는 경우, 프로세스(1100)는 블록(1145)으로 진행할 수 있다. 그러나 예측된 질병 진행이 조기 치료 조건을 만족하지 않는 경우 프로세스(1100)는 블록(1155)으로 진행한다. 일부 구현예에서, 조기 치료 조건은 SMA 표현형의 예측된 진행이 향후 6개월과 같은 미래 기간에 걸쳐 건강 위험을 나타내는지 여부를 평가하는 데 사용되는 규칙일 수 있다. 예를 들어, SMA로 진단된 대상체에 대한 SMA 표현형의 예측된 진행이 다음 4개월 내의 보행 상실인 경우, AI 시스템(802)은 예측된 진행을 조기 치료 조건을 만족하는 것으로 해석할 수 있다. 이 경우, 블록(1145)에서, AI 시스템(802)은 데이터 레지스트리(722)와 같은 데이터 저장소에, 동일하거나 유사한 질병 진행을 갖는 대상체를 이전에 치료한 의사(가령, 동일한 병원에 고용되었거나 이 목적을 위해 검색 가능하도록 동의한 의사)의 식별자를 쿼리한다.
블록(1150)에서, AI 시스템(802)은 통신(가령, 이메일)을 자동으로 생성하고 식별된 의사와 연관된 사용자 장치로 전송할 수 있다. 통신은 대상체를 치료하는 의사와 유사한 질병 진행을 가진 다른 대상체를 이전에 치료한 의사(블록(1145)에서 식별됨) 사이에서 개시될 통신 세션에 대한 요청일 수 있다. 예를 들어, 통신 세션 중에 의사는 다른 대상체에 대해 수행된 치료 및 임상 결과에 대해 논의할 수 있다. 블록(1145)에서 식별된 의사에 의해 제공된 정보는 SMA 표현형의 예측된 진행에 따라 증상이 발생하기 전에 대상체에 대한 치료 일정으로 치료 의사를 보조할 수 있다. 조기 치료 조건이 만족되지 않을 때(예를 들어, SMA 표현형의 예측된 진행이 약하거나 수년 동안 발생할 것으로 예측되지 않을 때), (블록(1155)에서) AI 시스템(802)은 유사하거나 동일한 예측된 진행을 공유하는 대상체에 대응하는 대상체 레코드를 불러올 수 있고 (블록(1160)에서) 연관된 치료 및 치료 스케줄을 사용자 장치 상에 디스플레이한다.
X. 클라우드 기반 애플리케이션이 인공 지능 기법을 사용하여 새로운 임상 연구를 제안하기 위한 대상체 그룹을 자동으로 정의할 수 있음
도 12는 본 개시내용의 일부 양태에 따라, 새로운 또는 기존 임상 연구에 대한 대상체 그룹을 지능적으로 정의하기 위한 프로세스의 예를 예시하는 흐름도이다. 프로세스(1200)는 도 1 및 7-10에 예시된 임의의 구성요소에 의해 수행될 수 있다. 예를 들어, 프로세스(1200)는 AI 시스템(902)에 의해 수행될 수 있다. 또한, 프로세스(1200)는 감소된-차원 대상체 레코드를 자동으로 생성하고 대상체 레코드에 대한 하위공간 클러스터링을 수행하여 새로운 또는 기존 임상 연구를 위한 후보 대상체를 식별하는 AI 모델을 실행하도록 수행될 수 있다.
프로세스(1200)는 AI 시스템(902)이 데이터 레지스트리, 예를 들어 데이터 레지스트리(722)에 저장된 대상체 레코드를 액세스 블록(1210)에서 시작한다. 대상체 레코드는 규칙적이거나 불규칙한 시간 간격으로 또는 도 12와 관련하여 더 자세히 설명된 예측 기능을 트리거하는 사용자 입력에 응답하여 자동으로 액세스될 수 있다. 블록(1220)에서, 데이터 레지스트리에 저장된 일부(예를 들어, 전부는 아님) 또는 모든 대상체 레코드는 본 명세서에 설명된(예를 들어, 도 1-6과 관련하여 설명된) 다양한 구현예를 사용하여 숫자 표현(예를 들어, 벡터 표현)으로 변환될 수 있다. 대상체 레코드는 사전에 또는 실시간으로 또는 블록(1210)의 수행에 앞서, 또는 실시간으로 또는 실질적으로 실시간으로 숫자 표현으로 변환 또는 벡터화될 수 있다.
블록(1230)에서, AI 시스템(902)은 대상체 레코드의 숫자 표현으로부터 두드러진 특징(salient feature)의 서브세트를 선택하기 위해 대상체 레코드에 대해 AI 기반 특징 선택을 수행할 수 있다. 예를 들어, 대상체 레코드의 고차원성(가령, 잠재적으로 수백 개의 특징 포함)이 주어지면, 특징 선택 모델이 훈련되어 목표 작업, 가령, 새로운 또는 기존 임상 연구에 대한 후보 대상체 식별을 수행하는 데 중요한 대상체 레코드 내 특징을 검출 및 선택할 수 있다. 블록(1240)에서, 블록(1210)에서 액세스된 각각의 대상체 레코드에 대해, AI 시스템(902)은 대상체 레코드의 자동으로 선택된 두드러진 특징의 감소된-차원 숫자 표현을 생성할 수 있다.
블록(1230)에서 수행되는 특징 선택은 임의의 AI 기반 특징 선택 모델, 가령, 희소 로지스틱 회귀, 최소 절대 축소 및 선택 연산자(LASSO), 단변량 임계값(예를 들어, l 0 -놈 최소화, l 1 -놈 최소화), LASSO에 대한 최소 각도 회귀, 좌표 하강법, 근위 기법(proximal technique), 엘라스틱 넷(Elastic Net), 융합 또는 그룹화 LASSO 및 그 밖의 다른 적절한 특징 선택 기법을 사용해 수행될 수 있다. AI 기반 특징 선택 모델은 대상체 레코드의 대상체 특징의 세트의 대상체 특징의 불완전한 서브세트가 표적 작업과 관련이 있는지 식별하도록 훈련될 수 있다.
단지 비제한적 예로서, 목표 작업은 Evrysdi™ (리스디플람, F. Hoffman-La Roche AG)와 관련된 임상 연구에 포함시키기에 적합한 후보가 될 대상체를 식별하는 것이다. 대상체가 임상 연구에 적합한 후보인지 여부를 검출하는 것은 특징 선택 모델의 훈련된 기능일 수 있다. 특징 선택 모델은 각각 기존 임상 연구에 "적합" 또는 "부적합" 레이블을 포함하는 대상체 레코드의 훈련 데이터 세트를 사용하여 훈련될 수 있다. 훈련 프로세스 중 패턴, 상관관계 및 관계 학습에 기초하여 특징 선택 모델은 대상체 특징의 세트의 불완전한 서브세트가 임상 연구와 관련이 있는지 학습할 수 있다. 예를 들어, 상기 특징 선택 모델은 SMA 2형으로 진단되었고 2세에서 25세 사이인 대상체가 훈련 데이터 세트에서 검출된 패턴, 상관관계 및 관계에 기초하여 임상 연구에 적합한 후보임을 학습하도록 훈련될 수 있다. 따라서, 상기 특징 선택 모델은 대상체 특징의 세트의 불완전한 서브세트에 "나이"와 관련된 대상체 특징 및 "SMA 유형"에 관련된 대상체 특징을 포함할 수 있다.
블록(1250)에서, AI 시스템(902)은 새로운 또는 기존 임상 연구를 위한 대상체 그룹을 자동으로 정의하기 위한 프로토콜을 실행할 수 있다. 일부 구현예에서, 대상체 그룹은 감소된-차원의 대상체 레코드(또는 이의 숫자 표현)의 클러스터링에 기초하여 정의될 수 있다. 감소된-차원의 대상체 레코드는 기법, 가령, k-평균 클러스터링을 이용해 처리하기에 여전히 어려울 수 있다. 따라서, 예를 들어, 감소된-차원의 대상체 레코드는 특징의 다양한 나머지 차원에 따라 하위공간에 클러스터링될 수 있다. 하위공간 클러스터링은 다른 하위공간(가령, 하나 이상의 차원의 선택) 내에서 대상체 레코드의 클러스터를 식별하기 위해 실행된다. 하위공간 클러스터링 기법을 실행함으로써 대상체 레코드의 클러스터가 형성될 수 있다. 클러스터는 대상체 특징의 서브세트(가령, 대상체의 차원적 양태를 나타내는 대상체 특징)에 의해 정의될 수 있다.
블록(1260)에서, AI 시스템(902)은 자동으로 정의된 대상체 그룹에 대한 새로운 또는 기존 임상 연구의 유효성을 나타내는 임상 연구 유효성 파라미터를 생성할 수 있다. 일부 구현예에서, 임상 연구 유효성 파라미터는 대상체 그룹의 특징(블록(1250)에서 정의됨)이 특정한 기존 임상 연구의 특징과 관련되는 정도를 나타내는 숫자 값일 수 있다. 훈련된 분류 모델이 임상 연구에 포함된 임상 결과에 따라 대상체와 연관된 특징을 "효과적" 또는 "효과적이지 않음"으로 분류하는 데 사용될 수 있다. 출력된 분류는 또한 분류 모델에 의해 출력되는 신뢰도 또는 관련성 파라미터와 연관될 수 있다. 대상체 그룹에 대한 기존 임상 연구가 존재하지 않는 경우 그리고 대상체 그룹이 임상 연구에 대해 "효과적"일 가능성이 높은 특징을 갖는 것으로 분류되는 경우, AI 시스템(902)은 대상체 그룹의 대상체를 연구하기 위해 생성될 새로운 임상 연구에 대한 제안을 생성할 수 있다. 블록(1270)에서, 대상체 그룹은 블록(1260)에서 생성된 임상 연구 유효성 파라미터에 기초하여 새로운 또는 기존 치료 파일에 대해 선택된다.
XI. 클라우드 기반 애플리케이션이 대상체 레코드의 콘텍스트를 고려하여 SMA를 앓는 대상체에 대한 최적의 치료를 선택할 수 있음
도 13은 본 개시내용의 일부 양태에 따라, SMA로 진단된 대상체에 수행될 치료의 선택을 촉진시키기 위해 인공 지능 모델을 배치하기 위한 프로세스의 예를 예시하는 흐름도이다. 프로세스(1300)는 도 1 및 7-10에 예시된 임의의 구성요소에 의해 수행될 수 있다. 예를 들어, 프로세스(1300)는 AI 시스템(1002)에 의해 수행될 수 있다. 또한, 프로세스(1300)는 SMN2 표현의 개선량 같은 보상 기능을 최대화하기 위해 치료를 자동으로 선택하도록 훈련된 강화 학습 모델을 실행하도록 수행될 수 있다.
프로세스(1300)는 블록(1310)에서 시작하며 여기서 AI 시스템(1002)은 데이터 레지스트리, 예를 들어 데이터 레지스트리(722)에 저장된 대상체 레코드를 액세스하거나 불러온다. 대상체 레코드는 SMA로 진단된 특정 대상체를 특징지을 수 있다. 블록(1220)에서, 블록(1210)에서 액세스되거나 불러와진 대상체 레코드는 본 명세서에 설명된(예를 들어, 도 1-6과 관련하여 설명됨) 다양한 구현을 사용하여 숫자 표현(예를 들어, 벡터 표현)으로 변환될 수 있다. 대상체 레코드는 사전에 또는 실시간으로 또는 블록(1210)의 수행에 앞서, 또는 실시간으로 또는 실질적으로 실시간으로 숫자 표현으로 변환 또는 벡터화될 수 있다.
블록(1330)에서, AI 시스템(1002)은 특정 대상체의 건강 상태의 콘텍스트를 나타내는 콘텍스트 벡터를 생성할 수 있다. 예를 들어, 콘텍스트 벡터는 특정 대상체의 대상체 레코드의 상태를 숫자 형태로 컨텍스트화할 수 있는 고정 길이 벡터이다. 블록(1340)에서, 특정 대상체를 나타내는 콘텍스트 벡터는 선택된 행동을 수행하는 것에 응답하여 보상이 수신될 때 선택된 행동(예를 들어, 치료)을 강화하는 것을 학습하는 강화 학습기를 포함하는 치료 선택 시스템에 입력될 수 있다. 치료 선택 시스템은 임의의 강화 학습 모델, 가령, 무모델 강화 학습, 정책 최적화, 정책 구배, 모델 기반 강화 학습, Q-함수, Q-테이블, 중요도 샘플링, U-곡선, 심층 강화, 반복 신경망을 사용한 지도 강화 학습 및 그 밖의 다른 적절한 강화 학습 기법일 수 있다.
블록(1350)에서, 치료 선택 시스템은 SMN 단백질의 발현을 증가시키기 위한 유전자 치료를 수행하는 것과 같은 조치를 선택할 수 있다. 치료 선택 시스템은 받을 보상의 예측에 기초하여 치료 그룹 중에서 지능적으로 치료를 선택할 수 있다. 예를 들어, 훈련 프로세스 중에 치료 선택 시스템은 치료 관찰 내에서 10세 내지 20세이며 제1 치료(가령, 리스디플람)로 치료 받은 대상체가 SMN 단백질의 발현의 15%-20% 증가를 경험할 가능성이 높고, 2세 내지 10세이며 제2 치료(가령, 뉴시너센)로 치료 받은 대상체가 SMN 단백질의 발현의 3% 증가를 경험할 가능성이 높으며, 5세 내지 12세이며 약한 물리 치료의 제3 치료로 치료 받은 대상체가 6분 걷기 검사 점수의 23% 증가(운동 기능의 유의미한 증가를 나타냄)를 경험할 가능성이 높은 패턴을 검출한다. 대상체가 7세인 때, 치료 선택 시스템은 예측된 보상에 기초하여 제1 치료, 제2 치료, 제3 치료 중 지능적으로 치료를 선택한다. 치료 선택 시스템은 조치에서 잠재적인 보상을 최대화하는 치료를 선택한다. 보상 기능이 SMN 단백질의 발현 증가 퍼센티지를 최대화하도록 구성되는 경우, 이 치료가 SMN 단백질 발현의 증가에 대해 최상의 보상을 제안하기 때문에 치료 선택 시스템은 7세 대상체를 위한 제2 치료를 선택한다. 그러나 보상 기능이 운동 기능 점수, 가령, 6분 걷기 검사 점수의 증가를 최대화하도록 구성된 경우, 치료 선택은 보상을 최대화하기 위해 7세 대상체에 대한 제3 치료를 선택할 수 있다.
블록(1360)에서 어떤 치료가 선택되든지, 치료 선택 시스템은 선택된 치료가 수행된 후 응답 신호를 수신한다. 예를 들어, 선택된 치료가 누시너센의 투여인 경우, 반응 신호(치료 후 이용가능할 때마다)는 대상체에서 검출된 SMN 단백질 발현 증가를 포함할 것이다. 또 다른 예로서, 선택된 치료가 주간 물리 치료인 경우, 반응 신호(치료 후 이용 가능할 때마다)는 대상체의 6분 걷기 검사 점수의 개선 백분율을 포함할 것이다. 블록(1370)에서, 치료 선택 시스템의 치료 관찰이 반응 신호로 업데이트된다.
XII. 추가 고려사항
본 개시내용의 일부 실시예는 하나 이상의 데이터 프로세서를 포함하는 시스템을 포함한다. 일부 실시예에서, 시스템은 하나 이상의 데이터 프로세서 상에서 실행될 때 하나 이상의 데이터 프로세서로 하여금 여기서 개시된 하나 이상의 방법 중 일부 또는 전부 및/또는 하나 이상의 프로세스 중 일부 또는 전부를 수행하게 하는 명령을 포함하는 비일시적 컴퓨터 판독형 저장 매체를 포함한다. 본 개시내용의 일부 실시예는 하나 이상의 데이터 프로세서 상에서 실행될 때 하나 이상의 데이터 프로세서로 하여금 여기서 개시된 하나 이상의 방법 중 일부 또는 전부 및/또는 여기서 개시된 하나 이상의 프로세스의 일부 또는 전부를 수행하게 하는 명령을 포함하는 비일시적 기계 판독형 저장 매체 내에 유형적으로 구현되는 컴퓨터-프로그램 프로덕트를 포함한다.
채용된 용어 및 표현은 한정이 아닌 설명 측면에서 사용되며, 이러한 용어 및 표현의 사용에 도시되고 기재된 특징부 또는 이의 일부분의 임의의 균등물을 배제하는 어떠한 의도도 없고, 청구된 발명의 범위 내에서 다양한 수정이 가능함이 자명하다. 따라서, 본 발명이 실시예 및 선택적 특징으로 특정하게 개시되었지만 본 명세서에 개시된 개념의 수정, 및 변형이 해당 분야의 통상의 기술자에 의해 이용될 수 있고, 이러한 수정 및 변형이 첨부된 청구항에 의해 정의된 본 발명의 범위 내에 있는 것으로 간주됨이 이해될 것이다.
뒤 이은 설명은 단지 바람직한 예시적인 실시 형태를 제공하며, 본 개시내용의 범위, 적용 가능성 또는 구성을 제한하도록 의도되지 않는다. 오히려, 바람직한 예시적인 실시예의 뒤 이은 설명은 다양한 실시예를 구현하기 위한 가능한 설명을 통상의 기술자에게 제공할 것이다. 첨부된 특허청구범위에 기재된 정신 및 범위를 벗어나지 않고 요소의 기능 및 배열에 다양한 변경이 이루어질 수 있음을 이해해야 한다.
실시예의 완전한 이해를 제공하기 위해 다음 설명에서 특정 세부사항이 제공된다. 그러나, 이러한 특정 세부사항 없이 실시예가 실시될 수 있음이 이해될 것이다. 예를 들어, 회로, 시스템, 네트워크, 프로세스 및 그 밖의 다른 구성요소는 실시예를 불필요한 세부 사항으로 모호하게 하지 않기 위해 블록도 형태의 구성요소로 표시될 수 있다. 또 다른 예에서, 잘 알려진 회로, 프로세스, 알고리즘, 구조 및 기술은 실시예를 모호하게 하는 것을 피하기 위해 불필요한 세부 사항 없이 표시될 수 있다.
XIII. 추가 예시
이하에서 사용될 때, 일련의 예시에 대한 임의의 참조는 각각의 예에 대한 참조로 개별적으로 이해되어야 한다(가령 "예 1-4"는 "예 1, 2, 3 또는 4"로 이해되어야 함).
예 1은 컴퓨터로 구현되는 방법으로서, 대상체와 연관된 대상체 레코드를 불러오는 단계 - 상기 대상체 레코드는 상기 대상체를 특징 짓는 특징의 세트를 포함하며, 상기 대상체는 척수근 위축증(SMA: spinal muscular atrophy)으로 진단 받았음 - , 상기 대상체 레코드에 포함된 상기 특징의 세트의 서브세트를 추출하는 단계 - 상기 특징의 세트의 서브세트의 각각의 특징은 SMA 특성과 연관됨 - , 상기 특징의 세트의 상기 서브세트를 하나 이상의 단어의 시퀀스로 조합함으로써 부분 단어 시퀀스를 생성하는 단계 - 상기 하나 이상의 단어의 각각의 단어는 상기 특징의 서브세트의 하나씩의 특징을 나타냄 - , 훈련된 단어-벡터 모델(word-to-vector model)을 이용해 상기 부분 단어 시퀀스를 숫자 표현으로 변환하는 단계, 부분 단어 시퀀스의 숫자 표현을 상기 부분 단어 시퀀스를 완성하기 위한 완성 단어 또는 구를 예측하도록 훈련된 자연어 처리(NLP: natural language processing) 모델로 입력하는 단계, NLP 모델에 의해 출력된 완성 단어 또는 구에 기초하여, 미래 타임라인 동안(가령, 다음 해 동안, 다음 5년 동안, 다음 10년 동안) 대상체에 대한 예측된 표현형 또는 증상을 나타내는 질병 진행을 생성하는 단계, 및 상기 대상체가 상기 질병 진행에 포함된 하나 이상의 SMA 표현형을 보인다고 예측된다는 지시자를 출력하는 단계를 포함한다.
예 2는 예 1의 컴퓨터로 구현되는 방법으로서, 상기 대상체에 특이적인 하나 이상의 SMA 표현형의 예측된 진행이 조기 치료 조건을 만족함을 결정하는 단계 - 조기 치료 조건을 만족하는 것은 상기 대상체가 상기 하나 이상의 SMA 표현형 중 하나의 SMA 표현형을 보이기 전에 치료를 수행하라는 권고를 나타냄 - 를 더 포함한다.
예 3은 예 1-2의 컴퓨터로 구현되는 방법으로서, 상기 하나 이상의 SMA 표현형의 예측된 진행이 조기 치료 조건을 만족할 때, 익명의 대상체와 연관된 기존 질병 진행을 식별하고 - 상기 기존 질병 진행은 상기 대상체에 특이적인 상기 하나 이상의 SMA 표현형의 예측된 진행과 매칭되고, 상기 익명의 대상체는 SMA로 진단되었음 - , 기존 질병 진행과 연관된 상기 익명의 대상체를 훈련한 사용자를 식별하며, 상기 사용자와 연관된 사용자 장치로 통신을 전송하며, 상기 통신은 상기 대상체에 대한 치료 권고를 요청한다.
예 4는 예 1-3의 컴퓨터로 구현되는 방법으로서, 하나 이상의 SMA 표현형의 예측된 진행이 조기 치료 조건을 만족하지 않을 때, 익명의 대상체와 연관된 기존 질병 진행을 식별하고 - 상기 기존 질병 진행은 상기 대상체에 특이적인 하나 이상의 SMA 표현형의 예측된 진행과 매칭되며, 상기 익명의 대상체는 SMA로 진단되었음 - , 상기 익명의 대상체를 특징 짓는 익명의 대상체 레코드를 불러오며, 상기 익명의 대상체 레코드로부터 치료 스케줄을 추출하고, 상기 치료 스케줄을 사용자 장치로 전송한다.
예 5는 예 1-4의 컴퓨터로 구현되는 방법으로서, 상기 대상체와 연관된 완성 단어 또는 구를 이전에 SMA에 대해 치료 받은 적이 있는 또 다른 대상체와 연관된 또 다른 하나 이상의 SMA 표현형에 매칭시키는 단계, 상기 또 다른 대상체를 특징 짓는 익명의 대상체 레코드를 불러오는 단계, 상기 익명의 대상체 레코드로부터 치료 스케줄을 추출하는 단계, 및 상기 치료 스케줄을 사용자 장치로 전송하는 단계를 더 포함한다.
예 6은 예 1-5의 컴퓨터로 구현되는 방법으로서, 상기 완성 단어 또는 구가 상기 부분 단어 시퀀스를 포함하는 완성 단어 시퀀스 내 다음 단어로서 예측되고, 상기 완성 단어 또는 구는 SMA 표현형을 나타낸다.
예 7은 예 1-6의 컴퓨터로 구현되는 방법으로서, 상기 질병 진행은 챗봇을 이용해 상기 대상체의 컴퓨팅 장치에서 출력된다.
예 8은 예 1-7의 컴퓨터로 구현되는 방법으로서, 상기 대상체 레코드는 상기 대상체에 대응하는 전자 의료 레코드에서 식별된 데이터를 포함한다.
예 9는 예 1-8의 컴퓨터로 구현되는 방법으로서, 상기 대상체에 대응하는 대상체 레코드는 SMA 1형, SMA 2형, SMA 3형, 또는 SMA 4형의 진단을 포함한다.
예 10은 예 1-9의 컴퓨터로 구현되는 방법으로서, NLP 모델을 훈련하는 것은 대상체 레코드의 세트를 포함하는 훈련 데이터 세트를 수집하는 것 - 상기 대상체 레코드의 세트의 각각의 대상체 레코드는 SMA로 진단된 또 다른 대상체에 대응하고, 상기 대상체 레코드의 세트의 각각의 대상체 레코드는 일정 기간 동안 SMA 표현형의 진행을 나타내는 하나 이상의 특징을 포함함 - , 상기 훈련 데이터 세트를 이용해 생성적 시퀀스 모델과 연관된 학습 알고리즘을 실행하는 것 - 상기 학습 알고리즘은 상기 대상체 레코드의 세트에 대응하는 대상체의 세트가 보이는 SMA 표현형의 진행과 연관된 패턴을 검출함 - , 및 상기 훈련 데이터 세트를 이용해 상기 생성적 시퀀스 모델과 연관된 상기 학습 알고리즘을 실행하는 것에 응답하여 상기 NLP 모델을 생성하는 것을 더 포함한다.
예 11은 예 1-10의 컴퓨터로 구현되는 방법으로서, 상기 NLP 모델과 연관된 데이터 누출을 검출하는 단계 - 상기 데이터 누출은 대상체 레코드에 포함된 특징의 세트 중 상기 대상체를 특징 짓는 특징을 노출시킴 - , 및 상기 NLP 모델과 연관된 데이터 누출을 검출하는 것에 응답하여, 상기 대상체 레코드에 포함된 특징의 세트 중 상기 특징의 노출을 방지 또는 차단하는 데이터 누출 방지 프로토콜을 실행하는 단계를 더 포함한다.
예 12는 예 1-11의 컴퓨터로 구현되는 방법으로서, 상기 데이터 누출 방지 프로토콜을 실행하는 단계는 상이한 프라이버시 모델에 따라 상기 NLP 모델을 재훈련하는 단계를 포함한다.
예 13은 예 1-12의 컴퓨터로 구현되는 방법으로서, 특징 선택 모델을 이용해, 상기 대상체를 특징 짓는 감소된-차원 대상체 레코드를 생성하는 단계 - 상기 감소된-차원 대상체 레코드는 상기 대상체 레코드에 포함된 특징의 세트로부터 하나 이상의 특징을 제거하며, 상기 하나 이상의 특징은 노이즈로서 특징지어짐 - 를 더 포함한다.
예 14는 시스템으로서, 하나 이상의 프로세서, 및 상기 하나 이상의 프로세서 상에서 실행될 때, 상기 하나 이상의 프로세서로 하여금 상기에서 개시된 예 1-13 중 하나 이상의 부분 또는 전부를 수행하게 하는 명령을 포함하는 비일시적 컴퓨터 판독형 저장 매체를 포함한다.
예 15는 비일시적 기계 판독형 저장 매체에 유형적으로 구현된 컴퓨터-프로그램 프로덕트로서, 하나 이상의 데이터 프로세서로 하여금 앞서 개시된 예 1-13 중 하나 이상의 부분 또는 전부를 수행하게 하도록 구성된 명령을 포함한다.

Claims (15)

  1. 컴퓨터로 구현되는 방법으로서,
    대상체와 연관된 대상체 레코드를 불러오는 단계 ― 상기 대상체 레코드는 상기 대상체를 특징 짓는 특징의 세트를 포함하며, 상기 대상체는 척수근위축증(SMA: spinal muscular atrophy)으로 진단 받았음 ― ,
    상기 대상체 레코드에 포함된 상기 특징의 세트의 서브세트를 추출하는 단계 ― 상기 특징의 세트의 서브세트의 각각의 특징은 SMA 특성과 연관됨 ― ,
    상기 특징의 세트의 상기 서브세트를 하나 이상의 단어의 시퀀스로 조합함으로써 부분 단어 시퀀스를 생성하는 단계 ― 상기 하나 이상의 단어의 각각의 단어는 상기 특징의 서브세트의 하나씩의 특징을 나타냄 ― ,
    훈련된 단어-벡터 모델(word-to-vector model)을 이용해 상기 부분 단어 시퀀스를 숫자 표현으로 변환하는 단계,
    부분 단어 시퀀스의 숫자 표현을 상기 부분 단어 시퀀스를 완성하기 위한 완성 단어 또는 구를 예측하도록 훈련된 자연어 처리(NLP: natural language processing) 모델로 입력하는 단계,
    NLP 모델에 의해 출력된 완성 단어 또는 구에 기초하여, 일정 기간 동안 상기 대상체에 특이적인 하나 이상의 SMA 표현형의 예측된 진행을 나타내는 질병 진행을 생성하는 단계, 및
    상기 대상체가 상기 질병 진행에 포함된 하나 이상의 SMA 표현형을 보인다고 예측된다는 지시자를 출력하는 단계를 포함하는, 컴퓨터로 구현되는 방법.
  2. 제1항에 있어서,
    상기 대상체에 특이적인 하나 이상의 SMA 표현형의 예측된 진행이 조기 치료 조건을 만족함을 결정하는 단계 ― 조기 치료 조건을 만족하는 것은 상기 대상체가 상기 하나 이상의 SMA 표현형 중 하나의 SMA 표현형을 보이기 전에 치료를 수행하라는 권고를 나타냄 ― 를 더 포함하는, 컴퓨터로 구현되는 방법.
  3. 제1항 내지 제2항에 있어서, 상기 하나 이상의 SMA 표현형의 예측된 진행이 조기 치료 조건을 만족할 때,
    익명의 대상체와 연관된 기존 질병 진행을 식별하고 ― 상기 기존 질병 진행은 상기 대상체에 특이적인 상기 하나 이상의 SMA 표현형의 예측된 진행과 매칭되고, 상기 익명의 대상체는 SMA로 진단되었음 ― ,
    기존 질병 진행과 연관된 상기 익명의 대상체를 훈련한 사용자를 식별하며,
    상기 사용자와 연관된 사용자 장치로 통신을 전송하는 ― 상기 통신은 상기 대상체에 대한 치료 권고를 요청함 ― , 컴퓨터로 구현되는 방법.
  4. 제1항 내지 제3항에 있어서, 하나 이상의 SMA 표현형의 예측된 진행이 조기 치료 조건을 만족하지 않을 때,
    익명의 대상체와 연관된 기존 질병 진행을 식별하고 ― 상기 기존 질병 진행은 상기 대상체에 특이적인 하나 이상의 SMA 표현형의 예측된 진행과 매칭되며, 상기 익명의 대상체는 SMA로 진단되었음 ― ,
    상기 익명의 대상체를 특징 짓는 익명의 대상체 레코드를 불러오며,
    상기 익명의 대상체 레코드로부터 치료 스케줄을 추출하고,
    상기 치료 스케줄을 사용자 장치로 전송하는, 컴퓨터로 구현되는 방법.
  5. 제1항 내지 제4항에 있어서,
    상기 대상체와 연관된 완성 단어 또는 구를 이전에 SMA에 대해 치료 받은 적이 있는 또 다른 대상체와 연관된 또 다른 하나 이상의 SMA 표현형에 매칭시키는 단계,
    상기 또 다른 대상체를 특징 짓는 익명의 대상체 레코드를 불러오는 단계,
    상기 익명의 대상체 레코드로부터 치료 스케줄을 추출하는 단계, 및
    상기 치료 스케줄을 사용자 장치로 전송하는 단계를 더 포함하는, 컴퓨터로 구현되는 방법.
  6. 제1항 내지 제5항에 있어서, 상기 완성 단어 또는 구가 상기 부분 단어 시퀀스를 포함하는 완성 단어 시퀀스 내 다음 단어로서 예측되고, 상기 완성 단어 또는 구는 SMA 표현형을 나타내는, 컴퓨터로 구현되는 방법.
  7. 제1항 내지 제6항에 있어서, 상기 질병 진행은 챗봇을 이용해 상기 대상체의 컴퓨팅 장치에서 출력되는, 컴퓨터로 구현되는 방법.
  8. 제1항 내지 제7항에 있어서, 상기 대상체 레코드는 상기 대상체에 대응하는 전자 의료 레코드에서 식별된 데이터를 포함하는, 컴퓨터로 구현되는 방법.
  9. 제1항 내지 제8항에 있어서, 상기 대상체에 대응하는 대상체 레코드는 SMA 1형, SMA 2형, SMA 3형, 또는 SMA 4형의 진단을 포함하는, 컴퓨터로 구현되는 방법.
  10. 제1항 내지 제9항에 있어서, NLP 모델을 훈련하는 것은
    대상체 레코드의 세트를 포함하는 훈련 데이터 세트를 수집하는 것 ― 상기 대상체 레코드의 세트의 각각의 대상체 레코드는 SMA로 진단된 또 다른 대상체에 대응하고, 상기 대상체 레코드의 세트의 각각의 대상체 레코드는 일정 기간 동안 SMA 표현형의 진행을 나타내는 하나 이상의 특징을 포함함 ― ,
    상기 훈련 데이터 세트를 이용해 생성적 시퀀스 모델과 연관된 학습 알고리즘을 실행하는 것 ― 상기 학습 알고리즘은 상기 대상체 레코드의 세트에 대응하는 대상체의 세트가 보이는 SMA 표현형의 진행과 연관된 패턴을 검출함 ― , 및
    상기 훈련 데이터 세트를 이용해 상기 생성적 시퀀스 모델과 연관된 상기 학습 알고리즘을 실행하는 것에 응답하여 상기 NLP 모델을 생성하는 것을 더 포함하는, 컴퓨터로 구현되는 방법.
  11. 제1항 내지 제10항에 있어서,
    상기 NLP 모델과 연관된 데이터 누출을 검출하는 단계 ― 상기 데이터 누출은 대상체 레코드에 포함된 특징의 세트 중 상기 대상체를 특징 짓는 특징을 노출시킴 ― , 및
    상기 NLP 모델과 연관된 데이터 누출을 검출하는 것에 응답하여, 상기 대상체 레코드에 포함된 특징의 세트 중 상기 특징의 노출을 방지 또는 차단하는 데이터 누출 방지 프로토콜을 실행하는 단계를 더 포함하는, 컴퓨터로 구현되는 방법.
  12. 제1항 내지 제11항에 있어서, 상기 데이터 누출 방지 프로토콜을 실행하는 단계는 상이한 프라이버시 모델에 따라 상기 NLP 모델을 재훈련하는 단계를 포함하는, 컴퓨터로 구현되는 방법.
  13. 제1항 내지 제12항에 있어서,
    특징 선택 모델을 이용해, 상기 대상체를 특징 짓는 감소된-차원 대상체 레코드를 생성하는 단계 ― 상기 감소된-차원 대상체 레코드는 상기 대상체 레코드에 포함된 특징의 세트로부터 하나 이상의 특징을 제거하며, 상기 하나 이상의 특징은 노이즈로서 특징지어짐 ― 를 더 포함하는, 컴퓨터로 구현되는 방법.
  14. 시스템으로서,
    하나 이상의 프로세서, 및
    상기 하나 이상의 프로세서 상에서 실행될 때, 상기 하나 이상의 프로세서로 하여금 여기서 개시되는 하나 이상의 컴퓨터로 구현되는 방법 중 일부 또는 전부를 수행하게 하는 명령을 포함하는 비일시적 컴퓨터 판독형 저장 매체를 포함하는, 시스템.
  15. 하나 이상의 데이터 프로세서로 하여금 여기서 개시되는 하나 이상의 컴퓨터로 구현되는 방법 중 일부 또는 전부를 수행하게 하도록 구성된 명령을 포함하는, 비일시적 기계 판독형 저장 매체 내에 유형적으로 구현되는 컴퓨터 프로그램 프로덕트.
KR1020237016972A 2020-11-26 2021-11-22 인공 지능을 이용해 척수근위축증과 관련된 예측 결과를 생성하기 위한 기법 KR20230088912A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20211555 2020-11-26
EP20211555.6 2020-11-26
PCT/US2021/060281 WO2022115356A1 (en) 2020-11-26 2021-11-22 Techniques for generating predictive outcomes relating to spinal muscular atrophy using artificial intelligence

Publications (1)

Publication Number Publication Date
KR20230088912A true KR20230088912A (ko) 2023-06-20

Family

ID=73698645

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237016972A KR20230088912A (ko) 2020-11-26 2021-11-22 인공 지능을 이용해 척수근위축증과 관련된 예측 결과를 생성하기 위한 기법

Country Status (7)

Country Link
US (1) US20230402180A1 (ko)
EP (1) EP4252253A1 (ko)
JP (1) JP2023550794A (ko)
KR (1) KR20230088912A (ko)
CN (1) CN116472591A (ko)
IL (1) IL303099A (ko)
WO (1) WO2022115356A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024073826A1 (pt) * 2022-10-06 2024-04-11 Sociedade Beneficente Israelita Brasileira Hospital Albert Einstein Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial
CN118016242B (zh) * 2024-04-09 2024-06-07 南京康尼机电股份有限公司 一种人体运动功能纠正训练方案的生成方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11011257B2 (en) * 2018-11-21 2021-05-18 Enlitic, Inc. Multi-label heat map display system

Also Published As

Publication number Publication date
JP2023550794A (ja) 2023-12-05
CN116472591A (zh) 2023-07-21
WO2022115356A1 (en) 2022-06-02
IL303099A (en) 2023-07-01
US20230402180A1 (en) 2023-12-14
EP4252253A1 (en) 2023-10-04

Similar Documents

Publication Publication Date Title
Zhang et al. Data-driven identification of post-acute SARS-CoV-2 infection subphenotypes
Jayaraman et al. Healthcare 4.0: A review of frontiers in digital health
JP6915282B2 (ja) オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
JP6780520B2 (ja) オープンデータ及び臨床医の入力を用いて患者のリスクを評価するシステム及び方法
Kendler Twin studies of psychiatric illness: current status and future directions
Hoffmann et al. Evidence of reproductive stoppage in families with autism spectrum disorder: a large, population-based cohort study
Kendler et al. A population-based twin study of lifetime major depression in men and women
Wakefield et al. Extending the bereavement exclusion for major depression to other losses: evidence from the National Comorbidity Survey
Lonsdale et al. Machine learning and artificial intelligence in pediatric research: current state, future prospects, and examples in perioperative and critical care
US20230402180A1 (en) Techniques for generating predictive outcomes relating to spinal muscular atrophy using artificial intelligence
Shusharina et al. Modern methods of diagnostics and treatment of neurodegenerative diseases and depression
Ginoux et al. Being active during the lockdown: The recovery potential of physical activity for well-being
Farzaneh et al. Collaborative strategies for deploying artificial intelligence to complement physician diagnoses of acute respiratory distress syndrome
Maldonado et al. Deep learning meets biomedical ontologies: knowledge embeddings for epilepsy
Lewis‐Smith et al. Computational analysis of neurodevelopmental phenotypes: Harmonization empowers clinical discovery
Zafari et al. Diagnosing post-traumatic stress disorder using electronic medical record data
Joudar et al. Artificial intelligence-based approaches for improving the diagnosis, triage, and prioritization of autism spectrum disorder: a systematic review of current trends and open issues
Kashyap et al. A deep learning method to detect opioid prescription and opioid use disorder from electronic health records
WO2023217737A1 (en) Health data enrichment for improved medical diagnostics
Fouladvand et al. Mild Cognitive Impairment: Data-Driven Prediction, Risk Factors, and Workup
US20230197271A1 (en) Intelligent workflow analysis for treatments using exposable cloud-based registries
US20220028511A1 (en) Systems and methods for initiating an updated user ameliorative plan
Le Goallec et al. Predicting arterial age using carotid ultrasound images, pulse wave analysis records, cardiovascular biomarkers and deep learning
Zhang et al. Machine Learning for Identifying Data-Driven Subphenotypes of Incident Post-Acute SARS-CoV-2 Infection Conditions with Large Scale Electronic Health Records: Findings from the RECOVER Initiative
Archana et al. Prediction of autism spectrum disorder from high-dimensional data using machine learning techniques