KR20240043724A - 생물학적 장애의 동적 면역조직화학 프로파일링을 위한 시스템 및 방법 - Google Patents

생물학적 장애의 동적 면역조직화학 프로파일링을 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20240043724A
KR20240043724A KR1020237022350A KR20237022350A KR20240043724A KR 20240043724 A KR20240043724 A KR 20240043724A KR 1020237022350 A KR1020237022350 A KR 1020237022350A KR 20237022350 A KR20237022350 A KR 20237022350A KR 20240043724 A KR20240043724 A KR 20240043724A
Authority
KR
South Korea
Prior art keywords
subject
disorder
disease
recurrence
trained model
Prior art date
Application number
KR1020237022350A
Other languages
English (en)
Inventor
마니쉬 아로라
폴 커틴
크리스틴 오스틴
Original Assignee
이칸 스쿨 오브 메디슨 엣 마운트 시나이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이칸 스쿨 오브 메디슨 엣 마운트 시나이 filed Critical 이칸 스쿨 오브 메디슨 엣 마운트 시나이
Publication of KR20240043724A publication Critical patent/KR20240043724A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/645Specially adapted constructive features of fluorimeters
    • G01N21/6456Spatial resolved fluorescence measurements; Imaging
    • G01N21/6458Fluorescence microscopy
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4737C-reactive protein
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/30Psychoses; Psychiatry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/38Pediatrics

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Theoretical Computer Science (AREA)
  • Neurosurgery (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Neurology (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Optics & Photonics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

본 개시내용은 질병 또는 장애에 대한 대상체의 진단 상태를 예측하기 위한 방법 및 시스템을 제공한다. 상기 방법은 염색된 치아 샘플을 생성하기 위하여 대상체의 치아, 모발 또는 손발톱 샘플을 염색하는 단계, 염색된 치아, 모발, 또는 손발톱 샘플 전반에 걸쳐 공간적으로 형광 강도를 분석하는 단계, 및 형광 강도의 분석에 적어도 부분적으로 기초하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 포함할 수 있다.

Description

생물학적 장애의 동적 면역조직화학 프로파일링을 위한 시스템 및 방법
상호 참조
본 출원은 2020년 12월 4일자로 출원된 미국 가출원 제63/121,792호의 이익을 주장하며, 이는 그 전체가 본원에 참조로 포함된다.
동적 생물학적 반응은 인간에 대해 구조적 및 기능적 중요성을 갖는 근본적인 생물학적 프로세스를 나타낼 수 있다. 예를 들어, 일탈적인 또는 비정상적인 동적 생물학적 반응은 질병 및 장애와 같은 많은 생물학적 병태와 연관될 수 있다. 이러한 생물학적 병태의 예는 신경학적 병태(예를 들어, 자폐 스펙트럼 장애, 조현병 또는 주의력-결핍/과잉행동 장애(ADHD)), 신경퇴행성 병태(예를 들어, 근위축성 측삭 경화증(ALS), 알츠하이머병, 파킨슨병 및 헌팅턴병) 및 암(예를 들어, 소아암)을 포함할 수 있다.
요약
상기 배경을 고려해 볼 때, 생물학적 병태의 진단을 위한, 그리고 특히 비-침습적 진단을 위한 정확한 방법 및 시스템이 필요하다. 이러한 진단은 생물학적 병태의 진단을 위한 비-침습적 방법으로 검출 가능한 바이오마커의 정확한 프로파일링에 기초할 수 있다. 본 개시내용은 대상체로부터 비-침습적으로 획득된 생물학적 샘플로부터의 동적 생물학적 반응 데이터의 분석에 기초하여 생물학적 병태의 정확한 진단을 위한 개선된 시스템 및 방법을 제공한다. 생물학적 병태의 정확한 진단을 위한 이러한 개선된 시스템 및 방법은 생물학적 샘플의 동적 면역조직화학 프로파일링과 질병 상태의 평가에 대한 이러한 동적 프로파일의 인공 지능 데이터 분석의 조합에 기초할 수 있다. 본 개시내용은 예를 들어, 생물학적 병태의 진단을 위한 생물학적 샘플 바이오마커를 제공함으로써 이러한 요구를 해결한다. 상기 생물학적 샘플은 점진적 성장과 연관된 인간 생물학적 표본을 포함한다. 이러한 생물학적 샘플은 모간(hair shaft), 치아 및 손발톱이 될 수 있다. 본 개시내용의 비-침습적 바이오마커는 어린 소아, 심지어 1세 미만의 유아의 진단에 사용될 수 있다.
일 측면에서, 본 개시내용은 (a) 대상체의 치아 샘플을 염색하여 염색된 치아 샘플을 생성하는 단계; (b) 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하는 단계; 및 (c) 형광 강도의 분석에 적어도 부분적으로 기초하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계:를 포함하는 질병 또는 장애에 대한 대상체의 진단 상태를 예측하기 위한 방법을 제공한다.
일부 구현예에서, 상기 분석하는 단계는 근본적인 생물학적 프로세스의 시간적 역학을 결정한다. 일부 구현예에서, 분석하는 단계는 염색된 치아 샘플의 형광 이미지를 획득하는 단계 및 상기 형광 이미지의 형광 강도를 분석하는 단계를 포함한다. 일부 구현예에서, 상기 형광 강도는 공간적으로 다양하다. 일부 구현예에서, 상기 염색된 치아 샘플의 형광 이미지를 획득하는 단계는 도립 또는 비-도립 공초점 현미경을 사용하는 것을 포함한다. 일부 구현예에서, 상기 치아 샘플을 염색하는 단계는 C-반응성 단백질 면역조직화학 염색을 사용하는 것을 포함한다. 일부 구현예에서, 상기 방법은 치아 샘플을 절편화하는 단계를 추가로 포함한다. 일부 구현예에서, 치아 샘플을 염색하는 단계는 (1) 치아 샘플을 절단하는 단계, (2) 치아 샘플을 탈석회화하는 단계, (3) 상기 탈석회화된 샘플을 절편화하는 단계, (4) 탈석회화된 치아 절편을 1차 및 2차 항체로 염색하는 단계, (5) 공초점 현미경으로 공간적 항체 형광을 측정하는 단계, 및/또는 (6) 형광 강도의 시간적 프로파일을 추출하는 단계를 포함한다.
일부 구현예에서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 질병 또는 장애는 ASD를 포함한다. 일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 대상체는 성인이다. 일부 구현예에서, 대상체는 약 12세 내지 약 5세 연령 사이이다. 일부 구현예에서, 대상체는 약 12세, 11세, 10세, 9세, 8세, 7세, 5세, 4세, 3세, 2세, 또는 1세 미만이다. 일부 구현예에서, 대상체는 적어도 약 1세, 2세, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 11세, 또는 12세이다.
일부 구현예에서, 상기 분석하는 단계는 형광 강도에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계, 및 염증의 시간적 프로파일을 분석하는 단계를 포함한다. 일부 구현예에서, 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응한다.
일부 구현예에서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 형광 강도를 처리하는 단계를 포함한다. 일부 구현예에서, 상기 처리하는 단계는 (예를 들어, 재발 정량화 분석에 의해) 형광 강도로부터 특징을 추출하는 단계, 및 훈련된 모델을 사용하여 특징을 분석하는 단계를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도(unsupervised) 클러스터링 알고리즘, 지도(supervised) 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅(gradient-boosting) 알고리즘 (예를 들어, 그래디언트-부스팅된 결정 트리와 같은 머신 러닝 알고리즘의 그래디언트-부스팅 구현) 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 훈련된 모델은 그래디언트-부스팅된 앙상블 모델을 포함한다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산(divergence), 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성(laminarity), 포획 시간(trapping time), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성된다. 일부 구현예에서, 상기 하나 이상의 특징은 샘플의 분석으로부터 도출된 형광 강도 트레이스(trace)에 재발 정량화 분석(RQA)을 적용하여 추출된다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성된다.
일부 구현예에서, 상기 방법은 (예를 들어, 하기 실시예 섹션에서 제공되는 것과 같은) 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 적어도 약 70%, 75%, 80%, 85% 또는 90%의 민감도를 갖는 모델을 사용하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 최대 약 70%, 75%, 80%, 85% 또는 90%의 민감도를 갖는 모델을 사용하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 적어도 약 70%, 75%, 80%, 85% 또는 90%의 특이도를 갖는 모델을 사용하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 최대 약 70%, 75%, 80%, 85% 또는 90%의 특이도를 갖는 모델을 사용하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 적어도 약 70%, 75%, 80%, 85% 또는 90%의 양성 예측 값을 갖는 모델로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 최대 약 70%, 75%, 80%, 85% 또는 90%의 양성 예측 값을 갖는 모델로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 적어도 약 70%, 75%, 80%, 85% 또는 90%의 음성 예측 값을 갖는 모델로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단 전반에 걸쳐 질병 또는 장애에 대한 진단 상태를 예측할 시 최대 약 70%, 75%, 80%, 85% 또는 90%의 음성 예측 값을 갖는 모델로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
일부 구현예에서, 상기 방법은 적합한 코호트 모집단에 대해 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.82, 적어도 약 0.84, 적어도 약 0.86, 적어도 약 0.88, 또는 적어도 약 0.90의 수신자 작동 특성 아래 면적(Area Under the Receiver Operating Characteristic, AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는 모델로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
다른 측면에서, 본 개시내용은 하나 이상의 프로세서, 및 상기 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 포함하는 장치를 제공하며, 상기 하나 이상의 프로그램은 하기에 대한 명령을 포함한다: (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; (c) c-반응성 단백질 형광 강도의 변화에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (d) 훈련된 모델을 사용하여 특징을 처리하여 대상체가 c-반응성 단백질과 연관된 질병 또는 장애를 갖는 가능성을 결정하는 단계. 일부 구현예에서, 상기 개별적인 제2 데이터세트는 재발 정량화 분석 또는 관련 방법을 상응하는 복수의 형광 강도 측정치에 적용함으로써 도출된다.
일부 구현예에서, 상기 복수의 형광 강도 측정치는 도립 또는 비-도립 공초점 현미경으로 측정된다. 일부 구현예에서, 상기 생물학적 샘플은 치아 샘플을 포함한다. 일부 구현예에서, 상기 치아 샘플은 C-반응성 단백질 면역조직화학 염색을 사용하여 염색된다. 일부 구현예에서, 상기 명령은 치아 샘플을 절편화하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 명령은 치아 샘플을 탈석회화하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 상기 질병 또는 장애는 ASD를 포함한다. 일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 인간은 약 12세 내지 약 5세 연령 사이이다. 일부 구현예에서, 대상체는 약 12세, 11세, 10세, 9세, 8세, 7세, 5세, 4세, 3세, 2세, 또는 1세 미만이다. 일부 구현예에서, 대상체는 적어도 약 1세, 2세, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 11세, 또는 12세이다. 일부 구현예에서, 분석하는 단계는 복수의 형광 강도 측정치에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계, 및 염증의 시간적 프로파일을 분석하는 단계를 포함한다. 일부 구현예에서, 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응한다. 일부 구현예에서, 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 복수의 형광 강도 측정치를 처리하는 단계를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성된다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간(TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성된다.
다른 측면에서, 본 개시내용은 비-일시적 컴퓨터 판독가능 저장 매체 및 내부에 삽입된 하나 이상의 컴퓨터 프로그램을 제공하며, 상기 하나 이상의 컴퓨터 프로그램은 컴퓨터 시스템에 의해 실행될 때 컴퓨터 시스템으로 인해 하기를 포함하는 방법을 수행하도록 하는 명령을 포함한다: (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; (c) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (d) 훈련된 모델을 사용하여 특징을 처리하여 대상체가 c-반응성 단백질과 연관된 질병 또는 장애를 갖는 가능성을 결정하는 단계. 일부 구현예에서, 상기 개별적인 제2 데이터세트는 재발 정량화 분석 또는 관련 방법을 상응하는 복수의 형광 강도 측정치에 적용함으로써 도출된다.
일부 구현예에서, 상기 복수의 형광 강도 측정치는 도립 또는 비-도립 공초점 현미경으로 측정된다. 일부 구현예에서, 상기 생물학적 샘플은 치아 샘플을 포함한다. 일부 구현예에서, 상기 치아 샘플은 C-반응성 단백질 면역조직화학 염색을 사용하여 염색된다. 일부 구현예에서, 상기 방법은 치아 샘플을 절편화하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 치아 샘플을 탈석회화하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 상기 질병 또는 장애는 ASD를 포함한다. 일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 대상체는 5세 미만이다. 일부 구현예에서, 대상체는 1세 미만이다. 일부 구현예에서, 분석하는 단계는 복수의 형광 강도 측정치에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계, 및 염증의 시간적 프로파일을 분석하는 단계를 포함한다. 일부 구현예에서, 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응한다. 일부 구현예에서, 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 복수의 형광 강도 측정치를 처리하는 단계를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성된다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간(TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성된다.
다른 측면에서, 본 개시내용은 하나 이상의 프로세서, 및 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 갖는 컴퓨터 시스템에서, 하기를 포함하는 모델을 훈련하기 위한 방법을 제공한다: (a) 복수의 훈련 대상체 중 훈련 대상체의 제1 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는 것에 상응하는 제1 진단 상태를 가지며, 복수의 훈련 대상체 중 훈련 대상체의 제2 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖지 않는 것에 상응하는 제2 진단 상태를 갖는, 복수의 훈련 대상체에서 각각의 개별적인 훈련 대상체에 대해,
(i) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (ii) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; 및 (iii) c-반응성 단백질 형광 강도의 변화에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (b) (i) 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 각각의 개별적인 제2 데이터세트의 상응하는 일련의 특징 및 (ii) 제1 진단 상태 및 제2 진단 상태 중에서 선택되는, 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 상응하는 진단 상태로 훈련되지 않은 또는 부분적으로 훈련되지 않은 모델을 훈련시키고, 이에 따라 시험 대상체의 c-반응성 단백질과 연관된 생물학적 샘플로부터 획득된 일련의 특징에서 특징에 대한 값에 기초하여 시험 대상체가 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는지의 여부에 관한 지표를 제공하는 훈련된 모델을 획득하는 단계. 일부 구현예에서, 상기 개별적인 제2 데이터세트는 재발 정량화 분석 또는 관련 방법을 상응하는 복수의 형광 강도 측정치에 적용함으로써 도출된다.
일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 모델 알고리즘, 지도 클러스터링 모델 알고리즘, 회귀 모델, 그래디언트-부스팅 알고리즘 (예를 들어, 그래디언트-부스팅된 결정 트리와 같은 머신 러닝 알고리즘의 그래디언트-부스팅 구현) 또는 이들의 임의의 조합이다. 일부 구현예에서, 상기 훈련된 모델은 그래디언트-부스팅된 앙상블 모델을 포함한다. 일부 구현예에서, 상기 훈련된 모델은 다항 분포에 대한 결과를 예측한다. 일부 구현예에서, 상기 훈련된 모델은 이항 분포에 대한 결과를 예측한다. 일부 구현예에서, c-반응성 단백질과 연관된 제1 생물학적 병태는 자폐 스펙트럼 장애(ASD), 주의력-결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부 및 소아암으로 이루어진 군으로부터 선택된다.
일부 구현예에서, c-반응성 단백질과 연관된 제1 생물학적 병태에 대해 시험 대상체를 평가하는 단계는 c-반응성 단백질과 연관된 제1 생물학적 병태의 존재와 c-반응성 단백질과 연관된 제1 생물학적 병태의 부재 간에 식별하는 단계를 추가로 포함한다. 일부 구현예에서, c-반응성 단백질과 연관된 제1 생물학적 병태에 대해 시험 대상체를 평가하는 단계는 c-반응성 단백질과 연관된 제1 생물학적 병태와 c-반응성 단백질과 연관된 제1 생물학적 병태와 구별되는 c-반응성 단백질과 연관된 제2 생물학적 병태 간에 식별하는 단계를 추가로 포함한다. 일부 구현예에서, 제1 생물학적 병태는 자폐 스펙트럼 장애이고, 제2 생물학적 병태는 신경전형적 발달이며; 즉, 신경발달 장애의 부재이다. 일부 구현예에서, 제1 생물학적 병태는 자폐 스펙트럼 장애이고, 제2 생물학적 병태는 주의력-결핍/과잉행동 장애이다. 일부 구현예에서, 시험 대상체는 인간이다. 일부 구현예에서, 인간은 약 12세 내지 약 5세 연령 사이이다. 일부 구현예에서, 대상체는 약 12세, 11세, 10세, 9세, 8세, 7세, 5세, 4세, 3세, 2세, 또는 1세 미만이다. 일부 구현예에서, 대상체는 적어도 약 1세, 2세, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 11세, 또는 12세이다. 일부 구현예에서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간, 치아 및 손발톱으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간이고, 참조선은 모간의 종(longitudinal) 방향에 상응한다. 일부 구현예에서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 치아이고, 참조선은 치아의 신생아 선(neonatal line)을 포함하는 성장 밴드(growth band) 전반에 걸친 방향에 상응한다. 일부 구현예에서, 상기 상응하는 복수의 위치는 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플을 따라 상응하는 복수의 위치 중 제1 위치가 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플의 끝(tip)에 가장 가까운 위치에 상응하도록 시퀀싱된다. 일부 구현예에서, 상기 상응하는 복수의 형광 강도 측정치에서의 각각의 트레이스는 복수의 데이터 포인트를 포함하고, 각각의 데이터 포인트는 복수의 위치 중 개별적인 위치의 인스턴스(instance)이다. 일부 구현예에서, 상기 상응하는 일련의 특징은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 특징은 재발 정량화 분석 또는 형광 트레이스의 관련 전산 분석으로부터 도출된다. 일부 구현예에서, 상기 상응하는 복수의 위치는 적어도 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개, 5000개, 6000개, 7000개, 8000개, 9000개, 10000개, 12000개, 14000개, 16000개, 18000개, 20000개, 또는 20000개 초과의 위치를 포함한다.
본 개시내용의 또 다른 측면은 하나 이상의 컴퓨터 프로세서에 의해 실행시, 상기 또는 본원의 다른 곳에서 임의의 방법을 구현하는 머신 실행가능 코드를 포함하는 비-일시적 컴퓨터 판독가능 매체를 제공한다.
본 개시내용의 다른 측면은 하나 이상의 컴퓨터 프로세서 및 이에 결합된 컴퓨터 메모리를 포함하는 시스템을 제공한다. 상기 컴퓨터 메모리는 하나 이상의 컴퓨터 프로세서에 의해 실행시, 상기 또는 본원의 다른 곳에서 임의의 방법을 구현하는 머신 실행가능 코드를 포함한다.
본 개시내용의 추가적인 측면 및 이점은 본 개시내용의 예시적인 구현예만이 도시되고 기술되는 하기의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 인식될 바와 같이, 본 개시내용은 다른 구현예 및 상이한 구현예가 가능하며, 이의 여러 세부사항은 모두 본 개시내용에서 벗어나지 않고 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되어서는 아니된다.
참조에 의한 편입
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별적인 간행물, 특허 또는 특허 출원이 구체적으로 그리고 개별적으로 참조로 포함되는 것으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다. 참조로 편입된 간행물 및 특허 또는 특허 출원이 명세서에 포함된 개시내용과 모순되는 범위 내에서, 본 명세서는 임의의 해당 모순된 자료 전반에 걸쳐 대체되고/되거나 우선을 취하도록 의도된다.
본 발명의 새로운 특징은 특히 첨부된 청구범위에 제시되어 있다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 이용되는 예시적인 구현예를 제시하는 하기의 상세한 설명 및 첨부 도면 (또한 본원에서 "도면" 및 "도")을 참조함으로써 획득될 것이며, 다음 중:
도 1은 본 개시내용의 컴퓨팅 장치(100)의 블록 다이아그램의 예를 보여준다.
도 2a-2c는 대상체의 모발 샘플(도 2a), 치아 샘플(도 2b) 및 손발톱 샘플(도 2c)의 예시를 보여준다.
도 3은 생물학적 병태에 대해 대상체를 평가하기 위한 방법(300)의 흐름도를 보여준다.
도 4는 본원에 제공된 방법을 구현하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템을 보여준다.
도 5는 시간 경과에 따른 대상체의 일일 C-반응성 단백질 프로파일의 예를 보여주며, 여기서 y-축은 CRP 강도를 나타내고 x-축은 발달 연령을 나타낸다.
도 6a-6b는 출생전 및 유아기(예를 들어, 최대 1세)에 샘플링된 C-반응성 단백질 프로파일의 재발 정량화 분석으로부터 도출된 특징을 이용하여 훈련된 모델로 다양한 예측 임계치에서 자폐증을 진단하는 방법의 민감도 및 특이도를 특성화하기 위한 수신자 작동 특성(ROC) 곡선을 나타낸다. 장치 성능은 다양한 분류 임계치에서 성능의 측정을 제공하는 ROC 플롯의 곡선 아래 면적(AUC)을 계산함으로써 측정되며; 여기서, AUC는 0.86이었고, 매우 정확한 예측 성능을 나타낸다.
본 발명의 다양한 구현예가 본원에 도시되고 기술되었지만, 이는 해당 구현예가 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명에서 벗어남이 없이 당업자에게 다양한 변형, 변경 및 대체가 발생할 수 있다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
동적 생물학적 반응은 인간에 대해 구조적 및 기능적 중요성을 갖는 근본적인 생물학적 프로세스를 나타낼 수 있다. 예를 들어, 일탈적인 또는 비정상적인 동적 생물학적 반응은 질병 및 장애와 같은 많은 생물학적 병태와 연관될 수 있다. 이러한 생물학적 병태의 예는 신경학적 병태(예를 들어, 자폐 스펙트럼 장애, 조현병 또는 주의력-결핍/과잉행동 장애(ADHD)), 신경퇴행성 병태(예를 들어, 근위축성 측삭 경화증(ALS), 알츠하이머병, 파킨슨병 및 헌팅턴병) 및 암(예를 들어, 소아암)을 포함할 수 있다.
상기 배경을 고려해 볼 때, 생물학적 병태의 진단을 위한, 그리고 특히 비-침습적 진단을 위한 정확한 방법 및 시스템이 필요하다. 이러한 진단은 생물학적 병태의 진단을 위한 비-침습적 방법으로 검출 가능한 바이오마커의 정확한 프로파일링에 기초할 수 있다. 본 개시내용은 대상체로부터 비-침습적으로 획득된 생물학적 샘플로부터의 동적 생물학적 반응 데이터의 분석에 기초하여 생물학적 병태의 정확한 진단을 위한 개선된 시스템 및 방법을 제공한다. 생물학적 병태의 정확한 진단을 위한 이러한 개선된 시스템 및 방법은 생물학적 샘플의 동적 면역조직화학 프로파일링과 질병 상태의 평가에 대한 이러한 동적 프로파일의 인공 지능 데이터 분석의 조합에 기초할 수 있다. 본 개시내용은 예를 들어, 생물학적 병태의 진단을 위한 생물학적 샘플 바이오마커를 제공함으로써 이러한 요구를 해결한다. 상기 생물학적 샘플은 점진적 성장과 연관된 인간 생물학적 표본을 포함한다. 이러한 생물학적 샘플은 모간, 치아 및 손발톱이 될 수 있다. 본 개시내용의 비-침습적 바이오마커는 어린 소아, 심지어 1세 미만의 유아의 진단에 사용될 수 있다. 일부 경우에, 상기 소아는 약 12세 내지 약 5세 연령의 사이일 수 있다. 일부 구현예에서, 상기 소아는 약 12세, 11세, 10세, 9세, 8세, 7세, 5세, 4세, 3세, 2세, 또는 1세 미만일 수 있다. 일부 구현예에서, 상기 소아는 적어도 약 1세, 2세, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 11세, 또는 12세일 수 있다.
일 측면에서, 본 개시내용은 (a) 대상체의 치아 샘플을 염색하여 염색된 치아 샘플을 생성하는 단계; (b) 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하는 단계; 및 (c) 형광 강도의 분석에 적어도 부분적으로 기초하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계:를 포함하는 질병 또는 장애에 대한 대상체의 진단 상태를 예측하기 위한 방법을 제공한다.
일부 구현예에서, 분석하는 단계는 염색된 치아 샘플의 형광 이미지를 획득하는 단계 및 상기 형광 이미지의 형광 강도를 분석하는 단계를 포함한다. 일부 구현예에서, 상기 염색된 치아 샘플의 형광 이미지를 획득하는 단계는 도립 또는 비-도립 공초점 현미경을 사용하는 것을 포함한다. 일부 구현예에서, 상기 치아 샘플을 염색하는 단계는 C-반응성 단백질 면역조직화학 염색을 사용하는 것을 포함한다. 일부 구현예에서, 상기 방법은 치아 샘플을 절편화하는 단계를 추가로 포함한다. 일부 구현예에서, 치아 샘플을 염색하는 단계는 치아 샘플을 탈석회화하는 단계를 포함한다.
일부 구현예에서, 본원에 개시된 시스템 및 방법은 C-반응성 단백질 형광 면역조직화학 염색을 단독으로 또는 다른 기법과 조합하여 사용할 수 있다. 이러한 기법은 레이저 절제-유도 결합 플라즈마-질량 분광법(LA-ICP-MS), 라만 분광법 또는 이들의 임의의 조합을 포함할 수 있다. 일부 구현예에서, 조합 기법은 주어진 기법 단독의 진단 정확도 또는 정밀도를 향상시킬 수 있다. 일부 구현예에서, LA-ICP-MS의 추가는 C-반응성 단백질 형광 면역조직화학 데이터의 진단력을 보완할 수 있는 주어진 생물학적 샘플의 복수의 비-침습성 금속 대사 바이오마커를 제공할 수 있다. 일부 구현예에서, 금속 대사 바이오마커는 아연, 주석, 마그네슘, 구리, 요오드화물, 리튬, 알루미늄, 인, 황, 칼슘, 크롬, 망간, 철, 코발트, 니켈, 비소, 스트론튬, 카드뮴, 주석, 요오드, 바륨, 수은, 납, 비스무트, 몰리브덴, 또는 이들의 임의의 조합을 포함할 수 있다. 일부 구현예에서, 라만 분광법의 추가는 C-반응성 단백질 형광 면역조직화학 데이터의 진단력을 보완하기 위해 질병 또는 외적 원인(external stressor)에 의해 유도된 생리학적 변화를 나타내는 복수의 스펙트럼을 제공할 수 있다.
일부 구현예에서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 질병 또는 장애는 ASD를 포함한다. 일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 대상체는 성인이다. 일부 구현예에서, 대상체는 약 12세 내지 약 5세 연령 사이일 수 있다. 일부 구현예에서, 대상체는 약 12세, 11세, 10세, 9세, 8세, 7세, 5세, 4세, 3세, 2세, 또는 1세 미만일 수 있다. 일부 구현예에서, 대상체는 적어도 약 1세, 2세, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 11세, 또는 12세일 수 있다.
일부 구현예에서, 상기 분석하는 단계는 형광 강도에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계, 및 염증의 시간적 프로파일을 분석하는 단계를 포함한다. 일부 구현예에서, 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응한다.
일부 구현예에서, 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 형광 강도를 처리하는 단계를 포함한다. 일부 구현예에서, 이 훈련된 모델은 복수의 파라미터를 포함하며, 상기 용어 "파라미터"는 모델에서 하나 이상의 입력, 출력 및/또는 기능에 영향(예를 들어, 변형, 맞춤화 및/또는 조정)을 미칠 수 있는 모델(예를 들어, 모델이 회귀자 또는 분류자인 경우)의 임의의 계수, 또는 유사하게, 내부 또는 외부 요소의 임의의 값(예를 들어, 가중치 및/또는 하이퍼파라미터)을 지칭한다. 예를 들어, 일부 구현예에서, 모델의 파라미터는 모델의 행동, 학습 및/또는 성능을 제어, 변형, 맞춤화 및/또는 조정하는 데 사용될 수 있는 임의의 계수, 가중치 및/또는 하이퍼파라미터를 지칭한다. 일부 경우에, 파라미터는 모델에 대한 입력(예를 들어, 특징)의 영향을 증가시키거나 감소시키는 데 사용된다. 비제한적인 예로서, 일부 구현예에서, 파라미터는 노드의 (예를 들어, 신경망의) 영향을 증가시키거나 감소시키는 데 사용되며, 상기 노드는 하나 이상의 활성화 기능을 포함한다. 모델의 특정 입력, 출력 및/또는 기능에 대한 파라미터의 할당은 주어진 모델에 대해 임의의 하나의 패러다임에 제한되지 않지만 목적한 성능을 위해 임의의 적합한 모델에서 사용될 수 있다. 일부 구현예에서, 파라미터는 고정된 값을 갖는다. 일부 구현예에서, 파라미터의 값은 수동으로 및/또는 자동으로 조정 가능하다. 일부 구현예에서, 파라미터의 값은 모델에 대한 검증 및/또는 훈련 프로세스에 의해 (예를 들어, 오류 최소화 및/또는 역전파(back propagation) 방법에 의해) 변형된다. 일부 구현예에서, 본 개시내용의 모델은 복수의 파라미터를 포함한다. 일부 구현예에서, 모델 (예를 들어, 훈련되지 않은 모델, 부분적으로 훈련된 모델 또는 완전히 훈련된 모델)과 연관된 복수의 파라미터는 n개의 파라미터이고, 여기서: n ≥ 2; n ≥ 5; n ≥ 10; n ≥ 25; n ≥ 40; n ≥ 50; n ≥ 75; n ≥ 100; n ≥ 125; n ≥ 150; n ≥ 200; n ≥ 225; n ≥ 250; n ≥ 350; n ≥ 500; n ≥ 600; n ≥ 750; n ≥ 1,000; n ≥ 2,000; n ≥ 4,000; n ≥ 5,000; n ≥ 7,500; n ≥ 10,000; n ≥ 20,000; n ≥ 40,000; n ≥ 75,000; n ≥ 100,000; n ≥ 200,000; n ≥ 500,000, n ≥ 1 x 106, n ≥ 5 x 106, 또는 n ≥ 1 x 107이다. 일부 구현예에서, n은 10,000 내지 1 x 107, 100,000 내지 5 x 106, 또는 500,000 내지 1 x 106이다.
일부 구현예에서, 상기 훈련된 모델을 사용하여 형광 강도를 처리하는 단계는 (예를 들어, 재발 정량화 분석에 의해) 형광 강도로부터 특징을 추출하는 단계, 및 훈련된 모델을 사용하여 특징을 분석하는 단계를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 (예를 들어, 그래디언트-부스팅된 결정 트리와 같은 머신 러닝 알고리즘의 그래디언트-부스팅 구현) 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 훈련된 모델은 그래디언트-부스팅된 앙상블 모델을 포함한다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성된다. 일부 구현예에서, 상기 하나 이상의 특징은 샘플의 분석으로부터 도출된 형광 강도 트레이스에 재발 정량화 분석(RQA)을 적용하여 추출된다. 일부 구현예에서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성된다.
일부 구현예에서, 상기 방법은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 적어도 약 0.80의 수신자 작동 특성 아래 면적(AUROC)을 갖는 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 추가로 포함한다.
다른 측면에서, 본 개시내용은 하나 이상의 프로세서, 및 상기 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 포함하는 장치를 제공하며, 상기 하나 이상의 프로그램은 하기에 대한 명령을 포함한다: (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; (c) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (d) 훈련된 모델을 사용하여 특징을 처리하여 대상체가 c-반응성 단백질과 연관된 질병 또는 장애를 갖는 가능성을 결정하는 단계. 일부 구현예에서, 상기 개별적인 제2 데이터세트는 재발 정량화 분석 또는 관련 방법을 상응하는 복수의 형광 강도 측정치에 적용함으로써 도출된다.
다른 측면에서, 본 개시내용은 비-일시적 컴퓨터 판독가능 저장 매체 및 내부에 삽입된 하나 이상의 컴퓨터 프로그램을 제공하며, 상기 하나 이상의 컴퓨터 프로그램은 컴퓨터 시스템에 의해 실행될 때 컴퓨터 시스템으로 인해 하기를 포함하는 방법을 수행하도록 하는 명령을 포함한다: (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; (c) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (d) 훈련된 모델을 사용하여 특징을 처리하여 대상체가 c-반응성 단백질과 연관된 질병 또는 장애를 갖는 가능성을 결정하는 단계. 일부 구현예에서, 상기 개별적인 제2 데이터세트는 재발 정량화 분석 또는 관련 방법을 상응하는 복수의 형광 강도 측정치에 적용함으로써 도출된다.
다른 측면에서, 본 개시내용은 하나 이상의 프로세서, 및 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 갖는 컴퓨터 시스템에서, 하기를 포함하는 모델을 훈련하기 위한 방법을 제공한다: (a) 복수의 훈련 대상체 중 훈련 대상체의 제1 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는 것에 상응하는 제1 진단 상태를 가지며, 복수의 훈련 대상체 중 훈련 대상체의 제2 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖지 않는 것에 상응하는 제2 진단 상태를 갖는 것인, 복수의 훈련 대상체에서 각각의 개별적인 훈련 대상체에 대해, (i) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (ii) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; 및 (iii) c-반응성 단백질 형광 강도의 변화에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (b) (i) 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 각각의 개별적인 제2 데이터세트의 상응하는 일련의 특징 및 (ii) 제1 진단 상태 및 제2 진단 상태 중에서 선택되는, 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 상응하는 진단 상태로 훈련되지 않은 또는 부분적으로 훈련되지 않은 모델을 훈련시키고, 이에 따라 시험 대상체의 c-반응성 단백질과 연관된 생물학적 샘플로부터 획득된 일련의 특징에서 특징에 대한 값에 기초하여 시험 대상체가 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는지의 여부에 관한 지표를 제공하는 훈련된 모델을 획득하는 단계. 일부 구현예에서, 상기 개별적인 제2 데이터세트는 재발 정량화 분석 또는 관련 방법을 상응하는 복수의 형광 강도 측정치에 적용함으로써 도출된다.
일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 모델 알고리즘, 지도 클러스터링 모델 알고리즘, 회귀 모델, 그래디언트-부스팅 알고리즘 (예를 들어, 그래디언트-부스팅된 결정 트리와 같은 머신 러닝 알고리즘의 그래디언트-부스팅 구현) 또는 이들의 임의의 조합이다. 일부 구현예에서, 상기 훈련된 머신 러닝 모델은 그래디언트-부스팅된 앙상블 모델을 포함한다. 일부 구현예에서, 상기 훈련된 모델은 다항 분포에 대한 결과를 예측한다. 일부 구현예에서, 상기 훈련된 모델은 이항 분포에 대한 결과를 예측한다. 일부 구현예에서, c-반응성 단백질과 연관된 제1 생물학적 병태는 자폐 스펙트럼 장애(ASD), 주의력-결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부 및 소아암으로 이루어진 군으로부터 선택된다.
일부 구현예에서, c-반응성 단백질과 연관된 제1 생물학적 병태에 대해 시험 대상체를 평가하는 단계는 c-반응성 단백질과 연관된 제1 생물학적 병태의 존재와 c-반응성 단백질과 연관된 제1 생물학적 병태의 부재 간에 식별하는 단계를 추가로 포함한다. 일부 구현예에서, c-반응성 단백질과 연관된 제1 생물학적 병태에 대해 시험 대상체를 평가하는 단계는 c-반응성 단백질과 연관된 제1 생물학적 병태와 c-반응성 단백질과 연관된 제1 생물학적 병태와 구별되는 c-반응성 단백질과 연관된 제2 생물학적 병태 간에 식별하는 단계를 추가로 포함한다. 일부 구현예에서, 제1 생물학적 병태는 자폐 스펙트럼 장애이고, 제2 생물학적 병태는 신경전형적 발달이며; 즉, 신경발달 장애의 부재이다. 일부 구현예에서, 제1 생물학적 병태는 자폐 스펙트럼 장애이고, 제2 생물학적 병태는 주의력-결핍/과잉행동 장애이다. 일부 구현예에서, 시험 대상체는 인간이다. 일부 구현예에서, 인간은 약 12세 내지 약 5세 연령 사이일 수 있다. 일부 구현예에서, 인간은 약 12세, 11세, 10세, 9세, 8세, 7세, 5세, 4세, 3세, 2세, 또는 1세 미만일 수 있다. 일부 구현예에서, 인간은 적어도 약 1세, 2세, 3세, 4세, 5세, 6세, 7세, 8세, 9세, 10세, 11세, 또는 12세일 수 있다. 일부 구현예에서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간, 치아 및 손발톱으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간이고, 참조선은 모간의 종 방향에 상응한다. 일부 구현예에서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 치아이고, 참조선은 치아의 신생아 선을 포함하는 성장 밴드 전반에 걸친 방향에 상응한다. 일부 구현예에서, 상기 상응하는 복수의 위치는 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플을 따라 상응하는 복수의 위치 중 제1 위치가 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플의 끝에 가장 가까운 위치에 상응하도록 시퀀싱된다. 일부 구현예에서, 상기 상응하는 복수의 형광 강도 측정치에서의 각각의 트레이스는 복수의 데이터 포인트를 포함하고, 각각의 데이터 포인트는 복수의 위치 중 개별적인 위치의 인스턴스이다. 일부 구현예에서, 상기 상응하는 일련의 특징은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 상기 특징은 재발 정량화 분석 또는 형광 트레이스의 관련 전산 분석으로부터 도출된다. 일부 구현예에서, 상기 상응하는 복수의 위치는 적어도 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개, 5000개, 6000개, 7000개, 8000개, 9000개, 10000개, 12000개, 14000개, 16000개, 18000개, 20000개, 또는 20000개 초과의 위치를 포함한다.
예시적인 시스템의 세부사항은 도 1과 함께 기술되며, 이는 본 개시내용의 컴퓨팅 장치(100)의 블록 다이아그램의 예를 보여준다. 일부 구현에서 장치(100)는 하나 이상의 프로세싱 유닛 CPU(들)(102)(프로세서로도 지칭됨), 하나 이상의 네트워크 인터페이스(104), 사용자 인터페이스(106), 비영구 메모리(111), 영구 메모리(112) 및 이들 구성요소를 상호연결하기 위한 하나 이상의 통신 버스(114)를 포함한다. 하나 이상의 통신 버스(114)는 선택적으로 시스템 구성요소 간의 통신을 상호연결하고 제어하는 회로(종종 칩셋으로 칭해짐)를 포함한다. 비영구 메모리(111)는 전형적으로 DRAM, SRAM, DDR RAM, ROM, EEPROM, 플래시 메모리와 같은 고속 랜덤 액세스 메모리를 포함하는 반면, 영구 메모리(112)는 전형적으로 CD-ROM, 디지털 다목적 디스크(DVD) 또는 기타 광 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 자기 디스크 저장 장치, 광 디스크 저장 장치, 플래시 메모리 장치 또는 기타 비휘발성 고체 상태 저장 장치를 포함한다. 영구 메모리(112)는 선택적으로 CPU(들)(102)로부터 원격 위치된 하나 이상의 저장 장치를 포함한다. 영구 메모리(112) 및 비영구 메모리(112) 내의 비휘발성 메모리 장치(들)은 비-일시적 컴퓨터 판독가능 저장 매체를 포함한다. 일부 구현에서, 비영구적 메모리(111) 또는 대안적으로 비-일시적 컴퓨터 판독가능 저장 매체는 때때로 영구 메모리(112)와 함께 하기 프로그램, 모듈 및 데이터 구조 또는 이들의 서브세트를 저장한다: 다양한 기본 시스템 서비스를 처리하고 하드웨어 종속 작업을 수행하기 위한 절차를 포함하는 선택적 운영 시스템(116); 시스템(100)을 다른 장치 및/또는 통신 네트워크(104)와 연결하기 위한 선택적 네트워크 통신 모듈 (또는 명령)(118); 생물학적 병태에 대해 대상체를 평가하기 위한 훈련 모델용 선택적 분류자 훈련 모듈(120); 하나 이상의 훈련 대상체(124)에 대한 특징 데이터를 포함하는, 훈련 대상체로부터의 생물학적 샘플에 대한 데이터세트를 위한 선택적 데이터 저장소(122)로서, 상기 특징 데이터는 각각의 특징(126) 및 진단 상태(128) (예를 들어, 개별적인 훈련 대상체가 생물학적 병태를 갖는 것으로 진단되었거나 또는 생물학적 병태를 갖는 것으로 진단되지 않은 적응증)와 연관된 파라미터를 포함하는 것인, 선택적 데이터 저장소(122); 생물학적 병태를 구별하는 모델을 검증하기 위한 선택적 분류자 검증 모듈(130); 검증 대상체로부터의 생물학적 샘플에 대한 데이터세트를 위한 선택적 데이터 저장소(132); 및 생물학적 병태를 갖는 것으로, 예를 들어, 분류자 훈련 모듈(120)을 사용하여 훈련된 바와 같이 대상체를 분류하기 위한 선택적 환자 분류 모듈(134).
다양한 구현에서, 상기 식별된 요소 중 하나 이상은 이전에 언급된 메모리 장치 중 하나 이상에 저장되고, 전술한 기능을 수행하기 위한 일련의 명령에 상응한다. 상기 식별된 모듈, 데이터 또는 프로그램 (예를 들어, 일련의 명령)은 별도의 소프트웨어 프로그램, 절차, 데이터세트 또는 모듈로 구현될 필요가 없으며, 따라서 이러한 모듈 및 데이터의 다양한 서브세트는 다양한 구현에서 결합되거나 그렇지 않으면 재배열될 수 있다. 일부 구현에서, 비영구 메모리(111)는 상기 식별된 모듈 및 데이터 구조의 서브세트를 선택적으로 저장한다. 또한, 일부 구현예에서 메모리는 상기 기술되지 않은 추가적인 모듈 및 데이터 구조를 저장한다. 일부 구현예에서, 상기 식별된 요소 중 하나 이상은 시각화 시스템(100) 이외의 컴퓨터 시스템에 저장되며, 시각화 시스템(100)은 필요시 이러한 데이터의 전부 또는 일부를 검색할 수 있도록 시각화 시스템(100)에 의해 주소 지정 가능하다.
일부 구현예에서, 시스템(100)은 화학적 분석을 수행하기 위한 하나 이상의 분석 장치에 연결되거나, 또는 이를 포함한다. 예를 들어, 선택적 네트워크 통신 모듈 (또는 명령)(118)은 예를 들어, 통신 네트워크(104)를 통해 시스템(100)과 하나 이상의 분석 장치를 연결하도록 구성된다. 일부 구현예에서, 하나 이상의 분석 장치는 레이저 절제-유도 결합 플라즈마-질량 분광계(LA-ICP-MS), 형광 이미지 센서 또는 라만 분광계를 포함한다.
비록 도 1은 "시스템(100)"을 도시하지만, 도면은 본원에 기술된 구현의 구조적 개략도로서보다는 컴퓨터 시스템에 존재할 수 있는 다양한 특징의 기능적 설명으로서 더 많이 의도된다. 실제로, 그리고 당업자에 의해 인식되는 바와 같이, 별개로 보여지는 항목이 결합될 수 있고 일부 항목은 분리될 수 있다. 더욱이, 도 1은 비영구 메모리(111)의 특정 데이터 및 모듈을 도시하지만, 이들 데이터 및 모듈의 일부 또는 전부는 영구 메모리(112)에 있을 수 있다.
일부 구현예에서, 본 개시내용의 방법은 생물학적 샘플(예를 들어, 모간을 포함하는 모발 가닥)을 획득하는 단계를 포함한다. 대상체는 인간일 수 있다. 일부 구현예에서, 대상체는 5세이거나 또는 그 이하의 아동이다 (예를 들어, 상기 아동은 5세, 4세, 3세, 2세, 1세, 9개월령, 6개월령, 3개월령, 또는 1개월령이거나 또는 그 이하이다). 일부 구현예에서, 대상체는 성인이다. 도 2a는 모간을 포함하는 대상체의 모발 샘플의 예를 보여준다. 모발 샘플은 (예를 들어, 가위의 도움으로) 대상체로부터 간단히 절단할 수 있다. 모발 샘플을 획득하는 방법은 비침습적일 수 있다. 획득된 모발 샘플은 최소 1 cm의 길이를 가질 수 있다 (예를 들어, 모발 샘플은 1 cm, 2 cm, 3 cm, 4 cm 또는 5 cm 길이이다). 모발 샘플은 모발의 임의의 부분 (예를 들어, 끝 또는 끝과 모낭 사이의 일부)을 포함할 수 있다. 특히, 모발의 모낭을 포함하는 모발 샘플에 대한 특별한 요구사항은 없다. 도 2b는 대상체의 치아 샘플의 예를 보여준다. 도 2c는 대상체의 손발톱 샘플의 예를 보여준다. 손발톱 또는 모발의 경우, 생물학적 샘플을 획득하는 것은 손발톱 또는 모발이 샘플링될 수 있도록 대상체를 위치시키는 것을 지칭할 수 있다. 손발톱 샘플은 전체 손발톱 또는 손발톱의 잘라낸 조각을 포함할 수 있다.
일부 구현예에서, 상기 획득된 생물학적 샘플은 하나 이상의 용매 및/또는 계면활성제로 생물학적 샘플을 세척하고 건조시킴에 의해 전처리하는 것과 같이 전처리된다. 상기 생물학적 샘플이 모발인 경우, 모발 샘플은 TRITON X-100® 및 초순수 금속이 없는 물(예를 들어, MILLI-Q® 물)의 용액으로 세척하고, 오븐에서 (예를 들어, 섭씨 60도에서) 밤새 건조시킬 수 있다. 상기 전처리는 모간을 접착 필름 (예를 들어, 양면 테이프)이 있는 유리 슬라이드 (예를 들어, 현미경용 유리 슬라이드) 상에 배치시킴에 의해 측정을 위한 모간을 준비하는 단계를 추가로 포함할 수 있다. 상기 모간은 모간이 실질적으로 직선이 되도록 위치될 수 있다. 모간이 있는 유리 슬라이드는 분석을 수행하기 위해 측정 시스템 (예를 들어, 레이저 절제-유도 결합 플라즈마-질량 분광계(LA-ICP-MS), 형광 이미지 센서, 라만 분광계)에 또는 이의 근처에 배치될 수 있다. 생물학적 샘플이 치아 또는 손발톱인 경우, 생물학적 샘플의 표면은 (예를 들어, 계면활성제, 물 또는 하나 이상의 용매에 의해) 세척될 수 있다. 일부 경우에, 샘플은 본원의 다른 곳에서 기술된 바와 같이, 분석을 수행하는 것과 관련하여 시간 프레임의 이전, 이후, 직전, 또는 임의의 조합에 따라 탈석회화될 수 있다. 일부 경우에, 샘플을 탈석회화하는 단계는 하기 단계를 포함할 수 있다: (a) 에틸렌디아민테트라아세트산(EDTA)의 용액에 치아를 침지하는 단계로, 상기 EDTA는 최대 약 5주의 기간 동안 약 7.0 내지 약 7.4의 pH를 포함할 수 있는 것인, 단계; (b) 매주 빈도로 치아를 칭량하는 단계; (c) 상기 치아 안정기(plateaus)의 무게 변화 시 샘플을 제거하는 단계. 상기 샘플은 분석을 수행하기 위한 측정 시스템 (예를 들어, 레이저 절제-유도 결합 플라즈마-질량 분광계(LA-ICP-MS), 형광 이미지 센서 또는 라만 분광계) 내부 또는 이의 근처에 배치될 수 있다.
도 3은 생물학적 병태에 대해 대상체를 평가하기 위한 방법(300), 예컨대 질병 또는 장애에 대한 대상체의 진단 상태를 예측하기 위한 방법의 흐름도를 보여준다. 상기 방법(300)은 (작동 302에서와 같이) 대상체의 치아 샘플을 염색하여 염색된 치아 샘플을 생성하는 단계를 포함할 수 있다. 다음으로, 상기 방법(300)은 (작동 304에서와 같이) 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하는 단계를 포함할 수 있다. 다음으로, 상기 방법(300)은 (작동 306에서와 같이) 형광 강도의 분석에 적어도 부분적으로 기초하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계를 포함할 수 있다.
일부 구현예에서, 분석하는 단계는 염색된 치아 샘플의 형광 이미지를 획득하는 단계 및 상기 형광 이미지의 형광 강도를 분석하는 단계를 포함한다. 일부 구현예에서, 상기 염색된 치아 샘플의 형광 이미지를 획득하는 단계는 도립 또는 비-도립 공초점 현미경을 사용하는 것을 포함한다. 일부 구현예에서, 상기 치아 샘플을 염색하는 단계는 C-반응성 단백질 면역조직화학 염색을 사용하는 것을 포함한다. 일부 구현예에서, 상기 방법은 치아 샘플을 절편화하는 단계를 추가로 포함한다. 일부 구현예에서, 치아 샘플을 염색하는 단계는 치아 샘플을 탈석회화하는 단계를 포함한다.
일부 구현예에서, 상기 분석하는 단계는 형광 강도에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계, 및 염증의 시간적 프로파일을 분석하는 단계를 포함한다. 일부 구현예에서, 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응한다.
측정치 데이터는 생물학적 샘플을 따라 복수의 위치에서 순차적으로 생물학적 샘플로부터 수집될 수 있다. 일부 구현예에서, 상기 생물학적 샘플의 참조선을 따른 복수의 위치는 적어도 100개의 위치 (예를 들어, 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개, 5000개, 6000개, 7000개, 8000개, 9000개, 10000개, 12000개, 14000개, 16000개, 18000개, 20000개 또는 20000개 이상의 위치)를 포함한다. 일부 구현예에서, 개별적인 위치는 서로 인접해 있다. 이 방법에 의해, 상기 생물학적 샘플 상의 구별되는 위치에 상응하는 각각의 영역은 이에 따라 동적 (예를 들어, 시간-변동) 존재비 측정치와 연관될 수 있다. 일부 구현예에서, 개별적인 위치는 사전 정의된 거리만큼 떨어져 있다. 일부 구현예에서, 샘플링은 모발 샘플과 같은 생물학적 샘플의 끝과 가장 가까운 개별적인 위치로부터 (예를 들어, 대상체의 가장 어린 연령에 상응하는 위치에서) 시작하여 생물학적 샘플의 참조선을 따라 수행된다. 일반적으로, 샘플링의 방향이 알려져 있는 한, 끝 또는 뿌리에 가장 가까운 개별적인 위치로부터 시작하여 샘플링을 수행할 수 있으며, 적절한 훈련된 모델이 분석에 사용된다.
상기 샘플링은 일련의 데이터 포인트를 생성할 수 있다. 각각의 일련의 데이터 포인트는 생물학적 샘플을 따라 복수의 위치에서 측정된 동적 생물학적 반응을 나타내는 물질의 측정치(예를 들어, 존재비(abundance) 또는 농도)에 상응할 수 있다. 상기 생물학적 샘플의 참조선 상의 각각의 위치는 생물학적 샘플의 특정 성장 시간에 상응할 수 있다.
일부 구현예에서, 치아의 생물학적 샘플의 경우, 참조선은 240일 내지 510일의 성장 (예를 들어, 치아 유형에 따른 치아 크라운 형성 기간)을 포함할 수 있다. 일부 구현예에서, 참조선을 따른 각각의 위치는 약 1 내지 약 0.5 마이크로미터에 상응할 수 있다. 대안적으로 또는 추가적으로, 상기 생물학적 샘플은 모간을 포함할 수 있으며, 여기서 참조선을 따른 위치는 대략 5분의 성장 (예를 들어, 1 마이크로미터 해상도 및 개월 당 평균 모발 성장 속도 1 cm를 사용하여 계산된 모발 성장 기간)에 상응한다. 상기 생물학적 샘플의 참조선을 따른 복수의 위치를 성장의 상응하는 기간과 연관시킴으로써, 복수의 트레이스를 포함하는 제1 데이터세트가 획득된다. 각각의 트레이스는 상기 생물학적 샘플로부터 측정된 동적 생물학적 반응을 나타내는 물질의 측정치 (예를 들어, 존재비 또는 농도)의 시간-의존적 존재비를 포함한다. 예를 들어, 위치 사이의 거리는 생물학적 샘플의 추정된 성장 (예를 들어, 생물학적 시간)에 상응할 수 있다. 예를 들어, 존재비는 최대 약 8 밀리미터(mm) 거리를 따라 치아 샘플에 대해 측정될 수 있으며, 이는 대략 240일 내지 510일의 생물학적 시간에 상응한다. 대안적으로 또는 추가적으로, 존재비는 1.2 cm 거리를 따라 모발 샘플에 대해 측정될 수 있으며, 이는 대략 35일의 생물학적 시간에 상응한다. 상기 생물학적 시간은 평균 모발 성장 속도 (예를 들어, 개월 당 1 cm)를 사용하여 추정될 수 있다.
일부 구현예에서, 데이터 분석은 생물학적 샘플로부터 측정된 동적 생물학적 반응을 나타내는 물질의 시간-의존적 존재비 (예를 들어, 시간-의존적 농도)에 상응하는 트레이스에 대해 수행될 수 있다. 이는 데이터를 정리 (예를 들어, 시간 범위에 걸쳐 데이터를 평활화하고/하거나 사전 결정된 임계치보다 더 높거나 더 낮은 데이터 포인트를 제거하는 것)하기 위한 맞춤형 작동이 포함될 수 있다. 일부 구현예에서, 상기 데이터 분석은 인접한 포인트 간의 평균 절대치 차(mean absolute difference)의 표준 편차의 적어도 1배, 2배 또는 3배인 인접한 데이터 포인트 간의 평균 절대치 차를 갖는 데이터 포인트를 트레이스로부터 제거하는 것을 포함한다.
일부 구현예에서, 상기 데이터 분석은 내부 표준에 대해 각각의 트레이스를 정규화하는 것을 추가로 포함한다. 예를 들어, 환경 노출 (예를 들어, 식이)에 따라 변동하지 않는 생물학적 샘플의 발달/성장 동안 고르게 포함되는 상기 샘플에서 검출된 측정 물질은 내부 표준으로서 쓰일 수 있다.
일부 구현예에서, 상기 데이터 분석은 트레이스의 동적 주기적 특성을 기술하는 일련의 특징을 획득하기 위해 시간-종속적 트레이스에 대한 재발 정량화 분석(RQA)을 수행하는 것을 추가로 포함한다. RQA는 상기 시간-종속적 트레이스의 가변성을 측정한다. RQA는 주어진 파형에서 주기적 속성을 기술하는 특징의 추정을 수반하며, 이는 결정론, 엔트로피, 평균 대각선 길이(MDL), 층류성, 엔트로피, 포획 시간(TT), 재발 시간(RT), Vmax 및 Lmax를 포함하고, 이들 각각은 첨부되는 참조에 기술된 바와 같이, 신호 역학의 다양한 측면을 캡처한다. RQA의 방법 및 특징은 예를 들어, Webber 등 "Simpler Methods Do It Better: Success of Recurrence Quantification Analysis as a General Purpose Data Analysis Tool," Physics Letters A 373, 3753-3756 (2009) 및 Marwan 등 "Recurrence Plots for the Analysis of Complex Systems," Physics Reports 438, 237-239 (2007)에 기술되어 있으며, 이들 각각의 내용은 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 시간-종속적 트레이스는 푸리에 변환, 웨이블릿 분석 및 코시노 분석과 같은 다른 분석 방법을 사용함에 의해 분석된다. 이러한 기술은 주파수 구성요소 및 이들의 관련된 전력의 스펙트럼 분석을 포함한, 유사한 척도를 도출하는 데 적용될 수 있다. 이러한 척도 및 관련된 도함수(derivative) 측정치는 RQA로부터 도출된 특징 대신 사용하여 예측 분류를 위한 생물학적 샘플로부터 획득된 시간-종속적 트레이스를 분석할 수 있다.
RQA는 획득된 개별적인 트레이스에서 동적 시간적 구조를 시각화하고 분석하는 재발 플롯의 구성을 포함한다. 이러한 재발 플롯은 해당 시퀀스의 시간-지연 도출에 대해 주어진 시퀀스를 플로팅(plotting)함으로써 순차적 측정치의 위상 프로세스를 예시할 수 있다. 모간에서 측정된 1차원 트레이스로부터, 추가 차원은 계산적으로 도출되어 위상 궤적으로 지칭되는 더 높은 차원 공간에 트레이스가 삽입되며, 여기서 t는 원래 트레이스의 값을 지칭하고, 차원 (t+τ) 및 (t+2τ)는 간격 τ만큼 원래 시계열을 지연시키는 것으로부터 도출된다. 이후 후속 분석은 삽입된 위상 궤적 상에서 수행되어 재발 플롯을 구성하고 재발 정량화 분석을 수행한다. 재발 플롯은 위상 궤적 내의 각각의 포인트에 임계치 함수의 적용을 통해 위상 궤적으로부터 도출될 수 있다; 전형적으로 백색 또는 흑색 공간으로 표시되는 정방 이항 행렬로 구성된, 상응하는 재발 플롯 상에서, 주어진 포인트는 각각의 시간적 간격에서 1의 값이 할당되며, 상기 위상-궤적의 다른 포인트는 할당된 임계치 경계의 공간적 한계를 공유한다. RQA 방법은 재발 플롯에 적용되어 시스템이 동일한 상태를 재방문할 때 시간적 간격을 반영하는 흑색 포인트를 갖는, 주어진 시스템에서 상태 간의 지연 간격을 조사한다. 시스템이 주어진 상태의 패턴을 연속적으로 반복하는, 주기적 프로세스는 재발 플롯에서 대각선 흑색 라인으로 나타날 것이며, 반면 안정성의 기간은 정사각형 구조로, 거짓된 반복은 흑색 점으로, 그리고 고유한 이벤트는 공백으로 나타날 것이다.
일부 구현예에서, 재발 플롯은 단일 물질 또는 두 물질의 조합의 트레이스에 대해 구성된다 (예를 들어, 두 물질의 상호작용적 주기적 패턴을 시각화하기 위해; 이는 교차-재발 정량화 분석 또는 공동-재발 정량화 분석으로 지칭될 수 있다). 일부 구현예에서, 재발 플롯은 3개 이상의 물질의 조합에 대해 구성된다.
일부 구현예에서, 데이터 분석은 재발 플롯과 연관된 일련의 특징을 획득하기 위해 재발 플롯을 분석하는 것을 포함한다. 상호교환적으로 "리듬성 특징" 또는 "동적 특징"으로 지칭될 수 있는 특징은 복수의 트레이스에 존재하는 주기성, 예측 가능성 및 전이성을 기술하는 정량적 측정을 제공한다. 상기 특징은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 층류성, 엔트로피, 포획 시간 (TT), 재발 시간 (RT), Vmax, Lmax 및 이들의 임의의 조합을 포함하는 세트로부터 선택된다.
일부 구현예에서, 데이터 분석은 획득된 일련의 특징을 훈련된 모델에 입력하는 단계를 추가로 포함한다. 일부 구현예에서, 훈련된 모델은 생물학적 병태를 갖는 대상체에 대한 확률을 획득하기 위한 예측 계산적 알고리즘을 포함한다. 일부 구현예에서, 예측 계산적 알고리즘은 하기 계산을 수행한다:
여기서, p(대상체)는 대상체가 제1 생물학적 병태를 갖는 확률이고, e는 오일러의 수(Euler's number)이고, α는 β 1 x 1 + … + β k x k 가 0과 동일할 때, 대상체가 생물학적 병태를 갖는 확률과 연관된 계산된 파라미터이고, x 1, …, x k 는 일련의 특징에서 각각의 특징에 대해 도출된 값에 상응하며, 상기 일련의 특징은 1 내지 k의 특징을 포함하고, β 1 , …, β k 는 1 내지 k의 특징을 포함하는 일련의 특징에서 각각의 특징과 연관된 가중치 파라미터에 상응한다.
상기 가중치 파라미터 β 1 , …, β k 는 모델 훈련에 기초하여 정의될 수 있다. 확률 p(대상체)는 0 내지 1의 숫자 범위로 제공될 수 있으며, 여기서 1은 대상체가 생물학적 병태를 갖는 100% 확률에 상응한다.
일부 구현예에서, 데이터 분석은 획득된 확률 p(대상체)에 임계치를 적용하는 것을 포함한다. 획득한 확률 p(대상체)가 임계치 이상인 경우, 대상체는 생물학적 병태를 갖는 것으로 평가된다. 획득한 확률이 임계치 미만인 경우, 대상체는 생물학적 병태를 갖지 않는 것으로 평가된다. 일부 구현예에서, 임계치는 약 0.3 내지 0.6 이다 (예를 들어, 사전 결정된 임계치는 약 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 또는 0.6이다). 확률적 임계치에 할당된 값은 사전 결정되거나, 또는 최대 곡선-아래-면적을 산출하는 값(ROC-AUC)에 상응하는 최적의 임계치를 사용함과 더불어, 수신자-작동-특성(ROC) 차트의 사용을 통해 모델의 훈련 동안 추정될 수 있다. 일부 구현예에서, 획득된 확률은 연관된 오즈 (예를 들어, OR=p/(1-p)가 되도록 확률로부터 도출될 수 있는 오즈비(odds ratio, OR))의 관점에서 표현된다. 예를 들어, 평가는 대상체가 생물학적 병태를 갖는 오즈(odds)를 평가하는 것을 포함한다.
일부 구현예에서, 데이터 분석은 제1 생물학적 병태를 대안적인 병태, 예를 들어, 제2 생물학적 병태로부터 식별하는 것을 포함한다. 일부 구현예에서, 대안적인 병태는 공지된 병태 (예를 들어, 신경전형적 병태 (NT))와 연관되지 않는다. 일부 구현예에서, 제1 생물학적 병태는 자폐 스펙트럼 장애(ASD)와 연관되고 대안적인 병태는 주의력-결핍/과잉행동 장애 (ADHD)와 연관된다. 일부 구현예에서, 대안적인 병태는 임의의 다른 신경 발달 병태, 또는 두 가지 신경 발달 병태에 대한 동반이환 진단이다. 따라서, 데이터 분석은 두 가지 신경 발달 병태 간에 (예를 들어, 자폐 스펙트럼 장애와 ADHD 간에, 또는 ASD와 ASD 및 ADHD 모두에 대해 진단된 동반이환(CM) 사례 간에) 식별할 수 있다.
의사 및 환자의 치료 팀과 같은 의료 서비스 제공자는 환자 데이터 (예를 들어, 동적 생물학적 반응 데이터 또는 기타 건강 데이터), 및/또는 이러한 데이터로부터 생성된 예측 또는 평가에 액세스할 수 있다. 데이터 분석 결과에 기초하여, 의료 서비스 제공자는 임상 결정 또는 결과를 결정할 수 있다.
예를 들어, 의사는 대상체에서 예측되는 질병 또는 장애에 적어도 부분적으로 기초하여, 환자가 병원 또는 다른 임상 현장에서 하나 이상의 임상 시험을 받도록 지시할 수 있다. 이러한 명령은 특정의 사전-결정된 기준 (예를 들어, 질병 또는 장애의 가능성에 대한 최소 임계치)이 충족될 때 제공될 수 있다.
이러한 최소 임계치는 예를 들어, 적어도 약 5% 가능성, 적어도 약 10% 가능성, 적어도 약 20% 가능성, 적어도 약 25% 가능성, 적어도 약 30% 가능성, 적어도 약 35% 가능성, 적어도 약 40% 가능성, 적어도 약 45% 가능성, 적어도 약 50% 가능성, 적어도 약 55% 가능성, 적어도 약 60% 가능성, 적어도 약 65% 가능성, 적어도 약 70% 가능성, 적어도 약 75% 가능성, 적어도 약 80% 가능성, 적어도 약 85% 가능성, 적어도 약 90% 가능성, 적어도 약 95% 가능성, 적어도 약 96% 가능성, 적어도 약 97 % 가능성, 적어도 약 98% 가능성, 또는 적어도 약 99% 가능성일 수 있다.
또 다른 예로서, 의사는 대상체에서 예측되는 질병 또는 장애에 적어도 부분적으로 기초하여 환자에게 투여될 치료 (예를 들어, 약물), 임상 절차 또는 추가 임상 시험의 치료적 유효량을 처방할 수 있다. 예를 들어, 의사는 환자의 염증 징후에 반응하여 항염증 치료제를 처방할 수 있다.
모델
본 개시내용의 방법 및 시스템은 인공 지능 기술의 외부 능력을 활용하거나 액세스하여 다양한 질병 또는 장애에 대한 시그니처를 개발할 수 있다. 이러한 시그니처는 (예를 들어, 표준의 임상 치료보다 몇 개월 또는 몇 년 더 일찍) 질병 또는 장애를 정확하게 예측하는 데 사용될 수 있다. 이러한 예측 능력을 사용하여, 의료 서비스 제공자(예를 들어, 의사)는 정보에 근거한 정확한 위험-기반 결정을 내릴 수 있고, 이에 따라 환자에게 제공되는 치료 및 모니터링의 품질을 개선시킬 수 있다.
본 개시내용의 방법 및 시스템은 대상체(환자)로부터 획득된 동적 생물학적 반응 데이터를 분석하여 질병 또는 장애를 갖는 대상체의 가능성을 생성할 수 있다. 예를 들어, 상기 시스템은 훈련된 (예를 들어, 예측) 알고리즘을 상기 획득된 동적 생물학적 반응 데이터에 적용하여 질병 또는 장애를 갖는 대상체의 가능성을 생성할 수 있다. 훈련된 알고리즘은 상기 획득된 동적 생물학적 반응 데이터를 처리하여 질병 또는 장애를 갖는 대상체의 가능성을 생성하도록 구성된 분류자 또는 회귀자와 같은 인공 지능-기반 모델을 포함할 수 있다. 상기 모델은 환자의 하나 이상의 코호트로부터의 임상 데이터세트를 사용하여, 예를 들어, 입력으로서 환자의 임상 건강 데이터 및/또는 동적 생물학적 반응 데이터와 모델에 대한 출력으로서 환자의 알려진 임상 건강 결과(예를 들어, 질병 또는 장애)를 사용하여 훈련될 수 있다.
상기 모델은 하나 이상의 머신 러닝 알고리즘을 포함할 수 있다. 머신 러닝 알고리즘의 예는 서포트 벡터 머신 (SVM), 나이브 베이즈 분류(na
Figure pct00002
ve Bayes classification), 랜덤 포레스트(random forest), 신경망 (예컨대, 심층 신경망(DNN), 순환 신경망(RNN), 심층 RNN, 장단기 메모리(LSTM) 순환 신경망(RNN), 또는 게이트 순환 유닛(GRU), 또는 분류 및 회귀를 위한 기타 지도 러닝 알고리즘 또는 비지도 머신 러닝, 통계적, 또는 심층-러닝 알고리즘을 포함할 수 있다. 상기 모델은 마찬가지로 다수의 예측 모델로 구성된 앙상블 모델의 추정을 수반할 수 있으며, 예를 들어, 그래디언트-부스팅 결정 트리의 구성에서 그래디언트 부스팅과 같은 기술을 활용할 수 있다. 상기 모델은 환자 데이터에 상응하는 하나 이상의 훈련 데이터세트를 사용하여 훈련될 수 있다.
훈련 데이터세트는 예를 들어, 공통 임상 특성(특징) 및 임상 결과(라벨)를 갖는 환자의 하나 이상의 코호트로부터 생성될 수 있다. 훈련 데이터세트는 일련의 특징 및 특징에 상응하는 라벨을 포함할 수 있다. 특징은 동적 생물학적 반응 데이터, 전자 의료 기록(EMR)으로부터 도출된 환자 인구 통계 정보 및 의료 관찰을 포함하는 알고리즘 입력에 상응할 수 있다. 특징은 예를 들어, 동적 생물학적 반응 데이터의 특정 범위 또는 범주와 같은 임상 특성을 포함할 수 있다. 특징은 환자 연령, 환자 병력, 기타 의학적 병태, 현재 또는 과거 투약, 및 마지막 관찰 이후 시간과 같은 환자 정보를 포함할 수 있다. 예를 들어, 주어진 시점에서 주어진 환자로부터 수집된 일련의 특징은 집합적으로 시그니처로 쓰일 수 있으며, 이는 주어진 시점에서 환자의 건강 상태 또는 상태를 나타낼 수 있다.
예를 들어, 동적 생물학적 반응 데이터 및 기타 건강 측정치의 범위는 연속적인 측정 값의 복수의 분리된 연속적인 범위로서 표현될 수 있고, 동적 생물학적 반응 데이터 및 기타 건강 측정치의 범주는 복수의 분리된 일련의 측정 값 (예를 들어, {"높음", "낮음"}, {"높음", "보통"}, {"낮음", "보통"}, {"높음", "경계선상의 높음", "보통" , "낮음"} 등)으로서 표현될 수 있다. 임상적 특성에는 질병 또는 장애의 진단, 임상 치료의 이전 시행 (예를 들어, 약물, 외과적 치료, 화학요법, 방사선요법, 면역요법 등), 행동 요인, 또는 기타 건강 상태 (예를 들어, 고혈압(hypertension) 또는 고혈압(high blood pressure), 고혈당증(hyperglycemia) 또는 고혈당(high blood glucose), 고콜레스테롤혈증(hypercholesterolemia) 또는 고콜레스테롤혈증(high blood cholesterol), 알레르기 반응 또는 기타 부작용의 이력 등)와 같은 환자의 건강 이력을 나타내는 임상 라벨도 포함될 수 있다.
라벨은 예를 들어, 대상체 (예를 들어, 환자)에서 질병 또는 장애의 존재, 부재, 진단 또는 예후와 같은 임상 결과를 포함할 수 있다. 임상 결과는 환자에서 질병 또는 장애의 존재, 부재, 진단 또는 예후와 연관된 시간적 특성을 포함할 수 있다. 예를 들어, 시간적 특성은 이전 임상 결과 이후 특정 기간 (예를 들어, 병원에서 퇴원시, 약물과 같은 치료 시행시, 외과 수술과 같은 임상 절차 진행 중 등) 내에 질병 또는 장애의 발생을 가지는 환자를 나타낼 수 있다. 이러한 기간은 예를 들어, 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 6시간, 약 8시간, 약 10시간, 약 12시간, 약 14시간, 약 16시간, 약 18시간, 약 20시간, 약 22시간, 약 24시간 시간, 약 2일, 약 3일, 약 4일, 약 5일, 약 6일, 약 7일, 약 10일, 약 2주, 약 3주, 약 4주, 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 6개월, 약 8개월, 약 10개월, 약 1년 또는 약 1년 초과일 수 있다.
입력 특징은 데이터를 빈(bin)으로 집계하거나 대안적으로 원-핫 인코딩(one-hot encoding)을 사용함으로써 구조화될 수 있다. 입력은 또한 이전에 언급된 입력으로부터 도출된 특징 값 또는 벡터, 예컨대 별도의 동적 생물학적 반응 데이터 또는 고정된 기간에 따른 다른 측정치, 및 연속적인 측정치 간의 이산 도함수(discrete derivative) 또는 유한 차분(finite difference)을 포함할 수 있다. 이러한 기간은 예를 들어, 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 6시간, 약 8시간, 약 10시간, 약 12시간, 약 14시간, 약 16시간, 약 18시간, 약 20시간, 약 22시간, 약 24시간, 약 2일, 약 3일, 약 4일, 약 5일, 약 6일, 약 7일, 약 10일, 약 2주, 약 3주, 약 4주, 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 6개월, 약 8개월, 약 10개월, 약 1년 또는 약 1년 초과일 수 있다.
훈련 기록은 관찰의 시퀀스로부터 구성될 수 있다. 이러한 시퀀스는 데이터 프로세싱의 용이성을 위해 고정된 길이를 포함할 수 있다. 예를 들어, 시퀀스는 제로-패딩되거나(zero-padded) 또는 단일 환자의 기록의 독립적인 서브세트로 선택될 수 있다.
모델은 입력 특징을 처리하여 하나 이상의 분류, 하나 이상의 예측 또는 이들의 조합을 포함하는 출력 값을 생성할 수 있다. 예를 들어, 이러한 분류 또는 예측에는 건강/정상 건강 상태(예를 들어, 질병 또는 장애의 부재) 또는 부정적인 건강 상태(예를 들어, 질병 또는 장애의 존재)의 이항 분류, 범주 라벨(예를 들어, '질병 또는 장애 없음', '명백한 질병 또는 장애' 및 '가능성 있는 질병 또는 장애')의 그룹 간의 분류, 특정 질병 또는 장애 발병의 가능성(예를 들어, 상대적 가능성 또는 확률), 질병 또는 장애의 존재를 나타내는 점수, 환자가 경험한 전신 염증의 수준을 나타내는 점수, 환자의 사망 가능성에 대한 '위험 요인', 환자가 질병 또는 장애가 발병한 것으로 예상되는 시간의 예측, 및 임의의 수치 예측에 대한 신뢰 구간이 포함될 수 있다. 다양한 머신 러닝 기술은 또한 머신 러닝 기술의 출력이 모델의 후속 계층 또는 하위 섹션에 대한 입력 특징으로 사용될 수 있도록 캐스케이드화될(cascaded) 수 있다.
실시간 분류 또는 예측을 생성하도록 모델을 훈련시키기 위해 (예를 들어, 모델의 가중치 및 상관관계를 결정함으로써), 상기 모델은 데이터세트를 사용하여 훈련될 수 있다. 이러한 데이터세트는 통계적으로 유의미한 분류 또는 예측을 생성하기에 충분히 클 수 있다. 예를 들어, 데이터세트는 다음을 포함할 수 있다: 동적 생물학적 반응 데이터 및 기타 측정치, 및 병원 또는 기타 임상 환경으로부터의 동적 생물학적 반응 데이터 및 기타 측정치를 포함하는 비식별된 데이터의 데이터베이스.
데이터세트는 서브세트 (예를 들어, 이산 또는 중첩), 예컨대 훈련 데이터세트, 발달 데이터세트 및 시험 데이터세트로 분할될 수 있다. 예를 들어, 데이터세트는 데이터세트의 80%를 포함하는 훈련 데이터세트 및 데이터세트의 20%를 포함하는 시험 데이터세트로 분할될 수 있다. 상기 훈련 데이터세트는 데이터세트의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90%를 포함할 수 있다. 상기 발달 데이터세트는 데이터세트의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90%를 포함할 수 있다. 상기 시험 데이터세트는 데이터세트의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 또는 약 90%를 포함할 수 있다. 훈련 세트 (예를 들어, 훈련 데이터세트)는 샘플링의 독립성을 보장하기 위해 하나 이상의 환자 코호트에 상응하는 일련의 데이터의 무작위 샘플링에 의해 선택될 수 있다. 대안적으로, 훈련 세트 (예를 들어, 훈련 데이터세트)는 샘플링의 독립성을 보장하기 위해 하나 이상의 환자 코호트에 상응하는 일련의 데이터의 비례 샘플링에 의해 선택될 수 있다.
모델 예측의 정확도를 개선하고 모델의 과적합(overfitting)을 줄이기 위해, 상기 데이터세트는 훈련 세트 내의 샘플 수를 증가시키기 위해 증강될 수 있다. 예를 들어, 데이터 증강은 훈련 기록에서 관찰의 순서를 재배열하는 것을 포함할 수 있다. 누락된 관측치를 갖는 데이터세트를 수용하기 위해, 포워드-필링(forward-filling), 백-필링(back-filling), 선형 보간, 및 다중-작업 가우시안 프로세스와 같은 누락된 데이터를 대체하는 방법이 사용될 수 있다. 데이터세트는 교란인자(confounding factor)를 제거하기 위해 필터링될 수 있다. 예를 들어, 데이터베이스 내에서, 환자의 서브세트가 제외될 수 있다.
상기 모델은 하나 이상의 신경망, 예컨대 신경망, 컨볼루션 신경망(convolutional neural network, CNN), 심층 신경망(DNN), 순환 신경망(RNN) 또는 심층 RNN을 포함할 수 있다. 상기 순환 신경망은 장단기 메모리(LSTM) 유닛 또는 게이트 순환 유닛(GRU)일 수 있는 유닛을 포함할 수 있다. 예를 들어, 상기 모델은 일련의 입력 특징, 예컨대, 활력 징후 및 기타 측정치, 환자 의료 이력, 및/또는 환자 인구 통계를 갖는 신경망을 포함하는 알고리즘 아키텍처를 포함할 수 있다. 신경망 기술, 예컨대 드롭아웃 또는 정규화는 과적합을 방지하기 위해 모델을 훈련하는 동안 사용될 수 있다. 신경망은 복수의 하위-네트워크를 포함할 수 있으며, 이들 각각은 상이한 유형의 출력 정보의 분류 또는 예측을 생성하도록 구성된다 (예를 들어, 이는 신경망의 전체 출력을 형성하기 위해 결합될 수 있다). 상기 모델은 랜덤 포레스트, 분류 및 회귀 트리, 서포트 벡터 머신, 판별 분석, 회귀 기술, 뿐만 아니라 앙상블 및 이의 그래디언트-부스팅된 변형을 포함하는 통계적 또는 관련된 알고리즘을 대안적으로 활용할 수 있다.
상기 모델이 질병 또는 장애의 분류 또는 예측을 생성할 때, 알림 (예를 들어, 경계경보 또는 알람)이 생성되고, 의료 서비스 제공자, 예컨대 의사, 간호사 또는 병원 내 환자의 치료 팀의 다른 구성원에게 전송될 수 있다. 알림은 자동 전화 통화, 단문 메시지 서비스(SMS) 또는 멀티미디어 메시지 서비스(MMS) 메시지, 이메일 또는 대시보드 내의 경계경보를 통해 전송될 수 있다. 알림은 출력 정보, 예컨대 질병 또는 장애의 예측, 예측된 질병 또는 장애의 가능성, 질병 또는 장애의 예상되는 발병까지의 시간, 가능성 또는 시간의 신뢰 구간, 또는 질병 또는 장애에 대해 권장된 치료 과정을 포함할 수 있다.
상기 모델의 성능을 검증하기 위해, 다른 성능 척도가 생성될 수 있다. 예를 들어, 수신자-작동 곡선 아래 면적(AUROC)은 모델의 진단 능력을 결정하는 데 사용될 수 있다. 예를 들어, 상기 모델은 특이도 및 민감도를 조정 가능 하도록 조절 가능한 분류 임계치를 사용할 수 있으며, 수신자-작동 곡선(ROC)을 사용하여 특이도 및 민감도의 상이한 값에 상응하는 상이한 작동 포인트를 식별할 수 있다.
데이터세트가 충분히 크지 않은 경우와 같은 일부 경우에, 교차-검증은 상이한 훈련 및 시험 데이터세트 전반에 걸쳐 모델의 견고성을 평가하기 위해 수행될 수 있다.
민감도, 특이도, 정확도, 양성 예측 값(PPV), 음성 예측 값(NPV), AUPRC, AUROC 등과 같은 성능 척도를 계산하기 위해 하기 정의가 사용될 수 있다. "거짓 양성"은 양성 결과 또는 결과가 부정확하거나 조기에 (예를 들어, 질병 또는 장애의 실제 발병 전, 또는 임의의 발병 없이) 생성된 결과를 지칭할 수 있다. "진실 양성"은 환자가 질병 또는 장애를 가지고 있을 때, 양성 결과 또는 결과가 정확하게 생성된 결과 (예를 들어, 환자가 질병 또는 장애의 증상을 보이거나, 또는 환자의 기록이 질병 또는 장애를 나타냄)를 지칭할 수 있다. "거짓 음성"은 음성 결과 또는 결과가 생성되었지만, 환자가 질병 또는 장애를 갖는 결과 (예를 들어, 환자가 질병 또는 장애의 증상을 보이거나, 또는 환자의 기록이 질병 또는 장애를 나타냄)를 지칭할 수 있다. "진실 음성"은 음성 결과 또는 결과가 (예를 들어, 질병 또는 장애의 실제 발병 전, 또는 임의의 발병 없이) 생성된 결과를 지칭할 수 있다.
상기 모델은 진단 정확도 측정치에 상응하는 최소한의 원하는 값을 갖는 것과 같이 정확도 또는 성능에 대한 특정의 사전-결정된 병태가 충족될 때까지 훈련될 수 있다. 예를 들어, 진단 정확도 측정치는 대상체에서 질병 또는 장애의 발생 가능성의 예측에 상응할 수 있다. 또 다른 예로서, 진단 정확도 측정치는 대상체가 이전에 치료받은 질병 또는 장애의 악화 또는 재발 가능성의 예측에 상응할 수 있다. 진단 정확도 측정치의 예에는 질병 또는 장애를 검출하거나 예측하는 진단 정확도에 상응하는 민감도, 특이도, 양성 예측 값(PPV), 음성 예측 값(NPV), 정확도, 정밀도-재현율 곡선 아래 면적(AUPRC) 및 수신자 작동 특성(ROC) 곡선(AUROC)의 곡선 아래 면적(AUC)이 포함될 수 있다.
예를 들어, 이러한 사전-결정된 병태는 질병 또는 장애를 예측하는 민감도가 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 사전-결정된 병태는 질병 또는 장애를 예측하는 특이도가 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 사전-결정된 병태는 질병 또는 장애를 예측하는 양성 예측 값(PPV)이 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 사전-결정된 병태는 질병 또는 장애를 예측하는 음성 예측 값(NPV)이 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 사전-결정된 병태는 질병 또는 장애를 예측하는 수신자 작동 특성(ROC) 곡선(AUROC)의 곡선 아래 면적(AUC)이 적어도 약 0.50, 적어도 약 0.55, 적어도 약 0.60, 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.85, 적어도 약 0.90, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 또는 적어도 약 0.99의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 사전-결정된 병태는 질병 또는 장애를 예측하는 정밀도-재현율 곡선 아래 면적(area under the precision-recall curve, AUPRC)이 적어도 약 0.10, 적어도 약 0.15, 적어도 약 0.20, 적어도 약 0.25, 적어도 약 0.30, 적어도 약 0.35, 적어도 약 0.40, 적어도 약 0.45, 적어도 약 0.50, 적어도 약 0.55, 적어도 약 0.60, 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.85, 적어도 약 0.90, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 또는 적어도 약 0.99의 값을 포함하는 것일 수 있다.
일부 구현예에서, 상기 모델은 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 민감도로 질병 또는 장애를 예측하도록 훈련되거나 구성될 수 있다.
일부 구현예에서, 상기 모델은 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 특이도로 질병 또는 장애를 예측하도록 훈련되거나 구성될 수 있다.
일부 구현예에서, 상기 모델은 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 양성 예측 값(PPV)으로 질병 또는 장애를 예측하도록 훈련되거나 구성될 수 있다.
일부 구현예에서, 상기 모델은 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 음성 예측 값(NPV)으로 질병 또는 장애를 예측하도록 훈련되거나 구성될 수 있다.
일부 구현예에서, 상기 훈련된 모델은 적어도 약 0.50, 적어도 약 0.55, 적어도 약 0.60, 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.85, 적어도 약 0.90, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 또는 적어도 약 0.99의 수신자 작동 특성(ROC) 곡선(AUROC)의 곡선 아래 면적(AUC)으로 질병 또는 장애를 예측하도록 훈련되거나 구성될 수 있다.
일부 구현예에서, 상기 모델은 적어도 약 0.10, 적어도 약 0.15, 적어도 약 0.20, 적어도 약 0.25, 적어도 약 0.30, 적어도 약 0.35, 적어도 약 0.40, 적어도 약 0.45, 적어도 약 0.50, 적어도 약 0.55, 적어도 약 0.60, 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.85, 적어도 약 0.90, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 또는 적어도 약 0.99의 정밀도-재현율 곡선 아래 면적(AUPRC)으로 질병 또는 장애를 예측하도록 훈련되거나 구성될 수 있다.
상기 훈련 데이터 세트는 훈련 대상체 (예를 들어, 인간)으로부터 수집될 수 있다. 각각의 훈련은 이들이 생물학적 병태로 진단되었거나, 또는 생물학적 병태로 진단되지 않았음을 나타내는 진단 상태를 갖는다. 일부 구현예에서, 훈련 대상체는 5세 또는 그 이하 (예를 들어, 5세, 4세, 3세, 2세, 1세, 9개월령, 6개월령, 3개월령 또는 1개월령, 또는 그 이하)의 아동이다. 복수의 훈련 대상체 중 각각의 훈련 대상체에 대해 하기의 훈련 절차가 수행될 수 있다.
일부 구현예에서, 훈련 데이터 (예를 들어, 동적 IHC 데이터)는 훈련 대상체의 생물학적 샘플로부터 생성될 수 있다. 각각의 생물학적 샘플의 경우, 상기 훈련 대상체의 생물학적 샘플에 대한 참조선의 복수의 위치가 이로부터 측정치를 생성하기 위해 샘플링될 수 있으며, 이에 따라 복수의 동적 생물학적 반응 샘플을 획득할 수 있다. 상기 상응하는 복수의 동적 생물학적 반응 샘플에서 각각의 동적 생물학적 반응 샘플은 상응하는 복수의 위치에서 상이한 위치에 상응하고, 상응하는 복수의 위치에서 각각의 위치는 상응하는 생물학적 샘플의 상이한 성장 기간을 나타낸다. 다음으로, 생물학적 샘플의 각각의 개별적인 위치를 분석하여 (예를 들어, 레이저 절제-유도 결합 플라즈마-질량 분광계(LA-ICP-MS), 형광 이미지 센서 또는 라만 분광계를 사용하여) 복수의 트레이스를 획득한다. 상응하는 복수의 트레이스에서의 각각의 트레이스는, 상기 상응하는 복수의 동적 생물학적 반응 샘플로부터 시간 경과에 따라 집합적으로 결정되는, 상응하는 물질의 존재비 측정치에 상응한다.
다음으로, 개별적인 제2 데이터세트는 상응하는 일련의 특징을 측정하기 위해 상응하는 복수의 트레이스에 대한 재발 정량화 분석(RQA) 또는 관련 방법의 적용을 통해 획득될 수 있으며, 상기 상응하는 일련의 특징에서 각각의 개별적인 특징은 상응하는 복수의 트레이스에서 하나 이상의 물질의 존재비의 변화에 의해 결정된다.
다음으로, 훈련되지 않은 또는 부분적으로 훈련되지 않은 모델은 (i) 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 각각의 개별적인 제2 데이터세트의 상응하는 일련의 특징 및 (ii) 제1 진단 상태 및 제2 진단 상태 중에서 선택되는, 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 상응하는 진단 상태로 생성될 수 있고, 이에 따라 훈련된 모델을 획득할 수 있다. 상기 훈련된 모델은 시험 대상체의 생물학적 샘플로부터 획득된 일련의 특징에서 특징에 대한 값에 기초하여 시험 대상체가 제1 생물학적 병태를 갖는지의 여부에 관한 지표를 제공한다. 일부 구현예에서, 상기 훈련된 모델은 신경망 알고리즘, 컨볼루션 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 모델 알고리즘, 지도 클러스터링 모델 알고리즘, 회귀 모델 또는 이들의 임의의 조합 또는 변형이며, 특히 기술된 알고리즘의 그래디언트-부스팅 구현, 예를 들어, 그래디언트-부스팅된 결정 트리를 포함한다. 일부 구현예에서, 상기 훈련된 모델은 다항 또는 이항 분포에 대한 결과를 예측한다. 일부 구현예에서, 상기 훈련된 모델은 샘플이 제1 생물학적 병태를 가진 대상체로부터 도출되었는지 여부에 대한 이항 예측을 만드는 데 사용될 수 있으며; 또는, 진단하지 않은 대상체와 제1 생물학적 병태 또는 제2 생물학적 병태를 가진 대상체를 구별하는 다항일 수 있으며, 여기서 제2 생물학적 병태는 제1 생물학적 병태와 구별된다.
일부 구현예에서, 상기 모델은 신경망 또는 컨볼루션 신경망이다. Vincent 등, 2010, "Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion," J Mach Learn Res 11, pp. 3371-3408; Larochelle 등, 2009, "Exploring strategies for training deep neural networks," J Mach Learn Res 10, pp. 1-40; 및 Hassoun, 1995, Fundamentals of Artificial Neural Networks, Massachusetts Institute of Technology를 참조하고, 이들 각각은 본원에 참조로 포함된다.
SVM은 Cristianini 및 Shawe-Taylor, 2000, "An Introduction to Support Vector Machines," Cambridge University Press, Cambridge; Boser 등, 1992, "A training algorithm for optimal margin classifiers," in Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory, ACM Press, Pittsburgh, Pa., pp. 142-152; Vapnik, 1998, Statistical Learning Theory, Wiley, New York; Mount, 2001, Bioinformatics: sequence and genome analysis, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; Duda, Pattern Classification, Second Edition, 2001, John Wiley & Sons, Inc., pp. 259, 262-265; 및 Hastie, 2001, The Elements of Statistical Learning, Springer, New York; 및 Furey 등, 2000, Bioinformatics 16, 906-914에 기술되며, 이들 각각은 그 전체가 본원에 참조로 포함된다. 분류에 사용되는 경우, SVM은 라벨링된 데이터로부터 최대로 떨어져 있는 초평면(hyper-plane)과 주어진 일련의 이항 라벨링된 데이터를 분리한다. 선형 분리가 가능하지 않은 경우, SVM은 '커널'의 기술과 조합하여 작동할 수 있으며, 이는 특징 공간에 대한 비-선형 매핑을 자동으로 실현한다. 특징 공간에서 SVM에 의해 확인된 초평면은 입력 공간에서 비-선형 결정 경계에 상응한다.
결정 트리는 일반적으로 Duda, 2001, Pattern Classification, John Wiley & Sons, Inc., New York, pp. 395-396에 의해 기술되며, 이는 본원에 참조로 포함된다. 트리-기반 방법은 특징 공간을 일련의 직사각형으로 분할하고, 이후 각각의 것에서 (상수와 같은) 모델에 적합화한다. 일부 구현예에서, 결정 트리는 랜덤 포레스트 회귀이다. 사용될 수 있는 하나의 특정 알고리즘은 분류 및 회귀 트리(CART)이다. 다른 특정 결정 트리 알고리즘은 ID3, C4.5, MART 및 랜덤 포레스트를 포함하지만, 이에 제한되지는 않는다. CART, ID3 및 C4.5는 Duda, 2001, Pattern Classification, John Wiley & Sons, Inc., New York. pp. 396-408 및 pp. 411-412에 기술되어 있으며, 이는 그 전체가 본원에 참조로 포함된다. CART, MART 및 C4.5는 Hastie 등, 2001, The Elements of Statistical Learning, Springer-Verlag, New York, Chapter 9에 기술되어 있으며, 이는 본원에 참조로 포함된다. 랜덤 포레스트는 Breiman, 1999, "Random Forests-Random Features," Technical Report 567, Statistics Department, U.C. Berkeley, September 1999에 기술되어 있으며, 이는 그 전체가 본원에 참조로 포함된다.
클러스터링 (예를 들어, 비지도 클러스터링 모델 알고리즘 및 지도 클러스터링 모델 알고리즘)은 Duda 및 Hart, Pattern Classification and Scene Analysis, 1973, John Wiley & Sons, Inc., New York (이하 "Duda 1973")의 211-256 페이지에 기술되어 있으며, 이는 그 전체가 본원에 참조로 포함된다. Duda 1973의 섹션 6.7에 기술된 바와 같이, 클러스터링 문제는 데이터세트에서 자연적인 그룹화를 발견하는 것 중 하나로서 기술된다. 자연적인 그룹화를 식별하기 위해, 2가지 사안이 다루어진다. 첫째, 2개의 샘플 간의 유사성 (또는 부동성)을 측정하는 방식이 결정된다. 이러한 계측 (유사성 측정)은 하나의 클러스터의 샘플이 다른 클러스터의 샘플에 대한 것보다 서로 더 유사하다는 것을 보장하는 데 사용된다. 둘째, 유사성 측정을 사용하여 데이터를 클러스터로 분할하기 위한 메커니즘이 결정된다. 유사성 측정은 Duda 1973의 섹션 6.7에서 논의되며, 여기서 클러스터링 조사를 시작하는 하나의 방식은 거리 함수를 정의하고 훈련 세트의 모든 샘플 쌍 간의 거리의 행렬을 계산하는 것이라고 명시되어 있다. 거리가 유사성의 양호한 척도인 경우, 이후 동일한 클러스터에서 참조 엔티티 간의 거리는 상이한 클러스터에서 참조 엔티티 간의 거리보다 현저하게 작을 것이다. 그러나, Duda 1973의 215 페이지에 명시된 바와 같이, 클러스터링은 거리 계측의 사용을 필요로 하지 않는다. 예를 들어, 비계측 유사성 함수 s(x, x')를 사용하여 2개의 벡터 x 및 x'를 비교할 수 있다. 통상적으로, s(x, x')는 x 및 x'가 다소 "유사한" 경우에 이의 값이 큰 대칭 함수이다. 비계측(nonmetric) 유사성 함수 s(x, x')의 예는 Duda 1973의 218 페이지에 제공된다. 데이터세트의 포인트 간의 "유사성" 또는 "부동성"을 측정하기 위한 방법이 선택되었으면, 클러스터링은 데이터의 임의의 분할의 클러스터링 품질을 측정하는 기준 함수를 필요로 한다. 기준 함수를 극단화하는 데이터 세트의 분할은 데이터를 클러스터링하는 데 사용된다. Duda 1973의 217 페이지를 참조한다. Duda 1973의 섹션 6.8에 기준 함수가 논의되어 있다. 보다 최근에, Duda 등, Pattern Classification, 2nd edition, John Wiley & Sons, Inc. New York에 공개되었다. 537-563 페이지에서는 클러스터링이 상세하게 기술되어 있다. 클러스터링 기술에 대한 더 많은 정보는 Kaufman 및 Rousseeuw, 1990, Finding Groups in Data: An Introduction to Cluster Analysis, Wiley, New York, N.Y.; Everitt, 1993, Cluster analysis (3d ed.), Wiley, New York, N.Y.; 및 Backer, 1995, Computer-Assisted Reasoning in Cluster Analysis, Prentice Hall, Upper Saddle River, New Jersey에서 확인할 수 있으며, 이들 각각은 본원에 참조로 포함된다. 본 개시내용에서 사용될 수 있는 특정 예시적인 클러스터링 기술은 계층적 클러스터링(최근접-이웃 알고리즘, 최원접-이웃 알고리즘, 평균 연결 알고리즘, 중심 알고리즘 또는 제곱합 알고리즘을 사용한 응집형 클러스터링), k-평균 클러스터링, 퍼지 k-평균 클러스터링 알고리즘 및 자비스-패트릭(Jarvis-Patrick) 클러스터링을 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 상기 클러스터링은 훈련 세트가 클러스터링되는 것이 부과될 때 어떤 클러스터가 형성되어야 하는지에 대한 선입견이 없는 비지도 클러스터링을 포함한다.
다중-범주 로짓 모델(multi-category logit model)과 같은 회귀 모델은 Agresti, An Introduction to Categorical Data Analysis, 1996, John Wiley & Sons, Inc., New York, Chapter 8에 기술되어 있으며, 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 상기 모델은 Hastie 등, 2001, The Elements of Statistical Learning, Springer-Verlag, New York에 개시된 회귀자를 이용하며, 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 그래디언트-부스팅 모델은 예를 들어, 본원에 기술된 분류 알고리즘에 대해 사용되며; 이러한 그래디언트-부스팅 모델은 Boehmke, Bradley; Greenwell, Brandon (2019)에 기술되어 있다. "Gradient Boosting". Hands-On Machine Learning with R. Chapman & Hall. pp. 221-245. ISBN 978-1-138-49568-5., 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 앙상블 모델링 기술은 예를 들어, 본원에 기술된 분류 알고리즘에 대해 사용되며; 본원의 분류 모델의 구현에 기술되어 있는 이러한 앙상블 모델링 기술은 Zhou Zhihua(2012)에 기술되어 있다. Ensemble Methods: Foundations and Algorithms. Chapman and Hall/CRC. ISBN 978-1-439-83003-1, 이는 그 전체가 본원에 참조로 포함된다.
일부 구현예에서, 모델은 데이터 분석을 수행하기 위한 명령을 포함하는 하나 이상의 프로그램 (예를 들어, 도 1의 비영구 메모리(111) 또는 영구 메모리(112)에 저장된 하나 이상의 프로그램)을 실행하는 장치에 의해 수행된다. 일부 구현예에서, 데이터 분석은 적어도 하나의 프로세서 (예를 들어, 프로세싱 코어(102)) 및 데이터 분석을 수행하기 위한 명령을 포함하는 메모리 (예를 들어, 비영구 메모리(111) 또는 영구 메모리(112)에 저장된 하나 이상의 프로그램)를 포함하는 시스템에 의해 수행된다.
컴퓨터 시스템
본 개시내용은 본 개시내용의 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 도 4는 예를 들어, 치아 샘플을 염색하고, 염색된 치아 샘플의 형광 이미지를 획득하고, 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하고, 염증의 시간적 프로파일을 생성하고, 훈련된 모델을 사용하여 데이터를 처리하고, 대상체의 질병 또는 장애의 위험을 결정하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템(401)을 보여준다. 컴퓨터 시스템(401)은 예를 들어, 치아 샘플을 염색하는 것, 염색된 치아 샘플의 형광 이미지를 획득하는 것, 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하는 것, 염증의 시간적 프로파일을 생성하는 것, 시간적 프로파일의 역학을 측정하는 것, 훈련된 모델을 사용하여 데이터를 처리하고, 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 것과 같은 본 개시내용의 센서 데이터 분석의 다양한 측면을 조절할 수 있다. 컴퓨터 시스템(401)은 사용자의 전자 장치 또는 전자 장치에 대해 원격 위치에 있는 컴퓨터 시스템일 수 있다. 전자 장치는 모바일 전자 장치일 수 있다.
상기 컴퓨터 시스템(401)은 중앙 프로세싱 유닛(CPU, 또한 본원의 "프로세서" 및 "컴퓨터 프로세서")(405)를 포함하며, 이는 단일 코어 또는 멀티 코어 프로세서 또는 병렬 프로세싱을 위한 복수의 프로세서일 수 있다. 컴퓨터 시스템(401)은 또한 메모리 또는 메모리 위치(410)(예를 들어, 랜덤-액세스 메모리, 판독-전용 메모리, 플래시 메모리), 전자 저장 유닛(415)(예를 들어, 하드 디스크), 하나 이상의 다른 시스템과 통신하기 위한 통신 인터페이스(420)(예를 들어, 네트워크 어댑터), 및 주변 장치(425), 예컨대 캐시(cache), 기타 메모리, 데이터 저장 및/또는 전자 디스플레이 어댑터를 포함한다. 메모리(410), 저장 유닛(415), 인터페이스(420) 및 주변 장치(425)는 통신 버스(실선), 예컨대 마더보드를 통해 CPU(405)와 통신한다. 저장 유닛(415)은 데이터를 저장하기 위한 데이터 저장 유닛 (또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(401)은 통신 인터페이스(420)의 도움으로 컴퓨터 네트워크("네트워크")(430)에 작동가능하게 결합될 수 있다. 네트워크(430)는 인터넷, 인터넷 및/또는 엑스트라넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라넷일 수 있다. 일부 경우에, 네트워크(430)는 통신 및/또는 데이터 네트워크이다. 네트워크(430)는 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있는 하나 이상의 컴퓨터 서버를 포함할 수 있다. 일부 경우에, 컴퓨터 시스템(401)의 도움으로 네트워크(430)는 피어-투-피어(peer-to-peer) 네트워크를 구현할 수 있으며, 이는 컴퓨터 시스템(401)에 결합된 장치가 클라이언트 또는 서버로 작동하도록 할 수 있다.
상기 CPU(405)는 프로그램 또는 소프트웨어로 구현될 수 있는 머신-판독가능 명령의 시퀀스를 실행할 수 있다. 상기 명령은 메모리(410)와 같은 메모리 위치에 저장될 수 있다. 상기 명령은 CPU(405)로 지시될 수 있으며, 이는 본 개시내용의 방법을 구현하기 위해 CPU(405)를 후속적으로 프로그래밍하거나 또는 그렇지 않으면 구성할 수 있다. 상기 CPU(405)에 의해 수행되는 작동의 예는 페치(fetch), 디코딩, 실행 및 후기록(writeback)을 포함할 수 있다.
상기 CPU(405)는 집적 회로와 같은 회로의 일부일 수 있다. 시스템(401)의 하나 이상의 다른 컴포넌트가 회로에 포함될 수 있다. 일부 경우에, 상기 회로는 주문형 집적 회로(ASIC, application specific integrated circuit)이다.
저장 유닛(415)은 드라이버, 라이브러리 및 저장된 프로그램과 같은 파일을 저장할 수 있다. 저장 유닛(415)은 사용자 데이터, 예를 들어, 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 일부 경우에, 컴퓨터 시스템(401)은 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(401)과 통신하는 원격 서버 상에 위치되는 것과 같은, 컴퓨터 시스템(401) 외부에 있는 하나 이상의 추가 데이터 저장 유닛을 포함할 수 있다.
컴퓨터 시스템(401)은 네트워크(430)를 통해 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예를 들어, 컴퓨터 시스템(401)은 사용자(예를 들어, 의료 서비스 제공자)의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예는 개인용 컴퓨터(예를 들어, 휴대용 PC), 슬레이트 또는 태블릿 PC(예를 들어, 애플® iPad, 삼성® 갤럭시 탭), 전화, 스마트폰(예를 들어, 애플® iPhone, 안드로이드-이용가능한 장치, 블랙베리®), 또는 개인용 디지털 보조기를 포함한다. 사용자는 네트워크(430)를 통해 컴퓨터 시스템(401)에 액세스할 수 있다.
본원에 기술된 바와 같은 방법은 예를 들어, 메모리(410) 또는 전자 저장 유닛(415)과 같은 컴퓨터 시스템(401)의 전자 저장 위치에 저장된 머신(예를 들어, 컴퓨터 프로세서) 실행가능 코드를 통해 구현될 수 있다. 머신 실행가능 또는 머신-판독가능 코드는 소프트웨어의 형태로 제공될 수 있다. 사용 동안, 코드는 프로세서(405)에 의해 실행될 수 있다. 일부 경우에, 코드는 저장 유닛(415)으로부터 검색될 수 있고, 프로세서(405)에 의한 액세스 준비를 위해 메모리(410) 상에 저장될 수 있다. 일부 상황에서, 전자 저장 유닛(415)은 배제될 수 있으며, 머신-실행가능 명령은 메모리(410) 상에 저장된다.
상기 코드는 코드를 실행하도록 조정된 프로세서를 갖는 머신과 함께 사용하기 위해 미리-컴파일되고(pre-compiled) 구성될 수 있거나, 또는 실행 시간(runtime) 동안 컴파일될 수 있다. 상기 코드는 미리-컴파일되거나 또는 컴파일된 방식으로 코드를 실행할 수 있도록 선택할 수 있는 프로그래밍 언어로 공급될 수 있다.
컴퓨터 시스템(401)과 같은 본원에 제공된 시스템 및 방법의 측면은 프로그래밍에 구현될 수 있다. 상기 기술의 다양한 측면은 전형적으로 머신 (또는 프로세서) 실행가능 코드 및/또는 머신 판독가능 매체의 유형에 수반되거나 구현되는 관련 데이터의 형태인 "제품" 또는 "제조 물품"으로 간주될 수 있다. 머신-실행가능 코드는 전자 저장 유닛, 예컨대 메모리 (예를 들어, 판독-전용 메모리, 랜덤-액세스 메모리, 플래시 메모리) 또는 하드 디스크 상에 저장될 수 있다. "스토리지(storage)" 유형 매체는 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등과 같은 컴퓨터, 프로세서 등의 유형의 메모리 또는 이의 관련 모듈 중 임의 또는 전부를 포함할 수 있으며, 이는 소프트웨어 프로그래밍을 위해 언제든지 비-일시적 스토리지를 제공할 수 있다. 소프트웨어의 전부 또는 일부는 때때로 인터넷 또는 다양한 다른 통신 네트워크를 통해 통신될 수 있다. 이러한 통신은, 예를 들어, 하나의 컴퓨터 또는 프로세서로부터 다른 것으로, 예를 들어, 관리 서버 또는 호스트 컴퓨터로부터 응용 서버의 컴퓨터 플랫폼으로 소프트웨어의 로딩을 가능하게 할 수 있다. 따라서, 소프트웨어 요소를 지닐 수 있는 다른 유형의 매체는 유선 및 광 유선 네트워크를 통해 그리고 다양한 에어-링크를 통해 로컬 장치 간의 물리적 인터페이스 전반에 걸쳐 사용되는 것과 같은 광학, 전기 및 전자기파를 포함한다. 유선 또는 무선 링크, 광학 링크 등과 같은 해당 파동을 전달하는 물리적 요소는, 또한 소프트웨어를 지닌 매체로 간주될 수 있다. 본원에 사용된 바와 같이, 비-일시적, 유형의 "저장" 매체에 제한되지 않는 한, 컴퓨터 또는 머신 "판독가능 매체"와 같은 용어는 실행을 위해 프로세서에 명령을 제공하는 데 참여하는 임의의 매체를 지칭한다.
따라서, 컴퓨터-실행가능 코드와 같은 머신 판독가능 매체는 유형의 저장 매체, 반송파 매체 또는 물리적 전송 매체를 포함하지만 이에 제한되지 않는 많은 형태를 취할 수 있다. 비휘발성 저장 매체는 예를 들어, 도면에 도시된 데이터베이스 등을 구현하는 데 사용될 수 있는 임의의 컴퓨터 등에 있는 임의의 저장 장치와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 저장매체는 이러한 컴퓨터 플랫폼의 메인 메모리와 같은 동적 메모리를 포함한다. 유형의 전송 매체는 동축 케이블; 컴퓨터 시스템 내의 버스를 구성하는 전선을 포함하는 구리 전선 및 광섬유를 포함한다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 동안 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서, 컴퓨터-판독가능 매체의 공통 형태는 예를 들어 다음을 포함한다: 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드 종이 테이프, 구멍 패턴이 있는 임의의 다른 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 판독할 수 있는 임의의 다른 매체. 이러한 형태의 컴퓨터 판독가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서로 전달하는 데 관여할 수 있다.
컴퓨터 시스템(401)은 예를 들어, 형광 이미지 데이터, 형광 강도 데이터, 염증의 시간적 프로파일 및 머신 러닝 분류를 제공하기 위한 사용자 인터페이스(UI)(440)를 포함하는 전자 디스플레이(435)를 포함하거나 이와 통신할 수 있다. UI의 예는 제한 없이, 그래픽 사용자 인터페이스(GUI) 및 웹-기반 사용자 인터페이스를 포함한다.
본 개시내용의 방법 및 시스템은 하나 이상의 알고리즘을 통해 구현될 수 있다. 알고리즘은 중앙 프로세싱 유닛(405)에 의해 실행시 소프트웨어를 통해 구현될 수 있다. 알고리즘은 예를 들어, 치아 샘플을 염색하고, 염색된 치아 샘플의 형광 이미지를 획득하고, 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하고, 염증의 시간적 프로파일을 생성하고, 훈련된 모델을 사용하여 데이터를 처리하고, 대상체의 질병 또는 장애의 위험을 결정할 수 있다.
본원의 다른 곳에서 기술된 방법이 구현예에 따른 단계 또는 일련의 작동을 나타내지만, 당업자는 본원에 기술된 교시에 기초하여 많은 변형을 인식할 것이다. 상기 단계는 다른 순서로 완료될 수 있다. 단계는 추가되거나 생략될 수 있다. 일부 단계는 하위 단계를 포함할 수 있다. 여러 단계는 유익한 만큼 자주 반복될 수 있다.
각각의 방법 또는 일련의 작동의 단계 중 하나 이상은 본원에 기술된 바와 같은 회로, 예를 들어, 필드 프로그램 가능 게이트 어레이를 위한 프로그램 가능 어레이 로직과 같은 프로세서 또는 로직 회로 중 하나 이상을 사용하여 수행될 수 있다. 회로는 각각의 방법 또는 일련의 작동의 단계 중 하나 이상을 제공하도록 프로그래밍될 수 있으며, 상기 프로그램은 컴퓨터 판독가능 메모리에 저장된 프로그램 명령 또는 예를 들어, 프로그래밍 가능 어레이 로직 또는 필드 프로그래밍 가능 게이트 어레이과 같은 로직 회로의 프로그래밍된 단계를 포함할 수 있다.
실시예
실시예 1: 질병 위험을 결정하기 위한 치아 샘플의 동적 분자 프로파일
본 개시내용의 방법 및 시스템을 사용하여, 치아 샘플의 분자 프로파일을 생성하고 후속적으로 분석하여 대상체의 질병 위험을 결정하였다. 일반적으로, 생물학적 반응(예를 들어, 염증)의 시간적 역학은 샘플(예를 들어, 치아 샘플)에 각인되는 것으로 밝혀졌으며, 대상체의 질병 위험을 결정하기 위해 분석될 수 있다. 동적 분자 프로파일은 염증의 마커인 C-반응성 단백질(CRP)에 대해 생성되었다. 치아 바이오마커를 사용하여, 두 세트의 아동-자폐 스펙트럼 장애가 있는 제1 세트(37 사례) 및 자폐 스펙트럼 장애가 없는 제2 세트(대조군 77 사례)에서 태아(출생전) 발달 및 유아기를 포함하는 기간 동안 CRP 및 염증의 동적 시계열 프로파일을 생성하였다. 시계열 CRP 프로파일을 분석하여 CRP 신호 역학의 새로운 특징을 밝혀냈으며, 이는 자폐증 사례와 대조군을 정확하게 구별하였다. 예를 들어, 1세 이전에 존재했던 염증 프로파일은 사례와 대조군 간에 큰 차이가 있었다. 이에 비해, 자폐증의 임상적 진단은 일반적으로 약 3 내지 4세에 결정된다.
유치 샘플은 각각의 아동 대상체로부터 획득하였다. 치아 샘플을 개방 절편화하고, 탈석회화하고 면역조직화학 염색(예를 들어, 상아질)을 치아 샘플에 적용하였다. 면역조직화학 염색은 출생전 및 출생후 기간에 걸쳐 염증의 시간적 프로파일을 개발하기 위해 치아 샘플의 성장 고리를 따라 C-반응성 단백질(염증의 분자 마커)을 효과적으로 매핑하였다. 질병 위험(예를 들어, 자폐증)을 결정하기 위해 고도로 정확한 모델을 훈련하기 위해 본 개시내용의 머신 러닝 알고리즘을 사용하여 시간적 프로파일을 분석하였다.
도 5는 시간 경과에 따른 대상체의 일일 C-반응성 단백질 프로파일의 예를 보여주며, 여기서 y-축은 CRP 강도를 나타내고 x-축은 발달 연령을 나타낸다. 아동 대상체의 발달 연령은 임신 중기(second trimester) (예를 들어, 출생 전 140일, 대상체가 태아기(prenatal stage)에 있을 때부터 시작)부터 약 6개월령 범위까지의 기간을 포함하였다. 도 5에 나타낸 바와 같이, 자폐증이 있는 아동의 경우 (CRP 강도로 나타낸 바와 같은) 염증 프로파일이 출생전에 더 높은 것으로 관찰되었다.
도 6a-6b는 출생전 및 유아기(예를 들어, 최대 1세)에 샘플링된 C-반응성 단백질 프로파일의 재발 정량화 분석으로부터 도출된 특징을 이용하여 다양한 예측 임계치에서 자폐증을 진단하는 방법의 민감도 및 특이도를 특성화하기 위한 수신자 작동 특성(ROC) 곡선을 나타낸다. 도 6a는 자폐 스펙트럼 장애에 대한 대상체를 평가하는 개시된 방법의 정확도를 평가하기 위한 실험적 수신자 작동 특성(ROC) 곡선을 보여준다. ROC 곡선은 이항 분류자의 성능을 평가하는 데 사용될 수 있다. ROC 곡선은 특이도(진음성률로도 칭해짐)에 대한 민감도(진양성률로도 칭해짐)로 플롯팅된다. 완벽한 분류자는 100% 민감도와 100% 특이도 및 1.0의 곡선 아래 면적(AUC)을 가질 수 있다. 도 6a에 나타낸 바와 같이, 동적 C-반응성 단백질 프로파일에 기초하여 대상체에서 자폐증의 존재를 결정하도록 구성된 분류자는 0.72 내지 1.00의 95% 신뢰 구간(CI)과 더불어 0.86의 수신자 작동 특성 (ROC)의 곡선 아래 면적(AUC)을 가졌다. 수신자 작동 특성 (ROC)은 사례 상태의 예측된 확률에 더 높거나 더 낮은 임계치가 적용됨에 따라 분류자의 민감도 및 특이도 값이 어떻게 변하는지 보여주며; 더 낮은 임계치는 예를 들어, 보다 민감한 분류를 산출할 것이지만, 이에 상응하게 덜 특정적일 것이다. 도 6b에 나타낸 바와 같이, (예를 들어, 수치적 특징 가중치로 표시된 바와 같은) 특징 중요도의 내림차순으로 순위가 매겨진 분류자 성능에 기여하는 주요 동적 특징에는 층류성, 엔트로피, TT, MDL, RT1, RT2, Vmax, 결정론 및 Lmax가 포함된다. 예를 들어, 층류성은 다른 것들보다 더 높은 특징 중요도를 갖는 것으로 결정되었다.
따라서, 본 개시내용의 방법 및 시스템을 사용한 C-반응성 단백질 프로파일의 분석으로부터 도출된 특징의 분석은 아동 대상체로부터 비침습적으로 수득된 생물학적 샘플(예를 들어, 치아 샘플)에서 측정된 C-반응성 단백질 시그니처 분석으로부터 도출된 특징만을 사용하여, 0.86의 AUC로 자폐증의 질병 위험을 성공적으로 결정하였다. 이러한 결과는 어린 시절의 염증 반응의 역학이 이후의 질병과 연결되어 있으며, 이는 본 개시내용의 방법 및 시스템을 사용하여 정확하게 검출되고 프로파일링될 수 있음을 입증한다.
본 발명의 바람직한 구현예가 본원에 도시되고 기술되었지만, 이는 이러한 구현예가 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명이 명세서 내에 제공된 특정 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 기술되었지만, 본원의 구현예의 설명 및 예시는 제한적인 의미로 해석되는 것을 의미하지 않는다. 이제 본 발명을 벗어나지 않고 당업자에게 수많은 변형, 변경 및 대체가 일어날 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 의존하는 본원에 제시된 특정 묘사, 구성 또는 상대적인 비율에 제한되지 않는다는 것을 이해해야 한다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 이러한 임의의 대안, 변형, 변경 또는 등가물도 포함해야 한다는 것이 고려된다. 하기 청구범위는 본 발명의 범위를 정의하며, 이들 청구범위 및 이들의 등가물 범위 내의 방법 및 구조가 이에 포함되도록 의도된다.
구현예
구현예 1. 질병 또는 장애에 대한 대상체의 진단 상태를 예측하기 위한 방법으로서, (a) 대상체의 치아 샘플을 염색하여 염색된 치아 샘플을 생성하는 단계; (b) 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하는 단계; 및 (c) 형광 강도의 분석에 적어도 부분적으로 기초하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계:를 포함하는 방법.
구현예 2. 구현예 1에 있어서, 상기 분석하는 단계는 염색된 치아 샘플의 형광 이미지를 획득하는 단계 및 상기 형광 이미지의 형광 강도를 분석하는 단계를 포함하는, 방법.
구현예 3. 구현예 2에 있어서, 상기 염색된 치아 샘플의 형광 이미지를 획득하는 단계는 도립 또는 비-도립 공초점 현미경을 사용하는 것을 포함하는, 방법.
구현예 4. 구현예 1 내지 3 중 어느 한 구현예에 있어서, 상기 치아 샘플을 염색하는 단계는 C-반응성 단백질 면역조직화학 염색을 사용하는 것을 포함하는, 방법.
구현예 5. 구현예 1 내지 4 중 어느 한 구현예에 있어서, 치아 샘플을 절편화하는 단계를 추가로 포함하는, 방법.
구현예 6. 구현예 1 내지 5 중 어느 한 구현예에 있어서, 상기 치아 샘플을 염색하는 단계는 치아 샘플을 탈석회화하는 단계를 포함하는, 방법.
구현예 7. 구현예 1 내지 6 중 어느 한 구현예에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함하는, 방법.
구현예 8. 구현예 1 내지 6 중 어느 한 구현예에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애를 포함하는, 방법.
구현예 9. 구현예 1 내지 8 중 어느 한 구현예에 있어서, 상기 대상체는 인간인, 방법.
구현예 10. 구현예 9에 있어서, 상기 대상체는 12세 미만인, 방법.
구현예 11. 구현예 9에 있어서, 상기 대상체는 1세 미만인, 방법.
구현예 12. 구현예 1 내지 11 중 어느 한 구현예에 있어서, 상기 분석하는 단계는 형광 강도에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계 및 염증의 시간적 프로파일을 분석하는 단계를 포함하는, 방법.
구현예 13. 구현예 12에 있어서, 상기 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응하는 것인, 방법.
구현예 14. 구현예 1 내지 13 중 어느 한 구현예에 있어서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 형광 강도를 처리하는 단계를 포함하는, 방법.
구현예 15. 구현예 14에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
구현예 16. 구현예 14에 있어서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함하는, 방법.
구현예 17. 구현예 14에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성되는 것인, 방법.
구현예 18. 구현예 17에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간 (TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성되는 것인, 방법.
구현예 19. 구현예 18에 있어서, 상기 훈련된 모델은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
구현예 20. 구현예 18에 있어서, 상기 훈련된 모델은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
구현예 21. 구현예 18에 있어서, 상기 훈련된 모델은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
구현예 22. 구현예 18에 있어서, 상기 훈련된 모델은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
구현예 23. 구현예 18에 있어서, 상기 훈련된 모델은 적어도 약 0.80의 수신자 작동 특성 아래 면적(AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
구현예 24. 하나 이상의 프로세서, 및 상기 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 포함하는 장치로서, 상기 하나 이상의 프로그램은 하기에 대한 명령을 포함하는 것인, 장치: (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; (c) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (d) 훈련된 모델을 사용하여 특징을 처리하여 c-반응성 단백질과 연관된 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계.
구현예 25. 구현예 24에 있어서, 상기 복수의 형광 강도 측정치는 도립 또는 비-도립 공초점 현미경으로 측정되는 것인, 장치.
구현예 26. 구현예 24 또는 25에 있어서, 상기 생물학적 샘플은 치아 샘플을 포함하는 것인, 장치.
구현예 27. 구현예 24 내지 26 중 어느 한 구현예에 있어서, 상기 치아 샘플은 C-반응성 단백질 면역조직화학 염색을 사용하여 염색되는 것인, 장치.
구현예 28. 구현예 26에 있어서, 상기 명령은 치아 샘플을 절편화하는 단계를 추가로 포함하는, 장치.
구현예 29. 구현예 26에 있어서, 상기 명령은 치아 샘플을 탈석회화하는 단계를 추가로 포함하는, 장치.
구현예 30. 구현예 24 내지 29 중 어느 한 구현예에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함하는, 장치.
구현예 31. 구현예 24 내지 29 중 어느 한 구현예에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애 ASD를 포함하는 것인, 장치.
구현예 32. 구현예 24 내지 31 중 어느 한 구현예에 있어서, 상기 대상체는 인간인, 장치.
구현예 33. 구현예 24 내지 32 중 어느 한 구현예에 있어서, 상기 대상체는 12세 미만인, 장치.
구현예 34. 구현예 24 내지 32 중 어느 한 구현예에 있어서, 상기 대상체는 1세 미만인, 장치.
구현예 35. 구현예 24 내지 34 중 어느 한 구현예에 있어서, 상기 분석하는 단계는 복수의 형광 강도 측정치에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계 및 염증의 시간적 프로파일을 분석하는 단계를 포함하는, 장치.
구현예 36. 구현예 35에 있어서, 상기 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응하는 것인, 장치.
구현예 37. 구현예 24 내지 36 중 어느 한 구현예에 있어서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 복수의 형광 강도 측정치를 처리하는 단계를 포함하는, 장치.
구현예 38. 구현예 37에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 장치.
구현예 39. 구현예 37에 있어서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함하는, 장치.
구현예 40. 구현예 37에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성되는 것인, 장치.
구현예 41. 구현예 37에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간 (TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성되는 것인, 장치.
구현예 42. 구현예 24 내지 41 중 어느 한 구현예에 있어서, 상기 훈련된 모델은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
구현예 43. 구현예 24 내지 41 중 어느 한 구현예에 있어서, 상기 훈련된 모델은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
구현예 44. 구현예 24 내지 41 중 어느 한 구현예에 있어서, 상기 훈련된 모델은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
구현예 45. 구현예 24 내지 41 중 어느 한 구현예에 있어서, 상기 훈련된 모델은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
구현예 46. 구현예 24 내지 41 중 어느 한 구현예에 있어서, 상기 훈련된 모델은 적어도 약 0.80의 수신자 작동 특성 아래 면적(AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
구현예 47. 비-일시적 컴퓨터 판독가능 저장 매체 및 내부에 삽입된 하나 이상의 컴퓨터 프로그램으로서, 상기 하나 이상의 컴퓨터 프로그램은 컴퓨터 시스템에 의해 실행될 때 컴퓨터 시스템으로 인해 하기를 포함하는 방법을 수행하도록 하는 명령을 포함하는 것인, 비-일시적 컴퓨터 판독가능 저장 매체: (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; (c) c-반응성 단백질 형광 강도의 변화에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (d) 훈련된 모델을 사용하여 특징을 처리하여 c-반응성 단백질과 연관된 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계.
구현예 48. 구현예 47에 있어서, 상기 복수의 형광 강도 측정치는 도립 또는 비-도립 공초점 현미경으로 측정되는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 49. 구현예 47 또는 48에 있어서, 상기 생물학적 샘플은 치아 샘플을 포함하는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 50. 구현예 49에 있어서, 상기 치아 샘플은 C-반응성 단백질 면역조직화학 염색을 사용하여 염색되는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 51. 구현예 49에 있어서, 상기 방법은 치아 샘플을 절편화하는 단계를 추가로 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 52. 구현예 47 내지 51 중 어느 한 구현예에 있어서, 상기 방법은 치아 샘플을 탈석회화하는 단계를 추가로 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 53. 구현예 47 내지 52 중 어느 한 구현예에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 54. 구현예 47 내지 52 중 어느 한 구현예에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD)를 포함하는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 55. 구현예 47 내지 54 중 어느 한 구현예에 있어서, 상기 대상체는 인간인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 56. 구현예 47 내지 55 중 어느 한 구현예에 있어서, 상기 대상체는 12세 미만인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 57. 구현예 47 내지 55 중 어느 한 구현예에 있어서, 상기 대상체는 1세 미만인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 58. 구현예 47 내지 57 중 어느 한 구현예에 있어서, 상기 분석하는 단계는 복수의 형광 강도 측정치에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계 및 염증의 시간적 프로파일을 분석하는 단계를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 59. 구현예 58에 있어서, 상기 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응하는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 60. 구현예 47 내지 59 중 어느 한 항에 있어서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 복수의 형광 강도 측정치를 처리하는 단계를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 61. 구현예 60에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 62. 구현예 60에 있어서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 63. 구현예 60에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성되는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 64. 구현예 60에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간 (TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성되는 것인, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 65. 구현예 47 내지 64 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 66. 구현예 47 내지 64 중 어느 한 구현예에 있어서, 상기 훈련된 모델은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 67. 구현예 47에 있어서, 상기 훈련된 모델은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 68. 구현예 47에 있어서, 상기 훈련된 모델은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 69. 구현예 47에 있어서, 상기 훈련된 모델은 적어도 약 0.80의 수신자 작동 특성 아래 면적(AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
구현예 70. 하나 이상의 프로세서, 및 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 갖는 컴퓨터 시스템에서, 하기를 포함하는 모델을 훈련하기 위한 방법: (a) 복수의 훈련 대상체 중 훈련 대상체의 제1 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는 것에 상응하는제1 진단 상태를 가지며, 복수의 훈련 대상체 중 훈련 대상체의 제2 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖지 않는 것에 상응하는 제2 진단 상태를 갖는 것인, 복수의 훈련 대상체에서 각각의 개별적인 훈련 대상체에 대해, (i) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계; (ii) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; 및 (iii) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및 (b) (i) 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 각각의 개별적인 제2 데이터세트의 상응하는 일련의 특징 및 (ii) 제1 진단 상태 및 제2 진단 상태 중에서 선택되는, 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 상응하는 진단 상태로 훈련되지 않은 또는 부분적으로 훈련되지 않은 모델을 훈련시키고, 이에 따라 시험 대상체의 c-반응성 단백질과 연관된 생물학적 샘플로부터 획득된 일련의 특징에서 특징에 대한 값에 기초하여 시험 대상체가 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는지의 여부에 관한 지표를 제공하는 훈련된 모델을 획득하는 단계.
구현예 71. 구현예 70에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 모델 알고리즘, 지도 클러스터링 모델 알고리즘, 회귀 모델, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합인, 방법.
구현예 72. 구현예 70에 있어서, 상기 훈련된 모델은 다항 분류자인, 방법.
구현예 73. 구현예 70에 있어서, 상기 훈련된 모델은 이항 분류자인, 방법.
구현예 74. 구현예 70 내지 73 중 어느 한 구현예에 있어서, 상기 c-반응성 단백질과 연관된 제1 생물학적 병태는 자폐 스펙트럼 장애(ASD), 주의력-결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부 및 소아암으로 이루어진 군으로부터 선택되는 것인, 방법.
구현예 75. 구현예 70에 있어서, 상기 방법은 c-반응성 단백질과 연관된 제1 생물학적 병태와 금속 대사와 연관된 제1 생물학적 병태와 구별되는 c-반응성 단백질과 연관된 제2 생물학적 병태 간에 식별함에 의해 c-반응성 단백질과 연관된 제1 생물학적 병태에 대해 시험 대상체를 평가하는 단계를 추가로 포함하는, 방법.
구현예 76. 구현예 75에 있어서, 상기 제1 생물학적 병태는 자폐 스펙트럼 장애이고, 제2 생물학적 병태는 주의력-결핍/과잉행동 장애인, 방법.
구현예 77. 구현예 70 내지 76 중 어느 한 구현예에 있어서, 상기 시험 대상체는 인간인, 방법.
구현예 78. 구현예 77에 있어서, 상기 인간은 12세 미만인, 방법.
구현예 79. 구현예 78에 있어서, 상기 인간은 1세 미만인, 방법.
구현예 80. 구현예 70 내지 79 중 어느 한 구현예에 있어서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간, 치아 및 손발톱으로 이루어진 군으로부터 선택되는 것인, 방법.
구현예 81. 구현예 80에 있어서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간이고, 참조선은 모간의 종 방향에 상응하는 것인, 방법.
구현예 82. 구현예 70 내지 79 중 어느 한 구현예에 있어서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 치아이고, 참조선은 치아의 신생아 선을 포함하는 성장 밴드 전반에 걸친 방향에 상응하는 것인, 방법.
구현예 83. 구현예 70 내지 82 중 어느 한 구현예에 있어서, 상기 상응하는 복수의 위치는 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플을 따라 상응하는 복수의 위치 중 제1 위치가 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플의 끝에 가장 가까운 위치에 상응하도록 시퀀싱되는 것인, 방법.
구현예 84. 구현예 70 내지 79 중 어느 한 구현예에 있어서, 상기 상응하는 복수의 형광 강도 측정치에서의 각각의 트레이스는 복수의 데이터 포인트를 포함하고, 각각의 데이터 포인트는 복수의 위치 중 개별적인 위치의 인스턴스인 것인, 방법.
구현예 85. 구현예 70 내지 84 중 어느 한 구현예에 있어서, 상기 상응하는 일련의 특징은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
구현예 86. 구현예 70 내지 86 중 어느 한 구현예에 있어서, 상기 상응하는 복수의 위치는 적어도 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개 또는 5000개, 6000개, 7000개, 8000개, 9000개, 10000개, 12000개, 14000개, 16000개, 18000개, 20000개, 또는 20000개 초과의 위치를 포함하는 것인, 방법.

Claims (86)

  1. 질병 또는 장애에 대한 대상체의 진단 상태를 예측하기 위한 방법으로서,
    (a) 염색된 치아 샘플을 생성하기 위하여 대상체의 치아 샘플을 염색하는 단계;
    (b) 염색된 치아 샘플의 전반에 걸쳐 공간적으로 형광 강도를 분석하는 단계; 및
    (c) 형광 강도의 분석에 적어도 부분적으로 기초하여 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계:
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 분석하는 단계는 염색된 치아 샘플의 형광 이미지를 획득하는 단계 및 상기 형광 이미지의 형광 강도를 분석하는 단계를 포함하는, 방법.
  3. 제2항에 있어서, 상기 염색된 치아 샘플의 형광 이미지를 획득하는 단계는 도립 또는 비-도립 공초점 현미경을 사용하는 것을 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 치아 샘플을 염색하는 단계는 C-반응성 단백질 면역조직화학 염색을 사용하는 것을 포함하는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 치아 샘플을 절편화하는 단계를 추가로 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 치아 샘플을 염색하는 단계는 치아 샘플을 탈석회화하는 단계를 포함하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함하는, 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애를 포함하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 대상체는 인간인, 방법.
  10. 제9항에 있어서, 상기 대상체는 12세 미만인, 방법.
  11. 제9항에 있어서, 상기 대상체는 1세 미만인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 분석하는 단계는 형광 강도에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계 및 염증의 시간적 프로파일을 분석하는 단계를 포함하는, 방법.
  13. 제12항에 있어서, 상기 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 형광 강도를 처리하는 단계를 포함하는, 방법.
  15. 제14항에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 방법.
  16. 제14항에 있어서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함하는, 방법.
  17. 제14항에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성되는, 방법.
  18. 제17항에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간 (TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성되는, 방법.
  19. 제18항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
  20. 제18항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
  21. 제18항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
  22. 제18항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
  23. 제18항에 있어서, 상기 훈련된 모델은 적어도 약 0.80의 수신자 작동 특성 아래 면적(Area Under the Receiver Operating Characteristic, AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는, 방법.
  24. 하나 이상의 프로세서, 및 상기 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 포함하는 장치로서, 상기 하나 이상의 프로그램은 하기에 대한 명령을 포함하는, 장치:
    (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계;
    (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계;
    (c) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및
    (d) 훈련된 모델을 사용하여 특징을 처리하여 c-반응성 단백질과 연관된 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계.
  25. 제24항에 있어서, 상기 복수의 형광 강도 측정치는 도립 또는 비-도립 공초점 현미경으로 측정되는, 장치.
  26. 제24항 또는 제25항에 있어서, 상기 생물학적 샘플은 치아 샘플을 포함하는, 장치.
  27. 제24항 내지 제26항 중 어느 한 항에 있어서, 상기 치아 샘플은 C-반응성 단백질 면역조직화학 염색을 사용하여 염색되는, 장치.
  28. 제26항에 있어서, 상기 명령은 치아 샘플을 절편화하는 단계를 추가로 포함하는, 장치.
  29. 제26항에 있어서, 상기 명령은 치아 샘플을 탈석회화하는 단계를 추가로 포함하는, 장치.
  30. 제24항 내지 제29항 중 어느 한 항에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함하는, 장치.
  31. 제24항 내지 제29항 중 어느 한 항에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애 ASD를 포함하는, 장치.
  32. 제24항 내지 제31항 중 어느 한 항에 있어서, 상기 대상체는 인간인, 장치.
  33. 제24항 내지 제32항 중 어느 한 항에 있어서, 상기 대상체는 12세 미만인, 장치.
  34. 제24항 내지 제32항 중 어느 한 항에 있어서, 상기 대상체는 1세 미만인, 장치.
  35. 제24항 내지 제34항 중 어느 한 항에 있어서, 상기 분석하는 단계는 복수의 형광 강도 측정치에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계 및 염증의 시간적 프로파일을 분석하는 단계를 포함하는, 장치.
  36. 제35항에 있어서, 상기 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응하는, 장치.
  37. 제24항 내지 제36항 중 어느 한 항에 있어서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 복수의 형광 강도 측정치를 처리하는 단계를 포함하는, 장치.
  38. 제37항에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 장치.
  39. 제37항에 있어서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함하는, 장치.
  40. 제37항에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성되는, 장치.
  41. 제37항에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간 (TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성되는, 장치.
  42. 제24항 내지 제41항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
  43. 제24항 내지 제41항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
  44. 제24항 내지 제41항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
  45. 제24항 내지 제41항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
  46. 제24항 내지 제41항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 0.80의 수신자 작동 특성 아래 면적(Area Under the Receiver Operating Characteristic, AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는, 장치.
  47. 비-일시적 컴퓨터 판독가능 저장 매체 및 내부에 삽입된 하나 이상의 컴퓨터 프로그램으로서, 상기 하나 이상의 컴퓨터 프로그램은 컴퓨터 시스템에 의해 실행될 때 컴퓨터 시스템으로 인해 하기를 포함하는 방법을 수행하도록 하는 명령을 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체 및 내부에 삽입된 하나 이상의 컴퓨터 프로그램:
    (a) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계;
    (b) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계;
    (c) c-반응성 단백질 형광 강도의 변화에 의해 결정되는 것인 상응하는 복수의 형광 강도 측정치, 상응하는 일련의 특징에서의 각각의 개별적인 특징으로부터 개별적인 제2 데이터세트를 도출하는 단계; 및
    (d) 훈련된 모델을 사용하여 특징을 처리하여 c-반응성 단백질과 연관된 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계.
  48. 제47항에 있어서, 상기 복수의 형광 강도 측정치는 도립 또는 비-도립 공초점 현미경으로 측정되는, 비-일시적 컴퓨터 판독가능 저장 매체.
  49. 제47항 또는 제48항에 있어서, 상기 생물학적 샘플은 치아 샘플을 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  50. 제49항에 있어서, 상기 치아 샘플은 C-반응성 단백질 면역조직화학 염색을 사용하여 염색되는, 비-일시적 컴퓨터 판독가능 저장 매체.
  51. 제49항에 있어서, 상기 방법은 치아 샘플을 절편화하는 단계를 추가로 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  52. 제47항 내지 제51항 중 어느 한 항에 있어서, 상기 방법은 치아 샘플을 탈석회화하는 단계를 추가로 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  53. 제47항 내지 제52항 중 어느 한 항에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD), 주의력 결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부, 소아암 또는 이들의 임의의 조합을 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  54. 제47항 내지 제52항 중 어느 한 항에 있어서, 상기 질병 또는 장애는 자폐 스펙트럼 장애(ASD)를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  55. 제47항 내지 제54항 중 어느 한 항에 있어서, 상기 대상체는 인간인, 비-일시적 컴퓨터 판독가능 저장 매체.
  56. 제47항 내지 제55항 중 어느 한 항에 있어서, 상기 대상체는 12세 미만인, 비-일시적 컴퓨터 판독가능 저장 매체.
  57. 제47항 내지 제55항 중 어느 한 항에 있어서, 상기 대상체는 1세 미만인, 비-일시적 컴퓨터 판독가능 저장 매체.
  58. 제47항 내지 제57항 중 어느 한 항에 있어서, 상기 분석하는 단계는 복수의 형광 강도 측정치에 적어도 부분적으로 기초하여 염증의 시간적 프로파일을 생성하는 단계 및 염증의 시간적 프로파일을 분석하는 단계를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  59. 제58항에 있어서, 상기 염증의 시간적 프로파일의 적어도 일부는 대상체의 출생전 기간에 상응하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  60. 제47항 내지 제59항 중 어느 한 항에 있어서, 상기 질병 또는 장애에 대한 대상체의 진단 상태를 예측하는 단계는 훈련된 모델을 사용하여 복수의 형광 강도 측정치를 처리하는 단계를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  61. 제60항에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 알고리즘, 지도 클러스터링 알고리즘, 회귀 알고리즘, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 비-일시적 컴퓨터 판독가능 저장 매체.
  62. 제60항에 있어서, 상기 훈련된 모델은 그래디언트-부스팅된 결정 트리를 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  63. 제60항에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 특징을 처리하도록 구성되는, 비-일시적 컴퓨터 판독가능 저장 매체.
  64. 제60항에 있어서, 상기 훈련된 모델은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간 (TT), 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 둘 이상의 특징을 처리하도록 구성되는, 비-일시적 컴퓨터 판독가능 저장 매체.
  65. 제47항 내지 제64항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 민감도로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  66. 제47항 내지 제64항 중 어느 한 항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 특이도로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  67. 제47항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 양성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  68. 제47항에 있어서, 상기 훈련된 모델은 적어도 약 80%의 음성 예측 값으로 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  69. 제47항에 있어서, 상기 훈련된 모델은 적어도 약 0.80의 수신자 작동 특성 아래 면적(Area Under the Receiver Operating Characteristic, AUROC)을 갖는 질병 또는 장애에 대한 진단 상태를 예측하는, 비-일시적 컴퓨터 판독가능 저장 매체.
  70. 하나 이상의 프로세서, 및 하나 이상의 프로세서에 의한 실행을 위한 하나 이상의 프로그램을 저장하는 메모리를 갖는 컴퓨터 시스템에서, 하기를 포함하는 모델을 훈련하기 위한 방법:
    (a) 복수의 훈련 대상체 중 훈련 대상체의 제1 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는 것에 상응하는 제1 진단 상태를 가지며, 복수의 훈련 대상체 중 훈련 대상체의 제2 서브세트는 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖지 않는 것에 상응하는 제2 진단 상태를 갖는, 복수의 훈련 대상체에서 각각의 개별적인 훈련 대상체에 대해,
    (i) 대상체의 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 참조선을 따라 복수의 위치에서 각각의 개별적인 위치를 샘플링하고, 이에 따라 복수의 형광 강도 측정치, 복수의 위치에서 상이한 위치에 상응하는 복수의 형광 강도 측정치의 각각의 형광 강도 측정치, 및 c-반응성 단백질과 연관된 대상체의 생물학적 샘플에 대한 상이한 성장 기간을 나타내는 복수의 위치에서 각각의 위치를 획득하는 단계;
    (ii) 생물학적 샘플에 대한 참조선 전반에 걸쳐 각각의 형광 강도를 분석하고, 이에 따라 제1 데이터세트를 획득하는 단계; 및
    (iii) c-반응성 단백질 형광 강도의 순차적 가변성에 의해 결정되는 상응하는 일련의 특징에서의 각각의 개별적인 특징인 상응하는 복수의 형광 강도 측정치로부터 개별적인 제2 데이터세트를 도출하는 단계; 및
    (b) (i) 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 각각의 개별적인 제2 데이터세트의 상응하는 일련의 특징 및 (ii) 제1 진단 상태 및 제2 진단 상태 중에서 선택되는, 복수의 훈련 대상체에서 각각의 훈련 대상체에 대한 상응하는 진단 상태로 훈련되지 않은 또는 부분적으로 훈련되지 않은 모델을 훈련시키고, 이에 따라 시험 대상체의 c-반응성 단백질과 연관된 생물학적 샘플로부터 획득된 일련의 특징에서 특징에 대한 값에 기초하여 시험 대상체가 c-반응성 단백질과 연관된 제1 생물학적 병태를 갖는지의 여부에 관한 지표를 제공하는 훈련된 모델을 획득하는 단계.
  71. 제70항에 있어서, 상기 훈련된 모델은 신경망 알고리즘, 서포트 벡터 머신 알고리즘, 결정 트리 알고리즘, 비지도 클러스터링 모델 알고리즘, 지도 클러스터링 모델 알고리즘, 회귀 모델, 그래디언트-부스팅 알고리즘 및 이들의 임의의 조합인, 방법.
  72. 제70항에 있어서, 상기 훈련된 모델은 다항 분류자인, 방법.
  73. 제70항에 있어서, 상기 훈련된 모델은 이항 분류자인, 방법.
  74. 제70항 내지 제73항 중 어느 한 항에 있어서, 상기 c-반응성 단백질과 연관된 제1 생물학적 병태는 자폐 스펙트럼 장애(ASD), 주의력-결핍/과잉행동 장애(ADHD), 근위축성 측삭 경화증(ALS), 조현병, 과민성 장 질환(IBD), 소아 신장 질환, 신장 이식 거부 및 소아암으로 이루어진 군으로부터 선택되는, 방법.
  75. 제70항에 있어서, 상기 방법은 c-반응성 단백질과 연관된 제1 생물학적 병태와 금속 대사와 연관된 제1 생물학적 병태와 구별되는 c-반응성 단백질과 연관된 제2 생물학적 병태 간에 식별함에 의해 c-반응성 단백질과 연관된 제1 생물학적 병태에 대해 시험 대상체를 평가하는 단계를 추가로 포함하는, 방법.
  76. 제75항에 있어서, 상기 제1 생물학적 병태는 자폐 스펙트럼 장애이고, 제2 생물학적 병태는 주의력-결핍/과잉행동 장애인, 방법.
  77. 제70항 내지 제76항 중 어느 한 항에 있어서, 상기 시험 대상체는 인간인, 방법.
  78. 제77항에 있어서, 상기 인간은 12세 미만인, 방법.
  79. 제78항에 있어서, 상기 인간은 1세 미만인, 방법.
  80. 제70항 내지 제79항 중 어느 한 항에 있어서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간, 치아 및 손발톱으로 이루어진 군으로부터 선택되는, 방법.
  81. 제80항에 있어서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 모간이고, 참조선은 모간의 종 방향에 상응하는, 방법.
  82. 제70항 내지 제79항 중 어느 한 항에 있어서, 상기 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플은 치아이고, 참조선은 치아의 신생아 선을 포함하는 성장 밴드 전반에 걸친 방향에 상응하는, 방법.
  83. 제70항 내지 제82항 중 어느 한 항에 있어서, 상기 상응하는 복수의 위치는 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플을 따라 상응하는 복수의 위치 중 제1 위치가 개별적인 훈련 대상체의 c-반응성 단백질과 연관된 상응하는 생물학적 샘플의 끝에 가장 가까운 위치에 상응하도록 시퀀싱되는, 방법.
  84. 제70항 내지 제79항 중 어느 한 항에 있어서, 상기 상응하는 복수의 형광 강도 측정치에서의 각각의 트레이스는 복수의 데이터 포인트를 포함하고, 각각의 데이터 포인트는 복수의 위치 중 개별적인 위치의 인스턴스인, 방법.
  85. 제70항 내지 제84항 중 어느 한 항에 있어서, 상기 상응하는 일련의 특징은 재발률, 결정론, 평균 대각선 길이, 최대 대각선 길이, 발산, 대각선 길이의 섀넌 엔트로피, 재발 경향, 층류성, 포획 시간, 최대 수직선 길이, 수직선 길이의 섀넌 엔트로피, 평균 재발 시간, 재발 시간의 섀넌 엔트로피, 최대 추정 재발의 수, 평균 대각선 길이(MDL), 재발 시간(RT), Vmax, 결정론, Lmax 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 방법.
  86. 제70항 내지 제86항 중 어느 한 항에 있어서, 상기 상응하는 복수의 위치는 적어도 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개 또는 5000개, 6000개, 7000개, 8000개, 9000개, 10000개, 12000개, 14000개, 16000개, 18000개, 20000개, 또는 20000개 초과의 위치를 포함하는, 방법.
KR1020237022350A 2020-12-04 2021-12-03 생물학적 장애의 동적 면역조직화학 프로파일링을 위한 시스템 및 방법 KR20240043724A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063121792P 2020-12-04 2020-12-04
US63/121,792 2020-12-04
PCT/US2021/061803 WO2022120164A1 (en) 2020-12-04 2021-12-03 Systems and methods for dynamic immunohistochemistry profiling of biological disorders

Publications (1)

Publication Number Publication Date
KR20240043724A true KR20240043724A (ko) 2024-04-03

Family

ID=79259454

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237022350A KR20240043724A (ko) 2020-12-04 2021-12-03 생물학적 장애의 동적 면역조직화학 프로파일링을 위한 시스템 및 방법

Country Status (9)

Country Link
US (1) US20240003813A1 (ko)
EP (1) EP4256345A1 (ko)
JP (1) JP2024501620A (ko)
KR (1) KR20240043724A (ko)
CN (1) CN117859064A (ko)
AU (1) AU2021391811A1 (ko)
CA (1) CA3201128A1 (ko)
MX (1) MX2023006475A (ko)
WO (1) WO2022120164A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023240117A1 (en) * 2022-06-08 2023-12-14 Icahn School Of Medicine At Mount Sinai Systems and methods for dynamic immunohistochemistry profiling of biological disorders and feature engineering thereof

Also Published As

Publication number Publication date
AU2021391811A1 (en) 2023-07-20
CN117859064A (zh) 2024-04-09
JP2024501620A (ja) 2024-01-15
WO2022120164A1 (en) 2022-06-09
US20240003813A1 (en) 2024-01-04
CA3201128A1 (en) 2022-06-09
EP4256345A1 (en) 2023-10-11
MX2023006475A (es) 2023-08-21

Similar Documents

Publication Publication Date Title
Van Smeden et al. Critical appraisal of artificial intelligence-based prediction models for cardiovascular disease
US20230120282A1 (en) Systems and methods for managing autoimmune conditions, disorders and diseases
Gao et al. Model-based and model-free machine learning techniques for diagnostic prediction and classification of clinical outcomes in Parkinson’s disease
Zhou et al. The detection of age groups by dynamic gait outcomes using machine learning approaches
JP7361187B2 (ja) 医療データの自動化された検証
US20240112803A1 (en) Systems and Methods for Dynamic Raman Profiling of Biological Diseases and Disorders
Bhatia et al. IoT-inspired smart home based urine infection prediction
US20240003813A1 (en) Systems and Methods for Dynamic Immunohistochemistry Profiling of Biological Disorders
JP2014083194A (ja) ネットワークエントロピーに基づく生体の状態遷移の予兆の検出を支援する検出装置、検出方法及び検出プログラム
Mohi Uddin et al. XML‐LightGBMDroid: A self‐driven interactive mobile application utilizing explainable machine learning for breast cancer diagnosis
JP2014064515A (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
Bernardini et al. A clinical decision support system to stratify the temporal risk of diabetic retinopathy
US20230368921A1 (en) Systems and methods for exposomic clinical applications
US20230019703A1 (en) Personal health tracking urinalysis device
WO2023240117A1 (en) Systems and methods for dynamic immunohistochemistry profiling of biological disorders and feature engineering thereof
Raju et al. Chronic kidney disease prediction using ensemble machine learning
Varghese et al. Machine Learning in the Parkinson’s disease smartwatch (PADS) dataset
WO2023240122A1 (en) Systems and methods for dynamic raman profiling of biological diseases and disorders and feature engineering methods thereof
WO2023196463A1 (en) Systems and methods for space health exposomics
Kashyap et al. Revolutionizing healthcare with data science: early disease identification and prediction system
CN116615702A (zh) 用于暴露组学临床应用的系统和方法
Cui Survival Prediction of Pediatric Leukemia under Model Uncertainty
Eissa et al. CODI: Enhancing machine learning-based molecular profiling through contextual out-of-distribution integration
WO2024092136A2 (en) Machine learning modeling for inpatient prediction
Sufriyana et al. Human and machine learning of prognostic prediction for prelabor rupture of membranes and the time of delivery: a nationwide development, validation, and deployment using medical history