KR20220044720A - 환자를 계층화하기 위한 분류기의 개발 - Google Patents

환자를 계층화하기 위한 분류기의 개발 Download PDF

Info

Publication number
KR20220044720A
KR20220044720A KR1020227002006A KR20227002006A KR20220044720A KR 20220044720 A KR20220044720 A KR 20220044720A KR 1020227002006 A KR1020227002006 A KR 1020227002006A KR 20227002006 A KR20227002006 A KR 20227002006A KR 20220044720 A KR20220044720 A KR 20220044720A
Authority
KR
South Korea
Prior art keywords
subject
therapy
disease
responsive
classifier
Prior art date
Application number
KR1020227002006A
Other languages
English (en)
Inventor
수잔 기아시안
디오도르 알. 멜로스
마크 산토리니
애셔 아멜리
낸시 쉔브루너
비아체슬라브 알. 아크매브
케이스 제이. 존슨
Original Assignee
사이퍼 메디슨 코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사이퍼 메디슨 코퍼레이션 filed Critical 사이퍼 메디슨 코퍼레이션
Publication of KR20220044720A publication Critical patent/KR20220044720A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/177Receptors; Cell surface antigens; Cell surface determinants
    • A61K38/1793Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/24Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
    • C07K16/241Tumor Necrosis Factors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6863Cytokines, i.e. immune system proteins modifying a biological response such as cell growth proliferation or differentiation, e.g. TNF, CNF, GM-CSF, lymphotoxin, MIF or their receptors
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/76Antagonist effect on antigen, e.g. neutralization or inhibition of binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/52Assays involving cytokines
    • G01N2333/525Tumor necrosis factor [TNF]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Cell Biology (AREA)
  • Databases & Information Systems (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Urology & Nephrology (AREA)

Abstract

특정 치료에 대한 반응을 예측하기에 유용한 분류기를 개발하기 위한 시스템 및 방법이 본원에 제시된다. 예를 들어, 일부 구현예에서, 본 개시내용은 항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계를 포함하는, 자가면역 장애를 겪고 있는 대상체를 치료하는 방법을 제공한다.

Description

환자를 계층화하기 위한 분류기의 개발
계류 중인 출원에 대한 상호 참조
본 출원은 2020년 1월 24일에 출원된 미국 가출원 제62/965,486호, 2019년 6월 27일에 출원된 미국 가출원 제62/867,853호, 및 2019년 8월 2일에 출원된 미국 가출원 제62/882,402호에 대한 우선권을 주장하며, 이들 각각은 그 전체가 참조로 본원에 포함되어 있다.
본 특허 출원의 주제는 2018년 3월 16일에 출원된 미국 가출원 제62/644,070호의 우선권 및 이익을 주장하는 2019년 3월 15일에 출원된 "항-TNF 요법에 대한 반응을 예측하기 위한 방법 및 시스템"이라는 제목의 계류 중인 국제 특허 출원 제PCT/US19/22588호와 관련되며, 이들 각각의 내용은 그 전체가 참조로 본원에 포함되어 있다.
류마티스성 관절염(RA)과 같은 자가면역 질환은 수백만 명의 환자에게 영향을 미치고, 이들의 치료는 전체 의료비 지출의 상당 부분을 차지한다. 자가면역 질환은 장기 특이적 자가면역 및 전신 자가면역의 두 그룹으로 나뉠 수 있다. RA를 포함하는 류마티스성 질환은 주로 활막성 관절에서 나타나 결국 힘줄, 연골, 및 뼈의 비가역적인 파괴를 유발하는 전신 자가 면역 질환에 속한다. 현재 RA에 대한 치료법은 없지만, 주로 이 사이토카인의 전염증성 신호전달을 중화시키는 작용을 하는 항-TNF(tumor necrosis factor) 제제의 개발을 통해 이들 환자의 치료를 관리하기 위해 상당한 개선이 이루어졌다. 이러한 생물학적 요법(예컨대, 휴미라(Humira), 엔브렐(Enbrel), 레미케이드(Remicade), 심포니(Simponi), 및 심지아(Cymzia))은 일부 RA 환자의 치료 결과를 상당히 개선하였다.
RA 환자 중 약 34%(낮은 백분율)는 항-TNF 요법에 대해 임상 반응을 나타내어, 낮은 질환 활성(LDA)을 달성하고 때때로 관해를 달성한다. 이러한 소위 "반응자" 환자에서의 질환 진행은 부적절한 TNF 유도 전염증성 반응의 결과일 가능성이 높다. 항-TNF에 반응하지 못하는 환자의 경우, 항-CD20, 공동자극 차단, JAK 및 항-IL6 요법과 같은 이용가능한 대안적인 승인된 요법이 있다. 그러나, 환자는 전형적으로 상이한 항-TNF를 통한 1차 사이클링 후에만 이러한 대안적인 요법으로 전환되며, 이는 1년 넘게 걸릴 수 있는데 증상이 지속되고 질환이 더 진행되어 치료 목표에 도달하기 어렵다.
치료 지연 문제 외에도, 항-TNF 요법과 관련된 심각한 감염 및 악성종양의 알려진 위험이 너무 심각해서 제품 승인은 전형적으로 소위 "블랙박스 경고"가 라벨에 포함될 것을 요구한다. 이러한 요법의 다른 잠재적인 부작용은, 예를 들어, 울혈성 심부전, 탈수초 질환, 및 다른 전신 부작용을 포함한다.
더욱이, 정밀 의학은 오믹 데이터 및 임상 결과를 사용하는 기계 학습, 인공 지능, 및 네트워크 과학 접근법으로 개발된 독점 알고리즘을 사용하여 게놈 및/또는 다중오믹 데이터를 해석하는 능력에 의존한다. 그러나, 주요 과제는 오믹 데이터를 분석하는 소프트웨어가 지속적으로 개선되고 업데이트되고 있다는 것이다. 이러한 업데이트는 임상 실험실 환경에서 소프트웨어 구성요소를 포함한 시스템을 잠그고 검증할 필요성을 고려할 때 적시에 구현하기 매우 어렵다.
항-TNF 요법의 중요한 알려진 문제는 반응률이 일관되지 않다는 것이다. 실제로, 면역학 및 류마티스학 분야의 선두 과학자 및 임상의를 모아 이러한 분야에서 충족되지 않은 요구를 확인하기 위해 고안된 최근 국제 회의는 거의 보편적으로 반응률의 불확실성을 지속적인 과제로서 확인한다. 예를 들어, 류마티스성 관절염, 건선 관절염, 축성 척추관절염, 전신 홍반성 루푸스, 및 결합 조직 질환(예컨대, 쇼그렌 증후군, 전신 경화증, 베체트병을 포함하는 혈관염 및 IgG4 관련 질환)을 포함한 다양한 질환의 치료에서의 과제와 관련된 브레이크아웃 세션을 개최한 19회 연례 국제 표적 요법 회의는 이러한 모든 질환에 공통적인 특정 문제, 특히 "치료 반응에 대한 예측 도구가 개발될 수 있도록 ... 각 질환 내의 이질성을 더 잘 이해할 필요성"를 확인하였다. 예컨대 문헌[Winthrop, et al., "The unmet need in rheumatology: Reports from the targeted therapies meeting 2017," Clin. Immunol. pii: S1521-6616(17)30543-0, Aug. 12, 2017]을 참고한다. 유사하게도, 항-TNF 요법으로 크론병을 치료하는 것에 관한 광대한 문헌은 일관되게 불규칙한 반응률 및 어떤 환자가 이익을 얻을지 예측할 수 없음을 안타까워한다. 예컨대, 문헌[M.T. Abreu, "Anti-TNF Failures in Crohn's Disease," Gastroenterol Hepatol (N.Y.), 7(1):37-39 (Jan. 2011)]을 참고하며, 또한 문헌[Ding et al., "Systematic review: predicting and optimising response to anti-TNF therapy in Crohn's disease - algorithm for practical management," Aliment Pharmacol. Ther., 43(1):30-51 (Jan. 2016)(항-TNF 치료에 대한 1차 무반응이 환자의 13-40%에 영향을 미친다고 보고함)]을 참고한다.
무엇보다도, 제공된 기술은 치료 제공자가 대상체의 카테고리를 구별할 수 있게 해주며, 예컨대, 특정 요법(예컨대, 항-TNF 요법)으로부터 이익을 얻을 가능성이 있는 대상체를 그렇지 않은 대상체, 특정 결과 또는 부작용을 달성하거나 겪을 가능성이 더 높은 대상체 등과 구별할 수 있게 해 준다. 따라서, 일부 구현예에서, 이러한 제공된 기술은 환자에 대한 위험을 감소시키고, 무반응자 환자 집단에 대한 치료의 시기 및 품질을 증가시키고, 약물 개발의 효율을 증가시키고/거나, 무반응자 환자에게 비효과적인 요법을 투여하는 것과 관련된 비용 또는 관련 요법(예컨대, 항-TNF 요법)을 받을 때 이러한 환자가 경험하는 부작용을 치료하는 것과 관련된 비용을 피한다.
일부 구현예에서, 본 개시내용은 대상체를 특정 요법(예컨대, 항-TNF 요법)으로 치료하는 방법으로서, 방법은 요법에 대해 반응성일 것으로 예측되는 대상체와 요법에 대해 무반응성일 것으로 예측되는 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 요법을 투여하는 단계를 포함하는 것인 방법을 제공한다.
무엇보다도, 대상체가 특정 요법에 대해 반응성 또는 무반응성인지 및/또는 특정 결과 또는 부작용을 달성하거나 겪는지 여부를 결정하는 데 유용한 분류기의 구현예뿐만 아니라 이러한 분류기를 제조하는 방법이 본원에 추가로 기재된다.
제공된 기술은 무엇보다도 예를 들어, 반응자 대 무반응자 집단를 정의하는 특정 기존 접근법의 문제의 원인을 확인하는 것을 포함하고/거나 이러한 집단을 구별하는 분류기를 정의하기 위한 특히 유용한 전략을 나타내는 특정 통찰력을 구현하고/거나 이로부터 발생한다.
예를 들어, 본원에 기재된 바와 같이, 본 개시내용은 집단에서의 유전자 발현 차이의 고려를 통해 반응자 대 무반응자 집단을 정의하기 위한 많은 기존 전략의 문제의 한 가지 근원이 그들이 전형적으로 최고 배수(highest fold)(즉, 중요한) 변화에 우선순위를 두거나 집중한다는 점이라는 WO 제2019/178546호에 의해 제공된 통찰력을 이용하며, WO 제2019/178546호에 기재된 바와 같이, 이러한 접근법은 질환 생물학과 관련된 미묘하지만 의미있는 차이를 놓친다. 더욱이, 본 개시내용은 또한 인간 상호작용체(human interactome) 맵 상에(특히, 일부 구현예에서, 제안되었지만 실험적으로 검증되지 않은 임의의 이론적, 계산적 또는 기타 상호작용을 명시적으로 배제하는 세포 구성요소 간의 실험적으로 지원된 물리적 상호작용을 나타내는 인간 상호작용체 맵 상에) 변경된 발현 수준을 갖는 유전자의 맵핑이 특정 요법, 및 특히 항-TNF 요법에 대한 반응자 대 무반응자를 정의하기 위한 유용하고 효과적인 분류기를 제공할 수 있다는 WO 제2019/178546호에도 기재된 통찰력을 이용한다. 일부 구현예에서, 이러한 분류기에 포함된 유전자는 인간 상호작용체 상의 연결된 모듈을 나타낸다.
본 개시내용은 특히 유용한 치료 분류기가 크로스 플랫폼 데이터의 사용을 통해 개발된다는 통찰력을 추가로 제공한다. 예를 들어, 본 개시내용은 차등 유전자 발현 분석과 발현된 서열의 서열 분석, 예컨대, 단일 뉴클레오타이드 다형성(SNP) 분석의 조합이 치료 분류기(즉, 관련 요법이 투여될 때 대상체(들)가 하나 이상의 특정 결과 또는 부작용(들) 등에 반응하고/거나 달성하거나 겪을 가능성을 예측하는 분류기)의 개발에 특히 유용하다는 것을 교시한다.
다양한 요법(예컨대, 항-TNF) 요법의 중요한 알려진 문제는 반응률이 일관되지 않다는 것이다. 실제로, 면역학 및 류마티스학 분야의 선두 과학자 및 임상의를 모아 이러한 분야에서 충족되지 않은 요구를 확인하기 위해 고안된 최근 국제 회의는 거의 보편적으로 반응률의 불확실성을 지속적인 과제로서 확인한다. 예를 들어, 류마티스성 관절염, 건선 관절염, 축성 척추관절염, 전신 홍반성 루푸스, 및 결합 조직 질환(예컨대, 쇼그렌 증후군, 전신 경화증, 베체트병을 포함하는 혈관염 및 IgG4 관련 질환)을 포함한 다양한 질환의 치료에서의 과제와 관련된 브레이크아웃 세션을 개최한 19회 연례 국제 표적 요법 회의는 이러한 모든 질환에 공통적인 특정 문제, 특히 "치료 반응에 대한 예측 도구가 개발될 수 있도록 ... 각 질환 내의 이질성을 더 잘 이해할 필요성"를 확인하였다. 예컨대 문헌[Winthrop, et al., "The unmet need in rheumatology: Reports from the targeted therapies meeting 2017," Clin. Immunol. pii: S1521-6616(17)30543-0, Aug. 12, 2017]을 참고한다. 유사하게도, 항-TNF 요법으로 크론병을 치료하는 것에 관한 광대한 문헌은 일관되게 불규칙한 반응률 및 어떤 환자가 이익을 얻을지 예측할 수 없음을 안타까워한다. 예컨대, 문헌[M.T. Abreu, "Anti-TNF Failures in Crohn's Disease," Gastroenterol Hepatol (N.Y.), 7(1):37-39 (Jan. 2011)]을 참고하며, 또한 문헌[Ding et al., "Systematic review: predicting and optimising response to anti-TNF therapy in Crohn's disease - algorithm for practical management," Aliment Pharmacol. Ther., 43(1):30-51 (Jan. 2016)(항-TNF 치료에 대한 1차 무반응이 환자의 13-40%에 영향을 미친다고 보고함)]을 참고한다.
따라서, 현재 항-TNF 요법을 투여 중인 상당수의 환자는 치료로부터 이익을 얻지 못하고 오히려 해를 입을 수도 있다. 항-TNF 요법과 관련된 심각한 감염 및 악성종양의 알려진 위험은 너무 심각해서 제품 승인은 전형적으로 소위 "블랙박스 경고"가 라벨에 포함될 것을 요구한다. 이러한 요법의 다른 잠재적인 부작용은, 예를 들어, 울혈성 심부전, 탈수초 질환, 및 다른 전신 부작용을 포함한다. 또한, 환자가 항-TNF 요법에 반응하지 않는 것으로 확인되기까지(즉, 항-TNF 요법에 무반응자임) 몇 주 내지 몇 개월의 치료가 필요하다는 점을 고려할 때, 현재 반응자 대 무반응자 대상체를 확인하지 못한 결과로 이러한 환자의 적절한 치료가 상당히 지연될 수 있다. 예컨대, 문헌[Roda et al., "Loss of Response to Anti-TNFs: Definition, Epidemiology, and Management," Clin. Tranl. Gastroenterol., 7(1):e135 (Jan. 2016) (Hanauer et al., "ACCENT I Study group. Maintenance Infliximab for Crohn's disease: the ACCENT I randomized trial," Lancet 59:1541-1549 (2002); Sands et al., "Infliximab maintenance therapy for fistulizing Crohn's disease," N. Engl. J. Med. 350:876-885 (2004) 언급)]을 참고한다.
따라서, 일부 구현예에서, 본 개시내용은 대상체를 항-TNF 요법으로 치료하는 방법을 제공하며, 방법은 항-TNF 요법을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계를 포함하고, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 및 하기 중 적어도 하나: 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발된다.
일부 구현예에서, 본 개시내용은 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측하도록 결정된 분류기의 적용에 의해 반응성으로 분류된 대상체에게 항-TNF 요법을 투여하는 단계를 포함하는 염증성 질환, 장애, 또는 병태를 치료하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계; 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는 대상체를 하나 이상의 치료 속성에 대해 계층화하기 위한 분류기를 개발하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은, 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석함으로써, 하나 이상의 치료 속성에 대해 대상체를 계층화하기 위한 분류기를 개발하는 방법에서, 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는 개선을 제공한다.
일부 구현예에서, 본 개시내용은 자가면역 장애를 겪고 있는 대상체를 치료하는 방법을 제공하며, 방법은 항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계를 포함하고; 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 하기 중 적어도 하나: 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발되며; 분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증된다.
일부 구현예에서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 하나 이상의 유전자는 인간 상호작용체 맵 상에 맵핑될 때 이들의 위상학적 특성에 의해 특성화된다. 일부 구현예에서, SNP는 인간 게놈을 참조하여 확인된다. 일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 하나 이상의 SNP의 존재; 및 적어도 하나의 임상 특징 각각을 평가함으로써 개발된다.
일부 구현예에서, 하나 이상의 유전자는 하기에서 선택된다:
Figure pct00001
일부 구현예에서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택된다. 일부 구현예에서, 분류기는 적어도 90% 정확성으로 무반응성인 집단 내의 대상체 중 적어도 40%를 확인하며, 집단은 적어도 170명의 대상체를 포함한다.
일부 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여를 포함한다. 일부 구현예에서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택된다. 일부 구현예에서, 분류기는 반응성 및 무반응성의 사전 대상체로부터 유래된 마이크로어레이 분석을 사용하여 확립된다. 일부 구현예에서, 분류기는 독립적인 코호트로부터 유래된 RNAseq 데이터를 사용하여 검증된다. 일부 구현예에서, SNP는 표 5에서 선택된다.
일부 구현예에서, 본 개시내용은 자가면역 질환을 겪고 있는 대상체에게 요법을 투여하는 방법을 제공하며, 방법은 항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성 또는 무반응성으로 분류된 대상체에게 요법을 투여하는 단계로서; 대상체가 분류기에 의해 반응성으로 분류되는 경우, 항-TNF 요법을 투여하고; 대상체가 분류기에 의해 무반응성으로 분류되는 경우, 항-TNF 요법의 대안을 투여하는 단계를 포함하고; 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 하기 중 적어도 하나: 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발되고; 분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증된다.
일부 구현예에서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 하나 이상의 SNP의 존재; 및 적어도 하나의 임상 특징 각각을 평가함으로써 개발된다.
일부 구현예에서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택된다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여를 포함한다.
일부 구현예에서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트에서 선택된다.
일부 구현예에서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택된다.
일부 구현예에서, 본 개시내용은 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계; 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는 대상체를 하나 이상의 치료 속성에 대해 계층화하기 위한 분류기를 개발하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은, 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석함으로써, 하나 이상의 치료 속성에 대해 대상체를 계층화하기 위한 분류기를 개발하는 방법에서, 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 및 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는 개선을 제공한다.
일부 구현예에서, 하나 이상의 치료 속성은 특정 질환, 장애, 또는 병태의 발병 위험, 특정 질환, 장애, 또는 병태에 대한 특정 결과의 가능성, 특정 요법에 대한 반응의 가능성으로 이루어진 군에서 선택된다. 일부 구현예에서, 하나 이상의 치료 속성은 특정 요법에 대한 반응의 가능성이다. 일부 구현예에서, 특정 요법은 항-TNF 요법이다. 일부 구현예에서, 하나 이상의 SNP의 존재를 평가하는 것은 RNA의 서열 데이터를 참조 인간 게놈과 비교하는 것을 포함한다.
일부 구현예에서, 본 개시내용은 자가면역 질환을 겪고 있는 대상체를 치료하는 방법을 제공하며, 방법은 (a) 컴퓨팅 장치의 프로세서에 의해, 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 유전자는 표 1에서 선택되는 단계; (b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로, (c) 대상체가 항-TNF 요법에 대해 무반응성으로 분류된 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 투여하거나; 또는 대상체가 항-TNF 요법에 대해 반응성으로 분류된 경우, 항-TNF 요법을 투여하는 단계를 포함한다.
일부 구현예에서, 단계 (a)에서의 프로세서는 하나 이상의 임상 특징; 또는 하나 이상의 단일 뉴클레오타이드 다형성(SNP) 중 적어도 하나에 상응하는 데이터를 추가로 수신한다.
일부 구현예에서, 하나 이상의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택된다. 일부 구현예에서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염에서 선택된다. 일부 구현예에서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염이다.
일부 구현예에서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트에서 선택된다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러에서 선택된다.
일부 구현예에서, 단계 (b)는 기계 학습 모델을 사용하여 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 기계 학습 모델은 랜덤 포레스트 모델이다.
일부 구현예에서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 단계 (b)는 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다.
일부 구현예에서, 본 개시내용은 (a) 컴퓨팅 장치의 프로세서에 의해, 자가면역 질환(예컨대, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 11개의 모든 구성원(들))을 포함하는 단계; (b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여 항-TNF 요법에 대해 무반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로, (c) 질환의 치료를 위해 대상체에게 제2 요법(예컨대, 제1 요법에 대한 대안, 예컨대, 항-TNF 요법에 대한 대안)을 처방 및/또는 투여하여, 대상체에의 제1 요법의 처방 및/또는 투여를 피하는 단계를 포함하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은 (a) 컴퓨팅 장치의 프로세서에 의해, 질환(예컨대, 자가면역 질환, 예컨대, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 구성원(들))을 포함하는 단계; (b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여 제1 요법(예컨대, 항-TNF 요법)에 대해 반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로, (c) 질환의 치료를 위해 대상체에게 제1 요법을 처방 및/또는 투여하는 단계를 포함하는 방법을 제공한다.
일부 구현예에서, 단계 (b)는 기계 학습 모델(예컨대, 랜덤 포레스트 모델)을 사용하여 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다.
일부 구현예에서, 본 개시내용은 대상체의 게놈 데이터(예컨대, 차세대 RNA-seq 데이터)의 분석을 위한(예컨대, 그리고 상기 게놈 데이터에 기초하여 상기 대상체의 분류의 결정을 위한) 파이프라인(예컨대, 컴퓨터 아키텍처 파이프라인)을 제공하며, 상기 파이프라인은 복수의 모듈을 포함하고, 각각의 모듈은 상기 모듈의 업데이트 후에 독립적으로 검증될 수 있다.
일부 구현예에서, 상기 복수의 모듈은 하나 이상의 기계 학습 모델을 포함한다.
일부 구현예에서, 상기 복수의 모듈은 하나 이상의 알려진 생물정보학 모듈(예컨대, RSEM 및/또는 STAR) 및 하나 이상의 독점 분류 모듈(들)을 포함한다.
일부 구현예에서, 본 개시내용은 자가면역 질환을 겪고 있는 대상체를 상기 대상체에게 항-TNF 요법의 임의의 투여 전에 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 분류하는 방법을 제공하며, 방법은 (a) 컴퓨팅 장치의 프로세서에 의해, 하기로 이루어진 군에서 선택되는 하나 이상의 유전자 각각의 대상체에 대한 발현 수준에 상응하는 데이터를 수신하는 단계:
Figure pct00002
및 (b) 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하는 단계를 포함한다.
일부 구현예에서, 자가면역 질환을 겪고 있는 대상체를 상기 대상체에게 항-TNF 요법의 임의의 투여 전에 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 분류하는 방법은, (c) 대상체가 단계 (b)에서 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 처방 및/또는 투여하는 단계; 또는 대상체가 단계 (b)에서 항-TNF 요법에 대해 반응성으로 분류되는 경우, 대상체에게 항-TNF 요법을 투여하는 단계를 추가로 포함한다.
일부 구현예에서, 단계 (a)에서의 프로세서는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 수신한다: (i) 대상체의 하나 이상의 임상 특징; (ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
일부 구현예에서, 단계 (a)에서의 프로세서는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 수신한다.
일부 구현예에서, 단계 (a)에서의 프로세서는 표 5에 열거된 하나 이상의 SNP에 상응하는 데이터를 수신한다.
일부 구현예에서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염으로 이루어진 군에서 선택되는 구성원이다. 일부 구현예에서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염이다.
일부 구현예에서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함한다.
일부 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 및 전술한 것 중 어느 것의 바이오시밀러로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함한다.
일부 구현예에서, 항-TNF 요법에 대한 대안은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 및 전술한 것 중 어느 것의 임의의 바이오시밀러로 이루어진 군의 임의의 구성원을 포함하지 않는다.
일부 구현예에서, 단계 (b)는 기계 학습 모델을 사용하여 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 기계 학습 모델은 랜덤 포레스트 모델이다.
일부 구현예에서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 단계 (b)는 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다. 일부 구현예에서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함한다.
일부 구현예에서, 본 개시내용은 자가면역 질환을 겪고 있는 대상체를 상기 대상체에게 항-TNF 요법의 임의의 투여 전에 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 분류하는 방법을 제공하며, 방법은 (a) 컴퓨팅 장치의 프로세서에 의해, 자가면역 질환을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 단계; (b) 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로, 대상체의 분류를 자동으로 결정하는 단계를 포함한다.
일부 구현예에서, 자가면역 질환을 겪고 있는 대상체를 상기 대상체에게 항-TNF 요법의 임의의 투여 전에 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 분류하는 방법은 (c) 대상체가 단계 (b)에서 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 처방 및/또는 투여하거나; 또는 대상체가 단계 (b)에서 항-TNF 요법에 대해 반응성으로 분류되는 경우, 대상체에게 항-TNF 요법을 투여하는 단계를 추가로 포함한다.
일부 구현예에서, 자가면역 질환은 류마티스성 관절염이다.
일부 구현예에서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 2개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계를 포함한다.
일부 구현예에서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 3개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계를 포함한다.
일부 구현예에서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 5개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계를 포함한다.
일부 구현예에서, 단계 (a)에서의 프로세서는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 수신한다: (i) 대상체의 하나 이상의 임상 특징; (ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
일부 구현예에서, 단계 (a)에서의 프로세서는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 수신한다.
일부 구현예에서, 단계 (a)에서의 프로세서는 표 5에 열거된 하나 이상의 SNP에 상응하는 데이터를 수신한다.
일부 구현예에서, 본 개시내용은 자가면역 질환을 겪고 있는 대상체를 상기 대상체에게 항-TNF 요법의 임의의 투여 전에 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 분류하기 위한 시스템을 제공하며, 시스템은 프로세서; 및 그 위에 명령을 갖는 메모리를 포함하고, 프로세서에 의해 실행시, 명령은 프로세서가 (a) 데이터의 세트를 수신하게 하고, 상기 데이터의 세트는 하기로 이루어진 군에서 선택되는 하나 이상의 유전자 각각의 대상체에 대한 발현 수준을 포함하며:
Figure pct00003
(b) 데이터의 세트를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하게 한다.
일부 구현예에서, 데이터의 세트는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 포함한다: (i) 대상체의 하나 이상의 임상 특징; (ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
일부 구현예에서, 데이터의 세트는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 포함한다.
일부 구현예에서, 데이터의 세트는 표 5에 열거된 하나 이상의 SNP를 포함한다.
일부 구현예에서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염으로 이루어진 군에서 선택되는 구성원이다. 일부 구현예에서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염이다. 일부 구현예에서, 자가면역 질환은 류마티스성 관절염이다.
정의
투여 : 본원에 사용된 바와 같이, 용어 "투여"는 전형적으로, 예를 들어 조성물이거나, 또는 조성물에 포함되거나 조성물에 의해 전달되는 제제의 전달을 달성하기 위해, 대상체 또는 시스템에게 조성물을 투여하는 것을 지칭한다.
제제 : 본원에 사용된 바와 같이, 용어 "제제"는 개체(entity)(예를 들어, 지질, 금속, 핵산, 폴리펩타이드, 다당류, 소분자 등, 또는 이의 복합체, 조합, 혼합물 또는 시스템[예컨대, 세포, 조직, 유기체]), 또는 현상(예컨대, 열, 전류 또는 전계, 자기력 또는 자기장 등)를 지칭한다.
아미노산: 본원에 사용된 바와 같이, 용어 "아미노산"은, 예컨대, 하나 이상의 펩타이드 결합의 형성을 통해, 폴리펩타이드 사슬 내로 혼입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 구현예에서, 아미노산은 일반 구조 H2N-C(H)(R)-COOH를 갖는다. 일부 구현예에서, 아미노산은 자연발생 아미노산이다. 일부 구현예에서, 아미노산은 비자연 아미노산이고; 일부 구현예에서, 아미노산은 D-아미노산이며; 일부 구현예에서, 아미노산은 L-아미노산이다. 본원에 사용된 바와 같이, 용어 "표준 아미노산"은 자연발생 펩타이드에서 일반적으로 발견되는 20개의 L-아미노산 중 어느 것을 지칭한다. "비표준 아미노산"은 그것이 천연 공급원에서 발견되는지 또는 발견될 수 있는 여부에 관계없이 표준 아미노산 이외의 임의의 아미노산을 지칭한다. 일부 구현예에서, 폴리펩타이드 내의 카르복시- 및/또는 아미노-말단 아미노산을 포함하는 아미노산은 상기 일반 구조와 비교하여 구조적 변형을 함유할 수 있다. 예를 들어, 일부 구현예에서, 아미노산은 일반 구조와 비교하여 메틸화, 아미드화, 아세틸화, 페길화, 글리코실화, 인산화, 및/또는 치환(예컨대, 아미노기, 카르복실산기, 하나 이상의 양성자, 및/또는 하이드록실기)에 의해 변형될 수 있다. 일부 구현예에서, 이러한 변형은, 예를 들어, 동일한 변형되지 않은 아미노산을 함유하는 폴리펩타이드와 비교하여 변형된 아미노산을 함유하는 폴리펩타이드의 안정성 또는 순환 반감기를 변경할 수 있다. 일부 구현예에서, 이러한 변형은 동일한 변형되지 않은 아미노산을 함유하는 폴리펩타이드와 비교하여 변형된 아미노산을 함유하는 폴리펩타이드의 관련 활성을 유의하게 변경하지 않는다. 문맥으로부터 명백한 바와 같이, 일부 구현예에서, 용어 "아미노산"은 유리 아미노산을 지칭하기 위해 사용될 수 있고; 일부 구현예에서 그것은 폴리펩타이드의 아미노산 잔기, 예컨대, 폴리펩타이드 내의 아미노산 잔기를 지칭하기 위해 사용될 수 있다.
유사체 : 본원에 사용된 바와 같이, 용어 "유사체"는 참조 물질과 하나 이상의 특정한 구조적 특징, 요소, 구성요소, 또는 모이어티를 공유하는 물질을 지칭한다. 전형적으로, "유사체"는, 예를 들어 코어 또는 공통 구조를 공유하는 참조 물질과 상당한 구조적 유사성을 나타내지만, 특정 별개 방식에서 상이하다. 일부 구현예에서, 유사체는, 예컨대, 참조 물질의 화학적 조작에 의해, 참조 물질로부터 생성될 수 있는 물질이다. 일부 구현예에서, 유사체는 참조 물질을 생성하는 것과 실질적으로 유사한(예컨대, 이와 복수의 단계를 공유하는) 합성 과정의 수행을 통해 생성될 수 있는 물질이다. 일부 구현예에서, 유사체는 참조 물질을 생성하는 데 사용된 것과 상이한 합성 과정의 수행을 통해 생성되거나 생성될 수 있다.
길항제 : 본원에 사용된 바와 같이, 용어 "길항제"는 그의 존재, 수준, 정도, 유형, 또는 형태가 표적의 감소된 수준 또는 활성과 연관된 제제, 또는 조건을 지칭할 수 있다. 길항제는, 예를 들어, 소분자, 폴리펩타이드, 핵산, 탄수화물, 지질, 금속, 및/또는 관련 억제 활성을 나타내는 임의의 다른 개체를 포함하는, 임의의 화학적 부류의 제제를 포함할 수 있다. 일부 구현예에서, 길항제는 그것이 그의 표적에 직접 결합한다는 점에서 "직접 길항제"일 수 있고, 일부 구현예에서, 길항제는 그것이 그의 표적에 직접 결합하지 않는 수단에 의해, 예컨대 표적의 수준 또는 활성이 변경되도록 표적의 조절제와 상호작용함으로써, 그의 영향을 발휘한다는 점에서 "간접 길항제"일 수 있다. 일부 구현예에서, "길항제"는 "억제제"로서 지칭될 수 있다.
항체: 본원에 사용된 바와 같이, 용어 "항체"는 특정한 표적 항원에 특이적 결합을 부여하기에 충분한 표준 면역글로불린 서열 요소를 포함하는 폴리펩타이드를 지칭한다. 당업계에 공지된 바와 같이, 자연에서 생산된 온전한 항체는 일반적으로 "Y 모양의" 구조로 지칭되는 것으로 서로 회합하는 2개의 동일한 중쇄 폴리펩타이드(각각 약 50 kD) 및 2개의 동일한 경쇄 폴리펩타이드(각각 약 25 kD)로 구성된 대략 150 kD 사량체성 제제이다. 각각의 중쇄는 적어도 4개의 도메인(각각 약 110개의 아미노산 길이)인 아미노-말단 가변(VH) 도메인(Y 구조의 끝에 위치함) 다음에 3개의 불변 도메인: CH1, CH2, 및 카르복시-말단 CH3(Y의 줄기(stem)의 맨 아래에 위치함)으로 구성된다. "스위치(switch)"로 알려진 짧은 영역은 중쇄 가변 및 불변 영역을 연결한다. "힌지(hinge)"는 CH2 및 CH3 도메인을 항체의 나머지에 연결한다. 이러한 힌지 영역에 있는 2개의 디설파이드 결합은 온전한 항체에서 2개의 중쇄 폴리펩타이드를 서로 연결한다. 각각의 경쇄는 또 다른 "스위치"에 의해 서로 분리된, 2개의 도메인인 아미노-말단 가변(VL) 도메인 다음에 카르복시-말단 불변(CL) 도메인으로 구성된다. 온전한 항체 사량체는 중쇄 및 경쇄가 단일 디설파이드 결합에 의해 서로 연결된 2개의 중쇄-경쇄 이량체로 구성되고; 2개의 다른 디설파이드 결합은 중쇄 힌지 영역을 서로 연결하여, 이량체가 서로 연결되고 사량체가 형성된다. 자연적으로 생산된 항체는 또한 전형적으로 CH2 도메인에서 글리코실화된다. 자연 항체 내의 각 도메인은 압축된 역평행 베타 배럴로 서로에 대해 패킹된 2개의 베타 시트(예컨대, 3, 4, 또는 5 가닥 시트)로부터 형성된 "면역글로불린 접힘"을 특징으로 하는 구조를 갖는다. 각 가변 도메인은 "보체 결정 영역"(CDR1, CDR2, 및 CDR3)으로 알려진 3개의 초가변 루프 및 4개의 다소 불변인 "프레임워크" 영역(FR1, FR2, FR3, 및 FR4)을 함유한다. 자연 항체가 접힐 때, FR 영역은 도메인에게 구조적 프레임워크를 제공하는 베타 시트를 형성하고, 중쇄 및 경쇄 모두로부터의 CDR 루프 영역은 3차원 공간에서 합쳐져 Y 구조의 끝에 위치한 단일 초가변 항원 결합 부위를 생성한다. 자연발생 항체의 Fc 영역은 보체 시스템의 요소에 결합하고, 예를 들어 세포독성을 매개하는 효과기 세포를 포함하는 효과기 세포 상의 수용체에도 결합한다. 당업계에 알려진 바와 같이, Fc 수용체에 대한 Fc 영역의 친화성 및/또는 다른 결합 속성은 글리코실화 또는 다른 변형을 통해 조절될 수 있다. 일부 구현예에서, 본 발명에 따라 생산되고/거나 이용된 항체는 이러한 변형되거나 조작된 글리코실화를 갖는 Fc 도메인을 포함하는 글리코실화된 Fc 도메인을 포함한다. 본 발명의 목적을 위해, 특정 구현예에서, 자연 항체에서 발견되는 바와 같은 충분한 면역글로불린 도메인 서열을 포함하는 임의의 폴리펩타이드 또는 폴리펩타이드의 복합체는 그러한 폴리펩타이드가 자연적으로 생산(예컨대, 항원에 반응하는 유기체에 의해 생성)되는지, 또는 재조합 공학, 화학적 합성, 또는 다른 인공 시스템 또는 방법에 의해 생산되는지 여부에 상관없이 "항체"로 지칭되고/거나 사용될 수 있다. 일부 구현예에서, 항체는 다클론성이며; 일부 구현예에서, 항체는 단클론성이다. 일부 구현예에서, 항체는 마우스, 토끼, 영장류, 또는 인간 항체의 특징인 불변 영역 서열을 갖는다. 일부 구현예에서, 항체 서열 요소는 당업계에 알려진 바와 같이 인간화, 영장류화, 키메라 등이다. 더욱이, 본원에 사용된 바와 같이 용어 "항체"는 적절한 구현예에서(달리 언급되지 않거나 문맥으로부터 명백하지 않는 한) 대안적인 표현으로 항체 구조적 및 기능적 특징을 이용하기 위한 당업계에 공지되거나 개발된 작제물 또는 형식 중 어느 것을 지칭할 수 있다. 예를 들어, 일 구현예에서, 본 발명에 따라 이용되는 항체는 비제한적으로, 온전한 IgA, IgG, IgE 또는 IgM 항체; 이중 또는 다중 특이적 항체(예컨대, Zybodies® 등); 항체 단편, 예컨대 Fab 단편, Fab' 단편, F(ab')2 단편, Fd' 단편, Fd 단편, 및 단리된 CDR 또는 이의 세트; 단일 사슬 Fv; 폴리펩타이드-Fc 융합; 단일 도메인 항체(예컨대, 상어 단일 도메인 항체, 예컨대 IgNAR 또는 이의 단편); 카멜로이드 항체; 마스크된 항체(예컨대, Probodies®); Small Modular ImmunoPharmaceuticals("SMIPsTM"); 단일 사슬 또는 탠덤 디아바디(TandAb®); VHH; Anticalins®; Nanobodies® 미니바디; BiTE®; 안키린 반복 단백질 또는 DARPINs®; Avimers®; DART; TCR-유사 항체;, Adnectins®; Affilins®; Trans-bodies®; Affibodies®; TrimerX®; MicroProteins; Fynomers®, Centyrins®; 및 KALBITOR®에서 선택된 형태이다. 일부 구현예에서, 항체는 자연적으로 생성되면 가질 공유 변형(예컨대, 글리칸의 부착)이 결여될 수 있다. 일부 구현예에서, 항체는 공유 변형(예컨대, 글리칸, 페이로드[예컨대, 검출가능한 모이어티, 치료 모이어티, 촉매 모이어티 등], 또는 다른 펜던트기[예컨대, 폴리-에틸렌 글리콜 등]의 부착)을 함유할 수 있다.
연관된 : 2개의 사건 또는 개체는 하나의 존재, 수준, 정도, 유형 및/또는 형태가 다른 것과 상관관계가 있는 경우, 본원에 사용된 용어와 같이 서로 "연관"된다. 예를 들어, 특정 개체(예컨대, 폴리펩타이드, 유전적 서명, 대사산물, 미생물 등)는 그의 존재, 수준 및/또는 형태가 질환, 장애, 또는 병태의 발생 및/또는 감수성과 상관관계가 있는 경우(예컨대, 관련 집단에 걸쳐) 특정 질환, 장애, 또는 병태와 연관된 것으로 간주된다. 일부 구현예에서, 2개 이상의 개체는 이들이 직접 또는 간접적으로 상호작용하여 서로 물리적으로 근접하고/거나 이를 유지하는 경우 서로 물리적으로 "연관"된다. 일부 구현예에서, 물리적으로 서로 연관된 2개 이상의 개체는 서로 공유적으로 연결되고, 일부 구현예에서, 물리적으로 서로 연관된 2개 이상의 개체는 서로 공유적으로 연결되지 않지만 예를 들어 수소 결합, 반 데르 발스 상호작용, 소수성 상호작용, 자성, 및 이의 조합에 의해 비공유적으로 연관된다.
생물학적 샘플 : 본원에 사용된 바와 같이, 용어 "생물학적 샘플"은 전형적으로 본원에 기재된 바와 같은 관심있는 생물학적 공급원(예컨대, 조직 또는 유기체 또는 세포 배양물)으로부터 수득되거나 유래된 샘플을 지칭한다. 일부 구현예에서, 관심있는 공급원은 유기체, 예컨대 동물 또는 인간을 포함한다. 일부 구현예에서, 생물학적 샘플은 생물학적 조직 또는 유체이거나 이를 포함한다. 일부 구현예에서, 생물학적 샘플은 골수; 혈액; 혈액 세포; 복수; 조직 또는 미세 바늘 생검 샘플; 세포 함유 체액; 자유 부유 핵산; 가래; 타액; 소변; 뇌척수액, 복막액; 흉막액; 대변; 림프; 부인과 유체; 피부 면봉; 질 면봉; 구강 면봉; 비강 면봉; 세척액, 예컨대 유관 세척액 또는 기관지폐포 세척액; 흡인액; 부스러스; 골수 표본; 조직 생검 표본; 수술 표본; 대변, 다른 체액, 분비물, 및/또는 배설물; 및/또는 이로부터의 세포 등이거나 이를 포함한다. 일부 구현예에서, 생물학적 샘플은 개체로부터 수득된 세포이거나 이를 포함한다. 일부 구현예에서, 수득된 세포는 샘플이 수득된 개체로부터의 세포이거나 이를 포함한다. 일부 구현예에서, 샘플은 임의의 적절한 수단에 의해 관심있는 공급원으로부터 직접 수득된 "일차 샘플"이다. 예를 들어, 일부 구현예에서, 일차 생물학적 샘플은 생검(예컨대, 미세 바늘 흡인 또는 조직 생검), 수술, 체액(예컨대, 혈액, 림프, 대변 등)의 수집 등으로 이루어진 군에서 선택되는 방법에 의해 수득된다. 일부 구현예에서, 문맥으로부터 명확한 바와 같이, 용어 "샘플"은 일차 샘플을 가공함으로써(예컨대, 하나 이상의 구성요소를 제거함으로써 및/또는 하나 이상의 제제를 첨가함으로써), 예를 들어, 반투과성 막을 사용한 여과에 의해 수득되는 제제를 지칭한다. 이러한 "가공된 샘플"은, 예를 들어 샘플로부터 추출된 핵산 또는 단백질을 포함할 수 있거나, 일차 샘플을 mRNA의 증폭 또는 역전사, 특정 구성요소의 단리 및/또는 정제 등과 같은 기술에 적용하여 수득된 핵산 또는 단백질을 포함할 수 있다.
조합 요법: 본원에 사용된 바와 같이, 용어 "조합 요법"은 대상체가 2개 이상의 치료 요법(예컨대, 2개 이상의 치료제)에 동시에 노출되는 임상 개입을 지칭한다. 일부 구현예에서, 2개 이상의 치료 요법은 동시에 투여될 수 있다. 일부 구현예에서, 2개 이상의 치료 요법은 순차적으로 투여될 수 있다(예컨대, 제1 요법은 제2 요법의 임의의 용량을 투여하기 전에 투여됨). 일부 구현예에서, 2개 이상의 치료 요법은 중첩되는 투여 요법으로 투여된다. 일부 구현예에서, 조합 요법의 투여는 다른 제제(들) 또는 양식을 받고 있는 대상체에게 하나 이상의 치료제 또는 양상을 투여하는 것을 포함할 수 있다. 일부 구현예에서, 조합 요법은 개별 제제가 반드시 단일 조성물로 함께(또는 심지어는 반드시 동시에) 투여되는 것을 요구하지 않는다. 일부 구현예에서, 조합 요법의 2개 이상의 치료제 또는 양상은 개별적으로, 예컨대, 별도의 조성물로, 별도의 투여 경로(예컨대, 하나의 제제는 경구로, 또 다른 제제는 정맥내로)를 통해, 및/또는 상이한 시점에 대상체에게 투여된다. 일부 구현예에서, 2개 이상의 치료제는 조합 조성물로, 또는 심지어 조합 화합물로(예컨대, 단일 화학적 복합체 또는 공유 개체의 일부로서), 동일한 투여 경로를 통해, 및/또는 동시에 함께 투여될 수 있다.
대등한 : 본원에 사용된 바와 같이, 용어 "대등한"은 서로 동일하지 않을 수 있지만 서로 비교를 허용하기에 충분히 유사한 2개 이상의 제제, 개체, 상황, 조건 세트 등을 지칭하므로, 당업자는 관찰된 차이 또는 유사에 기초하여 결론이 합리적으로 도출될 수 있음을 이해할 것이다. 일부 구현예에서, 조건, 상황, 개체, 또는 집단의 대등한 세트는 복수의 실질적으로 동일한 특징 및 하나 또는 소수의 다양한 특징에 의해 특성화된다. 당업자는 맥락에서 동등한 것으로 간주되기 위해 2개 이상의 이러한 제제, 객체, 상황, 조건 세트 등에 대해 임의의 주어진 상황에서 어떤 정도의 동일성이 요구되는지 이해할 것이다. 예를 들어, 당업자는 상황, 개체, 또는 집단의 상이한 세트 하에 또는 이를 이용하여 수득된 결과 또는 관찰된 현상의 차이가 다양한 상기 특징의 변화에 의해 유발되거나 이를 나타낸다는 합리적인 결론을 보장하기에 충분한 수 및 유형의 실질적으로 동일한 특징에 의해 특성화될 때 상황, 개체, 또는 집단의 세트가 서로 대등한 것으로 이해할 것이다.
상응하는 : 본원에 사용된 바와 같이, 문구 "상응하는"은 "상응하는" 속성이 명백하도록 합리적으로 대등하기에 충분한 특성을 공유하는 2개의 개체, 사건, 또는 현상 사이의 관계를 지칭한다. 예를 들어, 일부 구현예에서, 용어는 적절한 참조 화합물 또는 조성물과의 비교를 통해 화합물 또는 조성물에서 구조적 요소의 위치 및/또는 동일성을 지정하기 위해 화합물 또는 조성물을 참조하여 사용될 수 있다. 예를 들어, 일부 구현예에서, 다량체 내의 단량체성 잔기(예컨대, 폴리펩타이드 내의 아미노산 잔기 또는 폴리뉴클레오타이드 내의 핵산 잔기)는 적절한 참조 중합체 내의 잔기에 "상응하는" 것으로서 확인될 수 있다. 예를 들어, 당업자는 단순함을 위해 폴리펩타이드 내의 잔기가 종종 참조 관련 폴리펩타이드를 기반으로 하는 표준 넘버링 시스템을 사용하여 지정된다는 것을 이해할 것이므로, 예를 들어 위치 190에서의 잔기에 "상응하는" 아미노산은 실제로 특정 아미노산 사슬 내의 190번째 아미노산일 필요는 없고 오히려 참조 폴리펩타이드 내의 190에서 발견되는 잔기에 상응하며; 당업자는 "상응하는" 아미노산을 확인하는 방법을 쉽게 인식한다. 예를 들어, 당업자는, 예를 들어, 본 개시내용에 따른 폴리펩타이드 및/또는 핵산에서 "상응하는" 잔기를 확인하는 데 활용될 수 있는, 예를 들어, BLAST, CS-BLAST, CUSASW++, DIAMOND, FASTA, GGSEARCH/GLSEARCH, Genoogle, HMMER, HHpred/HHsearch, IDF, Infernal, KLAST, USEARCH, parasail, PSI-BLAST, PSI-Search, ScalaBLAST, Sequilab, SAM, SSEARCH, SWAPHI, SWAPHI-LS, SWIMM, 또는 SWIPE와 같은 소프트웨어 프로그램을 포함하는 다양한 서열 정렬 전략을 알 것이다.
투여 요법: 본원에 사용된 바와 같이, 용어 "투여 요법"은 전형적으로 시간에 의해 분리된, 대상체에게 개별적으로 투여되는 단위 용량 세트(전형적으로 하나 초과)를 지칭한다. 일부 구현예에서, 주어진 치료제는 하나 이상의 용량을 포함할 수 있는 권장된 투여 요법을 갖는다. 일부 구현예에서, 투여 요법은 각각이 다른 용량과 시간상 분리되는 복수의 용량을 포함한다. 일부 구현예에서, 개별 용량은 동일한 길이의 시간에 의해 서로 분리되고; 일부 구현예에서, 투여 요법은 복수의 용량 및 개별 용량을 분리하는 적어도 2개의 상이한 시간을 포함한다. 일부 구현예에서, 투여 요법 내의 모든 용량은 동일한 단위 용량 양이다. 일부 구현예에서, 투여 요법 내의 상이한 용량은 상이한 양이다. 일부 구현예에서, 투여 요법은 제1 용량 양의 제1 용량 다음에 제1 용량 양과 상이한 제2 용량 양의 하나 이상의 추가 용량을 포함한다. 일부 구현예에서, 투여 요법은 제1 용량 양의 제1 용량 다음에 제1 용량 양과 동일한 제2 용량 양의 하나 이상의 추가 용량을 포함한다. 일부 구현예에서, 투여 요법은 관련 집단에 걸쳐 투여될 때 원하는 또는 유익한 결과와 상관관계가 있다(즉, 치료 투여 요법이다).
개선된, 증가된 또는 감소된: 본원에 사용된 바와 같이, 용어 "개선된," "증가된," 또는 "감소된,", 또는 이의 문법적으로 대등한 비교 용어는 대등한 참조 측정값에 대비한 값을 나타낸다. 예를 들어, 일부 구현예에서, 관심있는 제제로 달성된 평가 값은 대등한 참조 제제로 수득된 평가 값에 비해 "개선"될 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, 관심있는 대상체 또는 시스템에서 달성된 평가 값은 상이한 조건 하에(예컨대, 관심있는 제제의 투여와 같은 사건 전 또는 후에) 동일한 대상체 또는 시스템에서, 또는 상이한 대등한 대상체에서(예컨대, 관심있는 특정 질환, 장애, 또는 병태의 하나 이상의 지표의 존재하에, 또는 조건 또는 제제 등의 이전 노출하에 관심있는 대상체 또는 시스템과 상이한 대등한 대상체 또는 시스템에서) 수득된 평가 값에 비해 "개선"될 수 있다.
약학 조성물: 본원에 사용된 바와 같이, 용어 "약학 조성물"은 하나 이상의 약학적으로 허용되는 담체와 함께 제제화된 활성제를 지칭한다. 일부 구현예에서, 활성제는 관련 대상체에 대한 치료 요법에서(예컨대, 투여될 때 미리 결정된 치료 효과를 달성할 통계적으로 유의한 확률을 나타내는 것으로 입증된 양으로), 또는 상이한 대등한 대상체에서(예컨대, 관심있는 특정 질환, 장애, 또는 병태의 하나 이상의 지표의 존재하에, 또는 병태 또는 제제 등에 대한 이전 노출하에 관심있는 대상체 또는 시스템과 상이한 대등한 대상체 또는 시스템에서) 투여에 적절한 단위 용량 양으로 존재한다. 일부 구현예에서, 비교 용어는 통계적으로 관련된 차이(예컨대, 통계적 관련성을 달성하기에 충분한 유병률 및/또는 크기)를 지칭한다. 당업자는, 주어진 맥락에서, 이러한 통계적 유의성을 달성하는 데 필요하거나 충분한 차이의 정도 및/또는 유병률을 인식할 수 있거나 쉽게 결정할 수 있을 것이다.
약학적으로 허용되는: 본원에 사용된 바와 같이, 문구 "약학적으로 허용되는"은 건전한 의학적 판단의 범위 내에서, 합리적인 이익/위험 비율에 상응하는, 과도한 독성, 자극, 알레르기 반응, 또는 다른 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합한 화합물, 물질, 조성물, 및/또는 투여 형태를 지칭한다.
참조 : 본원에 사용된 바와 같이, 용어 "참조"는 비교가 수행되는 표준 또는 대조군을 기술한다. 예를 들어, 일부 구현예에서, 관심있는 제제, 동물, 개체, 집단, 샘플, 서열 또는 값은 참조 또는 대조군 제제, 동물, 개체, 집단, 샘플, 서열 또는 값과 비교된다. 일부 구현예에서, 참조 또는 대조군은 관심있는 시험 또는 결정과 실질적으로 동시에 시험 및/또는 결정된다. 일부 구현예에서, 참조 또는 대조군은, 선택적으로 유형적 매체로 구현된, 과거의 참조 또는 대조군이다. 전형적으로, 당업자에 의해 이해되는 바와 같이, 참조 또는 대조군은 평가 중인 것과 대등한 조건 또는 상황 하에서 결정 또는 특성화된다. 당업자는 특정한 가능한 참조 또는 대조군에 대한 의존 및/또는 비교를 정당화하기 위해 충분한 유사성이 존재할 때를 이해할 것이다.
치료 유효량: 본원에 사용된 바와 같이, 용어 "치료 유효량"은 치료 요법의 일부로서 투여될 때 원하는 생물학적 반응을 유발하는 물질(예컨대, 치료제, 조성물, 및/또는 제제)의 양을 지칭한다. 일부 구현예에서, 물질의 치료 유효량은 질환, 장애, 및/또는 병태를 겪고 있거나 이에 민감한 대상체에게 투여될 때, 질환, 장애, 및/또는 병태의 발병을 치료, 진단, 예방, 및/또는 지연시키기에 충분한 양이다. 당업자에 이해되는 바와 같이, 물질의 유효량은 원하는 생물학적 종점, 전달될 물질, 표적 세포 또는 조직 등과 같은 인자에 따라 달라질 수 있다. 예를 들어, 질환, 장애, 및/또는 병태를 치료하기 위한 제제 내의 화합물의 유효량은 질환, 장애 및/또는 병태의 하나 이상의 증상 또는 특성의 발병을 완화, 개선, 경감, 억제, 예방, 지연시키고, 이의 중증도를 감소시키고/거나 이의 발생을 감소시키는 양이다. 일부 구현예에서, 치료 유효량은 단일 용량으로 투여되고; 일부 구현예에서, 치료 유효량을 전달하기 위해 다중 단위 용량이 필요하다.
변이체 : 본원에 사용된 바와 같이, 용어 "변이체"는 참조 개체와 유의한 구조적 동일성을 나타내지만 참조 개체와 비교하여 하나 이상의 화학적 모이어티의 존재 또는 수준에서 참조 개체와 구조적으로 상이한 개체를 지칭한다. 많은 구현예에서, 변이체는 또한 그의 참조 개체와 기능적으로 상이하다. 일반적으로, 특정 개체가 참조 개체의 "변이체"인 것으로 적절하게 고려되는지 여부는 참조 개체와의 구조적 동일성의 정도에 기초한다. 당업자에 의해 이해되는 바와 같이, 임의의 생물학적 또는 화학적 참조 개체는 특정한 특징적인 구조적 요소를 갖는다. 변이체는 정의상 하나 이상의 이러한 특징적인 구조적 요소를 공유하는 별개의 화학적 개체이다. 몇 가지 예를 들자면, 소분자는 특징적인 코어 구조적 요소(예컨대, 매크로사이클 코어) 및/또는 하나 이상의 특징적인 펜던트 모이어티를 가질 수 있으므로 소분자의 변이체는 코어 구조적 요소 및 특징적인 펜던트 모이어티를 공유하지만 코어 내에 존재하는 다른 펜던트 모이어티 및/또는 결합 유형(단일 대 이중, E 대 Z 등)이 상이한 것이며, 폴리펩타이드는 선형 또는 3차원 공간에서 서로에 대해 지정된 위치를 갖고/거나 특정 생물학적 기능에 기여하는 복수의 아미노산으로 구성된 특징적인 서열 요소를 가질 수 있고, 핵산은 선형 또는 3차원 공간에서 서로에 대해 지정된 위치를 갖는 복수의 뉴클레오타이드 잔기로 구성된 특징적인 서열 요소를 가질 수 있다. 예를 들어, 변이체 폴리펩타이드는 아미노산 서열의 하나 이상의 차이 및/또는 폴리펩타이드 백본에 공유적으로 부착된 화학적 모이어티(예컨대, 탄수화물, 지질 등)의 하나 이상의 차이의 결과로서 참조 폴리펩타이드와 상이할 수 있다. 일부 구현예에서, 변이체 폴리펩타이드는 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 또는 99%인 참조 폴리펩타이드와의 전체 서열 동일성을 나타낸다. 대안적으로 또는 추가적으로, 일부 구현예에서, 변이체 폴리펩타이드는 참조 폴리펩타이드와 적어도 하나의 특징적인 서열 요소를 공유하지 않는다. 일부 구현예에서, 참조 폴리펩타이드는 하나 이상의 생물학적 활성을 갖는다. 일부 구현예에서, 변이체 폴리펩타이드는 참조 폴리펩타이드의 생물학적 활성 중 하나 이상을 공유한다. 일부 구현예에서, 변이체 폴리펩타이드는 참조 폴리펩타이드의 생물학적 활성 중 하나 이상이 결여되어 있다. 일부 구현예에서, 변이체 폴리펩타이드는 참조 폴리펩타이드와 비교하여 하나 이상의 생물학적 활성의 감소된 수준을 나타낸다. 많은 구현예에서, 관심있는 폴리펩타이드가 특정 위치에 소수의 서열 변경을 제외하고 모체의 아미노산 서열과 동일한 아미노산 서열을 갖는 경우, 관심있는 폴리펩타이드는 모체 또는 참조 폴리펩타이드의 "변이체"인 것으로 간주된다. 전형적으로, 변이체 내의 잔기 중 20%, 15%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 미만이 모체와 비교하여 치환된다. 일부 구현예에서, 변이체는 모체와 비교하여 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 치환된 잔기를 갖는다. 종종, 변이체는 매우 적은(예컨대, 5, 4, 3, 2, 또는 1개 미만) 수의 치환된 기능적 잔기(즉, 특정 생물학적 활성에 참여하는 잔기)를 갖는다. 더욱이, 변이체는 모체와 비교하여 전형적으로 5, 4, 3, 2, 또는 1개 이하의 부가 또는 결실을 갖고, 종종 부가 또는 결실을 갖지 않는다. 더욱이, 임의의 부가 또는 결실은 전형적으로 약 25, 약 20, 약 19, 약 18, 약 17, 약 16, 약 15, 약 14, 약 13, 약 10, 약 9, 약 8, 약 7, 약 6개 미만이고, 일반적으로 약 5, 약 4, 약 3, 또는 약 2개 미만의 잔기이다. 일부 구현예에서, 모체 또는 참조 폴리펩타이드는 자연에서 발견되는 펩타이드이다.
도 1은 대상체를 항-TNF 요법에 대한 반응자로 분류하기 위한 특정 유전자의 발현 수준의 잠재적인 상대 예측값의 그래프이다.
도 2는 (빨간색 박스에서) RNAseq 생물정보학 파이프라인, 및 (파란색 박스에서), 예시적인 독점 알고리즘(예컨대, 본 실시예에서, PrismRA 알고리즘)을 포함하는 예시적인 구현예의 예시이다.
도 3은 분류에서 사용(예컨대, 진단, 특정 치료에 대한 반응성의 확인, 및 다른 적용)하기 위한 RNA-seq 데이터의 모듈식 처리를 위한 예시적인 파이프라인이다.
도 4는 다양한 구현예에서 사용하기 위한 예시적인 네트워크 환경 및 컴퓨팅 장치이다.
도 5는 본 개시내용에 기재된 기술을 구현하는 데 사용될 수 있는 컴퓨팅 장치(500) 및 모바일 컴퓨팅 장치(550)의 예를 보여준다.
도 6a는 특징 선택(n = 75), 모델 훈련(n = 185), 및 모델 검증(n = 46)에 사용되는 코호트의 흐름도이다.
도 6b는 도 6a의 코호트 1에서의 특징 선택 과정을 설명하는 과정이다. POC 데이터세트는 도 6a의 코호트 1 데이터의 세트를 지칭한다. 데이터의 80%는 가장 차별적인 유전자를 확인하기 위해 U-시험을 사용하여 분류기를 훈련하는 데 사용되며, 80% 데이터는 최종 특징 세트를 제공하기 위해 10겹 교차검증을 사용하여 10개의 그룹으로 나뉘고; 최종 특징 세트는 나머지 20%의 데이터에 대한 모델 훈련 및 평가에 사용된다. 이 과정은 적어도 100번 반복된다.
도 6c는 코호트 1에 적용된 특징 선택 방법의 흐름도이다.
도 7a-7d는 항-TNF 요법에 대한 반응자 및 무반응자를 구별하는 Abcon 코호트(Affymetrix)에서의 유전자의 선택에 관한 것이다. 도 7a는 상위 100개에서 선택된 특징 대 교차 검증 라운드 수의 플롯이다. 도 7b는 100 라운드의 교차 검증에 걸쳐 총 20% 보류된 시험 세트에 대한 평균 곡선하 면적(AUC)을 보여주는 수신자 작동 특징 곡선이다. 도 7c는 각 랜덤 포레스트 모델에 의해 지시된 바와 같이 100 라운드의 교차 검증에 걸쳐 총 20% 보류된 시험 세트의 예측된 클래스 확률을 예시한다. 도 7d는 100 라운드의 교차 검증 중 30 라운드에 대해 상위 100개로 순위가 매겨진 38개의 유전자를 고려할 때 항-TNF 요법에 대한 반응자(빨간색) 및 무반응자(검정색)의 주성분 분석을 예시한다.
도 8a-8b는 종점 및 포함 기준의 최적화에 관한 것이다. 도 8a는 혈청양성인 환자와 혈청양성이 아닌 환자 모두로부터 구축된 모델의 곡선 분포하 면적이다. 도 8b는 RF 및 CCP에 대해 혈청양성인 환자로만 구축된 모델의 곡선 분포하 면적이다. 혈청양성 샘플에서 기준선 RNAseq 데이터는 남성 및 여성 환자 모두에 대해 ACR50 결과를 가장 잘 예측한다.
도 9a-9d는 대표적인 모델 성능에 관한 것이다. 중앙 AUC 모델은 남성 및 여성 혈청양성 환자를 고려하고 치료 후 6개월의 ACR50을 임상 종점으로서 사용할 때 생성된다. 도 9a는 10회 반복된 총 10% 보류된 교차 검증에 대한 평균 곡선하 면적(AUC)을 나타내는 수신자 작동 특징 곡선을 예시한다. 도 9b는 10회 반복된 총 10% 보류된 교차 검증에 대한 음성 예측값 대 진음성률의 플롯이다. 도 9c는 랜덤 포레스트 모델에 의해 판단된 반응자 및 무반응자 간의 집계된 검증 세트 샘플에 대한 예측된 확률의 플롯이다. 도 9d는 집계된 검증 세트 샘플의 혼동 행렬이다.
도 10a는 공변량 단독, RNA 단독, 및 RNA를 갖는 공변량을 사용하는 모델 성능을 예시한다.
도 10b는 공변량의 선택 빈도를 예시한다.
도 11은 10% 교차 검증의 50회 반복에 걸쳐 상위 15개에서 유전자의 선택 빈도의 그래프이다.
도 12a-12d는 항-TNF 요법에 대한 반응의 예측을 위한 모델의 검증에 관한 것이다. 도 12a는 검증 세트 샘플에 대한 곡선하 면적(AUC)을 나타내는 수신자 작동 특징 곡선을 예시한다. 도 12b는 검증 세트 샘플에 대한 음성 예측값 대 진음성률의 플롯이다. 도 12c는 랜덤 포레스트 모델에 의해 판단된 바와 같은 각 검증 세트 샘플에 대한 예측된 클래스 확률의 플롯이다. 도 12d는 항-TNF 요법에 대한 반응의 예측을 위한 모델의 검증과 관련된 혼동 행렬이다.
도 13a-13d는 항-TNF 요법에 대한 반응의 예측을 위한 혈청양성 환자 단독(n = 23) 사이의 모델 검증에 관한 것이다. 도 13a는 검증 세트 샘플에 대한 곡선하 면적(AUC)을 나타내는 수신자 작동 특징 곡선을 예시한다. 도 13b는 검증 세트 샘플에 대한 음성 예측값 대 진음성률의 플롯이다. 도 13c는 랜덤 포레스트 모델에 의해 판단된 바와 같은 각 검증 세트 샘플에 대한 예측된 클래스 확률의 플롯이다. 도 13d는 항-TNF 요법에 대한 반응의 예측을 위한 혈청양성 환자 단독(n = 23) 사이의 모델의 검증과 관련된 혼동 행렬이다.
도 14는 분류기를 개발하기 위한 예시적인 작업흐름이다.
도 15는 2개의 주요 그룹인 하나의 우세한 무반응자 및 다른 반응자를 예시하는 38개 유전자에 대한 RNA 발현 데이터의 계층적 클러스터 분석이며, 이에 의해 항-TNF 반응 예측을 위한 이들 유전자의 차별적인 성질을 입증한다. 히트맵(heatmap)은 임의의 단위의 상대적인 RNA 발현 수준을 나타낸다.
도 16a는 인간 상호작용체 단백질-단백질 네트워크의 서브세트의 시각화이다. 네트워크 상에 포함된 단백질은 회색 원으로 표시되어 있다. 빨간색 윤곽 원은 SNP 함유 RNA에 의해 코딩된 단백질을 나타내고, 파란색 윤곽 원은 반응 차별적인 유전자에 의해 코딩된 단백질을 나타낸다.
도 16b는 분자 약물 표적, RA와 연관된 단백질(질환 모듈 단백질), PrismRA 예측 분류 알고리즘의 개발에 포함된 모든 분자 특징, SNP-함유 RNA(SNP)에 의해 코딩된 단백질 및 차별적인 유전자(DG)에 의해 코딩된 단백질의 근접성의 정량적 분석이다. 최종 예측 분류 알고리즘에 포함된 분자 특징은 노란색이다.
도 17은 적어도 10명의 환자에서 선택된 SNP가 검출된 훈련 코호트에서의 반응자 및 무반응자 RA 환자의 백분율을 도시하는 일련의 막대 그래프이다.
도 18은 RA 질환 모듈, RA 약물 표적, 및 분류기 특성(SNP 및 DG)을 함유하는 인간 상호작용체 서브네트워크이다.
도 19는 RA에서 항-TNF 약물 반응 알고리즘의 개발을 설명하는 흐름도이다. 항-TNF 요법에 대한 반응자 및 무반응자를 구별하는 유전자 발현은 공개적으로 이용가능한 마이크로어레이 데이터세트에서 선택되었다. 크로스-플랫폼 분석에서, 이러한 특성은 네트워크 질환 모듈 연관된 SNP 및 임상 인자와 조합된 다음, RNAseq 데이터를 사용하여 기계 학습 알고리즘을 훈련하는 데 사용되었다. 예측 약물 반응 알고리즘의 성능은 독립적인 검증 시험에서 검증되었다.
항-TNF 요법에 대한 대상체 반응의 자동화된 예측을 위한 시스템 및 방법이 본원에 제시된다. 또한 게놈 및/또는 다중-오믹 데이터의 자동화된 해석을 위한 모듈식 시스템이 본원에 제시된다.
A. 제공된 분류기(들)
본 개시내용은 어떤 환자가 특정 요법에 반응할지 또는 반응하지 않을지 확인(즉, 예측)할 수 있는 분류기 및 이러한 분류기의 개발을 제공한다. 일부 구현예에서, 분류기는 항-TNF 요법(예컨대, 특정한 항-TNF 제제 및/또는 요법)을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된다.
무엇보다도, 본 개시내용은, 선택적으로 특정 임상 특징 및/또는 특정 단일 뉴클레오타이드 다형성(들)의 존재 또는 부재와 결합된, 단독 및 서로 조합된 유전자의 특정 세트에 대한 발현 수준(들)이 항-TNF 요법에 대한 반응(예컨대, 반응의 하나 이상의 특성)을 예측하는 데 유용하다는 통찰력을 포함한다.
일부 구현예에서, 본 개시내용은 이러한 유전자 발현 수준(들), 임상 특징(들) 및/또는 SNP(들)이거나 이를 포함하는 분류기를 제공하며, 그것이 항-TNF 요법에 반응하는 대상체와 반응하지 않는 대상체를 구별하도록 확립되었음을 입증한다. 일부 구현예에서, 제공된 분류기는 항-TNF 요법을 받았고 그의 반응성이 알려진(예컨대, 이전에 결정된) 과거의(즉, 이전) 대상체 집단(들)의 후향적 분석을 통해, 항-TNF 요법에 대해 반응성 또는 무반응성인 대상체(예컨대, 항-TNF 요법을 받지 않은 대상체)를 구별하도록 확립된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 70% 정확성으로 코호트 내의 무반응자 중 적어도 50%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 70% 정확성으로 코호트 내의 무반응자 중 적어도 60%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 70% 정확성으로 코호트 내의 무반응자 중 적어도 70%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 70% 정확성으로 코호트 내의 무반응자 중 적어도 80%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 70% 정확성으로 코호트 내의 무반응자 중 적어도 90%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 70% 정확성으로 코호트 내의 무반응자 중 적어도 99%를 확인하는 분류기는 "검증된" 것으로 간주된다.
일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 80% 정확성으로 코호트 내의 무반응자 중 적어도 50%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 90% 정확성으로 코호트 내의 무반응자 중 적어도 50%를 확인하는 분류기는 "검증된" 것으로 간주된다. 일부 구현예에서, 이러한 과거의(즉, 이전) 집단(들)에 적용될 때 적어도 99% 정확성으로 코호트 내의 무반응자 중 적어도 50%를 확인하는 분류기는 "검증된" 것으로 간주된다.
일부 구현예에서, 본 개시내용은 제공된 분류기의 적용을 통해 이러한 항-TNF 요법에 반응할 가능성이 있는 것으로 결정된 대상체(들)에게 항-TNF 요법을 투여하는 단계를 포함하는, 질환, 장애, 또는 병태를 겪고 있는 대상체를 치료하는 방법을 제공하며; 대안적으로 또는 추가적으로, 일부 구현예에서, 본 개시내용은 제공된 분류기의 적용을 통해 이러한 항-TNF 요법에 반응할 가능성이 없을 것으로 결정된 대상체(들)에게 항-TNF 요법을 보류하고/거나 대안을 투여하는 단계를 포함하는, 질환, 장애, 또는 병태를 겪고 있는 대상체를 치료하는 방법을 제공한다.
일부 구현예에서, 제공된 분류기는 하나 이상의 유전자에 대한 유전자 발현 정보일 수 있거나 이를 포함할 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, 제공된 분류기는 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재 또는 부재 및/또는 관련 대상체의 하나 이상의 임상 특징일 수 있거나 이를 포함할 수 있다.
일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 하나 이상의 SNP의 존재; 및 적어도 하나의 임상 특징 각각을 평가함으로써 개발된다.
일부 구현예에서, 본원에 기재된 바와 같이, 분류기는 항-TNF 요법을 받았고 반응하거나(즉, 반응자) 또는 반응하지 않는(즉, 무반응자) 것으로 결정된 환자(예컨대, 사전 대상체)로부터의 생물학적 샘플의 하나 이상의 특성(예컨대, 유전자 발현 수준, 하나 이상의 SNP의 존재 또는 부재 등)의 후향적 분석에 의해 개발되고; 대안적으로 또는 추가적으로, 일부 구현예에서, 분류기는 임의의 생물학적 샘플의 평가를 포함하거나 포함하지 않을 수 있는(그리고, 예를 들어, 의료 기록을 참조하여 수행될 수 있는) 이러한 환자의 하나 이상의 임상 특징의 후향적 분석에 의해 개발된다. 일부 구현예에서, 이러한 모든 환자는 동일한 항-TNF 요법(선택적으로 동일하거나 상이한 시간 동안)을 받았고; 대안적으로 또는 추가적으로, 일부 구현예에서, 이러한 모든 환자는 동일한 질환, 장애, 또는 병태로 진단받았다. 일부 구현예에서, 그의 생물학적 샘플이 후향적 분석에서 분석되는 환자는 상이한 항-TNF 요법을 받았고(예컨대, 상이한 항-TNF 제제로 및/또는 상이한 요법에 따라); 대안적으로 또는 추가적으로, 일부 구현예에서, 그의 생물학적 샘플이 후향적 분석에서 분석되는 환자는 상이한 질환, 장애, 또는 병태로 진단되었다.
1. 유전자 발현
전형적으로, 본원에 기재된 바와 같은 분류기의 유전자 발현 측면은 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 및 하기 중 적어도 하나: 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 결정된다. 그의 발현 수준이 반응자 및 무반응자 집단 사이에서 통계적으로 유의한 차이를 나타내는 유전자는 유전자 반응 서명에 포함될 수 있다.
일부 구현예에서, 본 개시내용은 반응성 및 무반응성 대상체 사이의 분류기를 확인하거나 제공하기 위한 특정한 이전 노력의 문제의 근원이 반응자 대 무반응자 집단에서의 유전자 발현 수준의 비교가 집단 사이의 발현 수준에서 가장 큰 차이(예컨대, 2배 초과 변화)를 나타내는 유전자를 강조하고/거나 이에 초점을 맞춘(종종 단독으로) 것을 통해서라는 통찰력을 구현한다. 본 개시내용은 그의 발현 수준 차이가 상대적으로 작은(예컨대, 발현의 2배 미만 변화) 유전자라도 유용한 정보를 제공하고 본원에 기재된 구현예에서 분류기에 가치있게 포함된다는 것을 인식한다.
더욱이, 일부 구현예에서, 본 개시내용은 본원에 기재된 바와 같이 그의 발현 수준이 반응자 및 무반응자 집단 사이에서 통계적으로 유의한 차이(선택적으로 작은 차이를 포함함)를 나타내는 유전자의 상호작용 패턴의 분석이 분류기의 품질과 예측력을 실질적으로 개선하는 새롭고 가치 있는 정보를 제공한다는 통찰력을 구현한다.
일부 구현예에서, 제공된 분류기는 대상체가 특정 요법(예컨대, 항-TNF 요법)에 반응할지 또는 반응하지 않을지 결정하는 데 사용될 수 있는(예컨대, 그의 발현 수준이 상관관계가 있는) 유전자 또는 유전자의 세트이거나 이를 포함한다. 일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 및 하기 중 적어도 하나: 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 및 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발된다.
일부 구현예에서, 분류기에서 사용하기 위한 및/또는 유전자 발현을 측정하기 위한 하나 이상의 유전자는 표 1의 유전자에서 선택된다:
Figure pct00004
특정 구현예에서, 상기 확인된 11개의 확인된 유전자(및/또는 도 1에 나타낸 17개의 추가 유전자)의 다양한 서브세트의 유전자 발현 수준이 사용된다(예컨대, 가중 인자와 함께 또는 가중 인자 없이). 예를 들어, 특정 구현예에서, 분류 모델은 11개 유전자의 세트 중 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 구성원의 서브세트의 발현 수준에 기초할 수 있고, CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3이 사용될 수 있거나, 또는, 특정 구현예에서, 분류 모델은 도 1에 나타낸 28개의 유전자 세트 중 하나의 서브세트의 발현 수준에 기초할 수 있다. 특정 구현예에서, 분류기에서 각 유전자의 RNA 시퀀싱(RNA-seq) 데이터 리드 카운트(read count)가 모델에 사용된다. 특정 구현예에서, RNA-seq 리드 카운트는 백만 리드당 엑손의 킬로베이스당 단편(FPKM)으로서 제공된다.
더욱이, 그리고 놀랍게도, 11개의 유전자인 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3의 세트의 유전자 발현 수준에 기초한 모델은 임상 공변량 분류기(CC) 또는 조합된 게놈-임상 분류기(GCC)보다 항-TNF 요법에 대한 반응/무반응의 더 나은 예측자인 것으로 나타났다.
일부 구현예에서, 항-TNF 반응을 예측하기 위해 11개의 유전자(CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3)의 세트 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 유전자가 측정된다. 일부 구현예에서, 1개의 유전자가 측정된다. 일부 구현예에서, 2개의 유전자가 선택된다. 일부 구현예에서, 3개의 유전자가 선택된다. 일부 구현예에서, 4개의 유전자가 선택된다. 일부 구현예에서, 5개의 유전자가 선택된다. 일부 구현예에서, 6개의 유전자가 선택된다. 일부 구현예에서, 7개의 유전자가 선택된다. 일부 구현예에서, 8개의 유전자가 선택된다. 일부 구현예에서, 9개의 유전자가 선택된다. 일부 구현예에서, 10개의 유전자가 선택된다. 일부 구현예에서, 11개의 유전자가 선택된다. 일부 구현예에서, 8개 초과의 유전자가 선택된다. 일부 구현예에서, 8개, 9개, 10개, 또는 11개의 유전자가 선택된다.
일부 구현예에서, 대상체를 반응성 또는 무반응성으로 분류하는 것(즉, 결정 또는 예측하는 것)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3에서 선택된 하나 이상의 유전자의 발현 수준을 사용하여 결정된다. 일부 구현예에서, 분류는 기계 학습 모델을 사용하여 결정된다. 일부 구현예에서, 기계 학습 모델은 랜덤 포레스트 모델이다.
일부 구현예에서, 제공된 방법은 임상 공변량 분류기(CC)를 사용하지 않고 반응자 또는 무반응자로서 대상체의 분류를 결정한다. 일부 구현예에서, 제공된 방법은 조합된 게놈-임상 분류기(GCC)를 사용하지 않고 반응자 또는 무반응자로서 대상체의 분류를 결정한다. 일부 구현예에서, 제공된 방법은 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고 반응자 또는 무반응자로서 대상체의 분류를 결정한다.
일부 구현예에서, 분류기에서 사용하기 위한 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택된다.
일부 구현예에서, 분류기에서의 유전자 발현은, 예를 들어 검증된 생물학적 데이터(예컨대, Gene Expression Omnibus("GEO")와 같은 공개적으로 이용가능한 데이터베이스로부터 유래된 생물학적 데이터)로부터 준비될 수 있거나 준비된 mRNA 및/또는 단백질 발현 데이터세트를 사용하여 확인될 수 있다. 일부 구현예에서, 분류기는 특정 요법(예컨대, 항-TNF 요법)에 대해 알려진 반응성 및 알려진 무반응성의 사전 대상체의 유전자 발현 수준을 비교함으로써 유래될 수 있다. 일부 구현예에서, 특정 유전자(즉, 서명 유전자)는 분류기를 개발하는 데 사용될 이러한 유전자 발현 데이터의 코호트에서 선택된다.
일부 구현예에서, 서명 유전자는 참조로 본원에 포함된 문헌[Santolini, "A personalized, multiomics approach identifies genes involved in cardiac hypertrophy and heart failure," Systems Biology and Applications, (2018)4:12; doi:10.1038/s41540-018-0046-3]에 의해 보고된 방법과 유사한 방법에 의해 확인된다. 일부 구현예에서, 서명 유전자는 알려진 반응성 및 무반응성의 사전 대상체의 유전자 발현 수준을 비교하고 두 그룹 사이의 유의한 변화를 확인함으로써 확인되며, 여기서 유의한 변화는 발현의 큰 차이(예컨대, 2배 초과의 변화), 발현의 작은 차이(예컨대, 2배 미만의 변화), 또는 둘 모두일 수 있다. 일부 구현예에서, 유전자는 발현 차이의 유의성에 의해 순위가 매겨진다. 일부 구현예에서, 유의성은 유전자 발현 및 반응 결과 사이의 피어슨(Pearson) 상관관계에 의해 측정된다. 일부 구현예에서, 서명 유전자는 발현 차이의 유의성에 의한 순위에서 선택된다. 일부 구현예에서, 선택된 서명 유전자의 수는 분석된 유전자의 총 수보다 적다. 일부 구현예에서, 200개 이하의 서명 유전자가 선택된다. 일부 구현예에서 100개 이하의 유전자가 선택된다.
일부 구현예에서, 서명 유전자는 단백질-단백질 상호작용의 맵인 인간 상호작용체(HI) 상의 이들의 위치와 함께 선택된다. 이러한 방식의 HI의 사용은 mRNA 활성이 동적이라는 인식을 포함하며, 특정 질환을 이해하는 데 중요한 단백질의 실제 과발현 및 과소발현을 결정한다. 일부 구현예에서, 특정 요법(즉, 항-TNF 요법)에 대한 반응과 연관된 유전자는 HI 맵 상에서 별개의 모듈로 클러스터링(즉, 유전자의 클러스터를 형성)할 수 있다. 이러한 클러스터의 존재는 근본적인 기저 질환 생물학의 존재와 연관된다. 일부 구현예에서, 분류기는 HI 맵 상의 유전자의 클러스터에서 선택된 서명 유전자로부터 유래된다. 따라서, 일부 구현예에서, 분류기는 인간 상호작용체 맵 상의 항-TNF 요법에 대한 반응과 연관된 유전자의 클러스터로부터 유래된다.
일부 구현예에서, 특정 요법에 대한 반응과 연관된 유전자는 인간 상호작용체 맵 상에 맵핑될 때 특정 위상학적 특성을 나타낸다. 예를 들어, 일부 구현예에서, 항-TNF 요법에 대한 반응과 연관된 복수의 유전자는 인간 상호작용체 맵 상에서의 이들의 위치(즉, 위상학적 특성, 예컨대, 서로에 대한 이들의 근접성)에 의해 특성화된다.
일부 구현예에서, 특정 요법(즉, 항-TNF 요법)에 대한 반응과 연관된 유전자들은 HI 맵 상에서 서로 근접하여 존재할 수 있다. 상기 근접한 유전자들은 반드시 근본적인 기저 질환 생물학을 공유할 필요는 없다. 즉, 일부 구현예에서, 근접한 유전자들은 중요한 단백질 상호작용을 공유하지 않는다. 따라서, 일부 구현예에서, 분류기는 인간 상호작용체 맵 상의 근접한 유전자들로부터 유래된다. 일부 구현예에서, 분류기는 인간 상호작용체 맵 상의 다른 특정한 위상학적 특징으로부터 유래된다.
일부 구현예에서, 특정 요법(즉, 항-TNF 요법)에 대한 반응과 연관된 유전자는 HI 맵과 조합하여 사용될 때 확산 상태 거리(Diffusion State Distance, DSD)에 의해 결정될 수 있다(Cao, et al., PLOS One, 8(10): e76339(Oct. 23, 2013) 참고).
일부 구현예에서, 서명 유전자는 (1) 알려진 반응자 및 알려진 무반응자와 비교하여 유전자의 발현 차이의 유의성에 기초하여 유전자의 순위를 매기고; (2) 순위를 매긴 유전자로부터 유전자를 선택하고 선택된 유전자를 인간 상호작용체 맵 상에 맵핑하고; (3) 인간 상호작용체 맵 상에 맵핑된 유전자로부터 서명 유전자를 선택하는 단계에 의해 선택된다.
일부 구현예에서, 서명 유전자(예컨대, Santolini 방법으로부터, 또는, 비제한적으로, 클러스터링, 근접성 및 확산 기반 방법을 포함하는 다양한 네트워크 위상학적 특성을 사용하여 선택됨)는 확률적 신경망에 제공되어 분류기를 제공(즉, "훈련")한다. 일부 구현예에서, 확률적 신경망은 참조로 본원에 포함된 문헌[D. F. Specht in "Probabilistic Neural Networks," Neural Networks, 3(1):109-118 (1990)]에 의해 제안된 알고리즘을 구현한다. 일부 구현예에서, 확률적 신경망은 R-통계 언어로 작성되며, 정량적 변수의 벡터에 의해 기술된 관찰 세트를 아는 것은 관찰을 주어진 수의 그룹(예컨대, 반응자 및 무반응자)으로 분류한다. 알고리즘은 알려진 반응자 및 무반응자로부터 취한 서명 유전자의 데이터의 세트로 훈련되고, 제공된 새로운 관찰을 추측한다. 일부 구현예에서, 확률적 신경망은 https://CRAN.R-project.org/package=pnn으로부터 유래된 것이다. 일부 구현예에서, 서명 유전자는 분류기를 제공하기 위해 랜덤 포레스트 모델에 따라 분석된다.
2. 단일 뉴클레오타이드 다형성
본 개시내용은 단일 뉴클레오타이드 다형성(SNP)이 RNA 서열 데이터를 통해 확인될 수 있다는 통찰력을 추가로 포함한다. 즉, RNA 서열 데이터를 참조 인간 게놈과 비교함으로써, 예컨대, RNA 서열 데이터를 GRCh38 인간 게놈에 맵핑함으로써. 이론에 구속되기를 바라지 않지만, 분류기에 사용된 RNA 서열과 상관관계가 있는 SNP의 존재는 특정 요법(예컨대, 항-TNF 요법)에 반응하거나 반응하지 않는 대상체의 서브집단의 확인을 용이하게 할 수 있는 것으로 여겨진다. 즉, 차별적인 유전자 및 SNP 함유 RNA의 단백질 산물은 네트워크 의학 및 경로 농축 분석(pathway enrichment analysis)을 사용하여 분석될 수 있다. 분류기에 포함된 차별적인 유전자 및 SNP 함유 RNA에 의해 코딩된 단백질은, 예를 들어, 차별적인 유전자의 특정 세트의 확인에 의해 대상체의 특정 서브집단을 확인하는 것을 돕기 위해 인간 상호작용체의 맵 상에 중첩될 수 있다.
일부 구현예에서, 제공된 분류기 및 이러한 분류기를 사용하는 방법은 단일 뉴클레오타이드 다형성(SNP)과 관련된 평가를 포함한다. 일부 구현예에서, 본 개시내용은 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계; 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는, 대상체를 하나 이상의 치료 속성에 대해 계층화시키기 위한 분류기를 개발하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은, 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석함으로써 대상체를 하나 이상의 치료 속성에 대해 계층화하기 위한 분류기를 개발하는 방법에서, 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 및 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는 개선을 제공한다.
일부 구현예에서, 하나 이상의 SNP는 하기에서 선택된다:
Figure pct00005
Figure pct00006
3. 임상 특징
분류기는 또한 반응자 및 무반응자 사이를 확인하는 분류기의 예측 능력을 더 개선하기 위해 추가 정보를 포함할 수 있다. 예를 들어, 일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 및 하기 중 적어도 하나: 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발된다. 즉, 일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자 및 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가함으로써 개발된다. 일부 구현예에서, 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자 및 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발된다.
본 개시내용은 특정 임상 특징(예컨대, BMI, 성별, 연령 등)이 본원에 제공된 분류기에 포함될 수 있다는 통찰력을 추가로 포함한다. 일부 구현예에서, 제공된 분류기 및 이러한 분류기를 사용하는 방법은 임상 특징과 관련된 평가를 포함한다. 일부 구현예에서, 본 개시내용은 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계; 하나 이상의 임상 특징의 존재를 평가하는 단계; 상기 임상 특징과 관련된 발현이 적어도 하나의 치료 속성과 상관관계가 있음을 결정하는 단계; 및 하나 이상의 임상 특징을 분류기에 포함시키는 단계를 포함하는, 대상체를 하나 이상의 치료 속성에 대해 계층화하기 위한 분류기를 개발하는 방법을 제공한다.
일부 구현예에서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택된다.
일부 구현예에서, 임상 특징은 하기에서 선택된다:
Figure pct00007
Figure pct00008
4. 분류기 검증
대안적으로 또는 추가적으로, 일부 구현예에서, 분류기는 리브-원-아웃(leave-one-out) 교차 및/또는 k겹 교차 검증을 사용하여 알려진 반응자 및 무반응자의 코호트를 사용하는 확률적 신경망에서 훈련될 수 있다. 일부 구현예에서, 이러한 과정은 분석에서 하나의 샘플을 제외하고(즉, 리브-원-아웃) 나머지 샘플만을 기초로 분류기를 훈련한다. 일부 구현예에서, 상기 업데이트된 분류기는 제외된 샘플의 반응 확률을 예측하는 데 사용된다. 일부 구현예에서, 이러한 과정은, 예를 들어, 모든 샘플이 한 번 제외될 때까지 반복적으로 반복될 수 있다. 일부 구현예에서, 이러한 과정은 알려진 반응자 및 무반응자의 코호트를 k개의 동일한 크기 그룹으로 무작위로 분할한다. k 그룹 중에서, 단일 그룹은 모델을 시험하기 위한 검증 데이터로서 유지되고, 나머지 그룹은 훈련 데이터로서 사용된다. 이러한 과정은 k번 반복될 수 있으며, k 그룹 각각은 검증 데이터로서 정확히 한 번 사용된다. 일부 구현예에서, 결과는 훈련 세트 내의 각 샘플의 확률 스코어이다. 이러한 확률 스코어는 실제 반응 결과와 상관관계가 있을 수 있다. 반복 작동 곡선(Recursive Operating Curve, ROC)은 분류기의 성능을 추정하는 데 사용될 수 있다. 일부 구현예에서, 약 0.6 이상의 곡선하 면적(AUC)은 적합한 검증된 분류기를 반영한다. 일부 구현예에서, 0.9의 음성 예측값(NPV)은 적합한 검증된 분류기를 반영한다. 일부 구현예에서, 분류기는, 예를 들어, 적합성을 확인하기 위해(즉, 리브-원-아웃 및/또는 k겹 교차 검증을 사용하여) 완전히 독립적인(즉, 맹검) 코호트에서 시험될 수 있다. 따라서, 일부 구현예에서, 제공된 방법은, 예를 들어, 알려진 반응자 및 무반응자의 그룹에 반응 확률을 할당하고; 반응자 및 무반응자의 맹검 그룹에 대해 분류기를 확인함으로써, 분류기를 검증하는 하나 이상의 단계를 추가로 포함한다. 이러한 과정의 출력은 대상체가 특정 요법(예컨대, 항-TNF 요법)에 반응할지 또는 반응하지 않을지 확립하는 데 유용한 훈련된 분류기이다.
따라서, 일부 구현예에서, 분류기는 한 가지 유형의 요법, 예컨대, 항-TNF 요법을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된다. 이 분류기는 대상체가 주어진 요법에 반응할지 또는 반응하지 않을지 예측할 수 있다. 일부 구현예에서, 반응성 및 무반응성의 사전 대상체는 동일한 질환, 장애, 또는 병태를 겪었다.
일부 구현예에서, 대상체의 유전자는 마이크로어레이, RNA 시퀀싱, 실시간 정량적 역전사 PCR(qRT-PCR), 비드 어레이, ELISA, 및 단백질 발현 중 적어도 하나에 의해 측정된다.
일부 구현예에서, 분류기는 이전에 항-TNF 요법으로 치료되었지만 분류기를 준비하는 데 사용된 대상체의 코호트와는 독립적인 대상체의 코호트를 사용하여 검증된다. 일부 구현예에서, 분류기는 유전자 발현 데이터, SNP 데이터, 또는 임상 특징을 사용하여 업데이트된다. 일부 구현예에서, 분류기는 무반응성 대상체의 90% 이상이 검증 코호트 내에서 60% 이상의 정확성으로 예측될 때 "검증된" 것으로 간주된다.
일부 구현예에서, 분류기는 적어도 100명의 대상체의 집단에 걸쳐 반응성을 예측하는 적어도 60% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 150명의 대상체의 집단에 걸쳐 적어도 60% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 60% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 200명 이상의 대상체의 집단에 걸쳐 적어도 60% 정확성으로 대상체의 반응성을 예측한다.
일부 구현예에서, 분류기는 적어도 100명의 대상체의 집단에 걸쳐 적어도 80% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 150명의 대상체의 집단에 걸쳐 적어도 80% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 80% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 200명 이상의 대상체의 집단에 걸쳐 적어도 80% 정확성으로 대상체의 반응성을 예측한다.
일부 구현예에서, 분류기는 적어도 100명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 150명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측한다. 일부 구현예에서, 분류기는 적어도 200명 이상의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측한다.
B. 유전자 서명(들) 및/또는 SNP 검출
훈련된 분류기를 사용하여 대상체에서 유전자 서명을 검출하는 것은 당업자에게 일상적인 일이다. 다시 말해서, 먼저 유전자 서명을 정의함으로써(분류기로부터), 다양한 방법이 대상체 또는 대상체의 그룹이 확립된 유전자 서명을 발현하는지 결정하는 데 사용될 수 있다. 예를 들어, 일부 구현예에서, 의사는 요법의 투여 전에 대상체로부터 혈액 또는 조직 샘플을 수득하고, 상기 혈액 또는 조직 샘플으로부터 mRNA 프로파일을 추출 및 분석할 수 있다. mRNA 프로파일의 분석은, 비제한적으로 유전자 어레이, RNA-시퀀싱, 나노스트링 시퀀싱, 실시간 정량적 역전사 PCR(qRT-PCR), 비드 어레이, 또는 효소 결합 면역흡착 분석(ELISA)을 포함하는 당업자에게 알려진 임의의 방법에 의해 수행될 수 있다. 따라서, 일부 구현예에서, 본 개시내용은 마이크로어레이, RNA 시퀀싱, 실시간 정량적 역전사 PCR(qRT-PCR), 비드 어레이, 및 ELISA 중 적어도 하나에 의해 유전자 발현을 측정하는 단계를 포함하는, 대상체가 반응자 또는 무반응자로 분류되는지 결정하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 RNA 시퀀싱(즉, RNAseq)에 의해 대상체의 유전자 발현을 측정하는 단계를 포함하는 대상체가 반응자 또는 무반응자로 분류되는지 결정하는 방법을 제공한다.
본 개시내용은 단일 뉴클레오타이드 다형성(SNP)이 RNA 서열 데이터를 통해, 즉, RNA 서열 데이터를 참조 인간 게놈과 비교함으로써, 예컨대, RNA 서열 데이터를 GRCh38 인간 게놈에 맵핑함으로써 확인될 수 있다는 통찰력을 추가로 포함한다. 이론에 구속되기를 바라지 않지만, 분류기에 사용된 RNA 서열과 상관관계가 있는 SNP의 존재는 특정 요법(예컨대, 항-TNF 요법)에 반응하거나 반응하지 않는 대상체의 하위집단을 확인하는 것을 용이하게 할 수 있다고 여겨진다. 즉, 차별적인 유전자 및 SNP 함유 RNA의 단백질 산물은 네트워크 의학 및 경로 농축 분석을 사용하여 분석될 수 있다. 분류기에 포함된 차별적인 유전자 및 SNP 함유 RNA에 의해 코딩된 단백질은, 예를 들어, 차별적인 유전자의 특정 세트의 확인에 의해 대상체의 특정 서브집단을 확인하는 것을 돕기 위해 인간 상호작용체의 맵 상에 중첩될 수 있다.
일부 구현예에서, 유전자 발현은 배경 데이터를 차감하고, 배치 효과(batch effect)를 수정하고, 하우스키핑 유전자의 평균 발현으로 나눔으로써 측정된다. 문헌[Eisenberg & Levanon, "Human housekeeping genes, revisited," Trends in Genetics, 29(10):569-574 (October 2013)]을 참고한다. 마이크로어레이 데이터 분석의 맥락에서, 배경 차감은 각 프로브 특징의 형광 신호 강도로부터, 임의의 mRNA 서열에 상보적이지 않은 칩 상의 프로브 특징으로부터 발생하는 평균 형광 신호, 즉 비특이적 결합으로부터 발생하는 신호를 차감하는 것을 지칭한다. 배경 차감은 어피메트릭스 유전자 발현 콘솔(Affymetrix Gene Expression Console)과 같은 상이한 소프트웨어 패키지로 수행될 수 있다. 하우스키핑 유전자는 기본적인 세포 유지에 관여하므로 모든 세포 및 조건에서 일정한 발현 수준을 유지할 것으로 예측된다. 관심있는 유전자, 즉, 반응 서명에서의 유전자의 발현 수준은 발현 수준을 선택된 하우스키핑 유전자의 그룹에 대한 평균 발현 수준으로 나눔으로써 정규화될 수 있다. 이러한 하우스키핑 유전자 정규화 절차는 실험 가변성에 대해 유전자 발현 수준을 보정한다. 또한, 강력한 다중-어레이 평균("RMA")과 같은 정규화 방법은 마이크로어레이의 상이한 배치에 대한 가변성을 보정하고, 일루미나(Illumina) 및/또는 어피메트릭스(Affymetrix) 플랫폼에 의해 권장되는 R 패키지에서 이용가능하다. 정규화된 데이터는 로그 변환되고, 샘플에 대해 낮은 검출률을 가진 프로브는 제거된다. 또한, 이용가능한 유전자 기호 또는 Entrez ID가 없는 프로브는 분석으로부터 제거된다.
일부 구현예에서, 본 개시내용은 항-TNF 요법을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 포함하는 키트를 제공한다.
C. 분류기 사용
1. 환자 계층화
무엇보다도, 본 개시내용은 항-TNF 요법에 대한 반응성을 예측하기 위한 기술을 제공한다. 일부 구현예에서, 제공된 기술은 이전 방법보다 우수한 코호트에 대한 일관성 및/또는 정확성을 나타낸다.
따라서, 본 개시내용은 반응자 및 무반응자 집단을 정의 및/또는 구별하는, 환자 계층화를 위한 기술을 제공한다. 예를 들어, 일부 구현예에서, 본 개시내용은 항-TNF 요법으로 대상체를 치료하는 방법을 제공하며, 상기 방법은 일부 구현예에서, 항-TNF 요법을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계를 포함한다.
일부 구현예에서, 본 개시내용은 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계; 서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및 하나 이상의 SNP를 분류기에 포함시키는 단계를 포함하는, 하나 이상의 치료 속성에 대해 대상체를 계층화하기 위한 분류기를 개발하는 방법을 제공한다.
2. 요법 모니터링
또한, 본 개시내용은 주어진 대상체 또는 대상체의 코호트에 대한 요법을 모니터링하기 위한 기술을 제공한다. 대상체의 유전자 발현 수준은 시간이 지남에 따라 변할 수 있기 때문에, 일부 경우에 하나 이상의 시점에, 예를 들어, 특정 및 또는 주기적인 간격으로 대상체를 평가하는 것이 필요하거나 바람직할 수 있다.
일부 구현예에서, 시간 제약 하에 반복된 모니터링은 진행 중인 치료 요법에 영향을 미칠 수 있는 대상체의 유전자 발현 프로파일 또는 특징의 하나 이상의 변화의 검출을 허용하거나 달성한다. 일부 구현예에서, 대상체에게 투여된 특정 요법이 계속되거나, 변경되거나, 또는 중단되는 것에 대한 반응으로 변화가 검출된다. 일부 구현예에서, 요법은, 예를 들어, 대상체가 이미 치료되고 있는 하나 이상의 제제 또는 치료의 투여의 빈도 및/또는 양을 증가시키거나 감소시킴으로써 변경될 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, 요법은 하나 이상의 새로운 제제 또는 치료를 갖는 요법의 추가에 의해 변경될 수 있다. 일부 구현예에서, 요법은 하나 이상의 특정 제제 또는 치료의 중단 또는 중지에 의해 변경될 수 있다.
한 가지 예를 들자면, 대상체가 처음에 반응성으로 분류되면(대상체의 유전자 발현이 분류기를 통해 질환, 장애, 또는 병태와 연관된 것으로 결정되었기 때문에), 주어진 항-TNF 요법이 투여될 수 있다. 주어진 간격으로(예컨대, 6개월마다, 매년마다 등), 대상체는 주어진 항-TNF 요법에 대해 여전히 "반응성"에 해당한다는 것을 확인하기 위해 다시 시험될 수 있다. 주어진 대상체에 대한 유전자 발현 수준이 시간이 지남에 따라 변하고, 대상체가 질환, 장애, 또는 병태와 연관된 유전자를 더 이상 발현하지 않거나, 현재 무반응성과 연관된 유전자를 발현하는 경우, 대상체의 요법은 유전자 발현의 변화에 맞게 변경될 수 있다.
따라서, 일부 구현예에서, 본 개시내용은 분류기를 통해 항-TNF 요법에 반응성으로 이전에 확립된 대상체에게 요법을 투여하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은 투여 전에, 대상체가 분류기를 통해 반응자가 아님을 결정하는 단계; 및 항-TNF 요법에 대한 대안적인 요법을 투여하는 단계를 추가로 포함하는 방법을 제공한다.
일부 구현예에서, 대상체의 유전자는 마이크로어레이, RNA 시퀀싱, 실시간 정량적 역전사 PCR(qRT-PCR), 비드 어레이, ELISA, 및 단백질 발현 중 적어도 하나에 의해 측정된다.
일부 구현예에서, 대상체는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택된 질환, 장애, 또는 병태를 겪는다.
일부 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여이거나 이를 포함한다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙 또는 아달리무맙의 투여이거나 이를 포함한다.
일부 구현예에서, 반응성 및 무반응성의 사전 대상체는 동일한 질환, 장애, 또는 병태를 겪었다.
일부 구현예에서, 항-TNF 요법이 투여되는 대상체는 이전의 반응성 및 무반응성의 사전 대상체와 동일한 질환, 장애, 또는 병태를 겪고 있다.
일부 구현예에서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택된다.
일부 구현예에서, 질환, 장애, 또는 병태는 류마티스성 관절염이다.
일부 구현예에서, 질환, 장애, 또는 병태는 궤양성 대장염이다.
D. 치료 방법
일부 구현예에서, 항-TNF 요법이 투여되거나, 또는 항-TNF 요법이 보류되는(및/또는 대안적인 요법이 투여되는) 것과 관련된 대상체 또는 집단은 하나 이상의 유전자, 및 전형적으로 복수의 유전자에 대해 특정 발현 수준을 나타내는 것으로 결정된 대상체 또는 집단이다. 일부 구현예에서, 하나 이상의 유전자는 특정 역치 미만의 발현 수준을 갖는 것으로 결정되고; 대안적으로 또는 추가적으로, 일부 구현예에서, 하나 이상의 유전자는 특정 역치 미만의 발현 수준을 갖는 것으로 결정된다. 일부 구현예에서, 유전자의 특정 세트는 각각이 특정 역치에 대비하여 평가되는(그리고, 예컨대, 이러한 역치를 초과, 미만, 또는 대등한 것으로 결정됨) 발현 패턴을 갖는 것으로 결정된다.
일부 구현예에서, 본 개시내용은 하나 이상의 유전자의 특정 발현 수준 미만을 나타내는 것으로 결정된 대상체에게 항-TNF 요법에 대한 대안을 투여하는 단계를 포함하는, 질환, 장애, 또는 병태를 겪고 있는 대상체를 치료하는 방법을 제공한다.
따라서, 일부 구현예에서, 본 개시내용은
(a) 컴퓨팅 장치의 프로세서에 의해, 염증성 질환(예컨대, 자가면역 장애, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 구성원(들))을 포함하는 단계;
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여 항-TNF 요법에 대해 무반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
(c) 질환의 치료를 위해 대상체에게 제2 요법(예컨대, 항-TNF 요법에 대한 대안)을 처방 및/또는 투여하여, 대상체에의 제1 요법의 처방 및/또는 투여를 피하는 단계
를 포함하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은
(a) 컴퓨팅 장치의 프로세서에 의해, 질환(예컨대, 자가면역 질환, 예컨대, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 구성원(들))을 포함하는 단계;
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여 제1 요법(예컨대, 항-TNF 요법)에 반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
(c) 질환의 치료를 위해 대상체에게 제1 요법을 처방 및/또는 투여하는 단계
를 포함하는 방법을 제공한다.
일부 구현예에서, 본 개시내용은 항-TNF 요법을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 방법으로서(즉, 분류기는 후향적 분석을 통해 이들이 받은 항-TNF 요법에 반응한 사람 대 반응하지 않은 사람을 구별하도록 확립되었음); 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 및 하기 중 적어도 하나: 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 및 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발되는 것인 방법을 제공한다.
TNF 매개 장애는 현재 TNF의 억제에 의해, 및 특히 항-TNF 제제의 투여에 의해(즉, 항-TNF 요법에 의해) 치료된다. 미국에서 사용 승인된 항-TNF 제제의 예는 단클론 항체, 예컨대 아달리무맙(Humira®), 세르톨리주맙 페골(Cimiza®), 인플릭시맙(Remicade®), 및 데코이 순환 수용체 융합 단백질, 예컨대 에타네르셉트(Enbrel®)를 포함한다. 이들 제제는 현재 하기 표 2에 제시된 바와 같이 투여 요법에 따라 적응증 치료에 사용하기 위해 승인되었다:
Figure pct00009
Figure pct00010
Figure pct00011
본 개시내용은 표 2에 제시된 바와 같은 치료 요법을 포함하는 항-TNF 요법과 관련된 기술을 제공한다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙(Remicade®), 아달리무맙(Humira®), 세르톨리주맙 페골(Cimiza®), 에타네르셉트(Enbrel®), 또는 이의 바이오시밀러의 투여이거나 이를 포함한다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙(Remicade®) 또는 아달리무맙(Humira®)의 투여이거나 이를 포함한다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙(Remicade®)의 투여이거나 이를 포함한다. 일부 구현예에서, 항-TNF 요법은 아달리무맙(Humira®)의 투여이거나 이를 포함한다.
일부 구현예에서, 항-TNF 요법은 바이오시밀러 항-TNF 제제의 투여이거나 이를 포함한다. 일부 구현예에서, 항-TNF 제제는 인플릭시맙 바이오시밀러, 예컨대 CT-P13, BOW015, SB2, 인플렉트라(Inflectra), 렌플렉시스(Renflexis), 및 익시피(Ixifi), 아달리무맙 바이오시밀러, 예컨대 ABP 501(AMGEVITATM), 아드프라르(Adfrar), 및 훌리오TM(HulioTM)및 에타네르셉트 바이오시밀러, 예컨대 HD203, SB4(Benepali®), GP2015, 에렐지(Erelzi), 및 인타셉트(Intacept)에서 선택된다.
일부 구현예에서, 본 개시내용은 자가면역 장애를 겪고 있는 대상체를 치료하는 방법을 제공하며, 방법은 항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계로서; 분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자; 하기 중 적어도 하나: 하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는 반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징을 평가함으로써 개발되고; 분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증되는 단계를 포함한다.
일부 구현예에서, 항-TNF 요법을 받은 코호트에서의 대상체로부터 유래된 데이터는 하나의 유형(예컨대, 마이크로어레이, RNAseq 등)이고, 독립적인 코호트에서 분류기를 검증하는 데 사용되는 데이터는 상이한 유형(예컨대, 마이크로어레이, RNAseq)으로부터 유래된다. 따라서, 일부 구현예에서, 분류기는 반응성 및 무반응성의 사전 대상체로부터 유래된 마이크로어레이 분석을 사용하여 확립된다. 일부 구현예에서, 분류기는 독립적인 코호트로부터 유래된 RNAseq 데이터를 사용하여 검증된다.
본원에 제공된 바와 같이, 선택적으로 특정 임상 특징과 결합된 특정 유전자 조합의 유전자 발현 수준은 환자/대상체가 특정 요법(예컨대, 항-TNF 요법)에 반응하거나 반응하지 않는지 여부를 결정하는 데 사용될 수 있다. 예를 들어, 일부 구현예에서, 11개의 유전자 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3의 세트의 유전자 발현 수준을 기반으로 한 검증된 랜덤 포레스트 모델은 항-TNF 요법에 대한 반응자로서 대상체의 분류에서 0.72의 곡선하 면적(AUC), 0.85의 음성 예측값(NPV), 및 0.61의 진음성률(TNR)을 달성하였다. 이론에 구속되기를 바라지 않지만, 이들 유전자는 염증 과정, RA, 자가면역 및 항-TNF 제제의 작용 메커니즘과 매우 관련된 것으로 보인다. 달성된 높은 NPV는 약물 부작용이 심각할 수 있고 LDA 또는 관해가 달성되는 데 오랜 시간이 걸릴 수 있는 RA의 치료에 중요한 무반응자의 확인에 특히 중요하다. 예를 들어, 류마티스 전문의는 RA를 겪고 있는 주어진 대상체가 항-TNF 요법에 반응하지 않을 것임을 정확하게 예측할 수 있고, 따라서 그 대신 대안적인 요법을 처방할 수 있으므로, 대상체가 항-TNF 약물의 부작용 위험 및 비효과적인 질환 치료에 의해 유발된 지연을 피할 수 있게 한다.
일부 구현예에서, 대상체는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염에서 선택된 질환, 장애, 또는 병태를 겪는다.
일부 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여이거나 이를 포함한다. 일부 구현예에서, 항-TNF 요법은 인플릭시맙 또는 아달리무맙의 투여이거나 이를 포함한다.
일부 구현예에서, 항-TNF 요법에 대안적인 요법은 리툭시맙(Rituxan®), 사릴루맙(Kevzara®), 토파시티닙 시트레이트(Xeljanz®), 레푸노미드(Arava®), 베돌리주맙(Entyvio®), 토실리주맙(Actemra®), 아나킨라(Kineret®), 및 아바타셉트(Orencia®)에서 선택된다.
일반적으로, 제공된 개시내용은 항-TNF 요법의 투여가 고려되거나 구현되는 임의의 맥락에서 유용하다. 일부 구현예에서, 제공된 기술은 비정상적인(예컨대, 상승된) TNF 발현 및/또는 활성과 관련된 질환, 장애, 또는 병태를 겪고 있는 대상체의 진단 및/또는 치료에 유용하다. 일부 구현예에서, 제공된 기술은 항-TNF 요법을 받고 있거나 받은 대상체를 모니터링하는 데 유용하다. 일부 구현예에서, 제공된 기술은 대상체가 주어진 항-TNF 요법에 반응할지 또는 반응하지 않을지 확인한다. 일부 구현예에서, 제공된 기술은 대상체가 주어진 항-TNF 요법에 대한 내성을 발생시킬지 여부를 확인한다.
E. 질환, 장애, 또는 병태
일반적으로, 제공된 개시내용은 항-TNF 요법의 투여가 고려되거나 구현되는 임의의 맥락에서 유용하다. 일부 구현예에서, 제공된 기술은 비정상적인(예컨대, 상승된) TNF 발현 및/또는 활성과 관련된 질환, 장애, 또는 병태를 겪고 있는 대상체의 진단 및/또는 치료에 유용하다. 일부 구현예에서, 제공된 기술은 항-TNF 요법을 받고 있거나 받은 대상체를 모니터링하는 데 유용하다. 일부 구현예에서, 제공된 기술은 대상체가 주어진 항-TNF 요법에 반응할지 또는 반응하지 않을지 확인한다. 일부 구현예에서, 제공된 기술은 대상체가 주어진 항-TNF 요법에 대한 내성을 발생시킬지 여부를 확인한다.
따라서, 본 개시내용은 표 2에 열거된 것을 포함하는, TNF와 관련된 다양한 장애의 치료와 관련된 기술을 제공한다. 일부 구현예에서, 대상체는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병(성인 또는 소아), 궤양성 대장염, 염증성 장 질환, 만성 건선, 판상 건선, 화농성 한선염, 천식, 포도막염, 및 소아 특발성 관절염에서 선택된 질환, 장애, 또는 병태를 겪고 있다. 일부 구현예에서, 질환, 장애, 또는 병태는 류마티스성 관절염이다. 일부 구현예에서, 질환, 장애, 또는 병태는 건선 관절염이다. 일부 구현예에서, 질환, 장애, 또는 병태는 강직성 척추염이다. 일부 구현예에서, 질환, 장애, 또는 병태는 크론병이다. 일부 구현예에서, 질환, 장애, 또는 병태는 성인 크론병이다. 일부 구현예에서, 질환, 장애, 또는 병태는 소아 크론병이다. 일부 구현예에서, 질환, 장애, 또는 병태는 염증성 장 질환이다. 일부 구현예에서, 질환, 장애, 또는 병태는 궤양성 대장염이다. 일부 구현예에서, 질환, 장애, 또는 병태는 만성 건선이다. 일부 구현예에서, 질환, 장애, 또는 병태는 판상 건선이다. 일부 구현예에서, 질환, 장애, 또는 병태는 화농성 한선염이다. 일부 구현예에서, 질환, 장애, 또는 병태는 천식이다. 일부 구현예에서, 질환, 장애, 또는 병태는 포도막염이다. 일부 구현예에서, 질환, 장애, 또는 병태는 소아 특발성 관절염이다.
일부 구현예에서, 질환, 장애, 또는 병태는 환상 육아종(granuloma annulare), 지방성 생괴사(necrobiosis lipoidica), 화농성 한선염(hidradenitis suppurativa), 괴저성 농피증(pyoderma gangrenossum), 스위트 증후군(Sweet's syndrome), 각질하 농포성 피부병(subcorneal pustular dermatosis), 전신 홍반성 루푸스(systemic lupus erythematosus), 경피증, 피부근염, 베체트병, 급성/만성 이식편대 숙주 질환, 모공성 홍색 비강진(pityriasis rubra pilaris), 쇼그렌 증후군, 베게너 육아종증, 류마티스성 다발성근육통, 피부근염, 및 괴저성 농피증이다.
또한, 언급된 바와 같이, 본 개시내용은 의사가 대상체의 코호트에서의 반응을 신뢰성 있고 일관되게 예측하게 하는 기술을 제공한다. 특히, 예를 들어, 일부 항-TNF 요법에 대한 반응률은 주어진 대상체의 코호트 내에서 35% 미만이다. 제공된 기술은 대상체의 코호트 내에서 65% 초과 정확성으로 반응률(즉, 특정 대상체가 주어진 요법에 반응할지 또는 반응하지 않을지 여부)의 예측을 허용한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 반응자(즉, 항-TNF 요법에 반응할)인 대상체를 65% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 반응자인 대상체를 70% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 반응자인 대상체를 80% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 반응자인 대상체를 90% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 반응자인 대상체를 100% 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 무반응자(즉, 항-TNF 요법에 반응하지 않을)인 대상체를 65% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 무반응자인 대상체를 70% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 무반응자인 대상체를 80% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 무반응자인 대상체를 90% 이상 예측한다. 일부 구현예에서, 본원에 기재된 방법 및 시스템은 주어진 코호트 내에서 무반응자인 대상체를 100% 예측한다.
F. 파이프라인 분석
또한 임상 소프트웨어에 필요한 추적가능성 및 V&V 시험/문서화를 허용하지만 시간 경과에 따른 구성요소의 업데이트를 허용하기 위해 유연한 모듈식 아키텍처로 게놈 데이터를 분석하기 위한 파이프라인이 본원에 기재된다. DNA 및 RNA(RNAseq)의 차세대 시퀀싱(NGS)은 빠르게 진화하는 분야이고, 생물정보학 알고리즘 및 구성요소에 대한 개선이 정기적으로 이용가능하게 되고 있다. 이것은 전통적으로 제한되고(lock down) 검증된 표준 IVD 소프트웨어와 충돌한다. 소프트웨어에 대한 임의의 변형은 광범위한 재입증 및 재검증이 필요하다. 특정 구현예에서, 본원에 기재된 파이프라인은 하나 이상의 독점 알고리즘과 함께 파이프라인에서 조립될, R로 작성된 알고리즘인 기존의 최첨단 생물정보학 모듈, 예컨대 RSEM, STAR의 사용을 허용한다. 각 모듈은 래퍼(wrapper)에 "캡슐화"된다. 파이프라인의 각 구성요소는 독립적으로 검증될 수 있다. 전체 파이프라인은 검증될 것이고, 시스템은 웨트-실험실(wet-lab) 생성 데이터를 사용하여 검증될 것이다. 만약 파이프라인의 임의의 구성요소, 예컨대 RSEM, STAR 또는 하나 이상의 독점 알고리즘가 향후에 업데이트된다면, 업그레이드된 구성요소를 확인하고, 업그레이드된 구성요소를 갖는 시스템을 확인하고, 이전에 생성된 웨트 실험실 데이터를 재분석함으로써 손쉬운 V&V가 완료될 수 있다.
도 2는 독점 분류 알고리즘 - 이 예에서, R(특정 요법에 대한 반응자) 또는 NR(요법에 대한 무반응자)의 분류 결과를 생성하는 독점 알고리즘에 대한 입력을 생성하는 데 사용될 수 있는 RNA-seq 생물정보학 파이프라인의 예시적인 구현예를 도시한다. 다른 종류의 분류가 수행될 수 있다.
도 2의 예시적인 구현예에 예시된 바와 같이:
1. RNAseq 생물정보학 파이프라인
a. 애플리케이션은 fastq 파일 및 환자 식별자를 읽고 일련의 속성값과 함께 동일한 환자 식별자를 특징으로 하는 구조화된 텍스트 보고서(포맷은, 예를 들어, XML, JSON, 또는 다른 옵션일 수 있음)를 내놓는다.
b. 입력 파일은 fastq 텍스트 데이터 파일이다(평균적으로 ~30M 읽기, 파일당 ~1.4G 파일 크기).
c. fastq 입력 파일부터 최종 보고서까지의 절차는 다음을 포함한다:
i. STAR(Spliced Transcripts Alignment to a Reference) 정렬기[Dobin et al., 2013]를 이용하여 참조 게놈 어셈블리(인간 게놈 어셈블리 GRCh37 또는 GRCh38)에 대한 fastq 짧은 읽기 레코드의 정렬
ii. RSEM(RNA-Seq by Expectation-Maximization) 소프트웨어 패키지(Li and Wewey, 2011)를 이용한 전사체 존재량(transcript abundance)의 정량화.
iii. 사용자정의 방법에 의한 선택적 정규화
2. PrismRA 알고리즘(예시적인 독점 알고리즘)
a. R 패키지를 사용하여 이전 단계에서 생성된 입력 데이터 매트릭스에 대해 설정된 이진 결과의 모델링. 이 R 패키지는 glmnet, beanplots, pROC 및 samr를 포함하는 다른 패키지에 대한 종속성을 특징으로 할 것이다.
3. QC 트랙킹(tracking) 및 트리거(trigger)
a. 최종 텍스트 보고서 외에도, 애플리케이션은 그의 값이 소프트웨어의 상이한 행동을 유발하는 중간 QC 보고서를 읽고 쓸 수 있다.
b. QC 보고서는 FastQC 패키지(이는 3개의 Picard BAM/SAM 라이브러리가 필요함)가 있는 fastq 파일로부터 그리고 RNA-SeQC 패키지가 있는 BAM 파일로부터 생성된다.
4. 데이터 추적가능성, 보안, 개인정보 보호, 규정 준수
a. 결과는 모든 입력 및 프로세스에 대해 완전히 추적가능하다.
b. 데이터 개인정보 보호 및 보안: 예컨대, 21 CFR Part 11, HIPAA 및 ISO27001 보안 규정 준수; GDPR 규정 준수.
c. 안정성:
i. 소프트웨어는 자동 패키지 업데이트로부터 격리된다.
ii. 소프트웨어는 휴대용이며, 예컨대, 프레미스 또는 프라이빗 클라우드 상에 배포될 수 있는 컨테이너 내에 있다.
도 4에 나타낸 바와 같이, 본원에 기재된 바와 같은 시스템, 방법, 및 아키텍처를 제공하는 데 사용하기 위한 네트워크 환경(400)의 구현이 도시되고 설명된다. 개괄적으로, 도 4를 참조하면, 예시적인 클라우드 컴퓨팅 환경(400)의 블록 다이어그램이 도시되고 설명된다. 클라우드 컴퓨팅 환경(400)은 하나 이상의 자원 제공자(402a, 402b, 402c)(집합적으로 402)를 포함할 수 있다. 각각의 자원 제공자(402)는 컴퓨팅 자원을 포함할 수 있다. 일부 구현에서, 컴퓨팅 자원은 데이터를 처리하는 데 사용되는 임의의 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 예를 들어, 컴퓨팅 자원은 알고리즘, 컴퓨터 프로그램, 및/또는 컴퓨터 애플리케이션을 실행할 수 있는 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 일부 구현에서, 예시적인 컴퓨팅 자원은 저장 및 검색 능력을 갖는 애플리케이션 서버 및/또는 데이터베이스를 포함할 수 있다. 각각의 자원 제공자(402)는 클라우드 컴퓨팅 환경(400)에서 임의의 다른 자원 제공자(402)에 연결될 수 있다. 일부 구현에서, 자원 제공자(402)는 컴퓨터 네트워크(408)를 통해 연결될 수 있다. 각각의 자원 제공자(402)는 컴퓨터 네트워크(408)를 통해 하나 이상의 컴퓨팅 장치(404a, 404b, 404c)(집합적으로 404)에 연결될 수 있다.
클라우드 컴퓨팅 환경(400)은 자원 관리자(406)를 포함할 수 있다. 자원 관리자(406)는 컴퓨터 네트워크(408)를 통해 자원 제공자(402) 및 컴퓨팅 장치(404)에 연결될 수 있다. 일부 구현에서, 자원 관리자(406)는 하나 이상의 자원 제공자(402)에 의해 컴퓨팅 자원을 하나 이상의 컴퓨팅 장치(404)에 제공하는 것을 용이하게 할 수 있다. 자원 관리자(406)는 특정 컴퓨팅 장치(404)로부터 컴퓨팅 자원에 대한 요청을 수신할 수 있다. 자원 관리자(406)는 컴퓨팅 장치(404)에 의해 요청된 컴퓨팅 자원을 제공할 수 있는 하나 이상의 자원 제공자(402)를 식별할 수 있다. 자원 관리자(406)는 컴퓨팅 자원을 제공하기 위해 자원 제공자(402)를 선택할 수 있다. 자원 관리자(406)는 자원 제공자(402) 및 특정 컴퓨팅 장치(404) 사이의 연결을 용이하게 할 수 있다. 일부 구현에서, 자원 관리자(406)는 특정 자원 제공자(402) 및 특정 컴퓨팅 장치(404) 사이의 연결을 확립할 수 있다. 일부 구현에서, 자원 관리자(406)는 특정 컴퓨팅 장치(404)를 요청된 컴퓨팅 자원을 갖는 특정 자원 제공자(402)에게 다시 보낼 수 있다.
도 5는 본 개시내용에 기재된 기술을 구현하는 데 사용될 수 있는 컴퓨팅 장치(500) 및 모바일 컴퓨팅 장치(550)의 예를 보여준다. 컴퓨팅 장치(500)는 다양한 형태의 디지털 컴퓨터, 예컨대 랩탑, 데스크탑, 워크스테이션, 개인 디지털 단말기, 서버, 블레이드 서버, 메인프레임, 및 다른 적절한 컴퓨터를 대표하는 것으로 의도된다. 모바일 컴퓨팅 장치(550)는 다양한 형태의 모바일 장치, 예컨대 개인 디지털 단말기, 휴대폰, 스마트폰, 및 다른 유사한 컴퓨팅 장치를 대표하는 것으로 의도된다. 본원에 도시된 구성요소, 이들의 연결 및 관계, 및 이들의 기능은 단지 예시인 것으로 의도되며 제한하고자 하는 것이 아니다.
컴퓨팅 장치(500)는 프로세서(502), 메모리(504), 저장 장치(506), 메모리(504)에 연결되는 고속 인터페이스(508) 및 다중 고속 확장 포트(510), 및 저속 확장 포트(514) 및 저장 장치(506)에 연결되는 저속 인터페이스(512)를 포함한다. 프로세서(502), 메모리(504), 저장 장치(506), 고속 인터페이스(508), 고속 확장 포트(510), 및 저속 인터페이스(512) 각각은 다양한 버스를 사용하여 상호연결되며, 일반적인 마더보드 상에 또는 적절한 다른 방식으로 장착될 수 있다. 프로세서(502)는 고속 인터페이스(508)에 결합된 디스플레이(516)와 같은 외부 입력/출력 장치 상에 GUI를 위한 그래픽 정보를 표시하기 위해 메모리(504)에 또는 저장 장치(506) 상에 저장된 명령을 포함하는, 컴퓨팅 장치(500) 내에서 실행하기 위한 명령을 처리할 수 있다. 다른 구현에서, 다중 프로세서 및/또는 다중 버스는 다중 메모리 및 메모리 유형과 함께 적절하게 사용될 수 있다. 또한, 다중 컴퓨팅 장치가 연결될 수 있으며, 각각의 장치는 필요한 작업의 일부를 제공한다(예컨대, 서버 뱅크, 블레이드 서버의 그룹, 또는 다중-프로세서 시스템으로서). 따라서, 본원에 사용된 바와 같이, 복수의 기능이 "프로세서"에 의해 수행되는 것으로 설명되는 경우, 이것은 복수의 기능이 임의의 수의 컴퓨팅 장치(하나 이상)의 임의의 수의 프로세서(하나 이상)에 의해 수행되는 구현예를 포함한다. 또한, 하나의 기능이 "프로세서"에 의해 수행되는 것으로 설명되는 경우, 이것은 상기 기능이 임의의 수의 컴퓨팅 장치(하나 이상)의 임의의 수의 프로세서(하나 이상) (예컨대, 분산 컴퓨팅 시스템에서)에 의해 수행되는 구현예를 포함한다.
메모리(504)는 컴퓨팅 장치(500) 내에 정보를 저장한다. 일부 구현에서, 메모리(504)는 휘발성 메모리 유닛 또는 유닛들이다. 일부 구현에서, 메모리(504)는 비휘발성 메모리 유닛 또는 유닛들이다. 메모리(504)는 다른 형태의 컴퓨터 판독가능한 매체, 예컨대 자기 또는 광 디스크일 수도 있다.
저장 장치(506)는 컴퓨팅 장치(500)를 위한 대용량 저장을 제공할 수 있다. 일부 구현에서, 저장 장치(506)는 컴퓨터 판독가능한 매체, 예컨대 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 또는 테이프 장치, 플래쉬 메모리 또는 다른 유사한 고체형 메모리 장치, 또는 다수의 장치, 예컨대 저장 영역 네트워크 또는 다른 구성의 장치이거나 이를 포함할 수 있다. 명령은 정보 캐리어에 저장될 수 있다. 명령은, 하나 이상의 처리 장치(예를 들어, 프로세서(502))에 의해 실행될 때, 상기 기재된 것과 같은 하나 이상의 방법을 수행한다. 명령은 또한 컴퓨터 또는 기계 판독가능한 매체(예를 들어, 메모리(504), 저장 장치(506), 또는 프로세서(502) 상의 메모리)와 같은 하나 이상의 저장 장치에 의해 저장될 수 있다.
고속 인터페이스(508)는 컴퓨팅 장치(500)를 위한 대역폭 집약적 동작을 관리하는 반면, 저속 인터페이스(512)는 더 낮은 대역폭 집약형 동작을 관리한다. 이러한 기능 할당은 예시일 뿐이다. 일부 구현에서, 고속 인터페이스(508)는 메모리(504), 디스플레이(516)(예컨대, 그래픽 프로세서 또는 가속기를 통해), 및 다양한 확장 카드(도시되지 않음)를 수용할 수 있는 고속 확장 포트(510)에 결합된다. 구현에서, 저속 인터페이스(512)는 저장 장치(506) 및 저속 확장 포트(514)에 결합된다. 다양한 통신 포트(예컨대, USB, 블루투스®, 이더넷, 무선 이더넷)를 포함할 수 있는 저속 확장 포트(514)는 예컨대, 네트워크 어댑터를 통해, 하나 이상의 입력/출력 장치, 예컨대 키보드, 포인팅 장치, 스캐너, 또는 네트워킹 장치, 예컨대 스위치 또는 라우터에 결합될 수 있다.
컴퓨팅 장치(500)는 도면에 도시된 바와 같이 많은 상이한 형태로 구현될 수 있다. 예를 들어, 그것은 표준 서버(520)로서, 또는 이러한 서버의 그룹에서 여러 번 구현될 수 있다. 또한, 그것은 개인용 컴퓨터, 예컨대 랩탑 컴퓨터(522)에서 구현될 수 있다. 그것은 또한 랙 서버 시스템 524의 일부로서 구현될 수 있다. 대안적으로, 컴퓨팅 장치(500)로부터의 구성요소는 모바일 장치(도시되지 않음), 예컨대 모바일 컴퓨팅 장치(550) 내의 다른 구성요소와 조합될 수 있다. 이러한 장치 각각은 컴퓨팅 장치(500) 및 모바일 컴퓨팅 장치(550) 중 하나 이상을 포함할 수 있고, 전체 시스템은 서로 통신하는 다수의 컴퓨팅 장치로 구성될 수 있다.
모바일 컴퓨팅 장치(550)는 다른 구성요소 중에서 프로세서(552), 메모리(564), 입력/출력 장치, 예컨대 디스플레이(554), 통신 인터페이스(566), 및 트랜스시버(568)을 포함한다. 모바일 컴퓨팅 장치(550)는 또한 추가 저장을 제공하기 위해 마이크로 장치 또는 다른 장치와 같은 저장 장치를 제공받을 수 있다. 프로세서(552), 메모리(564), 디스플레이(554), 통신 인터페이스(566), 및 트랜스시버(568) 각각은 다양한 버스를 사용하여 상호연결되고, 구성요소 중 몇 개는 일반 마더보드 상에 또는 적절한 다른 방식으로 장착될 수 있다.
프로세서(552)는 메모리(564)에 저장된 명령을 포함하여, 모바일 컴퓨팅 장치(550) 내에서 명령을 실행할 수 있다. 프로세서(552)는 개별 및 다중 아날로그 및 디지털 프로세서를 포함하는 칩의 칩셋으로서 구현될 수 있다. 프로세서(552)는, 예를 들어 모바일 컴퓨팅 장치(550)의 다른 구성요소의 조율, 예컨대 사용자 인터페이스, 모바일 컴퓨팅 장치(550)에 의해 작동되는 애플리케이션, 및 모바일 컴퓨팅 장치(550)에 의한 무선 통신의 제어를 제공할 수 있다.
프로세서(552)는 제어 인터페이스(558) 및 디스플레이(554)에 연결된 디스플레이 인터페이스(556)를 통해 사용자와 통신할 수 있다. 디스플레이(554)는, 예를 들어, TFT(Thin-Film-Transistor Liquid Crystal Display) 디스플레이 또는 OLED(Organic Light Emitting Diode) 디스플레이, 또는 다른 적절한 디스플레이 기술일 수 있다. 디스플레이 인터페이스(556)는 그래픽 및 다른 정보를 사용자에게 제공하기 위해 디스플레이(554)를 구동하기 위한 적절한 회로를 포함할 수 있다. 제어 인터페이스(558)는 사용자로부터 명령을 수신하고 이들을 프로세서(552)에 제출하기 위해 변환할 수 있다. 또한, 외부 인터페이스(562)는 모바일 컴퓨팅 장치(550)와 다른 장치와의 근거리 통신을 가능하게 하기 위해 프로세서(552)와의 통신을 제공할 수 있다. 외부 인터페이스(562)는, 예를 들어, 일부 구현에서 유선 통신을 제공하거나, 또는 다른 구현에서 무선 통신을 제공할 수 있고, 다중 인터페이스가 또한 사용될 수 있다.
메모리(564)는 모바일 컴퓨팅 장치(550) 내에 정보를 저장한다. 메모리(564)는 컴퓨터 판독가능한 매체 또는 매체들, 휘발성 메모리 유닛 또는 유닛들, 또는 비휘발성 메모리 유닛 또는 유닛들 중 하나 이상으로서 구현될 수 있다. 확장 메모리(574)는 또한 확장 인터페이스(572)를 통해 모바일 컴퓨팅 장치(550)에 제공되고 연결될 수 있으며, 이는, 예를 들어, SIMM(Single In Line Memory Module) 카드 인터페이스를 포함할 수 있다. 확장 메모리(574)는 모바일 컴퓨팅 장치(550)를 위한 추가 저장 공간을 제공할 수 있거나, 또한 모바일 컴퓨팅 장치(550)를 위한 애플리케이션 또는 다른 정보를 저장할 수 있다. 구체적으로, 확장 메모리(574)는 상기 기재된 프로세스를 수행하거나 보완하기 위한 명령을 포함할 수 있고, 보안 정보도 포함할 수 있다. 따라서, 예를 들어, 확장 메모리(574)는 모바일 컴퓨팅 장치(550)를 위한 보안 모듈로서 제공될 수 있고, 모바일 컴퓨팅 장치(550)의 안전한 사용을 허용하는 명령으로 프로그래밍될 수 있다. 또한, 보안 애플리케이션은 해킹할 수 없는 방식으로 SIMM 카드 상에 식별 정보를 배치하는 것과 같이, 추가 정보와 함께, SIMM 카드를 통해 제공될 수 있다.
메모리는, 예를 들어, 하기에 논의된 바와 같은 플래쉬 메모리 및/또는 NVRAM 메모리(비휘발성 랜덤 액세스 메모리)를 포함할 수 있다. 일부 구현에서, 명령은 정보 캐리어에 저장된다. 명령은 하나 이상의 처리 장치(예를 들어, 프로세서(552))에 의해 실행될 때 상기 기재된 것과 같은 하나 이상의 방법을 수행한다. 명령은 또한 하나 이상의 저장 장치, 예컨대 하나 이상의 컴퓨터 또는 기계 판독가능한 매체(예를 들어, 메모리(564), 확장 메모리(574), 또는 프로세서(552) 상의 메모리)에 의해 저장될 수 있다. 일부 구현에서, 명령은, 예를 들어, 트랜스시버(568) 또는 외부 인터페이스(562)를 통해, 전파된 신호로 수신될 수 있다.
모바일 컴퓨팅 장치(550)는 통신 인터페이스(566)를 통해 무선으로 통신할 수 있고, 이는 필요한 경우 디지털 신호 처리 회로를 포함할 수 있다. 통신 인터페이스(566)는, 예컨대 특히 GSM 음성 통화(Global System for Mobile communications), SMS(Short Message Service), EMS(Enhanced Messaging Service), 또는 MMS 메시징(Multimedia Messaging Service), CDMA(code division multiple access), TDMA(time division multiple access), PDC(Personal Digital Cellular), WCDMA(Wideband Code Division Multiple Access), CDMA2000, 또는 GPRS(General Packet Radio Service)와 같은 다양한 모드 또는 프로토콜 하에 통신을 제공할 수 있다. 이러한 통신은, 예를 들어, 무선 주파수를 사용하여 트랜스시버(568)를 통해 발생할 수 있다. 또한, 근거리 통신은, 예컨대 Bluetooth®, Wi-Fi™ 또는 다른 이러한 트랜스시버(도시되지 않음)를 사용하여 발생할 수 있다. 또한, GPS(Global Positioning System) 수신기 모듈(570)은 추가적인 네비게이션 및 위치 관련 무선 데이터를 모바일 컴퓨팅 장치(550)에 제공할 수 있고, 이는 모바일 컴퓨팅 장치(550) 상에서 작동하는 애플리케이션에 의해 적절하게 사용될 수 있다.
모바일 컴퓨팅 장치(550)는 또한 오디오 코덱(560)을 사용하여 청각적으로 통신할 수 있으며, 이는 사용자로부터 음성 정보를 수신하고 이를 사용가능한 디지털 정보로 변환할 수 있다. 오디오 코덱(560)은 마찬가지로, 예컨대, 모바일 컴퓨팅 장치(550)의 핸드셋에서, 예컨대 스피커를 통해, 사용자를 위한 가청 사운드를 생성할 수 있다. 이러한 사운드는 음성 전화 통화로부터의 사운드를 포함할 수 있고, 녹음된 사운드(예컨대, 음성 메시지, 음악 파일 등)를 포함할 수 있으며, 또한 모바일 컴퓨팅 장치(550) 상에서 작동하는 애플리케이션에 의해 생성된 사운드를 포함할 수 있다.
모바일 컴퓨팅 장치(550)는 도면에 도시된 바와 같이 많은 상이한 형태로 구현될 수 있다. 예를 들어, 그것은 휴대폰(580)으로서 구현될 수 있다. 그것은 또한 스마트폰(582), 개인 디지털 단말기, 또는 다른 유사한 모바일 장치의 일부로서 구현될 수 있다.
본원에 기재된 시스템 및 기술의 다양한 구현은 디지털 전자 회로, 집적 회로, 특별히 설계된 ASIC(application specific integrated circuits), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이의 조합으로 실현될 수 있다. 이러한 다양한 구현은 데이터 및 명령을 수신하고 데이터 및 명령을 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치에 전송하기 위해 결합된, 특수 또는 범용일 수 있는 적어도 하나의 프로그램가능한 프로세서를 포함하는 프로그램가능한 시스템 상에서 실행가능 및/또는 해석가능한 하나 이상의 컴퓨터 프로그램에서의 구현을 포함할 수 있다.
이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드로도 알려짐)은 프로그램가능한 프로세서에 대한 기계 명령을 포함하고, 높은 수준 절차 및/또는 객체 지향 프로그래밍 언어로, 및/또는 어셈블리/기계 언어로 구현될 수 있다. 본원에 사용된 바와 같이, 용어 기계 판독가능한 매체 및 컴퓨터 판독가능한 매체는 기계 판독가능 신호로서 기계 명령을 수신하는 기계 판독가능한 매체를 포함하는 프로그램가능한 프로세서에 기계 명령 및/또는 데이터를 제공하는 데 사용되는 임의의 컴퓨터 프로그램 제품, 장치 및/또는 장치(예컨대, 자기 디스크, 광 디스크, 메모리, 프로그램가능한 논리 장치(PLD))를 지칭한다. 용어 기계 판독가능 신호는 기계 명령 및/또는 데이터를 프로그램가능한 프로세서에 제공하는 데 사용되는 임의의 신호를 지칭한다.
사용자와의 상호작용을 제공하기 위해, 본원에 기재된 시스템 및 기술은 사용자에게 정보를 표시하기 위한 디스플레이 장치(예컨대, CRT(cathode ray tube) 또는 LCD(liquid crystal display) 모니터) 및 사용자가 컴퓨터에 입력을 제공할 수 있는 키보드 및 포인팅 장치(예컨대, 마우스 또는 트랙볼)를 갖는 컴퓨터 상에 구현될 수 있다. 다른 종류의 장치도 사용자와의 상호작용을 제공하는 데 사용될 수 있고, 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 감각 피드백(예컨대, 시각적 피드백, 청각적 피드백, 또는 촉각적 피드백)일 수 있으며, 사용자로부터의 입력은 음향, 음성, 또는 촉각적 입력을 포함하는 임의의 형태로 수신될 수 있다.
본원에 기재된 시스템 및 기술은 백 엔드 구성요소(예컨대, 데이터 서버로서)를 포함하거나, 또는 미들웨어 구성요소(예컨대, 애플리케이션 서버)를 포함하거나, 또는 프론트 엔드 구성요소(예컨대, 사용자가 본원에 기재된 시스템 및 기술의 구현과 상호작용할 수 있는 그래픽 사용자 인터페이스 또는 웹 브라우저를 갖는 클라이언트 컴퓨터)를 포함하는 컴퓨팅 시스템으로, 또는 이러한 백 엔드, 미들웨어, 또는 프론트 엔드 구성요소의 임의의 조합으로 구현될 수 있다. 시스템의 구성요소는 임의의 형태 또는 매체의 디지털 데이터 통신(예컨대, 통신 네트워크)에 의해 상호연결될 수 있다. 통신 네트워크의 예는 근거리 네트워크(LAN), 광역 네트워크(WAN), 및 인터넷을 포함한다.
컴퓨팅 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트 및 서버는 일반적으로 서로 멀리 떨어져 있으며, 전형적으로 통신 네트워크를 통해 상호작용한다. 클라이언트 및 서버의 관계는 각각의 컴퓨터에서 작동되고 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램에 의해 발생한다.
일부 구현에서, 본원에 기재된 모듈은 분리되거나, 단일 또는 조합 모듈로 포함될 수 있다. 도면에 도시된 모듈은 본원에 기재된 시스템을 여기에 도시된 소프트웨어 아키텍처로 제한하고자 하는 것은 아니다.
본원에 기재된 상이한 구현의 요소는 상기에 구체적으로 제시되지 않은 다른 구현을 형성하기 위해 조합될 수 있다. 요소는 이들의 작동에 부정적인 영향을 미치지 않으면서 본원에 기재된 프로세스, 컴퓨터 프로그램, 데이터베이스 등에서 제외될 수 있다. 또한, 도면에 도시된 논리 흐름은 원하는 결과를 달성하기 위해 도시된 특정 순서, 또는 순차적 순서를 요구하지 않는다. 다양한 개별 요소는, 일부 구현예에서 본원에 기재된 시스템 및 방법의 구조, 기능 및 장치에 비추어, 본원에 기재된 기능을 수행하기 위해 하나 이상의 개별 요소로 조합될 수 있다.
청구된 발명의 시스템, 아키텍처, 장치, 방법, 및 프로세스는 본원에 기재된 구현예로부터의 정보를 사용하여 개발된 변형 및 개조를 포함하는 것으로 고려된다. 본원에 기재된 시스템, 아키텍처, 장치, 방법, 및 프로세스의 개조 및/또는 변형은 이 설명에 의해 고려되는 바와 같이 수행될 수 있다.
설명 전반에 걸쳐, 물품, 장치, 시스템, 및 아키텍처가 특정 구성요소를 갖거나 포함하는 것으로 설명되거나, 또는 프로세스 및 방법이 특정 단계를 갖거나 포함하는 것으로 설명되는 경우, 추가적으로, 언급된 구성요소로 본질적으로 구성되거나 구성되는 본 발명의 장치, 장치, 시스템, 및 아키텍처가 있고, 언급된 처리 단계로 본질적으로 구성되거나 구성되는 본 발명에 따른 프로세스 및 방법이 있음이 고려된다.
단계의 순서 또는 특정 동작을 수행하기 위한 순서는 본 발명이 작동가능한 상태로 유지되는 한 중요하지 않음을 이해해야 한다. 더욱이, 2개 이상의 단계 또는 동작은 동시에 수행될 수 있다.
예를 들어, 배경 섹션에서, 임의의 간행물의 본원에서의 언급은 간행물이 본원에 제시된 임의의 청구범위에 대해 선행 기술로서의 역할을 한다는 것을 인정하는 것은 아니다. 배경 섹션은 명료함을 위해 제시되며, 임의의 청구범위에 대해 선행 기술의 설명으로서 의미되지 않는다.
헤더는 읽는 사람의 편의를 위해 제공된다. 헤더의 존재 및/또는 배치는 본원에 기재된 주제의 범위를 제한하는 것으로 의도되지 않는다.
G. 예시적인 구현예
하기 번호가 매겨진 구현예는 비제한적이지만 개시내용의 특정 양태를 예시한다:
구현예 1. 항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계로서;
분류기는 발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자;
하기 중 적어도 하나:
하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는
반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징
을 평가함으로써 개발되고;
분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증되는 단계를 포함하는 자가면역 장애를 겪고 있는 대상체를 치료하는 방법
구현예 2. 구현예 1에 있어서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측하는 방법.
구현예 3. 구현예 1 또는 2에 있어서, 하나 이상의 유전자는 인간 상호작용체 맵 상에 맵핑될 때 이들의 위상학적 특성에 의해 특성화되는 방법.
구현예 4. 구현예 1-3 중 어느 하나의 구현예에서, SNP는 인간 게놈을 참조하여 확인되는 방법.
구현예 5. 구현예 1-4 중 어느 하나의 구현예에서, 분류기는
발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자;
하나 이상의 SNP의 존재; 및
적어도 하나의 임상 특징
각각을 평가함으로써 개발되는 방법.
구현예 6. 구현예 1-5 중 어느 하나의 구현예에서, 하나 이상의 유전자는 하기에서 선택되는 것인 방법:
Figure pct00012
구현예 7. 구현예 1-6 중 어느 하나의 구현예에서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택되는 방법.
구현예 8. 구현예 1-6 중 어느 하나의 구현예에서, 분류기는 적어도 90% 정확성으로 무반응성인 집단 내에서 대상체의 적어도 40%를 확인하고, 집단은 적어도 170명의 대상체를 포함하는 방법.
구현예 9. 구현예 1-8 중 어느 하나의 구현예에서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여를 포함하는 방법.
구현예 10. 구현예 1-9 중 어느 하나의 구현예에서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택되는 방법.
구현예 11. 구현예 1-10 중 어느 하나의 구현예에서, 분류기는 반응성 및 무반응성의 사전 대상체로부터 유래된 마이크로어레이 분석을 사용하여 확립되는 방법.
구현예 12. 구현예 1-11 중 어느 하나의 구현예에서, 분류기는 독립적인 코호트로부터 유래된 RNAseq 데이터를 사용하여 검증되는 방법.
구현예 13. 구현예 1-12 중 어느 하나의 구현예에서, SNP는 표 5에서 선택되는 방법.
구현예 14. 항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성 또는 무반응성으로 분류된 대상체에게 요법을 투여하는 단계로서;
대상체가 분류기에 의해 반응성으로 분류되는 경우, 항-TNF 요법을 투여하고; 대상체가 분류기에 의해 무반응성으로 분류되는 경우, 항-TNF 요법에 대한 대안을 투여하고;
분류기는
발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자;
하기 중 적어도 하나:
하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는
반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징
을 평가함으로써 개발되며;
분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증되는 단계
를 포함하는 자가면역 질환을 겪고 있는 대상체에게 요법을 투여하는 방법.
구현예 15. 구현예 14에 있어서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측하는 방법.
구현예 16. 구현예 15에 있어서, 분류기는
발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는(예컨대, 선형 및/또는 비선형 방식으로) 하나 이상의 유전자;
하나 이상의 SNP의 존재; 및
적어도 하나의 임상 특징
각각을 평가함으로써 개발되는 방법.
구현예 17. 구현예 14-16 중 어느 한 구현예에 있어서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택되는 방법.
구현예 18. 구현예 14-17 중 어느 한 구현예에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여를 포함하는 방법.
구현예 19. 구현예 14-18 중 어느 한 구현예에 있어서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트에서 선택되는 방법.
구현예 20. 구현예 19에 있어서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택되는 방법.
구현예 21. 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계;
서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계;
하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및
하나 이상의 SNP를 분류기에 포함시키는 단계
를 포함하는, 대상체를 하나 이상의 치료 속성에 대해 계층화하기 위한 분류기를 개발하는 방법.
구현예 22. 구현예 21에 있어서, 하나 이상의 치료 속성은 특정 질환, 장애, 또는 병태의 발병 위험, 특정 질환, 장애, 또는 병태에 대한 특정 결과의 가능성, 특정 요법에 대한 반응의 가능성으로 이루어진 군에서 선택되는 방법.
구현예 23. 구현예 21 또는 22에 있어서, 하나 이상의 치료 속성은 특정 요법에 대한 반응의 가능성인 방법.
구현예 24. 구현예 21-23 중 어느 한 구현예에 있어서, 특정 요법은 항-TNF 요법인 방법.
구현예 25. 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석함으로써, 하나 이상의 치료 속성에 대해 대상체를 계층화하기 위한 분류기를 개발하는 방법에서, 개선은
서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 및
하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및
하나 이상의 SNP를 분류기에 포함시키는 단계
를 포함하는 방법.
구현예 26. 구현예 25에 있어서, 하나 이상의 치료 속성은 특정 질환, 장애, 또는 병태의 발병 위험, 특정 질환, 장애, 또는 병태에 대한 특정 결과의 가능성, 특정 요법에 대한 반응의 가능성으로 이루어진 군에서 선택되는 방법.
구현예 27. 구현예 25 또는 26에 있어서, 하나 이상의 치료 속성은 특정 요법에 대한 반응의 가능성인 방법.
구현예 28. 구현예 25-27 중 어느 한 구현예에 있어서, 특정 요법은 항-TNF 요법인 방법.
구현예 29. 구현예 25-28 중 어느 한 구현예에 있어서, 하나 이상의 SNP의 존재를 평가하는 것은 RNA의 서열 데이터를 참조 인간 게놈과 비교하는 것을 포함하는 방법.
구현예 30. (a) 컴퓨팅 장치의 프로세서에 의해, 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 유전자는 표 1에서 선택되는 단계;
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
(c) 대상체가 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 투여하거나; 또는 대상체가 항-TNF 요법에 대해 반응성으로 분류되는 경우, 항-TNF 요법을 투여하는 단계
를 포함하는 자가면역 질환을 겪고 있는 대상체를 치료하는 방법.
구현예 31. 구현예 30에 있어서, 단계 (a)에서의 프로세서는
하나 이상의 임상 특징; 또는
하나 이상의 단일 뉴클레오타이드 다형성(SNP)
중 적어도 하나에 상응하는 데이터를 추가로 수신하는 방법.
구현예 32. 구현예 30 또는 31에 있어서, 하나 이상의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택되는 방법.
구현예 33. 구현예 30-32 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염에서 선택되는 방법.
구현예 34. 구현예 30-33 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염인 방법.
구현예 35. 구현예 30-34 중 어느 한 구현예에 있어서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트에서 선택되는 방법.
구현예 36. 구현예 30-34 중 어느 한 구현예에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러에서 선택되는 방법.
구현예 37. 구현예 30-36 중 어느 한 구현예에 있어서, 단계 (b)는 기계 학습 모델을 사용하여 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 38. 구현예 37에 있어서, 기계 학습 모델은 랜덤 포레스트 모델인 방법.
구현예 39. 구현예 30-38 중 어느 한 구현예에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 40. 구현예 30-38 중 어느 한 구현예에 있어서, 단계 (b)는 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 41. 구현예 30-38 중 어느 한 구현예에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 42. (a) 컴퓨팅 장치의 프로세서에 의해, 자가면역 질환(예컨대, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 구성원(들))을 포함하는 단계;
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
(c) 질환의 치료를 위해 대상체에게 제2 요법(예컨대, 제1 요법에 대한 대안, 예컨대, 항-TNF 요법에 대한 대안)을 처방 및/또는 투여하여, 대상체에의 제1 요법의 처방 및/또는 투여를 피하는 단계
를 포함하는 방법.
구현예 43. (a) 컴퓨팅 장치의 프로세서에 의해, 질환(예컨대, 자가면역 질환, 예컨대, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 구성원(들))을 포함하는 단계;
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여 제1 요법(예컨대, 항-TNF 요법)에 대한 반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
(c) 질환의 치료를 위해 대상체에게 제1 요법을 처방 및/또는 투여하는 단계
를 포함하는 방법.
구현예 44. 구현예 42 또는 43에 있어서, 단계 (b)는 기계 학습 모델(예컨대, 랜덤 포레스트 모델)을 사용하여 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 45. 구현예 43 또는 44에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 46. 대상체의 게놈 데이터(예컨대, 차세대 RNA-seq 데이터)의 분석을 위한(예컨대, 그리고 상기 게놈 데이터에 기초하여 상기 대상체의 분류의 결정을 위한) 파이프라인(예컨대, 컴퓨터 아키텍처 파이프라인)으로서, 상기 파이프라인은 복수의 모듈을 포함하고, 각각의 모듈은 상기 모듈의 업데이트 후에 독립적으로 검증될 수 있는 것인 파이프라인.
구현예 47. 구현예 46에 있어서, 상기 복수의 모듈은 하나 이상의 기계 학습 모델을 포함하는 것인 파이프라인.
구현예 48. 구현예 46 또는 47에 있어서, 상기 복수의 모듈은 하나 이상의 알려진 생물정보학 모듈(예컨대, RSEM 및/또는 STAR) 및 하나 이상의 독점 분류 모듈(들)을 포함하는 것인 파이프라인.
구현예 49. (a) 컴퓨팅 장치의 프로세서에 의해, 하기로 이루어진 군에서 선택되는 하나 이상의 유전자 각각의 대상체에 대한 발현 수준에 상응하는 데이터를 수신하는 단계:
Figure pct00013
; 및
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하는 단계
를 포함하는, 상기 대상체에게 상기 항-TNF 요법의 임의의 투여 전에 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 자가면역 질환을 겪고 있는 대상체를 분류하는 방법.
구현예 50. 구현예 49에 있어서,
(c) 대상체가 단계 (b)에서 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 처방 및/또는 투여하거나; 또는 대상체가 단계 (b)에서 항-TNF 요법에 대한 반응성으로 분류되는 경우, 대상체에게 항-TNF 요법을 투여하는 단계
를 추가로 포함하는 방법.
구현예 51. 구현예 49 또는 50에 있어서, 단계 (a)에서의 프로세서는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 수신하는 단계:
(i) 대상체의 하나 이상의 임상 특징;
(ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
구현예 52. 구현예 49 내지 51 중 어느 한 구현예에 있어서, 단계 (a)에서의 프로세서는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 수신하는 방법.
구현예 53. 구현예 49 내지 52 중 어느 한 구현예에 있어서, 단계 (a)에서의 프로세서는 표 5에 열거된 하나 이상의 SNP에 상응하는 데이터를 수신하는 방법.
구현예 54. 구현예 49 내지 53 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염으로 이루어진 군에서 선택되는 구성원인 방법.
구현예 55. 구현예 49 내지 54 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염인 방법.
구현예 56. 구현예 49 내지 55 중 어느 한 구현예에 있어서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 방법.
구현예 57. 구현예 49 내지 55 중 어느 한 구현예에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 및 전술한 것 중 어느 것의 바이오시밀러로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 방법.
구현예 58. 구현예 44 내지 52 중 어느 한 구현예에 있어서, 항-TNF 요법에 대한 대안은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 및 전술한 것 중 어느 것의 임의의 바이오시밀러로 이루어진 군의 임의의 구성원을 포함하지 않는 방법.
구현예 59. 구현예 49 내지 58 중 어느 한 구현예에 있어서, 단계 (b)는 기계 학습 모델을 사용하여 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 60. 구현예 59에 있어서, 기계 학습 모델은 랜덤 포레스트 모델인 방법.
구현예 61. 구현예 49 내지 60 중 어느 한 구현예에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 62. 구현예 49 내지 60 중 어느 한 구현예에 있어서, 단계 (b)는 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 63. 구현예 49 내지 60 중 어느 한 구현예에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
구현예 64. (a) 컴퓨팅 장치의 프로세서에 의해, 자가면역 질환을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 단계;
(b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로, 대상체의 분류를 자동으로 결정하는 단계
를 포함하는, 상기 대상체에게 상기 항-TNF 요법의 임의의 투여 전에 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 자가면역 질환을 겪고 있는 대상체를 분류하는 방법.
구현예 65. 구현예 64에 있어서,
(c) 대상체가 단계 (b)에서 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 처방 및/또는 투여하거나; 또는 대상체가 단계 (b)에서 항-TNF 요법에 대해 반응성으로 분류되는 경우, 대상체에게 항-TNF 요법을 투여하는 단계
를 추가로 포함하는 방법.
구현예 66. 구현예 64 또는 65에 있어서, 자가면역 질환은 류마티스성 관절염인 방법.
구현예 67. 구현예 64 내지 66 중 어느 한 구현예에 있어서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 2개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 것을 포함하는 방법.
구현예 68. 구현예 64 내지 66 중 어느 한 구현예에 있어서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 3개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 것을 포함하는 방법.
구현예 69. 구현예 64 내지 66 중 어느 한 구현예에 있어서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 5개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 것을 포함하는 방법.
구현예 70. 구현예 64 내지 69 중 어느 한 구현예에 있어서, 단계 (a)에서의 프로세서는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 수신하는 것인 방법:
(i) 대상체의 하나 이상의 임상 특징;
(ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
구현예 71. 구현예 64 내지 70 중 어느 한 구현예에 있어서, 단계 (a)에서의 프로세서는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 수신하는 방법.
구현예 72. 구현예 64 내지 71 중 어느 한 구현예에 있어서, 단계 (a)에서의 프로세서는 표 5에 열거된 하나 이상의 SNP에 상응하는 데이터를 수신하는 방법.
구현예 73. 대상체에게 상기 항-TNF 요법의 임의의 투여 전에 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로 자가면역 질환을 겪고 있는 대상체를 분류하기 위한 시스템으로서, 시스템은
프로세서; 및
그 위에 명령을 갖는 메모리
를 포함하고, 프로세서에 의해 실행시, 명령은 프로세서가
(a) 데이터의 세트를 수신하게 하고, 상기 데이터의 세트는 하기로 이루어진 군에서 선택되는 하나 이상의 유전자 각각의 대상체에 대한 발현 수준을 포함하며:
Figure pct00014
; 및
(b) 데이터의 세트를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하게 하는 시스템.
구현예 74. 구현예 73에 있어서, 데이터의 세트는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 포함하는 시스템:
(i) 대상체의 하나 이상의 임상 특징;
(ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
구현예 75. 구현예 74에 있어서, 데이터의 세트는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)으로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 포함하는 시스템.
구현예 76. 구현예 74 또는 75에 있어서, 데이터의 세트는 표 5에 열거된 하나 이상의 SNP를 포함하는 시스템.
구현예 77. 구현예 74 내지 76 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염으로 이루어진 군에서 선택되는 구성원인 시스템.
구현예 78. 구현예 74 내지 76 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염인 시스템.
구현예 79. 구현예 74 내지 76 중 어느 한 구현예에 있어서, 자가면역 질환은 류마티스성 관절염인 시스템.
예시
실시예 1
도입
RA와 같은 자가면역 질환은 집합적으로 수백만 명의 환자에 영향을 미치고 이들의 치료는 전체 의료비 지출의 상당 부분을 차지하므로 환자 결과를 개선하기 위해 관심이 필요하다.
자가면역 질환은 장기 특이적 자가면역 및 전신 자가면역의 두 그룹으로 나뉠 수 있다. RA를 포함하는 류마티스성 질환은 주로 활막성 관절에서 나타나 결국 힘줄, 연골, 및 뼈의 비가역적인 파괴를 유발하는 전신 자가 면역 질환에 속한다. 현재 RA에 대한 치료법은 없지만, 주로 이 사이토카인의 전염증성 신호전달을 중화시키는 작용을 하는 항-TNF 제제의 개발을 통해 이들 환자의 치료를 관리하기 위해 상당한 개선이 이루어졌다. 이러한 요법(예컨대, 휴미라(Humira), 레미케이드(Remicade), 심포니(Simponi), 및 심지아(Cymzia))은 일부 RA 환자의 치료 결과를 상당히 개선하였다.
RA 환자의 약 1/3은 항-TNF 요법에 대해 임상 반응을 나타내어, 때때로 관해를 달성한다. 이러한 소위 "반응자" 환자에서의 질환 진행은 부적절한 TNF 유도 전염증성 반응의 결과일 가능성이 높다.
RA를 치료하는 데 가장 널리 사용되는 생물학적 요법은 항-TNF이다. 이러한 부류의 약물의 도입은 일부 환자에 대해 LDA 또는 관해를 달성함으로써 RA의 치료를 바꾸어 놓았다. 그러나, 이러한 치료 표적에 도달하는 환자의 비율은 다수의 임상 연구에 걸쳐 대략 34%로 낮다. 항-TNF에 반응하지 못하는 환자의 경우, 항-CD20, 공동자극 차단, JAK 및 항-IL6 요법과 같은 이용가능한 대안적인 승인된 요법이 있다. 그러나, 환자는 상이한 항-TNF를 통한 1차 사이클링 후에만 이러한 대안적인 요법으로 전환되며, 이는 1년 넘게 걸릴 수 있는데 증상이 지속되고 질환이 더 진행되어 치료 목표에 도달하기 어렵다.
손상 진행을 중지 또는 최소화하기 위해 가능한 한 빨리 환자를 LDA 또는 관해에 이르게 하는 표적에 대한 치료 개념이 널리 받아들여졌지만, 종종 많은 환자에서 달성하기 어렵다. RA는 류마티스 전문의 및 환자에 의한 임상 평가를 기반으로 하는 질환 중증도의 척도를 사용하여 평가된다. 경증, 중등도, 또는 중증 질환 활성은 RA의 경우 부종 및 압통 관절의 수; 통증, 기능 및 전반적인 건강의 환자 및 의사가 보고한 평가; 뿐만 아니라 혈청 바이오마커 수준을 사용하여 결정되며, 이는 조합될 때 질환 활성 스코어(DAS)를 생성한다. 중등도 내지 중증 질환 활성은 환자의 증상이 더 이상 효과적으로 관리되지 않고 있음을 나타낸다. 요법에 대한 반응은 DAS의 변화 및 LDA 또는 관해 수준에 상응하는 국제적으로 합의된 DAS28 스코어에 대한 처리를 사용하여 모니터링된다.
가장 복잡한 질환과 마찬가지로 샘플 처리, 라이브러리 준비 및 혈액 대 활막 RA에서의 더 낮은 생물학적 신호로 인한 코호트간 재현불가능성은 공통적인 증상을 보이는 종점을 공유하는 상이한 질환의 모음이므로 환자가 이들의 개별 질환 생물학에 최적화된 표적 요법을 처방받는 것을 보장하기 위해 개인맞춤 의학 접근법이 필요하다. 복잡한 질환에서 개인맞춤 건강 관리는 특히 임의의 주어진 요법에 대한 반응률이 낮고, 심각한 부작용이 각각과 연관되며, 환자에게 제공하기 위해 대안적인 효과적인 요법이 이용가능할 때 의미가 있다. 이들 인자 모두는 RA에 적용된다. 보완 요법으로 개체의 생물학을 표적화함으로써, 의사, 환자, 및 지불자는 가장 효율적으로 치료 목표를 달성할 것이다. 또한, 이들의 고유한 질환 생물학을 기반으로 기존 요법에 대한 무반응자를 특이적으로 표적화하는 새로운 요법이 개발되어야 한다. 이것은 현재의 표준 치료 요법에 반응하지 않는 환자와 연관된 높은 약물, 일반 의료 및 사회적 비용이 고려될 때 훨씬 더 중요하다.
요법 시작 전에 항-TNF에 대한 무반응을 예측하는 시험은 환자가 현재의 표준 치료와 비교하여 더 빨리 대안적인 요법으로 전환되게 하여, 더 많은 환자가 LDA 또는 관해의 치료 목표에 도달하게 할 것이다. 이러한 예측 반응 시험 및 환자 치료에 대한 그의 영향은 환자에게 상당한 임상 이익을 제공하고 의료 시스템에 비용절감을 제공할 것이다.
분자 수준에서 주어진 환자의 활성 질환 메커니즘을 치료제의 작용 메커니즘과 일치시키는 것은 반응률을 유의하게 개선하여, 더 많은 환자가 낮은 질환 활성(LDA) 또는 관해의 치료 목표에 도달하게 할 것이다. 치료 목표를 달성하는 것은 대안적인 요법을 고려하기 전에 질환 증상이 유의하게 악화되기를 기다리는 일상적인 관행과 비교하여 초기 단계의 RA 환자에게 유의하게 의미있는 임상 이익을 갖는다.
도 6a는 선택된 특징(n=75), 모델 훈련(n=185), 및 모델 검증(n=46)에 사용된 코호트의 흐름도이다. 도 6b는 도 6a의 코호트 1에서 특징 선택 과정을 설명하는 과정이다. POC 데이터세트는 도 6a의 코호트 1 데이터의 세트를 지칭한다. 데이터의 80%는 가장 차별적인 유전자를 확인하기 위해 U-시험을 사용하여 분류기를 훈련하는 데 사용되고, 80% 데이터는 최종 특징 세트를 제공하기 위해 10겹 교차검증을 사용하여 10개의 그룹으로 나뉘며; 최종 특징 세트는 데이터의 나머지 20%에 대해 모델 훈련 및 평가에 사용된다. 이 과정은 적어도 100번 반복된다. 도 6c는 코호트 1에 적용된 특징 선택 방법의 흐름도이다.
결과
항-TNF 요법에 대한 반응을 예측하는 바이오마커의 확인. 본 연구에서, 항-TNF 요법에 대한 반응자 및 무반응자를 구별하는 예측 바이오마커는 Bienkowska et al.(코호트 1)에 의해 공개된 공개적으로 이용가능한 데이터세트에서 선택되었고, CORRONA(코호트 2)로부터 구입된 231명의 류마티스성 관절염 환자의 코호트 사이에서 추가로 평가되었으며, 이들 중 185개의 샘플이 모델 훈련(80%)에 사용되었고, 46개(20%)가 검증에 사용되었다. 코호트 설명을 위해 물질 및 방법을 참고하고, 특징 선택, 모델 훈련, 및 모델 검증에 사용된 샘플의 흐름도를 위해 도 6a를 참고한다.
코호트 1 샘플 중에서 특징 선택을 위해 사용된 방법이 도 6c에 도시되어 있다. 데이터세트 내의 21,818개의 총 유전자 전사체 중에서, 38개가 랜덤 포레스트를 사용하여 20% 보류된 교차 검증의 100 라운드 중에서 30 라운드에서 차별적인 것으로 선택되었다(도 7a). 예측 유전자가 선택된 모델은 100 라운드의 교차 검증 내내 모든 보류된 검증 세트 샘플로부터의 스코어를 집계함으로써 평가되었다. 여기에서, 반응자는 집계된 랜덤 포레스트 모델에 의해 무반응자 스코어 출력과 비교하여 유의하게 더 높은 스코어(p < 0.0001)를 갖는 것으로 밝혀졌다(도 7b). 집계된 스코어는 60%의 곡선하 면적(AUC)을 초래하였고(도 7c), 이는 예측 유전자가 선택된 모델이 반응자 및 무반응자를 유의하게 구별할 수 있음을 시사한다.
38개의 선택된 유전자를 고려할 때 샘플 간의 변동(variance)이 주 성분 분석(PCA)을 통해 도 7d에 나타나 있다. 여기에서, 데이터에서 설명된 변동의 대부분(22%)은 첫 번째 주 성분(PC1)을 따르며 반응 상태(반응자 대 무반응자)와 크게 연관되고, 이는 이러한 38개의 선택된 유전자의 유전자 발현 프로파일이 반응자 및 무반응자 사이에서 구별된다는 것을 나타낸다.
크로스 플랫폼 모델 최적화 및 훈련. 코호트 1에서 선택된 38개의 예측 유전자는 CORRONA(코호트 2)로부터 수집된 231명의 류마티스성 관절염 환자 중에서 추가로 평가되었다. 중요하게도, 이러한 두 코호트로부터의 데이터는 2개의 상이한 플랫폼인 마이크로어레이(코호트 1) 및 RNASeq(코호트 2)를 통해 생성되었고, 이는 새로운 RNASeq 플랫폼 상의 선택된 특징을 사용한 모델의 재훈련을 필요로 한다. 코호트 1에서 확인된 38개의 예측 유전자 중에서, 28개가 코호트 2 훈련 내에서 검출될 수 있었고, 최종 모델 개발을 위해 평가되었다. 코호트 2에서의 231명의 환자 중에서, 80%(n = 185)가 종점, 포함 기준, 최종 특징 세트, 및 모델 훈련의 최적화를 위해 사용된 반면, 나머지 20%(n = 46)는 보류된 검증을 위해 따로 두었다.
포함 기준 최적화를 위해, 모델은 모든 훈련 세트 환자 중에서(도 8a) 뿐만 아니라 RF 및 CCP 모두에 대해 혈청양성으로 시험된 훈련 세트 환자 중에서만(도 8b) 구축되었다. 혈청음성이 섬유근육통과 강하게 연관되어 있고 덜 정확한 반응 평가로 이어져 잠재적으로 잘못 라벨링된 샘플을 사용한 훈련을 초래할 수 있다는 관찰 때문에, 혈청양성이 모델 훈련을 위한 포함 기준으로서 조사되었다. 이러한 두 집단 내에서, 모델은 상이한 임상 종점(ACR50 3m, ACR50 6m, CDAI 3m, CDAI 6m, EULAR 3m, 및 EULAR 6m)을 사용할 때 평가되었다. 반응자 및 무반응자가 각 종점에 의해 어떻게 정의되었는지에 관한 정보의 경우 물질 및 방법을 참조한다.
최고의 모델 성능은 임상 종점으로서 ACR50 6m을 사용하여 남성 및 여성 혈청양성 환자(n = 90, 도 6a 참고) 사이에서 구축된 모델로 달성되었다. 여기에서, 72%의 중앙 AUC는 10회 반복된 10% 보류된 교차 검증의 50회 반복 사이에서 달성되었다. 이 모델의 성능은 임의의 다른 종점 또는 포함 기준으로 구축된 모델보다 유의하게 더 높았다(p<0.0001). 그의 높은 성능으로 인해, 이 모델은 추가 평가 및 보류된 검증을 위해 선택되었다.
임상 종점으로서 ACR50 6m을 사용하여 남성 및 여성 혈청양성 환자 사이에서 구축된 중앙 모델은 도 9a-9d에 상세히 설명되어 있다. 10% 보류된 교차 검증의 10 라운드 후에 검증 세트 샘플의 스코어를 집계하는 것은 무반응자(p < 0.00001)와 비교하여 반응자 사이에서 유의하게 더 높은 스코어를 초래하고(도 9c), 이는 72%의 AUC와 연관된다(도 9a).
도 9b는 집계된 검증 세트 샘플에 기초하여 계산된 음성 예측값(NPV) 대 진음성률(TNR)을 보여준다. 여기에서, 0.89의 NPV는 0.55의 TNR에서 달성될 수 있다. 이 선택된 최적 스코어 컷오프(0.29)에서 예측된 분류와 실제 분류 사이의 일치를 나타내는 혼동 행렬이 도 9d에 나타나 있다.
선택된 모델 성능은 연령, BMI, 환자 통증, 및 압통 및 부종 관절의 수와 같은 임상 기준선 공변량을 사용하여 구축된 모델과 분류 정확도를 비교함으로써 추가로 평가되었다. RNA 단독, 공변량을 갖는 RNA, 뿐만 아니라 혈청양성 환자 사이에서 공변량 단독을 사용하고 임상 종점으로서 ACR50 6m을 사용하여 구축된 모델의 박스플롯이 도 10a-10b에 나타나 있다. 최고 모델 AUC는 RNA 단독으로 구축된 모델로 달성되었고(0.72의 중앙 AUC), 이는 공변량 단독으로 구축된 모델(0.59의 중앙 AUC) 뿐만 아니라 공변량과 조합된 RNA로 구축된 모델(0.70의 중앙 AUC, p < 0.005)보다 유의하게 더 높은(p<0.00001) 것으로 밝혀졌다.
특징 견고성(feature robustness)은 10% 교차 검증의 50 라운드에 걸쳐 상위 15개(28개 중) 특징에서 이들의 선택 빈도를 측정함으로써 평가되었다(도 11). 무작위로, 예측된 선택 수는 시뮬레이션을 통해 2,679(54%)인 것으로 결정되었다. 11개의 유전자(CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3)는 가능한 5,000개 선택 중에서 4,000개 초과(80%)에서 선택되었고, 평가된 28개의 유전자 후보의 가장 강력한 서브세트인 것으로 간주되는데, 이들이 무작위 예측보다 더 큰 빈도로 선택되었기 때문이었다. 선택 빈도의 실질적인 감소는 상위 11개 이후에 관찰되며, 다음으로 가장 빈번하게 선택되는 유전자는 5,000개의 가능한 선택 중 54%에서만 선택된다. 이러한 나머지 17개 유전자는 무작위 예측보다 더 큰 빈도로 선택되지 않았기 때문에 최종 모델 개발 및 검증에 고려되지 않았다.
항-TNF 요법에 대한 반응 예측을 위한 최적화된 모델의 검증. 동일한 CORRONA 연구 코호트의 일부였지만 그의 RNA가 최종 모델 검증을 위해 나중에 시퀀싱된 추가적인 46명의 환자에 의해 분류기 성능이 더 평가되었다. 모델 검증을 위해 보류된 46개의 샘플 중에서, 35개는 요법 시작 후 6개월에 추적되었고 모델 검증을 위해 사용되었다. 90개의 훈련 샘플의 전체 세트는 입력(CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3)으로서 11개의 선택된 유전자를 이용하여 최종 랜덤 포레스트 모델을 훈련하는 데 사용되었다. 모델 검증의 결과가 도 11에 나타나 있고, 이는 0.72의 AUC, 0.85의 NPV, 및 0.61의 TNR을 달성하였다. 훈련 데이터(도 9c 참고)로부터 결정된 최적 모델 컷오프(0.29)가 혼동 행렬 생성(도 9d)에 사용되었다. 혈청양성 단독 환자(n = 23) 사이의 모델 검증의 결과가 도 13a-13d에 나타나 있다.
논의
우리가 아는 한, 류마티스성 관절염의 맥락에서 항-TNF 요법에 대한 반응을 예측하는 바이오마커가 교차 코호트, 크로스 플랫폼 분석에서 선택, 최적화 및 검증된 것은 이번이 처음이다. 여기에서, 마이크로어레이(Affymatrix)를 통해 유전자 발현이 정량화된 공개적으로 이용가능한 데이터세트로부터 28개의 예측 유전자가 선택되었다. RNASeq 플랫폼 상에서 모델 최적화 후, 28개의 유전자의 서브세트(11)는 72%의 검증된 AUC, 0.85의 NPV 및 0.61의 TNR을 갖는 것으로 나타난 모델을 구축하는 데 사용되었다. 이러한 결과는 유전자 발현 프로파일이 항-TNF 요법에 대한 무반응을 재현가능하게 예측하는 데 사용될 수 있으며, 이 프로파일이 잠재적으로 대안적인 요법을 탐색하기 위해 무반응자를 걸러 내고 후속적으로 RA의 치료를 위해 상기 처방된 항-TNF 요법에 대한 반응률을 증가시키는 데 사용될 수 있음을 시사한다.
현재 항-TNF 반응을 예측하는 임상적으로 유용한 분류기의 부족은 연구 커뮤니티 부분의 노력 부족으로 인한 것이 아니다. 류마티스성 인자(RF) 및 항-사이클릭 시트룰린화된 펩타이드(CCP)는 RA를 진단하는 데 사용되는 바이오마커이며, 환자의 약 80%에서 발견된다. 이러한 순환하는 바이오마커의 수준은 리툭시맙에 대한 반응과 상관관계가 있었지만, 경향은 미미하였고 임상적으로 쓸모있을 만큼 충분히 유용하지 않았다. 많은 유전적 연관성 연구는 항-TNF 치료 및 대안적인 요법에 대한 반응을 위한 유전적 위험 유전자좌의 예측값을 평가하기 위해 수행되었다. 연관성이 발견되었지만, 효과 크기는 미미하였다. 한 연구는 토실리주맙 치료 환자에서 위험 대립유전자당 DAS28 스코어의 변화 중 2%만이 설명될 수 있다고 추정하였다. 항-TNF에 대한 반응을 예측하는 8개의 상이한 유전자 발현 서명을 시험한 독립적인 연구에서, 대부분의 서명은 임상적으로 유용할 충분한 예측값을 입증하는 데 실패하였다. 그리고, 몇 가지 연구는 환자의 독립적인 코호트에서 요구되는 성능 기준을 충족하지 못하는 다양한 분류기의 불능을 논의하였다. RA 토실리주맙 및 리툭시맙에 대한 대안적인 승인된 요법에 대한 반응을 예측하는 분류기도 공개되었지만, 이들은 또한 환자의 독립적인 코호트에서 검증되지 못했다. 많은 이들 연구들이 공통적으로 갖는 것은 사용된 분석 프레임워크만이 유전적 및 임상 결과 데이터의 세트 간의 수학적 상관관계를 찾는다는 것이다. 결과적으로, 많은 이들 분류기가 성능이 떨어지는 이유 또는 결과가 환자의 독립적인 코호트에서 되풀이될 수 없는 이유를 설명하는 생물학적 맥락은 포착되지 않는다.
혈액 또는 조직의 RNA 수는 개별 환자의 질환 생물학을 설명하는 데 필요한 정보를 포함한다. 그러나, 전체 전사체 분석(방법 참고)에 의해 생성된 많은 수의 특징(RNA) 및 상대적으로 적은 수의 샘플을 고려할 때, 과제는 항상 환자의 질환 생물학을 담당하는 더 적은 세트의 원인 유전자를 확인하는 것이었다. 샘플 크기를 증가시키는 한 가지 접근법은 공개적으로 이용가능한 데이터세트로부터 수집된 정보를 활용하는 것이지만, 연구 설계, 특히 RNA 정량화에 사용된 플랫폼의 차이는 코호트 간의 직접 번역의 문제를 제시한다. 유전자 발현 데이터세트의 크로스 플랫폼 분석은 결핵을 포함한 분야에서 진단 개발을 위해 널리 연구되어 온 대상이다. 본 연구에서, 바이오마커는 마이크로어레이에 의해 생성된 데이터세트로부터 확인되었으며 RNASeq 데이터세트 내에서 추가로 평가되었다. 이러한 2개의 플랫폼 상에서 생성된 데이터는 높은 상관관계가 있는 것으로 나타났지만, 동적 범위의 차이는 하나의 플랫폼에서의 진단 모델 개발 및 다른 플랫폼에서의 검증에 대한 이의를 제기한다. 본 연구에서, 마이크로어레이 데이터세트는 고차원의 유전자 발현 데이터를 반응과 관련된 더 적은 수의 유전자로 축소하는 데 사용되었으므로, 본 발명자들의 RNASeq 데이터세트 내에서 보다 표적화된 접근법이 취해질 수 있다. 두 플렛폼 중 하나에서 구축된 교차 검증된 모델은 일관된 성능을 갖는 것으로 나타났다.
많은 허용된 항-TNF 요법에 대한 임상 정의가 존재하고 최적 표준이 없기 때문에, 본 발명자들은 데이터가 이용가능한 모든 종점을 평가하고 어떤 종점이 훈련 세트 샘플 중에서 환자의 기준선 유전자 발현 프로파일에 의해 가장 잘 반영되는지 결정하는 것을 선택하였다. 모델 성능에 미치는 가장 크게 영향을 미치는 것은 클래스 라벨에 사용된 임상 종점인 것으로 밝혀졌다. CDAI 3m, CDAI 6m 및 EULAR 6m과 같은 특정 임상 종점은 유의하게 무작위(AUC 50%)를 초과하는 성능을 낼 수 없는 반면, ACR50 6m 및 EULAR 6m과 같은 다른 임상 종점은 72% 정도의 높은 중앙 AUC를 달성하였다. 이러한 종점은 서로 높은 상관관계가 있기 때문에, 이러한 발견은 잘못 라벨링된 샘플의 작은 비율이 전체 모델 성능에 큰 영향을 미칠 수 있고, 결과적으로, 일부 종점은 환자 전사 프로파일에 의해 더 잘 반영된다는 것을 시사한다. 향후 연구는 어떤 종점이 가장 생물학적으로 관련될 수 있는지에 대한 통찰력을 얻기 위해 임상 종점 및 환자 전사체 사이의 관계를 추가로 조사해야 한다.
포함 기준으로서 혈청양성은 혈청양성 환자가 유사한 질환 진행을 공유하였고 더 중증인 RA를 가질 가능성이 더 높다는 사실 때문에 조사된 반면, 혈청음성 RA 환자는 건선 관련 관절염 또는 척추관절병과 같은 상이한 형태의 염증성 관절염을 갖는 것으로 가정되었다. 따라서, 진단 모델 개발을 위한 혈청양성 환자의 선택은 혈청양성 및 혈청음성 환자 모두를 조합하는 것보다 덜 이질적인 RA 집단인 것으로 간주될 수 있다. 본 발명자들의 모델 훈련으로부터 혈청음성 환자를 제거하는 것은 모델 AUC의 더 높은 중앙 및 표준 편차 모두를 초래하였다.
공변량 분석. 본 발명자들의 RNA 기반의 유전자 발현 시험의 견고성을 추가로 입증하기 위해, 기준선에서 임상 공변량을 사용하여 구축된 모델들을 비교하였다. RNA 단독을 사용하여 구축된 모델이 임상 공변량을 사용한 모델보다 유의하게 더 우수한 성능을 내었다는 사실은 병원에 방문하는 동안 기준선에서 취할 수 있는 다른 간단한 측정보다 전사체로부터 수득된 정보의 가치를 입증한다.
TNF-α는 염증 및 미생물 면역뿐만 아니라 많은 항상성 생리 기능의 강력하고 중심적인 매개체이다. 그것은 RA를 포함한 자가면역 질환의 치료를 위한 항-TNF-α 약물의 핵심 표적이다. TNF-α는 막관통 단백질로서 발현되며 그의 유전자 발현은 3개의 전사 인자인 핵 인자 kB(NF-κB), c-Jun 활성자 단백질-1(AP1) 및 활성화된 T 세포와 연관된 핵 인자(NFAT)에 의해 조절된다. TNF-α가 그의 동족 수용체에 결합하는 것은 세포 사멸 또는 세포 활성화에 이를 수 있는 복잡하고 다양한 신호전달 경로 활성을 개시한다. TNF-α 수용체 활성화는 전염증성 사이토카인, 케모카인 및 프로스타글란딘의 합성으로 이어진다. 또한, TNF-α는 백혈구 이동에 필수적인 세포골격 재구성을 조절한다. TNF-α 활성화의 이러한 다면발현적 역할은 분류기에 포함된 유전자에 의해 코딩된 11개의 단백질 중 9개의 단백질의 기능에 반영된다. 2개는 전염증성 메커니즘에 관여하고, 5개는 세포골격 리모델링 및 기능에 관여하며, 1개는 NF-κB 조절에 관여하고, 2개는 T 세포 활성화에 관여한다. 예를 들어, 시스테이닐 류코트리엔 수용체 2(CYSLTR2)는 과립구, 대식세포 및 비만 세포(PMID: 25572555)와 같은 활성화된 선천 면역 세포에 의해 빠르게 생성된 전염증성 지질 매개체인 류코트리엔에 의해 활성화된 G-단백질 결합 수용체(GPCR)이다. 이러한 부류의 GPCR은 화학주성, 탈과립화 및 수퍼옥사이드 음이온의 생성을 포함하는 다양한 백혈구 기능을 촉발한다.
세포골격 리모델링의 역할은 이 분류기에서 두드러지게 나타난다. 세포골격은 세포 모양, 운동성, 내부 조직화, 및 세포소기관과 소포의 움직임을 담당하는 3차원 세포내 단백질성 네트워크이다. 세포골격 구성요소 및 RA 질환 생물학의 상호작용은 다면적일 가능성이 높다. 동적 액틴 리모델링은 염증 부위로의 면역 세포의 효율적인 귀소(homing) 및 유출에 중요하다. 사이토카인의 일시적이고 분극화된 방출은 세포골격 리모델링에 좌우된다. 본 발명자들의 분류기에서 세포골격 구성요소의 우세는 세포골격이 이전에 인식된 것보다 RA 질환 생물학에서 더 중심적인 역할을 할 수 있고 항-TNF-α 요법에 대한 무반응을 예측하는 데 중추적일 수 있음을 시사한다.
자가항원은 RA와 같은 자가면역 질환에 중심이 되는 부적절한 면역 반응을 확립하는 데 중요한 구성요소이므로, 자가항원이 본 발명자들의 분류기에서 강조되는 것은 놀랍지 않다. RA의 면역학적 특징은 면역글로불린(Ig) G의 Fc 부분에 대한 자가항체의 계열인 류마티스성 인자(RF)를 포함하는 혈액 내의 자가항체의 존재이다. 본 발명자들의 분석은 RA와 연관된 2개의 추가적인 자가항원 유전자인 GOLGA1 및 NA14를 확인하였다. GOLGA1은 수송 소포를 골지로 국소화하는 분자 테더(tether)인 Golgin-97을 코딩한다(5). 또한, Golgin-97의 제거는 NF-κB를 활성화한다. NA14는 눈물 및 타액을 만드는 분비선을 공격하는 쇼그렌 증후군으로 알려진 또 다른 자가면역 질환의 특징적인 자가항원이다. 또한, 세포골격 구성요소 액틴 및 미오신에 대한 자가항체는 일부 RA 환자 혈청(PMID: 12447636)에 풍부하다.
RA와 같은 면역 매개 질환에 관여하는 유전적 및 환경적 요소. RA를 갖는 위험은 환자의 1촌에서 증가하고 일란성 쌍둥이에서 자가면역의 비교적 높은 일치도(40%)가 있으며, 이는 면역 매개 질환의 병인에서 유전적 구성요소를 나타낸다. 매우 큰 잘 규명된 환자 코호트의 DNA의 분석과 함께, 인간 및 마우스 게놈의 단일뉴클레오타이드 다형성(SNP) 및 일배체형 맵의 이용가능성으로 지난 10년 동안, 본 발명자들은 인간 자가면역 질환과 연관하여 발견되는 유전자의 수의 폭발을 관찰하였다. 그러나, 면역 매개 질환의 일치도는, 중요하긴 하지만, 일란성 쌍둥이에서 40% 미만이며, 이는 환경적 인자 및 후성유전적 요소가 또한 이러한 질환의 발병에 역할을 한다는 것을 시사한다. 더욱이, 현재 연구는 면역 유전자에서의 위험과 연관된 대립유전자 변이가 자가면역 소인을 증가시키도록 진화한 것이 아니라, 식이, 미생물총, 비타민, 흡연 등과 같은 환경적 요소의 결과로서 선택되었음을 밝혀준다. 결론적으로, 자가면역 질환, 특히 RA의 복잡성은 다양한 도구 및 메커니즘을 사용하여 많은 상이한 그룹에 의해 확인된다. 이러한 연구는 분자 수준에서 RA의 이질성을 입증하고 단일 표적화된 치료가 모든 환자에게 작동할 수 없는 이유를 설명하여, 본 발명자들의 분류기의 중요성을 더 증폭시킨다. 이 연구에서, 본 발명자들은 유전자 기반 분류기를 사용하여 RA 환자에서 항-TNF 요법에 대한 무반응을 예측할 수 있었다. 분류기에서의 유전자는 환경적 인자 및 후성유전적 요소에 의해 영향을 받을 수 있는 유전자를 포함하여, 새롭고 잘 연구되지 않은 다른 유전자 외에도, 이러한 이미 잘 알려진 유전적 위험 인자 중 일부와 관련이 있다.
방법
연구 집단: 코호트 1 - 예측 유전자는 문헌[Bienkowska et al., Genomics, 94: 423-432(2009)]에 공개된 공개적으로 이용가능한 데이터세트 GSE15258로부터 확인되었고, 이의 전체내용은 참조로 본원에 포함되어 있다.
코호트 2:
· 생물학적으로 나이브(naive)한 환자.
· 북미 류마티스학 연구원 컨소시엄(CORRONA)은 200165 이래로 미국에서 38,000명이 넘는 RA 환자 및 이들의 의사로부터 "실제(real world)" 종단 데이터를 수집하고 있다. 데이터는 각 등록 방문시 기관 검토 위원회/윤리 위원회 승인을 받아 수집되고 질환 중증도 및 활성, 약물, 부작용, 삶의 질, 실험실 및 이미징 결과, 및 사회인구통계학적 정보 65를 포함한다.
· CERTAIN 시험은 항-TNF 요법(후미라, 에타네르셉트, 인플릭시맙, 심지아 및 심포니), 및 대안적인 작용 메커니즘 약물 아바타셉트, 리툭시맙 및 토실리주맙과 같은 생물학적 약물의 효과 및 안전성을 비교하기 위해 생물학적 제제를 시작하거나(생물학적 제제 나이브(naive)) 전환하는 중등도 내지 중증 질환 활성을 갖는 RA 환자로부터의 데이터를 수집 및 비교하기 위해 CORRONA 레지스트리에 의해 시작되었다. 일차 비교 유효성 종점은 등록 전에 적어도 하나의 항-TNF 제제에 노출된 환자 중에서 1년에 낮은 질환 활성의 도달이었다. 환자 방문 및 혈액 검사는 3개월마다 지시되었다.
· CERTAIN 시험은 생물학적 제제를 시작하거나 전환하는 >10의 임상 질환 활성 스코어(CDAI)로서 정의된 중등도 수준의 질환 활성을 갖는 모든 환자에게 개방되었다. 또한, PAXgeneTM 혈액 RNA 튜브는 이 연구 전에 기준선에서 CERTAIN 환자로부터 수집되어 -80℃에 보관되었다.
· 이러한 후향적 검증 연구를 위해, PAXgene 전혈 RNA 샘플은 생물학적 (b) DMARD 시작 전에 수반되는 MTX로 모두 처리되고 용량 > 5 mg의 변화 없이 3개월 추적 방문에서 여전히 MTX에 있는 환자에서 선택되었다. 3개월 방문 후, 환자는 생물학적 제제를 중단할 수 있다. 환자는 기준선에서, 또는 3개월 추적 방문에서 수반되는 하이드록시클로로퀸(Plaquenil)을 복용하도록 허용되었지만 다른 csDMARD을 복용하도록 허용되지 않았다. 환자는 3개월 방문시에 프레드니손(≤10 mg/일)을 복용하도록 허용되었다. 6개월 방문시에 더 높은 용량(>10 mg/일)의 프레드니손이 허용되었다. 임상 평가는 압통 및 부종 관절 수, 의사 및 환자 전반적 질환 활성 스코어, 환자 통증 및 피로, 및 삶의 질 조사를 포함하였다. 실험실 연구는 완전 혈액 수, C-반응성 단백질, RF, 및 항-CCP 역가를 포함하였다. 환자는 MTX 또는 하이드록시클로로퀸의 용량 변화가 필요하거나 기준선 또는 3개월 방문시 다른 csDMARD 요법으로 치료되는 경우 연구로부터 제외되었다. 프레드니손 >10 mg/일의 용량을 복용 중인 환자도 연구로부터 제외되었다.
항-TNF 요법에 대한 반응의 평가. 신청자는 CDAI < 10, DAS28CRP < 2.9 또는 ACR50 또는 EULAR 양호한 반응과 동등한 반응에 의해 정의된 낮은 질환 활성을 달성하는 것으로 반응을 정의하였다. 항-TNF 요법에 대한 환자 반응은 항-TNF 요법 시작 후 3개월과 6개월에 평가되었다.
RNA 단리 및 QC. miRNA를 포함한 총 RNA는 제조사의 지침에 따라 PAXgene 혈액 miRNA 키트(PreAnalytix)를 사용하여 PAXgene 혈액 RNA 튜브에 수집된 혈액으로부터 단리되었다. 정제된 RNA는 -80℃에서 보관되었다. RNA 품질은 Agilent Bioanalyzer를 사용하여 평가되었고, 샘플은 NanoDrop ND-8000 분광광도계를 사용한 분광광도법에 의해 정량화되었다. 5 초과의 RIN 및 적어도 1 μg의 RNA를 갖는 샘플은 GlobinClear 처리로 진행되었다.
글로빈 고갈 및 cDNA 라이브러리 준비. 글로빈 mRNA는 제조사의 지침에 따라 GlobinClear-Human 키트(Thermo Fisher)를 사용하여 혈액 유래의 총 RNA 샘플로부터 고갈되었다. 최종 글로빈 mRNA가 고갈된 RNA 샘플은 NanoDrop ND-8000 분광광도계를 사용한 분광광도법에 의해 정량화되었다.
시퀀싱 라이브러리를 Illumina TruSeq 표준 총 RNA 방법을 사용하여 생성하였다. 리보솜 RNA는 제조사의 지침에 따라 RiboZero Magnetic Gold 키트를 사용하여 라이브러리 생성 전에 우선적으로 제거되었다. 최종 라이브러리는 PCR을 통해 증폭되었고, 정규화되었고, 시퀀싱을 위해 풀링되었다. 라이브러리는 샘플당 최소 30 M 리드를 표적으로 하여 75 사이클 동안 Nextseq 500 시퀀서 상에서 실행되었다.
RNA-seq 분석 및 유전자 발현 처리. 환자당 33.7 내지 47.5 M의 범위로 평균 ~40.2 M 리드가 포획되었다. 유전자당 및 전사체당 초기 값은 (i) STAR(Spliced Transcripts Alignment to a Reference) 정렬기[Dobin et al., 2013]를 이용하여 짧은 50-mere 리드를 GRCh37 버전 인간 게놈 어셈블리에 맵핑한 후, RSEM(RNA-Seq by Expectation-Maximization) 소프트웨어 패키지(Li and Wewey, 2011)를 이용한 전사체 존재량(transcript abundance)의 정량화에 의해 유래되었다. 원시 수(raw count)가 분석에 사용되었다.
통계 분석. 모든 통계 분석은 Python 2.7.15를 사용하여 수행되었다. 도 6a는 특징 선택, 모델 훈련, 및 모델 검증을 위해 사용된 코호트의 흐름도뿐만 아니라 최종 모델 개발에 사용된 포함 기준을 상세히 설명한다. 도 6b는 코호트 1 사이에서 예측 유전자 확인을 위해 사용된 방법의 흐름도를 상세히 설명한다. 100 라운드의 교차 검증에 걸쳐, 샘플의 80%가 특징 선택 및 모델 훈련을 위해 무작위로 선택되었다. 80% 훈련 샘플 중에서, 만-휘트니(Mann-Whitney) U-시험은 반응자 및 무반응자 사이에서 발현이 유의하게 상이하지 않은 임의의 특징을 제거하는 데 사용되었다(p > 0.05). 나머지 특징은 랜덤 포레스트가 그의 평균 감소 불순물에 기초하여 각각의 특징의 순위를 매기는 데 사용된 10겹의 교차 검증을 통해 후속적으로 추가로 평가되었다. 5/10 교차 검증 겹에서 상위 100위의 특징은 20% 보류된 시험 샘플로 시험된 랜덤 포레스트 모델을 구축하는 데 사용되었다. 이 과정은 100회 반복되었고, 100회 반복 중 30에서 선택된 특징은 추가 평가를 위한 예측 바이오마커로 간주되었다.
항-TNF 요법에 대한 반응의 예측 바이오마커는 북미 류마티스학 연구원 컨소시엄(CORRONA)으로부터 수집된 231명의 환자의 독립적인 코호트에서 추가로 평가되었다(섹션 3.1, 연구 집단 참고). 185개의 샘플(코호트의 80%)이 최종 특징 선택, 임상 종점 평가, 및 모델 훈련에 사용되었다. 최적 모델 파라미터 및 임상 종점은 50회 반복된 10% 보류된 교차 검증의 10회 반복을 통해 평가되었다. 교차 검증의 각 라운드 내에서, 랜덤 포레스트 불순물 평균 감소에 의해 순위가 매겨진 상위 15개 특징은 보류된 10% 샘플 상에서 시험된 모델을 구축하는 데 사용되었다. 최종 특징 선택의 경우, 특징은 이들이 가능한 5,000개 선택 중 4,000개 초과에서 상위 15위인 경우 선택되었다. 최종 랜덤 포레스트 모델은 이러한 선택된 특징을 사용하여 후속적으로 훈련되었고 코호트 내의 나머지 46개 샘플(20%) 중에서 검증되었다.
실시예 2
본 실시예는 류마티스성 관절염(RA) 환자에서 치료 시작 전에 기준선에서 항-TNF 요법에 대한 무반응을 예측하는 분류 알고리즘의 교차-코호트, 크로스-플랫폼 개발 및 검증을 설명한다. 더욱이, 본 실시예는 다른 분류기의 개발에 적용될 수 있는, 예컨대, 다른 특징(예를 들어, 특정 결과 또는 부작용을 달성하거나 겪을 가능성 등)을 예측하고/거나 다른 요법과 관련된 특정 기술을 설명한다.
1. 방법
(1) 연구 집단
(a) 발견 코호트
환자 마이크로어레이 데이터(accession GSE15258)는 유전자 발현 옴니버스(GEO)로부터 수득되었다. 샘플 수집 및 코호트 정보의 세부사항은 이전에 보고되었다. 간략히, 항-TNF 요법을 받은 적이 없는 RA 환자가 등록되었고 혈액 샘플은 PAXgene 튜브에 수집되었다. 치료 반응은 DAS28-CRP EULAR 반응 정의에 따라 치료 시작 후 14주에 평가되었다. 58명의 여성 환자 샘플이 사용되었다.
(b) 훈련 코호트 및 검증 코호트
RA 환자 전혈 샘플 및 임상 측정값은 북미 류마티스학 연구원 컨소시엄(CORRONA)에 의해 CERTAIN 시험에서 전향적으로 수집되었다. CERTAIN 연구는 43개의 사이트 및 117명의 류마티스 전문의를 포함하는 전향적 비교 효과 연구로서 설계되었다. 기관 검토 위원회 및 윤리 위원회 승인은 샘플 수집 및 연구 참여 전에 수득되었다. 현재의 연구를 위해 선택된 샘플은 샘플 수집시에 생물학적 제제를 받지 않았다(즉, 환자는 하기 요법에 대한 경험이 없었다: 아달리무맙, 에타네르셉트, 인플릭시맙, 세르톨리주맙 페골, 골리무맙, 토실리주맙, 리툭시맙, 및 아바타셉트). 환자는 치료 의사의 재량에 따라 아달리무맙, 에타네르셉트, 세르톨리주맙 페골, 골리무맙 또는 인플릭시맙으로 치료되었고 적어도 6개월 동안 종단적으로 추적되었다. 병력 외에도, 요법 개시 후 0개월 및 6개월에 수집된 임상 평가는 압통 및 부종 관절 수, 의사 및 환자 전반적 질환 활성 스코어, csDMARD 용량, 환자 통증 평가, 및 삶의 질 조사를 포함하였다. 중앙 실험실에서 수행된 실험실 연구는 완전 혈액 수, C-반응성 단백질(CRP) 수준, 류마티스성 인자 역가, 및 항-사이클릭 시트룰린화된 단백질(항-CCP) 역가를 포함하였다. 환자 인구통계 및 임상 변수의 특징은 표 3에 상세히 설명되어 있다. 훈련(n=143) 및 검증 시험(n=175) 환자 코호트는 반응률, 연령, 및 성별에 대해 균형을 이루었다. 환자는 이들이 100의 최대 스코어 중 적어도 15의 시각적 아날로그 척도 통증 스코어를 가진 경우 독립 검증 시험에 포함되었다. CERTAIN 연구의 포함 기준과 일치하게도, 검증 시험 내의 모든 환자는 10을 초과하는 CDAI를 가지고 있었다.
Figure pct00015
Figure pct00016
(ii) 항-TNF 요법에 대한 임상 반응의 평가
CORRONA 연구 샘플 중에서, 항-TNF 요법 시작 후 6개월에서의 반응은 ACR50에 의해 정의되었다(ACR50은 관해 또는 낮은 질환 활성을 달성하는 환자로서 미국 류마티스학 대학에 의해 정의된 환자 치료 표적을 지칭하며, 여기서 숫자(예컨대, 50)는 부종 및 압통 관절의 수, 환자 및 의사 보고서 평가 및 통증 및 전체 건강뿐만 아니라 혈청 바이오마커를 포함하는 표준 측정 세트의 퍼센트 개선을 지칭함). 반응자는 28개의 압통 관절 수에서 > 50% 개선, 28개의 부종 관절 수에서 > 50% 개선 및 5개의 임상 변수(질환 지수, 환자 통증, 환자 전반적 평가, 의사 전반적 평가 및 CRP 수준) 중 적어도 3개에서 > 50% 개선을 나타내는 개체이다.
(iii) RNA 단리 및 QC
총 RNA는 제조사의 지침에 따라 PAXgene 혈액 miRNA 키트(PreAnalytix)를 사용하여 PAXgene 혈액 RNA 튜브에 수집된 혈액으로부터 단리되었다. RNA 품질은 Agilent Bioanalyzer를 사용하여 평가되었고, 샘플은 NanoDrop ND-8000 분광광도게를 사용하여 정량화되었다.
(iv) RNA-시퀀싱(RNAseq) 분석 및 유전자 발현 전처리
RNA는 제조사의 지침에 따라 GLOBINclear(Thermo Fisher), Ribo-Zero Magnetic Gold(Epidemiology), 및 TruSeq Standard Total RNA(Illumina) 키트를 사용하여 처리되었다. 라이브러리는 75 사이클 동안 NextSeq 550 DX 또는 NovaSeq 6000 시퀀서 상에서 처리되었다. 33.7 - 58.6 M의 범위로 평균 42.4 M 리드가 환자당 포획되었다. 50-nt 리드는 STAR를 사용하여 GRCh37 인간 게놈에 맵핑되었다. 100만개의 맵핑된 리드당 킬로베이스의 전사체당 단편(FPKM)의 유전자당 존재량은 RSEM 소프트웨어 패키지로 계산되었다. > 400만 또는 > 700만 단백질 코딩 리드의 RNA 무결성 스코어(RIN)를 갖는 샘플을 분석하였다. 주성분 분석을 기반으로 하는 NextSeq 및 NovaSeq 처리된 라이브러리 사이에서 감지가능한 배치 효과(batch effect)가 관찰되지 않았다.
(v) 단일-뉴클레오타이드 다형성(SNP) 분석
무엇보다도, 본 개시내용은 SNP 분석이 본원에 기재된 바와 같은 분류기, 예컨대, RNAseq 데이터로 및/또는 본원에 기재된 바와 같이 유전자 발현 수준에서의 작지만 유의한 차이를 고려하여 개발된 분류기에 포함시키기 위한 특히 유용한 정보를 제공하는 통찰력을 제공한다. SNP 데이터를 수득하기 위해, 샘플은 STAR을 사용하여 GRCh38 인간 게놈에 정렬되었다. SNP는 RNAseq 데이터 상의 SNP 및 삽입-결실(indel) 호출을 위한 게놈 분석 툴키트 최고 실행(Genome Analysis Toolkit Best Practices) 워크플로우의 변형된 버전을 사용하여 호출되었다. 39개의 RA 관련 SNP가 평가되었다.
(vi) 기계 학습 및 약물 반응 알고리즘 개발
58명의 환자 발견 코호트에서 21,818개의 전사체 특징이 평가되었다. 무작위로 선택된 80%의 샘플 중에서, 만-휘트니 U 시험은 반응자 및 무반응자 사이에 유의하게 차별이 없는 임의의 유전자 발현을 제거하는 데 사용되었다(p > 0.05). 랜덤 포레스트 기계 학습 알고리즘은 그의 평균 감소 불순물을 기반으로 각각의 나머지 특징의 순위를 매기는 데 사용되었다. 상위 100개의 특징은 보류된 데이터의 20% 서브세트로 시험된 랜덤 포레스트 모델을 구축하는 데 사용되었다. 이 과정은 100회 반복되었고, 반복의 > 30%에서 선택된 특징이 추가로 고려되었다. 37개의 선택된 유전자 중 26개의 유전자에 대한 유전자 발현은 훈련 코호트에서 RNAseq에 의해 검출가능하였다. 2개의 추가 특징은 낮은 발현으로 인해 제거되었다. 최종 모델 개발 동안, 70개의 차별적인 분자 및 임상 특징(표 4-6)은 훈련 코호트 데이터를 사용하여 상기와 같이 랜덤 포레스트에 의해 평가되었다. 각각의 특징의 중요성은 이를 특징 목록으로부터 제거하고 보류된 데이터의 20% 서브세트에서 모델 성능을 평가함으로서 평가되었다. 상위 50%의 가장 중요한 특징은 전체 훈련 세트를 사용하여 랜덤 포레스트 예측 분류 모델을 구축하는 데 사용되었다. 모델 성능은 수신자 작동 곡선하 면적, 음성 예측값 및 진음성률을 사용하여 평가되었다. 모든 통계 분석은 Python 2.7.15(www.python.org)를 사용하여 수행되었다.
표 4는 류마티스성 관절염 환자에서 항-TNF에 대한 무반응을 예측하는 분류 알고리즘의 개발 동안 평가된 차별적인 유전자를 제공한다.
Figure pct00017
Figure pct00018
표 5는 류마티스성 관절염 환자에서 항-TNF에 대한 무반응을 예측하는 분류 알고리즘의 개발 동안 평가된 SNP를 제공한다.
Figure pct00019
Figure pct00020
Figure pct00021
표 6은 CERTAIN 코호트로부터 이 연구에서 이용가능한 임상 인자를 제공한다.
Figure pct00022
Figure pct00023
(vii) 인간 상호작용체 및 RA 질환 모듈 구축, 및 분자 특징의 네트워크 의학 분석 수행
인간 상호작용체는 상이한 유형의 실험적으로 유래된 단백질-단백질 상호작용(PPI) 데이터를 함유하는 21개의 공개 데이터베이스(표 5)로부터 이전에 설명된 대로 조립되었다: 1) 고처리량 효모-2 하이브리드(Y2H) 실험(HI-Union), 3차원(3D) 단백질 구조(Interactome3D, Instruct, Insider) 또는 문헌 큐레이션(PINA, MINT, LitBM17, Interactome3D, Instruct, Insider, BioGrid, HINT, HIPPIE, APID, InWeb)으로부터 유래된 바이너리 PPI; 2) BioPlex2, QUBIC, CoFrac, HINT, HIPPIE, APID, LitBM17, 및 InWeb에 존재하는, 친화성 정제 후 질량 분광법에 의해 확인된 PPI; 3) KinomeNetworkX 및 PhosphoSitePlus로부터의 키나아제-기질 상호작용; 4) Signalink 및 InnateDB로부터의 신호전달 상호작용; 및 5) ENCODE 컨소시엄에 의해 유래된 조절 상호작용. Alonso-Lopez 등에 의해 제공된 PSI-MI ID의 큐레이트된 목록은 문헌-큐레이션 데이터베이스에 존재하는 몇 가지 실험 방법 간의 바이너리 상호작용을 구별하는 데 사용되었다. 특히 InWeb의 경우, 큐레이션 스코어 < 0.175(75번째 백분위수)를 갖는 상호작용은 고려되지 않았다. 모든 단백질은 이들의 상응하는 Entrez ID(NCBI)에서 맵핑되었고 맵핑될 수 없는 단백질은 제거되었다. 생성된 인간 상호작용체는 18,505개의 단백질 및 327,924개의 상호작용을 포함한다.
DIAMOnD 접근법은 RA 질환 모듈을 생성하는 데 사용되었다. 질환 모듈을 시딩(seeding)하는 데 사용된 단백질은 5개의 데이터베이스 중 적어도 2개에 의해 RA와 연관되었다: (GWAS Catalog, HuGE Navigator Phenopedia, ClinVar, OMIM, 및 MalaCards). DIAMOnD는 질환 연관 단백질로서 동일한 유전자 온톨로지 생물학적 과정에서 유의하게 농축된 단백질을 확인하였다.
인간 상호작용체 맵 상에서 서로에 대한 분자 특징의 근접성은 이전에 설명된 대로 계산되었다. 간략히, 가장 가까운 거리는 세트 내의 각 단백질과 그 다음으로 가장 가까운 단백질 사이의 평균 최단 경로 길이로서 정의되었다. 관찰된 가장 가까운 거리의 유의성은 동일한 크기의 10,000개의 무작위 단백질 세트로부터 결정된 예측된 가장 가까운 거리와 비교하여 평가되었다. 무작위화는 이전에 설명된 대로 수행되었다.
(viii) 경로 농축 분석
KEGG, Biocarta, Reactome, 및 Signal Transduction(ST) 경로 주석(annotation)은 분자 서명 데이터베이스(MSigDB), 버전 6.2로부터 수득되었다. Fisher의 정확 검정은 생물학적 경로를 확인하는 데 사용되었다. < 0.05의 본페로니(Bonferroni) 수정된 p-값을 갖는 경로는 농축된 것으로 간주되었다. IL10, POMC, JAK1, ICOSLG, TNF, TNFSF11, NR3C1, P2RY12(NCT02874092), PTGER4, GGPS1, FDPS, TNFRSF13B(NCT03016013), IL6, ESR1, ESR2, ITK(NCT02919475), BTK, TLR4(NCT03241108), IRAK4, JAK2, JAK3, HDAC1(NCT02965599), PSMB5, ADORA3, ITGA9(NCT02698657, NCT03257852), IFNB1(NCT02727764; NCT03445715), CX3CL1은 RA에서 승인된 약물 표적이었다.
2. 결과
인간 상호작용체 및 RA 질환 생물학 맵 구축
인간 질환 생물학을 평가하는 데 필요한 네트워크 의학 도구의 개발을 시작하기 위해, 세포 구성요소 및 이들의 물리적 상호작용의 맵이 생성되었다. 총 18,505개의 단백질 사이의 327,924개의 단백질-단백질 상호작용의 공개적으로 이용가능한 데이터(표 7)를 통합함으로써, 인간 상호작용체로 불리는 생물학의 포괄적인 맵이 생성되었다(방법 참고).
Figure pct00024
Figure pct00025
질환 관련 단백질은 질환 모듈로 불리는 인간 상호작용체 상의 하위-네트워크에서 서로 상호작용하는 경향이 있다. 알려진 질환 연관 단백질에 대한 이들의 근접성을 기반으로 잠재적인 질환 연관 단백질을 집계하는 DIAMOnD 접근법을 사용하여, 대략 200개의 단백질을 함유하는 RA 질환 모듈이 생성되었다. 이 중에서, 66%는 게놈 전체 연관성 연구 데이터베이스에서 RA와 연관되었고, DIAMOnD는 질환 연관 단백질로서 동일한 유전자 온톨로지 생물학적 과정 용어에서 유의하게 농축된 나머지 단백질을 확인하였다.
인간 상호작용체 및 RA 질환 모듈을 사용하여, 본 출원은 어떤 RA 환자가 항-TNF 요법에 반응하지 않을지 예측하기 위해 임상 변수 및 분자 특징을 통합하는 혈액 기반 분류 알고리즘을 생성하고자 하였다(도 11). 간략히, 항-TNF 요법에 대한 반응자 및 무반응자를 구별하는 분자 특징은 공개적으로 이용가능한 마이크로어레이 데이터세트로부터 선태되었다. 크로스-플랫폼 분석에서, 이러한 특징은 RA 질환 모듈 연관 SNP 및 임상 인자와 조합되었다. 기계 학습 알고리즘은 RNAseq 데이터를 사용하여 훈련되었다. 마지막으로, 예측 약물 반응 알고리즘의 성능은 독립적인 검증 시험에서 검증되었다.
(i) RA 환자에서 항-TNF 요법에 대한 불충분한 반응을 예측하는 전혈에서의 차별적인 유전자 발현의 크로스-플랫폼 확인
요법에 대한 무반응을 예측하는 시험의 임상 유용성을 최대화하기 위해, 전문적인 표본 수집 절차가 필요하지 않은 일상적인 비침습적 또는 최소 침습적 샘플 공급원이 이상적이다. 이러한 이유로, 전혈로부터 유래된 유전자 발현 데이터가 분석되었다. 항-TNF 요법에 대해 반응자 및 무반응자인 것으로 간주된 환자 사이에서 차별적인 유전자 발현은 랜덤 포레스트 기계 학습 알고리즘을 사용하여 58명의 생물학적 제제를 받지 않은 RA 환자의 공개적으로 이용가능한 마이크로어레이 발견 코호트 데이터세트에서 선택되었다. 유전자 발현이 평가된 발견 데이터세트 내의 21,818개의 유전자 중에서, 37개는 항-TNF 요법에 대한 반응자(n=24) 및 무반응자(n=51) 사이에서 차별적이었다(도 9; 표 3). 마이크로어레이 및 RNAseq에 의한 전사 프로파일링은 동적 범위가 다양하고, 관찰된 차별 유전자 발현의 수 및 정도에서 일부 불일치를 나타낸다. 그럼에도 불구하고, 마이크로어레이 데이터에서 항-TNF 약물 반응이 차별적인 것으로 확인된 전사체의 많은 부분은 또한 RNAseq 데이터에서 반응자 및 무반응자를 구별하였다.
(ii) RNAseq 데이터로부터 질환 연관 SNP의 평가
RNAseq는 마이크로어레이 분석으로부터 결여되어 있는 뉴클레오타이드 서열에 대한 정보를 제공한다. 유전자 발현 외에도, RNA 서열의 변이는 RA 환자에서 항-TNF 요법에 대한 무반응을 예측할 수 있다. 이를 위해, CORRONA CERTAIN 연구에서 143명의 RA 환자로부터 수득된 임상 데이터 및 전혈 RNAseq 데이터로부터 훈련 데이터세트가 생성되었다. 환자 집단의 특징 및 인구통계는 표 3에 요약되어 있다. SNP 분석은 전통적으로 전체 게놈 시퀀싱 데이터 상에서 수행되지만, 대부분의 게놈은 전사된다. 따라서, 대부분의 SNP 변이체는 리보솜 RNA 고갈된 RNAseq 데이터에서 검출될 수 있다. 류마티스성 관절염과 관련된 여러 SNP는 발현 정량적 형질 유전자좌(eQTL) 분석을 통해 말초 혈액 단핵 세포에서 유전자 발현 변화와 기능적으로 연관되었다(표 4). 선택된 SNP와 연관된 유전적 유전자좌는 RA 질환 모듈과 유의한 중첩을 갖는다(도 8b). 22개의 이러한 SNP는 환자 RNAseq 데이터에서 검출 한계를 초과하였고 추가 분석에 포함되었다(도 9).
(iii) 다중 인자 예측 약물 반응 알고리즘을 개발하기 위한 SNP, 유전자 발현 데이터, 및 임상 변수의 통합
약물 반응을 나타내는 유전자 발현(표 4), RA 연관 SNP(표 5) 및 임상 인자(표 6)는 항-TNF 요법에 대한 무반응을 예측하는 약물 반응 알고리즘을 훈련 및 개발하는 데 사용되었다. 6개월의 ACR50을 벤치마크로 사용하여, 훈련 코호트 집단은 30.8%의 항-TNF 요법에 대한 반응률을 가지고 있었다. 이것은 일반 집단을 대표하고 CORRONA CERTAIN 연구의 실제 전향적 수집 접근법을 반영한다. 랜덤 포레스트는 차별적인 유전자 발현 세트로부터의 특징, SNP 뿐만 아니라 임상 인자, 또는 이의 조합을 사용하여 RNAseq 훈련 데이터세트의 80%로 예측 모델을 생성하는 데 사용되었다. 훈련 데이터세트의 나머지 20%에 대한 교차검증은 수신자 작동 특징 곡선하 면적을 사용하여 모델 성능을 평가하였다. 이 분석은 모델이 반응자 및 무반응자를 얼마나 잘 구별할 수 있는지 측정하기 위해 위양성 및 진양성 사이의 관계를 평가한다. 항-TNF 요법에 대한 무반응을 가장 잘 예측하는 모델은 3개의 모든 특징 유형의 조합을 사용하여 생성되었다. 모델 교차검증 성능의 수신자 작동 곡선하 면적(AUC)은 0.66이었다. 임상 인자만을 이용하는 경우, AUC는 0.56이었고, 분자 특징만을 이용하는 경우, AUC는 0.64였다(표 8). 교차검증 성능 데이터는 분류기에서 전사체 및 SNP 특징의 중대한 중요성을 확인시켜 준다. 표 8은 전체 특징 세트 및 그의 서브세트를 사용하여 모델로부터 교차 검증 결과를 제공한다.
Figure pct00026
(iv) RA 환자에서 항-TNF 요법에 대한 무반응을 예측하는 바이오마커 패널인 PrismRA™의 맹검 독립적 검증 시험
많은 연구는 항-TNF 요법에 대한 무반응의 생물학이 전혈의 전사체에 반영된다는 가설을 세웠다. 그러나, 어떤 것도 병원으로 옮겨지지 않았고, 이는 RA 질환 생물학의 복잡성 및 알고리즘 개발에 사용되는 다양한 방법론 모두를 반영할 가능성이 있다. 또한, 제한된 샘플 크기 및 유전자 발현 데이터 분석의 복잡성은 지금까지 환자 코호트에 걸쳐 그리고 더 넓은 환자 집단까지 일반화할 수 있는 알고리즘의 개발을 방해하였다. 12개의 SNP, 8개의 전사체, 2개의 실험실 시험 및 3개의 기본 인구통계 인자(성별, BMI, 환자 질환 평가)로 구성된 PrismRA™ 바이오마커 패널이 일반화가능하다는 것을 확인하기 위해, 전향적으로 수집된 샘플의 독립적인 그룹(n = 175)이 맹검 검증 시험을 수행하는 데 사용되었다. 검증 코호트에 포함된 샘플은 알고리즘 개발의 임의의 단계에 사용되지 않았고, 알고리즘은 이들 환자의 유전자 발현 데이터 또는 임상 결과로부터 유래된 정보를 갖지 않는다.
PrismRA™ 바이오마커 패널의 맹검 독립적 검증은 각 하위그룹에서 반응자인 0.152(CI 0.064, 0.364)의 매우 통계적으로 유의한 오즈비(odds ratio)로 검증 코호트를 예측된 무반응자 및 반응자로 계층화하였다. PrismRA™은 89.7%(음성 예측값) 정확성으로 무반응자 환자의 50.0%(특이도)를 확인하였다(표 9). 무반응자인 것으로 예측된 환자는 항-TNF에 대해 10.3%의 관찰된 ACR50 반응률을 가지며, 30.3%의 전체 반응률보다 유의하게 더 낮다. 이러한 개체를 대안적인 요법으로 다시 보내는 것은 의미있는 임상 변화를 달성할 가능성을 크게 증가시킬 것이다. 반대로, 예측된 반응자는 43.0%의 관찰된 ACR50 반응률을 가지며, 이는 계층화되지 않은 환자 집단의 반응률로부터 41.8% 개선이다. 표 9는 PrismRA™ 예측 바이오마커 패널 검증 성능을 제공한다.
Figure pct00027
(v) 항-TNF 요법에 대한 반응자 및 무반응자를 구별하는 유전자 산물의 생물학적 해석
모든 알려진 단백질-단백질 상호작용의 인간 상호작용체 맵은 항-TNF 요법에 대한 무반응의 기저 생물학을 평가하는 독특한 유리한 시점을 제공한다. RA 질환 생물학에 대한 PrismRA™ 예측 바이오마커 패널의 적용가능성을 특성화하기 위해, 차별적인 유전자 및 SNP eQTL의 단백질 산물은 인간 상호작용체 및 경로 농축 분석을 사용하여 분석되었다. PrismRA™ 패널에 포함된 차별적인 유전자 및 SNP eQTL에 의해 코딩된 단백질은 인간 상호작용체 맵 상에 중첩되었다(도 8a). 모두 합해서, 42개의 단백질이 인간 상호작용체 상에 맵핑되었고: 24개는 차별적인 유전자에 의해 그리고 18개는 SNP eQTL에 의해 기여된다. 이들 분자 특징은 항-TNF 요법에 반응하지 않을 RA 환자의 하위집단을 통합하는 작지만 화합하는 생물학적 네트워크를 강조하는 맵 상에 얽혀 있다. 이 근접성의 정량화(방법 참고)는 이러한 상이한 분자 특징이 서로 유의하게 가깝다는 것을 나타낸다(z-스코어 = -2.18). 또한, RA 질환 모듈(z-스코어 = - 4.09) 및 RA 약물 표적, 예컨대 JAK 및 TNF(z-스코어 = -3.98)는 집합적으로 SNP 및 DG에 근접한다(도 8b).
경로 농축 분석은 항-TNF 요법 반응에 관여하는 분자 경로를 간파하기 위해 수행되었다. T 세포 신호전달은 질의된 경로 분석 데이터베이스에서 가장 농축된 경로로서 확인되었다. RA의 항-TNF 요법 반응 및 질환 생물학 모두에 대한 T 세포 신호전달의 관련성과 중요성은 잘 확립되어 있다.
3. 논의
마이크로어레이 유전자 발현 데이터, RNA 차세대 시퀀싱, 생물학적 네트워크 분석, 및 기계 학습을 큰 환자 코호트에 포함시킴으로써, 이 연구는 전혈 유전자 발현 데이터를 사용하여 항-TNF 요법에 대한 무반응을 예측하는 약물 반응 알고리즘이 상이한 RA 환자 코호트에 걸쳐 성능을 낼 수 있음을 입증한다. PrismRA™의 맹검 독립적 검증 시험에 사용된 전향적으로 수집된 RNAseq 데이터세트는 상기 약물 반응 알고리즘이 90% 정확성으로 RA 환자의 독립적 집단에서 항-TNF 요법에 대한 무반응을 예측할 수 있음을 입증하였다. 항-TNF 요법은 계층화되지 않은 환자 집단의 거의 70%가 치료 표적에 도달하는 것을 돕지 못한다. PrismRA를 임상 치료에 포함시키는 것은 이 수를 절반 넘게 감소시킬 것이다.
예측 약물 반응 알고리즘은 마이크로어레이 데이터세트에서 확인된 차별적인 분자 특징으로부터 유래되었고 RNAseq 데이터로부터 유래된 제2 데이터세트로부터의 임상 인자와 함께 추가로 평가되었다. 이러한 2개의 유전자 발현 분석 플랫폼은 정규화된 유전자 발현 값을 결정하기 위한 RNA 검출 방법론 및 통계적 도구가 상이하다. 이러한 기술의 차이에도 불구하고, 이 연구에서 확인된 분자 특징의 크로스-플랫폼 및 교차-코호트 보편성은 항-TNF 약물 반응의 생물학의 근간이 되는 강력하고 일반화가능한 분자 과정의 존재를 강조한다.
단일 대규모 고처리량 분석 접근법은 아직 RA 질환 생물학의 완전한 분자 아키텍처를 포착하지 못했다. SNP는 조절 요소가 이들의 동족 단백질 파트너와 상호작용하는 경향, 유전자 유전자좌로부터 생성된 대체 스플라이스 변이체의 비율 또는 신원, 전사체 수준, 및 단백질 서열을 포함하는 세포 생물학의 많은 측면에 영향을 미칠 수 있다. 따라서, 질환 연관 SNP의 기능적 판독은 개체가 질환을 발병하는 경향뿐만 아니라 환경적 인자가 병리생물학에 영향을 미치는 성향에 기여한다. 단백질을 암호화하지 않는 많은 조절 요소 및 게놈 영역은, 예컨대 인핸서 RNA 및 프로모터 연관 전사체의 형태로 전사된다. 따라서, 전사에서 공간 및 시간 특이적 변화에 영향을 미치는 많은 SNP는 RNAseq 데이터로부터 평가될 수 있다. 함께, SNP 및 유전자 발현 분석은 이해하기 힘들 수 있는 표현형 변이 및 경로 연관성을 포착할 수 있다. 뉴클레오타이드 변이체 및 차별적인 유전자 발현을 단일 예측 알고리즘에 통합하는 것은 질환 발병 및 약물 반응에 대한 실행가능한 통찰력을 생성하였다.
각 환자의 개별화된 질환 생물학과 일치하게 치료 요법을 맞춤화하는 것은 현대 의학의 목표이다. 의학에 대한 이 개인맞춤 접근법은 종양학에서 사용되며, 여기서 특정 게놈 마커가 있는 환자에게 특정 요법이 처방된다. RA와 같은 자가면역 질환의 복잡성과 이질성은 임상적으로 유용한 도구를 개발하기 위한 새롭고 다면적인 접근을 필요로 한다. 항-TNF 요법에 반응하지 않을 환자를 확인하는 분자 경로의 조사는 T 세포 신호전달과 RA 질환 생물학 사이의 연결을 입증하였다. 활막 염증은 활막 구획 내로의 백혈구 침윤 및 유지로부터 기인할뿐만 아니라 만성 염증성 세포의 불충분한 아폽토시스로부터 기인한다. 이 활막 침윤물은 자연 살해(NK) 세포, CD4+, 및 CD8+ T 세포를 포함한다. 더욱이, 다수의 활성화된 T 조절 세포가 RA 환자의 관절에서 검출될 수 있다. T 세포 신호전달과 연관되지 않은 나머지 차별적인 유전자는 항-TNF 요법에 반응하거나 반응하지 않을 환자 사이에서 상이한 RA 질환의 상이한 측면을 나타낼 가능성이 있다. RA 질환 생물학과의 연결은 항-TNF 무반응자의 확인을 위한 강력한 임상 도구인 PrismRA™의 신뢰성 및 적용가능성을 말한다.
항-TNF 요법에 부적절하게 반응할 것으로 예측된 환자의 경우, 대안적인 생물학적 제제 및 표적화된 합성 요법은 대안적인 치료 개시 후 6개월에 30-40%의 ACR50 반응률로 질환 활성의 신속하고 지속적인 개선을 통해 개선된 안전성 및 효율을 제공한다. 몇 가지 이러한 대안적인 요법은 FDA에 의해 그리고 RA 환자 치료 지침에 의해 1차 요법으로서 추천된다. 혈액 검사로서 이러한 계층화 예측 분류 알고리즘을 RA의 임상 치료로 통합하는 것은 더 많은 환자에 대해 더 빠르게 낮은 질환 활성을 달성할 것이다. 이것은 환자의 시간을 몇 개월 또는 몇 년 절약하고, 잠재적인 질환 진행을 예방하고, 항-TNF 요법의 순환과 연관된 잠재적으로 심각한 부작용에 대한 노출을 피하고, 부작용의 비효과적인 치료 및 관리에 대한 의료 지출을 감소시킬 것이다.
이러한 기계 학습 및 네트워크 의학 접근법을 사용하여 표적화된 요법에 대한 무반응을 예측하는 약물 반응 알고리즘의 개발 및 검증은 RA뿐만 아니라 다른 복잡한 자가면역 질환에 대한 큰 정밀 의학 발전 가능성을 보여준다.
전술한 것은 그 안에 기재된 주제의 특정한 비제한적인 구현예의 설명이었다. 따라서, 본 명세서에 기재된 구현예는 단지 그 안에 보고된 주제를 예시하는 것으로 이해되어야 한다. 예시된 구현예의 세부사항에 대한 언급은 본질적인 것으로 간주되는 특징을 자체적으로 인용하는 청구범위를 제한하려는 것이 아니다.
청구된 주제의 시스템 및 방법은 그 안에 기재된 구현예로부터의 정보를 사용하여 개발된 변형 및 적응을 포함하는 것으로 고려된다. 그 안에 기재된 시스템 및 방법의 적응, 변형, 또는 둘 모두는 관련 기술 분야에서 통상의 기술을 가진 자에 의해 수행될 수 있다.
명세서 전반에 걸쳐, 시스템이 특정 구성요소를 갖거나 포함하는 것으로 기재되는 경우, 또는 방법이 특정 단계를 갖거나 포함하는 것으로 기재되는 경우, 추가적으로, 언급된 구성요소로 본질적으로 구성되거나 이로 구성되는 본 주제에 의해 포함되는 시스템이 있고, 언급된 처리 단계로 본질적으로 구성되거나 이로 구성되는 본 주제에 의해 포함되는 방법이 있는 것으로 고려된다.
단계의 순서 또는 특정 동작을 수행하기 위한 순서는 그 안에 기재된 주제의 임의의 구현예가 작동가능한 상태로 유지되는 한 중요하지 않는 것으로 이해되어야 한다. 더욱이, 2개 이상의 단계 또는 동작은 동시에 수행될 수 있다.

Claims (74)

  1. 자가면역 장애를 겪고 있는 대상체를 치료하는 방법으로서,
    항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체(prior subject)를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계
    를 포함하며,
    분류기는
    발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는 하나 이상의 유전자;
    하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는
    반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징
    중 적어도 하나
    를 평가함으로써 개발되며;
    분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증되는 방법.
  2. 제1항에 있어서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측하는 방법.
  3. 제1항 또는 제2항에 있어서, 하나 이상의 유전자는 인간 상호작용체 맵 상에 맵핑될 때 이들의 위상학적 특성에 의해 특성화되는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, SNP는 인간 게놈을 참조하여 확인되는 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 분류기는
    발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는 하나 이상의 유전자;
    하나 이상의 SNP의 존재; 및
    적어도 하나의 임상 특징
    각각을 평가함으로써 개발되는 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 하나 이상의 유전자는 하기에서 선택되는 방법:
    Figure pct00028
    .
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택되는 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서, 분류기는 적어도 90% 정확성으로 무반응성인 집단 내에서 대상체의 적어도 40%를 확인하고, 집단은 적어도 170명의 대상체를 포함하는 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여를 포함하는 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택되는 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 분류기는 반응성 및 무반응성의 사전 대상체로부터 유래된 마이크로어레이 분석을 사용하여 확립되는 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 분류기는 독립적인 코호트로부터 유래된 RNAseq 데이터를 사용하여 검증되는 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, SNP는 표 5에서 선택되는 방법.
  14. 자가면역 질환을 겪고 있는 대상체에게 요법을 투여하는 방법으로서,
    항-TNF 요법을 받은 코호트에서 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성 또는 무반응성으로 분류된 대상체에게 요법을 투여하는 단계
    를 포함하며,
    대상체가 분류기에 의해 반응성으로 분류되는 경우, 항-TNF 요법을 투여하고; 대상체가 분류기에 의해 무반응성으로 분류되는 경우, 항-TNF 요법에 대한 대안을 투여하고;
    분류기는
    발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는 하나 이상의 유전자;
    하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는
    반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징
    중 적어도 하나
    를 평가함으로써 개발되며;
    분류기는 항-TNF 요법을 받은 코호트보다 독립적인 코호트에 의해 검증되는 방법.
  15. 제14항에 있어서, 분류기는 적어도 170명의 대상체의 집단에 걸쳐 적어도 90% 정확성으로 대상체의 반응성을 예측하는 방법.
  16. 제15항에 있어서, 분류기는
    발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는 하나 이상의 유전자;
    하나 이상의 SNP의 존재; 및
    적어도 하나의 임상 특징
    각각을 평가함으로써 개발되는 방법.
  17. 제14항 내지 제16항 중 어느 한 항에 있어서, 적어도 하나의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택되는 방법.
  18. 제14항 내지 제17항 중 어느 한 항에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러의 투여를 포함하는 방법.
  19. 제14항 내지 제18항 중 어느 한 항에 있어서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트에서 선택되는 방법.
  20. 제19항에 있어서, 질환, 장애, 또는 병태는 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 다발성 경화증, 및 소아 특발성 관절염에서 선택되는 방법.
  21. 대상체를 하나 이상의 치료 속성(therapeutic attribute)에 대해 계층화(stratifying)하기 위한 분류기를 개발하는 방법으로서,
    치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석하는 단계;
    서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계;
    하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및
    하나 이상의 SNP를 분류기에 포함시키는 단계
    를 포함하는 방법.
  22. 제21항에 있어서, 하나 이상의 치료 속성은 특정 질환, 장애, 또는 병태의 발병 위험, 특정 질환, 장애, 또는 병태에 대한 특정 결과의 가능성, 특정 요법에 대한 반응의 가능성으로 이루어진 군에서 선택되는 방법.
  23. 제21항 또는 제22항에 있어서, 하나 이상의 치료 속성은 특정 요법에 대한 반응의 가능성인 방법.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, 특정 요법은 항-TNF 요법인 방법.
  25. 치료 속성 중 적어도 하나에 대해 적어도 2개의 상이한 카테고리를 나타내는 대상체에서 발현된 RNA의 서열 데이터를 분석함으로써, 하나 이상의 치료 속성에 대해 대상체를 계층화하기 위한 분류기를 개발하는 방법에 있어서, 개선이
    서열 데이터로부터 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재를 평가하는 단계; 및
    하나 이상의 SNP의 존재가 적어도 하나의 치료 속성과 상관관계가 있는지 결정하는 단계; 및
    하나 이상의 SNP를 분류기에 포함시키는 단계
    를 포함하는 방법.
  26. 제25항에 있어서, 하나 이상의 치료 속성은 특정 질환, 장애, 또는 병태의 발병 위험, 특정 질환, 장애, 또는 병태에 대한 특정 결과의 가능성, 특정 요법에 대한 반응의 가능성으로 이루어진 군에서 선택되는 방법.
  27. 제25항 또는 제26항에 있어서, 하나 이상의 치료 속성은 특정 요법에 대한 반응의 가능성인 방법.
  28. 제25항 내지 제27항 중 어느 한 항에 있어서, 특정 요법은 항-TNF 요법인 방법.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 하나 이상의 SNP의 존재를 평가하는 것은 RNA의 서열 데이터를 참조 인간 게놈과 비교하는 것을 포함하는 방법.
  30. 자가면역 질환을 겪고 있는 대상체를 치료하는 방법으로서,
    (a) 컴퓨팅 장치의 프로세서에 의해, 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 유전자는 표 1에서 선택되는 단계;
    (b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
    (c) 대상체가 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 투여하거나; 또는 대상체가 항-TNF 요법에 대해 반응성으로 분류되는 경우, 항-TNF 요법을 투여하는 단계
    를 포함하는 방법.
  31. 제30항에 있어서, 단계 (a)에서의 프로세서는
    하나 이상의 임상 특징; 또는
    하나 이상의 단일 뉴클레오타이드 다형성(SNP)
    중 적어도 하나에 상응하는 데이터를 추가로 수신하는 방법.
  32. 제30항 또는 제31항에 있어서, 하나 이상의 임상 특징은 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 치료 반응률(예컨대, ACR20, ACR50, ACR70), 및 이의 조합에서 선택되는 방법.
  33. 제30항 내지 제32항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염에서 선택되는 방법.
  34. 제30항 내지 제33항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염인 방법.
  35. 제30항 내지 제34항 중 어느 한 항에 있어서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트에서 선택되는 방법.
  36. 제30항 내지 제34항 중 어느 한 항에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 또는 이의 바이오시밀러에서 선택되는 방법.
  37. 제30항 내지 제36항 중 어느 한 항에 있어서, 단계 (b)는 기계 학습 모델을 사용하여 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  38. 제37항에 있어서, 기계 학습 모델은 랜덤 포레스트 모델인 방법.
  39. 제30항 내지 제38항 중 어느 한 항에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  40. 제30항 내지 제38항 중 어느 한 항에 있어서, 단계 (b)는 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  41. 제30항 내지 제38항 중 어느 한 항에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  42. (a) 컴퓨팅 장치의 프로세서에 의해, 질환(예컨대, 자가면역 질환, 예컨대, 류마티스성 관절염)을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 모든 11개의 구성원(들))을 포함하는 단계;
    (b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여 제1 요법(예컨대, 항-TNF 요법)에 대해 반응성으로 대상체의 분류를 자동으로 결정하는 단계; 및, 선택적으로,
    (c) 질환의 치료를 위해 대상체에게 제2 요법(예컨대, 제1 요법에 대한 대안, 예컨대, 항-TNF 요법에 대한 대안)을 처방 및/또는 투여하여, 대상체에의 제1 요법의 처방 및/또는 투여를 피하는 단계
    를 포함하는 방법.
  43. 대상체를 항-TNF 요법으로 치료하는 방법으로서,
    항-TNF 요법을 받은 반응성 및 무반응성의 사전 대상체를 구별하도록 확립된 분류기를 통해 반응성으로 결정된 대상체에게 항-TNF 요법을 투여하는 단계
    를 포함하며,
    분류기는
    발현 수준이 임상 반응성 또는 무반응성과 유의하게 상관관계가 있는 하나 이상의 유전자; 및
    하나 이상의 유전자의 발현된 서열에서의 하나 이상의 단일 뉴클레오타이드 다형성(SNP)의 존재; 또는
    반응성 및 무반응성의 사전 대상체의 적어도 하나의 임상 특징
    중 적어도 하나
    를 평가함으로써 개발되는 방법.
  44. 대상체에게 항-TNF 요법의 임의의 투여 전에, 상기 항-TNF 요법에 대한 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로, 자가면역 질환을 겪고 있는 상기 대상체를 분류하는 방법으로서,
    (a) 컴퓨팅 장치의 프로세서에 의해, 하기로 이루어진 군에서 선택되는 하나 이상의 유전자 각각의 대상체에 대한 발현 수준에 상응하는 데이터를 수신하는 단계:
    Figure pct00029
    ; 및
    (b) 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하는 단계
    를 포함하는 방법.
  45. 제44항에 있어서,
    (c) 대상체가 단계 (b)에서 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 처방 및/또는 투여하거나; 또는 대상체가 단계 (b)에서 항-TNF 요법에 대한 반응성으로 분류되는 경우, 대상체에게 항-TNF 요법을 투여하는 단계
    를 추가로 포함하는 방법.
  46. 제44항 또는 제45항에 있어서, 단계 (a)에서의 프로세서는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 수신하는 방법:
    (i) 대상체의 하나 이상의 임상 특징;
    (ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
  47. 제44항 내지 제46항 중 어느 한 항에 있어서, 단계 (a)에서의 프로세서는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 수신하는 방법.
  48. 제44항 내지 제47항 중 어느 한 항에 있어서, 단계 (a)에서의 프로세서는 표 5에 열거된 하나 이상의 SNP에 상응하는 데이터를 수신하는 방법.
  49. 제44항 내지 제48항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염으로 이루어진 군에서 선택되는 구성원인 방법.
  50. 제44항 내지 제49항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염인 방법.
  51. 제44항 내지 제50항 중 어느 한 항에 있어서, 항-TNF 요법에 대한 대안은 리툭시맙, 사릴루맙, 토파시티닙 시트레이트, 레푸노미드, 베돌리주맙, 토실리주맙, 아나킨라, 및 아바타셉트로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 방법.
  52. 제44항 내지 제50항 중 어느 한 항에 있어서, 항-TNF 요법은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 및 전술한 것 중 어느 것의 바이오시밀러로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 방법.
  53. 제44항 내지 제52항 중 어느 한 항에 있어서, 항-TNF 요법에 대한 대안은 인플릭시맙, 아달리무맙, 에타네르셉트, 시르톨리주맙 페골, 골릴루마, 및 전술한 것 중 어느 것의 임의의 바이오시밀러로 이루어진 군의 임의의 구성원을 포함하지 않는 방법.
  54. 제44항 내지 제53항 중 어느 한 항에 있어서, 단계 (b)는 기계 학습 모델을 사용하여 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  55. 제54항에 있어서, 기계 학습 모델은 랜덤 포레스트 모델인 방법.
  56. 제44항 내지 제55항 중 어느 한 항에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  57. 제44항 내지 제55항 중 어느 한 항에 있어서, 단계 (b)는 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  58. 제44항 내지 제55항 중 어느 한 항에 있어서, 단계 (b)는 임상 공변량 분류기(CC)를 사용하지 않고, 그리고 조합된 게놈-임상 분류기(GCC)를 사용하지 않고, 상기 분류를 자동으로 결정하는 것을 포함하는 방법.
  59. 대상체에게 항-TNF 요법의 임의의 투여 전에, 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로, 자가면역 질환을 겪고 있는 상기 대상체를 분류하는 방법으로서,
    (a) 컴퓨팅 장치의 프로세서에 의해, 자가면역 질환을 겪고 있는 대상체의 하나 이상의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 단계로서, 상기 하나 이상의 유전자는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 하나의 구성원을 포함하는 단계;
    (b) 프로세서에 의해, 단계 (a)에서 수신된 데이터를 사용하여, 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로, 대상체의 분류를 자동으로 결정하는 단계
    를 포함하는 방법.
  60. 제59항에 있어서,
    (c) 대상체가 단계 (b)에서 항-TNF 요법에 대해 무반응성으로 분류되는 경우, 자가면역 질환의 치료를 위해 대상체에게 항-TNF 요법에 대한 대안을 처방 및/또는 투여하거나; 또는 대상체가 단계 (b)에서 항-TNF 요법에 대해 반응성으로 분류되는 경우, 대상체에게 항-TNF 요법을 투여하는 단계
    를 추가로 포함하는 방법.
  61. 제59항 또는 제60항에 있어서, 자가면역 질환은 류마티스성 관절염인 방법.
  62. 제59항 내지 제61항 중 어느 한 항에 있어서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 2개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 것을 포함하는 방법.
  63. 제59항 내지 제61항 중 어느 한 항에 있어서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 3개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 것을 포함하는 방법.
  64. 제59항 내지 제61항 중 어느 한 항에 있어서, 단계 (a)는 CORO2B, STOML2, CHMP7, SPINT2, CYSLTR2, SSNA1, IMPDH2, GOLGA1, SUOX, ARPC1A, 및 KLHDC3으로 이루어진 군에서 선택되는 적어도 5개의 유전자 각각의 발현 수준에 상응하는 데이터를 수신하는 것을 포함하는 방법.
  65. 제59항 내지 제64항 중 어느 한 항에 있어서, 단계 (a)에서의 프로세서는 하기와 같은 (i) 및 (ii) 중 적어도 하나에 상응하는 데이터를 추가로 수신하는 방법:
    (i) 대상체의 하나 이상의 임상 특징;
    (ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
  66. 제59항 내지 제65항 중 어느 한 항에 있어서, 단계 (a)에서의 프로세서는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 수신하는 방법.
  67. 제59항 내지 제66항 중 어느 한 항에 있어서, 단계 (a)에서의 프로세서는 표 5에 열거된 하나 이상의 SNP에 상응하는 데이터를 수신하는 방법.
  68. 대상체에게 항-TNF 요법의 임의의 투여 전에, 상기 항-TNF 요법에 대해 반응성일 가능성이 있거나 무반응성일 가능성이 있는 것으로, 자가면역 질환을 겪고 있는 상기 대상체를 분류하기 위한 시스템으로서,
    프로세서; 및
    그 위에 명령(instruction)을 갖는 메모리
    를 포함하고, 프로세서에 의해 실행시, 명령은 프로세서가
    (a) 데이터의 세트를 수신하게 하고, 상기 데이터의 세트는 하기로 이루어진 군에서 선택되는 하나 이상의 유전자 각각의 대상체에 대한 발현 수준을 포함하며:
    Figure pct00030
    ;
    (b) 데이터의 세트를 사용하여, 항-TNF 요법에 대해 반응성 또는 무반응성으로 대상체의 분류를 자동으로 결정하게 하는 시스템.
  69. 제68항에 있어서, 데이터의 세트는 하기와 같은 (i) 및(ii) 중 적어도 하나에 상응하는 데이터를 추가로 포함하는 시스템:
    (i) 대상체의 하나 이상의 임상 특징;
    (ii) 대상체에 대한 하나 이상의 단일 뉴클레오타이드 다형성(SNP).
  70. 제69항에 있어서, 데이터의 세트는 체질량 지수(BMI), 성별, 연령, 인종, 이전 요법 치료, 질환 기간, C-반응성 단백질(CRP) 수준, 항-사이클릭 시트룰린화된 펩타이드의 존재, 류마티스성 인자의 존재, 환자 전반적 평가, 및 치료 반응률(예컨대, ACR20, ACR50, ACR70)로 이루어진 군에서 선택되는 대상체의 하나 이상의 임상 특징에 상응하는 데이터를 포함하는 시스템.
  71. 제69항 또는 제70항에 있어서, 데이터의 세트는 표 5에 열거된 하나 이상의 SNP를 포함하는 시스템.
  72. 제69항 내지 제71항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염, 건선 관절염, 강직성 척추염, 크론병, 궤양성 대장염, 만성 건선, 화농성 한선염, 및 소아 특발성 관절염으로 이루어진 군에서 선택되는 구성원인 시스템.
  73. 제69항 내지 제71항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염 또는 궤양성 대장염인 시스템.
  74. 제69항 내지 제71항 중 어느 한 항에 있어서, 자가면역 질환은 류마티스성 관절염인 시스템.
KR1020227002006A 2019-06-27 2020-06-26 환자를 계층화하기 위한 분류기의 개발 KR20220044720A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962867853P 2019-06-27 2019-06-27
US62/867,853 2019-06-27
US201962882402P 2019-08-02 2019-08-02
US62/882,402 2019-08-02
US202062965486P 2020-01-24 2020-01-24
US62/965,486 2020-01-24
PCT/US2020/039991 WO2020264426A1 (en) 2019-06-27 2020-06-26 Developing classifiers for stratifying patients

Publications (1)

Publication Number Publication Date
KR20220044720A true KR20220044720A (ko) 2022-04-11

Family

ID=74061318

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227002006A KR20220044720A (ko) 2019-06-27 2020-06-26 환자를 계층화하기 위한 분류기의 개발

Country Status (11)

Country Link
US (4) US11195595B2 (ko)
EP (1) EP3990656A4 (ko)
JP (1) JP2022541125A (ko)
KR (1) KR20220044720A (ko)
CN (1) CN114402084A (ko)
AU (1) AU2020308906A1 (ko)
CA (1) CA3145237A1 (ko)
GB (1) GB2603294A (ko)
IL (1) IL289304A (ko)
MX (1) MX2022000128A (ko)
WO (1) WO2020264426A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7496324B2 (ja) 2018-03-16 2024-06-06 サイファー メディシン コーポレイション 抗tnf療法に対する応答性を予測するための方法及びシステム
WO2020264426A1 (en) 2019-06-27 2020-12-30 Scipher Medicine Corporation Developing classifiers for stratifying patients
MX2023002446A (es) * 2020-09-01 2023-05-12 Scipher Medicine Corp Metodos y sistemas de prediccion de la respuesta a las terapias anti-tnf.
US11430575B2 (en) * 2020-11-13 2022-08-30 Specialty Diagnostic (SDI) Laboratories, Inc. Systems and methods for a data driven disease test result prediction
KR20240042361A (ko) * 2021-03-19 2024-04-02 사이퍼 메디슨 코퍼레이션 환자의 분류 및 치료 방법
WO2022240875A1 (en) 2021-05-13 2022-11-17 Scipher Medicine Corporation Assessing responsiveness to therapy
US20220399092A1 (en) * 2021-06-10 2022-12-15 Rajant Health Inc. Ai-enabled health platform
MX2023015447A (es) * 2021-06-22 2024-05-09 Scipher Medicine Corp Métodos y sistemas para la supervisión de terapias y el diseño de ensayos.
WO2023150731A2 (en) * 2022-02-04 2023-08-10 Scipher Medicine Corporation Systems and methods for predicting response to anti-tnf therapies
WO2024081737A1 (en) * 2022-10-12 2024-04-18 Exagen Inc. Biomarker selection for machine learning enabled prediction of treatment response
CN116312796B (zh) * 2022-12-27 2023-11-14 江苏先声医学诊断有限公司 一种基于期望最大化算法的宏基因组丰度估计方法及系统

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040120952A1 (en) 2000-08-07 2004-06-24 Centocor, Inc Anti-TNF antibodies and peptides of human tumor necrosis factor
CA2624359A1 (en) 2005-09-27 2007-04-05 Source Mdx Gene expression profiling for identification monitoring and treatment of rheumatoid arthritis
US7919264B2 (en) 2005-11-01 2011-04-05 Abbott Biotechnology Ltd. Methods and compositions for determining the efficacy of a treatment for ankylosing spondylitis using biomarkers
EP2008100A4 (en) * 2006-04-18 2009-12-16 Univ Leland Stanford Junior ESTABLISHING ANTIBODY PROFILES FOR DETERMINING PATIENT SENSITIVITY TO TREATMENT
EP2679996A1 (en) 2007-05-31 2014-01-01 AbbVie Inc. Biomarkers predictive of the responsiveness to TNF-alfa inhibitors in autoimmune disorders
JP5719591B2 (ja) * 2007-06-08 2015-05-20 バイオジェン アイデック エムエー インコーポレイティドBiogen Idec Inc. 抗tnf応答性または非応答性を予測するためのバイオマーカー
US7863021B2 (en) 2007-09-05 2011-01-04 Celera Corporation Genetic polymorphisms associated with rheumatoid arthritis, methods of detection and uses thereof
WO2009102957A2 (en) 2008-02-14 2009-08-20 The Johns Hopkins University Methods to connect gene set expression profiles to drug sensitivity
WO2009117791A2 (en) 2008-03-28 2009-10-01 Katholieke Universiteit Leuven Mucosal gene signatures
ES2445892T3 (es) 2008-08-25 2014-03-05 Janssen Biotech, Inc. Biomarcadores para el tratamiento anti-TNF en colitis ulcerosa y trastornos relacionados
US20110191087A1 (en) 2008-09-03 2011-08-04 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Computer implemented model of biological networks
CA2737485A1 (en) 2008-10-10 2010-04-15 Mount Sinai Hospital Methods for classifying samples based on network modularity
WO2011028945A1 (en) 2009-09-03 2011-03-10 Genentech, Inc. Methods for treating, diagnosing, and monitoring rheumatoid arthritis
WO2011047358A1 (en) 2009-10-15 2011-04-21 Crescendo Bioscience Biomarkers and methods for measuring and monitoring inflammatory disease activity
US10192641B2 (en) 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
KR102136041B1 (ko) 2010-04-29 2020-07-20 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)
WO2012066536A2 (en) 2010-11-16 2012-05-24 Prediguard Transcriptome signatures discriminate etanercept-treated rheumatoid arthritis (ra) patients according to their response or refractory status
US20130040835A1 (en) 2011-05-05 2013-02-14 Exagen Diagnostics, Inc Genes predictive of anti-TNF response in inflammatory diseases
CA2839792A1 (en) * 2011-05-10 2012-11-15 Nestec S.A. Methods of disease activity profiling for personalized therapy management
EP2900695B1 (en) 2012-09-27 2018-01-17 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Mesothelin antibodies and methods for eliciting potent antitumor activity
HU230680B1 (hu) 2012-10-19 2017-08-28 Egis Gyogyszergyar Nyilvanosan Muekoedoe Reszvenytarsasag Diagnosztikai eljárás
ES2647154T3 (es) 2012-11-05 2017-12-19 Novigenix Sa Combinaciones de biomarcadores para tumores colorrectales
EP2922861A4 (en) 2012-11-26 2016-09-14 Caris Life Sciences Switzerland Holdings Gmbh BIOMARKER COMPOSITIONS AND METHODS
WO2014135668A1 (de) 2013-03-08 2014-09-12 Universität Leipzig Verfahren und kit zur zytokinanalyse aus einer menschlichen vollblutprobe
WO2014186761A2 (en) 2013-05-17 2014-11-20 The Board Of Trustes Of The Leland Stanford Junior University Methods for determining responsiveness to an anti-cd47 agent
WO2015006213A1 (en) 2013-07-08 2015-01-15 Northeastern University Methods for identifying complex disease subtypes
EP3042202A1 (en) 2013-09-03 2016-07-13 Graham, L. Douglas Treatment methods for rheumatoid arthritis
WO2015084461A2 (en) 2013-09-23 2015-06-11 Northeastern University System and methods for disease module detection
CA2943821A1 (en) 2014-04-02 2015-10-08 Crescendo Bioscience Biomarkers and methods for measuring and monitoring juvenile idiopathic arthritis activity
US9753041B2 (en) 2014-04-21 2017-09-05 Univeristy Of South Florida Salivary inflammatory biomarkers associated with glycemic control and oral health
CA2964857A1 (en) 2014-10-20 2016-04-28 Nestec S.A. Methods for prediction of anti-tnf alpha drug levels and autoantibody formation
EP3227685A1 (en) 2014-12-02 2017-10-11 Nestec S.A. Methods for establishing a vedolizumab dosing regimen to treat patients with irritable bowel disease
US10385398B2 (en) 2015-08-21 2019-08-20 The Children's Hospital Of Philadelphia Methods for use in combination for the treatment and diagnosis of autoimmune diseases
US10018637B2 (en) 2015-10-06 2018-07-10 Celgene International Ii Sarl Methods for treating inflammatory and other diseases and the use of biomarkers as predictors of clinical sensitivity to treatment with apremilast
EP3165928B1 (en) 2015-11-06 2019-01-09 Promise Advanced Proteomics A method for quantifying anti-tnf antibodies
US20190080051A1 (en) 2015-11-11 2019-03-14 Northeastern University Methods And Systems For Profiling Personalized Biomarker Expression Perturbations
US20170145501A1 (en) 2015-11-20 2017-05-25 Lasse Folkersen Apparatus and methods of using of biomarkers for predicting tnf-inhibitor response
WO2017091777A1 (en) 2015-11-24 2017-06-01 Vijay Krishnan Novel healthcare delivery, treatment, and payment model for specialty drugs
GB201521357D0 (en) 2015-12-03 2016-01-20 Univ Liverpool Methods for predicting response to anti-TNF therapy
JP6572120B2 (ja) 2015-12-14 2019-09-04 浜松ホトニクス株式会社 光ビーム照射装置
WO2017223116A2 (en) 2016-06-20 2017-12-28 Healthtell Inc. Methods for differential diagnosis of autoimmune diseases
EP3654993A4 (en) 2017-07-17 2021-08-25 The Broad Institute, Inc. HUMAN COLON CELL ATLAS IN GOOD HEALTH WITH HEMORRHAGIC RECTO-COLITIS
US20200165677A1 (en) 2017-07-18 2020-05-28 Thaddeus Stappenbeck Methods and uses of inflammatory bowel disease biomarkers
US20190287644A1 (en) 2018-02-15 2019-09-19 Northeastern University Correlation Method To Identify Relevant Genes For Personalized Treatment Of Complex Disease
JP7496324B2 (ja) 2018-03-16 2024-06-06 サイファー メディシン コーポレイション 抗tnf療法に対する応答性を予測するための方法及びシステム
CA3133639A1 (en) 2019-03-22 2020-10-01 Inflammatix, Inc. Systems and methods for deriving and optimizing classifiers from multiple datasets
CN114026644A (zh) 2019-03-28 2022-02-08 相位基因组学公司 通过测序进行核型分析的系统和方法
WO2020264426A1 (en) 2019-06-27 2020-12-30 Scipher Medicine Corporation Developing classifiers for stratifying patients
MX2023002446A (es) 2020-09-01 2023-05-12 Scipher Medicine Corp Metodos y sistemas de prediccion de la respuesta a las terapias anti-tnf.
KR20240042361A (ko) 2021-03-19 2024-04-02 사이퍼 메디슨 코퍼레이션 환자의 분류 및 치료 방법
WO2023150731A2 (en) 2022-02-04 2023-08-10 Scipher Medicine Corporation Systems and methods for predicting response to anti-tnf therapies

Also Published As

Publication number Publication date
IL289304A (en) 2022-02-01
GB2603294A (en) 2022-08-03
CN114402084A (zh) 2022-04-26
AU2020308906A1 (en) 2022-02-03
JP2022541125A (ja) 2022-09-22
US20220375541A1 (en) 2022-11-24
US20210280271A1 (en) 2021-09-09
US11783913B2 (en) 2023-10-10
US12062415B2 (en) 2024-08-13
WO2020264426A1 (en) 2020-12-30
EP3990656A1 (en) 2022-05-04
MX2022000128A (es) 2022-04-27
US11456056B2 (en) 2022-09-27
GB202119148D0 (en) 2022-02-16
US11195595B2 (en) 2021-12-07
US20230386606A1 (en) 2023-11-30
US20220101946A1 (en) 2022-03-31
CA3145237A1 (en) 2020-12-30
EP3990656A4 (en) 2023-12-06

Similar Documents

Publication Publication Date Title
US11456056B2 (en) Methods of treating a subject suffering from rheumatoid arthritis based in part on a trained machine learning classifier
US20220154284A1 (en) Determination of cytotoxic gene signature and associated systems and methods for response prediction and treatment
JP7496324B2 (ja) 抗tnf療法に対する応答性を予測するための方法及びシステム
US20230282367A1 (en) Methods and systems for predicting response to anti-tnf therapies
US20240076368A1 (en) Methods of classifying and treating patients
EP4359567A1 (en) Methods and systems for therapy monitoring and trial design
KR20240044417A (ko) 개인맞춤형 요법을 위한 방법 및 시스템
US20240355416A1 (en) Methods of treating a subject suffering from rheumatoid arthritis with anti-tnf therapy based in part on a trained machine learning classifier
CA3212448A1 (en) Methods of classifying and treating patients
CN117916392A (zh) 用于疗法监测和试验设计的方法和系统
CN117813402A (zh) 分类和治疗患者的方法