KR20230037671A - 자간전증에 특이적인 순환 rna 시그니처 - Google Patents

자간전증에 특이적인 순환 rna 시그니처 Download PDF

Info

Publication number
KR20230037671A
KR20230037671A KR1020237007005A KR20237007005A KR20230037671A KR 20230037671 A KR20230037671 A KR 20230037671A KR 1020237007005 A KR1020237007005 A KR 1020237007005A KR 20237007005 A KR20237007005 A KR 20237007005A KR 20230037671 A KR20230037671 A KR 20230037671A
Authority
KR
South Korea
Prior art keywords
rna
preeclampsia
biological sample
arhgef25
lep
Prior art date
Application number
KR1020237007005A
Other languages
English (en)
Other versions
KR102605749B1 (ko
Inventor
사라 이. 먼첼
피오나 케이퍼
사라 키닝스
수잔느 로백
카를로 랜디즈-힌클리프
Original Assignee
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20230037671A publication Critical patent/KR20230037671A/ko
Application granted granted Critical
Publication of KR102605749B1 publication Critical patent/KR102605749B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/36Gynecology or obstetrics
    • G01N2800/368Pregnancy complicated by disease or abnormalities of pregnancy, e.g. preeclampsia, preterm labour
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 임신 여성에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정에 사용하기 위한 방법 및 물질을 포함하며, 상기 방법은 임신 여성으로부터 수득되는 생물시료 내에서 복수의 순환 RNA(C-RNA) 분자를 식별하는 단계를 포함한다.

Description

자간전증에 특이적인 순환 RNA 시그니처 {CIRCULATING RNA SIGNATURES SPECIFIC TO PREECLAMSIA}
계속 출원 데이터
본 출원은 2018년 5월 25일자 출원된 미국 가출원 제62/676,436호 및 2019년 5월 15일자 출원된 미국 가출원 제62/848,219호의 이익을 주장하며, 이들 기초출원의 각각은 그들의 전문이 본 명세서에 참조로 포함된다.
기술분야
본 발명은 일반적으로 임신 합병증 자간전증에 대한 검출 및 조기 위험 평가에 사용하기 위한 방법 및 물질에 관한 것이다
자간전증은 오직 임신 중에만 발생하여, 전체 임신의 5% 내지 8%에 영향을 미치는 질환이다. 그것은 모체 사망의 10% 내지 15% 및 태아 사망의 40%의 직접적인 원인이다. 자간전증의 3가지 주요 증상은 임신 20주 후에 발생하는 고혈압, 수족 부종, 및 소변 중 과잉의 단백질(단백뇨)을 포함할 수 있다. 자간전증의 다른 징후 및 증상은 중증 두통, 시력 변화(일시적 시력 상실, 흐린 시력 또는 광 민감성 포함), 구역 또는 구토, 소변 배출량 감소, 혈소판 수준 감소(저혈소판증), 간 기능 부전 및 폐 내의 액체에 의해 야기되는 호흡 곤란을 포함할 수 있다.
자간전증이 더욱 중증이고, 그것이 임신 중에 더욱 조기에 발생할수록, 엄마와 아기에 대한 위험이 더 크다. 자간전증은 진통 유도 및 분만 또는 제왕절개 분만에 의한 분만을 필요로 할 수 있다. 자간전증은 치료하지 않으면, 엄마와 아기 둘 모두에 대하여 심각한, 심지어는 치사의 합병증을 야기할 수 있다. 자간전증의 합병증은 태아 성장 제한, 낮은 출생 체중, 조기 출생, 태반 조기박리, HELLP 증후군(용혈, 간 효소 상승 및 낮은 혈소판 계수 증후군), 자간증(발작을 야기하는 중증 형태의 자간전증), 신장, 간, 폐, 심장 또는 눈 손상을 포함하는 기관 손상, 뇌졸중 또는 기타 뇌 손상을 포함한다. 예를 들어, 월드와이드 웹에서 mayoclinic.org/diseases-conditions/Preeclampsia/symptoms-causes/syc-20355745에서 이용 가능한 문헌["Preeclampsia - Symptoms and causes - Mayo Clinic," April 3, 2018]을 참조한다.
조기의 검출 및 치료와 함께, 자간전증이 조기에 검출되고, 정기적인 출생전 관리로 처치되면, 대부분의 여성은 건강한 아기를 분만할 수 있다. 다양한 단백질 바이오마커가 증상전 단계에서 모체 혈청의 수준의 변화를 나타내지만, 이들 바이오마커는 개별 환자에서 식별력 및 예측력이 결여된다(문헌[Karumanchi and Granger, 2016, Hypertension; 67(2): 238-242]). 따라서, 자간전증의 조기 검출을 위한 바이오마커의 식별은 자간전증의 조기 진단 및 치료에 중요하다.
본 발명은 임신 여성에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정 방법을 포함하며, 상기 방법은,
임신 여성으로부터 수득되는 생물시료에서 복수의 순환 RNA(C-RNA) 분자를 식별하는 단계를 포함하며;
하기로부터 선택되는 복수의 C-RNA 분자는 임신 여성에서 자간전증 및/또는 자간전증에 대한 위험 증가를 나타낸다:
(a) ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17, ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 최대 75개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(b) TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상 또는 27개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(c) CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 최대 122개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(d) VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2 및 HTRA4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상, 임의의 27개 이상, 임의의 28개 이상, 임의의 29개 이상 또는 30개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(e) ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상 또는 26개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(f) ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상 또는 22개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(g) CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상 또는 11개 모두(일부 실시형태에서, ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2 및 VSIG4의 7개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL 및 VSIG4의 10개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP 및 SKIL의 6개; 또는 ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2 및 SKIL의 8개 포함)로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자; 또는
(h) LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMA3G, TIPARP, LRRC26, PHEX, LILRA4 및 PER1 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상 또는 24개 모두로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자.
본 발명은 임신 여성에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정 방법을 포함하며, 상기 방법은,
임신 여성으로부터 생물시료를 수득하는 단계;
생물시료로부터 순환 RNA(C-RNA) 분자의 집단을 정제하는 단계;
정제된 C-RNA 분자의 집단 내의 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계를 포함하며;
하기로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열은 임신 여성에서 자간전증 및/또는 자간전증에 대한 위험 증가를 나타낸다:
(a) ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17, ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 50개 이상, 임의의 70개 이상 또는 75개 모두; 또는
(b) TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상 또는 27개 모두; 또는
(c) CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 50개 이상, 임의의 75개 이상, 임의의 100개 이상 또는 122개 모두; 또는
(d) VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2 및 HTRA4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상, 임의의 27개 이상, 임의의 28개 이상, 임의의 29개 이상 또는 30개 모두; 또는
(e) ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상 또는 26개 모두; 또는
(f) ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상 또는 22개 모두; 또는
(g) CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상 또는 11개 모두(일부 실시형태에서, ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2 및 VSIG4의 7개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL 및 VSIG4의 10개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP 및 SKIL의 6개; 또는 ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2 및 SKIL의 8개 포함); 또는
(h) LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMA3G, TIPARP, LRRC26, PHEX, LILRA4 및 PER1 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상 또는 24개 모두.
일부 양태에서, 생물시료 내의 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계는 혼성화, 역전사효소 PCR, 마이크로어레이 칩 분석 또는 시퀀싱, 즉, 서열결정(sequencing)을 포함한다.
일부 양태에서, 생물시료 내의 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계는 예를 들어, 클론으로 증폭되는 분자의 대량 병렬 서열결정 및/또는 RNA 서열결정을 포함하는 서열결정을 포함한다.
일부 양태에서, 방법은 순환 RNA(C-RNA) 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계 이전에 생물시료로부터 온전한 세포를 제거하는 단계; 생물시료를 데옥시뉴클레아제(DNase)로 처리하여 세포 유리 DNA(cell free DNA: cfDNA)를 제거하는 단계; 생물시료 내의 C-RNA 분자로부터 상보성 DNA(cDNA)를 합성하는 단계; 및/또는 cDNA 서열을 단백질을 인코딩하는 DNA 서열에 대하여 엑솜 농축에 의해 농축시키는 단계를 추가로 포함한다.
본 발명은 임신 여성에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정 방법을 포함하며, 상기 방법은,
임신 여성으로부터 생물학적 시료를 수득하는 단계;
생물시료로부터 온전한 세포를 제거하는 단계;
생물시료를 데옥시뉴클레아제(DNase)로 처리하여 세포 유리 DNA(cfDNA)를 제거하는 단계;
생물시료 내의 RNA 분자로부터 상보성 DNA(cDNA)를 합성하는 단계;
cDNA 서열을 단백질을 인코딩하는 DNA 서열에 대하여 농축하는 단계(엑솜 농축);
생성되는 농축된 cDNA 서열을 서열결정하는 단계; 및
농축된 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계를 포함하며;
하기로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열은 임신 여성에서 자간전증 및/또는 자간전증에 대한 위험 증가를 나타낸다:
(a) ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17, ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 최대 75개 모두; 또는
(b) TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상 또는 27개 모두; 또는
(c) CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 최대 122개 모두; 또는
(d) VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2 및 HTRA4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상, 임의의 27개 이상, 임의의 28개 이상, 임의의 29개 이상 또는 30개 모두; 또는
(e) ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상 또는 26개 모두; 또는
(f) ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상 또는 22개 모두; 또는
(g) CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES 중 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상 또는 11개 모두(일부 실시형태에서, ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2 및 VSIG4의 7개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL 및 VSIG4의 10개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP 및 SKIL의 6개; 또는 ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2 및 SKIL의 8개 포함); 또는
(h) LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMA3G, TIPARP, LRRC26, PHEX, LILRA4 및 PER1 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상 또는 24개 모두.
본 발명은 자간전증의 위험 증가와 연관된 순환 RNA 시그니처(circulating RNA signature)의 식별 방법을 포함하며, 상기 방법은 임신 여성으로부터 생물학적 시료를 수득하는 단계; 생물시료로부터 온전한 세포를 제거하는 단계; 생물시료를 데옥시뉴클레아제(DNase)로 처리하여, 세포 유리 DNA(cfDNA)를 제거하는 단계; 생물시료 내의 RNA 분자로부터 상보성 DNA(cDNA)를 합성하는 단계; cDNA 서열을 단백질을 인코딩하는 DNA 서열에 대하여 농축하는 단계(엑솜 농축); 생성되는 농축된 cDNA 서열을 서열결정하는 단계; 및 농축된 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계를 포함한다.
본 발명은,
임신 여성으로부터 생물학적 시료를 수득하는 단계;
생물시료로부터 온전한 세포를 제거하는 단계;
생물시료를 데옥시뉴클레아제(DNase)로 처리하여, 세포 유리 DNA(cfDNA)를 제거하는 단계;
생물시료 내의 RNA 분자로부터 상보성 DNA(cDNA)를 합성하는 단계;
cDNA 서열을 단백질을 인코딩하는 DNA 서열에 대하여 농축하는 단계(엑솜 농축);
생성되는 농축된 cDNA 서열을 서열결정하는 단계; 및
농축된 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계를 포함하는 방법을 포함하며;
단백질 코딩 서열은 하기로부터 선택되는 단백질의 적어도 일부분을 포함한다:
(a) ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17, ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개, 최대 75개 모두; 또는
(b) TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상, 또는 27개 모두; 또는
(c) CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 최대 122개 모두; 또는
(d) VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2 및 HTRA4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상, 임의의 27개 이상, 임의의 28개 이상, 임의의 29개 이상 또는 30개 모두; 또는
(e) ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상 또는 26개 모두; 또는
(f) ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상 또는 22개 모두; 또는
(g) CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상 또는 11개 모두(일부 실시형태에서, ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2 및 VSIG4의 7개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL 및 VSIG4의 10개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP 및 SKIL의 6개; 또는 ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2 및 SKIL의 8개 포함); 또는
(h) LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMA3G, TIPARP, LRRC26, PHEX, LILRA4 및 PER1 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상 또는 24개 모두.
일부 양태에서, 생물시료는 혈장을 포함한다.
일부 양태에서, 생물시료는 임신 16주 미만 또는 임신 20주 미만에 임신 여성으로부터 수득된다.
일부 양태에서, 생물시료는 임신 20주 초과에 임신 여성으로부터 수득된다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17, ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 50개 이상, 임의의 70개 이상, 최대 75개 모두의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상 또는 27개 모두의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5 중 복수의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2 및 HTRA4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상, 임의의 26개 이상, 임의의 27개 이상, 임의의 28개 이상, 임의의 29개 이상 또는 30개 모두의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상, 임의의 24개 이상, 임의의 25개 이상 또는 26개 모두의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상 또는 22개 모두의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 일부 실시형태에서, ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2 및 VSIG4의 7개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL 및 VSIG4의 8개; ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL 및 VSIG4의 10개; ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP 및 SKIL의 6개; 또는 ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2 및 SKIL의 8개를 포함하여, CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상 또는 11개 모두의 적어도 일부분을 인코딩한다.
본 발명은 자간전증의 위험 증가에 대한 순환 RNA(C-RNA) 시그니처를 포함하며, C-RNA 시그니처는 LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMA3G, TIPARP, LRRC26, PHEX, LILRA4 및 PER1 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 임의의 7개 이상, 임의의 8개 이상, 임의의 9개 이상, 임의의 10개 이상, 임의의 11개 이상, 임의의 12개 이상, 임의의 13개 이상, 임의의 14개 이상, 임의의 15개 이상, 임의의 16개 이상, 임의의 17개 이상, 임의의 18개 이상, 임의의 19개 이상, 임의의 20개 이상, 임의의 21개 이상, 임의의 22개 이상, 임의의 23개 이상 또는 24개 모두의 적어도 일부분을 인코딩한다.
본 발명은 본 명세서에 기재된 바와 같은 C-RNA 시그니처에 결합하고/하거나 이를 식별할 수 있는 복수의 작용제를 포함하는 고체 지지체 어레이를 포함한다.
본 발명은 본 명세서에 기재된 바와 같은 C-RNA 시그니처에 결합하고/하거나 이를 식별할 수 있는 복수의 프로브를 포함하는 키트를 포함한다.
본 발명은 본 명세서에 기재된 바와 같은 C-RNA 시그니처를 선택적으로 증폭시키기 위한 복수의 프라이머를 포함하는 키트를 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "핵산"은 해당 분야에서의 그의 용도와 일치하는 것으로 의도되고, 자연 발생 핵산 또는 그의 기능적 유사체를 포함한다. 특히 유용한 기능적 유사체는 핵산에 서열 특이적 방식으로 혼성화할 수 있거나 또는 특정 뉴클레오타이드 서열의 복제를 위한 주형으로서 사용될 수 있다. 자연 발생 핵산은 일반적으로 포스포디에스테르 결합을 함유하는 백본을 갖는다. 유사체 구조는 해당 분야에 공지된 다양한 것들 중 임의의 것을 비롯한 교대 백본 연결을 가질 수 있다. 자연 발생 핵산은 일반적으로 데옥시리보스 당(예를 들어, 데옥시리보핵산(DNA)에서 발견됨) 또는 리보스 당(예를 들어, 리보핵산(RNA)에서 발견됨)을 갖는다. 핵산은 해당 분야에 공지된 이러한 당 모이어티의 다양한 유사체 중 임의의 것을 함유할 수 있다. 핵산은 고유 또는 비-고유 염기를 포함할 수 있다. 이와 관련하여, 고유 데옥시리보핵산은 아데닌, 티민, 시토신 또는 구아닌으로 이루어진 군으로부터 선택되는 하나 이상의 염기를 가질 수 있고, 리보핵산은 우라실, 아데닌, 시토신 또는 구아닌으로 이루어진 군으로부터 선택되는 하나 이상의 염기를 가질 수 있다. 핵산에 포함될 수 있는 유용한 비-고유 염기는 해당 분야에 공지되어 있다. 용어 "주형" 및 "표적"은 핵산에 대한 언급에서 사용되는 경우 본 명세서에 언급된 방법 또는 조성물과 관련하여 핵산에 대한 의미론적인 식별자로서 의도되고, 달리 명확하게 지시하는 것을 넘어서 핵산의 구조 또는 기능을 필수적으로 제한하지 않는다.
본 명세서에 사용되는 바와 같이, "증폭시키다", "증폭시키는" 또는 "증폭 반응" 및 그들의 파생어는 일반적으로 핵산 분자의 적어도 일부가 적어도 하나의 추가의 핵산 분자로 복제되거나 또는 카피되는 임의의 작용 또는 과정을 지칭한다. 추가의 핵산 분자는 표적 핵산 분자의 적어도 일부 부분과 실질적으로 동일하거나 또는 실질적으로 상보성인 서열을 선택적으로 포함한다. 표적 핵산 분자는 단일-가닥 또는 이중-가닥일 수 있고, 추가의 핵산 분자는 독립적으로 단일-가닥 또는 이중-가닥일 수 있다. 증폭은 핵산 분자의 선형 또는 지수적 복제를 선택적으로 포함한다. 일부 실시형태에서, 이러한 증폭은 등온 조건을 사용하여 수행될 수 있고; 다른 실시형태에서, 이러한 증폭은 열순환을 포함할 수 있다. 일부 실시형태에서, 증폭은 단일 증폭 반응에서 복수의 표적 서열의 동시의 증폭을 포함하는 멀티플렉스 증폭이다. 일부 실시형태에서, "증폭"은 단독으로 또는 조합하여, DNA 및 RNA 기반 핵산의 적어도 일부 부분의 증폭을 포함한다. 증폭 반응은 당업자에게 공지된 증폭 과정 중 임의의 것을 포함할 수 있다. 일부 실시형태에서, 증폭 반응은 중합효소 연쇄 반응(PCR)을 포함한다.
본 명세서에 사용되는 바와 같이, "증폭 조건" 및 그의 파생어는 일반적으로 하나 이상의 핵산 서열을 증폭시키기에 적합한 조건을 지칭한다. 이러한 증폭은 선형이거나 또는 지수적일 수 있다. 일부 실시형태에서, 증폭 조건은 등온 조건을 포함할 수 있거나, 대안적으로 열순환 조건, 또는 등온 조건과 열순환 조건의 조합을 포함할 수 있다. 일부 실시형태에서, 하나 이상의 핵산 서열을 증폭시키기에 적합한 조건은 중합효소 연쇄 반응(PCR) 조건을 포함한다. 전형적으로, 증폭 조건은 핵산, 예컨대, 하나 이상의 표적 서열을 증폭시키거나, 하나 이상의 어댑터에 라이게이션된 증폭된 표적 서열, 예를 들어, 어댑터-라이게이션된 증폭된 표적 서열을 증폭시키기에 충분한 반응 혼합물을 지칭한다. 일반적으로, 증폭 조건은 증폭 또는 핵산 합성을 위한 촉매, 예를 들어, 중합효소; 증폭될 핵산에 대하여 어느 정도의 상보성을 보유하는 프라이머; 및 뉴클레오타이드, 예컨대, 핵산에 혼성화된 후 프라이머의 신장을 촉진시키기 위한 데옥시리보뉴클레오타이드 트리포스페이트(dNTP)를 포함한다. 증폭 조건은 핵산으로의 프라이머의 혼성화 또는 어닐링, 프라이머의 신장 및 신장된 프라이머가 증폭 중인 핵산 서열로부터 분리되는 변성 단계가 요구될 수 있다. 필수적이지는 않지만, 전형적으로, 증폭 조건은 열순환을 포함할 수 있고; 일부 실시형태에서, 증폭 조건은 어닐링, 신장 및 분리 단계가 반복되는 복수의 사이클을 포함한다. 전형적으로, 증폭 조건은 양이온, 예컨대, Mg++ 또는 Mn++를 포함하고, 다양한 이온 강도의 개질제를 또한 포함할 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "중합효소 연쇄 반응"("PCR")은 K. B. Mullis의 미국 특허 제4,683,195호 및 제4,683,202호의 방법을 지칭하는데, 이것은 클로닝 또는 정제 없이 게놈 DNA의 혼합물 중에서 관심 폴리뉴클레오타이드의 세그먼트의 농도를 증가시키는 방법을 기술한다. 관심 폴리뉴클레오타이드를 증폭시키는 이러한 과정은 매우 과량의 2가지 올리고뉴클레오타이드 프라이머를 요망되는 관심 폴리뉴클레오타이드를 함유하는 DNA 혼합물에 도입하는 단계에 이어서, DNA 중합효소의 존재 하에서의 일련의 열순환 단계로 이루어진다. 2가지 프라이머는 관심 이중 가닥 폴리뉴클레오타이드의 그들의 각각의 가닥에 상보성이다. 혼합물은 먼저 더 높은 온도에서 변성된 다음, 프라이머는 관심 분자의 폴리뉴클레오타이드 내의 상보성 서열에 어닐링된다. 어닐링 후, 프라이머는 중합효소를 사용하여 신장되어 새로운 상보성 가닥의 쌍을 형성한다. 변성, 프라이머 어닐링 및 중합효소 신장 단계를 수회 반복하여(열순환으로 지칭됨) 고농도의 요망되는 관심 폴리뉴클레오타이드의 증폭된 세그먼트를 수득할 수 있다. 요망되는 관심 폴리뉴클레오타이드(앰플리콘)의 증폭된 세그먼트의 길이는 서로에 대한 프라이머의 상대적인 위치에 의해 결정되고, 따라서 이러한 길이는 제어 가능한 파라미터이다. 이러한 과정의 반복으로 인해서, 이 방법은 "중합효소 연쇄 반응"(이하 "PCR")으로 지칭된다. 관심 폴리뉴클레오타이드의 요망되는 증폭된 세그먼트가 혼합물 중에서 우세한 핵산 서열(농도 면에서)이 되기 때문에, 그들은 "PCR 증폭된" 것으로 칭해진다. 상기에 논의된 방법에 대한 변형에서, 표적 핵산 분자를 복수의 상이한 프라이머 쌍, 일부 경우에, 관심 표적 핵산 분자당 하나 이상의 프라이머쌍을 사용하여 PCR 증폭시켜, 멀티플렉스 PCR 반응을 형성할 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "프라이머" 및 그의 파생어는 일반적으로 관심 표적 서열에 혼성화할 수 있는 임의의 폴리뉴클레오타이드를 지칭한다. 전형적으로, 프라이머는 뉴클레오타이드가 중합효소에 의해 중합될 수 있는 기질로서 기능하지만; 일부 실시형태에서, 프라이머는 합성된 핵산 가닥 내에 혼입되어, 또 다른 프라이머가 혼성화할 수 있는 부위를 제공하여, 합성된 핵산 분자에 상보성인 새로운 가닥의 합성을 프라이밍할 수 있다. 프라이머는 뉴클레오타이드 또는 그의 유사체의 임의의 조합을 포함할 수 있다. 일부 실시형태에서, 프라이머는 단일-가닥 올리고뉴클레오타이드 또는 폴리뉴클레오타이드이다. 용어 "폴리뉴클레오타이드" 및 "올리고뉴클레오타이드"는 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭하도록 본 명세서에서 상호 교환 가능하게 사용되고, 리보뉴클레오타이드, 데옥시리보뉴클레오타이드, 그의 유사체, 또는 그의 혼합물을 포함할 수 있다. 이 용어는 등가물로서, 뉴클레오타이드 유사체로부터 제조된 DNA 또는 RNA의 유사체를 포함하도록 이해되어야 하고, 단일 가닥(예컨대, 센스 또는 안티센스) 및 이중-가닥 폴리뉴클레오타이드에 적용 가능하도록 이해되어야 한다. 이 용어는 본 명세서에 사용되는 바와 같이 또한 예를 들어, 역전사효소의 작용에 의해 RNA 주형으로부터 생성된 DNA에 상보성이거나 또는 이를 카피하는, cDNA를 포함한다. 이 용어는 분자의 1차 구조 만을 지칭한다. 따라서, 이 용어는 삼중-, 이중- 및 단일-가닥 데옥시리보핵산("DNA"), 뿐만 아니라 삼중-, 이중- 및 단일-가닥 리보핵산("RNA")을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "라이브러리" 및 "서열결정 라이브러리"는 그들의 5' 말단에 공통 서열과, 그들의 3' 말단에 공통 서열을 공유하는 주형 분자의 집합물 또는 복수의 주형 분자를 지칭한다. 그들의 3' 및 5' 말단에 공지된 공통 서열을 함유하는 주형 분자의 집합물은 3' 및 5' 변형된 라이브러리로도 지칭될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "유동 셀"은 하나 이상의 유체 시약이 유동될 수 있는 고체 표면을 포함하는 챔버를 지칭한다. 본 개시내용의 방법에서 용이하게 사용될 수 있는 유동 셀 및 관련 유체 시스템 및 검출 플랫폼의 예는 예를 들어, 문헌[Bentley et al., Nature 456:53-59 (2008)], WO 04/018497호; US 7,057,026호; WO 91/06678호; WO 07/123744호; US 7,329,492호; US 7,211,414호; US 7,315,019호; US 7,405,281호 및 US 2008/0108082호에 기술되어 있다.
본 명세서에 사용되는 바와 같이, 핵산에 대한 언급에서 사용되는 경우 용어 "앰플리콘"은 핵산의 카피 생성물을 의미하고, 여기서 생성물은 핵산의 뉴클레오타이드 서열의 적어도 일부와 동일하거나 그에 상보성인 뉴클레오타이드 서열을 갖는다. 앰플리콘은 예를 들어, PCR, 회전환 증폭(RCA), 라이게이션 신장, 또는 라이게이션 연쇄 반응을 비롯한, 주형으로서 핵산 또는 그의 앰플리콘을 사용하는 임의의 다양한 증폭 방법에 의해 생성될 수 있다. 앰플리콘은 특정 뉴클레오타이드 서열의 단일의 카피(예를 들어, PCR 생성물) 또는 뉴클레오타이드 서열의 다수의 카피(예를 들어, RCA의 콘카타머 생성물(concatameric product))를 갖는 핵산 분자일 수 있다. 표적 핵산의 제1 앰플리콘은 전형적으로 상보성 카피이다. 후속 앰플리콘은 제1 앰플리콘의 생성 이후에, 표적 핵산으로부터 또는 제1 앰플리콘으로부터 생성된 카피이다. 후속 앰플리콘은 표적 핵산에 실질적으로 상보성이거나 표적 핵산에 실질적으로 동일한 서열을 가질 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "어레이"는 상대적인 위치에 따라 서로 구별될 수 있는 부위의 집단을 지칭한다. 어레이의 상이한 부위에 존재하는 상이한 분자는 그 어레이 내의 부위의 위치에 따라 서로 구별될 수 있다. 어레이의 개별 부위는 특정 유형의 하나 이상의 분자를 포함할 수 있다. 예를 들어, 부위는 특정 서열을 갖는 단일 표적 핵산 분자를 포함할 수 있거나, 부위는 동일한 서열(및/또는 그의 상보성 서열)을 갖는 몇몇 핵산 분자를 포함할 수 있다. 어레이의 부위는 동일한 기판 상에 위치된 상이한 특징부일 수 있다. 예시적인 특징부는 기판 내의 웰, 기판 내 또는 기판 상의 비드(또는 다른 입자), 기판으로부터의 돌출부, 기판 상의 릿지(ridge) 또는 기판 내의 채널을 비제한적으로 포함한다. 어레이의 부위는 각각 상이한 분자를 보유하는 개별 기판일 수 있다. 개별 기판에 부착되는 상이한 분자는, 기판이 회합된 표면 상의 기판의 위치에 따라 또는 액체 또는 젤 중의 기판의 위치에 따라 식별될 수 있다. 개별 기판이 표면 상에 위치된 예시적인 어레이는 비제한적으로 웰 내에 비드를 갖는 것을 포함한다.
용어 "차세대 서열결정(NGS)"은 본 명세서에서 클론으로 증폭된 분자의 및 단일의 핵산 분자의 대량 병렬 서열결정을 가능하게 하는 서열결정 방법을 지칭한다. NGS의 비제한적인 예는 가역성 염료 종결자를 사용한 합성에 의한 서열결정 및 라이게이션에 의한 서열결정을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "민감도"는 진양성의 수를 진양성과 위음성의 합으로 나눈 것과 같다.
본 명세서에 사용되는 바와 같이, 용어 "특이도"는 진음성의 수를 진음성과 위양성의 합으로 나눈 것과 같다.
용어 "농축한다"는 본 명세서에서 시료의 일부에 함유된 핵산을 증폭시키는 과정을 지칭한다. 농축은 특이적인 서열, 예를 들어, 다형성 서열을 표적화하는 특이적인 농축 및 시료의 DNA 단편의 전체 게놈을 증폭시키는 비-특이적인 농축을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "각각"은 물품의 집합물에 대한 언급에 사용되는 경우, 집합물 내의 개별 물품을 식별하도록 의도되지만, 문맥에서 명백하게 다르게 언급되지 않는 한, 반드시 집합물 내의 모든 물품을 지칭하는 것은 아니다.
본 명세서에 사용되는 바와 같이, 조성물, 용품, 핵산 또는 핵과 관련하여 "제공하는"은 조성물, 용품, 핵산 또는 핵을 제조하거나, 조성물, 용품, 핵산 또는 핵을 구매하거나, 또는 다르게 화합물, 조성물, 용품 또는 핵을 수득하는 것을 의미한다.
용어 "및/또는"은 열거된 요소 중 하나 또는 전부 또는 열거된 요소 중 임의의 둘 이상의 조합을 의미한다.
단어 "바람직한" 및 "바람직하게는"은 특정 상황 하에서 특정 이익을 제공할 수 있는 본 개시내용의 실시형태를 지칭한다. 그러나, 다른 실시형태가 동일하거나 다른 상황 하에서 또한 바람직할 수 있다. 추가로, 하나 이상의 바람직한 실시형태의 언급은 다른 실시형태가 유용하지 않다는 것을 암시하지 않고, 본 개시내용의 범주로부터 다른 실시형태를 배제하도록 의도되지 않는다.
용어 "포함한다" 및 그의 변형은 이들 용어가 설명 및 청구범위에 존재하는 경우 제한적인 의미를 갖지 않는다.
실시형태가 용어 "포함하다", "포함한다", 또는 "포함하는" 등과 함께 본 명세서에 기재되는 경우에는 언제나, "이루어진" 및/또는 "본질적으로 이루어진"과 관련하여 기재된 다른 유사한 실시형태도 또한 제공되는 것이 이해된다.
달리 명시되지 않는 한, 단수 표현 및 "적어도 하나"는 상호 교환 가능하게 사용되고, 하나 또는 하나 초과를 의미한다.
또한 본 명세서에서, 종점에 의한 수치 범위의 언급은 그 범위 내에 포함되는 모든 수를 포함한다(예를 들어, 1 내지 5는 1, 1.5, 2, 2.75, 3, 3.80, 4, 5 등을 포함한다).
본 명세서 전체에서 "일 실시형태", "실시형태", "특정 실시형태", 또는 "일부 실시형태" 등에 대한 언급은 그 실시형태와 관련하여 기재된 특정 특징부, 구성, 조성물 또는 특징이 본 개시내용의 적어도 하나의 실시형태에 포함됨을 의미한다. 따라서, 본 명세서 전체의 다양한 위치에서 이러한 어구의 존재는 본 개시내용의 동일한 실시형태를 반드시 지칭하는 것은 아니다. 추가로, 특정 특징부, 구성, 조성물 또는 특징이 하나 이상의 실시형태에서 임의의 적합한 방식으로 조합될 수 있다.
별개의 단계를 포함하는 본 명세서에 개시된 임의의 방법의 경우, 단계는 임의의 실행 가능한 순서로 행해질 수 있다. 그리고, 적절한 경우, 2개 이상의 단계의 임의의 조합이 동시에 행해질 수 있다.
본 개시내용의 상기 과제의 해결 수단은 본 개시내용의 각각의 개시된 실시형태 또는 모든 구현예를 기재하는 것으로 의도되지 않는다. 하기의 설명은 더욱 특히 예시적인 실시형태를 예시한다. 본 출원의 몇몇의 위치에서, 예의 목록을 통해 지침이 제공되며, 이 예는 다양한 조합으로 사용될 수 있다. 각각의 경우에, 열거된 목록은 오직 대표적인 그룹으로서 제공되며, 배타적인 목록으로 해석되어서는 안된다.
도 1. 태반 건강, 모체 반응 및 태아 반응 간의 관계의 개략도.
도 2. 순환 RNA(C-RNA)의 기원.
도 3. C-RNA에 대한 라이브러리 제조 작업흐름.
도 4. 제3 삼분기 임신과 비-임신 시료를 비교하는 C-RNA 접근법의 밸리데이션(validation).
도 5. 종적 임신 시료를 사용한 C-RNA 접근법의 밸리데이션.
도 6. 임상 연구의 설명.
도 7. 서열결정 데이터 특징.
도 8. 전체 데이터 세트에 의존하여, 임의의 유전자의 선택 없이 PE의 분류.
도 9. 부트스트랩핑(bootstrapping) 방법의 설명.
도 10. 부트스트랩핑 접근법을 사용한 자간전증 시료의 분류.
도 11. 과다-풍부 자간전증 유전자의 시험.
도 12. 표준 에이다부스트(Adaboost) 모델.
도 13. 독립적인 코호트는 자간전증 시그니처의 추가의 밸리데이션을 가능하게 한다.
도 14. 자간전증의 분류에서의 표준 에이다부스트 모델의 성능
도 15. 표준 DEX TREAT 분석을 사용한 자간전증의 분류.
도 16. 잭나이핑 접근법을 사용한 유전자의 선택 및 자간전증의 분류.
도 17. 독립적인 PEARL 바이오뱅크 코호트에서의 TREAT, 부트스트랩핑 및 잭나이핑 접근법의 밸리데이션.
도 18. 에이다부스트 정제된 모델을 구축하기 위한 생물정보학 접근법의 다이어그램.
도 19. 에이다부스트 정제된 모델에 의해 사용되는 유전자의 상대 존재비 및 독립적인 데이터세트에서의 그들의 예측능.
도 20. 표준 TREAT 분석 및 잭나이핑 접근법을 사용한 넥스테라 플렉스(Nextera Flex) 생성된 라이브러리에서의 자간전증에 특이적인 C-RNA 시그니처의 식별.
도 21. 넥스테라 플렉스 생성된 라이브러리에서 에이다부스트 정제된 모델에 의해 사용되는 유전자의 상대 존재비 및 RGH14 데이터세트에서의 그들의 예측력.
도 22a 내지 도 22d. 임상적으로 친숙한, 전체-엑솜 C-RNA 분석 방법의 밸리데이션. 도 22a는 서열결정 라이브러리 제조 방법의 개략도이며; 혈액 수집 후의 모든 단계는 중앙집중 처리 연구실에서 수행될 수 있다. 임신 과정 내내 변경되는 전사물의 시간적 변화(도 22b). C-RNA 임신 진행 연구에서 식별되는 유전자의 중첩(도 22c). 임신 시간 경과 연구에 특유한 91개의 유전자를 발현하는 조직(도 22d).
도 23a 내지 도 23c. PE 임상 연구를 위한 시료 수집. 패널은 iPC 연구(도 23a) 및 PEARL 연구(도 23b)에서 각 개체에 대한 혈액 수집 시간(삼각형)과 출생시 재태 기간(사각형)을 나타낸다. 적색 선은 만기 출생에 대한 임계값을 나타낸다. 조산은 조기-발병 PE 코호트에서 유의미하게 상승된다(도 23c). 피셔의 정확 검정(Fisher's exact test)에 의해 *** p < 0.001.
도 24a 내지 도 24g. C-RNA의 차등 분석에 의해 자간전증 바이오마커가 식별된다. PE에서 변경되는 전사물의 배수 변화 및 존재비(도 24a). 표준 분석 방법에 의해 검출되는 각 유전자에 대한 잭나이핑 후에 단측 p-값 신뢰 구간을 계산하였다(도 24b). (21개의) 유전자에 대하여 전체 엑솜 서열결정에 의해, 그리고 qPCR에 의해 결정되는 전사물 존재비 배수-변화(도 24c). 스튜던츠 T-검정에 의해 * p < 0.05. 영향을 받은 유전자의 조직 분포(도 24d). iPC 시료의 계층적 클러스터링(평균 연관, 제곱 유클리안 거리(squared Euclidean distance))(도 24e). PEARL 연구로부터의 조기-발병 PE(도 24f) 및 후기-발병 PE(도 24g) 시료의 클러스터링.
도 25a 내지 도 25e. 에이다부스트에 의해, 코호트에 걸쳐 자간전증 시료를 분류한다. 각 코호트에서 기계 학습에 의해 사용되는 전사물의 상대 존재비를 보여주는 히트맵(Heatmap)(도 25a). 각 블록의 높이는 각 유전자의 중요성을 반영한다. 각 데이터세트에 대한 ROC 곡선(도 25b). 에이다부스트 점수의 분포(KDE). 주황색 선은 PE와 대조군 시료를 판별하기 위한 최적의 경계를 나타낸다(도 25c). 차등 분석에 의해 식별되는 유전자와 에이다부스트에 사용되는 것들의 일치(도 25d). 에이다부스트 유전자의 조직 분포(도 25e).
도 26a 내지 도 26c. 혈액을 상이한 수집 튜브에 보관하는 경우 C-RNA 데이터 무결성. 상이한 튜브 유형에서 하룻밤 보관된 혈액으로부터의 이전에 검출된 C-RNA 임신 마커의 존재비를 EDTA 튜브에서의 수집 후에 즉시 처리하는 것과 비교(도 26a). 상이한 혈액 보관 기간 후에 동일한 개체로부터 제조된 C-RNA에 대한 전사물 FPKM 값을 비교하는 산포도(도 26b). 피어슨의 상관 계수, R은 EDTA 튜브를 사용하는 경우(세포-유리와 비교) 더욱 가변적이다(도 26c).
도 27a 및 도 27b. C-RNA 데이터 품질에 대한 혈장 부피의 영향. 9가지의 독립적인 연구로부터의 데이터를 사용하여 메타-분석을 수행하여, 프로토콜에 적절한 혈장 투입량을 결정하였다. 노이즈(생물학적 변동 계수, EdgeR)를 각각의 연구 내의 생물학적 반복검증으로부터 계산하였다(도 27a). 라이브러리 복잡성(결합된 집단, Preseq)을 각각의 시료에 대하여 계산하였다(도 27b). 구획 변인으로서 연구와 함께, 터키의 HSD 교정을 사용한 ANOVA에 의해 ** p < 0.01, *** p < 0.001.
도 28a 내지 도 28c. 임신 마커 조직 특이성. 완전한 변경된 유전자의 세트(도 28a), 각각의 연구에 특유한 전사물(도 28b) 또는 교차 유전자 세트(도 28c) 중 어느 하나를 사용한 3가지의 독립적인 연구에 의해 임신에서 검출되는 유전자의 조직 특이성을 보여주는 파이 차트.
도 29a 내지 도 29e. 잭나이핑은 자간전증에서 보편적으로 변경되지 않는 유전자를 배제한다. 전사물이 PE 시료에 걸쳐 얼마나 지속적으로 변경되는지를 결정하기 위해 사용되는 잭나이핑 방법의 개략도(도 29a). 각각의 차등적으로 풍부한 유전자에 대한 평균 존재비 및 노이즈(도 29b). 각각의 영향을 받은 전사물에 대한 ROC 곡선 아래 영역 값은 얼마나 분리된 C-RNA 전사물 존재비 분포가 대조군 및 PE 시료에 대하여 존재하는지의 척도를 제공한다(도 29c). 만-휘트니(Mann-Whitney) U 검정에 의해 * p < 0.05. 잭나이핑 후에 배제되는 유전자를 사용한 iPC 시료의 계측적 클러스터링(도 29d). 배제된 전사물의 조직 분포(도 29e). 태아 및 태반의 기여 감소는 PE의 모체 성분이 개체 간에 가장 가변적임을 시사할 수 있다.
도 30a 내지 도 30d. 에이다부스트 모델 개발 전략. RGH014 데이터세트를 6개의 조각으로 나누었다(도 30a). "홀드아웃 서브세트"는 (무작위로 선택된) 시료의 10% 및 (도 24c와 같이) 차등적으로 풍부한 유전자를 사용하는 경우 부정확하게 클러스터링된 3개의 시료를 함유하였으며, 이를 모델 구축에서 완전히 배제하였다. 남아 있는 시료를 무작위로 5개의 균일한 크기의 "시험 서브세트"로 나누었다. 각 시험 서브세트에 있어서, 훈련 데이터는 모든 비-홀드아웃 및 비-시험 시료로 구성되었다. 훈련 및 시험 데이터에 대한 유전자 계수를 edgeR에서 TMM-정규화시킨 다음, 각 유전자에 대해 평균 0 및 표준 편차 1으로 표준화하였다. 각 훈련/시험 시료 세트에 있어서, 훈련 데이터로부터 에이다부스트 모델(90개의 추정량, 1.6 학습 속도)을 10회 구축하였다(도 30b). 특징 가지치기를 수행하여, 증분식으로 증가하는 중요도 임계값 미만의 유전자를 제거하고, 시험 데이터를 예측하는 경우 매튜의 상관 계수에 의해 성능을 평가하였다. 최적의 성능 - 동점의 경우에 가장 적은 유전자 - 을 갖는 모델을 유지하였다. 모든 50개의 독립적인 모델로부터의 추정량을 단일의 에이다부스트 모델로 조합하였다(도 30c). 특징 가지치기를 생성된 앙상블에서, 이번에는 시험 하위세트에 걸친 평균 로그 손실 값에 의해 측정되는 임계값 및 성능을 설정하기 위하여 유전자를 사용한 모델의 백분율을 사용하여 수행하였다. 최종 에이다부스트 모델을 홀드아웃 데이터에 적용한 후의 ROC 곡선(도 30d). HCA에 의해 잘못 클러스터링된 3개의 시료 중 2개를 제외하고, 모든 시료가 정확하게 분리되었다.
도 31a 내지 도 31e. 기계 학습 성능에 대한 하이퍼파라미터 선택 및 특징 가지치기의 영향. 에이다부스트에 대한 최적의 하이퍼파라미터를 식별하기 위한 그리드 검색의 히트맵(도 31a). 매튜의 상관 계수를 성능의 척도로서 사용하였다. 각각의 하이퍼파라미터에 대한 성능의 편평화된 도면(도 31b). 화살표는 모델 구축을 위해 선택되는 값을 나타낸다. 도 31c는 성능에 대한 개별 에이다부스트의 가지치기의 영향을 나타낸다(도 30b에서와 같음). 실선은 모든 10개의 모델에 대한 평균이며, 음영 영역은 표준 편차를 나타낸다. 사전-가지치기된 앙상블에서 관찰되는 각 유전자를 사용한 에이다부스트 모델의 수(도 31d). 조합된 에이다부스트 앙상블을 가지치기하는 경우의 모델 성능(도 31e). 도 31d 및 도 31e에서 주황색 선은 최종 에이다부스트 모델을 생성하기 위하여 적용되는 임계값을 나타낸다.
개략도는 반드시 일정한 비율로 도시된 것은 아니다. 도면에서 사용된 유사한 번호는 유사한 성분을 지칭할 수 있다. 그러나, 주어진 도면에서 성분을 지칭하기 위한 번호의 사용은 동일한 번호로 표지된 또 다른 도면에서의 성분을 제한하도록 의도되지 않는다는 것이 이해될 것이다. 또한, 성분을 지칭하기 위한 상이한 번호의 사용은 상이한 번호의 성분이 다른 번호의 성분과 동일하거나 유사할 수 없다는 것을 나타내도록 의도되지 않는다.
자간전증에 특이적인 모체 순환계에서 관찰되는 순환 RNA의 시그니처, 및 자간전증의 진단 및 자간전증이 발생할 위험이 있는 임신 여성의 식별을 위한 비침습적 방법에서의 이러한 시그니처의 용도가 본 명세서에 제공된다.
체 내의 DNA 및 RNA의 대부분이 세포 내에 위치하지만, 혈액 중에 자유롭게 순환하는 세포외 핵산도 또한 관찰된다. 본 명세서에 "C-RNA"로도 지칭되는 순환 RNA는 혈류에서 관찰되는 RNA의 세포외 세그먼트를 지칭한다. C-RNA 분자는 주로 2가지 공급원으로부터 기원한다: 하나는 아폽토시스를 겪고 있는 죽어 가는 세포로부터 순환계 내로 방출되는 것이며, 둘은 엑소좀 내에 함유되는 것이 살아 있는 세포에 의해 순환계 내로 탈락되는 것이다. 엑소좀은 많은 세포 유형으로부터 세포외 공간 내로 방출되는 약 30 내지 150 nm의 직경의 작은 막 소낭이며, 혈청, 소변 및 모유를 포함하며, 단백질, mRNA 및 마이크로RNA를 보유하는 매우 다양한 체액에서 관찰된다. 엑소좀의 지질 2중층 구조는 그 안에 함유된 RNA를 RNase에 의한 분해로부터 보호하여, 혈액 중 안정성을 제공한다. 예를 들어, 문헌[Huang et al., 2013, BMC Genomics; 14:319]; 및 문헌[Li et al., 2017, Mol Cancer; 16:145)]을 참조한다. 엑소좀이 특수 기능을 가지며, 응고, 세포내 신호전달 및 노폐물 관리와 같은 과정에서 역할을 수행한다는 증거가 누적되고 있다(문헌[van der Pol et al., 2012, Pharmacol Rev; 64(3):676-705]). 또한, 문헌[Samos et al., 2006, Ann N Y Acad Sci; 1075:165-173]; 문헌[Zernecke et al., 2009, Sci Signal; 2:ra81]; 문헌[Ma et al., 2012, J Exp Clin Cancer Res; 31:38]; 및 문헌[Sato-Kuwabara et al., 2015, Int J Oncol; 46:17-27]을 참조한다.
본 명세서에 기재된 방법을 사용하여, 모체 순환계에서 관찰되는 C-RNA 분자는 태아, 태반 및 모체 건강의 바이오마커로서 기능하며, 임신의 진행에 대한 창을 제공한다. 임신을 나타내는 모체 순환계 내의 C-RNA 시그니처, 임신의 재태 단계와 시간적으로 연관되는 모체 순환계 내의 C-RNA 시그니처 및 임신 합병증 자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처가 본 명세서에 기재된다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17, ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3으로부터 선택되는 복수의 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (a)" 또는 "(a)"로도 지칭되는 하기 표 1에 나타낸 TruSeq 라이브러리 제조 방법으로 수득되는 에이다부스트 일반적 시그니처이다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4로부터 선택되는 복수의 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (b)" 또는 "(b)"로도 지칭되는 하기 표 1에 나타낸 TruSeq 라이브러리 제조 방법으로 수득되는 부트스트랩핑 시그니처이다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (c)" 또는 "(c)"로도 지칭되는 하기 표 1에 나타낸 TruSeq 라이브러리 제조 방법으로 수득되는 표준 DEX Treat 시그니처이다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2 및 HTRA4로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (d)" 또는 "(d)"로도 지칭되는 하기 표 1에 나타낸 TruSeq 라이브러리 제조 방법으로 수득되는 잭나이핑 시그니처이다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (e)" 또는 "(e)"로도 지칭되는 하기 표 1에 나타낸 농축을 위한 넥스테라 플렉스 라이브러리 제조 방법로 수득되는 표준 DEX Treat 시그니처이다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3 및 VSIG4로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (f)" 또는 "(f)"로도 지칭되는 하기 표 1에 나타낸 농축을 위한 넥스테라 플렉스 라이브러리 제조 방법로 수득되는 잭나이핑 시그니처이다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "에이다부스트 정제 1", "목록 (g)" 또는 "(g)"로도 지칭되는 하기 표 1에 나타낸 TruSeq 라이브러리 제조 방법으로 수득되는 에이다부스트 정제 TruSeq 시그니처이다.
일부 실시형태에서, 자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2 및 VSIG4(본 명세서에 "에이다부스트 정제 2"로도 지칭됨), ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL 및 VSIG4(본 명세서에 "에이다부스트 정제 3"으로도 지칭됨), ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL 및 VSIG4(본 명세서에 "에이다부스트 정제 4"로도 지칭됨), ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL 및 VSIG4(본 명세서에 "에이다부스트 정제 5"로도 지칭됨), ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP 및 SKIL(본 명세서에 "에이다부스트 정제 6"으로도 지칭됨) 또는 ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2 및 SKIL(본 명세서에 "에이다부스트 정제 7"로도 지칭됨)로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 C-RNA 분자를 포함한다.
자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMA3G, TIPARP, LRRC26, PHEX, LILRA4 및 PER1로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다. 이러한 C-RNA 시그니처는 본 명세서에 "목록 (h)" 또는 "(h)"로도 지칭되는 하기 표 1에 나타낸 농축을 위한 넥스테라 플렉스 라이브러리 제조 방법로 수득되는 에이다부스트 정제 넥스테라 플렉스 시그니처이다.
일부 실시형태에서, 자간전증을 나타내는 모체 순환계 내의 C-RNA 시그니처는 (a), (b), (c), (d), (e), (f), (g) 및/또는 (h) 중 임의의 것 중 임의의 하나 이상과 조합된, (a), (b), (c), (d), (e), (f), (g) 및/또는 (h) 중 임의의 것 중 임의의 하나 이상으로부터 선택되는 단백질의 적어도 일부분을 인코딩하는 복수의 C-RNA 분자를 포함한다.
본 명세서에 제공된 실시예는 자간전증과 대조군 임신을 구별하는 상기에 요약된 8개의 유전자 목록을 설명한다. 상이한 분석 방법 및/또는 별개의 데이터세트를 사용함으로써, 각각을 식별하였다. 그러나, 이들 다수의 유전자 세트 간에는 높은 일치도가 존재한다. 다수의 방법을 사용하여 자간전증 C-RNA에서 변경되는 바와 같은 전사물의 식별에 의해, 상기 전사물이 이러한 질병의 분류를 위하여 더 높은 예측 값을 갖는 것을 나타낸다. 따라서, 모든 차등적 발현 분석에 의해, 그리고 모든 에이다부스트 모델에 의해 식별되는 전사물의 중요도를 조합하고, 순위화시켰다. 더 낮은 순위에 할당되는 유전자는 중요하지 않거나, 비유익한 것이 아니고, 그들은 코호트와 시료 제제에 걸친 자간전증의 분류를 위해 덜 로버스트(robust)할 수 있다.
먼저, 라이브러리 제조 방법(TruSeq 및 농축을 위한 넥스테라 플렉스) 둘 모두에 대하여 모든 차등적 발현 분석(표준 DEX Treat, 부트스트랩핑 및 잭나이핑) 을 사용하는 경우 식별되는 전사물을 조합하였다. 하기 표 2는 상이한 분석 방법에 의해 식별되는 모든 125개의 전사물에 대한 상대 중요도를 나타낸다. 모든 분석 방법 및 둘 모두의 라이브러리 제조에 걸쳐 식별되는 전사물은 가장 강력한 분류자이며, 1의 중요도 순위를 할당하였다. 3가지 이상의 분석 방법에 의해 식별되고, 둘 모두의 라이브러리 제조로 검출되는 전사물에는 2의 중요도 순위를 제공하였다. 가장 엄격한 분석 방법인 잭나이핑에 의해 식별되지만, 라이브러리 제조 중 오직 하나에 의해서만 식별되는 전사물에는 3의 중요도 순위를 할당하였다. 5가지의 분석 방법 중 2개에서 식별되는 전사물에는 4의 중요도 순위를 제공하였다. 가장 광범위하고 포괄적인 분석인 표준 DEX Treat 방법에서만 식별되는 전사물에는 가장 낮은 5의 중요도 순위를 제공하였다.
그 다음, 모든 에이다부스트 모델(에이다부스트 일반 및 에이다부스트 정제) 및 둘 모두의 라이브러리 제조(하기 표 3)에 걸쳐 식별되는 91개의 전사물을 조합하였다. 각각의 라이브러리 제조에 대하여 정제된 에이다부스트 모델을 생성하는 경우, 모델이 동일한 데이터로부터 구축될 때마다 수득되는 유전자 세트에서 약간의 변동이 관찰되었다. 이것은 큰 전체-엑솜 C-RNA 데이터를 검색하기 위하여 에이다부스트에 의해 사용되는 무작위성의 자연적인 결과이다. 대표적인 유전자의 목록을 수득하기 위하여, 정제된 에이다부스트를 위한 모델 구축을 최소 9회 분리하여 시행하였으며, 하나 이상의 모델에 의해 사용된 모든 유전자를 기록하였다. 각 전사물을 포함하는 모델의 백분율은 표 3에 기록되어 있다(에이다부스트에 의해 사용되는 빈도). 에이다부스트는 그 자체의 "중요도" 값을 각각의 전사물에 할당하며, 이는 시료가 자간전증 환자로부터의 것인지의 여부를 결정하는 것에 전사물의 존재비가 얼마나 많은 영향을 미치는지를 반영한다. 이들 에이다부스트 중요도 값을 주어진 전사물이 사용되는 각각의 정제된 에이다부스트 모델에 걸쳐 평균화하였다(표 3, 평균 에이다부스트 모델 중요도).
모든 에이다부스트 분석 및 라이브러리 제조에 걸쳐 식별되는 전사물에 가장 높은 1의 중요도 순위를 할당하였다. 에이다부스트에 의한 90% 초과의 빈도를 사용하여, 단일의 라이브러리 제조 방법에 대한 정제된 에이다부스트 모델에서 식별되는 전사물에는 2의 중요도 순위를 할당하였다. 일반적으로, 이들 전사물은 또한 더 높은 에이다부스트 모델 중요도를 가지며, 이는 증가된 예측 능력과 일치한다. 단일의 라이브러리 제조 방법에 대한 정제된 에이다부스트 모델에서 식별되지만, 90% 미만의 에이다부스트 모델에 의해 사용되는 전사물에는 3의 중요도 순위를 할당하였다. 단일의 라이브러리 제조에 대한 일반적 에이다부스트 모델에서만 식별되는 전사물에는 가장 낮은 4의 중요도 순위를 제공하였다.
표 2에는 모든 분석 방법 및 라이브러리 제조에 걸쳐 DEX 분석에 의해 식별되는 모든 유전자가 열거되어 있다. 순위 1 = 모든 분석 방법 및 라이브러리 제조 방법에 걸쳐 식별되는 전사물. 순위 2 = 둘 모두의 라이브러리 제조 및 5개 중 3개의 분석 방법에서 식별되는 전사물. 순위 3 = 하나의 라이브러리 제조 방법에서, 가장 엄격한 분석인 잭나이핑에서 식별되는 것. 순위 4 = 5개 중 2개의 분석에서 식별되는 것. 그리고 순위 5 = 본 발명자들의 가장 관대한 분석 방법인 표준 DEX Treat 방법에서만 식별되는 것.
표 3에는 둘 모두의 라이브러리 제조에 걸친 에이다부스트 분석에 의해 식별되는 모든 유전자가 열거되어 있다. 순위 1 = 라이브러리 제조 방법 및 정제된 에이다부스트 모델 둘 모두에서 식별되는 것. 순위 2 = 하나의 라이브러리 제조 방법에서 식별되고, 높은 모델 중요도 및 빈도로 정제된 에이다부스트 모델에 존재하는 것. 순위 3 = 하나의 라이브러리 제조 방법에서 식별되고, 중간의 모델 중요도 및 빈도로 정제된 에이다부스트 모델에 존재하는 것. 그리고, 순위 4 = 하나의 라이브러리 제조에서 식별되고, 정제된 에이다부스트 모델에 존재하지 않는 것.
하기의 표 4는 본 명세서에 열거된 다양한 모든 유전자의 용어집이다. 유럽 생물정보학 연구소(European Bioinformatics Institute)의 HUGO 유전자 명명 위원회(Gene Nomenclature Committee)로부터 정보를 수득하였다.
Figure pat00001
Figure pat00002
Figure pat00003
Figure pat00004
Figure pat00005
Figure pat00006
Figure pat00007
Figure pat00008
Figure pat00009
Figure pat00010
Figure pat00011
Figure pat00012
용어 "복수"는 1개 초과의 요소를 지칭한다. 예를 들어, 용어는 자간전증을 나타내는 시그니처로서 제공되는 C-RNA 분자의 수에 대한 연급에서 본 명세서에 사용된다.
복수는 본 명세서에 기재된 목록에 열거된 분자 중 임의의 2개, 임의의 3개, 임의의 4개, 임의의 5개, 임의의 6개, 임의의 7개, 임의의 8개, 임의의 9개, 임의의 10개, 임의의 11개, 임의의 12개, 임의의 13개, 임의의 14개, 임의의 15개, 임의의 16개, 임의의 17개, 임의의 18개, 임의의 19개, 임의의 20개, 임의의 21개, 임의의 22개, 임의의 23개, 임의의 24개, 임의의 25개, 임의의 26개, 임의의 27개, 임의의 28개, 임의의 29개, 임의의 30개, 임의의 31개, 임의의 32개, 임의의 33개, 임의의 34개, 임의의 35개, 임의의 36개, 임의의 37개, 임의의 38개, 임의의 39개, 임의의 40개, 임의의 41개, 임의의 42개, 임의의 43개, 임의의 44개, 임의의 45개, 임의의 46개, 임의의 47개, 임의의 48개, 임의의 49개, 임의의 50개, 임의의 51개, 임의의 52개, 임의의 53개, 임의의 54개, 임의의 55개, 임의의 56개, 임의의 57개, 임의의 58개, 임의의 59개, 임의의 60개, 임의의 61개, 임의의 62개, 임의의 63개, 임의의 64개, 임의의 65개, 임의의 66개, 임의의 67개, 임의의 68개, 임의의 69개, 임의의 70개, 임의의 71개, 임의의 72개, 임의의 73개, 임의의 74개, 임의의 75개, 임의의 76개, 임의의 77개, 임의의 78개, 임의의 79개, 임의의 80개, 임의의 81개, 임의의 82개, 임의의 83개, 임의의 84개, 임의의 85개, 임의의 86개, 임의의 87개, 임의의 88개, 임의의 89개, 임의의 90개, 임의의 91개, 임의의 92개, 임의의 93개, 임의의 94개, 임의의 95개, 임의의 96개, 임의의 97개, 임의의 98개, 임의의 99개, 임의의 100개, 임의의 101개, 임의의 102개, 임의의 103개, 임의의 104개, 임의의 105개, 임의의 106개, 임의의 107개, 임의의 108개, 임의의 109개, 임의의 110개, 임의의 111개, 임의의 112개, 임의의 113개, 임의의 114개, 임의의 115개, 임의의 116개, 임의의 117개, 임의의 118개, 임의의 119개, 임의의 120개, 임의의 121개 또는 임의의 122개를 포함할 수 있다. 복수는 상기 열거된 수 중 적어도 임의의 것을 포함할 수 있다. 복수는 상기 열거된 수 중 임의의 것 초과를 포함할 수 있다. 복수는 상기 열거된 거들 중 임의의 것의 범위를 포함할 수 있다. 일부 실시형태에서, 자간전증을 나타내는 C-RNA 시그니처는 상기 열거된 바이오마커 중 단지 하나를 포함한다.
대상체로부터 수득되는 시료 내의 이들 C-RNA 시그니처 중 하나의 식별 및/또는 정량화를 사용하여 대상체가 자간전증을 앓거나 자간전증이 발생할 위험이 있는 것을 결정할 수 있다.
시료는 혈액, 혈청, 혈장, 땀, 눈물, 소변, 가래, 림프액, 타액, 양수, 예를 들어, 태반 조직 시료를 포함하나 이에 제한되지 않는 조직 생검, 면봉표본(swab) 또는 도말표본(smear)을 포함하나 이들에 제한되지 않는 생물학적 시료 또는 생물시료일 수 있다. 일부 바람직한 실시형태에서, 생물학적 시료는 세포 부재 혈장 시료이다. 생물학적 시료는 임신 여성 대상체로부터 수득되는 모체 시료일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "대상체"는 인간 대상체 및 비-인간 대상체를 지칭한다. 본 명세서의 예가 인간에 관한 것이고, 언어가 주로 인간에 관한 것이지만, 본 개시내용의 개념은 임의의 포유동물에 적용 가능하며, 수의학, 동물 과학, 연구소 등의 분야에 유용하다.
대상체는 임의의 임신의 재태 단계의 임신 여성을 포함하는 임신 여성일 수 있다. 임신의 재태 단계는 예를 들어, 제1 삼분기, 후기 제2 삼분기를 포함하는 제2 삼분기 또는 조기 제3 삼분기를 포함하는 제3 삼분기일 수 있다. 임신의 재태 단계는 예를 들어, 임신 16주 이전, 임신 20주 이전 또는 임신 20주 이후일 수 있다. 임신의 재태 단계는 예를 들어, 임신 8 내지 18주, 임신 10 내지 14주, 임신 11 내지 14주, 임신 11 내지 13주 또는 임신 12 내지 13주일 수 있다.
모체 혈장에서의 세포-유리 태아 핵산의 발견은 비침습적 모체 진단을 위한 새로운 가능성을 열었다. 지난 수년에 걸쳐, 이러한 순환 태아 핵산이 염색체 이수성의 출생전 검출을 위해 사용되게 할 수많은 접근법이 입증되었다. 예를 들어, 문헌[Poon et al., 2000, Clin Chem; 1832-4]; 문헌[Poon et al., 2001, Ann N Y Acad Sci; 945:207-10]; 문헌[Ng et al., 2003, Clin Chem; 49(5):727-31]; 문헌[Ng et al., 2003, Proc Natl Acad Sci U S A.;100(8):4748-53]; 문헌[Tsui et al., 2004, J Med Genet; 41(6):461-7]; 문헌[Go et al., 2004, Clin Chem; 50(8):1413-4]; 문헌[Smets et al., 2006, Clin Chim Acta; 364(1-2):22-32]; 문헌[Tsui et al., 2006, Methods Mol Biol; 336:123-34]; 문헌[Purwosunu et al., 2007, Clin Chem; 53(3):399-404]; 문헌[Chim et al., 2008, Clin Chem; 54(3):482-90]; 문헌[Tsui and Lo, 2008, Methods Mol Biol; 444:275-89]; 문헌[Lo, 2008, Ann N Y Acad Sci; 1137:140-143]; 문헌[Miura et al., 2010, Prenat Diagn; 30(9):849-61]; 문헌[Li et al., 2012, Clin Chim Acta; 413(5-6):568-76]; 문헌[Williams et al., 2013, Proc Natl Acad Sci U S A; 110(11):4255-60]; 문헌[Tsui et al., 2014, Clin Chem; 60(7):954-62]; 문헌[Tsang et al., 2017, Proc Natl Acad Sci U S A; 114(37):E7786-E7795] 및 미국 특허 공개 US 2014/0243212호에 기재된 방법 중 임의의 것이 본 명세서에 기재된 방법에 사용될 수 있다.
자간전증 또는 자간전증이 발생할 위험을 나타내는 모체 순환계 내의 C-RNA 시그니처의 바이오마커의 검출 및 식별은 다양한 기술 중 임의의 것을 포함할 수 있다. 예를 들어, 바이오마커는 방사성면역검정에 의해 혈청에서 검출될 수 있거나, 중합효소 연쇄 반응(PCR) 기법이 사용될 수 있다.
다양한 실시형태에서, 자간전증 또는 자간전증의 발생 위험을 나타내는 모체 순환계 내의 C-RNA 시그니처의 바이오마커의 식별은 C-RNA 분자의 서열결정을 포함할 수 있다. 다양한 고효율 서열결정 기법을 포함하나 이에 제한되지 않는 수많은 서열결정 기술 중 임의의 것이 사용될 수 있다.
일부 실시형태에서, 모체 생물시료 내의 C-RNA 집단은 서열결정 이전에 단백질-코딩 서열을 포함하는 RNA 서열의 농축으로 처리될 수 있다. 아질런트(Agilent) 슈어셀렉트(SureSelect) 인간 전 엑손 플랫폼(문헌[Chen et al., 2015a, Cold Spring Harb Protoc; 2015(7):626-33. doi: 10.1101/pdb.prot083659]); 로슈(Roche) NimbleGen SeqCap EZ 엑솜 라이브러리 SR 플랫폼(문헌[Chen et al., 2015b, Cold Spring Harb Protoc; 2015(7):634-41. doi: 10.1101/pdb.prot084855]); 또는 일루미나(Illumina) TruSeq 엑솜 농축 플랫폼(문헌[Chen et al., 2015c, Cold Spring Harb Protoc; 2015(7):642-8. doi:10.1101/pdb.prot084863])를 포함하나 이에 제한되지 않는 전체-엑솜 농축 및 서열결정에 이용가능한 다양한 플랫폼 중 임의의 것이 사용될 수 있다. 또한, 문헌["TruSeq™ Exome Enrichment Guide," Catalog # FC-930-1012 Part # 15013230 Rev. B November 2010] 및 문헌[Illumina's "TruSeq™ RNA Sample Preparation Guide," Catalog #RS-122-9001DOC Part # 15026495 Rev. F March 2014]을 참조한다.
특정 실시형태에서, 자간전증 또는 자간전증의 발생 위험을 나타내는 모체 순환계 내의 C-RNA 시그니처의 바이오마커는 마이크로어레이 기법을 사용하여 검출 및 식별될 수 있다. 이러한 방법에서, 관심 폴리뉴클레오타이드 서열을 마이크로칩 기판 상에 플레이팅하거나, 배열한다. 이어서, 배열된 서열을 모체 생물시료 또는 그의 정제 및/또는 농축된 부분과 혼성화시킨다. 마이크로어레이는 비드, 유리 현미경 슬라이드, 유리 웨이퍼, 금, 실리콘, 마이크로칩 및 기타 플라스틱, 금속, 세라믹 또는 생물학적 표면을 포함하나 이에 제한되지 않는 다양한 고체 지지체를 포함할 수 있다. 마이크로어레이 분석은 예컨대 일루미나의 기술에 의해 제조처의 프로토콜에 따라 상업적으로 입수 가능한 장비에 의해 수행될 수 있다.
순환 RNA의 제조를 위한 혈액 시료의 수득, 운송, 보관 및/또는 가공과 함께, 시료를 안정화시키고/안정화시키거나 시료 내로의 세포 RNA의 방출을 초래하는 세포막의 파열을 예방하기 위한 단계를 행할 수 있다. 예를 들어, 일부 실시형태에서, 혈액 시료는 혈장으로의 가공 이전에, 세포- 및 DNA-안정화 특성을 갖는 튜브, 예컨대 스트렉(Streck) 세포-유리 DNA BCT® 혈액 수집 튜브 내에 튜브 내에 수집, 운송 및/또는 보관될 수 있다. 일부 실시형태에서, 혈액 시료는 EDTA에 노출되지 않는다. 예를 들어, 문헌[Qin et al., 2013, BMC Research Notes; 6:380] 및 문헌[Medina Diaz et al., 2016, PLoS ONE; 11(11):e0166354]을 참조한다.
일부 실시형태에서, 혈액 시료는 채혈 약 24시간 내지 약 72시간 내에, 일부 실시형태에서, 채혈 약 24시간 내에 혈장으로 가공된다. 일부 실시형태에서, 혈액 시료는 혈장으로의 가공 이전에 실온에서 유지, 보관 및/또는 운송된다.
일부 실시형태에서, 혈액 시료는 혈장으로의 가공 이전에 (예를 들어, 얼음 상에서의) 냉각 또는 동결 없이 유지, 보관 및/또는 운송된다.
본 개시내용은 자간전증의 진단 및 자간전증의 발생 위험이 있는 임신 여성의 식별에 사용하기 위한 키트를 포함한다. 키트는 자간전증 또는 자간전증의 발생 위험을 나타내는 본 명세서에 기재된 바와 같은 모체 순환계 내의 C-RNA 시그니처를 특이적으로 검출하기 위한 적어도 하나의 시약, 예를 들어, 프로브를 포함하는 임의의 제품(예를 들어, 패키지(package) 또는 컨테이너(container))이다. 키트는 본 개시내용의 방법을 수행하기 위한 유닛으로서 홍보, 유통 또는 판매될 수 있다.
자간전증의 진단 및 자간전증의 발생 위험이 있는 임신 여성의 식별을 위한 비침습적 방법에서의 자간전증에 특이적인 모체 순환계에서 관찰되는 순환 RNA의 시그니처의 용도는 적절한 모니터링 및 의학적 관리와 조합될 수 있다. 예를 들어, 추가의 검사가 지시될 수 있다. 이러한 검사는 예를 들어, 간 기능, 신장 기능 및/또는 혈소판 및 다양한 응고 단백질을 측정하기 위한 혈액 검사, 단백질 또는 크레아티닌 수준을 측정하기 위한 소변 분석, 태아 성장, 체중 및 양수를 측정하기 위한 태아 초음파, 태아 움직임과 함께 태아 심박수를 측정하기 위한 비수축 검사를 포함할 수 있고/있거나 당신의 태아 호흡, 근육 긴장, 및 양수의 움직임 및 부피를 측정하기 위하여 초음파를 사용하는 생물물리학적 프로파일이 지시될 수 있다. 치료적 개입은 예를 들어, 출생전 방문 빈도의 증가, 혈압을 낮추기 위한 항고혈압 약제, 코르티코스테로이드 약제, 항경련 약제, 침상 안정, 입원 및/또는 조기 분만을 포함할 수 있다. 예를 들어, 문헌[Townsend et al., 2016 "Current best practice in the management of hypertensive disorders in pregnancy," Integr Blood Press Control; 9: 79-94]을 참조한다.
치료적 개입은 자간전증 발생 위험이 있는 것으로 식별된 임신 여성으로의 저용량의 아스피린의 투여를 포함할 수 있다. 최근의 다기관, 이중-맹검, 위약-제어 시험은, 조산 자간전증 위험이 높은 여성을 저용량의 아스피린으로 처치하면, 위약에 비하여 이러한 진단의 발병률을 더 낮추는 것을 입증하였다(문헌[Rolnik et al., 2017, "Aspirin versus Placebo in Pregnancies at High Risk for Preterm Preeclampsia," N Engl J Med; 377(7):613-622]). 저용량 아스피린의 투여량은 약 50 내지 약 150 ㎎/일, 약 60 내지 약 80 ㎎/일, 약 100 ㎎ 이상/일 또는 약 150 ㎎/일을 포함하나 이들에 제한되지 않는다. 투여는 예를 들어, 임신 16주에 또는 그 이전에 또는 임신 11주 내지 14주에 시작할 수 있다. 투여는 임신 36주 내내 계속할 수 있다.
본 발명은 하기의 실시예에 의해 예시된다. 특정 실시예, 물질, 양 및 절차가 본 명세서에 기재된 본 발명의 목적과 범주에 따라 광범위하게 해석되어야 하는 것을 이해해야 한다.
실시예
실시예 1
임신에 특유한 C-RNA 시그니처
모체 혈장 내의 순환 핵산의 존재는 태아 및 태반의 진행 및 건강으로의 창을 제공한다(도 1). 순환 RNA(C-RNA)는 모체 순환계에서 검출되며, 2개의 주된 공급원로부터 기원한다. 유의미한 C-RNA의 분획은 C-RNA를 함유하는 소낭을 혈류 내로 방출하는 아폽토시스 세포로부터 기원한다. 또한, C-RNA는 다양한 세포 유형으로부터 활성 신호전달 소낭, 예컨대 엑소좀 및 미세소낭의 탈락을 통해 모체 순환계에 유입한다. 도 2에 나타낸 바와 같이, C-RNA는 그에 따라 세포사의 부생성물 및 활성 신호전달 생성물로 구성된다. C-RNA의 특징은 흔한 과정으로부터의 생성, 신체의 도처의 세포로부터의 방출 및 안정성 및 소낭 내의 함유를 포함한다. 그것은 유전자 발현, 신호전달 및 세포사의 조직-특이적 변화를 반영하는 순환 전사체를 나타낸다.
C-RNA는 적어도 하기의 이유로 뛰어난 바이오마커일 가능성을 갖는다:
1) 모든 C-RNA가 C-RNA를 분해로부터 보호하는 막 결합된 소낭 내에 함유되어, 그것이 혈 중에서 꽤 안정하게 되게 한다.
2) C-RNA는 모든 세포 유형으로부터 기원한다. 예를 들어, C-RNA는 태반 및 발달 중인 태아 둘 모두로부터의 전사물을 함유하는 것으로 나타났다. C-RNA의 다양한 기원은 태아 및 전체 모체 건강 둘 모두에 대한 정보를 액세스하기 위한 풍부한 저장소가 될 가능성을 제공한다.
C-RNA 라이브러리를 표준 일루미나 라이브러리 제조 및 전체 엑솜 농축 기술을 사용하여 혈장 시료로부터 제조하였다. 이는 도 3에 나타나 있다. 구체적으로, 일루미나 TruSeqTM 라이브러리 제조 및 RNA 액세스 농축을 사용하였다. 이러한 접근법을 사용하여, 판독물의 90%가 인간 코딩 영역에 대하여 정렬되는 라이브러리를 생성하였다(도 3 및 도 7). 시료를 50 M 판독물로 시료를 다운샘플링하고, 40 M 이상 맵핑된 판독물을 하류 분석을 위해 사용하였다. 시료를 도 3에 나타낸 C-RNA 작업흐름을 사용하여 처리하였다. 이중 인덱싱된 라이브러리. Hiseq2000에서 50X50 서열분석
도 4에 나타낸 바와 같이, 제3 삼분기 임신 여성으로부터의 혈장 시료의 결과를 비-임신 여성으로부터의 혈장 시료와 비교하는 것은 임신에 특유한 명백한 시그니처를 제공한다. 이러한 시그니처의 상위 20개의 차등 존재비 유전자는 CSHL1, CSH2, KISS1, CGA, PLAC4, PSG1, GH2, PSG3, PSG4, PSG7, PSG11, CSH1, PSG2, HSD3B1, GRHL2, LGALS14, FCGR1C, PSG5, LGALS13 및 GCM1이다. 임신 시그니처에서 식별되는 유전자의 대부분은 태반에 의해 발현되며, 또한 공개된 데이터와 상호연관된다. 이들 결과는 또한, 태반 RNA가 모체 순환계에서 접근될 수 있음을 확인시켜 준다.
실시예 2
재태 기간에 걸친 C-RNA 시그니처
본 실시예는 임신 내내 상이한 재태 기간에 걸쳐 C-RNA 시그니처를 특성화하였다. 임신에 걸쳐 종적으로 상이한 시점에 C-RNA 시그니처의 변화가 실시예 1에 언급된 임신 및 비-임신 시료의 C-RNA 시그니처 간의 차이보다 더욱 미미할 것이 예상된다. 도 5에 나타낸 바와 같이, 제1 삼분기에서 상향조절되는 명백한 유전자의 군 및 제3 삼분기에서 증가하는 명백한 유전자의 군과 함께, 임신이 진행됨에 따라 시그니처 유전자의 C-RNA 프로파일의 명백한 시간적인 변화가 관찰되었다.
이들 유전자는 도 5에 열거된 바와 같이, CGB8, CGB5, ZSCAN23, HSPA1A, PMAIP1, C8orf4, ITM2B, IFIT2, CD74, HSPA6, TFAP2A, TRPV6, EXPH5, CAPN6, ALDH3B2, RAB3B, MUC15, GSTA3, GRHL2 및 CSHL1을 포함하였다.
이들 유전자는 또한, CSHL1, CSH2, KISS1, CGA, PLAC4, PSG1, GH2, PSG3, PSG4, PSG7, PSG11, CSH1, PSG2, HSD3B1, GRHL2, LGALS14, FCGR1C, PSG5, LGALS13 및 GCM1을 포함할 수 있다.
임신 과정 내내의 이들 변화는 문헌[Steve Quake] 및 문헌[Dennis Lo] 둘 모두로부터의 공개된 데이터와 상호연관된다. 예를 들어, 문헌[Maron et al., 2007, "Gene expression analysis in pregnant women and their infants identifies unique fetal biomarkers that circulate in maternal blood," J Clin Invest; 117(10):3007-3019]; 문헌[Koh et al., 2014, "Noninvasive in vivo monitoring of tissue-specific global gene expression in humans," Proc Natl Acad Sci U S A; 111(20):7361-6]; 및 문헌[Ngo et al., 2018, "Noninvasive blood tests for fetal development predict gestational age and preterm delivery," Science; 360(6393):1133-1136]을 참조한다. 태반의 유전자 발현 패턴과 상호연관되는 C-RNA 시그니처가 관찰되었다. 따라서, 이러한 접근법은 임신 내의 미미한 변화를 검출할 수 있고, 태반 건강을 모니터링하기 위한 비-침습적 수단을 제공한다.
실시예 3
자간전증의 C-RNA 시그니처
이러한 실시예를 사용하여, 자간전증에 특유한 C-RNA 시그니처를 식별하였다. C-RNA 시그니처를 검정한 2가지 연구, RGH14 연구(clinical trials.gov에 NCT0208494로 등록됨) 및 Pearl 연구(본 명세서에 Pearl 바이오뱅크로도 지칭됨; clinical trials.gov에 NCT02379832로 등록됨))로부터 자간전증으로 진단받은 임신 여성으로부터 수집된 시료에서 검출하였다(도 6). 2개의 튜브의 혈액을 자간전증에 대한 진단 시에 수집하였다. 재태 기간에 대하여 일치된 80개의 대조군 시료를 수집하여, 자간전증 병태와 관련되지 않은 전사 가변성을 최소화시키고, C-RNA 시그니처의 재태 기간 차이를 제어하였다. RGH14 연구로부터의 시료를 사용하여 생물학적으로 관련 있는 유전자의 세트를 식별하였으며, 이들 바이오마커의 예측치를 Pearl 바이오뱅크로부터의 독립적인 시료의 코호트에서 입증하였다.
RGH14 데이터의 분석에서, 자간전증(PE)에 특유한 C-RNA 시그니처를 4가지의 상이한 방법, TREAT 방법, 부트스트랩 방법, 잭나이핑 방법 및 에이다부스트 방법을 사용하여 식별하였다. 실시예 3은 처음 3개의 분석 방법에 집중하고, 실시예 4는 에이다부스트 방법에 집중한다.
EDGR 프로그램을 사용하는 역치에 비한 t-검정(TREAT) 통계적 방법은 연구자가 마이크로어레이 실험에서의 차등 발현이 주어진 (생물학적으로 의미 있는) 역치보다 더 큰지 여부를 공식적으로 검정하게 한다(연관된 p-값과 함께). TREAT 통계적 방법의 더욱 상세한 설명에 대하여 문헌[McCarthy and Smyth, 2009 "Testing significance relative to a fold-change threshold is a TREAT," Bioinformatics; 25(6):765-71] 및 EDGR 프로그램의 더욱 상세한 설명을 위하여 문헌[Robinson et al., 2010, "edgeR: a Bioconductor package for differential expression analysis of digital gene expression data," Bioinformatics; 26:139-140]을 참조한다. 에이다부스트 방법의 더욱 상세한 설명에 대해서는 문헌[Freund and Schapire, 1997, "A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting," Journal of Computer and Systems Sciences; 55(1):119-139] 및 문헌[Pedregosa et al., 2011, "Scikit-learn: Machine Learning in Python," JMLR; 12:2825-2830]을 참조한다. 에이다부스트 방법은 실시예 4에 논의될 것이다.
제1 방법에서, 표준 통계적 검정(TREAT 방법)을 사용하여 일치되는 대조군의 하위세트(40명의 환자)에 비하여 40명의 환자의 RGH14 자간전증 코호트에서 통계적으로 상이한 유전자를 식별하였다. 122개의 유전자가 일치되는 대조군의 하위세트(40명의 환자)에 비하여 자간전증 코호트(40명의 환자)에서 통계적으로 상이한 것으로 식별되었다(도 8, 우측 패널). 이들 유전자는 CYP26B1, IRF6, MYH14, PODXL, PPP1R3C, SH3RF2, TMC7, ZNF366, ADCY1, C6, FAM219A, HAO2, IGIP, IL1R2, NTRK2, SH3PXD2A, SSUH2, SULT2A1, FMO3, FSTL3, GATA5, HTRA1, C8B, H19, MN1, NFE2L1, PRDM16, AP3B2, EMP1, FLNC, STAG3, CPB2, TENC1, RP1L1, A1CF, NPR1, TEK, ERRFI1, ARHGEF15, CD34, RSPO3, ALPK3, SAMD4A, ZCCHC24, LEAP2, MYL2, NRG3, ZBTB16, SERPINA3, AQP7, SRPX, UACA, ANO1, FKBP5, SCN5A, PTPN21, CACNA1C, ERG, SOX17, WWTR1, AIF1L, CA3, HRG, TAT, AQP7P1, ADRA2C, SYNPO, FN1, GPR116, KRT17, AZGP1, BCL6B, KIF1C, CLIC5, GPR4, GJA5, OLAH, C14orf37, ZEB1, JAG2, KIF26A, APOLD1, PNMT, MYOM3, PITPNM3, TIMP4, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES, VSIG4, HBG2, CADM2, LAMP5, PTGDR2, NOMO1, NXF3, PLD4, BPIFB3, PACSIN1, CUX2, FLG, CLEC4C 및 KRT5를 포함한다.
TREAT 방법에서는 자간전증 환자를 개별 군으로 100% 정확하게 분류하는 유전자의 세트가 식별되지 않았다(도 15). 그러나, 이들 식별된 유전자에 대한 집중은 모든 측정된 유전자의 전체 데이터 세트를 사용하는 것에 비하여 분류를 개선시켰다(도 8, 좌측 패널). 이는 예측을 위해 유전자의 하위세트에 집중한 가치를 강조한다. 그러나, TREAT 방법을 사용하여, 어떤 대조군이 선택되었는지에 따라 식별된 유전자에서 유의미한 양의 가변성이 관찰되었다. 이러한 생물학적 가변성을 다루고, 본 발명자들의 유전자 목록의 예측치를 추가로 개선시키기 위하여, 제2 부트스트랩핑 접근법을 개발하였다.
RGH14 연구에서, 자간전증 환자 시료(40개)보다 더 많은 대조군 시료(80개)가 이용 가능하다. 따라서, 40개의 자간전증 환자 시료의 RGH14 코호트를 40개의 대조군 시료의 무작위 선택과 비교하였으며(여전히 재태 기간에 대하여 일치됨), 자간전증 코호트에서 통계적으로 상이한 유전자 목록을 식별하였다. 도 9에 나타낸 바와 같이, 이를 이어서 1,000회 반복하여, 유전자의 세트가 얼마나 자주 식별되었는지를 식별하였다. 유전자의 유의미한 하위세트가 오직 1,000회의 반복 중 10회 미만으로 나타났다(1,000회의 반복 중 1% 미만). 이들 낮은 빈도의 유전자는 생물학적 노이즈로 인한 것일 가능성이 크며, 자간전증에 보편적으로 특이적인 유전자를 반영하지 않을 수 있다. 그래서, 수행되는 1,000회의 반복 중 50%에서 식별되는 경우에만 유전자를 자간전증 코호트에서 통계적으로 상이한 것으로 간주하는 것을 요구함으로써 유전자 목록을 추가로 축소선택하였다(도 9, 우측 패널). 도 10에 나타낸 바와 같이, 추가의 부트스트랩핑 선택을 사용한 차등적인 전사물 존재비에 의해, 건강한 대조군으로부터 자간전증 시료가 구별된다. 이러한 추가의 요건의 사용은 생물학적 가변성을 다루는 것을 돕고, 자간전증 시료를 정확하게 분류하는 능력을 추가로 개선시켰다.
이러한 부트스트랩 방법을 사용하여, 27개의 유전자를 자간전증과 통계적으로 관련이 있는 것으로 식별하였다. 이들 유전자는 TIMP4, FLG, HTRA4, AMPH, LCN6, CRH, TEAD4, ARMS2, PAPPA2, SEMA3G, ADAMTS1, ALOX15B, SLC9A3R2, TIMP3, IGFBP5, HSPA12B, CLEC4C, KRT5, PRG2, PRX, ARHGEF25, ADAMTS2, DAAM2, FAM107A, LEP, NES 및 VSIG4를 포함한다. 이러한 부트스트랩핑 방법으로 식별된 유전자는 공개된 데이터와 뛰어난 일치를 가졌다. 이들 유전자 중 대략 75%는 태반에 의해 발현된다. 도 11에 나타낸 바와 같이, PAPPA 및 CRH를 포함하는 자간전증의 알려져 있는 마커와 중첩이 존재한다. 그리고, 유의미한 수의 이들 유전자는 배아 발생, 세포외 기질 리모델링, 면역 조절 및 심혈관 기능, 자간전증에서 이상조절되는 것으로 알려져 있는 모든 경로에 수반된다.
제3 잭나이핑 접근법도 또한 개발하여, 가장 높은 예측치를 갖는 유전자의 하위세트를 포획하였다. 이러한 접근법은 부트스트랩핑 방법과 유사하다. 자간전증 및 대조군 둘 모두로부터의 환자는 무작위로 하위 시료 추출하고, 차등적으로 풍부한 유전자를 1,000회 식별하였다. 유전자가 통계적으로 상이한 것으로서 식별되는 빈도를 사용하는 것 대신에, 잭나이핑 접근법은 각 전사물의 p-값에 대한 신뢰 구간(95%, 단측)을 계산하였다. 이러한 신뢰 구간이 0.05를 초과하였던 유전자를 배제하였다. (도 16, 좌측 패널).
잭나이핑 접근법을 사용하여, 30개의 유전자가 자간전증을 예측하는 것으로서 식별되었다: VSIG4, ADAMTS2, NES, FAM107A, LEP, DAAM2, ARHGEF25, TIMP3, PRX, ALOX15B, HSPA12B, IGFBP5, CLEC4C, SLC9A3R2, ADAMTS1, SEMA3G, KRT5, AMPH, PRG2, PAPPA2, TEAD4, CRH, PITPNM3, TIMP4, PNMT, ZEB1, APOLD1, PLD4, CUX2, HTRA4.
도 16 우측 패널에 나타낸 바와 같이, 이러한 접근법은 RGH14 데이터 세트에서 자간전증 환자의 우수한 분류를 제공하였다(도 15(TREAT), 도 10(부트스트랩핑) 및 도 16(잭나이핑) 비교). 또한, 각각의 식별된 유전자 목록을 사용하여, 독립적인 Pearl 바이오뱅크 데이터세트에서 자간전증 시료를 분류하였다. 도 17에 나타낸 바와 같이, 각각의 유전자 목록은 자간전증 시료를 분류할 수 있었다.
부트스트랩핑 및 잭나이핑 방법에 의해 식별되는 모든 유전자는 122개의 TREAT 방법 유전자에서 나타나 있다(표 2, DEX 분석, TruSeq 라이브러리 제조 방법). 부트스트랩핑 및 잭나이핑 접근법 유전자 목록은 고도로 일치하며, 70% 초과의 공통의 유전자가 존재한다. 임의의 접근법에 의해 식별되는 전사물의 거의 90%는 이러한 질병에서의 상승된 신호전달 및/또는 세포사와 일치하게, 자간전증 환자에서 증가된 전사물 존재비를 나타낸다.
실시예 4
에이다부스트를 사용한 C-RNA 시그니처의 식별
이러한 예시적인 대안적 접근법을 사용하여, 에이다부스트로 지칭되는 공개 이용 가능한 기계 학습 알고리즘을 사용하여, 자간전증과 연관된 특이적 C-RNA 시그니처를 식별하였다. 도 12에 나타낸 바와 같이, 이러한 접근법에서, 시료를 자간전증(PE) 또는 정상으로 분류하기 위한 가장 큰 예측력을 갖는 유전자의 세트를 식별한다. 이러한 유전자 목록을 사용하여, 건강한 대조군으로부터의 자간전증 코호트의 가장 명백한 분리가 관찰되었다. 그러나, 이러한 접근법은 또한, 모델을 구축하기 위해 사용되는 시료에 대한 과도한 훈련에 매우 민감성일 수 있다. 따라서, PEARL 연구로부터 완전히 독립적인 데이터 세트를 사용하여 예측 모델을 입증하였다(도 13). 이러한 에이다부스트 유전자 목록을 사용하여 자간전증 시료의 85%는 85% 특이도로 정확하게 분류하였다(도 14). 종합하여, 에이다부스트 기계 학습 접근법은 자간전증을 위한 가장 정확한 예측 모델을 구축하였다.
에이다부스트 방법을 사용하여, 75개의 유전자를 자간전증과 통계적으로 연관된 것으로 식별하였다(표 3, 에이다부스트 분석, TruSeq 라이브러리 제조 방법). 이들 유전자는 ARRDC2, JUN, SKIL, ATP13A3, PDE8B, GSTA3, PAPPA2, TIPARP, LEP, RGP1, USP54, CLEC4C, MRPS35, ARHGEF25, CUX2, HEATR9, FSTL3, DDI2, ZMYM6, ST6GALNAC3, GBP2, NES, ETV3, ADAM17,ATOH8, SLC4A3, TRAF3IP1, TTC21A, HEG1, ASTE1, TMEM108, ENC1, SCAMP1, ARRDC3, SLC26A2, SLIT3, CLIC5, TNFRSF21, PPP1R17, TPST1, GATSL2, SPDYE5, HIPK2, MTRNR2L6, CLCN1, GINS4, CRH, C10orf2, TRUB1, PRG2, ACY3, FAR2, CD63, CKAP4, TPCN1, RNF6, THTPA, FOS, PARN, ORAI3, ELMO3, SMPD3, SERPINF1, TMEM11, PSMD11, EBI3, CLEC4M, CCDC151, CPAMD8, CNFN, LILRA4, ADA, C22orf39, PI4KAP1 및 ARFGAP3을 포함한다.
또한, PE 시료의 로버스트 분류를 위하여 정제된 에이다부스트 모델을 개발하였다. 새로운 시료를 정확하게 예측할 수 있는 일반화된 기계 학습 모델을 생성하기 위하여, 본 발명자들은 단일의 데이터세트로의 오버핏팅을 피하는 엄밀한 접근법을 사용하였으며, 모델 구축에 사용되지 않은 시료로 최종 분류자를 입증하였다. 도 18에 예시된 바와 같이, RGH14 데이터세트를 무작위 선택에 의해 6개의 조각으로 나누었다: 모델 구축으로부터 배제시킨 시료의 12%가 있는 홀드아웃 하위세트 및 5개의 균일한 크기의 시험 하위세트. 각각의 반복을 위하여, 하위세트를 훈련 데이터 또는 시험 시료로서 표기하였다. 에이다부스트 모델의 구축 시에 시작하는 이러한 과정을 이러한 데이터 하위세트에서 최소 10회 반복하였다. 5개의 시험-훈련 하위세트에 대하여 50개의 고성능 모델을 구축한 후에, 모든 모델로부터의 추정량을 단일의 에이다부스트 모델로 병합하였다.
정제된 에이다부스트 모델을 사용하여, 11개의 유전자를 자간전증과 통계적으로 연관된 것으로서 식별하였다. 이들 유전자는 CLEC4C, ARHGEF25, ADAMTS2, LEP, ARRDC2, SKIL, PAPPA2, VSIG4, ARRDC4, CRH 및 NES를 포함한다. 이러한 예측 모델의 성능을 RGH14로부터의 홀드아웃 데이터 세트를 사용하여, 그리고 완전히 독립적인 Pearl 바이오뱅크 코호트에서 입증하였다(도 19).
에이다부스트 모델 생성 설명. 또한 도 18에 예시된 하기의 접근법에 의해 에이다부스트 분류 접근법을 정제하여, 더욱 특이적인 유전자 세트를 수득하였다(정제된 에이다부스트 1 내지 7). RGH14 데이터세트를 무작위 선택에 의해 6개의 조각으로 나누었다: 모델 구축으로부터 배제시킨 시료의 12%가 있는 홀드아웃 하위세트 및 5개의 균일한 크기의 시험 하위세트.
시험 하위세트의 각각에 있어서, 훈련 데이터를 홀드아웃 또는 시험 시료 중 어느 것에서 모든 시료로서 지정하였다. 시험 및 훈련 시료에 대한 유전자 계수를 edgeR에서 TMM-정규화시킨 다음, 훈련 데이터가 각각의 유전자에 대하여 0의 평균 및 1의 표준 편차를 갖도록 표준화시켰다. 그 다음, 90개의 추정량 및 1.6 학습 속도를 갖는 에이다부스트 모델을 훈련 데이터에 핏팅시켰다. 그 다음, 모델에서 각 유전자의 특징 중요도를 결정하고, 역치값 미만의 중요도를 갖는 유전자를 사용하여 추정량의 제거의 영향을 시험함으로써 특징 가지치기를 수행하였다. 가장 적은 유전자와 함께, (시험 데이터 분류에 대한 매튜 상관 계수에 의해 측정시) 최적의 성능을 초래하는 역치를 선택하고, 상기 모델을 유지하였다. 에이다부스트 모델의 구축에서 시작하는 이러한 과정을 이러한 데이터 하위세트에서 최소 10회 반복하였다.
모든 50개 이상의 모델을 5개의 시험-훈련 하위세트에 대하여 구축한 후에, 모든 모델로부터의 추정량을 단일의 에이다부스트 모델로 병합하였다. 특징 가지치기를 이번에는 임계값에 대하여 유전자를 혼입하는 모델의 백분율을 사용하고, 각각의 시험 하위세트의 분류를 위하여 평균 음성 로그 손실 값을 갖는 성능을 평가하여 다시 수행하였다. 가장 적은 유전자와 함께 최대 음성 로그 손실 값을 수득한 모델을 최종 에이다부스트 모델로서 선택하였다.
에이다부스트 유전자 목록. 이러한 과정의 반복 시에, 에이다부스트 알고리즘 구현에서의 고유의 무작위화로 인하여, 최종 모델에 대하여 선택되는 유전자에서 약간의 변동이 관찰되었지만, 시험 데이터, 홀드아웃 데이터 및 독립적(Pearl) 데이터세트를 예측하기 위한 성능은 높게 유지되었다
총 11개의 유전자: ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, NES, PAPPA2, SKIL, VSIG4(에이다부스트 정제 1)가 생성되는 14개의 에이다부스트 정제된 모델 중 적어도 하나에서 관찰되었지만, 동시에 모두를 포함하는 모델이 생성되지 않았다.
관찰되는 2개의 유전자 세트는 독립적인 데이터의 분류에 가장 높은 성능을 제공하였다. 이들은 에이다부스트 정제 2: ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, VSIG4및 에이다부스트 정제 3: ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, PAPPA2, SKIL, VSIG4이다.
4개의 추가의 유전자 세트는 거의 에이다부스트 정제 2-3만큼 높게 수행되었다. 이들은 에이다부스트 정제 4: ADAMTS2, ARHGEF25, ARRDC4, CLEC4C, LEP, NES, SKIL, VSIG4; 에이다부스트 정제 5: ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, CRH, LEP, PAPPA2, SKIL, VSIG4; 에이다부스트 정제 6: ADAMTS2, ARHGEF25, ARRDC2, CLEC4C, LEP, SKIL; 및 에이다부스트 정제 7: ADAMTS2, ARHGEF25, ARRDC2, ARRDC4, CLEC4C, LEP, PAPPA2, SKIL이다.
실시예 5
트랜스포좀 기반의 라이브러리 제조를 사용한 C-RNA 시그니처의 식별
RGH14 시료를 농축 프로토콜을 위하여 일루미나 넥스테라 플렉스를 통해 처리하고, 전체 엑솜에 대하여 농축하고, 4000만개 초과의 판독물로 서열결정하였다. 이러한 접근법은 적은 투입량에 대하여 더욱 민감하며, 로버스트하고, 이에 따라, 자간전증을 예측하는 추가의 유전자를 식별할 가능성이 있다. 이러한 데이터 세트를 3가지 분석 방법, 표준 차등 발현 분석(TREAT), 잭나이핑 및 정제된 에이다부스트 모델을 통해 시행하였다. 이들 분석 방법의 상세한 설명에 대하여 실시예 3 및 실시예 4를 참조한다.
라이브러리의 생성 방법의 변화는 모든 3가지 분석 방법에서 검출되는 유전자를 변경시켰다. TREAT 방법에 있어서, 26개의 유전자를 자간전증에서 차등적으로 풍부한 것으로서 식별하였으며, 다시 대다수는 자간전증에서 상승된 존재비를 나타낸다(표 2 참조, DEX 분석, 농축을 위한 넥스테라 플렉스 라이브러리 제조 방법). 이들 유전자는 ADAMTS1, ADAMTS2, ALOX15B, AMPH, ARHGEF25, CELF4, DAAM2, FAM107A, HSPA12B, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PACSIN1, PAPPA2, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3, VSIG4를 포함한다. 도 20은 이러한 유전자 목록과 함께 RGH14의 분류를 나타낸다.
잭나이핑 분석 방법의 적용에 의해, TREAT 목록을 자간전증에서 차등적으로 풍부한 것으로 식별되는 22개의 유전자로 축소선택하였다. 이들 유전자는 ADAMTS1, ADAMTS2, ALOX15B, ARHGEF25, CELF4, DAAM2, FAM107A, HTRA4, IGFBP5, KCNA5, KRT5, LCN6, LEP, LRRC26, NES, OLAH, PRX, PTGDR2, SEMA3G, SLC9A3R2, TIMP3, VSIG4를 포함하였다. 이러한 목록의 개선된 성능은 도 20에 나타나 있다.
정제된 에이다부스트 모델 접근법을 실시예 4에 기재된 바와 같이 이러한 데이터에 적용하였다. 이러한 방법을 사용하여, 24개의 유전자가 자간전증과 통계적으로 연관된 것으로서 확인된다(표 3, 에이다부스트 분석, 농축을 위한 넥스테라 플렉스 라이브러리 제조 방법). 이들 유전자는 LEP, PAPPA2, KCNA5, ADAMTS2, MYOM3, ATP13A3, ARHGEF25, ADA, HTRA4, NES, CRH, ACY3, PLD4, SCT, NOX4, PACSIN1, SERPINF1, SKIL, SEMAG3, TIPARP, LRRC26, PHEX, LILRA4 및 PER1을 포함한다. 이러한 예측 모델의 성능은 도 21에 나타나 있다.
실시예 6
모체 혈액으로부터의 순환 전사체 측정에 의해 조기-발병 자간전증 시그니처를 검출한다
수정부터 출생까지 임신 건강을 비-침습적으로 모니터링하기 위한 분자 도구는 불리한 결과에 대한 위험이 있는 임신의 정확한 검출을 가능하게 할 것이다. 순환 RNA(C-RNA)는 모든 조직에 의해 혈류 내로 방출되어, 태반, 태아 및 모체 건강의 접근 가능한 종합적인 측정을 제공한다(문헌[Koh et al., 2014, Proceedings of the National Academy of Sciences; 111:7361-7366]; 및 문헌[Tsui et al., 2014, Clinical Chemistry; 60:954-962]). 우세하며 잠재적으로 치사적인 임신 합병증인 자간전증(PE)은 태반에서 기원하나, 질병이 진행함에 따라 상당한 모체 성분을 얻는다(문헌[Staff et al., 2013, Hypertension; 61:932-942]; 및 문헌[Chaiworapongsa et al., 2014, Nature Reviews Nephrology; 10, 466-480]). 주장되는 바이오마커는 제한된 임상적 유용성을 나타내었다(문헌[Poon and Nicolaides, 2014, Obstetrics and Gynecology International; 2014:1-11]; 문헌[Zeisler et al., 2016, N Engl J Med; 374:13-22]; 및 문헌[Duhig etal., 2018, F1000Research; 7:242]). 순환 전사체의 특성화에 의해 더 나은 바이오마커를 식별할 수 있다고 가정하여, C-RNA를 113건, 조기-발병 PE 진단 시에 40건의 임신으로부터 분석하였다. 신규한 작업흐름을 사용하여, PE의 생물학과 일치하며, 태반, 태아 및 모체 기여를 나타내는 30개의 전사물의 존재비에서 차이를 식별하였다. 추가로, 기계 학습 모델을 개발하여, 2개의 독립적인 코호트에서 PE를 분류하기 위하여 오직 7개의 C-RNA 전사물이 필요함을 입증하였다(92 내지 98% 정확성). 본 실시예에 개시된 C-RNA의 전반적 측정은 모체 및 태아 건강 둘 모두의 모니터링에서의 유용성을 강조하며, 위험이 있는 임신의 진단 및 예측에 큰 효과를 갖는다.
다양한 임신 합병증에 대하여 C-RNA에서 잠재적인 바이오마커를 조사하고 식별하기 위하여 몇몇의 연구를 시작하였다(문헌[Pan et al., 2017, Clinical Chemistry; 63:1695-1704]; 문헌[Whitehead et al., 2016, Prenatal Diagnosis; 36:997-1008]; 문헌[Tsang et al., 2017, Proc Natl Acad Sci USA; 114: E7786-E7795]; 및 문헌[Ngo et al., 2018, Science; 360:1133-1136]). 그러나, 이들 연구는 소수의 환자만을 참여시켰고, 거의 오직 태반 및 태아 유래 전사물만으로 국한되는 소수의 유전자를 모니터링하는 것으로 제한되었다. 전체 순환 전사체의 측정은 그들이 가변성 및 세포 용해로부터의 오염을 최소화시키기 위하여 특수한 사전 시료 수집 및 처리를 필요로 하기 때문에, 수행하기가 어렵다(문헌[Chiu et al., 2001, Clinical Chemistry; 47:1607-1613]; 및 문헌[Page et al., 2013, PLoS ONE; 8: e77963]). 이러한 복잡한 작업흐름은 대규모 임상 시료 수집을 달성하기 어렵게 만드는데, 왜냐하면 대다수 진료소에서는 혈액 시료의 즉각적인 처리를 위해 필요한 업무가 수행불가하기 때문이다(문헌[Marton and Weiner, 2013, BioMed Research International; 2013:891391]). 따라서, 이러한 실시예를 사용하여, 시료 제조의 모든 단계가 제어된 환경에서 수행되는 처리 실험실로 혈액을 익일 운송 가능하게 하는 방법을 확립하여, 임상 시험 수준 평가를 위한 확장 가능한 플랫폼을 제공하였다(도 22a).
이러한 방법의 핵심은 처리 실험실로 혈액을 익일 운송하는 능력이다. 몇몇의 튜브 유형에서 실온 익일 운송 후에 C-RNA 임신 신호를 평가하였다(도 26a 내지 도 26c). 이전의 C-RNA 연구에 의해 사용되는 절대적 표준인 EDTA 튜브에 보관된 혈액은 임신-연관 전사물의 존재비의 감소 및 전사체 프로파일의 전반적 불안정성을 나타내었다(문헌[Qin et al., 2013, BMC Research Notes; 6:380]). 대조적으로, 비-침습적 출생전 검사(NIPT), 세포-유리 DNA BCT(스트렉)를 위해 사용되는 주된 튜브 유형은 태반 전사물로부터 신호를 유지하였으며, 기술적 재현성을 개선시켰다(도 26b)(문헌[Medina Diaz et al., 2016, PLoS ONE; 11:e0166354]).
혈액의 운송은 본 발명자들이 단일의 혈액 튜브로부터 환자당 평균 5 ㎖ 혈장을 용이하게 수득하게 하였다. 다양한 혈장 부피를 사용하는 경우 C-RNA 데이터 품질의 차이를 평가하였으며, 2 ㎖ 미만의 혈장의 사용은 노이즈를 유의미하게 증가시키고, 라이브러리 복잡성을 감소시키는 것으로 결정되었다(도 27a 및 도 27b). 따라서, 데이터 품질의 신뢰성을 최대화시키기 위하여 4 ㎖의 혈장을 본 실시예의 연구를 위해 사용하였다.
이러한 신규한 작업흐름은 내지 제3 삼분기에 건강한 임신마다 10,000개 초과의 전사물의 C-RNA 역학을 모니터링하는 이전의 연구를 요약함으로써 입증되었다. 45건의 건강한 임신으로부터 순차적으로 수집된 152개의 시료를 사용하여(자간전증 및 성장 제한 종적 연구 대조군 코호트 - PEARL; NCT02379832; 표 5), 156개의 유의미하게 변경된 전사물이 식별되었으며, 대다수는 임신이 진행하는 경우 존재비가 증가하였다(도 22b). 변경된 유전자의 42%가 이전의 C-RNA 연구에서 식별되었다(도 22c)(문헌[Koh et al., 2014, Proceedings of the National Academy of Sciences; 111:7361-7366]; 및 문헌[Tsui et al., 2014, Clinical Chemistry; 60:954-962]). 오직 이러한 연구에서만 식별된 91개의 전사물 중에, 64%가 태반 및/또는 태아 조직에 의해 발현된다(도 22d 및 도 28a 내지 도 28c). 아마도, 남아 있는 유전자는 임신에 대한 모체 반응을 반영한다.
연구 설계
다음 단계의 조사를 위하여, 작업흐름을 임상 시료에 적용하여 PE에서 C-RNA 변화를 측정하였다(iPC, 일루미나 자간전증 코호트). PE는 이질적 장애이며, 그것이 임신 34주 이전(조기-발병)에 나타나는지 이후(후기-발병)에 나타나는지에 기초하여 상이한 중증도 및 환자 결과와 연관된다(문헌[Staff et al., 2013, Hypertension; 61:932-942]; 문헌[Chaiworapongsa et al., 2014, Nature Reviews Nephrology; 10, 466-4803]; 및 문헌[Dadelszen et al., 2003, Hypertension in Pregnancy; 22:143-148]). 이 연구는 정확한 코호트를 수득하기 위해 더욱 중증인 조기-발병 형태에 집중하고, 가장 중요하게 만성 고혈압의 이력을 갖는 임의의 개체를 배제하는 명백한 포함 및 배제 요건을 갖는 엄격한 진단 기준을 정의하였다(표 6)(문헌[Nakanishi et al., 2017, Pregnancy Hypertension; 7:39-43]; 및 문헌[Hiltunen et al., 2017, PLoS ONE; 12:e0187729]). 모체 특징, 임신 결과 및 이용 중인 약제를 연구 내내 기록하였다(표 7). 113개의 시료를 8곳의 장소에 걸쳐 수집하였으며(표 8), 40개는 PE 진단 시의 것이며, 73개의 대조군은 1주 내로 재태 기간이 일치된다(도 23a). 1명을 제외한 모든 PE를 갖는 여성이 대조군의 9.5%와 대조적으로 조기에 출산을 제공하였으며, 이는 이러한 질병에 의해 중증으로 영향을 받는 개체를 식별하는 것으로서 이들 진단 기준을 확인시켜 준다(도 23c).
모든 시료를 다수 회분의 처리에 걸쳐 무작위로 분배한 다음, 40 M 이상의 판독물로 서열결정하였다. 완전한 코호트를 사용하는 표준 차등 발현 분석에 의해 42개의 변경된 전사물을 식별하였으며, 37개가 PE에서 증가하였다(도 24a, 청색 및 주황색). 그러나, 상이한 대조군의 하위세트를 분석을 위해 선택하는 경우 변경되는 것으로서 검출되는 유전자에서 관찰되는 높은 가변성이 관심 대상이었다.
이러한 차이를 다루기 위하여, 가장 지속적으로 변경되는 유전자의 식별을 가능하게 하는 잭나이핑 접근법을 도입하였다(도 24a 및 도 24b, 주황색). 무작위로 선택된 시료 하위세트를 사용한 차등 분석의 1,000회의 반복을 수행하였으며, 이는 각각의 추정적으로 변경된 전사물과 연관된 p-값에 대한 신뢰 구간의 구축을 가능하게 하였다(도 29a). 신뢰 구간이 0.05를 초과하였던 12개의 유전자를 배제하였다(도 24b). 이들 유전자는 단순히 기준선 존재비 또는 생물학적 분산에 대한 임계값을 설정함으로써 배제하지 않을 것이지만(도 29b), 이들 전사물이 더 낮은 예측값을 갖는 것이 관찰되었다(도 29c). 계층적 클러스터링은 이들 유전자가 PE 코호트에서 보편적으로 변경되지 않으며, 이에 따라, 이러한 질환의 정확한 분류를 위한 민감도(73%)가 결여된 것을 나타낸다(도 29d).
그 다음, 분석을 정제된 30개의 유전자 세트에 집중하였으며, 이 중 60%는 이전에 PE와 연관된 바 있다(문헌[Namli et al., 2018, Hypertension in Pregnancy; 37: 9-17]; 문헌[Than et al., 2018, Frontiers in Immunology; 9:1661]; 문헌[Kramer et al., 2016, Placenta; 37:19-25]; 문헌[Winn et al., 2008, Endocrinology; 150:452-462]; 및 문헌[Liu et al., 2018, Molecular Medicine Reports; 18:2937-2944]). qPCR 분석에 의해, 20개 중 19개의 유전자를 PE에서 유의미하게 변경되는 것으로서 확인하였다(도 24c, 표 9). 두드러지게, 이들 유전자의 40%가 세포외 또는 분비된 단백질 생성물을 인코딩한다. 또한, 거의 모든 유전자가 세포외 기질(ECM) 리모델링, 임신 지속, 태반/태아 발달, 혈관신생 및 저산소증 반응을 포함하는 PE 관련 과정에 수반된다(표 10). 이들 전사물 중 67%는 태반 및/또는 태아에 의해 발현되었다(도 24d). 나머지 모체에 의해 발현되는 전사물에서, 심혈관 및 면역 기능이 널리 나타났다(표 10). 이들 유전자의 계층적 클러스터링에 의해, PE 및 대조군 시료를 98% 민감도 및 97% 특이도로 효율적으로 분리하였다(도 24e). 흥미롭게도, 2개의 잘못 식별된 대조군에 대한 임상 데이터는 그들의 고혈압 약제의 사용에 의해 뒷받침되는 바와 같이, 잠재적으로 혼재하는 건강 문제를 나타내었다(표 7).
iPC에서 식별된 유전자를 사용하여, 독립적인 바이오뱅크로부터 수득되는 시료의 코호트를 클러스터링하는 능력을 평가하였다 - 자간전증 및 성장 제한 종적 연구(PEARL; NCT02379832; 도 23b 및 도 23c, 표 11). 이러한 코호트는 재태 기간-일치된 대조군과 함께 조기-(34주 미만에 진단) 및 후기-발병 PE로 이루어져 있다. 조기-발병 PE 시료를 83% 민감도 및 92% 특이도로, 일치되는 대조군으로부터 개별적으로 클러스터링하여, 이들 전사물의 타당성을 추가로 입증하였다(도 24f). 대조적으로, 후기-발병 PE 및 일치되는 대조군 시료에 대하여 클러스터링이 관찰되지 않았다(도 24g).
그 다음, iPC 데이터를 사용하여 PE 시료의 로버스트한 분류를 위하여 에이다부스트 모델을 구축하였다. 새로운 시료를 정확하게 예측할 수 있는 일반화된 기계 학습 모델을 생성하기 위하여, 단일의 데이터세트로의 오버핏팅을 피하는 엄밀한 접근법을 사용하였으며, 모델 구축에 사용되지 않은 시료로 최종 분류자를 입증하였다(도 30a 내지 도 30d 및 도 31a 내지 도 31e). 놀랍게도, 최종 모델은 오직 7개의 유전자를 사용하였으며, 이 중 3개는 이전에 보고된 적이 없었다(도 25a). 전체 iPC 코호트에 있어서, 이러한 모델은 매우 높은 정확도로 시료를 분류하였다(AUC=0.99, 민감도=98%, 특이도=99%; 도 25b 및 도 25c, 청색). 조기-발병 PE PEARL 시료도 또한 정확하게 분류되었다(AUC=0.88, 민감도=100%, 특이도=83%; 도 25b 및 도 25c, 분홍색). 예상 밖으로, 후기-발병 PE PEARL 시료도 또한 합리적인 정확도로 분류하였다(AUC=0.74, 민감도=75%, 특이도=67%; 도 25b 및 도 25c, 녹색).
이러한 유전자 세트는 차등 존재비 분석에 의해 식별되는 전사물과 매우 일치하였다(도 25d; 표 10). 분류자는 태반 및 모체 발현되는 전사물 둘 모두에 의존하였다(도 25e). 모델에 의해 사용되는 모든 유전자는 세포외 또는 막 결합된 단백질 생성물을 형성한다. 에이다부스트에 의해 선택되는 소수의 유전자에도 불구하고, 다양한 PE-관련 기능, 특히 심혈관 기능 및 혈관신생, 면역 조절, 태아 발달 및 ECM 리모델링이 관찰되었다.
방법
예비 임상 시료 수집. 임신한 환자를 임상시험 실시기준을 위한 국제 의약 조화 회의에 따라 일루미나 후원 임상 연구 프로토콜에 동원하였다. 사전 동의 후에, 20 ㎖의 전혈 시료를 ACOG 지침에 따라 정의되는 중증 특징을 갖는 임신 34주 이전에 자간전증의 진단을 갖는 40명의 임신 여성으로부터 수집하였다(표 6). 76건의 건강한 임신으로부터의 시료를 또한 수집하고, 재태 기간에 있어서 자간전증 그룹에 일치시켰다. 발생된 3개의 대조군 시료는 혈액 수집 후 자간전증으로 칭하고, 데이터 분석으로부터 배제하였다. 상세한 포함 및 배제 기준에 대하여, 표 6을 참조한다. 환자 임상 이력, 치료 및 출생 결과 정보도 또한 기록하였다(표 7).
텍사스 의대(미국 텍사스주 갤버스턴), 터프츠(Tufts) 의료 기관(미국 매사추세츠주 보스턴), 컬럼비아 대학 어빙 의료 기관(미국 뉴욕주 뉴욕), 윈스럽(Winthrop) 대학 병원(미국 뉴욕주 미네올라), 세인트 피터 대학 병원(미국 뉴저지주 뉴브런즈위크), 크리스티아나 케어(Christiana Care)(미국 델라웨어주 뉴어크), 럿거스 대학 로버트 우드 존슨 의과 대학(미국 뉴저지주 뉴 브런즈위크) 및 뉴욕 프레스비테리안(New York Presbyterian)/퀸즈(Queens)(미국 뉴욕주 뉴욕)를 포함하는 8곳의 상이한 임상 장소에 걸쳐 환자를 동원하였다. 임상 프로토콜 및 사전 동의를 각각의 임상 장소의 기관생명윤리위원회에 의해 승인받았다. 임상 장소에 걸친 환자 분포에 대해서는 표 8을 참조한다.
PEARL 밸리데이션 코호트 연구 설계. 일루미나는 독립적인 밸리데이션 코호트로서 사용될 자간전증 및 성장 제한 종적 연구(PEARL; NCT02379832)로부터 혈장 시료를 수득하였다. 연구가 완료에 도달한 후에 혈장 시료를 수득하였다. PEARL 시료를 연구 책임자 Emmanual Bujold, MD, MSc와 함께 퀘벡 대학 종합병원(CHU de Queebec)에서 수집하였다. 45건의 대조군 임신 및 45건의 사례 임신의 군을 이러한 연구에 동원하였으며, 작성된 사전 동의을 모든 환자에 대하여 수득하였다. 18세 초과의 참가자만이 적격하였으며, 모든 임신은 단태아였다.
자간전증 그룹. 자간전증에 대한 기준을 20주 내지 41주의 재태 기간 요건과 함께 캐나다 산부인과학회(SOGC) 2014년 6월 자간전증에 대한 기준에 기초하여 정의하였다. 혈액 시료를 진단 시에 1회 취하였다.
대조군. 정상의 임신을 갖는 것으로 예상되었던 45명의 임신 여성을 11주 내지 13주 재태 기간에 동원하였다. 각각의 등록된 환자를 임신 내내 출생까지 4회의 시점에 채혈하여 종적으로 추적하였다. 대조군 여성을 3개의 하위군으로 나누고, 후속 추적 채혈을 시차를 두어 임신 내내 전체 범위의 재태 기간을 포함시켰다(표 5).
PEARL 대조군 시료를 2가지 목적을 위해 사용하였다. 45명의 개별 여성으로부터의 153개의 종적 시료를 사용하여 임신 내내 태반 역학을 모니터링하였다. 또한, 자간전증 코호트에 대한 비교를 위해 대조군 시료를 선택하였으며, 이는 재태 기간에 대하여 일치하고, 모델의 밸리데이션을 위해 사용된다.
연구 시료 처리. 일루미나 전향적 수집으로부터의 모든 시료 및 PEARL 시료는 병태를 알지 못하는 연구자가 동일하게 처리하였다. 환자마다 2개의 혈액 튜브를 제조처의 지침에 따라 세포-유리 DNA BCT 튜브(스트렉)에 수집하였다. 혈액 시료를 실온에서 보관해서 익일 운송하였으며, 72시간 내에 처리하였다. 혈액을 실온에서 1,600 x g에서 20분 동안 원심분리하고, 혈장을 새로운 튜브로 옮기고, 16,000 x g에서 추가 10분 원심분리하여 잔류 세포를 제거하였다. 혈장을 사용할 때까지 -80℃에서 보관하였다. RNA를 제조처의 지침에 따라 순환 핵산 키트(퀴아젠(Qiagen))에 이어서 DNAse I 분해(써모피셔(Thermofisher))를 사용하여 4.5 ㎖의 혈장으로부터 추출하였다.
cDNA 합성 및 라이브러리 제조. 순환 RNA를 94℃에서 8분 동안 단편화시킨 후, 일루미나 트루사이트(TruSight) 종양 170 라이브러리 제조 키트(일루미나)를 사용하여 무작위 6량체 프라이밍된 cDNA 합성을 행하였다. 일루미나 서열결정 라이브러리 제조를 낮은 RNA 투입량을 수용하기 위한 하기의 변형과 함께, RNA를 위한 TST170 라이브러리 제조 키트에 따라 수행하였다. 모든 반응을 원래의 부피의 25%로 줄이고, 라이게이션 어댑터를 1:10 희석으로 사용하였다. 라이브러리 품질을 아질런트 생물분석기 2100(아질런트)에서 고감도(High Sensitivity) DNA 분석 키트를 사용하여 평가하였다.
전체 엑솜 농축. Quant-iT 피코그린(PicoGreen) dsDNA 키트(써모피셔 사이언티픽(ThermoFisher Scientific))를 사용하여 서열결정 라이브러리를 정량화하고, 200 ng 투입량에 대해 정규화시키고, 농축 반응당 4개의 시료로 풀링하였다. 전체 엑솜 농축을 TruSeq RNA 액세스(Access) 라이브러리 제조 가이드(일루미나)에 따라 수행하였다. 헤모글로빈 유전자 HBA1, HBA2 및 HBB에 대하여 설계된 5' 비오틴이 결여된 추가의 블로킹 올리고를 농축 반응에 포함시켜, 서열결정 라이브러리에서의 이들 유전자의 농축을 감소시켰다. 최종 농축 라이브러리를 Quant-IT 피코그린 dsDNA 키트(써모피셔 사이언티픽)를 사용하여 정량화하고, 정규화시키고, 일루미나 HiSeq 2000 플랫폼 상에서 쌍형성된 말단의 50×50 서열결정을 위하여 시료당 4000만의 판독물의 최소 심도로 풀링하였다.
데이터 분석. 다르게 언급되지 않는 한, 모든 통계적 검정은 양-측이었다. 데이터가 정규 분포되지 않는 경우 비-모수 검정을 사용하였다. 서열결정 판독물을 토팻(tophat)(v2.0.13)을 사용하여 인간 참조 게놈(hg19)에 대하여 맵핑하고, 전사물 존재비를 RefGene 좌표에 대한 특징 계수(subread-1.4.6)로 정량화시켰다. 조직 발현 데이터를 바디 아틀라스(Body Atlas)(상호관련 엔진, 베이스 공간, 일루미나 인코포레이티드)로부터 수득하였다(문헌[Kupershmidt, et al. , 2010, PLoS ONE 5; 10.1371/ journal.pone.0013066]). 태반 또는 태아 조직(뇌, 간, 폐 및 갑상선) 중 임의의 것에서 모든 조직에 걸친 발현 중간값보다 2배 이상인 발현을 갖는 vGene을 상기 군에 할당하였다. 하위세포 국소화를 UniProt로부터 수득하였다.
25% 미만의 시료에서 0.5 이하의 CPM을 갖는 유전자의 배제 후에 차등 발현 분석을 edgeR(v3.20.9)과 함께 R(v3.4.2)에서 수행하였다. 데이터세트를 TMM 방법에 의해 정규화시키고, 1 이상의 로그 배수 변화를 위한 glmTreat 시험에 이어서 본페로니-홀름 p-값 교정에 의해 차등 존재비 유전자를 식별하였다. 각각의 잭나이핑 반복을 위하여 대체 없이 무작위 시료추출에 의해 선택되는 각각의 군 내의 시료의 90%를 사용하여, 동일한 과정을 사용하였다. 1,000회의 잭나이핑 반복 후에, 유전자-방식 p-값에 대한 단측 95% 신뢰 구간을 statsmodels(v0.8.0)를 사용하여 계산하였다. 계층적 클러스터링 분석을 제곱 유클리안 거리 및 평균 연관으로 수행하였다.
에이다부스트를 scikit-learn(v0.19.1, sklearn.ensemble. AdaBoostClassifier)과 함께 파이선에서 수행하였다. 최적의 하이퍼파라미터 값(90 추정량, 1.6 학습 속도)을 매튜의 상관 계수를 사용하여 그리드 검색에 의해 결정하여 성능을 정량화하였다. 전체 에이다부스트 모델 개발 전략은 도 31a 내지 도 31e에 예시되어 있다. 데이터세트(25% 미만의 시료 중 0.5 이하의 CPM을 갖는 유전자의 TMM-정규화된 로그 CPM 값)를 분류자의 핏팅 이전에 표준화시켰다(sklearn.preprocessing. StandardScaler). 훈련 데이터에 핏팅되는 동일한 스케일러를 상응하는 시험 데이터세트에 적용하였으며; 5개의 훈련 데이터세트에 대한 모든 5개의 스케일러를 최종 모델에 사용하기 위하여 평균을 구하였다. 결정_함수 점수를 사용하여 ROC 곡선을 구축하고, 시료 분류를 결정하였다.
RT-qPCR 밸리데이션 검정 및 분석. 무작위로 선택된 19개의 자간전증(PE) 및 19개의 일치된 대조군 시료로부터의 2 ㎖의 혈장으로부터 C-RNA를 단리하고, cDNA로 전환시켰다. cDNA를 16 사이클 동안 TaqMan Preamp 마스터 믹스(카탈로그: 4488593)를 사용하여 사전-증폭시키고, 500 ㎕의 최종 부피로 10배 희석하였다. qPCR을 위하여 반응 혼합물은 제조처의 지침을 사용하여 5 ㎕의 희석된 사전-증폭 cDNA, 10 ㎕의 TaqMan 유전자 발현 마스터 믹스(카탈로그: 4369542), 1 ㎕의 TaqMan 프로브 및 4 ㎕의 물을 함유하였다. 각각의 TaqMan 프로브(표 9)에 있어서, 희석된 cDNA 시료마다 3가지 qPCR 반응을 수행하였으며, 바이오-라드(Bio-Rad) CFX 매니저 소프트웨어를 사용하여 Cq 값을 결정하였다. 각각의 표적 유전자에 대한 유전자 존재비를 결정하기 위하여, 5개의 참조 유전자 프로브 간의 평균 Cq 값(ref Cqavg)을 사용하여 ΔΔCq 2^-(표적 Cq - 참조 Cqavg)를 계산하였다. 각각의 프로브에 대한 배수 변화(PE/대조군)를 결정하기 위하여, 각각의 시료에 대한 ΔΔCq 값을 일치되는 대조군에 대한 평균 ΔΔCq 값으로 나누었다.
튜브 유형 연구. 순환 RNA 품질에 대한 튜브 유형 및 익일 운송의 영향을 평가하기 위하여, 하가의 튜브 유형 내에서 채혈하였디; K2 EDTA(베크톤 딕킨슨(Beckton Dickinson), ACD(베크톤 딕킨슨), 세포 유리 RNA BCT 튜브(스트렉) 및 1개의 세포 유리 DNA BCT 튜브(스트렉). 8 ㎖의 혈액을 각각의 튜브 내로 빼내고, 아이스 팩 상에서 익일 운송하거나(EDTA 및 ACD), 실온에서 운송하였다(세포 유리 RNA 및 DNA BCT 튜브). 모든 운송된 혈액 튜브를 채혈 24시간 이내에 혈장으로 처리하였다. 참조로서, 8 ㎖의 혈액을 K2 EDTA 튜브 내로 빼내고, 현장에서 4시간 이내에 혈장으로 처리하고, 드라이 아이스 상의 혈장으로서 운송하였다. 모든 혈장 처리 및 순환 RNA 추출은 방법 섹션에 기재된 바와 같이 수행하였다. 조건마다 3 ㎖의 혈장을 사용하여 기재된 바와 같은 일루미나 프로토콜을 사용하여 농축을 위한 서열결정 라이브러리를 생성하였다.
재현성 연구. 혈장을 10명의 개체로부터 수득하고, 4 ㎖, 1 ㎖ 및 0.5 ㎖ 부피로 나누었으며, 각각의 부피에 대하여 3회의 반복검증을 사용하였다. 순환 RNA 추출(퀴아젠 순환 핵산 키트) 및 무작위 프라이밍된 cDNA 합성을 이전에 기재된 바와 같이 모든 시료에서 수행하였다. 4.5 ㎖ 혈장 투입량을 사용하는 라이브러리에 있어서, 상기 기재된 바와 같은 TST170 종양 라이브러리 제조 키트를 사용하여 서열결정 라이브러리를 생성하였다. 1 ㎖ 및 0.5 ㎖ 투입량에 있어서, Accel-NGS 1S Plus DNA 라이브러리 키트스위프트 바이오사이언스즈((스위프트 바이오사이언스즈(Swift Biosciences))를 사용하여 라이브러리를 생성하였다. 전체 엑솜 농축 및 서열결정을 상기 기재된 바와 같이 사용하여 모든 시료에서 수행하였다.
논의
이러한 연구는 조기-발병 PE에 보편적인 차이를 식별하는데 집중하였으며, 이는 임상적으로 실행 가능한 바이오마커 발견의 궁극적인 목적을 뒷받침한다. 이것은 데이터에서 관찰되는 변동성을 설명하기 위하여 분석 방법을 맞춤화하는 것을 필요로 하였다. 이러한 분산은 C-RNA 측정에서의 상당한 생물학적 노이즈 및 PE의 표현형 다양성 둘 모두로부터 유래한다. C-RNA는 그것이 세포사, 신호전달 및 모든 기관에 걸친 유전자 발현의 조합을 나타내기 때문에, 단일 조직 전사물보다 내재적으로 더욱 가변적이다. 추가로, PE는 상이한 기저 분자적 원인과 연관될 수 있는 매우 다양한 모체 및 태아 결과를 나타낸다. 제거되었던 유전자가 PE에서 생물학적으로 관련될 수 있지만, 그들은 코호트에서 보편적이지 않다. 흥미롭게도, 배제된 전사물은 PE의 분자 하위세트를 나타낼 수 있는 특정 여성에서 상승되었다. 더 큰 코호트는 C-RNA가 이러한 질환의 다양한 병리생리학을 이해하는데 중요한 PE 하위유형을 기술할 수 있다면, 설명을 도울 것이다.
가장 큰 범용 전사물의 세트를 에이다부스트에 의해 식별하였다. 본 발명의 성공을 독립적인 조기-발병 PE 코호트(PEARL)의 고도로 정확한 분류에 의해 축소점수화시켰다. 이들 시료를 예를 들어, 만성 고혈압, 임신성 당뇨병 또는 알포트 증후군을 갖는 대조군의 여성을 포함하는, 유의미하게 관대한 포함 및 배제 기준을 사용하여 상이한 집단으로부터 수집하였다 - 이 중 누구도 PE를 갖는 것으로 잘못 식별되지 않았다. 계층적 클러스터링과 대조적으로, 후기-발병 PE 코호트로부터 24명 중 17명의 개체가 본 실시예의 기계 학습 모델에 의해 정확하게 분류되었으며, 이는 놀랍게도 조기- 및 후기-발병 PE가 별개의 질환이라는 제안을 제공한다. 본 실시예의 발견은 모든 PE에서 보편적으로 변경되는 몇몇의 경로가 존재할 수 있음을 뒷받침한다.
모든 평가에서, C-RNA는 태반, 태아 및 모체 발현되는 전사물에서 변화를 드러냈다. PE 시료에서 관찰되는 가장 두드러진 경향 중 하나는 무수한 ECM 리모델링 및 세포 이동/침습 단백질(FAM107A, SLC9A3R2, TIMP4, ADAMTS1, PRG2, TIMP3, LEP, ADAMTS2, ZEB1, HSPA12B)의 증가된 존재비였으며, 이는 이 질병에 특징적인 이상기능 융모막외 영양세포 침습 및 모체 혈관의 리모델링으로 추적한다. 모체 측의 조기-발병 PE는 심혈관 이상, 염증 및 조산으로서 나타나며, 이들 모두는 본 실시예의 데이터에서 비정상적인 거동의 분자적 징후를 나타낸다.
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
Figure pat00019
Figure pat00020
본 명세서에 인용된 모든 특허, 특허 출원 및 간행물 및 전자적으로 이용 가능한 자료(예를 들어, GenBank 및 RefSeq에서의 뉴클레오타이드 서열 제출물, 및 예를 들어, SwissProt, PIR, PRF, PDB에서의 아미노산 서열 제출물, GenBank 및 RefSeq에서의 주석이 달린 코딩 영역으로부터의 번역물 포함)의 완전한 개시내용은 그들의 전문이 참조로 포함된다. 간행물에 언급된 보충 자료(예컨대, 보충 표, 보충 도면, 보충 자료 및 방법, 및/또는 보충 실험 데이터)는 마찬가지로 그들의 전문이 참조로 포함된다. 본 출원의 개시내용과 본 명세서에 참조로 포함된 임의의 문서의 개시내용(들) 간에 불일치가 존재하는 경우, 본 출원의 개시내용이 우선해야 한다. 상기 상세한 설명 및 실시예는 단지 이해의 명확성을 위해 제공된다. 불필요한 제한은 그로부터 이해되지 않아야 한다. 본 개시내용은 나타내고 기재된 정확한 상세사항에 제한되지 않고, 당업자에게 자명한 변형이 청구범위에 의해서 정의된 본 개시내용에 포함될 것이다.
달리 지시되지 않는 한, 명세서 및 청구범위에 사용된 성분의 양, 분자량 등을 표현하는 모든 수는 모든 경우에 용어 "약"에 의해서 수식되는 것으로 이해되어야 한다. 따라서, 반대로 지시되지 않는 한, 명세서 및 청구범위에 언급된 수치 파라미터는 본 개시내용에 의해 수득하고자 하는 목적하는 특성에 따라서 달라질 수 있는 근사치이다. 적어도 그리고 청구범위의 범주와 동등한 학설을 제한하려는 시도가 아니지만, 각각의 수치 파라미터는 적어도 보고된 유효 자릿수에 비추어 그리고 통상적인 반올림 기법을 적용함으로써 해석되어야 한다.
본 개시내용의 넓은 범주를 설명하는 수치 범위 및 파라미터가 근사치임에도 불구하고, 구체적인 실시예에 언급된 수치는 가능한 한 정확하게 기록된다. 그러나 모든 수치는 본질적으로 그들의 각각의 시험 측정치에서 발견된 표준 편차에서 필연적으로 발생하는 범위를 함유한다.
모든 제목은 읽는 이의 편의를 위한 것이며, 달리 그렇게 명시되지 않는 한 제목 뒤에 오는 본문의 의미를 제한하기 위하여 사용되지 않아야 한다.

Claims (23)

  1. 임신 여성(female)에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정 방법으로서,
    상기 임신 여성으로부터 수득되는 생물시료에서 복수의 순환 RNA(C-RNA) 분자를 식별하는 단계를 포함하되,
    ARHGEF25 단백질의 코딩 영역을 인코딩하는 C-RNA 분자를 포함하는 복수의 C-RNA 분자의, 재태 기간-매칭된 대조군 대비 증가된 발현 수준이 상기 임신 여성에서 자간전증 및/또는 자간전증에 대한 위험 증가를 나타내는, 방법.
  2. 임신 여성(female)에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정 방법으로서,
    상기 임신 여성으로부터 수득되어진 생물시료를 준비하는 단계;
    상기 생물시료로부터 순환 RNA(C-RNA) 분자의 집단을 정제하는 단계;
    상기 정제된 C-RNA 분자의 집단 내의 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계를 포함하되;
    ARHGEF25 단백질의 코딩 영역을 인코딩하는 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열의, 재태 기간-매칭된 대조군 대비 증가된 발현 수준이 상기 임신 여성에서 자간전증 및/또는 자간전증에 대한 위험 증가를 나타내는, 방법.
  3. 제2항에 있어서, 상기 생물시료 내의 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계가 혼성화, 역전사효소 PCR, 마이크로어레이 칩 분석 또는 서열결정(sequencing)을 포함하는, 방법.
  4. 제2항에 있어서, 상기 생물시료 내의 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계가 서열결정을 포함하는, 방법.
  5. 제4항에 있어서, 서열결정은 RNA 서열결정을 포함하는, 방법.
  6. 제4항에 있어서, 서열결정이 클론으로 증폭된 분자의 대량 병렬 서열결정을 포함하는, 방법.
  7. 제6항에 있어서, 서열결정이 RNA 서열결정을 포함하는, 방법.
  8. 제2항 내지 제7항 중 어느 한 항에 있어서,
    상기 순환 RNA(C-RNA) 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계 이전에,
    상기 생물시료로부터 온전한 세포를 제거하는 단계;
    상기 생물시료를 데옥시뉴클레아제(DNase)로 처리하여, 세포 유리 DNA(cell free DNA: cfDNA)를 제거하는 단계;
    상기 생물시료 내의 C-RNA 분자로부터 상보성 DNA(cDNA)를 합성하는 단계; 및
    상기 cDNA 서열을 단백질을 인코딩하는 DNA 서열에 대하여 엑솜 농축에 의해 농축하는 단계를 추가로 포함하는, 방법.
  9. 임신 여성(female)에서의 자간전증의 검출 및/또는 자간전증에 대한 위험 증가의 결정 방법으로서, 상기 방법이
    상기 임신 여성으로부터 수득되어진 생물시료를 준비하는 단계;
    상기 생물시료로부터 온전한 세포를 제거하는 단계;
    상기 생물시료를 데옥시뉴클레아제(DNase)로 처리하여, 세포 프리 DNA(cfDNA)를 제거하는 단계;
    상기 생물시료 내의 RNA 분자로부터 상보성 DNA(cDNA)를 합성하는 단계;
    상기 cDNA 서열을 단백질을 인코딩하는 DNA 서열에 대하여 농축하는 엑솜 농축을 행하는 단계;
    상기 생성되는 농축된 cDNA 서열을 서열결정하는 단계; 및
    농축된 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 식별하는 단계를 포함하되,
    ARHGEF25 단백질의 코딩 영역을 인코딩하는 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열의, 재태 기간-매칭된 대조군 대비 증가된 발현 수준이 상기 임신 여성에서 자간전증 및/또는 자간전증에 대한 위험 증가를 나타내는, 방법.
  10. 제1항에 있어서, 상기 복수의 C-RNA 분자는 PAPPA2, LEP 및/또는 CRH를 추가로 포함하는, 방법.
  11. 제1항에 있어서, 상기 복수의 C-RNA 분자는 CLEC4C, ADAMTS2, ARRDC2, SKIL, VSIG4, ARRDC4, 및 NES 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상, 임의의 6개 이상, 또는 7개 모두를 추가로 포함하는, 방법.
  12. 제1항, 제2항 및 제9항 중 어느 한 항에 있어서, 상기 생물시료가 혈장을 포함하는, 방법.
  13. 제1항, 제2항 및 제9항 중 어느 한 항에 있어서, 상기 생물시료가 임신 16주 미만 또는 임신 20주 미만에 임신 여성으로부터 수득되는, 방법.
  14. 제1항, 제2항 및 제9항 중 어느 한 항에 있어서, 상기 생물시료가 임신 20주 초과에 임신 여성으로부터 수득되는, 방법.
  15. ARHGEF25 단백질의 코딩 영역을 인코딩하는 순환 RNA(C-RNA) 분자에 상보적이며 결합가능한 복수의 제제를 포함하는, 자간전증의 진단용 고체 지지체 어레이.
  16. ARHGEF25 단백질의 코딩 영역을 인코딩하는 순환 RNA(C-RNA) 분자에 결합 및/또는 식별가능한 복수의 프로브를 포함하는, 자간전증의 진단용 키트.
  17. ARHGEF25 단백질의 코딩 영역을 인코딩하는 순환 RNA(C-RNA) 분자를 선택적으로 증폭시키기 위한 복수의 프라이머를 포함하는, 자간전증의 진단용 키트.
  18. 제15항에 있어서, 상기 고체 지지체 어레이는 CLEC4C, ADAMTS2, ARRDC2, SKIL, VSIG4, ARRDC4, NES, PAPPA2, LEP 및/또는 CRH 단백질의 코딩 영역을 인코딩하는 C-RNA 분자에 상보적이며 결합가능한 제제를 추가로 포함하는, 자간전증의 진단용 고체 지지체 어레이.
  19. 제16항에 있어서, 상기 키트는 CLEC4C, ADAMTS2, ARRDC2, SKIL, VSIG4, ARRDC4, NES, PAPPA2, LEP 및/또는 CRH 단백질의 코딩 영역을 인코딩하는 C-RNA 분자에 결합 및/또는 식별 가능한 프로브를 추가로 포함하는, 자간전증의 진단용 키트.
  20. 제1항, 제2항 및 제9항 중 어느 한 항에 있어서, 상기 생물시료가 혈액 시료이며, 상기 혈액 시료를 혈장으로 가공하기 이전에, 상기 혈액 시료가 세포- 및 DNA-안정화 특성을 갖는 튜브에 수집, 운송 및/또는 보관되는, 방법.
  21. 제20항에 있어서, 상기 튜브가 스트렉(Streck) 세포-프리 DNA BCT® 혈액 수집 튜브를 포함하는, 방법.
  22. 제2항 또는 제9항에 있어서, PAPPA2, LEP 및/또는 CRH의 코딩 영역을 인코딩하는 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 확인하는 단계를 추가로 포함하는 방법.
  23. 제2항 또는 제9항에 있어서, CLEC4C, ADAMTS2, ARRDC2, SKIL, VSIG4, ARRDC4 및 NES 중 임의의 1개 이상, 임의의 2개 이상, 임의의 3개 이상, 임의의 4개 이상, 임의의 5개 이상 또는 임의의 6개 이상 또는 7개 모두의 코딩 영역을 인코딩하는 C-RNA 분자에 의해 인코딩되는 단백질 코딩 서열을 확인하는 단계를 추가로 포함하는 방법.
KR1020237007005A 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처 KR102605749B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201862676436P 2018-05-25 2018-05-25
US62/676,436 2018-05-25
US201962848219P 2019-05-15 2019-05-15
US62/848,219 2019-05-15
KR1020217030032A KR102505860B1 (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처
PCT/US2019/033964 WO2019227015A1 (en) 2018-05-25 2019-05-24 Circulating rna signatures specific to preeclampsia

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020217030032A Division KR102505860B1 (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처

Publications (2)

Publication Number Publication Date
KR20230037671A true KR20230037671A (ko) 2023-03-16
KR102605749B1 KR102605749B1 (ko) 2023-11-23

Family

ID=66867807

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020197037048A KR20200007035A (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처
KR1020217030032A KR102505860B1 (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처
KR1020237007005A KR102605749B1 (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020197037048A KR20200007035A (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처
KR1020217030032A KR102505860B1 (ko) 2018-05-25 2019-05-24 자간전증에 특이적인 순환 rna 시그니처

Country Status (8)

Country Link
US (1) US20210148899A1 (ko)
EP (1) EP3802880A1 (ko)
JP (2) JP7334122B2 (ko)
KR (3) KR20200007035A (ko)
CN (1) CN110785499A (ko)
AU (2) AU2019275457B2 (ko)
CA (1) CA3062226A1 (ko)
WO (1) WO2019227015A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102331735B1 (ko) * 2019-11-12 2021-11-26 전남대학교산학협력단 원형 RNA Samd4a를 포함하는 혈관 석회화의 치료 또는 진단용 조성물
CN113943798B (zh) * 2020-07-16 2023-10-27 中国农业大学 一种circ RNA作为肝细胞癌诊断标志物及治疗靶点的应用
US20230386607A1 (en) * 2020-10-20 2023-11-30 Bgi Genomics Co., Ltd. Method for determining pregnancy status of pregnant woman
CN112213487B (zh) * 2020-10-23 2021-10-29 郑州大学第一附属医院 Aste1在检测食管鳞癌中的应用
CN114921546B (zh) * 2022-05-13 2023-02-21 核工业总医院 circHIPK2作为乳腺癌生物标志物的应用
WO2023235353A2 (en) 2022-06-03 2023-12-07 Illumina, Inc. Circulating rna biomarkers for preeclampsia

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
WO2002004680A2 (en) 2000-07-07 2002-01-17 Visigen Biotechnologies, Inc. Real-time sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
CA2513292C (en) * 2003-01-17 2016-04-05 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
JP2008513782A (ja) 2004-09-17 2008-05-01 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子解析のための装置及び方法
EP1859051A4 (en) 2005-03-18 2009-08-05 Univ Hong Kong Chinese MARKERS FOR PRENATAL DIAGNOSIS AND SURVEILLANCE
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP3373174A1 (en) 2006-03-31 2018-09-12 Illumina, Inc. Systems and devices for sequence by synthesis analysis
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US20160289762A1 (en) * 2012-01-27 2016-10-06 The Board Of Trustees Of The Leland Stanford Junior University Methods for profiliing and quantitating cell-free rna
EP3351643B1 (en) 2013-02-28 2019-09-18 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
US20170234874A1 (en) * 2015-10-07 2017-08-17 Clearbridge Biophotonics Pte Ltd. Integrated visual morphology and cell protein expression using resonance-light scattering

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Clin Epigenetics, 10: 48 (2018.04.10.) *

Also Published As

Publication number Publication date
KR20210116718A (ko) 2021-09-27
WO2019227015A8 (en) 2020-02-27
KR20200007035A (ko) 2020-01-21
AU2021257892B2 (en) 2023-10-05
CA3062226A1 (en) 2019-11-25
EP3802880A1 (en) 2021-04-14
AU2021257892A1 (en) 2021-11-18
KR102605749B1 (ko) 2023-11-23
CN110785499A (zh) 2020-02-11
AU2019275457B2 (en) 2021-11-04
US20210148899A1 (en) 2021-05-20
KR102505860B1 (ko) 2023-03-06
JP2023123658A (ja) 2023-09-05
AU2019275457A1 (en) 2019-12-19
JP2020524987A (ja) 2020-08-27
WO2019227015A1 (en) 2019-11-28
JP7334122B2 (ja) 2023-08-28

Similar Documents

Publication Publication Date Title
KR102505860B1 (ko) 자간전증에 특이적인 순환 rna 시그니처
US20200270700A1 (en) Noninvasive diagnosis of fetal aneuploidy by sequencing
US20220010371A1 (en) Rapid aneuploidy detection
US11332774B2 (en) Method for determining copy number variations
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
Hromadnikova et al. First trimester screening of circulating C19MC microRNAs can predict subsequent onset of gestational hypertension
US20230135486A1 (en) Circulating rna signatures specific to preeclampsia
JP2023527761A (ja) 核酸サンプル富化およびスクリーニング方法
US20230392207A1 (en) Circulating rna biomarkers for preeclampsia
Montaner Domènech Development of tools for the analysis of cell-free DNA in human blood: Application in the noninvasive prenatal testing field
AU2015202167B2 (en) Noninvasive diagnosis of fetal aneuploidy by sequencing

Legal Events

Date Code Title Description
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant