CN114402083A - 用于检测子宫内膜异位症的分类器 - Google Patents

用于检测子宫内膜异位症的分类器 Download PDF

Info

Publication number
CN114402083A
CN114402083A CN202080047981.9A CN202080047981A CN114402083A CN 114402083 A CN114402083 A CN 114402083A CN 202080047981 A CN202080047981 A CN 202080047981A CN 114402083 A CN114402083 A CN 114402083A
Authority
CN
China
Prior art keywords
mir
endometriosis
machine learning
mirna
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080047981.9A
Other languages
English (en)
Inventor
休·泰勒
希瑟·鲍尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dot Lab Co
Yale University
Original Assignee
Dot Lab Co
Yale University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2019/059006 external-priority patent/WO2020092672A2/en
Application filed by Dot Lab Co, Yale University filed Critical Dot Lab Co
Publication of CN114402083A publication Critical patent/CN114402083A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/36Gynecology or obstetrics
    • G01N2800/364Endometriosis, i.e. non-malignant disorder in which functioning endometrial tissue is present outside the uterine cavity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioethics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文描述了用于检测子宫内膜异位症的改进方法。通常,所述方法包括但不限于将机器学习算法应用于miRNA水平以检测、预测、诊断或监测子宫内膜异位症是否存在。

Description

用于检测子宫内膜异位症的分类器
交叉引用
本申请要求于2019年4月29日提交的题为“用于检测子宫内膜异位症的分类器”的美国临时申请第62/840,300号和于2019年10月31日提交的题为“用于子宫内膜异位症的定量算法”的PCT/US2019/059006的权益,这两个申请的全部内容通过引用并入本文。
背景技术
子宫内膜异位症是影响青春期和育龄女性的常见病况。这种疾病被认为由子宫内膜组织引起,子宫内膜组织从其在子宫内衬的正常位置迁移到身体的其他部位,主要是在腹腔内。卵巢和肠壁通常受到影响。由于卵巢激素的作用,移位的子宫内膜组织就像在其正常位置一样,会根据月经周期而生长或衰退。子宫内膜异位症可引起许多症状,包括但不限于腹痛、胃肠不适、出血过多、不孕和月经紊乱。
患有复发性盆腔疼痛或不孕的女性可能疑似患有子宫内膜异位症。子宫内膜异位症是一种炎性病症,其中子宫内膜细胞在子宫外增殖,影响近10%的育龄女性。在50-60%患有慢性盆腔疼痛的育龄女性和多达50%的不孕女性中可见子宫内膜异位症。尽管子宫内膜异位症普遍存在,但其往往多年未被诊断。从症状发作到正确诊断的平均时间范围为5-10年。基于患者的症状描述,尤其是在早期阶段,难以识别该疾病,并且目前该病况的确诊需要腹腔镜检查,即一种外科手术。腹腔镜检查是目前用于视觉确认子宫内膜异位症病理和收集病变组织用于组织学分析的“金标准”方法。
发明内容
除其他方面外,本公开满足了本领域中对检测、诊断和监测子宫内膜异位症的微创、准确和更有效方法的需求。
在一个方面,提供了一种检测雌性受试者中是否存在子宫内膜异位症的方法,包括:(a)检测来自所述雌性受试者的体液样品中与子宫内膜异位症相关的一组miRNA的表达谱,其中所述与子宫内膜异位症相关的一组miRNA包括miR-342或miR451a;(b)将机器学习算法应用于所述与子宫内膜异位症相关的一组miRNA的表达谱,其中所述机器学习算法具有分配给miRNA特征的重要性度量,并且其中:i.将重要性度量分配给miR-342,并且分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b;或ii.将重要性度量分配给miR-451a,并且分配给miR-451a的重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-3613、miR-125b和let-7b;以及(c)使用所述机器学习算法来检测所述雌性受试者中是否存在子宫内膜异位症。在一些情况下,所述雌性受试者具有子宫内膜异位症的症状。在一些情况下,所述雌性受试者具有选自由以下组成的组中的子宫内膜异位症的症状:腹痛、胃肠不适、出血过多、不孕和月经紊乱。在一些情况下,所述方法包括诊断子宫内膜异位症、监测子宫内膜异位症、预知子宫内膜异位症或预测子宫内膜异位症的风险。在一些情况下,所述受试者先前尚未被诊断患有子宫内膜异位症。在一些情况下,所述受试者先前已被诊断患有子宫内膜异位症,并且所述方法证实所述雌性受试者中存在子宫内膜异位症。在一些情况下,所述方法还包括在检测到子宫内膜异位症存在时诊断所述雌性受试者中的子宫内膜异位症。在一些情况下,所述方法还包括在检测到子宫内膜异位症存在时预知或监测所述雌性受试者中的子宫内膜异位症。在一些情况下,所述方法还包括在检测到子宫内膜异位症存在时,向所述雌性受试者施用针对子宫内膜异位症的治疗。在一些情况下,所述方法还包括在检测到子宫内膜异位症不存在时,确定所述雌性受试者患有的病况不是子宫内膜异位症。在一些情况下,所述方法还包括在检测到子宫内膜异位症不存在时,向所述雌性受试者施用针对非子宫内膜异位症的病况的治疗。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。在一些情况下,分配给miR-342的重要性度量小于分配给至少一种其他miRNA的重要性度量。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b;并且小于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。在一些情况下,分配给miR-342的重要性度量小于分配给至少两种其他miRNA的重要性度量。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少三种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少四种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。在一些情况下,分配给miR-342的重要性度量大于分配给miR-150、miR-3613、miR-451a、let-7b和miR-125b的重要性度量。在一些情况下,分配给miR-451a的重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-3613、miR-125b和let-7b。在一些情况下,分配给miR-451a的重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-3613、miR-125b和let-7b。在一些情况下,分配给miR-451a的重要性度量大于分配给miR-3613、miR-125b和let-7b的重要性度量。在一些情况下,将所述重要性度量分配为使得所述重要性度量从最高到最低的排序为:miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。在一些情况下,所述体液样品包括细胞。在一些情况下,所述体液样品是无细胞样品。在一些情况下,所述体液样品是血液样品、血浆样品、唾液样品或血清样品。在一些情况下,所述一组miRNA是无细胞miRNA。在一些情况下,所述一组miRNA是细胞相关的miRNA或外泌体相关的miRNA。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量排序的机器学习算法,其中从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。在一些情况下,所述机器学习算法是随机森林算法、k-最近邻算法(k-nearest-neighbors,KNN),支持向量机(SVM)或朴素贝叶斯。在一些情况下,所述机器学习算法是随机森林算法。在一些情况下,所述方法以大于80%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述女性群体是绝经前女性。在一些情况下,所述女性群体包括患有平滑肌瘤、囊腺瘤、慢性盆腔感染、畸胎瘤、子宫内膜瘤或输卵管旁囊肿的女性。在一些情况下,所述女性群体包括患有I/II期子宫内膜异位症的女性。在一些情况下,所述女性群体包括患有III/IV期子宫内膜异位症的女性或患有所有四期子宫内膜异位症(I/II/III/IV期)的女性。在一些情况下,所述女性群体包括在获得所述样品之日起3个月内已经接受激素疗法的女性或处于其月经周期的任何阶段的女性。在一些情况下,所述女性群体包括含有至少100名女性的群组。在一些情况下,所述女性群体包括含有至少1000名女性的群组。在一些情况下,基于来自至少100个样品的表达数据来训练所述机器学习算法。在一些情况下,基于来自至少500个样品的表达数据来训练所述机器学习算法。在一些情况下,基于来自至少1000个样品的表达数据来训练所述机器学习算法。在一些情况下,基于包括患有I-IV期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.90。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.92。在一些情况下,所述方法以大于80%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于85%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于90%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于92%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于95%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于80%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于85%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于90%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于90%的特异性和小于85%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于95%的特异性和小于85%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以小于90%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以小于85%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以小于80%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法还包括在检测到子宫内膜异位症不存在时用不涉及手术的治疗来治疗所述雌性受试者。在一些情况下,所述方法还包括在检测到子宫内膜异位症存在时,向所述雌性受试者施用治疗,其中所述治疗包括激素治疗、手术、腹腔镜手术、他汀类(statin)、非甾体抗炎药(NSAID)、口服避孕药、孕激素(progestin)、促性腺激素释放(GnRH)激动剂、GnRH拮抗剂、雄激素、抗孕酮、选择性雌激素受体调节剂(SERM)、选择性孕酮受体调节剂(SPRM)、阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀、辛伐他汀、扑热息痛、COX-2抑制剂或阿司匹林。在一些情况下,所述miRNA表达水平是通过定量实时聚合酶链反应(RT-PCR)、微阵列、测序或下一代测序检测的。
在另一方面,提供了一种对雌性受试者中的子宫内膜异位症进行分类的方法,包括:(a)获得包括miRNA的体液样品,其中所述体液样品来自雌性受试者;(b)对所述体液样品中的一组miRNA进行定量实时聚合酶链反应、微阵列测定或测序测定,其中所述一组miRNA包括与子宫内膜异位症相关的两种或更多种不同的miRNA;(c)将所述生物样品中与子宫内膜异位症相关的两种或更多种不同miRNA的量与对照RNA的量进行比较,以确定所述体液样品中两种或更多种不同miRNA的归一化的miRNA水平;(d)通过将归一化的miRNA水平输入到经训练的算法中,将所述雌性受试者分类为子宫内膜异位症阳性或阴性,其中所述经训练的算法具有两种或更多种不同miRNA的重要性排序,并且其中通过在与子宫内膜异位症相关的两种或更多种不同miRNA的接受者操作特性(ROC)曲线上或在投票百分比分布上选择最佳截止点,将所述经训练的算法优化为特异性高于灵敏度;以及(e)在计算机屏幕上输出报告,所述报告基于(d)中所述雌性受试者为子宫内膜异位症阳性或阴性的分类,将所述雌性受试者鉴定为子宫内膜异位症阳性或阴性。在一些情况下,将所述经训练的算法优化以在女性群体中以大于80%的特异性检测子宫内膜异位症。在一些情况下,将所述经训练的算法优化以在女性群体中以大于90%的特异性和小于85%的灵敏度检测子宫内膜异位症。在一些情况下,所述经训练的算法在女性群体中以大于90%或大于95%的特异性检测I/II期子宫内膜异位症。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.9。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.92。在一些情况下,所述方法以大于85%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于90%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于95%的特异性检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于80%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以大于90%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述方法以小于90%、小于85%或小于80%的灵敏度检测女性群体中的子宫内膜异位症。在一些情况下,所述女性群体包括至少100名女性。在一些情况下,所述至少100名女性的群体包括患有平滑肌瘤的女性。在一些情况下,所述方法的曲线下面积(AUC)值大于0.85,而与子宫内膜异位症时期或激素治疗无关。在一些情况下,所述方法还包括在所述报告将所述雌性受试者鉴定为子宫内膜异位症阳性后,向所述雌性受试者施用针对子宫内膜异位症的治疗。在一些情况下,所述方法还包括在所述报告将所述雌性受试者鉴定为子宫内膜异位症阴性后,向所述女性受试者施用针对非子宫内膜异位症的病况的治疗。在一些情况下,所述方法还包括在报告将所述雌性受试者鉴定为子宫内膜异位症阴性后至少三个月对获得的另外的体液样品重复(a)-(e)。在一些情况下,所述经训练的算法将重要性度量分配给miR-342,其大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。在一些情况下,分配给miR-342的重要性度量小于分配给至少一种其他miRNA的重要性度量。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少三种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。在一些情况下,分配给miR-342的重要性度量大于分配给选自由以下各项组成的组中的至少四种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。在一些情况下,分配给miR-342的重要性度量大于分配给miR-150、miR-3613、miR-451a、let-7b和miR-125b的重要性度量。在一些情况下,分配给miR-451a的重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-3613、miR-125b和let-7b。在一些情况下,分配给miR-451a的重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-3613、miR-125b和let-7b。在一些情况下,分配给miR-451a的重要性度量大于分配给miR-3613、miR-125b和let-7b的重要性度量。在一些情况下,将所述重要性度量分配为使得所述重要性度量从最高到最低的排序为:miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。在一些情况下,所述体液样品包括细胞。在一些情况下,所述体液样品是无细胞样品。在一些情况下,所述体液样品是血液样品、血浆样品、唾液样品或血清样品。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量排序的机器学习算法,其中从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。在一些情况下,所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。在一些情况下,所述机器学习算法是随机森林算法。在一些情况下,所述女性群体是绝经前女性。在一些情况下,所述女性群体包括患有平滑肌瘤、囊腺瘤、慢性盆腔感染、畸胎瘤、子宫内膜瘤或输卵管旁囊肿的任意组合的女性。在一些情况下,所述女性群体包括患有I/II期子宫内膜异位症的女性。在一些情况下,所述女性群体包括患有III/IV期子宫内膜异位症的女性或所有患有四期子宫内膜异位症(I/II/III/IV期)的女性。在一些情况下,所述女性群体包括在获得所述样品之日起3个月内已经接受激素疗法的女性或处于其月经周期的任何阶段的女性。在一些情况下,所述女性群体包括含有至少100名女性的群组。在一些情况下,所述女性群体包括含有至少500名女性的群组。在一些情况下,所述女性群体包括含有至少1000名女性的群组。在一些情况下,基于来自至少100个样品的表达数据来训练所述机器学习算法。在一些情况下,基于来自至少1000个样品的表达数据来训练所述机器学习算法。在一些情况下,基于包括患有I-IV期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。在一些情况下,所述方法还包括在检测到子宫内膜异位症不存在时,用不涉及手术的治疗来治疗所述雌性受试者。在一些情况下,所述方法还包括在检测到子宫内膜异位症存在时,向所述雌性受试者施用治疗,其中所述治疗包括激素治疗、手术、腹腔镜手术、他汀类、非甾体抗炎药(NSAID)、口服避孕药、孕激素、促性腺激素释放(GnRH)激动剂、GnRH拮抗剂、雄激素、抗孕酮、选择性雌激素受体调节剂(SERM)、选择性孕酮受体调节剂(SPRM)、阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀、辛伐他汀、扑热息痛、COX-2抑制剂或阿司匹林。在一些情况下,所述方法包括诊断子宫内膜异位症、监测子宫内膜异位症、预知子宫内膜异位症或预测子宫内膜异位症的风险。在一些情况下,所述受试者先前尚未被诊断患有子宫内膜异位症。
在又一个方面,提供了一种诊断和治疗雌性受试者中的子宫内膜异位症的方法,包括:(a)检测来自所述雌性受试者的唾液样品中的与子宫内膜异位症相关的一组miRNA的表达谱,其中所述与子宫内膜异位症相关的一组miRNA包括miR-125b和至少一种其他miRNA;(b)将机器学习算法应用于所述与子宫内膜异位症相关的一组miRNA的表达谱,其中所述机器学习算法具有分配给miRNA特征的重要性度量,并且其中miR-125b的重要性度量大于miR-150、miR-3613、miR-451a、let-7b或miR-342的重要性度量;(c)使用所述机器学习算法以诊断所述雌性受试者中的子宫内膜异位症;以及(d)用针对子宫内膜异位症的治疗来治疗在所述雌性受试者中诊断的子宫内膜异位症。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的至少一种。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的至少两种。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的至少三种。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a和miR-3613。
在又一个方面,提供了一种表征雌性受试者为患有子宫内膜异位症的方法,包括:(a)获得包括miRNA的体液样品,其中所述体液样品来自雌性受试者;(b)对所述体液样品中的一组miRNA进行定量实时聚合酶链反应、微阵列测定或测序,其中所述一组miRNA包括与子宫内膜异位症相关的两种或更多种不同的miRNA;(c)将所述生物样品中的与子宫内膜异位症相关的两种或更多种不同miRNA的量与对照RNA的量进行比较,以确定体液样品中两种或更多种不同miRNA的归一化的miRNA水平;(d)通过将归一化的miRNA水平输入到经训练的算法中,将所述雌性受试者分类为子宫内膜异位症阳性或阴性,其中通过在与子宫内膜异位症相关的两种或更多种不同miRNA的接受者操作特性(ROC)曲线上选择最佳截止点,将所述经训练的算法优化为至少80%的灵敏度,并且其中所述经训练的算法具有两种或更多种不同miRNA的重要性排序;以及(e)在计算机屏幕上输出报告,所述报告基于(d)中所述雌性受试者为子宫内膜异位症阳性或阴性的分类,将所述雌性受试者鉴定为子宫内膜异位症阳性或阴性。
在又一个方面,提供了一种表征雌性受试者为患有或不患有子宫内膜异位症的方法,包括:(a)获得包括miRNA的体液样品,其中所述体液样品来自患有腹痛、胃肠不适、过度出血、不育或月经紊乱的雌性受试者,并且所述受试者先前尚未被诊断患有子宫内膜异位症;(b)对所述体液样品中的一组miRNA进行定量实时聚合酶链反应或测序,其中所述一组miRNA包括与子宫内膜异位症相关的两种或更多种不同的miRNA;(c)将所述生物样品中的与子宫内膜异位症相关的两种或更多种不同miRNA的量与对照RNA的量进行比较,以确定所述体液样品中的两种或更多种不同miRNA的归一化的miRNA水平;(d)通过将归一化的miRNA水平输入到经训练的算法中,将所述雌性受试者分类为子宫内膜异位症阳性或阴性,其中通过在与子宫内膜异位症相关的两种或更多种不同miRNA的接受者操作特性(ROC)曲线上选择最佳截止点,将所述经训练的算法优化为至少80%的特异性,并且其中所述经训练的算法具有两种或更多种不同miRNA的重要性排序;以及(e)在计算机屏幕上输出报告,所述报告基于(d)中所述雌性受试者为子宫内膜异位症阳性或阴性的分类,将所述雌性受试者鉴定为子宫内膜异位症阳性或阴性。在一些情况下,所述经训练的算法计算指示患有子宫内膜异位症的可能性的投票分数。在一些情况下,在投票分数大于36%时,所述经训练的算法将所述雌性受试者分类为患有子宫内膜异位症。在一些情况下,所述方法对于I/II期子宫内膜异位症的曲线下面积(AUC)值大于0.85。在一些情况下,所述方法的曲线下面积(AUC)值大于0.85以区分子宫内膜异位症和平滑肌瘤。在一些情况下,所述方法的曲线下面积(AUC)值大于0.85,而与子宫内膜异位症时期或激素治疗无关。在一些情况下,将所述方法优化为大于90%的特异性和小于85%的灵敏度。
在又一个方面,提供了一种检测雌性受试者中的子宫内膜异位症的方法,包括:(a)在来自所述受试者的包括miRNA的样品中检测与子宫内膜异位症相关的一组miRNA的表达谱;(b)将机器学习算法应用于所述表达谱以检测来自所述受试者的样品中的子宫内膜异位症,其中基于选自由以下各项组成的组中的一组miRNA特征来训练所述机器学习算法:(i)miR-342、miR-451a和miR-3613;(ii)miR-342、miR-451a、miR-3613和miR-125b;(iii)miR-342、miR-451a、miR-3613、miR-125b和let-7b;(iv)miR-342、miR-451a、let-7b和miR-125b;(v)miR-342、miR-451a、let-7b和miR-3613;(vi)miR-342、miR-451a和let-7b;(vii)miR-125b、miR-150、miR-342、miR-451a和let-7b;以及(viii)miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。在一些情况下,所述方法还包括在(a)之前从所述受试者获得包括miRNA的样品。在一些情况下,所述样品是唾液样品。在一些情况下,所述样品是血清样品。在一些情况下,所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。在一些情况下,所述女性群体是绝经前女性。在一些情况下,所述女性群体是绝经前的且超过18岁。在一些情况下,所述女性群体是绝经前的且49岁以下。在一些情况下,所述女性群体对于严重贫血、增生、息肉和恶性肿瘤呈阴性。在一些情况下,所述女性群体包括在获得样品之日起3个月内已经接受激素疗法的女性。在一些情况下,所述激素疗法包括生育控制药丸或GnRH激动剂。在一些情况下,基于至少100个样品的表达数据来训练所述机器学习算法。在一些情况下,基于患有手术确证的子宫内膜异位症的女性群体来训练所述机器学习算法。在一些情况下,基于包括患有I期或II期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。在一些情况下,基于包括患有I-IV期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量的机器学习算法,其中miR-342的重要性度量大于miR-150、let-7b或miR-125中的至少一种。在一些情况下,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的一种。在一些情况下,将机器学习算法应用于所述表达谱包括基于(viii)的所述一组miRNA特征来训练所述机器学习算法,并且应用具有分配给miRNA特征的特定重要性度量的机器学习算法,其中所述miRNA特征从最高到最低的排序为miR-125b、let-7b、miR-3613、miR-150、miR-342和miR-451a。在一些情况下,将机器学习算法应用于所述表达谱包括基于(viii)中所述一组miRNA特征来训练所述机器学习算法,并且应用具有分配给miRNA特征的特定重要性度量排序的机器学习算法,其中从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。在一些情况下,将机器学习算法应用于所述表达谱包括基于(viii)中所述一组miRNA特征来训练所述机器学习算法,并且应用具有分配给miRNA特征的特定重要性度量的机器算法,其中根据表9中的任何列进行所述miRNA特征的重要性度量排序。
在又一方面,提供了一种方法,包括:(a)在多个基于网络的非暂时性存储设备中以标准化格式存储与雌性患者的病况相关的信息;(b)通过网络向用户提供远程访问,使得至少一个用户可以通过图形用户界面实时更新与所述雌性患者的病况相关的信息,其中所述至少一个用户以来自所述雌性患者的miRNA的表达谱的形式提供更新的信息;(c)通过内容服务器,使用机器学习算法的应用程序将来自所述雌性患者的miRNA的所述表达谱转换为所述雌性患者患有子宫内膜异位症的可能性;(d)存储患有子宫内膜异位症的所述雌性患者的可能性;(e)每当更新的信息已被存储时,通过内容服务器自动生成包含所述雌性患者患有子宫内膜异位症的所述可能性的消息;以及(f)通过计算机网络实时向所有用户传送消息,使得每个用户能够立即获得所述雌性患者患有子宫内膜异位症的所述可能性。在一些情况下,基于一组miRNA特征来训练所述机器学习算法,所述一组miRNA特征选自由以下各项组成的组:(i)miR-342、miR-451a和miR-3613;(ii)miR-342、miR-451a、miR-3613和miR-125b;(iii)miR-342、miR-451a、miR-3613、miR-125b和let-7b;(iv)miR-342、miR-451a、let-7b和miR-125b;(v)miR-342、miR-451a、let-7b和miR-3613;(vi)miR-342、miR-451a和let-7b;(vii)miR-125b、miR-150、miR-342、miR-451a和let-7b;以及(viii)miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。在一些情况下,所述方法还包括从所述受试者获得包括miRNA的样品。在一些情况下,所述样品是血液样品、血浆样品或血清样品。在一些情况下,所述样品是唾液样品。在一些情况下,所述样品是血清样品。在一些情况下,所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。在一些情况下,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。在一些情况下,所述女性群体包括在获得样品之日起3个月内已经接受激素疗法的女性。在一些情况下,所述激素疗法包括生育控制药丸或GnRH激动剂。在一些情况下,所述样品是无细胞血清样品。在一些情况下,所述样品是无细胞唾液样品。在一些情况下,所述方法还包括基于(e)中报道的所述可能性向所述受试者施用治疗以治疗子宫内膜异位症。在一些情况下,所述治疗包括激素治疗、他汀类或非甾体抗炎药(NSAID)。在一些情况下,所述激素治疗包括口服避孕药、孕激素、GnRH激动剂、GnRH拮抗剂、雄激素、抗孕酮、SERM或SPRM。在一些情况下,所述他汀类包括阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀或辛伐他汀。在一些情况下,NSAID包括扑热息痛、COX-2抑制剂或阿司匹林。
在一些方面,本公开提供一种检测雌性受试者中的子宫内膜异位症的方法,包括:(a)在来自受试者的样品中检测与子宫内膜异位症相关的一组miRNA的表达谱;(b)将机器学习算法应用于所述表达谱以检测来自所述受试者的样品中的子宫内膜异位症,其中基于一组miRNA特征来训练所述机器学习算法,所述一组miRNA特征选自由以下各项组成的组:(i)miR-342、miR-451a和miR-3613;(ii)miR-342、miR-451a、miR-3613、miR-125b;(iii)miR-342、miR-451a、miR-3613、miR-125b、let-7b;(iv)miR-342、miR-451a、let-7b、miR-125b;(v)miR-342、miR-451a、let-7b、miR-3613;(vi)miR-342、miR-451a、let-7b;(vii)miR-125b、miR-150、miR-342、miR-451a、let-7b;和(viii)miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。在一些实施方案中,所述方法包括从所述受试者获得包括miRNA的样品。在一些实施方案中,所述样品是血液样品。在一些实施方案中,所述样品是血清样品。在一些实施方案中,所述样品是血浆样品。在一些实施方案中,所述样品是无细胞或非细胞的血液、血浆或血清样品。在一些实施方案中,所述样品是通过静脉穿刺收集到没有另外添加剂的收集管中然后离心除去细胞的血液样品。在一些实施方案中,将所述血液样品离心或过滤以除去细胞。在一些实施方案中,所述样品是血液、血浆或血清样品。在一些实施方案中,所述样品是尿液样品。在一些实施方案中,所述样品是体液样品。在一些实施方案中,所述体液是汗液、唾液、泪液、尿液、血液、血浆、血清、阴道液、宫颈-阴道液、全血、月经流出物、经血、脊髓液、肺液或痰。在一些实施方案中,所述机器学习算法是随机森林算法、k最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。在一些实施方案中,所述算法是随机森林算法。在一些实施方案中,所述方法在女性群体中检测的子宫内膜异位症的AUC大于0.85。在一些实施方案中,所述女性群体是绝经前女性。在一些实施方案中,所述女性群体是绝经前的并超过18岁。在一些实施方案中,所述女性群体是绝经前的且在49岁以下。在一些实施方案中,所述女性群体对于严重贫血、增生、息肉和恶性肿瘤呈阴性。在一些实施方案中,所述女性群体包括在获得样品之日起3个月内已经接受激素疗法的女性。在一些实施方案中,所述激素疗法包括生育控制药丸和/或GnRH激动剂。在一些实施方案中,基于来自至少100个样品的表达数据来训练所述算法。在一些实施方案中,基于来自至少50个样品的表达数据来训练所述算法。在一些实施方案中,基于来自至少200个样品的表达数据来训练所述算法。在一些实施方案中,基于来自至少500个样品或至少1000个样品的表达数据来训练所述算法。在一些实施方案中,基于患有手术确证的子宫内膜异位症的女性群体来训练所述算法。在一些实施方案中,基于包括患有I期或II期子宫内膜异位症的女性的女性群体来训练所述算法。在一些实施方案中,基于包括患有I-IV期子宫内膜异位症的女性的女性群体来训练所述算法。在一些实施方案中,将机器学习算法(例如,随机森林算法)应用于所述表达谱包括将重要性度量分配给miRNA特征,其中miR-342的重要性度量大于miR-150、let-7b或miR-125中的一种。在一些实施方案中,将机器学习算法应用于所述表达谱包括将重要性度量分配给所述miRNA特征,其中miR-125b的重要性度量大于miR-150、let-7b或miR-125中的一种。在一些实施方案中,将机器学习算法应用于所述表达谱包括基于(viii)中的特征来训练所述机器学习算法并将重要性度量分配给所述miRNA特征,其中所述miRNA特征从最高到最低的重要性度量排序为miR-125b、let-7b、miR-2613、miR-150、miR-342和miR-451a。在一些实施方案中,将机器学习算法应用于所述表达谱包括基于(viii)中的特征来训练所述机器学习算法并将重要性度量分配给所述miRNA特征,其中所述miRNA特征的重要性度量(例如特征重要性)从最高到最低排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。在一些实施方案中,将机器学习算法应用于所述表达谱包括基于(viii)中的特征来训练所述机器学习算法并将重要性度量分配给所述miRNA特征,其中所述miRNA特征的重要性度量根据表9进行排序。在一些实施方案中,所述方法还包括使用具有表9中分配的特征重要性的监督学习算法来检测、诊断或评估所述雌性受试者中子宫内膜异位症的风险。在一些实施方案中,所述方法还包括施用子宫内膜异位症治疗以治疗在雌性受试者中检测到或诊断出的子宫内膜异位症。
在一些方面,本公开提供了一种方法,包括:(a)在多个基于网络的非暂时性存储设备中以标准化格式存储与雌性患者的病况相关的信息;(b)通过网络向用户提供远程访问,使得至少一个用户可以通过图形用户界面实时更新与雌性患者的病况相关的信息,其中所述至少一个用户以来自所述雌性患者的miRNA表达谱的形式提供更新的信息;(c)通过内容服务器,使用机器学习算法的应用程序将来自所述雌性患者的miRNA的所述表达谱转换为所述雌性患者患有子宫内膜异位症的可能性;(d)存储所述雌性患者患有子宫内膜异位症的所述可能性;(e)每当更新的信息已被存储时,通过内容服务器自动生成包含所述雌性患者患有子宫内膜异位症的所述可能性的消息;以及(f)通过所述计算机网络将所述消息实时传送到所述用户中的至少一些,使得所述用户能够立即获得所述雌性患者患有子宫内膜异位症的所述可能性。在一些实施方案中,基于一组miRNA特征来训练所述机器学习算法,所述一组miRNA特征选自由以下各项组成的组:(i)miR-342、miR-451a和miR-3613;(ii)miR-342、miR-451a、miR-3613、miR-125b;(iii)miR-342、miR-451a、miR-3613、miR-125b、let-7b;(iv)miR-342、miR-451a、let-7b、miR-125b;(v)miR-342、miR-451a、let-7b、miR-3613;(vi)miR-342、miR-451a、let-7b;(vii)miR-125b、miR-150、miR-342、miR-451a、let-7b;和(viii)miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。在一些实施方案中,所述方法包括从所述受试者获得包括miRNA的样品。在一些实施方案中,所述样品是唾液样品。在一些实施方案中,所述样品是血清样品。在一些实施方案中,所述样品是血液、血浆或血清样品。在一些实施方案中,所述样品是尿液样品。在一些实施方案中,所述样品是体液样品。在一些实施方案中,所述体液是汗液、唾液、泪液、尿液、血液、血浆、血清、阴道液、宫颈-阴道液、全血、月经流出物、经血、脊髓液、肺液或痰。在一些实施方案中,所述机器学习算法是随机森林算法、k最近邻算法(KNN)、支持向量机(SVM)和朴素贝叶斯。在一些实施方案中,所述机器学习算法是随机森林算法。在一些实施方案中,所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。在一些实施方案中,所述女性群体包括在获得样品之日起3个月内已经接受激素疗法的女性。在一些实施方案中,激素疗法包括生育控制药丸或GnRH激动剂。在一些实施方案中,所述方法还包括基于所述重要性度量来检测、诊断或评估所述雌性受试者中子宫内膜异位症的风险。在一些实施方案中,所述方法还包括施用子宫内膜异位症治疗以治疗在所述雌性受试者中检测到或诊断出的子宫内膜异位症。
援引并入
本说明书中提及的所有出版物、专利和专利申请均通过引用全文并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。
附图说明
本发明的新颖特征在所附的权利要求书中特别阐述。通过参考以下对利用到本发明原理的说明性实施方案加以阐述的详细描述和附图,将会获得对本发明的特征和优点的更好的理解,在这些附图中:
图1描绘了对照相对于子宫内膜异位症患者血清中miRNA表达量的散点图和箱线图,证明所有标志物在一定程度上对于鉴定子宫内膜异位症是有效的。数据显示相对于小核RNA基因U6的水平归一化的6种miRNA(miR-125b、miR-451a、miR-3613、miR-150、miR-342和let-7b)的表达水平。绘制数据,其中,中位数用线表示并且四分位数间距(IQR)用箱线标记。根据Tukey方法显示晶须(whisker)和离群值,该方法在小于或等于1.5倍IQR(第25百分位数减去IQR或第75百分位数加上IQR)的点处绘制晶须,其中单独绘制落在此范围之外的点。*p<0.05,***p<0.001,使用曼-惠特尼U检验,然后用Bonferroni校正进行多重比较。
图2描绘了在增生期或分泌期miRNA表达的散点图/箱线图,显示6种miRNA的表达在月经周期的增生期相对于分泌期没有显著变化。数据显示了对照受试者中的miRNA表达水平,由血清取样时的月经周期阶段区分开,并相对于小核RNA基因U6的水平归一化。绘制数据,其中,中位数用线表示并且四分位数间距(IQR)用箱线标记。未发现显著差异(p>0.05,曼-惠特尼U检验)。
图3描绘了有或没有激素治疗的miRNA表达的散点图/箱线图,证明miRNA表达水平根据研究中对受试者的激素施用状态没有显著差异。数据显示通过是否存在激素治疗来(HT)分析子宫内膜异位症受试者中的miRNA表达水平。相对于小核RNA基因U6的水平将水平归一化。绘制数据,其中,中位数用线表示并且四分位数间距(IQR)用箱线标记。未发现显著差异(p>0.05,曼-惠特尼U检验)。
图4描绘了根据rASRM分期的miRNA表达的散点图/箱线图,证明虽然所有标志物区分对照和重度(III/IV)患者,但区分亚组(例如,对照相对于I/II或I/II相对于III/IV)的能力不同。数据显示子宫内膜异位症受试者中的miRNA表达水平,按子宫内膜异位症的时期划分:根据rASRM指南,I/II,轻微/轻度;III/IV,中度/重度。相对于小核RNA基因U6的水平将水平归一化。绘制数据,其中,中位数用线表示并且四分位数间距(IQR)用箱线标记。使用kruskal-wallis检验(非参数单向ANOVA)比较各组,使用邓恩多重比较检验来比较各亚组的成对平均值。*p<0.05,**p<0.01,***p<0.001。
图5描绘了示出独立数据集中的分类器算法的性能的接受者操作特性(ROC)曲线。图线示出使用6种miRNA生物标志物(miR-125b-5p、miR-150-5p、miR-342-3p、miR-451a、miR-3613-5p、let-7b)的随机森林模型的分析。在当前(n=100)数据集(“训练”)中导出模型,并针对回顾性Cosar等人Fertil Steril.2016年8月;106(2):402-9.doi:10.1016/j.fertnstert.2016.04.013(“Cosar”)研究(n=48)数据集(“测试”)来测试。
图6描绘了用于执行本文所述方法的计算机系统示例。
图7描绘了来自回顾性数据集(Cosar)中的RF模型的投票百分比分布的直方图;黑色柱表示患有手术定义的子宫内膜异位症的受试者,白色柱表示没患有子宫内膜异位症的受试者。使用43%的诊断阈值(截止值)(如竖直虚线所示)得到此数据集中的RF模型的96%的特异性和83%的灵敏度。
具体实施方式
概述
考虑到子宫内膜异位症的延迟诊断可能加重女性的成本和负面经历,更快地鉴别和治疗该疾病将会极大地有益于女性,潜在地预防晚期疾病的并发症,包括不孕,同时降低未治疗的子宫内膜异位症的经济负担。尽管腹腔镜检查是目前明确诊断子宫内膜异位症的临床建议,但它给患者带来了成本和风险,并且对于准确鉴定子宫内膜异位症具有局限性,尤其是若在没有组织学确认的情况下进行。对于早期疾病或表现不明确的患者很少进行手术干预。成像方法(诸如超声)可能适用于检测晚期子宫内膜异位症或子宫内膜瘤,但不足以检测大多数疾病,诸如常见的腹膜病变或粘连。
分析生物标志物的组合而不是单个生物标志物可以改善子宫内膜异位症的检测。血清癌抗原CA-125已被用作该疾病的循环标志物,然而它不具有足够的诊断灵敏度或特异性,因为增加的CA-125水平主要反映子宫内膜异位症晚期,并且在其他疾病(例如纤维瘤、卵巢癌、盆腔炎性病症)中也升高。对122种血液生物标志物(包括子宫内膜抗体)的141项研究的系统性综述报道,该综述中所研究的生物标志物均不符合分类或替代诊断测试的标准(参见Nisenblat等人,Cochrane数据库系统版本2016(5):Cd012179)。
本公开提供用于表征、监测和分析来自具有子宫内膜异位症的症状、患有子宫内膜异位症、处于患子宫内膜异位症的风险中或疑似患有子宫内膜异位症的受试者的样品的新型方法。本公开还提供检测、诊断、监测和/或预知此类受试者的方法,以及治疗此类受试者的方法。通常,本文提供的方法涉及检测或定量来自受试者的样品中的生物标志物,特别是非编码RNA(例如,miRNA)。在一些情况下,本文提供的方法涉及机器学习算法的应用。
定义
如本文所用,术语“无细胞”,当用于指核酸时,是指在从身体获得核酸时不与细胞结合的核酸。例如,核酸可以以无细胞状态存在于体液(诸如血液或唾液)中,因为它们不与细胞相关联。然而,在进入血流或其他体液之前,无细胞核酸可能最初已经与细胞(诸如子宫内膜细胞)相关联。相反,仅在体内与细胞相关联的核酸通常不被视为“无细胞的”。例如,如该术语在本文中使用的,直接从细胞提取的核酸通常不被认为是“无细胞的”。
如本文所用,“无细胞样品”通常是指生物样品,特别是生物流体样品,其中细胞不存在或存在的量如此之低,以至于所确定的miRNA水平反映其在样品的液体部分中而不是在细胞部分中的水平。在一些情况下,通过离心、过滤、分馏柱或其他方法获得样品的无细胞部分。在一些情况下,体液可以是天然无细胞的。通常,无细胞体液样品不包含完整细胞;然而,它可以包含细胞片段、外泌体或细胞碎片。在一些情况下,在样品收集后立即处理或使用样品;在一些情况下,将样品储存以备后用。可以使用本领域已知的任何合适的储存方法来储存体液样品,例如,样品可在约-20摄氏度至约-70摄氏度下冷冻。
如本文所用,“无细胞血清”样品通常是在收集后几乎立即处理以避免细胞破坏(诸如通过凝血机制)的血清样品。
本文使用传统的符号来描述多核苷酸序列:单链多核苷酸序列的左手端是5′端;双链多核苷酸序列的左侧方向被称为5′方向。
术语“受试者”、“患者”、“个体”等在本文中可互换使用,并且是指受本文所述方法检验的任何动物。在某些非限制性实施方案中,患者、受试者或个体是人。在一些情况下,本文提供的方法可涉及来自此类受试者、患者或个体的细胞。在一些情况下,该方法可以至少部分地在体外或原位进行。
如本文所用,“微小RNA”或“miRNA”描述小的非编码RNA分子,长度通常为约15至约50个核苷酸,优选17-23个核苷酸,其可通过例如称为RNA干扰(RNAi)的过程在调节基因表达中发挥作用。RNAi描述了通过与靶基因信使RNA(mRNA)中的序列互补或反义的RNA序列的存在导致靶基因表达的抑制的现象。miRNA通常是由约70个或更多个核苷酸的发夹前体(pre-miRNA)处理而成,该前体通过RNA酶III的顺序切割衍生自初级转录物(pri-miRNA)。miRBase是一个综合性的微小RNA数据库,位于www.mirbase.org。通常,miRNA基因被转录成前体或pre miRNA,其然后被加工成成熟miRNA。pre-miRNA通常以发夹形式出现,其中该发夹包含5′臂(或侧),该5′臂(或侧)连接到环,然后连接到3′臂(或侧)。前体miRNA的加工可导致miRNA的两种成熟形式的形成,该两种成熟形式包括衍生自前体miRNA环的5′侧或臂的5p形式以及衍生自前体miRNA发夹的3′侧或臂的3p形式。
如本文所用,“或”可以指“和”、“或”或者“和/或”,并且可以排他性地和包含性地使用。例如,术语“A或B”可以指“A或B”、“A而不是B”、“B而不是A”以及“A和B”。在一些情况下,上下文可指示特定含义。
如本文所用,术语“一个(a)”可以指单数或复数形式,换言之,“一个(a)”一般指“一个或多个”。类似地,术语“一(an)”可指单数或复数形式。
如本文所用,RNA和RNAs可以互换使用,并且可以指单个RNA或多个RNA。类似地,miRNA和miRNAs可互换使用,并且可以指单个miRNA或多个miRNA。
如本文所用,“非编码RNA”(ncRNA)通常是指在细胞中不翻译成蛋白质的内源性RNA分子。ncRNA的示例性类型包括转移RNA(tRNA)、核糖体RNA(rRNA)、微小RNA(miRNA)、piRNA、snoRNA、snRNA、exRNA、scRNA和长ncRNA(诸如Xist和HOTAIR)。在一些实施方案中,如本文所述的用于子宫内膜异位症的测试可涉及确定除了本文所述的特定微小RNA之外的一种或多种非miRNA的ncRNA的水平。
如本文所用,术语“随机森林”是指用于分类、回归和其他任务的集成学习方法,其通过在训练时构建多个决策树并输出类别来操作,所述类别是各个树的类别(分类)的众数或平均值预测(回归)。已经在各种上下文中描述了用于数据分类的随机森林的实现。
如本文所用,术语“支持向量机”(SVM)是指分析用于分类和回归分析的数据的监督学习方法。给定一组训练示例,每个训练示例被标记为属于两个类型中的一个或另一个,SVM训练算法构建将新的示例分配给一个类型或另一个类型的模型,使其成为非概率二元线性分类器(尽管存在诸如Platt scaling的方法以在概率分类设置中使用SVM)。SVM模型是作为空间中的点的示例的呈现,其被映射以使得单独类型的示例被尽可能宽的明显间隔划分。然后,新的示例被映射到相同的空间中,并被预测为属于基于它们落在其上的间隔侧的类型。
如本文所用,术语“测序”通常是指用于确定一个或多个多核苷酸中的核苷酸碱基序列的方法和技术。多核苷酸可以是例如核酸分子诸如脱氧核糖核酸(DNA)或核糖核酸(RNA),包括其变体或衍生物(例如单链DNA)。目前可用的各种系统都可以进行测序,例如但不限于
Figure BDA0003443165710000231
Pacific Biosciences
Figure BDA0003443165710000232
Oxford
Figure BDA0003443165710000233
或LifeTechnologies(Ion
Figure BDA0003443165710000234
)的测序系统。可选地或另外地,可以使用核酸扩增、聚合酶链反应(PCR)(例如数字PCR、定量PCR或实时PCR)或等温扩增进行测序。这样的系统可以提供对应于受试者(例如,人)的遗传信息的多个原始遗传数据,如同由系统从受试者提供的样品产生的。在一些示例中,此类系统提供测序读段(本文中也称为“读段”)。读段可包括对应于已被测序的核酸分子的序列的一串核酸碱基。
术语“衔接子”,“衔接头”可以同义地使用。衔接子或标签可通过任何方法与多核苷酸序列偶联,包括连接、杂交、引物延伸或其他方法。可将衔接子或标签添加至核酸以促进与测序流细胞的附接,从而促进测序引物与核酸的结合或用于对混合物中核酸序列的单独拷贝进行计数(例如,用作唯一分子标识符)。
在各种实施方案中,可以使用涉及计算ΔCT的“德尔塔CT方法”或“ΔCT方法”将靶分析物的量归一化为归一化物对照。在某些实施方案中,通过从用于检测靶分析物的定量核酸检测测定(例如qPCR测定)的CT(循环阈值)中减去用于检测归一化物对照的定量核酸检测测定(例如qPCR测定)的CT来计算ΔCT。在某些实施方案中,由ΔCT计算归一化物对照的量和靶分析物的量的倍数差异-在某些实施方案中,根据式2-ΔCT由ΔCT计算归一化物对照的量和靶分析物的量的倍数差异。在一些实施方案中,所述归一化物对照是管家核酸(例如编码管家多肽的DNA或RNA)。在一些情况下,所述归一化物对照是小核RNA基因U6。
受试者
本文所述的方法和组合物适用于人类和非人类受试者,包括兽医受试者。优选的受试者是“患者”——正在接受针对疾病或病况(例如,子宫内膜异位症)的医疗护理的活人,或者疑似患有这样的疾病或病况的活人,或者有患这样的疾病或病况的风险的活人。这包括正在调查病理学体征(例如,子宫内膜异位症)的没有明确疾病的人。
本文所述的方法和组合物的优选患者或受试者是处于青春期或青春期后、绝经期前、围绝经期或绝经期后(因为绝经期后子宫内膜异位症可能持续存在)的雌性患者。因此,一般而言,本文提供的方法和组合物可用于较大年龄范围的通常超过10岁或超过18岁的女性受试者。通常,所述受试者年龄在49岁以下。在一些情况下,所述受试者是绝经前的。在一些情况下,所述受试者是绝经前的且超过18岁。在一些情况下,所述受试者是绝经前的且在49岁以下。所述受试者可以处于月经周期的任何阶段,例如黄体期或增生期。
在一些情况下,受试者可能有患子宫内膜异位症的风险。例如,有患子宫内膜异位症风险的受试者可能具有子宫内膜异位症的家族史、子宫内膜异位症的症状或子宫内膜异位症的既往病史。子宫内膜异位症可以是子宫内膜异位症的任何时期。在一些情况下,所述受试者患有或疑似患有I期、II期、III期或IV期子宫内膜异位症。在一些情况下,所述受试者患有或疑似患有子宫内膜瘤。在一些情况下,所述受试者患有任何时期(例如,I-IV期)的子宫内膜异位症,但本文提供的方法检测作为受试者的一般病况的子宫内膜异位症,而不指定时期。在一些情况下,所述受试者患有早期子宫内膜异位症。在一些情况下,所述受试者为I/II期子宫内膜异位症。在一些情况下,所述受试者患有III/IV期子宫内膜异位症。
在一些情况下,受试者可能疑似患有子宫内膜异位症。这样的受试者可能不表现出子宫内膜异位症的症状。但在其他情况下,这样的受试者可能表现出子宫内膜异位症的症状,诸如痛经、排便或排尿疼痛、深度性交困难、慢性下腹痛、慢性下背痛、附件肿块、不孕或过度出血。在一些情况下,由于子宫内膜异位症先前或同时测试的结果,所述受试者可能疑似患有子宫内膜异位症。在一些情况下,受试者疑似由于多种因素而患有子宫内膜异位症。例如,由于在与子宫内膜异位症一致的总体临床背景中存在症状,所述受试者可能疑似患有子宫内膜异位症。
在一些情况下,受试者可能患有或疑似患有非子宫内膜异位症的病况。通常,本文所用的术语“非子宫内膜异位症病况”是指不是子宫内膜异位症的异常生殖病况。非子宫内膜异位症病况的非限制性示例包括纤维瘤、平滑肌瘤、囊肿、皮样囊肿、浆液性囊腺瘤、囊腺瘤、卵巢囊肿、粘液性囊腺瘤、盆腔感染、畸胎瘤和/或输卵管旁囊肿。在一些情况下,此类受试者可表现出子宫内膜异位症的症状,诸如痛经、排便或排尿疼痛、深度性交困难、慢性下腹痛、慢性下背痛、附件肿块、不孕或过度出血。在一些情况下,所述非子宫内膜异位症病况是良性的。在一些情况下,所述非子宫内膜异位症病况是恶性的。
在一些情况下,受试者可能正在接受激素治疗。所述激素治疗可以包括促性腺激素释放激素(GnRH)激动剂(用或没用雌激素/孕酮替代疗法或替勃龙治疗)和拮抗剂、释放左炔诺孕酮的子宫内装置(例如Mirena)、达那唑、抗孕酮、孕三烯酮、芳香酶抑制剂、选择性雌激素受体调节剂(SERM)或选择性孕酮受体调节剂(SPRM)。
样品
样品优选为体液样品。体液可以是汗液、唾液、眼泪、尿液、血液、血浆、血清、阴道液、宫颈阴道液、全血、月经流出物(例如,经血)、脊髓液、肺液、痰液或任何其他体液。在优选的实施方案中,样品是唾液或月经流出物(例如,经血)样品。在一些情况下,样品包括白细胞(WBC)。在一些实施方案中,样品是血浆样品。在一些实施方案中,样品是无细胞或非细胞的血液、血浆或血清样品。在一些实施方案中,样品是通过静脉穿刺收集到没有添加剂(例如,没有抗凝血剂或凝血剂)的收集管中,然后离心(例如,在2500xg下)以除去细胞的血液样品。在一些情况下,对样品(例如,血液、血清、血浆等)进行离心、过滤、分级分离或其他方法。在一些情况下,样品包括外周血单核细胞(PBMC);在一些情况下,样品包括外周血淋巴细胞(PBL)。如本文所用,术语“唾液”不包括痰液,因为痰液属于粘液或痰样品。在一些实施方案中,唾液、外周血样品或月经流出物(例如,血液)可通过合适的方法(例如,离心、过滤)分离为细胞和非细胞部分。在一些实施方案中,核酸(例如,miRNA或ncRNA)可从细胞(例如,含细胞)或非细胞(例如,不含细胞)部分提取。在一些实施方案中,如本文所述的miRNA或ncRNA表达的分析可在任何样品(例如,血液、血浆、血清、唾液、经血、月经流出物等)的含细胞的或非细胞的部分上进行。
在一些情况下,样品包括组织,诸如来自活检的组织。在一些情况下,组织是子宫内膜组织。
在一些实施方案中,样品包括无细胞非编码RNA(例如,无细胞miRNA)。在一些情况下,样品包含纯化的或提取的非编码RNA(例如,miRNA)。在一些实施方案中,样品包括外泌体封装的非编码RNA(例如,miRNA)。在一些实施方案中,样品包括细胞封装(例如,通过白细胞)的非编码RNA(例如,miRNA)。
样品收集
如本文所用,“获得样品”包括直接或间接获得样品,包括对样品进行获取(例如,从直接从受试者获得样品的第三方)。在一些实施方案中,样品由随后从样品获取生物标志物数据的同一方(例如,测试实验室)从受试者获取。在一些实施方案中,样品由从受试者收集样品的另一实体(例如,医师、护士、抽血者或其他医疗护理提供者)接收(例如,由测试实验室接收)。在一些实施方案中,样品由医疗专业人员在单独实体(例如,测试实验室)的指导下从受试者获取,并随后提供给所述实体(例如,测试实验室)。在一些实施方案中,样品由受试者或受试者的看护者(例如,家庭成员、家庭健康助理)在家中提取,随后提供给从样品获取生物标志物数据的一方(例如,测试实验室)。
在一些实施方案中,可从受试者获得血液的测试样品。在一些实施方案中,血液样品是外周血样品。在一些实施方案中,血液样品是全血样品。在一些实施方案中,样品是血液样品,并且包括全血、外周血、血清、血浆、PBL、PBMC、T细胞、CD4 T细胞、CD8 T细胞或巨噬细胞。可以通过诸如抽血等微创方法获得血液样品。可以通过静脉穿刺获得血液样品。
在一些实施方案中,唾液的测试样品可从受试者获得。获得唾液样品的方法可包括但不限于从受试者的口中排出(例如,吐出)、抽吸或者用拭子或其他收集工具取出。从唾液中提取RNA分子的方法可见于例如Pandit,P等人,Clin Chem.2013年7月;59(7):1118-22。各种唾液收集和回收装置(以清洁的方式收集样品,并提供用于样品中核酸的稳定化)可作为试剂盒获得,并且可从商业供应商处获得并且适用于本公开内容的方法,所述商业供应商诸如DNA Genotek(例如,Oragene-RNA以及US20110212002A1和WO2008040126A1中描述的产品)和Norgen Biotek。这样的试剂盒适合于患者单独使用,或在医疗护理提供者(例如,医师)的最小帮助下使用。
收集后,可通过添加抗微生物剂(例如,Normocin、叠氮化钠)、RNA酶抑制剂(例如,聚乙烯基磺酸、
Figure BDA0003443165710000271
)、通过在有机溶液(例如,Trizol、苯酚-氯仿、苯酚-氯仿-异戊醇)中破坏、或通过在洗涤剂与广谱蛋白酶(例如,SDS与蛋白酶K)的组合中破坏来稳定样品(例如,唾液)。
RNA(例如,miRNA)表达谱分析
本文公开的方法、试剂盒和系统可包括对生物样品内的RNA(例如,ncRNA、miRNA)进行特异性地检测、谱分析或量化以确定表达谱。在一些情况下,可以从生物样品分离RNA(例如,miRNA、ncRNA)。在一些情况下,可以从无细胞来源分离RNA(例如,miRNA、ncRNA)。
在一些情况下,表达水平是通过基于杂交的方法确定的,诸如Northern印迹、Southern印迹、分子信标、分子倒置探针或微阵列杂交。在一些情况下,基于杂交的方法涉及探针与靶RNA(例如,ncRNA、miRNA)的杂交,或多种不同探针与不同靶RNA(例如,ncRNA、miRNA)的杂交。
在一些情况下,通过扩增过程或通过聚合酶链反应(PCR)确定表达水平。在一些情况下,表达水平通过定量PCR、实时PCR、反转录酶PCR或其他类型的PCR确定。PCR可以包括使用探针,诸如TaqMan探针。
在一些情况下,通过测序确定表达水平。测序的示例可以包括Sanger测序、高通量测序、焦磷酸测序、边连接边测序(sequencing-by-ligation)、边合成边测序(sequencingby synthesis)、边杂交边测序(sequencing-by-hybridization)、RNA-seq(Illumina)、数字基因表达(Helicos)、下一代测序、边合成边单分子测序(SMSS)(Helicos)、大规模平行测序、克隆单分子阵列(Solexa)、鸟枪法测序、Maxim-Gilbert测序、引物步移或其任何组合。在一些实施方案中,测序可首先涉及反转录酶和/或PCR扩增步骤以增加待分析的miRNA的丰度或添加适当的测序衔接子。测序可以通过目前可用的各种系统进行,例如但不限于
Figure BDA0003443165710000281
Pacific Biosciences
Figure BDA0003443165710000282
Oxford
Figure BDA0003443165710000283
或Life Technologies(Ion
Figure BDA0003443165710000284
)的测序系统。可选地或另外地,可使用核酸扩增、聚合酶链反应(PCR)(例如数字PCR、定量PCR或实时PCR)或等温扩增进行测序。测序的示例可以包括Sanger测序、下一代测序和RNA测序。
生物标志物RNA(例如,miRNA、ncRNA)
本文中的方法和组合物可涉及从患者样品检测与子宫内膜异位症相关的一种或多种ncRNA(例如,miRNA)(例如,检测至少一种ncRNA的存在或不存在)或测量与子宫内膜异位症相关的一种或多种miRNA或ncRNA的水平,以检测、预测或监测子宫内膜异位症的严重程度。在一些情况下,多于一种miRNA的检测还包括将经训练的算法应用于与子宫内膜异位症相关的多于一种miRNA或ncRNA的表达水平。适于应用的经训练的算法包括本文描述的任何分类算法。在一些情况下,所述经训练的算法是机器学习算法。在一些情况下,所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)和朴素贝叶斯。
在一些情况下,使用的miRNA的分类器组包括miR-125b,miR-150、miR-342、miR-3613、miR-451a和let-7b的任意数量或组合中的至少一种。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451和miR-3613。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451、miR-3613和miR-125。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451、miR-3613、miR-125和let-7。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451、let-7和miR-125。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451、let-7和miR-3613。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451和let-7。在一些情况下,使用的miRNA的分类器组是miR-125、miR-150、miR-342、miR-451和let-7。在一些情况下,使用的miRNA的分类器组是miR-125、miR-150、miR-342、miR-3613、miR-451和let-7。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a和miR-3613。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、miR-3613和miR-125b。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、miR-3613、miR-125b和let-7b。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、let-7b和miR-125b。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、let-7b和miR-3613。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a和let-7b。在一些情况下,使用的miRNA的分类器组是miR-125b、miR-150、miR-342、miR-451a和let-7b。在一些情况下,使用的miRNA的分类器组是miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。在一些情况下,使用的miRNA的分类器组是miR-342-3p、miR-451a和miR-3613-5p。在一些情况下,使用的miRNA的分类器组是miR-342-3p、miR-451a、miR-3613-5p和miR-125b-5p。在一些情况下,使用的miRNA的分类器组是miR-342-3p、miR-451a、miR-3613-5p、miR-125b-5p和let-7b-5p。在一些情况下,使用的miRNA的分类器组是miR-342-3p、miR-451a、let-7b-5p和miR-125b-5p。在一些情况下,使用的miRNA的分类器组是miR-342-3p、miR-451a、let-7b-5p和miR-3613-5p。在一些情况下,使用的miRNA的分类器组是miR-342-3p、miR-451a和let-7b-5p。在一些情况下,使用的miRNA的分类器组是miR-125b-5p、miR-150-5p、miR-342-3p、miR-451a和let-7b-5p。在一些情况下,使用的miRNA的分类器组是miR-125b-5p、miR-150-5p、miR-342-3p、miR-3613-5p、miR-451a和let-7b-5p。
治疗
在一些实施方案中,本公开的方法包括向患有子宫内膜异位症、有发展为子宫内膜异位症的风险或疑似患有子宫内膜异位症的患者分配或施用治疗。通过使用本文所述的分类器或miRNA检测患者的临床状态,可对患有子宫内膜异位症的患者分配或施用适当的治疗。这些治疗可包括但不限于激素疗法、化学疗法、免疫疗法和手术治疗。类似地,本公开的方法可用于向由于子宫内膜异位症而生育力降低的患者分配或施用治疗。以这种方式,通过检测本文发现的生物标志物来确定患者生育力已降低的程度,可以分配或施用适当的治疗。相关治疗包括但不限于激素疗法、化学疗法、免疫疗法和手术治疗。
在一些实施方案中,患者的生物样品中一种或多种miRNA(例如循环miRNA)的水平或输出由其确定的临床病况的分类器用于检测、诊断、监测或预知患者的疾病(例如子宫内膜异位症)。在一些实施方案中,可以将从患者获得的测试样品中的一种或多种miRNA(例如,循环miRNA)的水平与在先前时间点从所述患者获得的参考样品的水平进行比较。在一些情况下,临床监测所述患者;而且在一些情况下,所述患者可以作为她自己的基线对照。例如,一种或多种miRNA(例如循环miRNA)水平的增加或减少的变化可指示患者中子宫内膜异位症的发展。在一些实施方案中,在多个时间点获得测试样品。在这些实施方案中,所述测量测试样品中一种或多种miRNA(例如循环miRNA)的水平为患者提供是否患有子宫内膜异位症或处于患有子宫内膜异位症风险中的指示。在一些情况下,将从患者获得的测试样品中的一种或多种miRNA(例如循环miRNA)的水平与来自不同患者的参考样品、或不同患者的复合物或平均值的水平进行比较。
在一些实施方案中,患者的生物样品中一种或多种miRNA(例如循环miRNA)的水平(或输出由其确定的临床病况的分类器)用于监测治疗的有效性或疾病预后。在一些实施方案中,可以将从经治疗的患者获得的测试样品中的一种或多种miRNA(例如,循环miRNA)的水平与在治疗开始之前从该患者获得的参考样品的水平进行比较。治疗的临床监测通常需要患者作为他或她自己的基线对照。在一些实施方案中,在施用治疗后的多个时间点获得测试样品。在这些实施方案中,测量测试样品中一种或多种miRNA(例如循环miRNA)的水平提供治疗的体内作用程度和持续时间的指示。在一些情况下,将获自经治疗患者的测试样品中的一种或多种miRNA(例如循环miRNA)的水平与来自不同患者的参考样品、或不同患者的复合物或平均值的水平进行比较。
生物标志物水平(或分类状态)的测量可以允许监测疾病的治疗过程。对疾病的治疗方案的有效性可以通过如下来监测:检测随时间变化从受试者获得的样品中有效量的一种或多种生物标志物并比较检测的生物标志物的量。例如,可以在受试者接受治疗之前获得第一样品,并且在受试者的治疗后或期间获得一个或多个后续样品。样品中生物标志物水平的变化可以提供关于治疗有效性的指示。
在一些实施方案中,本公开提供了用于监测响应于治疗的miRNA(或临床病况,诸如子宫内膜异位症或非子宫内膜异位症)的水平的方法。例如,在一些实施方案中,本公开提供了通过测量本文所述的一种或多种miRNA的水平来确定受试者中的治疗效果的方法。在一些实施方案中,可以随时间测量一种或多种miRNA的水平,其中将治疗开始后一个时间点的水平与治疗开始后另一个时间点的水平进行比较。在一些实施方案中,可以随时间测量一种或多种miRNA的水平,其中将治疗开始后一个时间点的水平与治疗开始前的水平进行比较。
本公开提供用于治疗或预防子宫内膜异位症的疗法(例如,药物、手术)。用于子宫内膜异位症治疗的已知方法和材料的非限制性列表包括但不限于止痛剂、激素治疗、化疗和手术治疗。在一些情况下,其中通过本文提供的方法检测到子宫内膜异位症的患者或受试者可经历另外的测试或程序以确认子宫内膜异位症。例如,患者或受试者可进行手术(例如,腹腔镜手术)以进一步诊断或表征子宫内膜异位症,例如,子宫内膜异位症的时期;或治疗子宫内膜异位症。用于治疗子宫内膜异位症的止痛剂包括简单的镇痛药,例如扑热息痛、COX-2抑制剂、阿司匹林和本领域公知的其他非甾体抗炎药,和麻醉性镇痛药,例如吗啡、可待因、羟考酮和本领域公知的其他镇痛药。激素治疗包括但不限于口服避孕药、孕激素(诸如地屈孕酮、醋酸甲羟孕酮、长效醋酸甲羟孕酮(Depot medroxyprogesterone acetate)、炔诺酮、左炔诺孕酮)、孕酮和孕酮样物质、GnRH激动剂(诸如亮丙瑞林、布舍瑞林、戈舍瑞林、组氨瑞林(histrelin)、地洛瑞林、那法瑞林和曲普瑞林(triptorelin))、雄激素和合成雄激素如达那唑、GnRH激动剂(例如恶拉戈利(Elagolix))(用或不用雌激素/孕酮替代疗法或替勃龙治疗)、释放左炔诺孕酮的子宫内装置(例如Mirena)、达那唑、抗孕酮、孕三烯酮、选择性雌激素受体调节剂(SERM)或选择性孕酮受体调节剂(SPRM)和芳香酶抑制剂。手术治疗包括但不限于腹腔镜手术、子宫切除术和卵巢切除术。特别适用于本公开的其他治疗是本领域公知的。在一些实施方案中,可以使用他汀类治疗患者,包括但不限于阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀和辛伐他汀。
本公开提供用于治疗或预防非子宫内膜异位症病况的疗法(例如,药物、手术)。用于非子宫内膜异位症治疗的已知方法和材料的非限制性列表包括但不限于止痛剂、抗生素、化疗和手术治疗。止痛剂可以包括简单的镇痛药,例如扑热息痛、COX-2抑制剂、阿司匹林和本领域公知的其他非甾体抗炎药,和麻醉性镇痛药,例如吗啡、可待因、羟考酮和本领域公知的其他镇痛药。手术治疗包括但不限于腹腔镜手术、子宫切除术和卵巢切除术。在一些情况下,患者或受试者可以在来自本文所述的子宫内膜异位症测试或测定的阴性结果后经历另外的测试或监测。例如,此类受试者或患者可以测试非子宫内膜异位症的疾病或病况,例如癌症、良性囊肿、纤维瘤等。在一些情况下,在阴性结果之后,受试者或患者可等待合理的时间量(例如超过一周、超过一个月、超过6个月)并且再次测试子宫内膜异位症。在一些情况下,此类测试可通过本文提供的方法进行。在一些情况下,响应于阴性子宫内膜异位症结果,受试者或患者可避免经历手术干预(例如腹腔镜手术)。
样品分类
根据本公开方法的miRNA存在和/或表达数据(例如,表示来自患者样品的特定miRNA的存在或不存在或水平的数据)可用于分类样品。例如,可以将样品分类为或预测为:a)来自患有子宫内膜异位症的患者或b)来自不患有子宫内膜异位症的患者。许多统计分类技术适合作为执行这种分类的方法。在监督学习方法中,用统计分类方法分析或处理来自两组或更多组(例如,患有或不患有子宫内膜异位症)中的一组样品。miRNA的不存在/存在或表达水平可用作区分两个或多个组的分类器的基础。然后可以分析或处理新的样品,使得分类器可以将新的样品与两组或更多组中的一组相关联。通常使用的监督分类器包括但不限于神经网络(多层感知器)、支持向量机、k-最近邻、高斯混合模型、高斯、朴素贝叶斯、决策树和径向基函数(RBF)分类器。线性分类方法包括Fisher线性判别、逻辑回归、朴素贝叶斯分类器、感知器和支持向量机(SVM)。与根据本公开的方法一起使用的其他分类器包括二次分类器、k-最近邻、提升方法、决策树、随机森林、神经网络、模式识别、贝叶斯网络和隐马尔科夫模型(Hidden Markov model)。通常用于监督学习的其他分类器,包括这些分类器的任何改进或组合,也可适用于本文所述的方法。
使用监督方法的分类通常通过以下方法进行:
1.收集训练集。例如,这些可包括来自患有子宫内膜异位症的患者样品的本文所述的一种或多种miRNA的表达水平或来自不患有子宫内膜异位症的患者样品的本文所述的一种或多种miRNA的表达水平。所述训练样品用于“训练”分类器。
2.确定学习函数的输入“特征”表示。学习函数的准确性取决于如何表示输入对象。通常,输入对象被转换为特征向量,其包含描述所述对象的多个特征。所述特征可以包括在来自患者或受试者的样品中检测到的一组miRNA。
3.确定学习函数的结构和相应的学习算法。选择学习算法,例如人工神经网络、决策树、贝叶斯分类器或支持向量机。使用学习算法构建分类器。
4.构建分类器(例如,分类模型)。在所收集的训练集上运行所述学习算法。可以通过优化在训练集的子集(称为验证集)上的执行或经由交叉验证来调整学习算法的参数。在参数调整和学习之后,可以在与训练集分离的原始样品的测试集上测量算法的性能。所构建的模型可以包括分配给各个特征的特征系数或重要性度量。
在一些情况下,个体特征是miRNA或miRNA的水平。在一些情况下,miRNA的水平是归一化值、平均值、中值、平均值、调整平均值或其他调整水平或值。个体特征可以包括miRNA的集合或分组(panel),诸如本文提供的集合或由其组成。
在一些情况下,机器学习算法具有分配给miRNA特征的重要性度量或特征重要性。在某些情况下,重要性度量或特征重要性是预先确定的;例如,重要性度量可以是通过对先前数据集的训练已经得出的。在一些情况下,分配给miR-342的重要性度量大于分配给一或多种其他miRNA(例如miR-150、miR-3613、miR-451a、let-7b或miR-125b或与子宫内膜异位症相关的其他miRNA)的重要性度量或特征重要性。在一些情况下,分配给miR-451a的重要性度量大于分配给miR-3613、miR-125b或let-7b中的一种或多种的重要性度量。
在一些实施方案中,将机器学习算法(例如随机森林算法)应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量大于miR-150、let-7b或miR-125中的至少一种。在一些实施方案中,将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b或miR-125中的至少一种。在一些实施方案中,miRNA特征的重要性度量或特征重要性从最高到最低的排序为miR-125b、let-7b、miR-2613、miR-150、miR-342和miR-451a(或其任何子集)。在一些实施方案中,miRNA特征的重要性度量(例如特征重要性)从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
在一些实施方案中,将机器学习算法(例如随机森林算法)应用于源自唾液样品的所述miRNA的表达谱。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-125b的重要性大于let-7b、miR-3613、miR-150、miR-342或miR-451a中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中let-7b的重要性度量或特征重要性大于miR-3613、miR-150、miR-342或miR-451a中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-3613的重要性度量或特征重要性大于miR-150、miR-342或miR-451a中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-150的重要性度量或特征重要性大于miR-342或miR-451a中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量或特征重要性大于miR-451a。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-451a的重要性度量或特征重要性小于miR-341、miR-150、miR-3613、let-7b或miR-125b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量或特征重要性小于miR-125b、let-7b、miR-3613或miR-150中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-150的重要性度量或特征重要性小于miR-3613、let-7b或miR-125b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-3613的重要性度量或特征重要性小于miR-125b或let-7b。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中let-7b的重要性度量或特征重要性小于miR-125b。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miRNA的重要性度量或特征重要性的顺序为miR-125b、let-7b、miR-3613、miR-150、miR-342和miR-451a。
在一些实施方案中,将机器学习算法(例如,随机森林算法)应用于源自样品(例如,血清样品)的miRNA的表达谱。在一些实施方案中,应用此类机器学习算法涉及应用具有分配给特定miRNA特征的重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量或特征重要性大于miR-125b、miR-451a、miR-3613、miR-150或let-7b中的至少一种。在一些实施方案中,miR-125b的重要性度量或特征重要性大于miR-451a、miR-3613、miR-150或let-7b中的至少一种。在一些实施方案中,miR-451a的重要性度量或特征重要性大于miR3613、miR-150或let-7b中的至少一种。在一些实施方案中,miR-3613的重要性度量或特征重要性大于miR-150或let-7b。在一些实施方案中,miR-150的重要性度量或特征重要性大于let-7b。在一些实施方案中,let-7b的重要性度量或特征重要性小于miR-150、miR-3613、miR-451a、miR-125b或miR-342中的至少一种。在一些实施方案中,miR-150的重要性度量或特征重要性小于miR-3613、miR-451a、miR-125b或miR-342中的至少一种。在一些实施方案中,miR-3613的重要性度量或特征重要性小于miR-451a、miR-125b或miR-342中的至少一种。在一些实施方案中,miR-451a的重要性度量或特征重要性小于miR-125b或miR-342。在一些实施方案中,miR-125b的重要性度量或特征重要性小于miR-342。在一些实施方案中,miRNA的重要性度量或特征重要性度量或特征重要性的顺序为miR-342、miR-125b、miR-451a、miR-3613、miR-150和let-7b。
在一些实施方案中,将机器学习算法(例如,随机森林算法)应用于源自样品(例如,血清样品)的所述miRNA的表达谱。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量或特征重要性大于miR-451a、miR-3613、miR-125b、let-7b或miR-150中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-451a的重要性度量或特征重要性大于miR-3613、miR-125b、let-7b或miR-150中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-3613的重要性度量或特征重要性大于miR-125b、let-7b或miR-150中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-125b的重要性度量或特征重要性大于let-7b或miR-150。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中let-7b的重要性度量或特征重要性大于miR-150。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-150的重要性度量或特征重要性小于let-7b、miR-125b、miR-3613、miR-451a或miR-342中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中let-7b的重要性度量或特征重要性小于miR-125b、miR-3613、miR-451a或miR-342中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-125b的重要性度量或特征重要性小于miR-3613、miR451a或miR-342中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-3613的重要性度量或特征重要性小于miR-342或miR-451a。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-451a的重要性度量或特征重要性小于miR-342。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miRNA的重要性度量或特征重要性的顺序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
在一些实施方案中,将机器学习算法(例如,随机森林算法)应用于源自样品(例如,血清样品)的所述miRNA的表达谱。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-125b的重要性度量或特征重要性大于miR-3613、miR-451a、miR-150、miR-342或let-7b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-3613的重要性度量或特征重要性大于miR-451a、miR-150、miR-342或let-7b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-451a的重要性度量或特征重要性大于miR-150,miR-342或let-7b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-150的重要性度量或特征重要性大于miR-342或let-7b。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量或特征重要性大于let-7b。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中let-7b的重要性度量或特征重要性小于miR-342、miR-150、miR-451a、miR-3613或miR-125b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-342的重要性度量或特征重要性小于miR-150、miR-451a、miR-3613或miR-125b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-150的重要性度量或特征重要性大于miR-451a、miR-3613或miR-125b中的至少一种。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-451a的重要性度量或特征重要性小于miR-3613或miR-125b。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miR-3613的重要性度量或特征重要性小于miR-125b。在一些实施方案中,应用此类机器学习算法包括应用具有分配给miRNA特征的特定重要性度量或特征重要性的机器学习算法,其中miRNA的重要性度量或特征重要性的顺序为miR-125b、miR-3613、miR-451a、miR-150、miR-342和let-7b。
一旦分类器(例如分类模型)如上文所述确定(“训练的”),其可用于分类样品,例如包括根据本文所述方法分析或处理的miRNA的患者样品。
无监督学习方法也可以与本文描述的方法一起使用。聚类是一种无监督学习方法,其中聚类算法在不使用标签的情况下关联一系列样品。最相似的样品被分类为“群集”。一个新的样品可以被分类到一个群集中,从而与它最紧密关联的其他成员一起分类。
本文提供的方法可以包括使用经过训练的分类器或算法来分析样品数据,特别是用于检测子宫内膜异位症。在一些情况下,使用来自样品的RNA(例如,miRNA、ncRNA)水平来开发或训练本文提供的算法或分类器。在一些情况下,在来自无症状患者或具有子宫内膜异位症的一种或多种症状的患者的样品中测量RNA水平(例如,miRNA、ncRNA水平),并对所得数据应用分类器或算法(例如,经训练的算法),以便检测、预测或监测子宫内膜异位症。
多维分类器(例如,算法)的训练可以使用许多样品来执行。例如,可以使用至少约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200个或更多个样品来执行多维分类器的训练。在一些情况下,可以使用至少约200、210、220、230、240、250、260、270、280、290、300、350、400、450、500个或更多个样品来执行多维分类器的训练。在一些情况下,可以使用至少约525、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、2000个或更多个样品来执行多维分类器的训练。
本文进一步公开了分类器组和产生一种或多种分类器组的方法。分类器组可单独地或以任何组合包括一种或多种RNA(例如,miRNA、ncRNA),诸如let-7a、let-7b、let-7c、let-7d、let-7e、let-7f、miR-135a、miR-135b、miR-18a、miR-125b、miR-143、miR-145、miR-150、miR-342、miR-451a、miR-500a、miR-3613和miR-6755。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a和miR-3613。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、miR-3613和miR-125b。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、miR-3613、miR-125b和let-7b。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、let-7b和miR-125b。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a、let-7b和miR-3613。在一些情况下,使用的miRNA的分类器组是miR-342、miR-451a和let-7b。在一些情况下,使用的miRNA的分类器组是miR-125b、miR-150、miR-342、miR-451a和let-7b。在一些情况下,使用的miRNA的分类器组是miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。
分类器和/或分类器探针组可用于将样品判定为健康(例如,为源自健康受试者)或从健康排除。例如,分类器可用于将样品分类为来自健康受试者的样品。或者,分类器可用于将样品分类为来自不健康受试者(例如,为源自不健康受试者)的样品。备选地或附加地,分类器可用于将样品判定为子宫内膜异位症(例如,为源自患有子宫内膜异位症的受试者)或从子宫内膜异位症排除。例如,分类器可用于将样品分类为来自患有子宫内膜异位症的受试者的样品。在另一个示例中,分类器可用于将样品分类为来自未患子宫内膜异位症的受试者的样品。
本文公开的方法可包括将分类分配给来自一个或多个受试者的一个或多个样品。将分类分配给样品可包括将算法应用于来自样品的一种或多种RNA(例如,miRNA、ncRNA)的水平。
该算法可提供其输出的记录,该输出包括样品的分类和/或置信水平。在一些情况下,该算法的输出可以是受试者患有病况如子宫内膜异位症的可能性。
该算法可以是经训练的算法。该算法可以包括线性分类器。线性分类器可以包括一种或多种线性判别分析、Fisher线性判别、朴素贝叶斯分类器、逻辑回归、感知器、支持向量机或其组合。线性分类器可以是支持向量机(SVM)算法。
该算法可包括一种或多种线性判别分析(LDA)、基本感知器、弹性网络逻辑回归、逻辑回归、(核)支持向量机(SVM)、对角线性判别分析(DLDA)、Golub分类器、基于Parzen的、(核)Fisher判别分类器、k最近邻、迭代式RELIEF、分类树、最大似然分类器、随机森林、最近质心、微阵列预测分析(PAM)、k-medians聚类、模糊C均值聚类、高斯混合模型或其组合。该算法可以包括对角线性判别分析(DLDA)算法。该算法可以包括最近质心算法。该算法可以包括随机森林算法。
本文提供的方法可以以高度的准确性、灵敏度和/或特异性帮助确定患者是否患有子宫内膜异位症。在一些情况下,预测准确性(例如,检测子宫内膜异位症或区分子宫内膜异位症与非子宫内膜异位症的预测准确性)大于55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99.0%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%或99.99%。在一些实施方案中,预测准确性是100%。在一些情况下,灵敏度(例如,检测子宫内膜异位症或区分子宫内膜异位症与非子宫内膜异位症的灵敏度)大于55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99.0%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%或99.99%。在一些实施方案中,灵敏度是100%。在一些情况下,特异性(例如,检测子宫内膜异位症或区分子宫内膜异位症与非子宫内膜异位症的特异性)大于55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99.0%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%或99.99%。在一些情况下,特异性是100%。在一些情况下,该方法的阳性预测值(例如,检测子宫内膜异位症或区分子宫内膜异位症与非子宫内膜异位症的阳性预测值)大于55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99.0%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%或99.99%。在一些情况下,阳性预测值是100%。在本文提供的任何方法中,阈值化后的AUC可以大于0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99、0.995或0.999。相反,该方法可预测或确定受试者是否不具有子宫内膜异位症或处于降低的子宫内膜异位症风险。阴性预测值(例如,检测子宫内膜异位症或区分子宫内膜异位症与非子宫内膜异位症的阴性预测值)可以大于55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99.0%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%或99.99%。在一些情况下,阴性预测值是100%。
在一些情况下,本文提供的方法通过选择最佳截止点来针对特异性进行优化。截止点可以是阈值或截止点,高于该阈值或截止值,将样品表征为来自患有子宫内膜异位症的受试者,并且低于该阈值或截止值,将样品鉴定为来自子宫内膜异位症为阴性的受试者。在一些情况下,当低于截止值时样品被鉴定为来自子宫内膜异位症为阳性的受试者,而当高于截止值时被鉴定为来自子宫内膜异位症为阴性的受试者。在一些情况下,截止点或阈值在接受者操作特性(ROC)曲线上或在投票百分比分布上。在一些情况下,将方法优化以获得特定特异性,例如大于80%特异性、大于85%特异性、大于90%特异性、大于95%特异性、大于98%特异性。在一些情况下,将特异性优化为高于测定灵敏度的值。在一些情况下,将特异性优化为高于某一值,例如高于85%,然后这可能导致测定的灵敏度小于某一值,例如小于95%、小于90%、小于85%、小于80%。在一些情况下,将特异性优化为高于某一值,例如高于90%,然后这可能导致测定的灵敏度小于某一值,例如小于95%、小于90%、小于85%、小于80%。在一些情况下,将特异性优化为高于某一值,例如高于95%,然后这可导致测定的灵敏度小于某一值,例如小于95%、小于90%、小于85%、小于80%。这样的测定可以特别适合于非危及生命的病况,因为它们可以帮助受试者避免当测定与高百分比的假阳性相关时可能发生的不必要的干预,例如手术干预。在一些情况下,所述方法在不同的女性群体中获得本文所述的特异性(例如,大于80%,大于90%)。所述群体可以是超过50名女性、超过100名女性、超过500名女性、超过1000名女性等的群体。所述群体可以包括例如患有一系列良性病况的女性,例如囊肿、纤维瘤、平滑肌瘤、囊腺瘤、慢性盆腔感染、畸胎瘤、输卵管旁囊肿。
在一些情况下,本文提供的方法通过选择最佳截止点来优化灵敏度。截止点可以是阈值或截止值,高于该阈值或截止点,将样品表征为来自患有子宫内膜异位症的受试者,并且低于该阈值或截止点,将样品鉴定为来自子宫内膜异位症为阴性的受试者。在一些情况下,当低于截止值时样品被鉴定为来自子宫内膜异位症为阳性的受试者,而当高于截止值时被鉴定为来自子宫内膜异位症为阴性的受试者。在一些情况下,截止点或阈值在接受者操作特性(ROC)曲线上或在投票百分比分布上。在一些情况下,将方法优化以获得特定的灵敏度,例如大于80%的灵敏度、大于85%的灵敏度、大于90%的灵敏度、大于95%的灵敏度、大于98%的灵敏度。在一些情况下,将灵敏度优化为高于测定的特异性的值。在一些情况下,将灵敏度优化为高于某一值,例如高于85%,然后这可导致测定的特异性小于某一值,例如小于95%、小于90%、小于85%、小于80%。这样的测定可以特别适合于子宫内膜异位症的筛选试验。在一些情况下,所述方法在不同的女性群体中获得本文所述的灵敏度(例如大于80%、大于90%)。所述群体可以是超过50名女性、超过100名女性、超过500名女性、超过1000名女性等的群体。所述群体可以包括例如患有一系列良性病况的女性,例如囊肿、纤维瘤、平滑肌瘤、囊腺瘤、慢性盆腔感染、畸胎瘤、输卵管旁囊肿。
本文公开的方法可以包括将分类分配给来自一个或多个受试者的一个或多个样品。将分类分配给所述样品可以包括将算法应用于来自样品的一种或多种RNA(例如miRNA,ncRNA)的水平。
算法可以提供其输出的记录,包括样品的分类和/或置信水平。在一些情况下,算法的输出可以是受试者患有病况(诸如子宫内膜异位症)的可能性。
在一些方面,本公开提供基于使用本文所述的机器学习算法产生的分类向受试者施用治疗以治疗本文检测的子宫内膜异位症。子宫内膜异位症的治疗包括但不限于止痛药(例如NSAID)、激素治疗、化疗和手术治疗。用于治疗子宫内膜异位症的止痛剂包括简单的镇痛药,例如扑热息痛、COX-2抑制剂、阿司匹林和本领域熟知的其他非甾体抗炎药,和麻醉性镇痛药,例如吗啡、可待因和羟考酮。激素治疗包括但不限于口服避孕药、孕激素(例如去氢孕酮、醋酸甲羟孕酮、长效醋酸甲羟孕酮、炔诺酮、左炔诺孕酮和本领域熟知的其他药物)、孕酮和孕酮样物质、GnRH激动剂(例如亮丙瑞林、布舍瑞林、戈舍瑞林、组氨瑞林、地洛瑞林、那法瑞林、曲普瑞林和亮丙瑞林(leuprolin))、雄激素和合成雄激素(例如达那唑)、GnRH拮抗剂和芳香酶抑制剂。手术治疗包括但不限于腹腔镜手术、子宫切除术和卵巢切除术。
在一些方面,施用GnRH拮抗剂以治疗本文检测的子宫内膜异位症。适于临床施用的多种GnRH拮抗剂包括肽(醋酸戈舍瑞林、布舍瑞林、组氨瑞林、地洛瑞林、那法瑞林和曲普瑞林、亮丙瑞林)和非肽(恶拉戈利/ABT-620,NBI-56418,参见例如Taylor等人,N EnglJMed.2017年7月6日;377(1):28-40)可用于患有难治性子宫内膜异位症的个体的子宫内膜异位症的二线治疗。
在一些实施方案中,上述流体样品收集和诊断在限定的时间段(例如1个月、6个月或1年)后进行,并且在未检测到子宫内膜异位症时,下调用于治疗子宫内膜异位症的药物(例如本文所述的任何激素类似物或拮抗剂)的初始剂量。在一些实施方案中,上述流体样品收集和诊断在限定的时间段(例如1个月、6个月或1年)后进行,并且当检测到子宫内膜异位症时,上调节药物的初始剂量。在一些实施方案中,上述流体样品收集和诊断在限定的时间段(例如,1个月、6个月或1年)后进行,并且当未检测到子宫内膜异位症时终止药物的施用。
计算机实现的方法
可在数字计算机中分析一种或多种RNA(例如,miRNA、ncRNA)的表达水平并将其与受试者的状态(例如,子宫内膜异位症)相关联。任选地,这样的计算机直接连接到接收与miRNA或ncRNA表达水平相关的实验确定的信号的扫描仪等(例如,qPCR系统、多重荧光读板仪、FACS仪器或序列器)。或者,可以通过其他手段输入表达水平。计算机可被编程用于将原始信号转换为表达水平(绝对或相对),将测量的表达水平与一种或多种参考表达水平或这样的值的尺度进行比较,如上所述。该计算机还可被编程用于根据与一种或多种参考表达水平的比较将值或其他指定分配给表达水平,并在表达谱中集合多个基因的此类值或指定。计算机还可被编程用于输出提供子宫内膜异位症存在的指示的值或其他指定,以及用于确定这样的值或指定的任何原始或中间数据。
典型的计算机(参见US 6,785,613,图4和图5)可包括互连主要子系统的总线,该主要子系统诸如中央处理器、系统存储器、输入/输出控制器、经由并行端口的外部设备如打印机、经由显示适配器的显示屏、串行端口、键盘、固定磁盘驱动器和可操作以接收软盘的软盘驱动器。可以连接许多其他设备,诸如经由I/O控制器的扫描仪、连接到串行端口的鼠标或网络接口。该计算机包含持有代码的计算机可读介质,以允许计算机执行各种功能。这些功能包括控制自动仪器、接收输入和递送输出,如上所述。该自动仪器可包括用于递送用于确定表达水平的试剂的机械臂,以及用于执行表达分析的小容器,例如微量滴定孔。
本文提供的方法、系统、试剂盒和组合物还可以能够通过计算机网络生成和传输结果。在一些情况下,首先从受试者(例如,有子宫内膜异位症的一种或多种症状的患者,或无症状患者)收集样品。在一些情况下,对样品进行测定并测量RNA(例如,miRNA、ncRNA)水平。计算机系统可用于分析数据和进行样品分类。结果可以能够经由计算机网络传输给不同类型的最终用户。在一些情况下,受试者(例如,患者)可以能够通过使用能够访问互联网的本地计算机上的独立软件和/或基于web的应用程序来访问结果。在一些情况下,可以经由提供给移动数字处理设备(例如,移动电话、平板计算机等)的移动应用程序来访问结果。在一些情况下,结果可以被医疗护理提供者(例如,医师)访问并帮助他们鉴别和跟踪患者的病况。在一些情况下,结果可用于其他目的,诸如教育和研究。
计算机程序
本文公开的方法、试剂盒和系统可包括至少一个计算机程序或其用途。计算机程序可包括一系列指令,这些指令可在数字处理设备的CPU中执行,被编写以执行指定任务。计算机可读指令可以实现为执行特定任务或实现特定抽象数据类型的程序模块,诸如函数、对象、应用程序编程接口(API)、数据结构等。根据本文提供的公开内容,本领域技术人员将认识到,计算机程序可以用各种语言的各种版本编写。
计算机可读指令的功能可以在各种环境中根据需要进行组合或分布。计算机程序通常可以提供来自一个位置或多个位置的一系列指令。在各种实施方案中,计算机程序部分或全部地包括一个或多个web应用程序、一个或多个移动应用程序、一个或多个独立应用程序、一个或多个web浏览器插件、扩展项、加载项或附加项或其组合。
本文进一步公开了用于对一个或多个样品进行分类的系统及其用途。该系统可包括(a)数字处理设备,其包括被配置用于执行可执行指令的操作系统和存储设备;(b)计算机程序,其包括可由数字处理设备执行以将来自受试者的样品分类的指令,该计算机程序包括:(i)第一软件模块,其被配置为从来自受试者的样品接收一种或多种RNA(例如,miRNA、ncRNA)的RNA(例如,miRNA、ncRNA)表达谱;(ii)第二软件模块,其被配置为分析来自受试者的RNA(例如,miRNA、ncRNA)表达谱;以及(iii)第三软件模块,其被配置为基于包含两个或更多个类别的分类系统对来自受试者的样品进行分类。类别中的至少一个可以选自子宫内膜异位症。分析来自受试者的基因表达谱可包括应用算法。分析基因表达谱可包括对来自受试者的RNA(例如,miRNA、ncRNA)表达谱进行归一化(例如,相对于组成型RNA,诸如小核RNA U6、RNU48、RNU44、U47或RNU6B或其任何组合)。
图6示出了被编程或以其他方式配置用于实现本公开内容的方法(诸如产生选择器集和/或用于数据分析)的计算机系统(本文也称为“系统”)601。系统601包括中央处理单元(CPU,本文也称为“处理器”和“计算机处理器”)605,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。系统601还包括存储器610(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元615(例如,硬盘)、用于与一个或多个其他系统通信的通信接口620(例如,网络适配器)和外围设备625,诸如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器610、存储单元615、接口620和外围设备625通过诸如主板的通信总线(实线)与CPU 605通信。存储单元615可以是用于存储数据的数据存储单元(或数据存储库)。系统601借助于通信接口620可操作地耦合到计算机网络(“网络”)630。网络630可以是因特网、互联网和/或外联网,或与互联网通信的内联网和/或外联网。在一些情况下,网络630是电信和/或数据网络。网络630可以包括一个或多个计算机服务器,其可以实现分布式计算,诸如云计算。在一些情况下,网络630可以借助于系统601实现对等网络,这可以使得与系统601耦合的设备能够作为客户端或服务器。
系统601可以与处理系统635通信。处理系统635可以被配置用于实现本文公开的方法。在一些示例中,处理系统635是多重荧光读板仪、qPCR机器或核酸测序系统,例如下一代测序系统(例如,Illumina测序仪、Ion Torrent测序仪、Pacific Biosciences测序仪)。处理系统635可以通过网络630或通过直接(例如,有线、无线)连接与系统601通信。处理系统635可被配置用于分析,诸如核酸序列分析。
本文所述的方法可以通过存储在系统601的电子存储位置(例如,存储器610或电子存储单元615上)的机器(或计算机处理器)可执行代码(或软件)来实现。在使用期间,代码可以由处理器605执行。在一些示例中,可以从存储单元615检索代码并将其存储在存储器610上,以供处理器605迅速存取。在一些情况下,可以排除电子存储单元615,并且将机器可执行指令存储在存储器610上。
数字处理设备
本文公开的方法、试剂盒和系统可包括数字处理设备或其用途。在进一步的实施方案中,数字处理设备包括执行设备功能的一个或多个硬件中央处理单元(CPU)。在更进一步的实施方案中,数字处理设备进一步包括被配置用于执行可执行指令的操作系统。在一些实施方案中,数字处理设备任选地连接到计算机网络。在进一步的实施方案中,数字处理设备任选地连接到因特网,使得其访问万维网。在更进一步的实施方案中,数字处理设备任选地连接到云计算基础设施。在其他实施方案中,数字处理设备任选地连接到内联网。在其他实施方案中,数字处理设备任选地连接到数据存储设备。
根据本文的描述,合适的数字处理设备的非限制性示例包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、小型笔记本计算机、上网本计算机、上网平板(netpad)计算机、机顶计算机、手持式计算机、互联网应用器件、移动智能手机、平板计算机、个人数字助理、视频游戏机和车载机。本领域技术人员将认识到,许多智能手机适合在本文所述的系统中使用。本领域技术人员还将认识到,具有任选的计算机网络连接的所选择的电视、视频播放器和数字音乐播放器适合在本文所述的系统中使用。合适的平板计算机包括具有本领域技术人员已知的手册、托板和可转换配置的那些平板计算机。
数字处理设备通常可以包括被配置用于执行可执行指令的操作系统。例如,操作系统可以是软件,包括程序和数据,其管理设备的硬件并为应用程序的执行提供服务。本领域技术人员将认识到,举非限制性示例而言,合适的服务器操作系统包括FreeBSD、OpenBSD、
Figure BDA0003443165710000501
Linux、
Figure BDA0003443165710000502
Mac OS X
Figure BDA0003443165710000503
Figure BDA0003443165710000504
Windows
Figure BDA0003443165710000505
Figure BDA0003443165710000506
本领域技术人员将认识到,举非限制性示例而言,合适的个人计算机操作系统包括
Figure BDA0003443165710000507
Figure BDA0003443165710000508
Mac OS
Figure BDA0003443165710000509
和类UNIX操作系统例如GNU
Figure BDA00034431657100005010
在一些实施方案中,操作系统由云计算提供。本领域技术人员还将认识到,举非限制性示例而言,合适的移动智能手机操作系统包括
Figure BDA00034431657100005011
OS、
Figure BDA00034431657100005012
Research In
Figure BDA00034431657100005013
BlackBerry
Figure BDA00034431657100005014
Windows
Figure BDA00034431657100005015
OS、
Figure BDA00034431657100005016
Windows
Figure BDA00034431657100005017
OS、
Figure BDA00034431657100005018
Figure BDA00034431657100005019
Figure BDA00034431657100005020
该装置通常包括存储和/或存储器设备。存储和/或存储器设备可以是用于临时或永久地存储数据或程序的一个或多个物理装置。在一些实施方案中,设备是易失性存储器,并且需要电力来维持存储的信息。在一些实施方案中,设备是非易失性存储器,并且在数字处理设备未通电时保留存储的信息。在进一步的实施方案中,非易失性存储器包括闪速存储器。在一些实施方案中,非易失性存储器包括动态随机存取存储器(DRAM)。在一些实施方案中,非易失性存储器包括铁电随机存取存储器(FRAM)。在一些实施方案中,非易失性存储器包括相变随机存取存储器(PRAM)。在其他实施方案中,设备是存储设备,其举非限制性示例而言包括CD-ROM、DVD、闪速存储器设备、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储设备。在进一步的实施方案中,存储和/或存储器设备是诸如本文所公开的那些设备的组合。
向用户发送可视信息的显示器通常可以被初始化。显示器的示例包括阴极射线管(CRT)、液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT-LCD)、有机发光二极管(OLED)显示器。在各种进一步的实施方案中,关于OLED显示器是无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器。在一些实施方案中,显示器可以是等离子体显示器、视频投影仪或诸如本文公开的那些显示器的组合。
数字处理设备通常可以包括从用户接收信息的输入设备。输入设备可以是例如键盘、定点设备,该定点设备举非限制性示例而言包括鼠标、轨迹球、轨迹板、操纵杆、游戏控制器或触笔;触摸屏或多点触摸屏、用于捕获语音或其他声音输入的麦克风、用于捕获运动或视觉输入的摄像机,或诸如本文公开的那些设备的组合。
非暂时性计算机可读存储介质
本文公开的方法、试剂盒和系统可以包括一种或多种非暂时性计算机可读存储介质,该存储介质用程序编码,该程序包括可由操作系统执行以执行和分析本文所述的测试的指令;优选地连接到网络化数字处理设备。计算机可读存储介质可以是可任选地从数字处理设备移除的数字的有形组件。计算机可读存储介质举非限制性示例而言包括CD-ROM、DVD、闪速存储器设备、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、云计算系统和服务器等。在一些情况下,程序和指令被永久地、实质上永久地、半永久地或非暂时地编码在介质上。
非暂时性计算机可读存储介质可以用计算机程序进行编码,该计算机程序包括可由处理器执行以创建或使用分类系统的指令。存储介质可以包括(a)计算机存储器中两个或更多个对照样品的一种或多种临床特征的数据库,其中(i)两个或更多个对照样品可以来自两个或更多个受试者;并且(ii)两个或更多个对照样品可基于包括三个或更多个类别的分类系统来差异地分类;(b)第一软件模块,其被配置用于比较两个或更多个对照样品的一种或多种临床特征;以及(c)第二软件模块,其被配置用于根据一种或多种临床特征的比较来产生分类器集。
类别中的至少两个可以选自子宫内膜异位症、非子宫内膜异位症和健康。
Web应用程序
在一些实施方案中,计算机程序包括web应用程序。根据本文提供的公开内容,本领域技术人员将认识到,在各种实施方案中,web应用程序利用一个或多个软件框架和一个或多个数据库系统。在一些实施方案中,在诸如
Figure BDA0003443165710000521
.NET或Ruby on Rails(RoR)等软件框架上创建web应用程序。在一些实施方案中,web应用程序利用一个或多个数据库系统,该数据库系统举非限制性示例而言包括关系型、非关系型、面向对象的、关联的和XML数据库系统。在进一步的实施方案中,合适的关系型数据库系统举非限制性示例而言包括
Figure BDA0003443165710000522
SQL Server、
Figure BDA0003443165710000523
Figure BDA0003443165710000524
本领域技术人员还将认识到,在各种实施方案中,web应用程序用一种或多种语言的一个或多个版本进行编写。web应用程序可以用一种或多种标记语言、呈现定义语言、客户端脚本语言、服务器端编码语言、数据库查询语言或其组合来编写。在一些实施方案中,web应用程序在一定程度上以标记语言,诸如超文本标记语言(HTML)、可扩展超文本标记语言(XHTML)或可扩展标记语言(XML)进行编写。在一些实施方案中,web应用程序在一定程度上以呈现定义语言,诸如级联样式表(CSS)进行编写。在一些实施方案中,web应用程序在一定程度上以客户端脚本语言,诸如异步Javascript和XML(AJAX)、
Figure BDA0003443165710000525
Actionscript、Javascript或
Figure BDA00034431657100005314
进行编写。在一些实施方案中,web应用程序在一定程度上以服务器端编码语言,诸如动态服务器页面(Active Server Pages,ASP)、
Figure BDA0003443165710000531
Perl、
Figure BDA0003443165710000532
JavaServer Pages(JSP)、超文本预处理器(PHP)、
Figure BDA0003443165710000533
Ruby、Tcl、Smalltalk、
Figure BDA0003443165710000534
或Groovy进行编写。在一些实施方案中,web应用程序在一定程度上以数据库查询语言,诸如结构化查询语言(SQL)进行编写。在一些实施方案中,web应用程序整合了诸如
Figure BDA0003443165710000535
Lotus
Figure BDA0003443165710000536
等企业服务器产品。在一些实施方案中,web应用程序包括媒体播放器元素。在各种进一步的实施方案中,媒体播放器元素利用许多合适的多媒体技术中的一种或多种,该多媒体技术举非限制性示例而言包括
Figure BDA0003443165710000537
HTML 5、
Figure BDA0003443165710000538
Figure BDA0003443165710000539
Figure BDA00034431657100005310
移动应用程序
在一些实施方案中,计算机程序包括提供给移动数字处理设备的移动应用程序。在一些实施方案中,移动应用程序在其制造时被提供给移动数字处理设备。在其他实施方案中,通过本文所述的计算机网络将移动应用程序提供给移动数字处理设备。
鉴于本文提供的公开内容,通过本领域技术人员已知的技术,使用本领域已知的硬件、语言和开发环境可以创建移动应用程序。本领域技术人员将认识到,移动应用程序是用多种语言编写的。举非限制性示例而言,合适的编程语言包括C、C++、C#、Objective-C、
Figure BDA00034431657100005311
Javascript、Pascal、Object Pascal、
Figure BDA00034431657100005312
Ruby、VB.NET、WML以及具有或不具有CSS的XHTML/HTML,或其组合。
可从多个来源获得合适的移动应用程序开发环境。举非限制性示例而言,可商购获得的开发环境包括AirplaySDK、alcheMo、
Figure BDA00034431657100005313
Celsius、Bedrock、FlashLite、.NET Compact Framework、Rhomobile和WorkLight Mobile Platform。其他开发环境可以免费获取,举非限制性示例而言包括Lazarus、MobiFlex、MoSync和Phonegap。此外,移动装置制造商分发软件开发工具包,举非限制性示例而言,包括iPhone和iPad(iOS)SDK、
Figure BDA0003443165710000541
SDK、
Figure BDA0003443165710000542
SDK、BREW SDK、
Figure BDA0003443165710000543
OS SDK、Symbian SDK、webOSSDK和
Figure BDA0003443165710000544
Mobile SDK。
本领域技术人员将认识到,多个商业论坛可用于分发移动应用程序,举非限制性示例而言包括
Figure BDA0003443165710000545
App Store、
Figure BDA0003443165710000546
Market、
Figure BDA0003443165710000547
App World、用于Palm设备的App Store、用于webOS的App Catalog、用于移动设备的
Figure BDA0003443165710000548
Marketplace、用于
Figure BDA0003443165710000549
设备的Ovi Store、
Figure BDA00034431657100005410
Apps和
Figure BDA00034431657100005411
DSiShop。
独立应用程序
在一些实施方案中,计算机程序包括独立应用程序,该应用程序是作为独立计算机进程运行的程序,而不是现有进程的附加程序,例如,不是插件。本领域技术人员将认识到,独立应用程序通常是编译的。编译器是将用编程语言编写的源代码转换为二进制目标代码如汇编语言或机器代码的计算机程序。举非限制性示例而言,合适的编译编程语言包括C、C++、Objective-C、COBOL、Delphi、Eiffel、
Figure BDA00034431657100005412
Lisp、
Figure BDA00034431657100005413
VisualBasic和VB.NET,或其组合。通常至少部分地执行编译以创建可执行程序。在一些实施方案中,计算机程序包含一个或多个可执行编译应用程序。
Web浏览器插件
在一些实施方案中,计算机程序包括web浏览器插件。在计算中,插件是一个或多个软件组件,其向更大的软件应用程序添加特定的功能。软件应用程序的制造商支持插件,以使第三方开发人员能够创建扩展应用程序的能力,支持轻松添加新特征,并减小应用程序的大小。当被支持时,插件能够实现自定义软件应用程序的功能。例如,在web浏览器中,插件通常用于播放视频、生成交互性、扫描病毒和显示特定的文件类型。本领域技术人员将熟悉多种web浏览器插件,包括
Figure BDA00034431657100005414
Player、
Figure BDA00034431657100005415
Figure BDA00034431657100005416
Figure BDA0003443165710000551
在一些实施方案中,工具栏包含一个或多个web浏览器扩展项、加载项或附加项。在一些实施方案中,工具栏包含一个或多个浏览器栏、工具栏或桌面栏。
鉴于本文提供的公开内容,本领域技术人员将认识到,可以使用多种插件框架来实现采用各种编程语言的插件的开发,该编程语言举非限制性示例而言包括C++、Delphi、
Figure BDA0003443165710000552
PHP、
Figure BDA0003443165710000553
和VB.NET或其组合。
web浏览器(也称为因特网浏览器)是被设计用于网络连接的数字处理设备的软件应用程序,用于检索、呈现和遍历万维网上的信息资源。合适的web浏览器举非限制性示例而言包括
Figure BDA0003443165710000554
Internet
Figure BDA0003443165710000555
Chrome、
Figure BDA0003443165710000556
Opera
Figure BDA0003443165710000557
和KDE Konqueror。在一些实施方案中,web浏览器是移动web浏览器。移动web浏览器(也称为微浏览器、迷你浏览器和无线浏览器)被设计用于移动数字处理设备,其举非限制性示例而言,包括手持计算机、平板计算机、上网本计算机、小型笔记本计算机、智能电话、音乐播放器、个人数字助理(PDA)和手持视频游戏系统。合适的移动web浏览器举非限制性示例而言包括
Figure BDA0003443165710000558
浏览器、RIM
Figure BDA0003443165710000559
浏览器、
Figure BDA00034431657100005510
Figure BDA00034431657100005511
Blazer、
Figure BDA00034431657100005512
浏览器、用于移动设备的
Figure BDA00034431657100005513
Figure BDA00034431657100005514
Internet
Figure BDA00034431657100005515
Mobile、
Figure BDA00034431657100005516
Basic Web、
Figure BDA00034431657100005517
浏览器、Opera
Figure BDA00034431657100005518
Mobile和
Figure BDA00034431657100005519
Figure BDA00034431657100005520
浏览器。
软件模块
本文公开的方法、试剂盒和系统可包括软件、服务器和/或数据库模块或其用途。鉴于本文提供的公开内容,通过本领域技术人员已知的技术,使用本领域已知的机器、软件和语言来创建软件模块。本文公开的软件模块以多种方式实现。在各种实施方案中,软件模块包括文件、代码段、编程对象、编程结构或其组合。在进一步的各种实施方案中,软件模块包括多个文件、多个代码段、多个编程对象、多个编程结构或其组合。在各种实施方案中,一个或多个软件模块举非限制性示例而言包括web应用程序、移动应用程序和独立应用程序。在一些实施方案中,软件模块在一个计算机程序或应用程序中。在其他实施方案中,软件模块在多于一个计算机程序或应用程序中。在一些实施方案中,软件模块被托管在一台机器上。在其他实施方案中,软件模块被托管在多于一台机器上。在进一步的实施方案中,软件模块被托管在云计算平台上。在一些实施方案中,软件模块被托管在一个位置的一台或多台机器上。在其他实施方案中,软件模块被托管在多于一个位置的一台或多台机器上。
数据库
本文公开的方法、试剂盒和系统可以包括一个或多个数据库或其用途。鉴于本文提供的公开内容,本领域技术人员将认识到许多数据库适合于存储和检索与miRNA或ncRNA表达谱、测序数据、分类器、分类系统、治疗方案或其组合有关的信息。在各种实施方案中,合适的数据库举非限制性示例而言包括关系型数据库、非关系型数据库、面向对象的数据库、对象数据库、实体关系模型数据库、关联数据库和XML数据库。在一些实施方案中,数据库是基于互联网的。在进一步的实施方案中,数据库是基于web的。在更进一步的实施方案中,数据库是基于云计算的。在其他实施方案中,数据库基于一个或多个本地计算机存储设备。
数据传输
本文公开的方法、试剂盒和系统可用于传输一个或多个报告。一个或多个报告可包括与来自一个或多个受试者的一个或多个样品的分类和/或鉴别有关的信息。一个或多个报告可包含与疾病状态(例如,子宫内膜异位症或非子宫内膜异位症)有关的信息。一个或多个报告可以包括与用于治疗有需要的受试者中的子宫内膜异位症的治疗方案有关的信息。一个或多个报告可被传输给受试者或受试者的医疗代表。受试者的医疗代表可以是医师、医师助理、护士或其他医疗护理提供者。受试者的医疗代表可以是受试者的家庭成员。受试者的家庭成员可以是父母、监护人、子女、兄弟姐妹、阿姨、叔叔、堂表兄弟姊妹或配偶。受试者的医学代表可以是受试者的法定代表人。
虽然在本文已经示出和描述了本发明的优选实施方案,但是对于本领域的技术人员显而易见的是,这些实施方案仅作为示例提供。本发明不旨在受说明书中提供的具体实施例的限制。虽然已经参考前述说明书描述了本发明,但是本文中的实施方案的描述和说明并不意味着以限制的意义来解释。在不脱离本发明的情况下,本领域的技术人员将想到许多变化、改变和替换。此外,应当理解,本发明的所有方面不限于本文所述的具体描述、配置或相对比例,其取决于各种条件和变量。应当理解,在实施本发明时可以采用本文所述的本发明实施方案的各种替代方案。因此,预期本发明还将涵盖任何此类替代、修改、变化或等同方案。以下权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同方案。
实施例
实施例1.-研究群体/患者选择
本文提出了一项研究,该研究在比先前研究更多样化的患者组中测试子宫内膜异位症的miRNA生物标志物。在针对良性妇科病况进行腹腔镜检查之前,从女性收集血清样品,并且在不知道手术发现的情况下进行六种靶miRNA的miRNA表达分析。本研究设计能够测试这些miRNA生物标志物的术前评价是否能够在由早期和晚期疾病组成的不同患者群体中区分子宫内膜异位症与其他良性病况。
从耶鲁大学医学院(纽黑文市,康涅狄格州)获得机构审查委员会(IRB)批准用于人类受试者的生物医学研究。从入院耶鲁-纽黑文医院并因疑似良性适应症(如盆腔包块、盆腔疼痛、不孕和子宫内膜异位症)接受腹腔镜或剖腹手术治疗的患者获得书面知情同意书。入选标准为18-49岁女性。排除标准由绝经后患者、怀孕、严重贫血、增生或息肉或恶性肿瘤组成。如果手术时的视觉发现(以及需要时的病理学)证实存在子宫内膜异位症,则将受试者分到疾病组中,如果手术显示其他良性病理,则将受试者分到对照组中。包括子宫内膜异位症的所有时期以及未治疗和经治疗的受试者以提供导致不同miRNA水平的疾病的全谱。记录每位患者的激素药物。根据患者最后月经期的日期确定月经周期的阶段。分期是经如下通过病历回顾完成的:通过评价手术评论和病理结果使用修订的美国生殖医学学会(rASRM)分类法(参见修订的美国子宫内膜异位症生殖医学分类法:1996.Fertility andsterility.1997;67(5):817-821,其通过引用明确地并入本文)。
取样
2016年9月至2017年10月期间,从在耶鲁纽黑文医院接受腹腔镜或开放式妇科手术的103名女性中收集血清样品。
为了收集血清样品,在手术(腹腔镜或开放式)之前,从所述受试者抽取血液(5-10ml)并收集在不含添加剂的无菌管(BD,Franklin Lakes,NJ,USA)中。通过在4℃下以2500rpm离心15分钟立即收集血清,并在-80℃以300μl等分试样储存。
103例患者中,3例因意外共病(包括病理上的恶性肿瘤)而被排除在外。在剩余的100名患者中,41名被归类为子宫内膜异位症研究群体,59名被归类为对照研究群体。根据疾病的视觉诊断和组织学验证将子宫内膜异位症组进行分类。基于在手术时不存在视觉疾病将对照组进行分类。
研究受试者的人口统计学资料和临床特征总结在表1中。子宫内膜异位症组的研究群体平均年龄为34.1±7.1岁,对照组为36.9±8.2岁。子宫内膜异位症组的体重指数为28.1±7.5,对照组为30.4±7.5。两组中女性的年龄之间(学生t-检验)或她们的BMI值之间(学生t-检验)没有统计学显著差异。研究受试者主要鉴定为高加索人,其次为黑人/非裔美国人和西班牙裔。
子宫内膜异位症组由根据rASRM时期分类的不同程度的疾病组成。41名子宫内膜异位症受试者分为I期11名(29%)、II期7名(17%)、III期15名(36%)和IV期8名(19%)。13名患者报告为子宫内膜瘤。对照组由不同的良性病变组成。59名对照受试者分为以下类别:23名(39%)为平滑肌瘤,4名(7%)为囊腺瘤,5名(8%)为慢性盆腔感染,3名(5%)为畸胎瘤,6名(10%)为输卵管旁囊肿,18名(31%)未发现异常病理(表1)。
记录了月经周期的阶段和激素药物的存在,也可参见表1。在大约一半的研究对象中,月经周期的阶段不能基于不规则周期的历史(数据缺失)或由于使用激素药物而准确地确定。在受试者总数(包括可确定的受试者)中,子宫内膜异位症组的8名(19%)处于增生期,15名(36%)处于分泌期,对照组的14名(24%)处于增生期,13名(22%)处于分泌期。许多研究对象在收集血清时使用激素剂。对于子宫内膜异位症组,激素剂的类型包括10名(24%)复方口服避孕药、5名(12%)仅孕酮、0名(0%)仅雌激素、6名(15%)GnRH激动剂、1名(2%)芳香酶抑制剂,其余19名(46%)不使用任何激素剂。对于对照组,激素剂类型包括10名(17%)口服复方避孕药、16名(27%)仅孕酮、1名(2%)仅雌激素、5名(8%)GnRH激动剂、1名(2%)芳香酶抑制剂,其余26名(44%)不使用任何激素剂。
表1:患者人口统计学和临床特征
Figure BDA0003443165710000591
Figure BDA0003443165710000601
实施例2.-来自血清样品和唾液样品的miRNA表达分析
血清样品
使用来自Qiagen(Valencia,CA,USA)的miRNeasy迷你试剂盒从如实施例1中收集的300μl血清样品中提取总miRNA,并根据制造商的说明书使用来自Applied Biosystemsby Life Technologies(Carlsbad,CA)的TaqMan Advanced miRNA cDNA合成试剂盒进行逆转录。使用SYBR Green(Bio-Rad Laboratories,Hercules,CA)和MyiQ单色实时PCR检测系统(Bio-Rad)用qRT-PCR定量微小RNA水平。扩增的转录物的特异性和引物-二聚体的缺失通过解链曲线分析证实。miRNA和U6基因的引物获自W.M.Keck Oligonucleotide SynthesisFacility(耶鲁大学,纽黑文市,康涅狄格州),通用反向引物获自Applied Biosystems。引物序列如先前研究40,45所述,并列于表2中。在qRT-PCR反应中使用以下循环条件:95℃持续3分钟,40个循环的(95℃持续15秒,59℃持续5秒,72℃持续55秒)。将每种miRNA的表达归一化为人U6小核RNA的表达。使用德尔塔(Ct)方法(也称为2-ΔCt方法)计算每种miRNA的相对表达。所有实验至少进行两次,每次在每个板上运行双孔。
表2:用于miRNA定量的示例性引物序列
Figure BDA0003443165710000611
实施例3.-来自血清样品的个体miRNA的表达分析
在该病例对照研究中,在手术/样品收集时间之前不知道子宫内膜异位症的存在,并且在不知道疾病状态的情况下进行血清miRNA分析。使用定量实时聚合酶链反应(qRT-PCR)前瞻性测量6种miRNA(miR-125b-5p、miR-150-5p、miR-342-3p、miR-451a、miR-3613-5p和let-7b)的表达水平,并相对于小核RNA U6进行定量。图1描绘了这些循环miRNA在患有子宫内膜异位症的受试者中相对于患有其他良性妇科病变的对照受试者的平均表达水平。与对照相比,在患有子宫内膜异位症的患者中观察到miR-125b、miR-150-5p、miR-342-3p和miR-451a的表达显著增加,并且观察到miR-3613-5p和let-7b的表达显著降低。
进行亚组分析以评估月经周期期间血清收集的时机是否会影响miRNA表达并影响用这些生物标志物诊断的准确性。基于月经阶段分离对照患者,在增生期(14,24%)与分泌期(13,22%)期间取样的患者之间之间未观察到miRNA水平表达的显著差异(参见图2)。当对鉴定为患有子宫内膜异位症的月经周期女性进行类似的分析时,没有观察到平均miRNA水平根据月经周期的阶段的差异。
相对于其他研究,本研究目的在于在人口统计学和正在进行的激素治疗方面反映更真实世界的患者群体。激素疗法有多种类型(表1),其中大多数患者接受口服复方避孕药(10,24%)或GnRH激动剂(6,14%)。为了确定在手术时服用的激素药物是否对miRNA表达有任何影响,我们分析了来自子宫内膜异位症患者的表达数据,以比较接受激素治疗的女性(22,54%)和未接受任何激素药物治疗的女性(19,46%)之间这些miRNA的表达。如图3所示,激素治疗的存在未显著影响所测试的6种靶miRNA的平均表达水平。
为了评价这些miRNA的表达是否与子宫内膜异位症的时期相关,在分析中将轻微/轻度(I/II期)子宫内膜异位症与中度/重度(III/IV期)子宫内膜异位症区分开。使用Kruskal-Wallis检验(非参数单向方差分析),发现所有6种miRNA在三组之间具有显著不同的方差(p<0.05):对照、I/II期和III/IV期(图4)。然而,在使用邓恩多重比较检验进行三对比较后,子宫内膜异位症的每个亚组与对照组相比具有显著不同的miRNA水平,但在轻微/轻度与中度/重度之间没有显著不同(图4)。我们还比较了患有卵巢子宫内膜异位症(子宫内膜瘤)的患者与不患有子宫内膜异位症患者的miRNA水平,但在该亚组分析中没有观察到任何显著差异。
为了评估个体miRNA表达水平用作子宫内膜异位症存在的生物标志物的能力,进行每种miRNA的接受者操作特性(ROC)分析。个体miRNA的ROC曲线下面积(AUC)评分范围为miR-150-5p的低点0.68至miR-342-3p的高点0.92之间(表3)。对于上调的miRNA(miR-125b-5p、miR-150-5p、miR-342-3p、miR-451a),高于截止值的水平指示子宫内膜异位症,而对于下调的miRNA(let-7b和miR-3613-5p),低于截止值的水平与子宫内膜异位症相关。
表3:个体miRNA的ROC分析
Figure BDA0003443165710000631
另外地,分析个体miRNA模型以确定导致至少80%灵敏度或至少80%特异性的截止值。这些值列于表3A中。
表3A:个体miRNA的附加分析
Figure BDA0003443165710000632
Figure BDA0003443165710000641
实施例4.-基于血清中miRNA表达的多变量模型构建和分析
首先,评估先前报道的miR-125b-5p、miR-451a和miR-3613-5p的组合的诊断性能(参见Cosar等人,Fertility and sterility.2016;106(2)::402-409.)。当针对当前数据集测试时,该组合产生0.8的AUC分数。因为先前的研究仅包括患有中度/重度(III/IV期)子宫内膜异位症的女性,并且当前的研究包括更多的轻微/轻度(I/II期)疾病的病例,所以进行基于机器学习的优化分析以鉴定在这种更加多样化和代表性的患者群体中miRNA生物标志物的最高评分组合。采用随机森林方法进行机器学习,使用6种miRNA构建机器学习模型。该模型以两种方式确认:通过随机二次抽样将总数据集分成训练子集和测试子集,并通过针对独立数据集(n=48,24名子宫内膜异位症和24名对照受试者)进行测试。训练数据集和测试数据集中模型性能的AUC分数如图5所示。在对来自患者样品的miRNA进行独立的重新定量然后应用算法之后,在独立的验证实验中获得6-标记分类器算法的AUC为0.939。
实施例5.-来自血清的多变量模型和个体miRNA结果的分析
设计实施例1-4的研究以证明循环miRNA可靠地将子宫内膜异位症与其他妇科病变区分开的能力,其中在不同(类真实世界)群体的独立测试数据集中具有强有力的诊断性能。在手术确证患有子宫内膜异位症的患者中,与具有各种妇科病况的对照组相比,发现血清miRNA miR-3613-5p和let-7b的表达显著较低,并且发现血清miRNA miR-125b-5p、miR-150-5p、miR-451a和miR-342-3p的表达显著较高。当前研究群体的临床特征反映了患有子宫内膜异位症的真实世界患者,包括不同种族人口统计,早期和晚期疾病以及激素治疗的存在。对照病例还包括比我们以前的研究更多种的疾病,其中对照组的女性都被诊断为不同类型的囊肿(皮样囊肿、卵巢囊肿、输卵管旁囊肿和浆液性或粘液性囊腺瘤)。此处,纤维瘤(平滑肌瘤)是在对照患者(n=23)中发现的主要病变,第二个最常见的是不存在异常病变(表1)。在患有各种盆腔病变的患者群组中对这些标记物的评价支持在一般群体中使用这些标记物来区分子宫内膜异位症与其他病况的效用。
使用逻辑回归模型评估miR-125b-5p、miR-451a、miR-3613-5p的组合,将该组合应用于当前数据获得0.8的AUC。由于该性能仅为中等,所以将本文产生的数据用于随机森林机器学习范例,以基于本文受试者中评估的6种miRNA构建最佳分类器,并且当该分类器应用于来自我们先前研究的独立数据集时,该分类器产生0.939的AUC(图5)。由于子宫内膜异位症不是危及生命的病况,所以优化分类器特异性(避免假阳性)将有助于防止过度诊断,并且如果症状持续,可以重新检测女性。因此,通过选择ROC曲线上的不同截止点优化6-miRNA随机森林模型的特异性,产生具有96%特异性和83%灵敏度的模型。可选地,还使用ROC曲线上的不同截止值,可以实现将灵敏度和特异性的值优化为接近90%。更高的灵敏度(和低的假阴性率)可适合于使用生物标志物组作为筛选测试。
实施例6.-基于本文导出的数据生成经训练的算法模型
为了构建用于预测子宫内膜异位症的改进模型,首先应用随机森林和惩罚线性回归方法来确定先前实施例中产生的多mRNA表达数据的重要性特征。
对于该程序,产生1000个重复,其中每个重复包括一对训练集和测试集。采用分层自展方法,因为分层自展在自展训练集中保持相同的病例和对照部分。对于每个重复,使用自展方法(重新取样和替换)产生训练集,并且未选择的样品用作测试集。随机分裂重复K=1000次。
对于每对数据集,将随机森林(使用ntree=500)或罚线性回归(使用α水平=0.4(使用弹性网络)、0.7(使用弹性网络)和1(使用LASSO));并且将最佳λ(如果其在每个α水平包括最小MSE,则选择该最佳λ)应用于训练集。使用由每种方法构建的模型估计患有疾病的预测概率,并用0.5(50%)的截止值对结果值进行二分化。然后计算使用计算机的加权准确性度量诸如AUC、特异性、灵敏度、误分类率等。将预测的疾病状态与测试集和训练集的真实疾病状态进行比较。计算总准确性度量,其为来自训练集的估计准确性度量和来自测试集的估计准确性的总和(适当加权)。
对于每种方法(随机森林或惩罚回归),报告了1000次重复的总体准确度和误差度量的平均值。类似地,报告了重要性度量(对于随机森林)或每个变量从1000中选出的次数(对于罚分回归)。这些数据报告在表4中。
表4:使用随机森林(RF)或惩罚回归(PR)方法的总体准确性度量的平均值(SD)
Figure BDA0003443165710000661
表5:使用随机森林(RF)方法的平均重要性度量
miRNA特征 平均下降准确性 平均下降基尼(Gini)
miR-342 35.8151 21.6168
Let-7b 32.812 18.7671
miR-125 29.2109 17.0781
miR-150 25.2763 10.6384
miR-3613 24.8889 12.9522
miR-451a 18.0184 6.719
表6:用于惩罚回归(PR)方法的非零系数
方法 miRNA特征 计数
PR(α=0.4) miR-125 1000
PR(α=0.4) miR-342 1000
PR(α=0.4) miR-3613 1000
PR(α=0.4) miR-451a 1000
PR(α=0.4) Let-7b 1000
PR(α=0.4) miR-150 995
PR(α=0.7) miR-125 1000
PR(α=0.7) miR-342 1000
PR(α=0.7) miR-3613 1000
PR(α=0.7) miR-451a 1000
PR(α=0.7) Let-7b 1000
PR(α=0.7) miR-150 981
PR(LASSO,α=1) miR-342 1000
PR(LASSO,α=1) miR451a 1000
PR(LASSO,α=1) Let-7b 1000
PR(LASSO,α=1) miR-125 999
PR(LASSO,α=1) miR-3613 999
PR(LASSO,α=1) miR-150 956
基于该数据,使用从上述模型构建步骤中使用RF重要性排序选择的多种标志物构建逻辑回归和随机森林模型。然后根据来自Cosar等人Fertility and sterility.2016;106(2):402-409的回顾性数据验证这些模型。数据示于表7和表8中。
表7:基于本文使用RF生成的回顾性数据的模型比较
Figure BDA0003443165710000681
表8:基于使用逻辑回归(LR)的自展回顾性数据的模型比较
按重要性排序的miRNA特征 AUC 灵敏度 特异性 误分类
miR-342 0.7882 0.875 0.7917 0.1667
miR-342,let-7b 0.7569 0.625 0.7917 0.2917
miR-342,let-7b,miR-125b 0.8082 0.6667 0.7917 0.2708
miR-342,let-7b,miR-125b,miR-150 0.803 0.6667 0.7917 0.2708
miR-342,let-7b,miR-125b,miR-150,miR-3613 0.8273 0.75 0.7917 0.2292
miR-125b,miR-451a,miR-3613 0.9167 0.9167 0.875 0.1042
Let-7b,miR-125b,miR-150 0.7795 0.625 0.75 0.3125
miR-125b,mIR-451a,miR-3613,miR-150 0.9236 0.9167 0.875 0.1042
基于表7和8中的数据,将随机森林确定为对于分类来自当前研究数据更好的经训练的算法方法(因为它对所有miRNA特征组合产生更好的结果)。
因此,将随机森林学习方法应用于该数据集或来自先前研究的数据集,并确定截止值以优化模型的性能。作为示例性演示,图7示出了其中在回顾性数据集(Cosar)中的来自RF模型的投票百分比分布的直方图;黑色柱表示患有手术定义的子宫内膜异位症的受试者,白色柱表示没患有子宫内膜异位症的受试者。使用43%的诊断阈值(截止值),如竖直虚线所示,对于该数据集中的RF模型产生96%的特异性和83%的灵敏度。
我们扩展该分析以确定由本文模型中使用的所有生物标志物(miR-125b、miR-451a、miR-3613、miR-150、miR-342和let-7b)构建的分类器是否可推广至多种不同的样品。
表9:关于各种数据集的具有给定重要性度量和特征排序的RF模型的miRNA的重要性度量性能
Figure BDA0003443165710000691
Figure BDA0003443165710000701
表10:表9中RF模型的性能
Figure BDA0003443165710000702
重要的是,6-标记物模型(D)在所有数据集中表现出高性能(大于0.93的AUC)。
实施例7.-子宫内膜异位症的检测、诊断和治疗
从疑似有子宫内膜异位症的雌性患者采集血液、血浆、血清、经血、月经流出物、尿液或唾液样品。然后确定样品中与子宫内膜异位症相关的微小RNA(例如,miR-125b、miR-451a、miR-3613、miR-150、miR-342和let-7b)的量,并且利用本文中使用的任何经过训练的算法分类器检测子宫内膜异位症。如果检测到子宫内膜异位症,则用治疗有效剂量的GnRH拮抗剂或激动剂疗法(例如,Elagolix)治疗患者。该化合物引起子宫内膜异位症症状的减少。在治疗1个月、治疗6个月和治疗1年后,评估患者的与子宫内膜异位症相关的微小RNA特征的水平。如果与子宫内膜异位症相关的微小RNA特征指示存在子宫内膜异位症,则将GnRH激动剂或拮抗剂疗法(例如,Elagolix)的剂量上调,并且重复治疗/测试过程,直至生物标志物指示不存在子宫内膜异位症。
尽管本文已经示出并描述了本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将会想到多种变化、改变和替代。应当理解,本文描述的本发明实施方案的各种替代方案可用于实践本发明。以下述权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同方案。

Claims (144)

1.一种检测雌性受试者中是否存在子宫内膜异位症的方法,包括:
(a)检测来自所述雌性受试者的体液样品中与子宫内膜异位症相关的一组miRNA的表达谱,其中所述与子宫内膜异位症相关的一组miRNA包括miR-342或miR451a;
(b)将机器学习算法应用于所述与子宫内膜异位症相关的一组miRNA的表达谱,其中所述机器学习算法具有分配给miRNA特征的重要性度量,并且其中:
i.将重要性度量分配给miR-342,并且分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b;或
ii.将重要性度量分配给miR-451a,并且分配给miR-451a的所述重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-3613、miR-125b和let-7b;以及
(c)使用所述机器学习算法来检测所述雌性受试者中是否存在子宫内膜异位症。
2.根据权利要求1所述的方法,其中所述雌性受试者具有子宫内膜异位症的症状。
3.根据权利要求1所述的方法,其中所述雌性受试者具有选自由以下组成的组中的子宫内膜异位症的症状:腹痛、胃肠不适、出血过多、不孕和月经紊乱。
4.根据前述权利要求中任一项所述的方法,其中所述受试者先前尚未被诊断患有子宫内膜异位症。
5.根据前述权利要求中任一项所述的方法,其中所述受试者先前已被诊断患有子宫内膜异位症,并且所述方法证实所述雌性受试者中存在子宫内膜异位症。
6.根据前述权利要求中任一项所述的方法,还包括当检测到子宫内膜异位症存在时,诊断所述雌性受试者中的子宫内膜异位症。
7.根据前述权利要求中任一项所述的方法,还包括当检测到子宫内膜异位症存在时,预知或监测所述雌性受试者中的子宫内膜异位症。
8.根据前述权利要求中任一项所述的方法,还包括当检测到子宫内膜异位症存在时,向所述雌性受试者施用针对子宫内膜异位症的治疗。
9.根据前述权利要求中任一项所述的方法,还包括当检测到子宫内膜异位症不存在时,确定所述雌性受试者患有的病况不是子宫内膜异位症。
10.根据前述权利要求中任一项所述的方法,还包括当检测到子宫内膜异位症不存在时,向所述雌性受试者施用针对非子宫内膜异位症的病况的治疗。
11.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。
12.根据权利要求11所述的方法,其中分配给miR-342的所述重要性度量小于分配给至少一种其他miRNA的重要性度量。
13.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。
14.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少三种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。
15.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少四种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。
16.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给miR-150、miR-3613、miR-451a、let-7b和miR-125b的重要性度量。
17.根据权利要求1所述的方法,其中分配给miR-451a的所述重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-3613、miR-125b和let-7b。
18.根据权利要求1所述的方法,其中分配给miR-451a的所述重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-3613、miR-125b和let-7b。
19.根据权利要求1所述的方法,其中分配给miR-451a的所述重要性度量大于分配给miR-3613、miR-125b和let-7b的重要性度量。
20.根据前述权利要求中任一项所述的方法,其中将所述重要性度量分配为使得所述重要性度量从最高到最低的排序为:miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
21.根据前述权利要求中任一项所述的方法,其中所述体液样品包括细胞。
22.根据前述权利要求中任一项所述的方法,其中所述体液样品是无细胞样品。
23.根据前述权利要求中任一项所述的方法,其中所述体液样品是血液样品、血浆样品、唾液样品或血清样品。
24.根据前述权利要求中任一项所述的方法,其中所述一组miRNA是无细胞miRNA。
25.根据前述权利要求中任一项所述的方法,其中所述一组miRNA是细胞相关的miRNA或外泌体相关的miRNA。
26.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量排序的机器学习算法,其中从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
27.根据前述权利要求中任一项所述的方法,其中所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。
28.根据前述权利要求中任一项所述的方法,其中所述机器学习算法是随机森林算法。
29.根据前述权利要求中任一项所述的方法,其中所述方法以大于80%的特异性检测女性群体中的子宫内膜异位症。
30.根据权利要求29所述的方法,其中所述女性群体是绝经前女性。
31.根据权利要求29所述的方法,其中所述女性群体包括患有平滑肌瘤、囊腺瘤、慢性盆腔感染、畸胎瘤、子宫内膜瘤或输卵管旁囊肿的女性。
32.根据权利要求29所述的方法,其中所述女性群体包括患有I/II期子宫内膜异位症的女性。
33.根据权利要求29所述的方法,其中所述女性群体包括患有III/IV期子宫内膜异位症的女性或患有所有四期子宫内膜异位症(I/II/III/IV期)的女性。
34.根据权利要求29所述的方法,其中所述女性群体包括在获得所述样品之日起3个月内已经接受激素疗法的女性或处于其月经周期任何阶段的女性。
35.根据权利要求29所述的方法,其中所述女性群体包括含有至少100名女性、至少500名女性或至少1000名女性的群组。
36.根据前述权利要求中任一项所述的方法,其中基于来自至少100个样品、至少500个样品或至少1000个样品的表达数据来训练所述机器学习算法。
37.根据前述权利要求中任一项所述的方法,其中基于包括患有I-IV期子宫内膜异位症女性的女性群体来训练所述机器学习算法。
38.根据前述权利要求中任一项所述的方法,其中所述方法的检测子宫内膜异位症的AUC在女性群体中大于0.85、在女性群体中大于0.90或在女性群体中大于0.92。
39.根据前述权利要求中任一项所述的方法,其中所述方法以大于85%、大于90%或大于95%的特异性检测女性群体中的子宫内膜异位症。
40.根据前述权利要求中任一项所述的方法,其中所述方法以大于80%的灵敏度、大于85%的灵敏度或大于90%的灵敏度检测女性群体中的子宫内膜异位症。
41.根据前述权利要求中任一项所述的方法,其中所述方法以大于90%的特异性和小于85%的灵敏度检测女性群体中的子宫内膜异位症。
42.根据前述权利要求中任一项所述的方法,其中所述方法以小于90%、小于85%或小于80%的灵敏度检测女性群体中的子宫内膜异位症。
43.根据前述权利要求中任一项所述的方法,还包括在检测到子宫内膜异位症不存在时,用不涉及手术的治疗来治疗所述雌性受试者。
44.根据前述权利要求中任一项所述的方法,还包括在检测到子宫内膜异位症存在时,向所述雌性受试者施用治疗,其中所述治疗包括激素治疗、手术、腹腔镜手术、他汀类、非甾体抗炎药(NSAID)、口服避孕药、孕激素、促性腺激素释放(GnRH)激动剂、GnRH拮抗剂、雄激素、抗孕酮、选择性雌激素受体调节剂(SERM)、选择性孕酮受体调节剂(SPRM)、阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀、辛伐他汀、扑热息痛、COX-2抑制剂或阿司匹林。
45.根据前述权利要求中任一项所述的方法,其中所述miRNA表达水平是通过定量实时聚合酶链反应(RT-PCR)、微阵列、测序或下一代测序检测的。
46.一种对雌性受试者中的子宫内膜异位症进行分类的方法,包括:
(a)获得包括miRNA的体液样品,其中所述体液样品来自雌性受试者;
(b)对所述体液样品中的一组miRNA进行定量实时聚合酶链反应、微阵列测定或测序测定,其中所述一组miRNA包括与子宫内膜异位症相关的两种或更多种不同的miRNA;
(c)将所述生物样品中的所述与子宫内膜异位症相关的两种或更多种不同miRNA的量与对照RNA的量进行比较,以确定所述体液样品中的所述两种或更多种不同miRNA的归一化的miRNA水平;
(d)通过将所述归一化的miRNA水平输入到经训练的算法中,将所述雌性受试者分类为子宫内膜异位症阳性或阴性,其中所述经训练的算法权衡所述两种或更多种不同miRNA的重要性排序,并且其中通过在与子宫内膜异位症相关的所述两种或更多种不同miRNA的接受者操作特性(ROC)曲线上或投票百分比分布上选择最佳截止点,将所述经训练的算法优化为特异性高于灵敏度;以及
(e)在计算机屏幕上输出报告,所述报告基于(d)中所述雌性受试者为子宫内膜异位症阳性或阴性的分类,将所述雌性受试者鉴定为子宫内膜异位症阳性或阴性。
47.根据权利要求46所述的方法,其中将所述经训练的算法优化以在女性群体中以大于80%的特异性检测子宫内膜异位症。
48.根据权利要求46所述的方法,其中将所述经训练的算法优化以在女性群体中以大于90%的特异性和小于85%的灵敏度检测子宫内膜异位症。
49.根据权利要求46所述的方法,其中所述经训练的算法在女性群体中以大于90%或大于95%的特异性检测I/II期子宫内膜异位症。
50.根据前述权利要求中任一项所述的方法,其中所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。
51.根据前述权利要求中任一项所述的方法,其中所述方法在女性群体中检测子宫内膜异位症的AUC大于0.9。
52.根据前述权利要求中任一项所述的方法,其中所述方法在女性群体中检测子宫内膜异位症的AUC大于0.92。
53.根据前述权利要求中任一项所述的方法,其中所述方法以大于85%的特异性检测女性群体中的子宫内膜异位症。
54.根据前述权利要求中任一项所述的方法,其中所述方法以大于90%的特异性检测女性群体中的子宫内膜异位症。
55.根据前述权利要求中任一项所述的方法,其中所述方法以大于95%的特异性检测女性群体中的子宫内膜异位症。
56.根据前述权利要求中任一项所述的方法,其中所述方法以大于80%的灵敏度检测女性群体中的子宫内膜异位症。
57.根据前述权利要求中任一项所述的方法,其中所述方法以大于90%的灵敏度检测女性群体中的子宫内膜异位症。
58.根据前述权利要求中任一项所述的方法,其中所述方法以小于90%、小于85%或小于80%的灵敏度检测女性群体中的子宫内膜异位症。
59.根据前述权利要求中任一项所述的方法,其中所述女性群体包括至少100名女性。
60.根据权利要求59所述的方法,其中所述至少100名的女性群体包括患有平滑肌瘤的女性。
61.根据前述权利要求中任一项所述的方法,其中所述方法的曲线下面积(AUC)值大于0.85,而与子宫内膜异位症时期或激素治疗无关。
62.根据权利要求46所述的方法,还包括在所述报告将所述雌性受试者鉴定为子宫内膜异位症阳性后,向所述雌性受试者施用针对子宫内膜异位症的治疗。
63.根据权利要求46所述的方法,还包括在所述报告将所述雌性受试者鉴定为子宫内膜异位症阴性后,向所述雌性受试者施用针对非子宫内膜异位症的病况的治疗。
64.根据前述权利要求中任一项所述的方法,还包括在所述报告将所述雌性受试者鉴定为子宫内膜异位症阴性后至少三个月对获得的另外的体液样品重复(a)-(e)。
65.根据前述权利要求中任一项所述的方法,其中所述经训练的算法将重要性度量分配给miR-342,所述重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。
66.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量小于分配给至少一种其他miRNA的重要性度量。
67.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。
68.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少三种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b或miR-125b。
69.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给选自由以下各项组成的组中的至少四种miRNA的重要性度量:miR-150、miR-3613、miR-451a、let-7b和miR-125b。
70.根据前述权利要求中任一项所述的方法,其中分配给miR-342的所述重要性度量大于分配给miR-150、miR-3613、miR-451a、let-7b和miR-125b的重要性度量。
71.根据前述权利要求中任一项所述的方法,其中分配给miR-451a的所述重要性度量大于分配给选自由以下各项组成的组中的至少一种miRNA的重要性度量:miR-3613、miR-125b和let-7b。
72.根据前述权利要求中任一项所述的方法,其中分配给miR-451a的所述重要性度量大于分配给选自由以下各项组成的组中的至少两种miRNA的重要性度量:miR-3613、miR-125b和let-7b。
73.根据前述权利要求中任一项所述的方法,其中分配给miR-451a的所述重要性度量大于分配给miR-3613、miR-125b和let-7b的重要性度量。
74.根据前述权利要求中任一项所述的方法,其中将所述重要性度量分配为使得所述重要性度量从最高到最低的排序为:miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
75.根据前述权利要求中任一项所述的方法,其中所述体液样品包括细胞。
76.根据前述权利要求中任一项所述的方法,其中所述体液样品是无细胞样品。
77.根据前述权利要求中任一项所述的方法,其中所述体液样品是血液样品、血浆样品、唾液样品或血清样品。
78.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给miRNA特征的特定重要性度量排序的机器学习算法,其中从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
79.根据前述权利要求中任一项所述的方法,其中所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。
80.根据前述权利要求中任一项所述的方法,其中所述机器学习算法是随机森林算法。
81.根据前述权利要求中任一项所述的方法,其中所述女性群体是绝经前女性。
82.根据前述权利要求中任一项所述的方法,其中所述女性群体包括患有平滑肌瘤、囊腺瘤、慢性盆腔感染、畸胎瘤、子宫内膜瘤或输卵管旁囊肿的任何组合的女性。
83.根据前述权利要求中任一项所述的方法,其中所述女性群体包括患有I/II期子宫内膜异位症的女性。
84.根据前述权利要求中任一项所述的方法,其中所述女性群体包括患有III/IV期子宫内膜异位症的女性或患有所有四期子宫内膜异位症(I/II/III/IV期)的女性。
85.根据前述权利要求中任一项所述的方法,其中所述女性群体包括在获得所述样品之日起3个月内已经接受激素疗法的女性或处于其月经周期任何阶段的女性。
86.根据前述权利要求中任一项所述的方法,其中所述女性群体包括含有至少100名女性的群组。
87.根据前述权利要求中任一项所述的方法,其中所述女性群体包括含有至少500名女性的群组。
88.根据前述权利要求中任一项所述的方法,其中所述女性群体包括含有至少1000名女性的群组。
89.根据前述权利要求中任一项所述的方法,其中基于来自至少100个样品的表达数据来训练所述机器学习算法。
90.根据前述权利要求中任一项所述的方法,其中基于来自至少1000个样品的表达数据来训练所述机器学习算法。
91.根据前述权利要求中任一项所述的方法,其中基于包括患有I-IV期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。
92.根据前述权利要求中任一项所述的方法,还包括在检测到子宫内膜异位症不存在时,用不涉及手术的治疗来治疗所述雌性受试者。
93.根据前述权利要求中任一项所述的方法,还包括在检测到子宫内膜异位症的存在时,向所述雌性受试者施用治疗,其中所述治疗包括激素治疗、手术、腹腔镜手术、他汀类、非甾体抗炎药(NSAID)、口服避孕药、孕激素、促性腺激素释放(GnRH)激动剂、GnRH拮抗剂、雄激素、抗孕酮、选择性雌激素受体调节剂(SERM)、选择性孕酮受体调节剂(SPRM)、阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀、辛伐他汀、扑热息痛、COX-2抑制剂或阿司匹林。
94.一种诊断和治疗雌性受试者中的子宫内膜异位症的方法,包括:
(a)检测来自所述雌性受试者的唾液样品中的与子宫内膜异位症相关的一组miRNA的表达谱,其中所述与子宫内膜异位症相关的一组miRNA包括miR-125b和至少一种其他miRNA;
(b)将机器学习算法应用于所述与子宫内膜异位症相关的一组miRNA的表达谱,其中所述机器学习算法具有分配给miRNA特征的重要性度量,并且其中miR-125b的重要性度量大于miR-150、miR-3613、miR-451a、let-7b或miR-342的重要性度量;
(c)使用所述机器学习算法诊断所述雌性受试者中的子宫内膜异位症;以及
(d)用针对子宫内膜异位症的治疗来治疗所述雌性受试者中诊断的所述子宫内膜异位症。
95.根据权利要求94所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的至少一种。
96.根据权利要求94所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的至少两种。
97.根据权利要求94所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的至少三种。
98.根据权利要求94所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a和miR-3613。
99.一种表征雌性受试者为患有子宫内膜异位症的方法,包括:
(a)获得包括miRNA的体液样品,其中所述体液样品来自雌性受试者;
(b)对所述体液样品中的一组miRNA进行定量实时聚合酶链反应、微阵列测定或测序,其中所述一组miRNA包括与子宫内膜异位症相关的两种或更多种不同的miRNA;
(c)将所述生物样品中的所述与子宫内膜异位症相关的两种或更多种不同miRNA的量与对照RNA的量进行比较,以确定所述体液样品中的所述两种或更多种不同miRNA的归一化的miRNA水平;
(d)通过将所述归一化的miRNA水平输入到经训练的算法中,将所述雌性受试者分类为子宫内膜异位症阳性或阴性,其中通过在所述与子宫内膜异位症相关的两种或更多种不同miRNA的接受者操作特性(ROC)曲线上选择最佳截止点,将所述经训练的算法优化为至少80%的灵敏度,并且其中所述经训练的算法权衡所述两种或更多种不同miRNA的重要性排序;以及
(e)在计算机屏幕上输出报告,所述报告基于(d)中所述雌性受试者为子宫内膜异位症阳性或阴性的分类,将所述雌性受试者鉴定为子宫内膜异位症阳性或阴性。
100.一种表征雌性受试者为不患有子宫内膜异位症的方法,包括:
(a)获得包括miRNA的体液样品,其中所述体液样品来自患有腹痛、胃肠不适、过度出血、不育或月经紊乱的雌性受试者,并且所述受试者先前未被诊断患有子宫内膜异位症;
(b)对所述体液样品中的一组miRNA进行定量实时聚合酶链反应或测序,其中所述一组miRNA包括与子宫内膜异位症相关的两种或更多种不同的miRNA;
(c)将所述生物样品中的所述与子宫内膜异位症相关的两种或更多种不同miRNA的量与对照RNA的量进行比较,以确定所述体液样品中的所述两种或更多种不同miRNA的归一化的miRNA水平;
(d)通过将所述归一化的miRNA水平输入到经训练的算法中,将所述雌性受试者分类为子宫内膜异位症阳性或阴性,其中通过在所述与子宫内膜异位症相关的两种或更多种不同miRNA的接受者操作特性(ROC)曲线上选择最佳截止点,将所述经训练的算法优化为至少80%的特异性,并且其中所述经训练的算法权衡所述两种或更多种不同miRNA的重要性排序;以及
(e)在计算机屏幕上输出报告,所述报告基于(d)中所述雌性受试者为子宫内膜异位症阳性或阴性的分类,将所述雌性受试者鉴定为子宫内膜异位症阳性或阴性。
101.根据权利要求100所述的方法,其中所述经训练的算法计算指示患有子宫内膜异位症的可能性的投票分数。
102.根据权利要求100所述的方法,其中在投票分数大于36%时,所述经训练的算法将所述雌性受试者分类为患有子宫内膜异位症。
103.根据权利要求100所述的方法,其中所述方法对于I/II期子宫内膜异位症的曲线下面积(AUC)值大于0.85。
104.根据权利要求100所述的方法,其中所述方法的曲线下面积(AUC)值大于0.85以区分子宫内膜异位症和平滑肌瘤。
105.根据权利要求100所述的方法,其中所述方法的曲线下面积(AUC)值大于0.85,而与子宫内膜异位症时期或激素治疗无关。
106.根据权利要求100所述的方法,其中将所述方法优化为大于90%的特异性和小于85%的灵敏度。
107.一种检测雌性受试者中的子宫内膜异位症的方法,包括:
(a)在来自所述受试者的包括miRNA的样品中检测与子宫内膜异位症相关的一组miRNA的表达谱;
(b)将机器学习算法应用于所述表达谱以检测来自所述受试者的所述样品中的子宫内膜异位症,其中基于一组miRNA特征来训练所述机器学习算法,所述一组miRNA特征选自由以下各项组成的组:
(i)miR-342、miR-451a和miR-3613;
(ii)miR-342、miR-451a、miR-3613和miR-125b;
(iii)miR-342、miR-451a、miR-3613、miR-125b和let-7b;
(iv)miR-342、miR-451a、let-7b和miR-125b;
(v)miR-342、miR-451a、let-7b和miR-3613;
(vi)miR-342、miR-451a和let-7b;
(vii)miR-125b、miR-150、miR-342、miR-451a和let-7b;以及
(viii)miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。
108.根据权利要求107所述的方法,还包括在(a)之前从所述受试者获得包括miRNA的所述样品。
109.根据权利要求107或108所述的方法,其中所述样品是唾液样品。
110.根据权利要求107或108所述的方法,其中所述样品是血清样品。
111.根据前述权利要求中任一项所述的方法,其中所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。
112.根据前述权利要求中任一项所述的方法,其中所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。
113.根据权利要求112所述的方法,其中所述女性群体是绝经前女性。
114.根据权利要求112所述的方法,其中所述女性群体是绝经前的且超过18岁。
115.根据权利要求112所述的方法,其中所述女性群体是绝经前的且在49岁以下。
116.根据前述权利要求中任一项所述的方法,其中所述女性群体对于严重贫血、增生、息肉和恶性肿瘤呈阴性。
117.根据权利要求112所述的方法,其中所述女性群体包括在获得所述样品之日起3个月内已经接受激素疗法的女性。
118.根据权利要求117所述的方法,其中所述激素疗法包括生育控制药丸或GnRH激动剂。
119.根据前述权利要求中任一项所述的方法,其中基于至少100个样品的表达数据来训练所述机器学习算法。
120.根据前述权利要求中任一项所述的方法,其中基于手术确证的子宫内膜异位症的女性群体来训练所述机器学习算法。
121.根据前述权利要求中任一项所述的方法,其中基于包括患有I期或II期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。
122.根据前述权利要求中任一项所述的方法,其中基于包括患有I-IV期子宫内膜异位症的女性的女性群体来训练所述机器学习算法。
123.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-342的重要性度量大于miR-150、let-7b或miR-125中的至少一种。
124.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中miR-125b的重要性度量大于miR-150、let-7b、miR-451a或miR-3613中的一种。
125.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括基于(viii)的所述一组miRNA特征来训练所述机器学习算法,并且应用具有分配给所述miRNA特征的特定重要性度量的机器学习算法,其中所述miRNA特征从最高到最低的排序为miR-125b、let-7b、miR-3613、miR-150、miR-342和miR-451a。
126.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括基于(viii)中所述一组miRNA特征来训练所述机器学习算法,并且应用具有分配给所述miRNA特征的特定重要性度量排序的机器学习算法,其中从最高到最低的排序为miR-342、miR-451a、miR-3613、miR-125b、let-7b和miR-150。
127.根据前述权利要求中任一项所述的方法,其中将机器学习算法应用于所述表达谱包括基于(viii)中所述一组miRNA特征来训练所述机器学习算法,并且应用具有分配给所述miRNA特征的特定重要性度量的机器算法,其中根据表9中的任何列进行所述miRNA特征的重要性度量排序。
128.一种方法,包括:
(a)在多个基于网络的非暂时性存储设备中以标准化格式存储与雌性患者的病况相关的信息;
(b)通过网络向用户提供远程访问,使得至少一个用户可以通过图形用户界面实时更新与雌性患者的所述病况相关的信息,其中所述至少一个用户以来自所述雌性患者的miRNA表达谱的形式提供更新的信息;
(c)通过内容服务器,使用机器学习算法的应用程序将来自所述雌性患者的miRNA的所述表达谱转换为所述雌性患者患有子宫内膜异位症的可能性;
(d)存储所述雌性患者患有子宫内膜异位症的可能性;
(e)每当所述更新的信息已被存储时,通过所述内容服务器自动生成包含所述雌性患者患有子宫内膜异位症的可能性的消息;以及
(f)通过计算机网络实时向所有用户传送消息,使得每个用户能够立即获得所述雌性患者患有子宫内膜异位症的可能性。
129.根据权利要求128所述的方法,其中基于一组miRNA特征来训练所述机器学习算法,所述一组miRNA特征选自由以下各项组成的组:
(i)miR-342、miR-451a和miR-3613;
(ii)miR-342、miR-451a、miR-3613和miR-125b;
(iii)miR-342、miR-451a、miR-3613、miR-125b和let-7b;
(iv)miR-342、miR-451a、let-7b和miR-125b;
(v)miR-342、miR-451a、let-7b和miR-3613;
(vi)miR-342、miR-451a和let-7b;
(vii)miR-125b、miR-150、miR-342、miR-451a和let-7b;和
(viii)miR-125b、miR-150、miR-342、miR-3613、miR-451a和let-7b。
130.根据权利要求128或129所述的方法,还包括从所述受试者获得包括miRNA的样品。
131.根据权利要求130所述的方法,其中所述样品是血液样品、血浆样品或血清样品。
132.根据权利要求130所述的方法,其中所述样品是唾液样品。
133.根据权利要求130所述的方法,其中所述样品是血清样品。
134.根据前述权利要求中任一项所述的方法,其中所述机器学习算法是随机森林算法、k-最近邻算法(KNN)、支持向量机(SVM)或朴素贝叶斯。
135.根据前述权利要求中任一项所述的方法,其中所述方法在女性群体中检测子宫内膜异位症的AUC大于0.85。
136.根据前述权利要求中任一项所述的方法,其中所述女性群体包括在获得所述样品之日起3个月内已经接受激素疗法的女性。
137.根据前述权利要求中任一项所述的方法,其中所述激素疗法包括生育控制药丸或GnRH激动剂。
138.根据前述权利要求中任一项所述的方法,其中所述样品是无细胞血清样品。
139.根据前述权利要求中任一项所述的方法,其中所述样品是无细胞唾液样品。
140.根据前述权利要求中任一项的方法,还包括基于(e)中报告的所述可能性向所述受试者施用治疗以治疗所述子宫内膜异位症。
141.根据权利要求140所述的方法,其中所述治疗包括激素治疗、他汀类或非甾体抗炎药(NSAID)。
142.根据权利要求140所述的方法,其中所述激素治疗包括口服避孕药、孕激素、GnRH激动剂、GnRH拮抗剂、雄激素、抗孕酮、SERM或SPRM。
143.根据权利要求140所述的方法,其中所述他汀类包括阿托伐他汀、西立伐他汀、氟伐他汀、洛伐他汀、美伐他汀、匹伐他汀、普伐他汀、瑞舒伐他汀或辛伐他汀。
144.根据权利要求140所述的方法,其中所述NSAID包括扑热息痛、COX-2抑制剂或阿司匹林。
CN202080047981.9A 2019-04-29 2020-04-28 用于检测子宫内膜异位症的分类器 Pending CN114402083A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962840300P 2019-04-29 2019-04-29
US62/840,300 2019-04-29
USPCT/US2019/059006 2019-10-31
PCT/US2019/059006 WO2020092672A2 (en) 2018-10-31 2019-10-31 A quantitative algorithm for endometriosis
PCT/US2020/030284 WO2020223238A1 (en) 2019-04-29 2020-04-28 Classifiers for detection of endometriosis

Publications (1)

Publication Number Publication Date
CN114402083A true CN114402083A (zh) 2022-04-26

Family

ID=73028712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080047981.9A Pending CN114402083A (zh) 2019-04-29 2020-04-28 用于检测子宫内膜异位症的分类器

Country Status (8)

Country Link
EP (1) EP3963094A4 (zh)
JP (1) JP2022530636A (zh)
CN (1) CN114402083A (zh)
AU (1) AU2020265577A1 (zh)
BR (1) BR112021021866A2 (zh)
CA (1) CA3134382A1 (zh)
SG (1) SG11202111117WA (zh)
WO (1) WO2020223238A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3800267A1 (en) 2014-03-27 2021-04-07 Yale University Circulating micrornas as biomarkers for endometriosis
KR20190057305A (ko) 2016-08-30 2019-05-28 예일 유니버시티 자궁내막증에 대한 바이오마커로서의 microRNAs

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2015221951A1 (en) * 2014-02-27 2016-09-15 Queen Mary University Of London Biomarkers for endometriosis
WO2019046494A1 (en) * 2017-08-30 2019-03-07 Dot Laboratories, Inc. METHODS AND COMPOSITIONS FOR DETECTION AND TREATMENT OF ENDOMETRIOSIS

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3118133A1 (en) * 2018-10-31 2020-05-07 Yale University A quantitative algorithm for endometriosis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2015221951A1 (en) * 2014-02-27 2016-09-15 Queen Mary University Of London Biomarkers for endometriosis
WO2019046494A1 (en) * 2017-08-30 2019-03-07 Dot Laboratories, Inc. METHODS AND COMPOSITIONS FOR DETECTION AND TREATMENT OF ENDOMETRIOSIS

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EMINE COSAR, M.D.: "Serum microRNAs as diagnostic markers of endometriosis: a comprehensive array-based analysis", FERTILITY AND STERILITY, vol. 106, no. 2, 11 May 2016 (2016-05-11), pages 1, XP029669756, DOI: 10.1016/j.fertnstert.2016.04.013 *
SIHYUN CHO, M.D.: "Circulating microRNAs as potential biomarkers for endometriosis", FERTILITY AND STERILITY, vol. 103, no. 5, 13 March 2015 (2015-03-13), pages 1255, XP029155696, DOI: 10.1016/j.fertnstert.2015.02.013 *

Also Published As

Publication number Publication date
AU2020265577A1 (en) 2021-11-04
WO2020223238A1 (en) 2020-11-05
EP3963094A1 (en) 2022-03-09
SG11202111117WA (en) 2021-11-29
EP3963094A4 (en) 2024-02-28
JP2022530636A (ja) 2022-06-30
BR112021021866A2 (pt) 2021-12-21
CA3134382A1 (en) 2020-11-05

Similar Documents

Publication Publication Date Title
US20220305075A1 (en) Methods and compositions for detecting and treating endometriosis
JP2022519897A (ja) 対象の妊娠関連状態を決定するための方法及びシステム
US20230059244A1 (en) Classifiers for detection of endometriosis
EP3692537B1 (en) Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
JP2018514189A (ja) 敗血症の診断法
US11685951B2 (en) Biomarkers for intracranial aneurysm
CN109477145A (zh) 炎症性肠病的生物标志物
JP2023524627A (ja) 核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
US20230348980A1 (en) Systems and methods of detecting a risk of alzheimer&#39;s disease using a circulating-free mrna profiling assay
CN114402083A (zh) 用于检测子宫内膜异位症的分类器
AU2020428397A1 (en) Method for predicting the likelihood of ectopic pregnancy (EP), viable intrauterine pregnancy (VIUP), or non-viable intrauterine pregnancy (NVIUP).
CN113454241A (zh) 胎盘功能障碍的核酸生物标志物
CA3227495A1 (en) Somatic variant cooccurrence with abnormally methylated fragments
WO2015179771A2 (en) Molecular signatures for distinguishing liver transplant rejections or injuries
JP2021517892A (ja) 疼痛のための精密医療:診断バイオマーカー、薬理ゲノミクス、およびリパーパス薬
WO2022245773A2 (en) Methods and systems for methylation profiling of pregnancy-related states
AU2022348442A1 (en) Methods for treating and diagnosing risk of renal allograft fibrosis and rejection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination