CN118028446A - 检测标志物及其应用 - Google Patents
检测标志物及其应用 Download PDFInfo
- Publication number
- CN118028446A CN118028446A CN202211377213.7A CN202211377213A CN118028446A CN 118028446 A CN118028446 A CN 118028446A CN 202211377213 A CN202211377213 A CN 202211377213A CN 118028446 A CN118028446 A CN 118028446A
- Authority
- CN
- China
- Prior art keywords
- preeclampsia
- model
- subject
- risk
- predicting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 32
- 239000003550 marker Substances 0.000 title claims abstract description 25
- 201000011461 pre-eclampsia Diseases 0.000 claims abstract description 109
- 238000012549 training Methods 0.000 claims abstract description 14
- 108091074194 miR-181b-1 stem-loop Proteins 0.000 claims abstract description 9
- 108091038599 miR-181b-2 stem-loop Proteins 0.000 claims abstract description 9
- 108091047242 miR-663a stem-loop Proteins 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 25
- 239000000523 sample Substances 0.000 claims description 23
- 238000003062 neural network model Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 16
- 230000035606 childbirth Effects 0.000 claims description 15
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 210000004369 blood Anatomy 0.000 claims description 10
- 239000008280 blood Substances 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 210000002700 urine Anatomy 0.000 claims description 9
- 238000007477 logistic regression Methods 0.000 claims description 8
- 210000004381 amniotic fluid Anatomy 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 6
- 210000002966 serum Anatomy 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 239000002671 adjuvant Substances 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims 1
- 230000035935 pregnancy Effects 0.000 abstract description 14
- 210000005259 peripheral blood Anatomy 0.000 abstract description 8
- 239000011886 peripheral blood Substances 0.000 abstract description 8
- 238000012795 verification Methods 0.000 abstract description 6
- 230000035945 sensitivity Effects 0.000 abstract description 5
- 239000002773 nucleotide Substances 0.000 description 54
- 125000003729 nucleotide group Chemical group 0.000 description 54
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 26
- 210000002381 plasma Anatomy 0.000 description 23
- 108090000623 proteins and genes Proteins 0.000 description 14
- 108091092259 cell-free RNA Proteins 0.000 description 13
- 150000007523 nucleic acids Chemical class 0.000 description 10
- 238000010200 validation analysis Methods 0.000 description 10
- 108020004707 nucleic acids Proteins 0.000 description 9
- 102000039446 nucleic acids Human genes 0.000 description 9
- 239000003147 molecular marker Substances 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 239000000090 biomarker Substances 0.000 description 3
- 208000002296 eclampsia Diseases 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013058 risk prediction model Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 108091035677 Small Cajal body specific RNA 4 Proteins 0.000 description 2
- 229960001138 acetylsalicylic acid Drugs 0.000 description 2
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000002826 placenta Anatomy 0.000 description 2
- 230000003169 placental effect Effects 0.000 description 2
- 208000012113 pregnancy disease Diseases 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 230000036266 weeks of gestation Effects 0.000 description 2
- 101150040471 19 gene Proteins 0.000 description 1
- 206010061452 Complication of pregnancy Diseases 0.000 description 1
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 102100026236 Interleukin-8 Human genes 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 208000002787 Pregnancy Complications Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 229940109239 creatinine Drugs 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 210000003785 decidua Anatomy 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000035487 diastolic blood pressure Effects 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 210000005059 placental tissue Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 201000001474 proteinuria Diseases 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000035488 systolic blood pressure Effects 0.000 description 1
- 210000002993 trophoblast Anatomy 0.000 description 1
- 238000012049 whole transcriptome sequencing Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及生物检测领域,尤其涉及检测标志物及其应用。本发明提供了检测标志物,包括:MIR181B1、MIR181B2、MIR663A、SNORD29、SNORD14E、TRG‑CCC1‑2、SCARNA26A、SCARNA4和TRG‑CCC1‑1中的一种或多种。本发明提供的检测标志物可以在孕早期且最多可以提前20周,以及只需要采取孕妇外周血就可以用无创的方法对子痫前期进行风险预测,预测的灵敏性可达91.6%,特异性可达100%,接收器工作特性曲线下面积(AUC)在训练集0.94,验证集0.958,均高于现有技术水平。
Description
技术领域
本发明涉及生物检测领域,尤其涉及检测标志物及其应用。
背景技术
子痫前期(PE)是一种与妊娠新发高血压相关的妊娠疾病,影响3~5%的怀孕。在最新的指南中,子痫前期定义为妊娠20周后孕妇出现收缩压≥140mmHg和(或)舒张压≥90mmHg,伴有下列任意一项:尿蛋白定量≥0.3g/24h,或尿蛋白/肌酐比值≥0.3,或随机尿蛋白≥(+)(无条件进行蛋白定量时的检查方法);无蛋白尿但伴有以下任何一种器官或系统受累:心、肺、肝、肾等重要器官,或血液系统、消化系统、神经系统的异常改变,胎盘-胎儿受到累及等。FIGO指南中根据子痫前期的诊断时间和分娩时间将子痫前期分成四种类型:早发型、晚发型子痫前期,早产、足月子痫前期,在34周前诊断为子痫前期的为早发型子痫前期,在37周前分娩的为早产型子痫前期。
截止目前,子痫前期的确切发病机理仍不清楚,也没有有效的治疗方法,终止妊娠和胎盘分娩是子痫前期的唯一有效治疗选择。在预防子痫前期的措施中,针对高风险子痫前期的孕妇人群服用阿司匹林是公认的方法。研究表明在妊娠≤16周服用阿司匹林可显著降低子痫前期的风险。如何对子痫前期高风险孕妇在子痫前期发作之前进行早期预测是迫切需要解决的问题。
已知一些子痫前期的风险因素,如高龄;家族病史和子痫前期病史;妊娠间隔时间;辅助生殖技术;肥胖等进行子痫前期高危人群筛查的研究,但是由于子痫前期的异质性和复杂性表现,没有已知的危险因素并不意味着子痫前期不会发生,通过母体的风险因素对子痫前期的高危人群进行预测并不准确。近年来,研究者对胎盘,血浆,蜕膜,外泌体,羊水子痫前期的机制进行了一些转录组学研究,并报道了一些与子痫前期早期预测相关的潜在的生物标志物。胎盘细胞功能障碍会导致严重的妊娠并发症,但侵入性胎盘组织采样会对孕妇和胎儿造成一定的不安全性,而通过对母体血液中的游离的循环RNA进行分析,可以无创的非侵入性的发现子痫前期胎盘中绒毛外滋养层细胞的功能异常,有助于在子痫前期症状发生前对孕妇进行子痫前期早期预测。但是到目前为止,还没有任何一种被大家广泛认可,可以应用于临床实践中的可以对各种类型的子痫前期进行预测的生物标志物。所以迫切需要开发一种非侵入性的可广泛应用于临床的可以高准确度的适用于各个妊娠阶段的,在症状发生前对子痫前期(尤其是早发型子痫前期)进行早期预测的生物标志物。
发明内容
有鉴于此,本发明提供了检测标志物及其应用。本发明提供的检测标志物可以在孕早期且最多可以提前20周,以及只需要采取孕妇外周血就可以用无创的方法对子痫前期进行风险预测,预测的灵敏性可达91.6%,特异性可达100%,接收器工作特性曲线下面积(AUC)在训练集0.94,验证集0.958,均高于现有技术水平。
为了实现上述发明目的,本发明提供以下技术方案:
本发明提供了检测标志物,包括:MIR181B1、MIR181B2、MIR663A、SNORD29、SNORD14E、TRG-CCC1-2、SCARNA26A、SCARNA4和TRG-CCC1-1中的一种或多种。
在本发明的一些实施方案中,上述检测标志物的核酸分子中,所述MIR181B1具有:
(1)、如SEQ ID NO:1所示的核苷酸序列;或
(2)、如(1)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(1)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(3)、与(1)或(2)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述MIR181B2具有:
(4)、如SEQ ID NO:2所示的核苷酸序列;或
(5)、如(4)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(4)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(6)、与(4)或(5)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述MIR663A具有:
(7)、如SEQ ID NO:3所示的核苷酸序列;或
(8)、如(7)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(7)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(9)、与(7)或(8)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述SNORD29具有:
(10)、如SEQ ID NO:4所示的核苷酸序列;或
(11)、如(10)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(10)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(12)、与(10)或(11)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述SNORD14E具有:
(13)、如SEQ ID NO:5所示的核苷酸序列;或
(14)、如(13)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(13)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(15)、与(13)或(14)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述TRG-CCC1-2具有:
(16)、如SEQ ID NO:6所示的核苷酸序列;或
(17)、如(16)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(16)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(18)、与(16)或(17)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述SCARNA26A具有:
(19)、如SEQ ID NO:7所示的核苷酸序列;或
(20)、如(19)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(19)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(21)、与(19)或(20)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述SCARNA4具有:
(22)、如SEQ ID NO:8所示的核苷酸序列;或
(23)、如(22)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(22)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(24)、与(22)或(23)所示的核苷酸序列至少有80%同一性的核苷酸序列;或
所述TRG-CCC1-1具有:
(25)、如SEQ ID NO:9所示的核苷酸序列;或
(26)、如(25)所示的核苷酸序列经取代、缺失或添加一个或多个碱基获得的核苷酸序列,且与(25)所示的核苷酸序列功能相同或相似的核苷酸序列;或
(27)、与(25)或(26)所示的核苷酸序列至少有80%同一性的核苷酸序列。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:1的序列为:CCTGTGCAGAGATTATTTTTTAAAAGGTCACAATCAACATTCATTGCTGTCGGTGGGTTGAACTGTGTGGACAAGCTCACTGAACAATGAATGCAACTGTGGCCCCGCTT。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:2的序列为:CTGATGGCTGCACTCAACATTCATTGCTGTCGGTGGGTTTGAGTCTGAATCAACTCACTGATCAATGAATGCAAACTGCGGACCAAACA。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:3的序列为:CCTTCCGGCGTCCCAGGCGGGGCGCCGCGGGACCGCCCTCGTGTCTGTGGCGGTGGGATCCCGCGGCCGTGTTTTCCTGGTGGCCCGGCCATG。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:4的序列为:TTTCTATGATGAATCAAACTAGCTCACTATGACCGACAGTGAAAATACATGAACACCTGAGAAAC。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:5的序列为:ATGATGAATGGTCCAAAACATTCGCGGTTTCCACCAGAATTCAAGGTGTTGGCAACTACCTTCCTTGGATGTCTGAGTGA。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:6的序列为:GCATTGGTGGTTCAGTGGTAGAATTCTCGCCTCCCACGCGGGAGACCCGGGTTCAATTCCCGGCCAATGCA。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:7的序列为:AAGTCTCCTTGTTATGGGGCAGTGCAGCTGTAGGCCAAGCTGTATCTGTTTGGGAAGGGAGAAAAAACAGTAGCTGGCATCCATATCCACTTCTCCGGGTGAGTGGTGCTGGAGAGGTATGTAGGACTCAATGTGGCCAGCCACACAA。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:8的序列为:ACTGGAGGACTAAGAAGGCTGAGTCTGATGAAGTAAGACTTTGCTGATACATTCCTCCTAGAAAAAAGGGTTGGAGAGAGCAGCCTTCACTGAAGAGTATCACAGGGCTGACTGTACTACCCAACACTC。
在本发明的一些实施方案中,上述核酸分子中,所述SEQ ID NO:9的序列为:GCATTGGTGGTTCAGTGGTAGAATTCTCGCCTCCCACGCGGGAGACCCGGGTTCAATTCCCGGCCAATGCA。
本发明还提供了上述检测标志物在制备检测子痫前期和/或分娩孕周的产品中的应用。
在本发明的一些实施方案中,上述应用中所述子痫前期为早发型子痫前期。
在本发明的一些实施方案中,上述应用中所述产品的检测样品包括血浆、全血、羊水、血清和尿液中的一种或多种。
本发明还提供了引物、探针或其组合,以上述检测标志物为扩增的目的片段。
本发明还提供了检测产品,包括上述引物、探针或其组合以及可接受的助剂。
在本发明的一些实施方案中,上述检测产品包括芯片、试剂或试剂盒中的一种或多种。
本发明还提供了上述检测标志物的筛选方法中所述筛选方法采用的筛选模型包括:平均神经网络模型、梯度提升机、逻辑回归模型、神经网络模型或支持向量机中的一种或多种。
本发明还提供了检测子痫前期或分娩孕周或预测子痫前期风险的方法,确定受试者取待检测样本中检测标志物的检出量,检测受试者是否患有子痫前期或预测受试者的分娩孕周。
本发明通过检测受试者子痫前期或预测子痫前期的风险,可以预测受试者是否发生早产,从而可以预测受试者的分娩孕周。
在本发明的一些实施方案中,检测样本包括血浆、全血、羊水、血清和尿液中的一种或多种。
在本发明的一些实施方案中,检测样本在孕妇第20孕周前采集获得,优选在11~20孕周采集获得。
在本发明的一些实施方案中,预测是否患有子痫前期的方法通过预测模型来实现。
在本发明的一些实施方案中,预测模型以子痫前期孕妇样本和健康孕妇样本的检测标志物的检出量为输入,并以患有子痫前期风险为输出,进行机器学习模型训练得到。
子痫前期风险通过风险分数确定,当风险分数大于或等于阈值表明孕妇患有子痫前期或存在子痫前期风险;阈值为0.5。
在本发明的一些实施方案中,机器学习模型包括:平均神经网络模型、梯度提升机、逻辑回归模型、神经网络模型或和支持向量机中的一种或多种。
本发明还提供了检测子痫前期或分娩孕周或预测子痫前期风险的装置,包括:预测模块;
用于根据受试者检测样本中检测标志物的检出量,检测受试者是否患有子痫前期或预测受试者的分娩孕周或预测受试者患有子痫前期风险;
在本发明的一些实施方案中,检测样本包括血浆、全血、羊水、血清和尿液中的一种或多种。
在本发明的一些实施方案中,检测样本在孕妇第20孕周前采集获得,优选在11~20孕周采集获得。
在本发明的一些实施方案中,检测受试者是否患有子痫前期或预测受试者的分娩孕周或预测受试者患有子痫前期风险的方法通过预测模型来实现;
在本发明的一些实施方案中,预测模型以子痫前期孕妇样本和健康孕妇样本的检测标志物的检出量为输入,并以患有子痫前期风险为输出,进行机器学习模型训练得到。
子痫前期风险通过风险分数确定,当风险分数大于或等于阈值表明孕妇患有子痫前期或存在子痫前期风险;阈值为0.5。
优选地,机器学习模型包括:平均神经网络模型、梯度提升机、逻辑回归模型、神经网络模型或和支持向量机中的一种或多种。
本发明还提供了计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述检测子痫前期或分娩孕周或预测子痫的方法。
本发明还提供了计算机处理设备,包括处理器和上述计算机可读存储介质,所述处理器执行所述计算机可读存储介质上的计算机程序,实现上述检测子痫前期或分娩孕周或预测子痫的方法。
本发明还提供了电子终端,包括:上述处理器、存储器和通信器;所述存储器用于存储计算机程序,所述通信器用于与外部设备进行通信连接,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述检测子痫前期或分娩孕周或预测子痫的方法。
本发明提供了检测标志物,包括:MIR181B1、MIR181B2、MIR663A、SNORD29、SNORD14E、TRG-CCC1-2、SCARNA26A、SCARNA4和TRG-CCC1-1中的一种或多种。
本发明的有益效果包括:
(1)本发明提供的检测标志物可以在孕早期且最多可以提前20周,以及只需要采取孕妇外周血就可以用无创的方法对子痫前期进行风险预测,预测的灵敏性可达91.6%,特异性可达100%,接收器工作特性曲线下面积(AUC)在训练集0.94,验证集0.958,均高于现有技术水平。
(2)本发明针对孕早中期所有孕妇进行子痫前期风险预测,不区分是否子痫前期高危人群,可以在症状发生前进行风险预测,适用人群更广,更具有临床应用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1示9个RNA分子标志物多模型受试者工作特征(ROC)曲线;
图2示5个RNA分子模型;
图3示12个RNA分子模型。
具体实施方式
本发明公开了检测标志物及其应用。
应该理解,表述“……中的一种或多种”单独地包括每个在所述表述后叙述的物体以及所述叙述的物体中的两者或更多者的各种不同组合,除非从上下文和用法中另有理解。与三个或更多个叙述的物体相结合的表述“和/或”应该被理解为具有相同的含义,除非从上下文另有理解。
术语“包括”、“具有”或“含有”,包括其语法同义语的使用,通常应该被理解为开放性和非限制性的,例如不排除其他未叙述的要素或步骤,除非另有具体陈述或从上下文另有理解。
应该理解,只要本发明仍可操作,步骤的顺序或执行某些行动的顺序并不重要。此外,两个或更多个步骤或行动可以同时进行。
本文中的任何和所有实例或示例性语言如“例如”或“包括”的使用,仅仅打算更好地说明本发明,并且除非提出权利要求,否则不对本发明的范围构成限制。本说明书中的任何语言都不应解释为指示任何未要求保护的要素对于本发明的实践是必不可少的。
此外,用以界定本发明的数值范围与参数皆是约略的数值,此处已尽可能精确地呈现具体实施例中的相关数值。然而,任何数值本质上不可避免地含有因个别测试方法所致的标准偏差。因此,除非另有明确的说明,应当理解本公开所用的所有范围、数量、数值与百分比均经过“约”的修饰。在此处,“约”通常是指实际数值在一特定数值或范围的正负10%、5%、1%或0.5%之内。
本发明提供了一种利用血浆游离RNA去寻找子痫前期的可以无创的方法进行风险预测的分子标志物并构建子痫前期风险预测模型。
本发明利用母体外周血血浆生成血浆游离RNA的表达谱,比较在孕早、中期子痫前期与非子痫前期的孕妇群体的血浆游离RNA表达谱的差异特征,筛选出子痫前期风险预测标志物,并利用机器学习算法(平均神经网络模型、梯度提升机、广义线性模型、神经网络模型和支持向量机)构建子痫前期风险预测模型。
具体步骤如下:
(1)母体血浆游离RNA获取
从孕妇获取外周血,并立即存储在4℃下,并在8小时内实行血浆分离。血浆分离之后立即存储在-80℃等待下一步的处理。获取孕妇外周血的孕周在13至19孕周。在血浆中按照1:3比例加入Trizol LS并立即震荡混匀,后续的cfRNA提取步骤可以使用TRIzol LS标准的RNA提取步骤或本领域常用的方法或试剂盒或两者组合的方法。
(2)cfRNA的测序或RT-PCR
采用胞外游离RNA的建库方法,这种方法能同时捕获血浆中长片段及短片段的RNA,为预测提供更多的特征。cfRNA的测序利用全转录组测序,使用下一代测序法对子痫前期和非子痫前期的孕妇外周血的血浆样本RNA进行测序。也可以采用RT-PCR的方法进行分析,包括但不限于这两种方法对cfRNA的表达谱进行定量分析。
(3)cfRNA的表达谱定量
将原始的cfRNA测序数据进行质控,包括剪切接头,去除低质量读长,去除<17bp长度的的读长,将质控后的高质量序列比对到人基因组,使用TPM方法进行定量。
(4)早发型子痫前期分子标志物(如表1和表2所示)
早发型子痫前期的分子标志物包括以下血浆游离RNA分子的至少一种MIR181B1、MIR181B2、MIR663A、SNORD29、SNORD14E、TRG-CCC1-2、SCARNA26A、SCARNA4、TRG-CCC1-1。
表19个早发型子痫前期特征基因的基因和转录本信息
基因名称 | 基因ID | 转录本长度(bp) |
MIR181B1 | 406955 | 110 |
MIR181B2 | 406956 | 89 |
MIR663A | 724033 | 93 |
SNORD29 | 9297 | 65 |
SNORD14E | 85391 | 80 |
RG-CCC1-2 | 100189298 | 71 |
SCARNA26A | 106633810 | 148 |
SCARNA4 | 677771 | 129 |
TRG-CCC1-1 | 7195 | 71 |
表2早发型子痫前期标志物基因的核酸序列
(5)基于标志物模型的子痫前期风险预测
根据已有的子痫前期风险预测模型(包括平均神经网络模型(AvNN),梯度提升机(GBM),逻辑回归模型(LR),神经网络模型(nnet)和支持向量机(SVM)),基于最终筛选出来的分子标志物,对样本进行子痫前期风险评估,其中风险分数大于或等于0.5认为子痫前期高风险,小于0.5认为子痫前期低风险。子痫前期风险分数由模型自动计算。
本发明实施例1~实施例7中,所用原料及试剂均可由市场购得。
下面结合实施例,进一步阐述本发明:
实施例1母体血浆获取
80例的单胎孕妇外周血从医院获取,包括40例早发型子痫前期和40例非子痫前期的孕妇外周血,血液收集孕周为13周至19周(如表3所示)。子痫前期组的样本从采血到子痫前期诊断相差孕周最大为20周。所有血液样本立即存储在4℃下,并在8小时内实行血浆分离。血浆分离采用2步离心法,在4℃以1,600g转速离心10分钟,再以12,000g转速离心10分钟。血浆分离之后立即存储在-80℃等待下一步的处理。
表3测试集和验证集样本人口统计学和临床特征
实施例2cfRNA的提取
在实施例1获得的血浆中加入Trizol LS(血浆:Trizol LS=1:3)并立即震荡混匀,后续的cfRNA提取步骤可以使用TRIzol LS标准的RNA提取方法。
实施例3cfRNA的测序
采用胞外游离RNA的建库方法,这种方法能同时捕获血浆中长片段及短片段的RNA,为预测提供更多的特征。cfRNA的测序利用全转录组测序,使用下一代测序法对子痫前期和非子痫前期的血浆样本进行测序。
实施例4cfRNA的表达谱定量
将原始的cfRNA测序数据进行质控,包括剪切接头,去除低质量读长,去除<17bp长度的的读长。将质控后的高质量序列比对到人基因组(GRCh38.p13),使用TPM方法进行定量,公式如下:
TPM=(Ni/Li)*1000000/(sum(N1/L1+N2/L2+N3/L3+…+Nn/Ln))
Ni为比对到第i个基因的读长数;Li为第i个基因的长度;sum(N1/L1+N2/L2+...+Nn/Ln)为所有(n个)基因按长度进行标准化之后数值的和。
实施例5分子标志物筛选
利用循环RNA的表达谱,比较子痫前期与非子痫前期的孕妇群体的cfRNA表达谱的基因上下调差异表达特征,筛选出子痫前期风险预测分子标志物。
首先将实施例1中的样本所有分组按照7:3的比例随机拆分成训练集和验证集,此时训练集包含28个子痫前期的样本和28个非子痫前期样本,验证集包含12个子痫前期的样本和12个非子痫前期样本(如图1所示)。所有的分子标志物筛选皆在训练集完成,验证集用于检验分子标志物及模型的预测效果。首先,通过比较子痫前期和非子痫前期组的表达谱差异来初步筛选候选的分子标志物,该步骤使用DESeq2包(R软件包)实现。对于每一个基因,在两组的平均表达量的差异和稳定性会在该步骤中考虑(平均表达量差异倍数绝对值大于1.5,p值小于0.05且校正后的p值小于0.1),最终通过筛选的基因采用用广义线性模型根据特征重要性进一步进行筛选,挑选出现频率较高的分子作为候选分子标志物。
实施例6基于标志物模型的构建及验证
如图1所示,根据实施例5获得的候选分子标志物进行模型的构建,首先在训练集中,基于候选分子标志物,采用5种机器学习算法(平均神经网络模型(AvNN),梯度提升机(GBM),逻辑回归模型(LR),神经网络模型(nnet)和支持向量机(SVM)))进行子痫前期的风险评估。每一种算法都采用十折交叉验证的方式挑选出最优参数进行预测模型构建。并通过模型训练集和验证集结果比较,去除训练集和验证集AUC(Area under thereceiveroperating characteristic curve,接收者操作特征曲线面积)<0.9的RNA分子组合,获得优化的RNA分子标志物组合。再根据验证集的AUC,验证RNA分子标志物组合的建模效果,筛选预测效果较佳的RNA分子标志物组合。
如图2和图3所示,为本实施例通过上述方案筛除的RNA分子标志物组合物。
使用5个RNA分子组合:MIR181B1、MIR181B2、SNORD29、SNORD14E和TRG-CCC1-2进行模型构建,如图2所示,构建的LR模型训练集AUC为0.861,验证集AUC为0.763。
使用12个RNA分子组合:MIR181B1、MIR181B2、MIR663A、SNORD29、SNORD14E、TRG-CCC1-2、SCARNA26A、SCARNA4、TRG-CCC1-1、CXCL8、SNORD15A和SNORD13P3进行模型构建,如图3所示,构建的LR模型训练集AUC为0.975,验证集AUC为0.896。
实施例7分子标志物对子痫前期风险的预测效果评估
对实施例6筛选得到的RNA分子标志物组合进行模型构建,根据模型预测效果,如图1和表4所示,最终筛选出9个RNA分子标志物,使用这9个RNA分子标志物建模可构建最佳预测模型。我们使用这9个RNA分子标志物构建的模型在AvNN、GBM、LR、nnet和SVM模型中训练集验证集AUC均在0.9以上,其中预测效果最佳的模型是LR,敏感性91.7%,特异性100%,验证集AUC为0.958。
表4最佳的模型LR测试集和验证集AUC、灵敏度及特异性
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.检测标志物,其特征在于,包括:MIR181B1、MIR181B2、MIR663A、SNORD29、SNORD14E、TRG-CCC1-2、SCARNA26A、SCARNA4和TRG-CCC1-1中的一种或多种。
2.如权利要求1所述的检测标志物在制备检测子痫前期和/或分娩孕周的产品中的应用。
3.如权利要求2所述的应用,其特征在于,所述子痫前期为早发型子痫前期。
4.如权利要求2或3所述的应用,其特征在于,所述产品的检测样品包括血浆、全血、羊水、血清和尿液中的一种或多种。
5.引物、探针或其组合,其特征在于,以如权利要求1所述的检测标志物为扩增的目的片段。
6.检测产品,其特征在于,包括如权利要求5所述的引物、探针或其组合以及可接受的助剂。
7.如权利要求6所述的检测产品,其特征在于,包括芯片、试剂和试剂盒中的一种或多种。
8.如权利要求1所述的检测标志物的筛选方法,其特征在于,所述筛选方法采用的筛选模型包括:广义线性模型、平均神经网络模型、梯度提升机、逻辑回归模型、神经网络模型和支持向量机中的一种或多种。
9.检测子痫前期或分娩孕周或预测子痫前期风险的方法,其特征在于,确定受试者检测样本中权利要求1所述的检测标志物的检出量,检测受试者是否患有子痫前期或预测受试者的分娩孕周;
优选地,所述检测样本包括血浆、全血、羊水、血清和尿液中的一种或多种;
优选地,所述预测是否患有子痫前期的方法通过预测模型来实现;
优选地,所述预测模型以子痫前期孕妇样本和健康孕妇样本的所述检测标志物的检出量数据为输入,并以患有子痫前期风险为输出,进行机器学习模型训练得到;
优选地,所述机器学习模型包括:平均神经网络模型、梯度提升机、逻辑回归模型、神经网络模型或和支持向量机中的一种或多种。
10.检测子痫前期或分娩孕周或预测子痫前期风险的装置,其特征在于,包括:预测模块;
用于根据受试者检测样本中权利要求1所述的检测标志物的检出量,检测受试者是否患有子痫前期或预测受试者的分娩孕周或预测受试者患有子痫前期风险;
优选地,所述检测样本包括血浆、全血、羊水、血清和尿液中的一种或多种;
优选地,所述检测受试者是否患有子痫前期或预测受试者的分娩孕周或预测受试者患有子痫前期风险的方法通过预测模型来实现;
优选地,所述预测模型以子痫前期孕妇样本和健康孕妇样本的所述检测标志物的检出量数据为输入,并以患有子痫前期风险为输出,进行机器学习模型训练得到;
优选地,所述机器学习模型包括:平均神经网络模型、梯度提升机、逻辑回归模型、神经网络模型或和支持向量机中的一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211377213.7A CN118028446A (zh) | 2022-11-04 | 2022-11-04 | 检测标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211377213.7A CN118028446A (zh) | 2022-11-04 | 2022-11-04 | 检测标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118028446A true CN118028446A (zh) | 2024-05-14 |
Family
ID=90997504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211377213.7A Pending CN118028446A (zh) | 2022-11-04 | 2022-11-04 | 检测标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118028446A (zh) |
-
2022
- 2022-11-04 CN CN202211377213.7A patent/CN118028446A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230203573A1 (en) | Methods for detection of donor-derived cell-free dna | |
Contro et al. | Cell-free fetal DNA for the prediction of pre-eclampsia at the first and second trimesters: a systematic review and meta-analysis | |
CN113692624A (zh) | 用于确定受试者的妊娠相关状态的方法和系统 | |
US10670610B2 (en) | Biomarker test for prediction or early detection of preeclampsia and/or HELLP syndrome | |
Tarca et al. | Maternal whole blood mRNA signatures identify women at risk of early preeclampsia: a longitudinal study | |
CN116234929A (zh) | 用于确定对象的妊娠相关状态的方法和系统 | |
US20200109452A1 (en) | Method of detecting a fetal chromosomal abnormality | |
CN110387414B (zh) | 一种利用外周血游离dna预测妊娠期糖尿病的模型 | |
US20230135486A1 (en) | Circulating rna signatures specific to preeclampsia | |
CN113454241A (zh) | 胎盘功能障碍的核酸生物标志物 | |
CN110580934A (zh) | 一种基于外周血游离dna高通量测序预测妊娠期相关疾病的方法 | |
CN118028446A (zh) | 检测标志物及其应用 | |
Rezk et al. | Biomarker screening in preeclampsia: an RNA-sequencing approach based on data from multiple studies | |
WO2023102840A1 (zh) | 基因标志物在预测孕妇子痫前期风险中的应用 | |
WO2024124587A1 (zh) | 子痫前期生物标志物及其用途 | |
KR102264060B1 (ko) | 구강 질환의 위험도 예측 방법 및 이를 수행하는 시스템, 그 방법이 을 수행하기 위한 프로그램이 기록된 컴퓨터 판독이 가능한 기록매체 | |
JP2015522258A (ja) | 子癇前症及び/またはhellp症候群の予測または早期検出のバイオマーカー検査 | |
WO2023102786A1 (zh) | 基因标志物在预测孕妇早产风险中的应用 | |
CN108707659A (zh) | 血清中LncRNA作为URSA诊断及妊娠结局评估标志物的应用 | |
CN118028447A (zh) | 预测子痫前期的标志物及装置 | |
EP3339861B1 (en) | Biomarker test for prediction or early detection of preeclampsia | |
CN116287175A (zh) | 标志物在制备预测妊娠期肝内胆汁淤积症的相关产品中的应用 | |
RU2712175C1 (ru) | Способ неинвазивного пренатального скрининга анеуплоидий плода | |
WO2021252574A1 (en) | Nucleic acid biomarkers for placental dysfunction | |
Lesniak | Identifying Preeclampsia Risk with Biological Aging Ratios |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |