CN116863995A - Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用 - Google Patents

Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用 Download PDF

Info

Publication number
CN116863995A
CN116863995A CN202311094699.8A CN202311094699A CN116863995A CN 116863995 A CN116863995 A CN 116863995A CN 202311094699 A CN202311094699 A CN 202311094699A CN 116863995 A CN116863995 A CN 116863995A
Authority
CN
China
Prior art keywords
snp
gene
drug
bleeding
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311094699.8A
Other languages
English (en)
Other versions
CN116863995B (zh
Inventor
向倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University First Hospital
Original Assignee
Peking University First Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University First Hospital filed Critical Peking University First Hospital
Priority to CN202311094699.8A priority Critical patent/CN116863995B/zh
Priority claimed from CN202311094699.8A external-priority patent/CN116863995B/zh
Publication of CN116863995A publication Critical patent/CN116863995A/zh
Application granted granted Critical
Publication of CN116863995B publication Critical patent/CN116863995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了ALPK2,ITGA11,ESYT1,CDH17在预测药物出血中的应用。本发明包含一项前瞻性临床队列随访人所有出血事件,因此对小出血事件敏感。SNP标志物可以在首次就诊时就进行检测,无需重复测试且不会随患者情况发生改变,因此有便捷可靠的特性,结合数学模型能够预测远期出血风险进而指导临床决策。由于研究人群依托真实世界研究,因此可推广性强,解决了现有预测方法适用人群受限的问题。

Description

ALPK2,ITGA11,ESYT1,CDH17在预测药物出血中的应用
技术领域
本发明属于生物医药领域,具体涉及ALPK2,ITGA11,ESYT1,CDH17在预测药物出血中的应用。
背景技术
虽然与维生素K拮抗剂相比,新型口服抗凝药在非瓣膜性房颤患者中引发大出血事件的概率更低,但随着其广泛应用,由新型口服抗凝药出血引起的急诊就诊量激增。并且即使是轻微出血也可能导致依从性差、处方剂量降低,从而导致治疗失败。因此,临床迫切需求预先识别发生出血事件发生风险高的患者。
发明内容
为弥补现有技术的不足,本发明提供了ALPK2,ITGA11,ESYT1,CDH17在预测药物出血中的应用。
为实现上述目的,本发明采用如下技术方案:
本发明的第一方面提供了检测SNP标志物的试剂在制备预测药物出血事件的产品中的应用,所述SNP标志物包括rs75334530,rs76292544,rs2305078,rs78528152和/或rs77124397,所述药物为抗血栓药物,所述rs75334530是ALPK2基因的SNP,所述rs76292544是SUSD3基因的SNP,所述rs2305078是ITGA11基因的SNP,所述rs78528152是ESYT1基因的SNP,所述rs77124397是CDH17基因的SNP。
进一步,所述试剂包括扩增所述SNP标志物的引物或识别所述SNP标志物的探针。
进一步,所述试剂还包括可检测标记。
进一步,所述可检测标记包括放射性同位素、核苷酸发色团、酶、底物、荧光分子、化学发光部分、磁粒、生物发光部分。
进一步,所述抗血栓药物包括溶栓药、抗凝药、抗血小板药。
进一步,所述抗血栓药物选自抗凝药。
进一步,所述抗凝药包括肝素、华法林、阿加曲班、磺达肝癸钠、利伐沙班、阿哌沙班、依度沙班、艾多沙班和/或达比加群。
进一步,所述抗凝药选自利伐沙班、达比加群。
本发明的第二方面提供了一种预测药物出血事件的产品,所述产品包括检测SNP标志物的试剂,所述SNP标志物包括ALPK2(rs75334530),SUSD3(rs76292544),ITGA11(rs2305078),ESYT1(rs78528152)和CDH17(rs77124397)。
进一步,所述试剂包括通过直接测序、单碱基延伸、等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性扩增、等位基因特异性核苷酸掺入、5'核酸酶消化、分子信标测定、寡核苷酸连接测定、大小分析和单链构象多态性方法检测所述SNP标志物基因型的试剂。
进一步,所述产品包括试剂盒、芯片或核酸膜条。
进一步,所述试剂盒还包括说明书。
进一步,所述药物为抗血栓药物。
进一步,所述抗血栓药物包括溶栓药、抗凝药、抗血小板药。
进一步,所述抗血栓药物选自抗凝药。
进一步,所述抗凝药包括肝素、华法林、阿加曲班、磺达肝癸钠、利伐沙班、阿哌沙班、依度沙班、艾多沙班和/或达比加群。
进一步,所述抗凝药选自利伐沙班、达比加群。
本发明的第三方面提供了SNP标志物在构建预测药物出血事件的计算模型/系统/设备/计算机可读存储介质中的应用,所述SNP标志物包括ALPK2(rs75334530),SUSD3(rs76292544),ITGA11(rs2305078),ESYT1(rs78528152)和CDH17(rs77124397)。
进一步,所述计算模型/系统/设备/计算机可读存储介质以所述SNP标志物的基因型为输入变量。
进一步,所述药物为抗血栓药物。
进一步,所述抗血栓药物包括溶栓药、抗凝药、抗血小板药。
进一步,所述抗血栓药物选自抗凝药。
进一步,所述抗凝药包括肝素、华法林、阿加曲班、磺达肝癸钠、利伐沙班、阿哌沙班、依度沙班、艾多沙班和/或达比加群。
进一步,所述抗凝药选自利伐沙班、达比加群。
本发明的优点和有益效果:
本发明包含一项前瞻性临床队列随访人所有出血事件,因此对小出血事件敏感。SNP标志物可以在首次就诊时就进行检测,无需重复测试且不会随患者情况发生改变,因此有便捷可靠的特性,结合数学模型能够预测远期出血风险进而指导临床决策。由于研究人群依托真实世界研究,因此可推广性强,解决了现有预测方法适用人群受限的问题。
附图说明
图1是基于Locauszoom的rs75334530多态性区域图;
图2是基于Locauszoom的rs76292544多态性区域图;
图3是基于Locauszoom的rs2305078多态性区域图;
图4是基于Locauszoom的rs78528152多态性区域图;
图5是基于Locauszoom的rs141927799多态性区域图;
图6是基于Locauszoom的rs77124397多态性区域图。
具体实施方式
下文提供了本说明书中使用的一些术语的定义。除非另有说明,本文中使用的所有技术和科学用语通常具有和本发明所属领域的普通技术人员通常理解的意思相同的意思。
本发明提供了检测SNP标志物的试剂在制备预测药物出血事件的产品中的应用,所述SNP标志物包括ALPK2(rs75334530),SUSD3(rs76292544),ITGA11(rs2305078),ESYT1(rs78528152)和CDH17(rs77124397),所述药物为抗血栓药物。
在本发明中,SNP(单核苷酸多态性)是指DNA中的单个碱基位置,在该单个碱基位置上存在一个群体的不同的等位基因或替代的核苷酸。该SNP位置通常前接和后接所述等位基因的高度保守序列(例如,在种群中小于1/100或1/1000的成员中不同的序列)。对于在每个SNP位置的等位基因,个体可以是纯合的或杂合的。本发明的SNP位点以“rs-”方式命名,本领域技术人员能够根据上文的rs-命名,从适合的数据库和相关的信息系统如单核苷酸多态性数据库(dbSNP)中确定其确切的位置、核苷酸序列。本发明中,SNP可以与SNP标志物混用。
等位基因是指在染色体的给定基因座存在的一对或一系列形式的基因或非基因区。在正常的二倍体细胞中,存在任一种基因的两个等位基因(每个亲本一个),其占据同源染色体上相同的相对位置(基因座)。在一个群体中,一种基因可能存在多于两个的等位基因。SNPs也具有等位基因,即,表征所述SNP的两个(或更多个)核苷酸。
在本发明中,rs75334530是ALPK2基因的SNP,rs76292544是SUSD3基因的SNP,rs2305078是ITGA11基因的SNP,rs78528152是ESYT1基因的SNP,rs77124397是CDH17基因的SNP。
在本发明中,药物出血事件是指由使用抗血栓药物引发的出血事件,具体地,是使用抗凝药物引发的出血事件。
在本发明中,抗血栓药物包括但不限于溶栓药、抗凝药、抗血小板药。
其中,溶栓药是指包括纤溶酶原、纤溶酶、激活酶原和抑制物的溶解血栓的药物。溶栓药的原理是通过促进纤维蛋白溶解而溶解血栓,其中溶栓酶是促进蛋白溶解剂或纤溶酶原的直接激活剂。体内纤维蛋白溶解过程是一系列蛋白酶催化反应,首先是体内激活剂被活化并转化为纤溶酶原的激活剂;之后经过激活剂的处理,纤溶酶原就转化为了纤溶酶,最后纤溶酶作用于纤维蛋白将之溶解。
溶栓药包括但不限于尿激酶、阿替普酶、瑞替普酶或链激酶。
抗凝药也称作抗凝素、抗凝物、抗凝血素,主要用于防治血管内栓塞或血栓形成的疾病,预防中风或其它血栓性疾病。抗凝药是通过影响凝血过程中的某些凝血因子阻止凝血过程的药物。
抗凝药包括但不限于肝素、华法林、磺达肝癸钠、利伐沙班、阿哌沙班、艾多沙班、依度沙班、阿加曲班或达比加群。
抗血小板药是指用来抑制血小板的环氧化酶生长的药物。
抗血小板药物主要分为两大类,分别是抑制血小板聚集药物、影响血小板活化扩增药物。抑制血小板聚集的药物包括血小板糖蛋白,磷酸二酯酶抑制剂两大类;影响血小板活化扩增的药物主要有血栓素A2抑制剂,二磷酸腺苷P2Y12受体拮抗剂,凝血酶受体拮抗剂,5-羟色胺受体拮抗剂这四类。
抗血小板药包括但不限于血小板糖蛋白、磷酸二酯酶抑制剂、血栓素A2抑制剂、二磷酸腺苷P2Y12受体拮抗剂、凝血酶受体拮抗剂、5-羟色胺受体拮抗剂。
在本发明的实施方案中,抗血栓药物选自抗凝药。
在本发明的具体实施方案中,抗凝药选自利伐沙班、达比加群。
所述试剂包括扩增所述SNP标志物的引物或识别所述SNP标志物的探针。
在本发明中,引物是指可以用具有短链游离3’羟基(free 3 'hydroxyl group)的碱基序列,与互补性模板(template)形成碱基对(base pair),起到柱状链条复制起点功能的短序列。引物可以用作在妥当的缓冲溶剂和温度下进行聚合反应(即,DNA聚合酶或逆转录酶)的试剂,以及存在4种不同核苷三磷酸时,可以开启DNA合成。此时,PCR条件、敏感度和反义引物的长度可以依据本领域的公知技术进行变形。
在本发明中,探针可以具有任何合适的长度,例如15、20、30、40、50、100、150、200、300、500、1000或超过1000个核苷酸的长度。但是优选的是长度不少于10个核苷酸,并且优选的是长度不超过大约80个核苷酸;在一些实施方案中,探针的长度为大约20至60个核苷酸;在其他的实施方案中,探针的长度为大约20至40个核苷酸。
探针可以是混合探针,也可以是可以依据特异序列结合到核酸互补性链条的寡核苷酸。混合条件要在等位基因之间的混合强度上显示出显著差异,以进行严格控制,使其仅混合到等位基因中之一。
所述引物或探针可以采用亚磷酰胺固体载体法或者其他公知的方法,进行化学合成。所述核酸序列可以利用本领域公知的多种技术手段进行变形。所述变形的非限定性例有:取代为甲基化,吸附、天然核苷酸中一种以上同系物,以及核苷酸之间的变形,如,变形为未带电连接体(例如:甲基膦酸酯、磷酸三酯、亚磷酰胺、氨基甲酸酯等),或者带电连接体(例如:硫代磷酸酯、二硫代磷酸酯等)。
所述试剂还包括可检测标记。
在本发明中,可检测标记是指能够产生表明在测定样品中存在靶多核苷酸的可检测信号的组合物。合适的标记包括但不限于放射性同位素、核苷酸发色团、酶、底物、荧光分子、化学发光部分、磁粒、生物发光部分。因此,标记是能够由装置或方法检测的任意组合物,包括但不限于光谱、光化学、生物化学、免疫化学、电、光学、化学检测装置或任何其他合适的装置。在一些实施方案中,标记可无需借助于装置而在视觉上检测。
其中,放射性同位素包括但不限于3H、14C、35S、125I、131I。
酶包括但不限于辣根过氧化物酶、β-半乳糖苷酶、荧光素酶、碱性磷酸酶、乙酰胆碱酶。
荧光分子包括但不限于FITC、罗丹明、镧系磷光体(lanthanide phosphors)。
所述试剂包括通过直接测序、单碱基延伸、等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性扩增(allele-specific PCR,AS-PCR)、等位基因特异性核苷酸掺入、5'核酸酶消化、分子信标测定、寡核苷酸连接测定、大小分析和单链构象多态性(SSCP)方法检测SNP标志物基因型的试剂。
在本发明中,单链构象多态性(SSCP)是指单链DNA由于碱基序列不同可引起空间构象差异,这种差异会导致相同或相近长度单链DNA电泳迁移率的不同,从而可以通过非变性聚丙烯酰胺凝胶电泳进行有效地检测。PCR-SSCP是将SSCP用于PCR扩增产物的基因突变检测的方法,PCR扩增的DNA片段在变性剂条件下,通过高温处理使双链DNA扩增片段解旋并且维持单链状态,进一步进行非变性聚丙烯酰胺凝胶电泳。目前,PCR-SSCP技术被广泛应用于分子生物学的各个领域。
等位基因特异性扩增(allele-specific PCR,AS-PCR)的原理是由于Taq DNA聚合酶对位于引物3'末端的单个碱基的错配无法修复,当引物3'末端的碱基与SNP位点的等位基因互补配对时,才能发生扩增反应;当引物3'末端的碱基与SNP位点的等位基因不互补配对时,则扩增反应不能发生。目前,已出现了基于AS-PCR改良的一些方法,如四引物扩增受阻突变体系PCR(tetra-primer amplification refractory mutation system PCR,Tetra-primer ARMS-PCR)、片段长度差异等位基因特异PCR(fragment length discrepantallele specific PCR, FLDAS-PCR)、多等位基因特异扩增(PCR amplification ofmultiple specific alleles, PMASA)等。
直接测序检测SNP是最直接可靠的方法,检出率高达100%,代表测序技术有焦磷酸测序(Pyrosequencing)、taqman技术、微测序(SNaPshot)等。该方法通过比对不同样本中的同一基因或是基因片段的PCR扩增产物的测序结果,或是重测序分析已定位的序列标签位点(STS)及表达序列标签(EST)来检测SNP。可以将PCR产物纯化回收后通过连接到载体上进行测序,也可以对PCR产物直接进行测序。通过序列的比对,就能够准确地检测SNP的突变类型和位置。
在本发明中,基因型指存在于个体或样品中的等位基因的同一性。典型地,其指与感兴趣的特定基因相关的个体的基因型;在多倍体个体中,其指个体携带有基因等位基因的何种组合。
所述产品包括试剂盒、芯片或核酸膜条。
在本发明中,试剂盒包含一组寡核苷酸引物,所述引物足以检测和/或定量本发明所述的SNP标志物的基因型。试剂盒还可以包括试管或其他妥当容器、反应缓冲液(多种pH及镁浓度)、脱氧核苷酸(dNTPs)、双脱氧核苷酸(ddNTPs)、Taq-聚合酶及逆转录酶等酶、DNase、RNAse抑制剂、DEPC-水(DEPC-water)及灭菌水等。本发明的寡核苷酸引物可以以冻干或重构的形式提供,或者可以作为一组核苷酸序列提供。在一个实施方案中,以微孔板(microplate)的形式提供引物,其中每一个引物组占用微孔板中的一个孔(或多个孔,如在重复的情况下)。微孔板可以进一步包含足以检测如下所述的一个或多个看家基因的引物。试剂盒可以进一步包含足以扩增本发明所述的基因的表达产物的试剂和说明。
试剂盒中适当的容器通常至少包括一种小瓶、试管、长颈瓶、宝特瓶、针筒或其它容器,其中可放置一种组分,并且优选地,可进行适当地等分。在试剂盒中存在多于一种的组分时,试剂盒中通常也将包含第二、第三或其它附加的容器,其中分离地放置附加的组分。然而,不同组合的组分可被包含在一个小瓶中。本发明的试剂盒通常也将包括一种用于容纳反应物的容器,密封以用于商业销售。这种容器可包括注模或吹模的塑料容器,其中可保留所需的小瓶。
在本发明中,芯片也称为阵列,指包含连接的核酸或肽探针的固体支持物。阵列通常包含按照不同的已知位置连接至基底表面的多种不同的核酸或肽探针。这些阵列,也称为“微阵列”,通常可以利用机械合成方法或光引导合成方法来产生这些阵列,所述光引导合成方法合并了光刻方法和固相合成方法的组合。阵列可以包含平坦的表面,或者可以是珠子、凝胶、聚合物表面、诸如光纤的纤维、玻璃或任何其它合适的基底上的核酸或肽。可以以一定的方式来包装阵列,从而允许进行全功能装置的诊断或其它方式的操纵。
术语“微阵列”是杂交阵列原件有序排列在基质上,所述杂交阵列原件诸如聚核苷酸探针(例如寡核苷酸)或结合剂(例如抗体)。所述基质可以是固体基质,例如,玻璃或二氧化硅玻片、珠、纤维光学粘结剂或半固态基质,例如硝酸纤维素膜。核苷酸序列可以是DNA、RNA或其中的任何排列。
在本发明中,核酸膜条包括基底和固定于所述基底上的探针;所述基底可以是任何适于固定探针的基底,包括但不限于尼龙膜、硝酸纤维素膜、聚丙烯膜、玻璃片、硅胶晶片、微缩磁珠。
本发明提供了SNP标志物在构建预测药物出血事件的计算模型/系统/设备/计算机可读存储介质中的应用,所述SNP标志物包括ALPK2(rs75334530), SUSD3(rs76292544),ITGA11(rs2305078),ESYT1(rs78528152)和CDH17(rs77124397)。
所述计算模型/系统/设备/计算机可读存储介质以所述SNP标志物的基因型为输入变量。
在一些实施方案中,所述计算模型/系统/设备/计算机可读存储介质还以其他与预测药物出血事件相关的标志物作为输入变量。
在本发明中,所述计算模型可以通过采用逻辑回归(Logtistic Regression)、随机森林(RandomForest)、极致梯度提升(eXtreme Gradient Boosting,XGBoosting)和支持向量机(Support Vector Machine,SVM)方法构建。
在本发明的具体实施方案中,包括遗传(单核苷酸多态性)的计算模型使用随机森林方法构建;包括临床的计算模型使用随机森林方法构建;包括临床+遗传(单核苷酸多态性)的计算模型使用支持向量机方法构建。
在本发明中,系统的实施可包括手动地、自动地、或它们组合地来执行或完成所选任务。而且,根据本发明的系统的实施方式的实际仪器和设备,可通过硬件、通过软件、或通过固件或通过它们的组合使用操作系统来实施多个所选任务。
例如,用于执行所选任务的硬件可以是芯片或电路。作为软件,所选任务可实施为通过计算机使用任何合适的操作系统执行的多个软件指令。在本发明中,根据如本发明所述系统的示例性实施方式的一个或多个任务可通过处理单元,如用于执行多个指令的计算平台来执行。可选地,该处理单元包括用于存储指令和/或数据的易失性存储器,和/或用于存储指令和/或数据的非易失性存储器,例如,磁性硬盘和/或可移动介质。可选地,还提供网络连接。还可选地提供显示器和/或用户输入装置诸如键盘或鼠标。
在本发明中,计算机可读存储介质诸如计算机可执行代码,可以采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如光盘或磁盘,诸如在任何计算机中的任何存储设备,易失性存储介质包括动态存储器,诸如此类计算机平台的主存储器。有形的传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频和红外数据通信期间生成的那些。因此,计算机可读介质的常见形式包括例如:软盘、软性磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡片纸带、具有孔模式的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或盒、传输数据或指令的载波、传输此类载波的缆线或链路,或者计算机可以从其读取编程代码和/或数据的任何其他介质。这些计算机可读介质的形式中的许多形式可以参与向处理器传送一个或更多个指令的一个或更多个序列以用于执行。
下面结合具体实施例进一步阐述此发明。应理解的是,在此描述的特定实施方式通过举例的方式来表示,并不作为对本发明的限制。在不偏离本发明范围的情况下,本发明的主要特征可以用于各种实施方式。
实施例
1、实验材料
(1)数据集
本发明数据集基于两项在中国开展的多中心、前瞻性队列研究。两项研究分别纳入了服用达比加群和利伐沙班的门诊患者。入组后根据患者提供血液样本进行基因型检测,并收集对应患者人口学和临床信息,随访周期长达24个月。出血事件包括学术研究联盟(BARC)标准定义的任何出血事件。
共包含423名患者,全部患者以8:2比例分为验证集和训练集,其中,验证集患者337名,训练集患者86名。
(2)分析软件
本发明全基因组关联分析采用主流分析工具PLINK。机器学习部分基于Python3软件sklearn库完成。
2、实验方法
(1)全基因组关联分析
本发明根据文献中通用研究标准筛选质量合格的患者和基因进行分析。对全部合格样本以逻辑回归方法和加性模型进行关联分析。
(2)预处理和特征工程
对连续变量标准化,分类变量进行one-hot编码预处理。为了确定基因型的主要预测因子,在全基因组关联分析中选择的显著单核苷酸多态性被同等地输入到机器学习中,以有监督学习递归特征消除方法和排列重要性方法进行特征筛选与服用达比加群和利伐沙班后出血事件存在相关性的单核苷酸多态性。用LocusZoom(http://locuszoom.org/)网站查看SNP区域。根据递归特征消除方法进行排序。在递归特征消除方法中排名前5位、排列重要性权重为正值且区域图提示非孤立的单核苷酸多态性留用于更高的临床可用性。
(3)预测模型和验证
利用人口学、临床和(2)中筛选的遗传信息,用4种方法构建机器学习模型,以Optuna框架调优,通过比较准确性、精确性、召回率、F1-评分评估模型性能,受试者工作曲线下面积最大者为最佳模型。为了得到稳健的结果,全部模型都经过10折交叉验证和100次重复自举。
(4)突变基因的预测效能
分别用临床信息以及临床信息和遗传多态性平等输入构建出血预测模型。其中模型采用逻辑回归、随机森林、极致梯度提升和支持向量机方法,通过检测准确性、精确性召回率、F1-分数和受试者工作曲线下面积评价模型预测能力,每组中使受试者工作曲线下面积最大者为最优模型。通过100次重复自举和10折交叉验证提升模型稳定性。
3、实验结果
经过递归特征消除,全基因组关联分析的所有显著SNP中排名前6的单核苷酸多态性被归纳于表1,其排列重要性权重均大于0,对模型有正向作用。
表1基于递归特征消除和排列重要性法特征筛选结果
Locauszoom结果如图1所示,rs141927799被认为是孤立的结果,因此被剔除。递归特征消除中排名第6的rs77124397被保留。
根据临床和基因信息,对验证集患者是否发生出血事件进行预测。结果表明,使用单核苷酸多态性rs75334530, rs76292544, rs2305078, rs78528152 和rs77124397的模型受试者工作曲线下面积达到0.7913,能够准确的反应出血事件的发生。
表2模型的预测效能
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

Claims (10)

1.检测SNP标志物的试剂在制备预测药物出血事件的产品中的应用,所述SNP标志物包括rs75334530,rs76292544,rs2305078,rs78528152和rs77124397,所述药物为抗血栓药物,所述rs75334530是ALPK2基因的SNP,所述rs76292544是SUSD3基因的SNP,所述rs2305078是ITGA11基因的SNP,所述rs78528152是ESYT1基因的SNP,所述rs77124397是CDH17基因的SNP。
2.根据权利要求1所述的应用,其特征在于,所述试剂包括扩增所述SNP标志物的引物或识别所述SNP标志物的探针。
3.根据权利要求2所述的应用,其特征在于,所述试剂还包括可检测标记。
4.根据权利要求1所述的应用,其特征在于,所述抗血栓药物包括溶栓药、抗凝药、抗血小板药。
5.根据权利要求4所述的应用,其特征在于,所述抗血栓药物选自抗凝药。
6.一种预测药物出血事件的产品,其特征在于,所述产品包括检测SNP标志物的试剂,所述SNP标志物包括rs75334530,rs76292544,rs2305078,rs78528152和rs77124397。
7.根据权利要求6所述的产品,其特征在于,所述试剂包括通过直接测序、单碱基延伸、等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性扩增、等位基因特异性核苷酸掺入、5'核酸酶消化、分子信标测定、寡核苷酸连接测定、大小分析和单链构象多态性方法检测所述SNP标志物基因型的试剂。
8.根据权利要求7所述的产品,其特征在于,所述产品包括试剂盒、芯片或核酸膜条。
9.根据权利要求8所述的产品,其特征在于,所述试剂盒还包括说明书。
10.SNP标志物在构建预测药物出血事件的计算模型/系统/设备/计算机可读存储介质中的应用,所述SNP标志物包括rs75334530,rs76292544,rs2305078,rs78528152和rs77124397。
CN202311094699.8A 2023-08-29 Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用 Active CN116863995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311094699.8A CN116863995B (zh) 2023-08-29 Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311094699.8A CN116863995B (zh) 2023-08-29 Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用

Publications (2)

Publication Number Publication Date
CN116863995A true CN116863995A (zh) 2023-10-10
CN116863995B CN116863995B (zh) 2024-05-14

Family

ID=

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110263441A1 (en) * 2008-10-15 2011-10-27 Golub Todd R Compositions, kits, and methods for identification, assessment, prevention, and therapy of hepatic disorders
US20130203053A1 (en) * 2010-06-04 2013-08-08 Nestec S.A. Methods for improving inflammatory bowel disease diagnosis
CN103733065A (zh) * 2011-06-02 2014-04-16 阿尔玛克诊断有限公司 用于癌症的分子诊断试验
CN110438228A (zh) * 2019-07-31 2019-11-12 南通大学附属医院 结直肠癌dna甲基化标志物
CN111733225A (zh) * 2019-03-25 2020-10-02 北京大学第一医院 一种可用于辅助氯吡格雷精准用药的prkg1基因snp标志物
CN114277148A (zh) * 2021-12-30 2022-04-05 深圳康华君泰生物科技有限公司 用于乳腺癌分型的生物标志物及其应用
KR20220153368A (ko) * 2021-05-11 2022-11-18 충북대학교 산학협력단 와파린 치료에 따른 출혈 부작용 위험 예측용 다형성 마커 및 이를 이용한 와파린 치료에 따른 출혈 부작용 위험 예측 방법
CN115386630A (zh) * 2022-10-31 2022-11-25 北京大学第一医院 一种用于抗血栓药物治疗血栓疗效预测的snp标志物及其应用
CN115418400A (zh) * 2022-11-03 2022-12-02 北京大学第一医院 Ahnak2的snp标志物在抗血栓药物治疗血栓疗效预测中的应用
CN116524996A (zh) * 2023-04-10 2023-08-01 首都医科大学附属北京胸科医院 基于arl6ip5基因及关联基因的肿瘤免疫疗效预测模型

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110263441A1 (en) * 2008-10-15 2011-10-27 Golub Todd R Compositions, kits, and methods for identification, assessment, prevention, and therapy of hepatic disorders
US20130203053A1 (en) * 2010-06-04 2013-08-08 Nestec S.A. Methods for improving inflammatory bowel disease diagnosis
CN103733065A (zh) * 2011-06-02 2014-04-16 阿尔玛克诊断有限公司 用于癌症的分子诊断试验
CN111733225A (zh) * 2019-03-25 2020-10-02 北京大学第一医院 一种可用于辅助氯吡格雷精准用药的prkg1基因snp标志物
CN110438228A (zh) * 2019-07-31 2019-11-12 南通大学附属医院 结直肠癌dna甲基化标志物
KR20220153368A (ko) * 2021-05-11 2022-11-18 충북대학교 산학협력단 와파린 치료에 따른 출혈 부작용 위험 예측용 다형성 마커 및 이를 이용한 와파린 치료에 따른 출혈 부작용 위험 예측 방법
CN114277148A (zh) * 2021-12-30 2022-04-05 深圳康华君泰生物科技有限公司 用于乳腺癌分型的生物标志物及其应用
CN115386630A (zh) * 2022-10-31 2022-11-25 北京大学第一医院 一种用于抗血栓药物治疗血栓疗效预测的snp标志物及其应用
CN115418400A (zh) * 2022-11-03 2022-12-02 北京大学第一医院 Ahnak2的snp标志物在抗血栓药物治疗血栓疗效预测中的应用
CN116524996A (zh) * 2023-04-10 2023-08-01 首都医科大学附属北京胸科医院 基于arl6ip5基因及关联基因的肿瘤免疫疗效预测模型

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CNKI, 出血 AND 血栓 AND SNP AND (作者:向倩)AND(作者单位:北京大学): "基于CYP2C9和VKORC1基因多态性的华法林个体化用药临床研究分析", 基于CYP2C9和VKORC1基因多态性的华法林个体化用药临床研究分析, vol. 38, no. 13, pages 1553 - 1557 *
QIAN XIANG ET AL.: "Genetic variants influenced the risk of bleeding and pharmacodynamics of rivaroxaban in patients with nonvalvular atrial fibrillation: A multicentre prospective cohort study", 《CLIN. TRANSL. MED.》, pages 1 - 11 *
ZHI-YAN LIU ET AL.: "Non-vitamin K antagonist oral anticoagulants in venous thromboembolism patients: a meta-analysis of real-world studies", 《BMC CARDIOVASCULAR DISORDERS》, 14 March 2022 (2022-03-14) *
刘志艳 等: "达比加群相关出血事件的危险因素分析", 《中国临床药理学杂志》, vol. 38, no. 23, 17 December 2022 (2022-12-17) *

Similar Documents

Publication Publication Date Title
Zhang et al. Application of next generation sequencing to molecular diagnosis of inherited diseases
JP6440658B2 (ja) 薬理ゲノミクスバイオマーカーを発見するための方法
CA2852098C (en) Colorectal cancer associated circulating nucleic acid biomarkers
King et al. Performance of commercial platforms for rapid genotyping of polymorphisms affecting warfarin dose
US20160053328A1 (en) Personalized biomarkers for cancer
Mason et al. International standards for genomes, transcriptomes, and metagenomes
US7335474B2 (en) Methods and systems for identifying predisposition to the placebo effect
US20110039710A1 (en) Apparatus and methods for applications of genomic microarrays in screening, surveillance and diagnostics
CN116863995B (zh) Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用
CN115386630B (zh) 一种用于抗血栓药物治疗血栓疗效预测的snp标志物及其应用
Schrijver et al. Diagnostic Single Nucleotide Polymorphism Analysis of Factor V Leiden and Prothrombin 20210G> A: A Comparison of the Nanogen Electronic Microarray With Restriction Enzyme Digestion and the Roche LightCycler
Wiita et al. Clinical application of high throughput molecular screening techniques for pharmacogenomics
Tan et al. Single-tube multiplex digital polymerase chain reaction assay for molecular diagnosis and prediction of severity of spinal muscular atrophy
CN116863995A (zh) Alpk2,itga11,esyt1,cdh17在预测药物出血中的应用
US20210371937A1 (en) Method for identifying high-risk aml patients
Soria et al. New approaches and future prospects for evaluating genetic risk of thrombosis
Koido et al. Predicting cell-type-specific non-coding RNA transcription from genome sequence
Wang Next-generation sequencing (NGS)
Strom et al. Technical validation of a multiplex platform to detect thirty mutations in eight genetic diseases prevalent in individuals of Ashkenazi Jewish descent
CN117417997A (zh) 一种诊断圆锥角膜的基因组生物标志物组合
KR102193658B1 (ko) 사상체질 중 소음인 진단용 snp 마커 및 이의 용도
KR102193659B1 (ko) 사상체질 중 소양인 진단용 snp 마커 및 이의 용도
KR102193657B1 (ko) 사상체질 중 태음인 진단용 snp 마커 및 이의 용도
Went Deciphering genetic susceptibility to multiple myeloma
Kalita et al. A novel method to identify cell-type specific regulatory variants and their role in cancer risk

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Xiang Qian

Inventor after: Cui Yimin

Inventor after: Mu Guangyan

Inventor after: Liu Zhiyan

Inventor after: Zhong Pan

Inventor before: Xiang Qian

CB03 Change of inventor or designer information
GR01 Patent grant