CN116312778B - 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 - Google Patents

成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN116312778B
CN116312778B CN202310077993.1A CN202310077993A CN116312778B CN 116312778 B CN116312778 B CN 116312778B CN 202310077993 A CN202310077993 A CN 202310077993A CN 116312778 B CN116312778 B CN 116312778B
Authority
CN
China
Prior art keywords
mature
data
model
cell tumor
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310077993.1A
Other languages
English (en)
Other versions
CN116312778A (zh
Inventor
林俊维
于世辉
穆亚飞
陈禹欣
蒙裕欢
陈涛
范喜杰
袁杰钺
李桂彬
缪夏萍
陈娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jinyu Translational Medical Research Institute Co ltd
Guangzhou Kingmed Diagnostics Group Co ltd
Guangzhou Kingmed Diagnostics Central Co Ltd
Guangzhou Medical University
Original Assignee
Guangzhou Jinyu Translational Medical Research Institute Co ltd
Guangzhou Kingmed Diagnostics Group Co ltd
Guangzhou Kingmed Diagnostics Central Co Ltd
Guangzhou Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jinyu Translational Medical Research Institute Co ltd, Guangzhou Kingmed Diagnostics Group Co ltd, Guangzhou Kingmed Diagnostics Central Co Ltd, Guangzhou Medical University filed Critical Guangzhou Jinyu Translational Medical Research Institute Co ltd
Priority to CN202310077993.1A priority Critical patent/CN116312778B/zh
Publication of CN116312778A publication Critical patent/CN116312778A/zh
Application granted granted Critical
Publication of CN116312778B publication Critical patent/CN116312778B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供的成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。

Description

成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质
技术领域
本发明涉及医疗数据处理技术领域,特别是涉及成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质。
背景技术
成熟B细胞肿瘤是一种异质性的起源与B细胞的单克隆增值性疾病,成熟B细胞肿瘤可分为40余种,各亚型间临床表现复杂,许多疑难病例的出现使成熟B细胞肿瘤亚型鉴别诊断成为临床工作中的重点和难点。
现有的基于形态学、免疫学、遗传学及分子生物学多个平台检测是诊断成熟B细胞肿瘤亚型的方法,且主要基于分子生物学中的二代测序(NGS)结合机器学习来建立辅助诊断模型,未结合多个平台检测方法建立辅助诊断模型。现有的成熟B细胞肿瘤诊断模型对于亚型的鉴别未结合多平台的检测结果进行辅助诊断,由于各亚型间临床表现复杂,亚型鉴别较为困难,造成一定的误诊率和漏诊率,且诊断较为主观,客观性不足。并且,基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,同时由于临床医生普遍缺乏相关计算机知识,对于模型使用具有一定的门槛,进一步地,具体而言,现有的辅助模型在使用时需要在其开发的计算机语言环境下使用,在相应的计算机语言中加载模型,并加载相应的检测数据并运行才能得到预测结果,使用模型效率不高,且许多临床医生不会使用计算机语言,本身构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。
因此,寻找一种适配的成熟B细胞肿瘤的辅助诊断预测方法,是本领域技术人员亟待解决的技术问题。
发明内容
针对上述现有技术中成熟B细胞肿瘤亚型的判断客观性不足造成一定的误诊和漏诊且使用模型门槛高的问题,本发明的目的在于提供成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质,能够提升临床医生使用诊断模型的便捷性、提升成熟B细胞肿瘤亚型的准确率,缓解临床医生过强的诊断主观性。
第一方面,本发明提供成熟B细胞肿瘤的辅助诊断预测方法,所述方法包括:
获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
基于R语言将所述预测结果通过网页进行可视化展示。
第二方面,本发明提供成熟B细胞肿瘤的辅助诊断预测装置,所述装置包括:
获取模块,用于获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
输入模块,用于将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
输出模块,用于将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
可视化模块,用于基于R语言将所述预测结果通过网页进行可视化展示。
第三方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
第四方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
根据本发明提供的成熟B细胞肿瘤的辅助诊断预测方法、装置、设备及介质,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中成熟B细胞肿瘤的辅助诊断方法的流程示意图;
图2为一个实施例中成熟B细胞肿瘤的辅助诊断方法的流程示意图;
图3为一个实施例中成熟B细胞肿瘤的辅助诊断模型可视化于临床应用的示意图;
图4为一个实施例中影响成熟B细胞肿瘤的辅助诊断模型中预测因子重要程度的示意图;
图5为一个实施例中成熟B细胞肿瘤的辅助诊断装置的系统示意图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本领域的技术人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”、“若干个”的含义是两个或两个以上,除非另有明确具体的限定。
须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本申请可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的功效及所能达成的目的下,均应仍落在本申请所揭示的技术内容得能涵盖的范围内。
实施例一
参阅图1及图2所示,本发明提供一种成熟B细胞肿瘤的辅助诊断预测方法,所述方法包括:
步骤101:获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
步骤102:将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
步骤103:将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
步骤104:基于R语言将所述预测结果通过网页进行可视化展示。
需要说明的是,本实施例主要针对成熟B细胞肿瘤的辅助诊断预测的步骤。
在步骤101中,获取待预测数据中的标志物CD5,需要先判断标志物CD5为阳性还是阳性,若标志物CD5为阳性输出为1,若标志物CD5为阴性输出为0;同样的,判断标志物CD10为阳性还是阴性。肿瘤细胞大小数据中,小到中等大小肿瘤细胞定义为小细胞(Small cellsize),中到大等肿瘤细胞定义为大细胞(Large cell size)。突变基因数据包括175个与血液肿瘤相关基因作为NGSpanel检测。
需要说明的是,所述突变基因数据包括:ABCB1,CD79A,GATA1,MEF2B,SBDS,ABL1,CD79B,GATA2,MFHAS1,SETBP1,ANKRD26,CDKN1A,GFI1,MPL,SETD2,APC,CDKN2A,GNA13,MTOR,SETDB1,ARID1A,CDKN2B,GNAI2,MYC,SF3B1,ARID1B,CEBPA,GNAS,MYD88,SGK1,ARID2,CHD8,GNB1,MYOM2,SH2B3,ASXL1,CIITA,GSKIP,NF1,SMC1A,ATG2B,CREBBP,HAX1,NOTCH1,SMC3,ATM,CRLF2,HRAS,NOTCH2,SOCS1,ATRX,CSF1R,ID3,NPM1,SRP72,B2M,CSF3R,IDH1,NRAS,SRSF2,BCL10,CTCF,IDH2,NSD2,STAG2,BCL2,CUX1,IKZF1,NT5C2,STAT3,BCL6,CXCR4,IKZF2,PALB2,STAT5B,BCOR,DDX41,IKZF3,PAX5,STAT6,BCORL1,DIS3,IL7R,PDGFRA,SUZ12,BIRC3,DKC1,IRF4,PDGFRB,SYK,BLM,DNM2,IRF8,PHF6,TAL1,BPGM,DNMT3A,ITPKB,PIGA,TCF3,BRAF,EED,JAK1,PIK3CA,TENT5C,BRCA1,EGFR,JAK2,PIK3CD,TERC,BRCA2,EGLN1,JAK3,PIM1,TERT,BRIP1,ELANE,KDM6A,PLCG2,TET2,BTG1,EP300,KIT,PPM1D,TNFAIP3,BTK,EPHA7,KMT2A,PRDM1,TNFRSF14,CALR,EPOR,KMT2B,PRF1,TP53,CARD11,ETV6,KMT2C,PRKDC,TPMT,CBL,EZH2,KMT2D,PRPF8,TRAF3,CBLB,FAS,KRAS,PTEN,U2AF1,CBLC,FAT1,KRT20,PTPN11,VHL,CCND1,FBXO11,LMO2,RAD21,WT1,CCND3,FBXW7,LYN,RELN,XPO1,CD28,FLT3,MAP2K1,RHOA,ZAP70,CD58,FOXO1,MCL1,RUNX1,ZRSR2。
在步骤102中,本实施例示例性给出了成熟B细胞肿瘤亚型结果,给出了八种亚型,与本申请同一发明构思的方法可适用的场景不限于这八种亚型。
在步骤103中,将标志物CD5阴/阳性数据、标志物CD10阴/阳性数据、肿瘤细胞大小数据、NGS175panel检测的突变基因纳入辅助诊断模型作为预测因子来构建模型,由于纳入模型的预测因子不同,所对应输出的成熟B细胞肿瘤亚型的预测结果也不同,主要在于预测因子对应的权重值影响输出的预测结果。
在步骤104中,参阅图3所示,将成熟B细胞肿瘤辅助诊断模型的输入连接基于R语言嵌入网页,临床医生可以直接在网页前端页面点选输入待预测数据,示例性的,输入一组待预测数据:标志物CD5阴性、标志物CD10阴性、肿瘤细胞大小数据为小细胞、突变基因数据为BRCA1,通过后台运行的成熟B细胞肿瘤辅助诊断模型计算后,针对这组数据的预测结果为:亚型为MZBL的预估值为0.998及亚型为FL的预估值为0.002,需要说明的是,亚型的预估值越接近1则属于该亚型的可能性越大。将预测结果通过直方图进行可视化显示在网页前端。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,遗传学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
实施例二
本实施例提供进一步的方案。实施例一给出了预测成熟B细胞肿瘤亚型并进行可视化的步骤,本实施例在实施例一的基础上,给出了成熟B细胞肿辅助诊断模型的训练过程如下:
获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%;通过adasyn函数对训练集进行自适应综合过采样方法的数据类不平衡处理;基于train函数和训练集进行五次十折交叉验证来构建成熟B细胞肿瘤辅助诊断模型,基于训练集对成熟B细胞肿瘤辅助诊断模型进行训练,并获取训练后的成熟B细胞肿瘤辅助诊断模型;通过测试集对训练后的诊断模型进行测试并获取通过测试的最终成熟B细胞肿瘤辅助诊断模型。
需要说明的是,本申请基于train函数和训练集进行十折交叉验证来构建成熟B细胞肿瘤辅助诊断模型,优选的,进行五次十折交叉验证,提升模型的准确性来构建性能更佳的成熟B细胞肿瘤辅助诊断模型。
需要说明的是,初诊成熟B细胞肿瘤患者数据从NGS175panel检测项目、流式细胞术、骨髓活检项目、组织活检项目、染色体核型检测项目、FISH检测项目中获取的,初诊成熟B细胞肿瘤患者数据包括NGSpanel检测的175个突变基因、流式细胞术中获取的抗原标志物CD5、抗原标志物CD10、肿瘤细胞大小数据。
需要说明的是,从初始样本数据中划分出占比80%的训练集用于对模型的训练,将训练集利用五次十折交叉验证,将训练集随机划分为10份子集,第一子集用于train函数中交叉验证的测试子集,其余9份子集轮流作为训练数据,期间,利用第一子集进行验证,每次试验都会得出相应的正确率,再求其平均值。
值得注意的是,对于部分患者可能缺失流失细胞术标志物CD5及标志物CD10的检测数据,不同的标志物缺失情况不同(缺失值占比在5%~94.4%),经过试验和进一步的比较,最后选择标志物CD5和标志物CD10这两个缺失值较少的标志物纳入模型作为其中的预测因子,但是由于标志物CD5和标志物CD10是流式的结果,存在一定的缺失值,因此需要对标志物CD5及标志物CD10进行缺失值填充,缺失值填充也是将数据进行预处理的步骤之一。
下面给出了缺失值填充的步骤。
在本实施例中,获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%的步骤,包括:
所述将所述患者数据进行预处理得到初始样本数据,包括:
获取患者数据中标志物CD5及标志物CD10,基于runif函数分别对标志物CD5和标志物CD10进行缺失值填充;
所述缺失值填充的步骤,包括:
分别筛选标志物CD5及标志物CD10中缺失值位置,对缺失值位置纳入随机数进行补充;
或,获取缺失值位置前或后的数值,将所述前或后的数值纳入相应的缺失值位置;
或,获取标志物CD5中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD5中缺失值位置,获取标志物CD10中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD10中缺失值位置。
需要说明的是,经过对标志物CD5、标志物CD10进行缺失值填充后,得到完整序列的标志物CD5及标志物CD10。
根据本实施例提供的方案,对数据进行预处理进行缺失值填充及过采样处理,得到完整均衡的初始样本数据集,主要由于获取到的初诊患者数据可能会偏向与某一种亚型,某种亚型的数据较多,训练时,模型可能会偏向与某种目标亚型输出预测结果,进而需要进行过采样处理,使得模型更客观地进行预测。本申请提供一种成熟B细胞肿瘤辅助诊断方法,采用机器学习的方法辅助临床医生诊断患者成熟B细胞肿瘤的亚型,一定程度上克服了诊断对临床医生经验的依赖。
实施例三
本实施例提供进一步的方案。在实施例二中给出的成熟B细胞肿瘤辅助诊断模型的训练过程,在实施例二的基础上给出的模型的验证过程。
根据confusionMatrix函数构建混淆矩阵,所述混淆矩阵包括模型准确度指标、置信区间指标、无信息率指标、检验准确度指标、衡量分类精度指标,所述混淆矩阵中的各个指标用于评析成熟B细胞肿瘤辅助诊断模型的性能。
需要说明的是,根据R语言中的caret包中的confusionMatrix函数构建混淆矩阵,
表1.模型性能具体信息
Accuracy:0.8434
95%CI:(0.7922,0.8862)
No Information Rate:0.6104
P-Value[Acc>NIR]:8.74e-16
Kappa:0.721
表2.模型预测各亚型性能具体信息
BL CLL/SLL DLBCL FL HCL LPL/WM MCL MZBL
Sensitivity 1.000 0.954 1.000 0.833 1.000 0.708 0.267 0.684
Specificity 1.000 0.825 1.000 1.000 1.000 0.970 0.970 0.961
Pos Pred Value 1.000 0.895 1.000 1.000 1.000 0.850 0.364 0.591
Neg Pred Value 1.000 0.920 1.000 0.996 1.000 0.933 0.954 0.974
Prevalence 0.008 0.610 0.024 0.024 0.004 0.193 0.060 0.076
Detection Rate 0.008 0.582 0.024 0.020 0.004 0.137 0.016 0.052
Detection Prevalence 0.008 0.651 0.024 0.020 0.004 0.161 0.044 0.088
Balanced Accuracy 1.000 0.889 1.000 0.917 1.000 0.839 0.618 0.823
获取训练后的成熟B细胞肿瘤辅助诊断模型,通过测试集对训练后的诊断模型进行测试,基于varImp函数评析对于待预测数据对成熟B细胞肿瘤辅助诊断模型的预测结果的权重值。
需要说明的是,对于鉴别成熟B细胞肿瘤不同亚型时不同变量的重要程度,参阅图4所示,给出了模型中权重值前20的预测因子。
根据本实施例所提供的方案,提供了一种成熟B细胞肿瘤辅助诊断方法,结合多平台的预测结果,对数据进行预处理,并构建成熟B细胞肿瘤辅助模型来预测成熟B细胞肿瘤的亚型,能够从多个指标评析出模型的性能,提升了预测成熟B细胞肿瘤亚型的准确率,为临床医生提供了一种客观的诊断方式进行初诊,一定程度上克服了对临床医生临床经验依赖。同时,将模型镶嵌在网页,使用网站可视化模型,可以使没有计算机基础的临床医生快速使用模型进行辅助诊断,拓展了模型的应用场景。而且,对临床上一些无法通过现有检测结果进行初步亚型诊断考虑方向的疑难病例,本申请提供了辅助诊断思路。
实施例四
本实施例提供进一步的方案,
所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,在处理基因突变数据时,并没有现有的方案可供参考,原因在于本方案涉及的突变基因数据,包括ABCB1,CD79A,GATA1,MEF2B,SBDS,属于基因类型数据包格式的数据,在将基因类型数据包格式数据时,通过selectInput函数进行输入端构建,具有函数调用更加简单高效的特点,且selectInput函数在调用突变基因数据时,对突变基因数据的识别调用误差很小,相对其他函数更加稳定。
S1:基于load函数加载存储有成熟B细胞肿瘤辅助诊断模型的数据库,通过odbcConnect函数与在后台运行的诊断模型建立连接;
S2:通过fluidPage函数构建诊断模型的前端可视化界面,在fluidPage函数设置元素,所述元素包括标题、侧边栏、主面板,所述侧边栏用于展示待预测数据的输入端,所述主面板用于展示预测结果;
S3:根据selectInput函数构建待预测数据的输入端,所述输入端与所述数据库连接,所述待预测数据的输入端包括用于输入标志物CD5阳/阴性数据的第一端口、用于标志物CD10阳/阴性数据的第二端口、用于输入肿瘤细胞大小数据的第三端口、用于输入突变基因数据的第四端口;
需要说明的是,根据fluidPage函数设置的标题、侧边栏、主面板,参阅图3所示,侧边栏设置有输入待预测数据的控件,根据selectInput函数在侧边栏中构建待预测数据的输入端,比如标志物CD5的阴性/阳性输入端,其中所述用于输入肿瘤细胞大小数据的第三端口还细分为大肿瘤细胞数据的输入端口及小肿瘤细胞数据的输入端口,是大肿瘤细胞则点选输入“Ye”,非大肿瘤细胞则点选输入“No”,同理输入小肿瘤细胞数据。所述主面板显示经成熟B细胞肿瘤辅助诊断模型计算得到的预测结果,预测结果包括对应的亚型相对应的预估概率值,通过直方图展示出来。
S4:获取所述输入端输入的待预测数据,采用ifelse函数将输入的待预测数据整合成矩阵输入到后台运行的诊断模型,根据诊断模型计算矩阵中的待预测数据并输出待预测数据相应的成熟B细胞肿瘤的亚型。
通过4个函数构建预测模型的输入、构架搭建和输出可视化,整体运行稳定,误操作bug少,对使用者具有操作简单,输入结果可视的优点。
需要说明的是,将待预测数据整合成矩阵输入到后台运行的诊断模型,识别待预测数据分别对应的预测因子的权重值,基于权重值计算出对应的亚型。其中一定侧边栏的输入控件,利用selectInput函数构建下拉菜单,提供输入待预测数据的端口,下拉菜单选择标志物CD5为阳性还是阴性,阳性对应标记“+”,阴性对应标记为“-”,同理,选择标志物CD10。
本实施例通过上述输入数据的第一端口、第二端口、第三端口来替代传统的需要相应计算机语言输入的方式,提升了使用模型的效率,为成熟B细胞辅助诊断模型的临床应用提供了便利,模型使用门槛不高,不需要加载相应的计算机语言,也不需要临床医生使用相应的计算机语言来输入待预测数据,通过镶嵌在网页的模型,通过点选输入的方式即可快速便捷的将模型用于临床应用。
在本实施例中,所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,还包括:
获取根据诊断模型计算矩阵中的待预测数据的亚型及亚型对应的预测概率,将待预测数据的亚型、亚型对应的预测概率建立映射关系;
基于ggplot2函数展示待预测数据的亚型、亚型对应的预测概率建立映射关系;
将根据成熟B细胞肿瘤辅助诊断模型整合的可视化脚本置于托管服务并生成网页链接。
需要说明的是,使用R语言的eventReactive函数构建网站server端,将待预测数据整合成矩阵进行后台模型的计算,将计算得到的亚型及亚型对应的预测概率输出,根据映射关系利用R语言的ggplot2函数将待预测数据对应的预测结果利用直方图进行展示。
本实施例所要解决的问题是,现有的医疗预测诊断模型中,使用时需要在其开发的计算机语言环境下使用,在相应的计算机语言中加载医疗预测诊断模型模型,并加载相应的检测数据并运行才能得到预测结果,使用模型效率不高,且许多临床医生不会使用计算机语言,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。进一步地,本方案是通过将模型通过网页可视化的方式进行临床应用,通过在网页点选的方式直接后台运行后输出结果,临床医生不需要使用计算机语言就能够利用本申请的成熟B细胞肿瘤辅助诊断模型进行初诊,虽然也有通过网页点选后输出预测结果的模型,但本申请的改进点在于应用于医疗数据处理,医疗数据较为复杂,现有的可视化方案不适用于本申请,需要寻找一种相适配的可视化方案。
根据本实施例所提供的方案,基于R语言load函数加载存储有成熟B细胞肿瘤辅助诊断模型,根据fluidPage函数构建诊断模型的前端可视化界面,构建将待预测数据的输入端口,不需要使用的计算机语言来输入,极大方便不会使用计算机语言的临床用于使用模型进行初诊。
实施例五
参阅图5所示,本实施例提供一种成熟B细胞肿瘤的辅助诊断预测装置,所述装置包括:
获取模块10,用于获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
输入模块20,用于将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
输出模块30,用于将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
可视化模块40,用于基于R语言将所述预测结果通过网页进行可视化展示。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,免疫学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
实施例六
本实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
图6示出了一个实施例中计算机设备的内部结构图,如图6所示,该计算机设备包括通过终端总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质有存储操作终端,还可有存储计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述的成熟B细胞肿瘤的辅助诊断预测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行上述的成熟B细胞肿瘤的辅助诊断预测方法。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,免疫学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
实施例七
本实施例提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
本实施例所要解决的问题是,现有技术中成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊的技术问题,各亚型的临床表现复杂,亚型鉴别较为困难,现有的辅助诊断模型尚未结合多平台(形态学、免疫学、遗传学及分子生物学)综合诊断,多是基于分子生物学中的二代测序(NGS)构建模型,诊断准确性不高。进一步地,由于基于分子生物学中的二代测序(NGS)建立的辅助诊断模型使用起来较为复杂,需要在构建该模型的计算机语言环境下使用该模型来进行预测,首先需要在相应的计算机语言中加载模型,使用相应的计算机语言来输入待预测数据,并运行才能得到预测结果,使用模型的效率不高,使用门槛较高;再者,由于大多数临床医生的不会使用计算机语言,使用模型来进行初诊预测较为困难,构建预测模型的目的之一在于辅助临床医生使用模型进行初诊,但由于需要基础计算机语言作为使用门槛的问题,导致模型的应用与临床应用产生了脱节。也就是说,本申请旨在解决上述的成熟B细胞肿瘤亚型的判断客观性不足、亚型的判断主要依赖临床医生的主观判断、诊断效率不高、造成一定的误诊和漏诊、模型使用方法复杂、模型使用门槛高的技术问题。
根据本实施例所提出的方案,综合形态学、免疫学、遗传学及分子生物学多个平台的检测结果,比如,形态学中肿瘤细胞大小数据,分子生物学中NGSpanel检测,免疫学中的标志物CD5及标志物CD10。本申请综合了多平台的检测结果来构建模型。通过使用标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据作为模型的变量纳入成熟B细胞肿瘤辅助诊断模型进行机器学习来构建模型,能够通过模型预测成熟B细胞肿瘤的亚型,提供一种客观的诊断方法,提升诊断的准确率。进一步地,基于R语言将成熟B细胞肿瘤辅助诊断模型镶嵌在网页中,不需要模型开发的计算机语言来记载模型,在可视化的模型网页中点选待预测数据自动载入后台的模型进行预测,并将预测结果自动展示在网页前端页面,为临床医生使用预测模型提供了便捷,提升了预测成熟B细胞肿瘤的亚型的效率。
可以理解的是,上述成熟B细胞肿瘤的辅助诊断预测方法、装置、计算机设备及存储介质属于一个总的发明构思,实施例可相互适用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (7)

1.成熟B细胞肿瘤的辅助诊断预测方法,其特征在于,所述方法包括:
获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
基于R语言将所述预测结果通过网页进行可视化展示;
所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,包括:
基于load函数加载存储有成熟B细胞肿瘤辅助诊断模型的数据库,通过odbcConnect函数与在后台运行的诊断模型建立连接;
通过fluidPage函数构建诊断模型的前端可视化界面,在fluidPage函数设置元素,所述元素包括标题、侧边栏、主面板,所述侧边栏用于展示待预测数据的输入端,所述主面板用于展示预测结果;
根据selectInput函数构建待预测数据的输入端,所述输入端与所述数据库连接,所述待预测数据的输入端包括用于输入标志物CD5阳/阴性数据的第一端口、用于标志物CD10阳/阴性数据的第二端口、用于输入肿瘤细胞大小数据的第三端口、用于输入突变基因数据的第四端口;
获取所述输入端输入的待预测数据,采用ifelse函数将输入的待预测数据整合成矩阵输入到后台运行的诊断模型,根据诊断模型计算矩阵中的待预测数据并输出待预测数据相应的成熟B细胞肿瘤的亚型;
其中,所述成熟B细胞肿瘤辅助诊断模型的训练过程如下:
获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%;
通过adasyn函数对训练集进行自适应综合过采样方法的数据类不平衡处理;
基于train函数和训练集进行十折交叉验证来构建成熟B细胞肿瘤辅助诊断模型,基于训练集对成熟B细胞肿瘤辅助诊断模型进行训练,并获取训练后的成熟B细胞肿瘤辅助诊断模型;
通过测试集对训练后的诊断模型进行测试并获取通过测试的最终成熟B细胞肿瘤辅助诊断模型;
获取初诊成熟B细胞肿瘤患者数据,将所述患者数据进行预处理得到初始样本数据,将初始样本数据随机划分为训练集和测试集,所述训练集占比为80%,所述测试集占比为20%的步骤,包括:
所述将所述患者数据进行预处理得到初始样本数据,包括:
获取患者数据中标志物CD5及标志物CD10,基于runif函数分别对标志物CD5和标志物CD10进行缺失值填充;
所述缺失值填充的步骤,包括:
分别筛选标志物CD5及标志物CD10中缺失值位置,对缺失值位置纳入随机数进行补充;
或,获取缺失值位置前或后的数值,将所述前或后的数值纳入相应的缺失值位置;
或,获取标志物CD5中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD5中缺失值位置,获取标志物CD10中出现频率最高的特征数值,将出现频率最高的特征数值纳入标志物CD10中缺失值位置;
初诊成熟B细胞肿瘤患者数据从NGS175panel检测项目、流式细胞术、骨髓活检项目、组织活检项目、染色体核型检测项目、FISH检测项目中获取的,初诊成熟B细胞肿瘤患者数据包括NGSpanel检测的175个突变基因、流式细胞术中获取的抗原标志物CD5、抗原标志物CD10、肿瘤细胞大小数据;
从初始样本数据中划分出占比80%的训练集用于对模型的训练,将训练集利用五次十折交叉验证,将训练集随机划分为10份子集,第一子集用于train函数中交叉验证的测试子集,其余9份子集轮流作为训练数据,期间,利用第一子集进行验证,每次试验都会得出相应的正确率,再求其平均值。
2.根据权利要求1所述的方法,其特征在于,所述成熟B细胞肿瘤辅助诊断模型的验证,包括:
根据confusionMatrix函数构建混淆矩阵,所述混淆矩阵包括模型准确度指标、置信区间指标、无信息率指标、检验准确度指标、衡量分类精度指标,所述混淆矩阵中的各个指标用于评析成熟B细胞肿瘤辅助诊断模型的性能。
3.根据权利要求2所述的方法,其特征在于,所述成熟B细胞肿瘤辅助诊断模型的验证,还包括:
获取训练后的成熟B细胞肿瘤辅助诊断模型,通过测试集对训练后的诊断模型进行测试,基于varImp函数评析对于待预测数据对成熟B细胞肿瘤辅助诊断模型的预测结果的权重值。
4.根据权利要求1所述的方法,其特征在于,所述基于R语言将所述预测结果通过网页进行可视化展示的步骤,还包括:
获取根据诊断模型计算矩阵中的待预测数据的亚型及亚型对应的预测概率,将待预测数据的亚型、亚型对应的预测概率建立映射关系;
基于ggplot2函数展示待预测数据的亚型、亚型对应的预测概率建立映射关系;
将根据成熟B细胞肿瘤辅助诊断模型整合的可视化脚本置于托管服务并生成网页链接。
5.成熟B细胞肿瘤的辅助诊断预测装置,其特征在于,用于应用权利要求1至4中任一项所述的方法,所述装置包括:
获取模块,用于获取待预测数据,所述待预测数据包括:标志物CD5、标志物CD10、肿瘤细胞大小数据、突变基因数据;
输入模块,用于将所述待预测数据作为成熟B细胞肿瘤辅助诊断模型的输入,所述成熟B细胞肿瘤辅助诊断模型用于预测所述待预测数据相应的成熟B细胞肿瘤的亚型,所述成熟B细胞肿瘤的亚型结果包括:BL、CLL/SLL、DLBCL、FL、HCL、LPL/WM、MCL、MZBL;
输出模块,用于将成熟B细胞肿瘤辅助诊断模型预测的所述亚型作为预测结果输出;
可视化模块,用于基于R语言将所述预测结果通过网页进行可视化展示。
6.计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
7.计算机设备,包括存储器和处理器,其特征在于,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述成熟B细胞肿瘤的辅助诊断预测方法的步骤。
CN202310077993.1A 2023-01-19 2023-01-19 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质 Active CN116312778B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310077993.1A CN116312778B (zh) 2023-01-19 2023-01-19 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310077993.1A CN116312778B (zh) 2023-01-19 2023-01-19 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116312778A CN116312778A (zh) 2023-06-23
CN116312778B true CN116312778B (zh) 2024-02-13

Family

ID=86815876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310077993.1A Active CN116312778B (zh) 2023-01-19 2023-01-19 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116312778B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118448056A (zh) * 2024-05-20 2024-08-06 暨南大学附属第一医院(广州华侨医院) 一种基于网络搜索机器学习的颅脑肿瘤可视化模型构建系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106460036A (zh) * 2014-03-04 2017-02-22 免疫医疗有限责任公司 用于对响应b细胞消耗疗法的b细胞恶性肿瘤进行鉴定的组合物和方法
CN110031624A (zh) * 2019-02-28 2019-07-19 中国科学院上海高等研究院 基于多神经网络分类器的肿瘤标志物检测系统、方法、终端、介质
CN113913518A (zh) * 2021-08-31 2022-01-11 广州市金域转化医学研究院有限公司 成熟b细胞肿瘤的分型标志物及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131475B2 (en) * 2003-09-03 2012-03-06 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for identifying, diagnosing, and predicting survival of lymphomas
US8557747B2 (en) * 2009-12-29 2013-10-15 Cancer Genetics, Inc. Tool for diagnosis and prognosis of mature B-cell neoplasms

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106460036A (zh) * 2014-03-04 2017-02-22 免疫医疗有限责任公司 用于对响应b细胞消耗疗法的b细胞恶性肿瘤进行鉴定的组合物和方法
CN110031624A (zh) * 2019-02-28 2019-07-19 中国科学院上海高等研究院 基于多神经网络分类器的肿瘤标志物检测系统、方法、终端、介质
CN113913518A (zh) * 2021-08-31 2022-01-11 广州市金域转化医学研究院有限公司 成熟b细胞肿瘤的分型标志物及其应用

Also Published As

Publication number Publication date
CN116312778A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
Reitsma et al. Assessing methodological quality
CN116312778B (zh) 成熟b细胞肿瘤的辅助诊断预测方法、装置、设备及介质
Kalmin et al. Conventional versus Rosemont endoscopic ultrasound criteria for chronic pancreatitis: comparing interobserver reliability and intertest agreement
Wright et al. Pathologic separation of idiopathic pulmonary fibrosis from fibrotic hypersensitivity pneumonitis
CN107103207B (zh) 基于病例多组学变异特征的精准医学知识搜索系统及实现方法
Stewart et al. Validation of the EuroClonality-NGS DNA capture panel as an integrated genomic tool for lymphoproliferative disorders
CN111508603A (zh) 一种基于机器学习的出生缺陷预测及风险评估方法、系统及电子设备
Bock et al. Association mapping in biomedical time series via statistically significant shapelet mining
CN110299185A (zh) 一种基于新一代测序数据的插入变异检测方法及系统
CN107292129A (zh) 易感基因型检测方法
CN116230081A (zh) 一种用于肺腺癌预后预测的生物标志物、应用及模型构建方法
Frame et al. Evaluation of mixture modeling with count data using NONMEM
Meng et al. The application of machine learning techniques in clinical drug therapy
WO2022027714A1 (zh) 诊断模型的诊断能力的评估方法、系统、设备和存储介质
CN115274118A (zh) 一种构建睾丸肿瘤诊断和术后复发风险预测模型的方法
CN116543867A (zh) 基于预测模型指导t2dm患者mtm模式的方法及装置
CN109949866A (zh) 病原体操作组的检测方法、装置、计算机设备和存储介质
KR20220086458A (ko) 유전자 데이터 공유를 위한 차세대 염기 서열 분석 방법, 차세대 염기 서열 분석 장치 및 차세데 염기 서열 분석 프로그램
Mauguen et al. Estimating the probability of clonal relatedness of pairs of tumors in cancer patients
CN114613498B (zh) 一种基于机器学习的辅助mdt临床决策方法、系统及设备
CN113913518B (zh) 成熟b细胞肿瘤的分型标志物及其应用
Hudgens et al. Development of the bleeding and pelvic discomfort scale for use in women with heavy menstrual bleeding associated with uterine fibroids
CN109492690B (zh) 一种基于卷积神经网络检测ct图像的方法
Zheng et al. SVsearcher: A more accurate structural variation detection method in long read data
CN116246701B (zh) 基于表型术语和变异基因的数据分析装置、介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant