急性白血病的骨髓细胞形态的数据治理分析方法及系统
技术领域
本发明涉及白血病细胞分析技术领域,尤其涉及一种急性白血病的骨髓细胞形态的数据治理分析方法及系统。
背景技术
急性白血病(acute leukemia, AL)是造血干细胞的恶性克隆性疾病,是常见的血液系统恶性肿瘤,发病时骨髓中异常的原始细胞及幼稚细胞(白血病细胞)大量增殖,抑制正常造血,广泛浸润肝、脾、淋巴结等髓外脏器。表现为贫血、出血、感染和浸润等临床特征。根据受累的细胞类型,AL通常可以分为急性淋巴细胞白血病(acute lymphoblasticleukemia,ALL)和急性髓细胞白血病(acute myeloid leukemia,AML)两大类。我国AML的发病率约为1.62/10万,而ALL则约为0.69/10万。成人以AML多见,儿童以ALL多见。急性白血病若不经特殊治疗,平均生存期仅3个月左右,短者甚至在诊断数天后即死亡。
骨髓(Bone Marrow,BM),由于生理变异和不同的调查资料,正常骨髓象各系统各阶段细胞比值变动范围较大,所以正常骨髓象实际含义是正常范围骨髓象,下降数据可做为骨髓涂片中各种血细胞正常值的参考: 粒细胞系统占比例最大,约占1/2。一般原始粒细胞<0.02,早幼粒细胞<0.05,以中性杆状核最多,其比值大于分叶核细胞,也多于晚幼粒细胞,嗜酸性粒细胞<0.05,嗜碱性粒细胞<0.01。
随着人口老龄化以及环境污染等因素,急性白血病的发病呈现逐年递增的现象。对疑诊急性白血病的患者,目前仍然是首先进行骨髓穿刺检查,抽取骨髓液行骨髓细胞学,流式细胞学,染色体以及基因检查明确急性白血病的诊断,以及后续的分型和预后判断。
骨髓细胞形态学检查是诊断急性白血病的基础。常规做法是骨髓细胞形态学检查;把骨髓液涂片后,进行瑞氏染色,然后在显微镜下检查判断是否有原始细胞,以及200个有核细胞或者500个有核细胞中原始细胞的比例占多少。
现有技术中存在以下缺点:1、目前骨髓细胞形态学的诊断主要依靠肉眼去计算200个有核细胞中原始细胞的比例,但存在疲劳误诊的情况,数据质量处理过程中的问题未及时纠正,统计不准确。
2、随着急性白血病的发病率越来越高,而相关的骨髓细胞学医生的缺乏,急性白血病从完成骨髓穿刺后到正式报告所花费的时间越来越长,耽误病人的治疗的宝贵时间。
3、未建立数据标准,数字化分析算法,目前的骨髓细胞形态学检查无法远程诊断。
4、目前的骨髓细胞形态学检查仍然停留在经验诊断,无法数字化,各个医疗业务之间数据共享性差,敏感数据等不到有效跟踪和监控,也无法保存电子证据。
发明内容
本发明实施例所要解决的技术问题在于,提供一种急性白血病的骨髓细胞形态的数据治理分析方法及系统,以使辅助医生诊断白血病。
为了解决上述技术问题,本发明实施例提出了一种急性白血病的骨髓细胞形态的数据治理分析方法,包括:
步骤1:采集不同形态的骨髓细胞元数据,确定元数据的管理范围及安全边界,识别急性白血病的骨髓细胞形态主数据,构建骨髓细胞形态的主数据标准化模型,搭建相关数据检测标准;
步骤2:对骨髓细胞形态的元数据进行数据质量筛选和数据纠错,对细胞核存在及其存在的概率进行预测及估算,通过不同的数据治理,进入到不同的标准化模型,进行数据标准化处理;
步骤3:对各个骨髓细胞的大小进行分类,根据病人的相关血液参数来设计细胞形状数据大小的边界范围,对每个元细胞数据进行放大比较,根据骨髓细胞形态的参考数据细胞大小为基准,对各个方向的细胞形态数据进行全方位的匹配比较,并从基准数据库里依据数据模型进行比对,提取出巨核细胞;
步骤4:对主数据进行二次处理,进行数据清洗,提升元数据的参考质量,依据判断及预测的红细胞、粒细胞系统、单核细胞系统分别建立不同的数据理解算法,搭建局部细胞的标准模型,为各细胞系统应用匹配数据,通过细胞数据理解疾病状态同时自动匹配下一步的治疗实施计划;
步骤5:从相关疾病诊断数据库中获取其它骨髓细胞形态数据,根据细胞核与细胞浆的比例,细胞浆内含有的颗粒的密度和丰度,颜色判断搭建新的细胞数据优化治理模型,按照数据治理的标准模型进一步分析,对数据再次进行清洗;并及时更新到病人的主数据池中。
进一步地,所述步骤3中,将所述巨核细胞转为本次检测的数据资产,如果有异常,进行异常监控,对敏感数据进行脱敏处理,当需要进行共享该巨核细胞数据时,则对其进行数据去隐私化。
进一步地,所述步骤5之后还包括:
步骤6:再次根据骨髓细胞核是否致密或疏松判断的数据模型,进行一次完整的循环,按照关联的模式,对于可预测及初步判断的疾病进行数据审核汇总,预警分析,此时进入人工干预或者机器自动识别,进行细胞数据维护,并在不同的医生数据库中交换审核,更新识别的策略。
进一步地,所述步骤3中,放大范围差异体现到2的n次方数据上。
相应地,本发明实施例还提供了一种急性白血病的骨髓细胞形态的数据治理分析系统,包括:
模块1:采集不同形态的骨髓细胞元数据,确定元数据的管理范围及安全边界,识别急性白血病的骨髓细胞形态主数据,构建骨髓细胞形态的主数据标准化模型,搭建相关数据检测标准;
模块2:对骨髓细胞形态的元数据进行数据质量筛选和数据纠错,对细胞核存在及其存在的概率进行预测及估算,通过不同的数据治理,进入到不同的标准化模型,进行数据标准化处理;
模块3:对各个骨髓细胞的大小进行分类,根据病人的相关血液参数来设计细胞形状数据大小的边界范围,对每个元细胞数据进行放大比较,根据骨髓细胞形态的参考数据细胞大小为基准,对各个方向的细胞形态数据进行全方位的匹配比较,并从基准数据库里依据数据模型进行比对,提取出巨核细胞;
模块4:对主数据进行二次处理,进行数据清洗,提升元数据的参考质量,依据判断及预测的红细胞、粒细胞系统、单核细胞系统分别建立不同的数据理解算法,搭建局部细胞的标准模型,为各细胞系统应用匹配数据,通过细胞数据理解疾病状态同时自动匹配下一步的治疗实施计划;
模块5:从相关疾病诊断数据库中获取其它骨髓细胞形态数据,根据细胞核与细胞浆的比例,细胞浆内含有的颗粒的密度和丰度,颜色判断搭建新的细胞数据优化治理模型,按照数据治理的标准模型进一步分析,对数据再次进行清洗;并及时更新到病人的主数据池中。
进一步地,所述模块3中,将所述巨核细胞转为本次检测的数据资产,如果有异常,进行异常监控,对敏感数据进行脱敏处理,当需要进行共享该巨核细胞数据时,则对其进行数据去隐私化。
进一步地,还包括模块6:再次根据骨髓细胞核是否致密或疏松判断的数据模型,进行一次完整的循环,按照关联的模式,对于可预测及初步判断的疾病进行数据审核汇总,预警分析,此时进入人工干预或者机器自动识别,进行细胞数据维护,并在不同的医生数据库中交换审核,更新识别的策略。
进一步地,所述模块3中,放大范围差异体现到2的n次方数据上。
本发明的有益效果为:本发明建立诊断急性白血病的骨髓细胞形态数据标准,可以解决急性白血病诊断高效且可靠方案的需求,减少误诊,并实现了数据共享,有专门的数据安全策略严格保护病人的疾病数据隐私,通过算法固定流程将各个数据环节打通,通过细胞数据快速而有效的判断疾病,提升数据质量,并将长期积累转为数据资产,实现病人相关数据全生命周期管理;本发明可以同时在本地或云上使用,建立统一的,可信的骨髓细胞形态数据管理库。
附图说明
图1是本发明实施例的急性白血病的骨髓细胞形态的数据治理分析方法的流程示意图。
图2是本发明实施例的急性白血病的骨髓细胞形态的数据治理分析系统的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
本发明实施例中若有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中若涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
骨髓细胞学诊断血液疾病如急性白血病,慢性白血病,再生障碍性贫血,多发性骨髓瘤等疾病的必须的检查。在血液科住院诊治的患者中,大约90%以上的患者需要经过骨髓细胞学检查才能明确诊断疾病。然而骨髓细胞病理的医师少,成长周期长,特别是边远地区的医院更加缺乏有经验的血液细胞病理医生,严重制约了发展。
急性白血病起病较急,需要尽快诊断。明确诊断到治疗开始的时间与预后存在明显的相关性。而急性白血病的骨髓细胞学相对其他疾病的骨髓细胞学检查有着显著的特征。因此,探索基于大数据分析及AI技术,通过搭建骨髓细胞形态数据治理模型和算法来辅助诊断急性白血病成为可能。
基于大数据及AI的数据治理分析基于某项业务研究、开发用于模拟、延伸和扩展人认识和分析数据的理论、方法、技术及应用系统的一门新的技术科学。通过数据分析和数据治理算法,它企图了解业务智能分析的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。通过数据分析,将达到人工智能的境界,智能的分析,智能的处理,可以对物体的具体数据进行分析、比较,核对。数据治理过程通过机器模拟人思维的信息过程。
请参照图1,本发明实施例的急性白血病的骨髓细胞形态的数据治理分析方法包括步骤1~步骤5。
步骤1:采集不同形态的骨髓细胞元数据,确定元数据的管理范围及安全边界,识别急性白血病的骨髓细胞形态主数据,构建骨髓细胞形态的主数据标准化模型,搭建相关数据检测标准。本发明建立骨髓细胞形态数据模型,对相关骨髓细胞形态参考数据进行标准化管理,通过高速摄像,油镜下扫描整个骨髓片,找到细胞呈现单层排列的细胞;确定元数据的管理范围,及安全边界,建立数据标准。骨髓细胞形态包括形状、大小、颜色、有核/无核、紧密度、光泽度、丰满度等。
步骤2:对骨髓细胞形态的元数据进行数据质量筛选和数据纠错,对细胞核存在及其存在的概率进行预测及估算,通过不同的数据治理,进入到不同的标准化模型,进行数据标准化处理。本发明通过数据标准化管理,对骨髓细胞形态的元数据进行数据质量筛选和数据纠错,搭建成熟红细胞数据管理流程,对细胞核存在及其存在的概率进行预测及估算,通过不同的数据治理,进入到不同的标准化模型。
步骤3:对各个骨髓细胞的大小进行分类,根据病人的相关血液参数来设计细胞形状数据大小的边界范围,对每个元细胞数据进行放大比较,根据骨髓细胞形态的参考数据细胞大小为基准,对各个方向的细胞形态数据进行全方位的匹配比较,并从基准数据库里依据数据模型进行比对,提取出巨核细胞。在经过数据标准化处理后,进入数据分析及挖掘阶段,对各个骨髓细胞的大小进行分类,根据病人的相关血液参数来设计细胞形状数据大小的边界范围,对每个元细胞数据进行放大比较,范围差异体现到2的n次方数据上,根据骨髓细胞形态的参考数据细胞大小为基准,对各个方向的细胞形态数据进行全方位的匹配比较,并从基准数据库里依据数据模型进行比对,提取出巨核细胞;同时把该巨核细胞转为本次检测的数据资产,如果有异常,进行异常监控,对敏感数据进行脱敏处理,当需要进行共享该细胞数据时,还需要对其进行数据去隐私化。
步骤4:对主数据进行二次处理,进行数据清洗,提升元数据的参考质量,依据判断及预测的红细胞、粒细胞系统、单核细胞系统分别建立不同的数据理解算法,搭建局部细胞的标准模型,为各细胞系统应用匹配数据,通过细胞数据理解疾病状态同时自动匹配下一步的治疗实施计划。进入到主数据二次处理阶段,进行数据清洗,提升元数据的参考质量,数据治理算法会依据判断及预测的红细胞,粒细胞系统,单核细胞系统分别建立不同的数据理解算法,搭建局部细胞的标准模型,为各细胞系统应用匹配数据,通过细胞数据理解疾病状态同时自动匹配下一步的治疗实施计划。本发明使用数据治理,AI等算法来辅助人工诊断急性白血病,通过数据模型实现数据安全机制,降低数据风险,监控敏感数据,使误诊率降到最低。
本发明建立诊断急性白血病的骨髓细胞形态的数据治理系统,搭建相关检测数据检测标准,缩短从就诊到确诊的宝贵时间;及时发现、解决及监控疾病细胞数据问题,从根本上改善和解决人工来判断疾病的数据问题,保证数据的可用性、数据质量以及数据集中管理及展现。
步骤5:当数据进行完数据清洗和数据整合后,此时从相关疾病诊断数据库中获取其它骨髓细胞形态数据,根据细胞核与细胞浆的比例,细胞浆内含有的颗粒的密度和丰度,颜色判断搭建新的细胞数据优化治理模型,按照数据治理的标准模型进一步分析,对数据再次进行清洗;并及时更新到病人的主数据池中。
本发明实施例消除部分细胞元数据的不一致型,建立规范的数据应用标准,实现数据判断及数据共享,并予保存电子证据。
作为一种实施方式,步骤3中,将所述巨核细胞转为本次检测的数据资产,如果有异常,进行异常监控,对敏感数据进行脱敏处理,当需要进行共享该巨核细胞数据时,则对其进行数据去隐私化。
作为一种实施方式,步骤5之后还包括步骤6:在前期对骨髓细胞形态进行判断的基础上,为了持续保障,将再次根据骨髓细胞核是否致密或疏松判断的数据模型,进行一次完整的循环,按照关联的模式,对于可预测及初步判断的疾病进行数据审核汇总,预警分析,此时进入人工干预或者机器自动识别,进行细胞数据维护,并在不同的医生数据库中交换审核,更新识别的策略。
本发明实施例把相关骨髓细胞形态相关数据环节贯通,解决通过人工独立的判断和执行,通过数据治理算法可以将各个环节打通,实现完整的数据管控及多方专家共享数据,提高医用数据的业务管理能力,辅助远程诊断。
作为一种实施方式,步骤3中,放大范围差异体现到2的n次方数据上。
本发明实施例经过采集骨髓细胞元数据,识别急性白血病的骨髓细胞形态主数据,搭建主数据模型及数据标准,理解细胞形态数据,对数据质量进行清洗,转换,设定安全边界,根据骨髓细胞形态的各个数据关联度,影响性分析,多次保障及判断元数据的完整性及时性。确保最终数据治理决策时骨髓细胞主数据及元数据的准确性,同时结合判断急性白血病的数字化业内经验,建立映射关系,最终来诊断急性白血病相关结论。
请参照图2,本发明实施例的急性白血病的骨髓细胞形态的数据治理分析系统包括模块1~模块5。
模块1:采集不同形态的骨髓细胞元数据,确定元数据的管理范围及安全边界,识别急性白血病的骨髓细胞形态主数据,构建骨髓细胞形态的主数据标准化模型,搭建相关数据检测标准。
模块2:对骨髓细胞形态的元数据进行数据质量筛选和数据纠错,对细胞核存在及其存在的概率进行预测及估算,通过不同的数据治理,进入到不同的标准化模型,进行数据标准化处理。
模块3:对各个骨髓细胞的大小进行分类,根据病人的相关血液参数来设计细胞形状数据大小的边界范围,对每个元细胞数据进行放大比较,根据骨髓细胞形态的参考数据细胞大小为基准,对各个方向的细胞形态数据进行全方位的匹配比较,并从基准数据库里依据数据模型进行比对,提取出巨核细胞。
模块4:对主数据进行二次处理,进行数据清洗,提升元数据的参考质量,依据判断及预测的红细胞、粒细胞系统、单核细胞系统分别建立不同的数据理解算法,搭建局部细胞的标准模型,为各细胞系统应用匹配数据,通过细胞数据理解疾病状态同时自动匹配下一步的治疗实施计划。
模块5:从相关疾病诊断数据库中获取其它骨髓细胞形态数据,根据细胞核与细胞浆的比例,细胞浆内含有的颗粒的密度和丰度,颜色判断搭建新的细胞数据优化治理模型,按照数据治理的标准模型进一步分析,对数据再次进行清洗;并及时更新到病人的主数据池中。
作为一种实施方式,模块3中将所述巨核细胞转为本次检测的数据资产,如果有异常,进行异常监控,对敏感数据进行脱敏处理,当需要进行共享该巨核细胞数据时,则对其进行数据去隐私化。
作为一种实施方式,急性白血病的骨髓细胞形态的数据治理分析系统还包括模块6:再次根据骨髓细胞核是否致密或疏松判断的数据模型,进行一次完整的循环,按照关联的模式,对于可预测及初步判断的疾病进行数据审核汇总,预警分析,此时进入人工干预或者机器自动识别,进行细胞数据维护,并在不同的医生数据库中交换审核,更新识别的策略。
作为一种实施方式,模块3中,放大范围差异体现到2的n次方数据上。
本发明实施例引入数据治理算法及人工智能辅助诊断急性白血病并数字化细胞学,保留诊断的电子证据;建立诊断急性白血病的骨髓细胞形态数据标准,搭建起判断数据模型及算法;实现各相关部门诊断急性白血病的细胞数据共享,数据治理算法自动从多个业务系统获得数据,实现从技术检验人员,专业医生,医疗专家,业务领导直接全流程数据推送及分析,决策;引入高速摄像,图像识别,大数据处理,人工智能来对急性白血病中的骨髓细胞进行数据清洗及数据质量控制;把和白血病的骨髓细胞各相关性参数(细胞大小、红细胞、细胞核、细胞浆)进行数据明确,并实现了数据量化,搭建了白血病骨髓细胞的数据边界;搭建了急性白血病骨髓细胞的数据跟踪及数据监控体系,相关数据实现了自匹配,对病因各问题整理分类,对治理效果进行预评估。建立预治疗相关模型,为下一步的机器自动学习和跟踪急性白血病的判断和治疗打下了数据基础。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。