CN108520778A - 一种基于大数据的肺癌筛查系统及方法 - Google Patents

一种基于大数据的肺癌筛查系统及方法 Download PDF

Info

Publication number
CN108520778A
CN108520778A CN201810361140.XA CN201810361140A CN108520778A CN 108520778 A CN108520778 A CN 108520778A CN 201810361140 A CN201810361140 A CN 201810361140A CN 108520778 A CN108520778 A CN 108520778A
Authority
CN
China
Prior art keywords
data
lung cancer
screening
patients
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810361140.XA
Other languages
English (en)
Inventor
滕峰
朱广迎
李建军
蒋捷
王虹
张新
严治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jh Zhong Shen Zhi Health Technology Co Ltd
China Japan Friendship Hospital
Original Assignee
Beijing Jh Zhong Shen Zhi Health Technology Co Ltd
China Japan Friendship Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jh Zhong Shen Zhi Health Technology Co Ltd, China Japan Friendship Hospital filed Critical Beijing Jh Zhong Shen Zhi Health Technology Co Ltd
Priority to CN201810361140.XA priority Critical patent/CN108520778A/zh
Publication of CN108520778A publication Critical patent/CN108520778A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于大数据的肺癌筛查系统及方法,该系统包括采集终端、服务器和人机界面;采集终端采集肺癌患者资料数据和需筛查患者的检测数据,并将所有数据进行上传;服务器用于接收资料数据和检测数据,并根据资料数据建立肺癌患者数据库;对肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据,并对所述关系数据进行学习、训练以得到肺癌风险预测模型;通过肺癌风险预测模型对检测数据进行处理,得出需筛查患者的各致病因素与肺癌之间的参考数据;将参考数据发送给人机界面显示;其效果是:通过对肺癌患者的数据库进行大数据分析和统计,得到不同致病因素与肺癌的关系数据,为肺癌前期的筛查提供了科学的参考依据。

Description

一种基于大数据的肺癌筛查系统及方法
技术领域
本发明属于数据处理技术领域,具体涉及到一种基于大数据的肺癌筛查系统及方法。
背景技术
目前,随着互联网技术的飞速发展,整个社会被推入“大数据”时代。我国已经建成了 一些肿瘤数据库,但缺乏病种针对性,而且此类数据库亦散见于极少量教学医院、中心医院。 此外,各大医院使用各自的医疗系统,同样的病人数据采用不同的记录规则,导致了肺癌病 人信息无法集成,各个医院因为使用的电子病历系统的差异,肿瘤病人数据无法被收集统一 使用,大量的病人数据只是成了摆设,出现了“数据丰富,无法统一”的现象。因此如何充 分利用这些宝贵的信息资源来对肺癌的早期诊断和治疗提供科学的指导、为医院管理决策提 供科学的参考依据,已经成为迫切需要解决的问题。
发明内容
为了解决上述问题,本发明提供一种基于大数据的肺癌筛查系统及方法,解决现有技术 中肺癌患者的资料数据无法被统一收集,并为肺癌的筛查提供科学的参考依据的缺陷。
本发明采取的一种技术方案为:一种基于大数据的肺癌筛查系统,其特征在于,包括采 集终端、服务器和人机界面;
所述采集终端用于采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据 和检测数据进行上传;
所述服务器用于接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据 库;对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据,并对所 述关系数据进行学习、训练以得到肺癌风险预测模型;通过所述肺癌风险预测模型对所述检 测数据进行处理,得出需筛查患者的各致病因素与肺癌之间的参考数据;将所述参考数据发 送给人机界面;
所述人机界面用于通过可视化的方式进行展示所述参考数据。
优选的,所述的一种基于大数据的肺癌筛查系统,还包括预处理模块,所述预处理模块 用于去除所述资料数据和检测数据中的无效数据以得到有效数据,并对所述有效数据进行分 类和格式转换。
本发明采用的另一种技术方案为:一种基于大数据的肺癌筛查方法,应用于上述的一种 基于大数据的肺癌筛查系统,所述方法包括以下步骤:
采集终端采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据和检测数 据进行上传;
服务器接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据库;
服务器对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据, 并对所述关系数据进行学习、训练以得到肺癌风险预测模型;
服务器通过所述肺癌风险预测模型对所述检测数据进行处理,得出需筛查患者的各致病 因素与肺癌之间的参考数据;
服务器将所述参考数据发送给人机界面进行可视化显示。
优选的,所述方法还包括:服务器对采集的所述资料数据和检测数据进行数据预处理, 所述预处理包括去除所述资料数据和检测数据中的无效数据以得到有效数据,并对所述有效 数据进行分类和格式转换。
优选的,服务器对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关 系数据,具体包括以下步骤:
服务器获取肺癌患者数据库中与肺癌疾病相关的各种症状;
服务器根据肺癌患者数据库中的所有样本信息,分别统计每种症状出现的概率;
服务器根据肺癌患者数据库中的肺癌样本信息,分别统计当某一症状出现时,肺癌疾病 出现的概率。
优选的,所述参考数据包括以下计算方法:
参考数据=ex/(1+ex);其中,e是自然对数,
x=-6.8272+(0.0391×年龄)+(0.7917×吸烟史)+(1.3388×恶性肿瘤)
+(0.1274×直径)+(1.0407×毛刺征)+(0.7838×位置)
患者有吸烟史,则吸烟史标记为1,否则标记为0;如果患者有大于五年的胸腔外恶性 肿瘤史,则恶性肿瘤项标记为1,否则标记为0;如果肺部结节边缘有毛刺,则毛刺征标记为1,否则标记为0;如果肺部结节位于上叶,则位置项标记为1,否则为0,直径为肺部结 节的直径,单位为毫米。
优选的,所述参考数据还包括以下计算方法:
若需筛查的患者的检测数据中患者的肺磨玻璃样变数据(GGO)小于百分之五十时,参 考数据=ex/(1+ex);其中,e是自然对数,
x=7.442+(0.051×年龄)+(0.711×症状表现)+(0.066×血清总蛋白)
+(0.032×直径)+(1.071×分叶)+(1.220×钙化灶)
血清总蛋白单位为g/L;症状表现、分叶、钙化灶有相应症状若出现时,则相应项标记 为1,否则标记为0;
若需筛查的患者的检测数据中患者的肺磨玻璃样变数据(GGO)大于百分之五十时,参 考数据=ex/(1+ex);
x=-6.192+(-0.924×性别)+(0.042×FEV1占预计值百分比)
+(0.131×直径)+(1.071×分叶)+(2.424×钙化灶)
其中,e是自然对数,FEV1表示肺功能检测值,分叶、钙化灶有相应症状若出现时,则 相应项标记为1,否则标记为0。
本发明的有益效果是:通过对肺癌患者的资料数据进行采集,建立肺癌患者数据库,通 过对肺癌患者的数据库进行大数据分析和统计,得到不同致病因素与肺癌的关系数据,为肺 癌前期的筛查提供了科学的参考依据。
附图说明
图1为本发明提供的一种基于大数据的肺癌筛查系统的结构示意图;
图2为本发明第一实施例提供的一种基于大数据的肺癌筛查方法的流程图;
图3为本发明第二实施例提供的一种基于大数据的肺癌筛查方法的流程图;
图4为本发明提供的一种可视化结果示意图。
具体实施方式
为了使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实 施例进行详细描述,这里的描述不意味着对应于实施例中陈述的具体实例的所有主题都在权 利要求中引用了。
参考图1所示,本发明提供的一种基于大数据的肺癌筛查系统的结构示意图,包括采集 终端、服务器和人机界面;
所述采集终端用于采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据 和检测数据进行上传;
所述服务器用于接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据 库;对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据,并对所 述关系数据进行学习、训练以得到肺癌风险预测模型;通过所述肺癌风险预测模型对所述检 测数据进行处理,得出需筛查患者的各致病因素与肺癌之间的参考数据;将所述参考数据发 送给人机界面;
所述人机界面用于通过可视化的方式进行展示所述参考数据。
应用时,采集终端可包括肺癌筛查专家系统、肺癌筛查物联网系统和肺癌筛查监管系统; 肺癌筛查专家系统用于根据筛查患者的资料数据,判断是否为肺癌患者,并为确诊的患者进 行资料上传;肺癌筛查物联网系统用于通过对各种肺癌筛查检测仪的数据进行收集;肺癌筛 查监管系统用于对肺癌数据查询和肺癌数据管理,总体反映肺癌患者在发病、诊断、疗效等 全方位的功能作用。
进一步地,为了提高数据收集的准确性和有效性,降低相应服务器的处理负荷,所述的 一种基于大数据的肺癌筛查系统还包括预处理模块,所述预处理模块用于去除所述资料数据 和检测数据中的无效数据以得到有效数据,并对所述有效数据进行分类和格式转换。
请参考图2,是本发明第一实施例所提供的一种基于大数据的肺癌筛查方法的流程图, 如图1所示,所述方法包括以下步骤:
S101,采集终端采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据和 检测数据进行上传;
具体地,采集终端可包括肺癌筛查专家系统、肺癌筛查物联网系统和肺癌筛查监管系统; 肺癌筛查专家系统用于根据筛查患者的资料数据,判断是否为肺癌患者,并为确诊的患者进 行资料上传;
肺癌筛查物联网系统用于通过对各种肺癌筛查检测仪的数据进行收集,并进行上传,具 体地,通过肺癌筛查物联网系统,在医疗机构设置数据收集点,针对发生肺癌以后的患者, 使用基因检测盒等产品进行组织病理和分子病理检测和筛查,设备通过vc编程,实现数据 输出到中控系统,再由中控系统同步到再由中控系统同步至肺癌筛查信息采集系统和医院肺 癌筛查小组的信息系统,医院信息系统再将数据同步到中心服务器。检查信息通过触控终端 程序,传输回医院,对筛查结果进行数据的分析和汇总。一般肺癌数据主要是包括以下九个 方面:
(1)基本病史,包括患者基本信息、个人史、生活史、既往史、过敏史、现病史等。
(2)检验数据(生化、血常规、肿瘤标志物等)。
(3)影像数据(胸片、低剂量率CT)。
(4)临床病理诊断(分型、分期、分级)。
(5)治疗方案。
(6)随访数据(随访时间、随访内容)。
(7)脂质组学。
(8)蛋白组学。
(9)代谢组学。
(10)基因组学。
肺癌筛查监管系统用于对肺癌数据查询和肺癌数据管理。总体反映肺癌患者在发病、诊 断、疗效等全方位的功能作用,数据形式表现多样、随时间动态变化的各项肺癌信息以动态 页面形式呈现。从基本信息管理、检验诊断信息管理、病理诊断信息管理、影像诊断信息管 理、临床治疗信息管理、肿瘤样本信息管理、临床评估信息管理七个方面综合归纳、整理肺 癌病例的资料数据,具体可参考如下表格。
可通过筛查医护人员使用的平板电脑或智能手机及APP组成采集录入病患基本信息、既 往病史、基因快速检测结果等数据,需筛查患者的检测数据也通过上述的各系统进行上传, 在此不再赘述。并通过无线移动网络与服务器和各检测仪进行数据传输。
S102,服务器接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据库;
具体地,将采集的资料数据分为不同的数据类别,同时创建录入修改、查询统计、数据 挖掘、可视化展示等综合操作的用户操作接口,从而构建具有层次信息的肺癌数据库,使数 据库中的信息具有统一、直观等优点。
S103,服务器对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系 数据,并对所述关系数据进行学习、训练以得到肺癌风险预测模型;
具体地,可采用人工智能、机器学习、模式识别、统计学等技术,进行高度自动化地分 析数据,做出归纳性的推理,从中得出肺癌与各致病因素之间的关系数据,并进行数据的学 习、训练和发现,建立肺癌风险预测模型,用于对待筛查的患者进行风险评估。
S104,服务器通过所述肺癌风险预测模型对所述检测数据进行处理,得出需筛查患者的 各致病因素与肺癌之间的参考数据;
具体地,服务器获取肺癌患者数据库中与肺癌疾病相关的各种症状,记为集合A;
服务器根据肺癌患者数据库中的所有样本信息,分别统计每种症状(即Ai)出现的概率, 记为P(Ai);
服务器根据肺癌患者数据库中的肺癌样本信息,分别统计当某一症状(即Ai)出现时, 肺癌疾病B出现的概率,记为P(B|Ai)。
例如,在出现一症状j时,根据贝叶斯公式:
分别计算当肺癌疾病B发生时,出现症状Ai的概率。需要注意的是,在发生肺癌疾病B 的前提下,计算出现症状Aj的概率时,需要将集合A中除了特征Aj之外的其他特征Ai与肺 癌疾病B的联合概率作为归一化因子进行归一化。
通过统计得到的概率作为先验信息和总体分布信息,不能直接应用于某特定患者患肺癌 疾病的预测,还需要待筛查患者的样本信息(也就是检测数据)才能为医生提供可靠的参考。
具体地,可通过贝叶斯公式计算:
P(B|Ak)=P(B)×P(Ak|B)/P(Ak)(k=1,2,…,m)
P(B|Ak)为每一个待筛查患者预测出其可能患肺癌疾病的概率。其中Ak指的是该患者自 身出现的与肺癌疾病相关的症状,P(Ak)指根据肺癌数据库中的所有信息,统计得出的出现 该症状的概率;P(B)指统计得出的患肺癌疾病的概率;P(Ak|B)指根据肺癌数据库中的所有 肺癌样本信息,统计得出的已患肺癌疾病B时,出现症状Ai的概率。
S105,服务器将所述参考数据发送给人机界面进行可视化显示。
具体地,服务器通过采用可视化的方式进行展示数据,将所分析的度量和数据有效地转 化为容易理解的图形,使其能够为医生基于事实所做的决策提供参考,使数据更加客观、更 具说服力。
请参考图3,是本发明第二实施例所提供的一种基于大数据的肺癌筛查方法的流程图, 如图2所示,该方法包括:
S201,采集终端采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据和 检测数据进行上传;
S202,服务器对采集的所述资料数据和检测数据进行数据预处理,所述预处理包括去除 所述资料数据和检测数据中的无效数据以得到有效数据,并对所述有效数据进行分类和格式 转换。因为采集到的原始数据很大程度上都是不完整或者不一致的,这会给后续的数据分析 和数据挖掘带来的极大的麻烦,导致无法直接进行数据挖掘或挖掘结果差强人意,所以十分 有必要对数据进行预处理。
S203,服务器接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据库;
S204,服务器对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系 数据,并对所述关系数据进行学习、训练以得到肺癌风险预测模型;
S205,服务器通过所述肺癌风险预测模型对所述检测数据进行处理,得出需筛查患者的 各致病因素与肺癌之间的参考数据;
S206,服务器将所述参考数据发送给人机界面进行可视化显示。
需要说明的是,步骤S201、S203至S206的具体处理过程请参考步骤S101至S105。
在本实施例中,通过在建立数据库之前进行数据预处理,在提高数据收集的准确性、有 效性和降低相应服务器的处理负荷的同时,还为后续模型的准确建立提供了相应的数据基 础。预测阶段,除了借助预测模型的预测结果,创新地引入贝叶斯概率,来挖掘数据中的潜 在规律。模型预测和贝叶斯概率两者结合,为肺癌前期的筛查提供科学的参考依据。
进一步地,所述参考数据包括以下计算方法:
参考数据=ex/(1+ex);其中,e是自然对数,
x=-6.8272+(0.0391×年龄)+(0.7917×吸烟史)+(1.3388×恶性肿瘤)
+(0.1274×直径)+(1.0407×毛刺征)+(0.7838×位置)
患者有吸烟史,则吸烟史标记为1,否则标记为0;如果患者有大于五年的胸腔外恶性 肿瘤史,则恶性肿瘤项标记为1,否则标记为0;如果肺部结节边缘有毛刺,则毛刺征标记为1,否则标记为0;如果肺部结节位于上叶,则位置项标记为1,否则为0,直径为肺部结 节的直径,单位为毫米。
进一步地,所述参考数据还包括以下计算方法:
若需筛查的患者的检测数据中患者的肺磨玻璃样变数据(GGO)小于百分之五十时,参 考数据=ex/(1+ex);其中,e是自然对数,
x=7.442+(0.051×年龄)+(0.711×症状表现)+(0.066×血清总蛋白)
+(0.032×直径)+(1.071×分叶)+(1.220×钙化灶)
其中,血清总蛋白单位为g/L;症状表现、分叶、钙化灶有相应症状若出现时,则相应 项标记为1,否则标记为0;
若需筛查的患者的检测数据中患者的肺磨玻璃样变数据(GGO)大于百分之五十时,参 考数据=ex/(1+ex);其中,e是自然对数,
x=-6.192+(-0.924×性别)+(0.042×FEV1占预计值百分比)
+(0.131×直径)+(1.071×分叶)+(2.424×钙化灶)
其中,FEV1表示肺功能检测值,分叶、钙化灶有相应症状若出现时,则相应项标记为1, 否则标记为0。
进一步地,参考图4所示,本发明中采用可视化展示参考数据,使其能够为医生基于事 实所做的决策提供支持。数据可视化,是指将相对晦涩的数据通过可视的、交互的方式进行 展示,从而形象、直观地表达数据蕴含的信息和规律。通俗地说,可视化设计的目的是“让 数据说话”,用图形去讲述数据的联系。相比传统的用表格或文档展现数据的方式,可视化 能将数据以更加直观的方式展现出来,使数据更加客观、更具说服力。例如图4所示,可以 清晰看出症状A与症状E与肺癌病情有关,而症状D与肺癌基本无关。
本发明通过多种方式,筛查收集确诊肺癌患者的相关数据,建成支持多中心研究的可挖 掘、可拓展的肺癌病例数据库,实现对肺癌专科病案资料的标准化和要素化管理,建设肺癌 数据库。并在此基础之上进行数据挖掘及分析,开展数据应用,根据数据的规律,帮助医生 做出更明智的决策,从而更好地适应不同病情。同时塑造病例数据交流、共享的平台,在临 床、科研和教学中应用,也可指导社区医疗机构对社区肺癌患者进行监测和防治;通过大数 据挖掘和数据可视化,对筛查结果分层分析并形象化展示,对早期肺癌筛查十分有效,对制 定符合我国实际国情的高危人群筛查标准具有重要的意义。
最后需要说明的是,上述描述为本发明的优选实施例,本领域的普通技术人员在本发明 的启示下,在不违背本发明宗旨及权利要求的前提下,可以做出多种类似的表示,这样的变 换均落入本发明的保护范围之内。

Claims (7)

1.一种基于大数据的肺癌筛查系统,其特征在于,包括采集终端、服务器和人机界面;
所述采集终端用于采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据和检测数据进行上传;
所述服务器用于接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据库;对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据,并对所述关系数据进行学习、训练以得到肺癌风险预测模型;通过所述肺癌风险预测模型对所述检测数据进行处理,得出需筛查患者的各致病因素与肺癌之间的参考数据;将所述参考数据发送给人机界面;
所述人机界面用于通过可视化的方式进行展示所述参考数据。
2.根据权利要求1所述的一种基于大数据的肺癌筛查系统,其特征在于,还包括预处理模块,所述预处理模块用于去除所述资料数据和检测数据中的无效数据以得到有效数据,并对所述有效数据进行分类和格式转换。
3.一种基于大数据的肺癌筛查方法,其特征在于,应用于权利要求2所述的一种基于大数据的肺癌筛查系统,所述方法包括以下步骤:
采集终端采集肺癌患者资料数据和需筛查患者的检测数据,并将所述资料数据和检测数据进行上传;
服务器接收所述资料数据和检测数据,并根据所述资料数据建立肺癌患者数据库;
服务器对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据,并对所述关系数据进行学习、训练以得到肺癌风险预测模型;
服务器通过所述肺癌风险预测模型对所述检测数据进行处理,得出需筛查患者的各致病因素与肺癌之间的参考数据;
服务器将所述参考数据发送给人机界面进行可视化显示。
4.根据权利要求3所述的一种基于大数据的肺癌筛查方法,其特征在于,所述方法还包括:服务器对采集的所述资料数据和检测数据进行数据预处理,所述预处理包括去除所述资料数据和检测数据中的无效数据以得到有效数据,并对所述有效数据进行分类和格式转换。
5.根据权利要求4所述的一种基于大数据的肺癌筛查方法,其特征在于,服务器对所述肺癌患者数据库进行数据分析,得出肺癌与各致病因素之间的关系数据,具体包括以下步骤:
服务器获取肺癌患者数据库中与肺癌疾病相关的各种症状;
服务器根据肺癌患者数据库中的所有样本信息,分别统计每种症状出现的概率;
服务器根据肺癌患者数据库中的肺癌样本信息,分别统计当某一症状出现时,肺癌疾病出现的概率。
6.根据权利要求5所述的一种基于大数据的肺癌筛查方法,其特征在于,所述参考数据包括以下计算方法:
参考数据=ex/(1+ex);其中,e是自然对数,
x=-6.8272+(0.0391×年龄)+(0.7917×吸烟史)+(1.3388×恶性肿瘤)+(0.1274×直径)+(1.0407×毛刺征)+(0.7838×位置)
患者有吸烟史,则吸烟史标记为1,否则标记为0;如果患者有大于五年的胸腔外恶性肿瘤史,则恶性肿瘤项标记为1,否则标记为0;如果肺部结节边缘有毛刺,则毛刺征标记为1,否则标记为0;如果肺部结节位于上叶,则位置项标记为1,否则为0,直径为肺部结节的直径,单位为毫米。
7.根据权利要求6所述的一种基于大数据的肺癌筛查方法,其特征在于,所述参考数据还包括以下计算方法:
若需筛查的患者的检测数据中患者的肺磨玻璃样变数据(GGO)小于百分之五十时,参考数据=ex/(1+ex);其中,e是自然对数,
x=7.442+(0.051×年龄)+(0.711×症状表现)+(0.066×血清总蛋白)+(0.032×直径)+(1.071×分叶)+(1.220×钙化灶)
血清总蛋白单位为g/L;症状表现、分叶、钙化灶有相应症状若出现时,则相应项标记为1,否则标记为0;
若需筛查的患者数据中患者的肺磨玻璃样变数据(GGO)大于百分之五十时,参考数据=ex/(1+ex);其中,e是自然对数,FEV1表示肺功能检测值,
x=-6.192+(-0.924×性别)+(0.042×FEV1占预计值百分比)+(0.131×直径)+(1.071×分叶)+(2.424×钙化灶)
分叶、钙化灶有相应症状若出现时,则相应项标记为1,否则标记为0。
CN201810361140.XA 2018-04-20 2018-04-20 一种基于大数据的肺癌筛查系统及方法 Pending CN108520778A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810361140.XA CN108520778A (zh) 2018-04-20 2018-04-20 一种基于大数据的肺癌筛查系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810361140.XA CN108520778A (zh) 2018-04-20 2018-04-20 一种基于大数据的肺癌筛查系统及方法

Publications (1)

Publication Number Publication Date
CN108520778A true CN108520778A (zh) 2018-09-11

Family

ID=63428921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810361140.XA Pending CN108520778A (zh) 2018-04-20 2018-04-20 一种基于大数据的肺癌筛查系统及方法

Country Status (1)

Country Link
CN (1) CN108520778A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109903846A (zh) * 2019-02-21 2019-06-18 吉林禾熙科技开发有限公司 基于医疗大数据的肺癌筛查系统及方法
CN109979554A (zh) * 2019-04-08 2019-07-05 皮敏 一种临床病例数据采集系统及采集方法
CN110047578A (zh) * 2019-04-11 2019-07-23 清华大学 病理影像处理装置
CN110097930A (zh) * 2019-04-04 2019-08-06 华南理工大学 精神分裂症医学数据处理方法、装置、系统、服务器及介质
CN110211699A (zh) * 2019-06-12 2019-09-06 湖南智超医疗科技有限公司 一种骨质疏松智能筛查系统
CN110246584A (zh) * 2019-06-13 2019-09-17 吉林大学第一医院 一种肺癌样本的预测评估方法和系统
CN110767310A (zh) * 2019-11-06 2020-02-07 西安交通大学医学院第二附属医院 一种基于大数据的肺癌筛查系统
CN110957014A (zh) * 2019-10-11 2020-04-03 上海市胸科医院 一种肺癌早期筛查信息管理系统
CN111028947A (zh) * 2019-12-02 2020-04-17 布谷鸟吉因健康科技(北京)有限公司 一种癌症预防健康管理方法及系统
CN111276203A (zh) * 2020-01-20 2020-06-12 和宇健康科技股份有限公司 一种肿瘤自动登记分析方法及系统
CN111524594A (zh) * 2020-06-12 2020-08-11 山东大学 目标人群血液系统恶性肿瘤筛查系统
CN110223775B (zh) * 2019-07-15 2021-01-01 四川大学华西医院 一种肺癌风险预测系统
CN110223776B (zh) * 2019-07-15 2021-01-01 四川大学华西医院 一种肺癌风险预测系统
CN112349425A (zh) * 2020-02-10 2021-02-09 胡秋明 新型冠状病毒感染肺炎人工智能快速筛查系统
CN113610829A (zh) * 2021-08-17 2021-11-05 大连大学附属中山医院 一种基于人工智能检测筛查肺结节的系统
CN117877737A (zh) * 2024-03-12 2024-04-12 北方健康医疗大数据科技有限公司 一种原发性肺癌风险预测模型的构建方法、系统及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247887A (zh) * 2017-07-27 2017-10-13 点内(上海)生物科技有限公司 基于人工智能帮助肺癌筛查的方法及系统
CN107292114A (zh) * 2017-06-28 2017-10-24 中日友好医院 一种孤立性肺结节恶性概率预测模型的建立方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292114A (zh) * 2017-06-28 2017-10-24 中日友好医院 一种孤立性肺结节恶性概率预测模型的建立方法
CN107247887A (zh) * 2017-07-27 2017-10-13 点内(上海)生物科技有限公司 基于人工智能帮助肺癌筛查的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张满: "孤立性肺结节良恶性预测模型的建立", 《中国博士学位论文全文数据库》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109903846A (zh) * 2019-02-21 2019-06-18 吉林禾熙科技开发有限公司 基于医疗大数据的肺癌筛查系统及方法
CN110097930A (zh) * 2019-04-04 2019-08-06 华南理工大学 精神分裂症医学数据处理方法、装置、系统、服务器及介质
CN109979554A (zh) * 2019-04-08 2019-07-05 皮敏 一种临床病例数据采集系统及采集方法
CN110047578A (zh) * 2019-04-11 2019-07-23 清华大学 病理影像处理装置
CN110211699A (zh) * 2019-06-12 2019-09-06 湖南智超医疗科技有限公司 一种骨质疏松智能筛查系统
CN110246584A (zh) * 2019-06-13 2019-09-17 吉林大学第一医院 一种肺癌样本的预测评估方法和系统
CN110223776B (zh) * 2019-07-15 2021-01-01 四川大学华西医院 一种肺癌风险预测系统
CN110223775B (zh) * 2019-07-15 2021-01-01 四川大学华西医院 一种肺癌风险预测系统
CN110957014A (zh) * 2019-10-11 2020-04-03 上海市胸科医院 一种肺癌早期筛查信息管理系统
CN110957014B (zh) * 2019-10-11 2023-09-26 上海市胸科医院 一种肺癌早期筛查信息管理系统
CN110767310A (zh) * 2019-11-06 2020-02-07 西安交通大学医学院第二附属医院 一种基于大数据的肺癌筛查系统
CN111028947A (zh) * 2019-12-02 2020-04-17 布谷鸟吉因健康科技(北京)有限公司 一种癌症预防健康管理方法及系统
CN111276203A (zh) * 2020-01-20 2020-06-12 和宇健康科技股份有限公司 一种肿瘤自动登记分析方法及系统
CN111276203B (zh) * 2020-01-20 2024-03-01 和宇健康科技股份有限公司 一种肿瘤自动登记分析方法及系统
CN112349425A (zh) * 2020-02-10 2021-02-09 胡秋明 新型冠状病毒感染肺炎人工智能快速筛查系统
CN111524594A (zh) * 2020-06-12 2020-08-11 山东大学 目标人群血液系统恶性肿瘤筛查系统
CN113610829A (zh) * 2021-08-17 2021-11-05 大连大学附属中山医院 一种基于人工智能检测筛查肺结节的系统
CN117877737A (zh) * 2024-03-12 2024-04-12 北方健康医疗大数据科技有限公司 一种原发性肺癌风险预测模型的构建方法、系统及装置

Similar Documents

Publication Publication Date Title
CN108520778A (zh) 一种基于大数据的肺癌筛查系统及方法
KR101873926B1 (ko) 빅데이터 기반 의료자문 서비스 제공 방법
CN111916215B (zh) 一种群集性/慢性疾病早期自动报警、初步特征分析与风险评估系统
CN110335647A (zh) 一种临床数据标准化系统及标准化数据采集方法
CN107610779A (zh) 疾病评价及患病风险评估方法及装置
Bozkurt et al. Using automatically extracted information from mammography reports for decision-support
Waghade et al. A comprehensive study of healthcare fraud detection based on machine learning
CN106650256A (zh) 一种分子诊疗精准医学平台
CN105528526A (zh) 一种基于中医药传承与大数据挖掘的生命周期动态健康管理系统
CN112216402A (zh) 基于人工智能的疫情预测方法、装置、计算机设备及介质
CN112365976B (zh) 一种基于迁移学习的复合病种临床路径构建方法及系统
CN108206056A (zh) 一种鼻咽癌人工智能辅助诊疗决策终端
CN117271804B (zh) 一种共病特征知识库生成方法、装置、设备及介质
CN114121295A (zh) 一种知识图谱驱动的肝癌诊疗方案推荐系统的构建方法
Li et al. BCRAM: A social-network-inspired breast cancer risk assessment model
CN116469571A (zh) 一种真实世界数据的专病图谱的构建方法及系统
KR101295785B1 (ko) 유전변이 데이터 베이스 구축 장치 및 방법
CN115458108A (zh) 一种融合多元技术的可视化糖尿病大数据智能分析系统
Kashyap et al. A deep learning method to detect opioid prescription and opioid use disorder from electronic health records
CN109192312A (zh) 一种心力衰竭患者不良事件智能管理系统及方法
Liu et al. A scoping review of the clinical application of machine learning in data-driven population segmentation analysis
CN113223734A (zh) 基于算法、医学影像和大数据的疾病诊断和大健康管理平台
CN113130085A (zh) 一种基于大数据的5g智能感控预测系统
CN108320797A (zh) 一种鼻咽癌数据库及基于所述数据库的综合诊疗决策方法
CN111489832A (zh) 一种用于生物医药研发的可视化数据处理平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20221018

AD01 Patent right deemed abandoned