CN116343980B - 一种基于智慧医疗复诊随访数据处理方法及系统 - Google Patents
一种基于智慧医疗复诊随访数据处理方法及系统 Download PDFInfo
- Publication number
- CN116343980B CN116343980B CN202310618458.2A CN202310618458A CN116343980B CN 116343980 B CN116343980 B CN 116343980B CN 202310618458 A CN202310618458 A CN 202310618458A CN 116343980 B CN116343980 B CN 116343980B
- Authority
- CN
- China
- Prior art keywords
- information
- data
- follow
- patient
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012552 review Methods 0.000 title claims abstract description 60
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 58
- 238000003745 diagnosis Methods 0.000 claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 49
- 238000004458 analytical method Methods 0.000 claims abstract description 36
- 238000003066 decision tree Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 10
- 201000010099 disease Diseases 0.000 claims abstract description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 39
- 238000004140 cleaning Methods 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 229940079593 drug Drugs 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 7
- 206010067484 Adverse reaction Diseases 0.000 claims description 6
- 230000006838 adverse reaction Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000000913 Kidney Calculi Diseases 0.000 description 1
- 206010029148 Nephrolithiasis Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pathology (AREA)
- Computational Linguistics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种基于智慧医疗复诊随访数据处理方法及系统,涉及医疗技术领域,包括获取待复诊患者的历史信息;接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理;基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征;对所述历史信息和所述关键语义特征进行关联,并采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析。本发明的有益效果为针对单个专病人群生成个性化随访计划及内容,更好的对诊后病情过程跟踪,医生对患者能够进行有效的管理和调整药方,可以提高补充复诊随访的效率,提升了随访内容精准性、随访工作效率。
Description
技术领域
本发明涉及医疗技术领域,具体而言,涉及基于智慧医疗复诊随访数据处理方法、系统、设备及可读存储介质。
背景技术
通过随访可以方便医生针对术后病人、特殊病人群、以及慢性疾病等进行长期跟踪观察,使得医生可以及时了解病人的病情变化并给予治疗建议,对病情复发和恶化的病人可安排重新住院治疗。另一方面,通过随访任务提醒医生电话回访患者后将信息记录记录在系统中;互联网医院随访数据处理系统主要是配置随访计划后,将随访任务包括表单和患教文章等通过医患即时消息会话等定期发送计划给患者,通过患者填写表单采集信息,通过发送患教文章进行患者指导和关怀等。
由于医生接诊的患者较多,无法短时间内将患者之前的病历以及随访的数据进行对比整理,无法更好的对诊后病情进行过程跟踪,因此导致医生对患者的管理和调整药方效果不佳,为此需要进行改进。
发明内容
本发明的目的在于提供一种基于智慧医疗复诊随访数据处理方法、系统、设备及可读存储介质,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
第一方面,本申请提供了一种基于智慧医疗复诊随访数据处理方法,其特征在于,包括:
获取待复诊患者的历史信息,所述历史信息包括不良反应记录、CT图像、用药数据和诊疗指导;
接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理;
基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征;
对所述历史信息和所述关键语义特征进行关联,并采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,得到分析数据,所述数据为有关于进行辅助诊断的参考信息,并将所述参考信息加载至医疗复诊患者档案中,在随访日期到达时在待复诊患者的页面中进行展示。
优选地,所述提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理,其中包括:
根据每个所述待复诊患者所对应的科室医生设定的规则,获取所述待复诊信息表单中的主要信息和附属信息;
基于所有所述附属信息,获取每个主要信息的多维度数据,所述附属信息包括所述待复诊患者的相关信息,其中包括待复诊患者的病例案号、诊断名称、诊断疾病编码以及出院时间,所述主要信息包括待复诊患者的基本信息、手术信息以及治疗信息;所述多维度数据标识了该主要信息与所有附属信息的有或无的关系;
根据每个所述主要信息对应的多维度数据中,获得每个所述主要信息与所有所述附属信息的相关度;
根据每个主要信息与所有附属信息的相关度,进行模糊聚类,获得聚类结果。
优选地,所述基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征,其中包括:
对聚类处理后的结果进行数据清洗,其中包括根据预设的清洗规则对CT图像进行清洗,得到清洗结果;
对所述清洗结果中的数据进行随机抽取,并对抽取到的数据进行标注;
基于BERT预训练语言模型,将标注后的数据输出至BERT模型中的分类模块,进行自主机器学习训练,得到关键语义特征。
优选地,所述采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,其中包括:
获取第一信息,所述第一信息包括科室医生分类标准;
基于待复诊患者填写的待复诊信息表单,筛选出与所述待复诊信息表单相类似的表单所对应的样例数据;
基于决策树的智能辅助诊断算法和所述第一信息,对所述样例数据进行分析,其中包括选取最优属性后,根据此属性的取值,对样例数据所在的集合进行划分,得到子数据集,再将每个子数据集当作完整数据集,迭代进行最优属性的选取,直到数据集中样本都是同一个分类标签时,决策树生成过程结束。
优选地,所述对所述历史信息和所述关键语义特征进行关联,之后包括:
根据皮尔逊相关系数,对关联之后的结果进行提取,得到提取后新的数据信息;
根据预设的医疗复诊体系,构建医疗复诊随访相关体系;
基于所述医疗复诊随访相关体系,计算提取后新的数据信息的相关性和敏感性,并依据预设条件对新的数据信息进行筛选。
第二方面,本申请还提供了一种基于智慧医疗复诊随访数据处理系统,包括获取模块、处理模块、训练模块和分析模块,其中:
获取模块:用于获取待复诊患者的历史信息,所述历史信息包括不良反应记录、CT图像、用药数据和诊疗指导;
处理模块:用于接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理;
训练模块:用于基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征;
分析模块:用于对所述历史信息和所述关键语义特征进行关联,并采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,生成参考信息并加载至医疗复诊患者档案中,在随访日期到达时在待复诊患者的页面中进行展示。
第三方面,本申请还提供了一种基于智慧医疗复诊随访数据处理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述基于智慧医疗复诊随访数据处理方法的步骤。
第四方面,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于基于智慧医疗复诊随访数据处理方法的步骤。
本发明的有益效果为:本发明采用决策树算法在支持这种分类方法的同时,也支持自主学习分析,可以从待复诊患者的随访数据中加以训练,在实际应用中,做到了安全准确的诊断,又给未来的智能医疗做出了重要的作用;能够针对单个专病人群生成个性化随访计划及内容,更好的对诊后病情过程跟踪,医生对患者能够进行有效的管理和调整药方,可以提高补充复诊随访的效率,提升了随访内容精准性、随访工作效率;本发明收集每个用户数据的主要信息和附属信息,继而可以多维度多角度的对待复诊患者进行分析描述,根据后续预设的模糊聚类算法对用户进行多维度多角度聚类,进行迭代,避免了从单一维度对用户进行聚类,获得了符合实际情况的聚类结果,提高了用户聚类精准度。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中所述的基于智慧医疗复诊随访数据处理方法流程示意图;
图2为本发明实施例中所述的基于智慧医疗复诊随访数据处理系统结构示意图;
图3为本发明实施例中所述的基于智慧医疗复诊随访数据处理设备结构示意图。
图中:701、获取模块;702、处理模块;7021、第一获取单元;7022、第二获取单元;7023、获得单元;7024、聚类单元;703、训练模块;7031、清洗单元;7032、标注单元;7033、输出训练单元;704、分析模块;7041、第三获取单元;7042、筛选单元;7043、分析单元;7044、提取单元;7045、构建单元;7046、计算单元;800、基于智慧医疗复诊随访数据处理设备;801、处理器;802、存储器;803、多媒体组件;804、I/O接口;805、通信组件。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本实施例提供了一种基于智慧医疗复诊随访数据处理方法。
参见图1,图中示出了本方法包括步骤S100、步骤S200、步骤S300和步骤S400。
S100、获取待复诊患者的历史信息,所述历史信息包括不良反应记录、CT图像、用药数据和诊疗指导。
可以理解的是,在本步骤中,需要了解待复诊患者的历史信息才能更好的将复诊随访数据进行处理。
S200、接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理。
可以理解的是,在本S200步骤中包括S201、S202、S203和S204,其中:
S201、根据每个所述待复诊患者所对应的科室医生设定的规则,获取所述待复诊信息表单中的主要信息和附属信息;
S202、基于所有所述附属信息,获取每个主要信息的多维度数据,所述附属信息包括所述待复诊患者的相关信息,其中包括待复诊患者的病例案号、诊断名称、诊断疾病编码以及出院时间,所述主要信息包括待复诊患者的基本信息、手术信息以及治疗信息;所述多维度数据标识了该主要信息与所有附属信息的有或无的关系;
需说明的是,每个信息表单中有主要信息以及附属信息,需要把每一个关于主要信息的多个维度进行获取,并标识哪些是与主要信息有关,哪些是无关冗杂信息进行剔除。
S203、根据每个所述主要信息对应的多维度数据中,获得每个所述主要信息与所有所述附属信息的相关度;
可以理解的是上述步骤中的关联度值的计算公式如下:
其中:为自变量t对应的关联度;t为母序列的数据种类;h为子序列的数据种类;m为子序列数据的样本总数量;/>为子序列数据f相对于因变量h的关系系数。
S204、根据每个主要信息与所有附属信息的相关度,进行模糊聚类,获得聚类结果。
需说明的是,由于将用户群之间的相似程度定义为目标函数,在聚类的过程中,始终朝着目标函数下降的方向调整身份属性特征向量的权重,因此本方案将无监督的聚类变成了有监督的聚类、聚类效果更好。
S300、基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征。
可以理解的是,在本S300步骤中包括S301、S302和S303,其中:
S301、对聚类处理后的结果进行数据清洗,其中包括根据预设的清洗规则对CT图像进行清洗,得到清洗结果;
需要说明的是,Kettle是清洗工具,主要由转换和作业两个部分完成;转换主要是用于从数据源进行移动和转换工作,而作业是负责高级别的工作,包括转换、通知和传输文件;清洗的规则主要根据CT图像进行清洗,例如清洗报告中的肾结石、或者肺部结节数据。
S302、对所述清洗结果中的数据进行随机抽取,并对抽取到的数据进行标注;
需要说明的是,对样本进行观察并随机抽取,样本中关于病理的分析描述不同,不同影像数据中也存在这差异,需要对这些差异数据进行标注,方便进行下一步的模型训练,模型训练进行自动机器学习。
S303、基于BERT预训练语言模型,将标注后的数据输出至BERT模型中的分类模块,进行自主机器学习训练,得到关键语义特征。
在本步骤中,利用BERT预训练模型以句编码的形式对字进行编码。本实施例中的
BERT预训练模型包含Token Embeddings和Position Embeddings两个部分。Token
Embedding通过查表的方式获得嵌入向量,Position Embedding用于对字的位置进行编码。
通过BERT预训练模型输出每个字的嵌入向量,如汉字的字嵌入向量表示为。
S400、对所述历史信息和所述关键语义特征进行关联,并采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,生成参考信息并加载至医疗复诊患者档案中,在随访日期到达时在待复诊患者的页面中进行展示。
可以理解的是,在本S400步骤中采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析中包括S401、S402和S403,其中:
S401、获取第一信息,所述第一信息包括科室医生分类标准;
需要说明的是,具体分类标准由科室医生给出,例如喝酒不能吃头孢,这是客观没有异议的,诸如此类的分类标准。
S402、基于待复诊患者填写的待复诊信息表单,筛选出与所述待复诊信息表单相类似的表单所对应的样例数据;
在本实施例中,系统可以根据患者填写的随访内容中的内容自动分析出类似于样例的数据,通过医生给出的标准加以分析,辅助医生对患者做出详细的诊断。
S403、基于决策树的智能辅助诊断算法和所述第一信息,对所述样例数据进行分析,其中包括选取最优属性后,根据此属性的取值,对样例数据所在的集合进行划分,得到子数据集,再将每个子数据集当作完整数据集,迭代进行最优属性的选取,直到数据集中样本都是同一个分类标签时,决策树生成过程结束。
需要说明的是,决策树算法在支持这种分类方法的同时,也支持自主学习分析,可以从待复诊患者的随访数据中加以训练,在实际应用中,做到了安全准确的诊断,又给未来的智能医疗做出了重要的作用,在本实施例中,决策树算法有三种,包括ID3算法、C4.5算法和CART算法。
可以理解的是,在本S403步骤之后包括S404、S405和S406,其中:
S404、根据皮尔逊相关系数,对关联之后的结果进行提取,得到提取后新的数据信息;
S405、根据预设的医疗复诊体系,构建医疗复诊随访相关体系;
需要说明的是,采用皮尔逊相关系数可以提取到用来测量两个变量之间相关性,将相互关联的数据信息提取出来为了更好的对数据进行分析;针对预设的医疗复诊体系建立起符合自身的随访体系,风险处理的相关度是两个变量的关联 ,根据第i个样本值、样本数量和pearson相关系数,利用皮尔逊相关系数来判断两两风险处理指标的相关度。
需要说明的是,医疗复诊随访相关体系中可包含用户管理模块以及随访记录模块,其中用户管理模块可以分为管理员、患者和医生,主要功能就是展示、管理登进系统的用户信息和分配用户的角色。每个科室的医生和患者之间可以互相查看个人信息,但是患者之间无法查看信息;随访记录模块可用于医生查看结果、给予反馈的信息的流程,随访记录中还有特征板块,特征板块主要是针对医生问诊后对患者的病情或者特征进行标注的板块,因为医生所负责的患者较多时,所起到的作用为可提示医生使用关键字记起是哪个患者。随访记录中医生可设置需要隔多久在APP通知或者系统提醒下做常规检查,或是提醒患者当出现什么症状后相对应需要停用或者启用哪些药物,或是提醒待复诊患者及时复诊。
S406、基于所述医疗复诊随访相关体系,计算提取后新的数据信息的相关性和敏感性,并依据预设条件对新的数据信息进行筛选。
需要说明的是,采用变差系数、指标的标准差、指标的平均值和样本数量进行计算,得到监测处理指标的敏感性和相关性;对新数据信息进行重新筛选,将会得到与历史信息更为符合的关联信息,这样生成的报告或者加载的信息才更为有效。
如图2所示,本实施例提供了一种基于智慧医疗复诊随访数据处理系统,参见图2所述系统包括获取模块701、处理模块702、训练模块703和分析模块704,其中:
获取模块701:用于获取待复诊患者的历史信息,所述历史信息包括不良反应记录、CT图像、用药数据和诊疗指导;
处理模块702:用于接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理;
训练模块703:用于基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征;
分析模块704:用于对所述历史信息和所述关键语义特征进行关联,并采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,生成参考信息并加载至医疗复诊患者档案中,在随访日期到达时在待复诊患者的页面中进行展示。
具体地,所述处理模块702,其中包括第一获取单元7021、第二获取单元7022、获得单元7023和聚类单元7024,其中:
第一获取单元7021:用于根据每个所述待复诊患者所对应的科室医生设定的规则,获取所述待复诊信息表单中的主要信息和附属信息;
第二获取单元7022:用于基于所有所述附属信息,获取每个主要信息的多维度数据,所述附属信息包括所述待复诊患者的相关信息,其中包括待复诊患者的病例案号、诊断名称、诊断疾病编码以及出院时间,所述主要信息包括待复诊患者的基本信息、手术信息以及治疗信息;所述多维度数据标识了该主要信息与所有附属信息的有或无的关系;
获得单元7023:用于根据每个所述主要信息对应的多维度数据中,获得每个所述主要信息与所有所述附属信息的相关度;
聚类单元7024:用于根据每个主要信息与所有附属信息的相关度,进行模糊聚类,获得聚类结果。
具体地,所述训练模块703,其中包括清洗单元7031、标注单元7032和输出训练单元7033,其中:
清洗单元7031:用于对聚类处理后的结果进行数据清洗,其中包括根据预设的清洗规则对CT图像进行清洗,得到清洗结果;
标注单元7032:用于对所述清洗结果中的数据进行随机抽取,并对抽取到的数据进行标注;
输出训练单元7033:用于基于BERT预训练语言模型,将标注后的数据输出至BERT模型中的分类模块,进行自主机器学习训练,得到关键语义特征。
具体地,所述分析模块704,包括第三获取单元7041、筛选单元7042和分析单元7043,其中:
第三获取单元7041:用于获取第一信息,所述第一信息包括科室医生分类标准;
筛选单元7042:用于基于待复诊患者填写的待复诊信息表单,筛选出与所述待复诊信息表单相类似的表单所对应的样例数据;
分析单元7043:用于基于决策树的智能辅助诊断算法和所述第一信息,对所述样例数据进行分析,其中包括选取最优属性后,根据此属性的取值,对样例数据所在的集合进行划分,得到子数据集,再将每个子数据集当作完整数据集,迭代进行最优属性的选取,直到数据集中样本都是同一个分类标签时,决策树生成过程结束。
所述分析模块704,之后包括提取单元7044、构建单元7045和计算单元7046,其中:
提取单元7044:用于根据皮尔逊相关系数,对关联之后的结果进行提取,得到提取后新的数据信息;
构建单元7045:用于根据预设的医疗复诊体系,构建医疗复诊随访相关体系;
计算单元7046:用于基于所述医疗复诊随访相关体系,计算提取后新的数据信息的相关性和敏感性,并依据预设条件对新的数据信息进行筛选。
需要说明的是,关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
对应于上面的方法实施例,本实施例中还提供了一种基于智慧医疗复诊随访数据处理设备,下文描述的一种基于智慧医疗复诊随访数据处理设备与上文描述的一种基于智慧医疗复诊随访数据处理方法可相互对应参照。
图3是根据示例性实施例示出的一种基于智慧医疗复诊随访数据处理设备800的框图。如图3所示,该基于智慧医疗复诊随访数据处理设备800包括:处理器801和存储器802。该基于智慧医疗复诊随访数据处理设备800还包括多媒体组件803,I/O接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该基于智慧医疗复诊随访数据处理设备800的整体操作,以完成上述的基于智慧医疗复诊随访数据处理方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该基于智慧医疗复诊随访数据处理设备800的操作,这些数据例如可以包括用于在该基于智慧医疗复诊随访数据处理设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘、鼠标或按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该基于智慧医疗复诊随访数据处理设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi、蓝牙、近场通信(Near FieldCommunication,简称NFC)、2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块、蓝牙模块或NFC模块。
在一示例性实施例中,基于智慧医疗复诊随访数据处理设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital SignalProcessing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的基于智慧医疗复诊随访数据处理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的基于智慧医疗复诊随访数据处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由基于智慧医疗复诊随访数据处理设备800的处理器801执行以完成上述的基于智慧医疗复诊随访数据处理方法。
相应于上面的方法实施例,本实施例中还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种基于智慧医疗复诊随访数据处理方法可相互对应参照。
可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的基于智慧医疗复诊随访数据处理方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (6)
1.一种基于智慧医疗复诊随访数据处理方法,其特征在于,包括:
获取待复诊患者的历史信息,所述历史信息包括不良反应记录、CT图像、用药数据和诊疗指导;
接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理;
基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征;
对所述历史信息和所述关键语义特征进行关联,得到关联信息;利用决策树的智能辅助诊断算法对所述关联信息进行处理,得到分析数据,所述分析数据用于为辅助诊断提供参考信息;
其中,基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征,包括:
对聚类处理后的结果进行数据清洗,其中包括根据预设的清洗规则对CT图像进行清洗,得到清洗结果;
对所述清洗结果中的数据进行随机抽取,并对抽取到的数据进行标注;
基于BERT预训练语言模型,将标注后的数据输出至BERT模型中的分类模块,进行自主机器学习训练,得到关键语义特征,其中BERT预训练语言模型以句编码的形式对字进行编码,包括Token Embeddings和Position Embeddings两个部分,Token Embedding通过查表的方式获得嵌入向量,Position Embedding用于对字的位置进行编码;
其中,对所述历史信息和所述关键语义特征进行关联,之后包括:
根据皮尔逊相关系数,对关联之后的结果进行提取,得到提取后新的数据信息;
根据预设的医疗复诊体系,构建医疗复诊随访相关体系,其中包括:针对预设的医疗复诊体系建立起符合自身的随访体系,风险处理的相关度是两个变量的关联 ,根据第i个样本值、样本数量和pearson相关系数,利用皮尔逊相关系数来判断两两风险处理指标的相关度;
基于所述医疗复诊随访相关体系,计算提取后新的数据信息的相关性和敏感性,其中包括采用变差系数、指标的标准差、指标的平均值和样本数量进行计算,并依据预设条件对新的数据信息进行筛选。
2.根据权利要求1所述的基于智慧医疗复诊随访数据处理方法,其特征在于,所述提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理,其中包括:
根据每个所述待复诊患者所对应的科室医生设定的规则,获取所述待复诊信息表单中的主要信息和附属信息;
基于所有所述附属信息,获取每个主要信息的多维度数据,所述附属信息包括所述待复诊患者的相关信息,其中包括待复诊患者的病例案号、诊断名称、诊断疾病编码以及出院时间,所述主要信息包括待复诊患者的基本信息、手术信息以及治疗信息;所述多维度数据标识了该主要信息与所有附属信息的有或无的关系;
根据每个所述主要信息对应的多维度数据中,获得每个所述主要信息与所有所述附属信息的相关度;
根据每个主要信息与所有附属信息的相关度,进行模糊聚类,获得聚类结果。
3.根据权利要求1所述的基于智慧医疗复诊随访数据处理方法,其特征在于,采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,得到分析数据,其中包括:
获取第一信息,所述第一信息包括科室医生分类标准;
基于待复诊患者填写的待复诊信息表单,筛选出与所述待复诊信息表单相类似的表单所对应的样例数据;
基于决策树的智能辅助诊断算法和所述第一信息,对所述样例数据进行分析,得到分析数据,其中进行决策树的过程为选取最优属性后,根据此属性的取值,对样例数据所在的集合进行划分,得到子数据集,再将每个子数据集当作完整数据集,迭代进行最优属性的选取,直到数据集中样本都是同一个分类标签时,决策树生成过程结束。
4.一种基于智慧医疗复诊随访数据处理系统,其特征在于,包括:
获取模块:用于获取待复诊患者的历史信息,所述历史信息包括不良反应记录、CT图像、用药数据和诊疗指导;
处理模块:用于接收待复诊患者填写的待复诊信息表单,提取所述待复诊信息表单中的关键信息并对所述关键信息进行聚类处理;
训练模块:用于基于BERT预训练语言模型,对聚类处理后的结果进行训练,得到关键语义特征;
分析模块:用于对所述历史信息和所述关键语义特征进行关联,并采用决策树的智能辅助诊断算法,对关联信息进行辅助诊断分析,得到分析数据,所述分析数据为有关于进行辅助诊断的参考信息,并将所述参考信息加载至医疗复诊患者档案中;
其中训练模块,包括清洗单元、标注单元和输出训练单元:
清洗单元:用于对聚类处理后的结果进行数据清洗,其中包括根据预设的清洗规则对CT图像进行清洗,得到清洗结果;
标注单元:用于对所述清洗结果中的数据进行随机抽取,并对抽取到的数据进行标注;
输出训练单元:用于基于BERT预训练语言模型,将标注后的数据输出至BERT模型中的分类模块,进行自主机器学习训练,得到关键语义特征,其中BERT预训练语言模型以句编码的形式对字进行编码,包括Token Embeddings和Position Embeddings两个部分,TokenEmbedding通过查表的方式获得嵌入向量,Position Embedding用于对字的位置进行编码;
其中,分析模块之后包括提取单元、构建单元和计算单元:
提取单元:用于根据皮尔逊相关系数,对关联之后的结果进行提取,得到提取后新的数据信息;
构建单元:用于根据预设的医疗复诊体系,构建医疗复诊随访相关体系,其中包括:针对预设的医疗复诊体系建立起符合自身的随访体系,风险处理的相关度是两个变量的关联,根据第i个样本值、样本数量和pearson相关系数,利用皮尔逊相关系数来判断两两风险处理指标的相关度;
计算单元:用于基于所述医疗复诊随访相关体系,计算提取后新的数据信息的相关性和敏感性,其中包括采用变差系数、指标的标准差、指标的平均值和样本数量进行计算,并依据预设条件对新的数据信息进行筛选。
5.根据权利要求4所述的基于智慧医疗复诊随访数据处理系统,其特征在于,所述处理模块,其中包括:
第一获取单元:用于根据每个所述待复诊患者所对应的科室医生设定的规则,获取所述待复诊信息表单中的主要信息和附属信息;
第二获取单元:用于基于所有所述附属信息,获取每个主要信息的多维度数据,所述附属信息包括所述待复诊患者的相关信息,其中包括待复诊患者的病例案号、诊断名称、诊断疾病编码以及出院时间,所述主要信息包括待复诊患者的基本信息、手术信息以及治疗信息;所述多维度数据标识了该主要信息与所有附属信息的有或无的关系;
获得单元:用于根据每个所述主要信息对应的多维度数据中,获得每个所述主要信息与所有所述附属信息的相关度;
聚类单元:用于根据每个主要信息与所有附属信息的相关度,进行模糊聚类,获得聚类结果。
6.根据权利要求4所述的基于智慧医疗复诊随访数据处理系统,其特征在于,所述分析模块,其中包括:
第三获取单元:用于获取第一信息,所述第一信息包括科室医生分类标准;
筛选单元:用于基于待复诊患者填写的待复诊信息表单,筛选出与所述待复诊信息表单相类似的表单所对应的样例数据;
分析单元:用于基于决策树的智能辅助诊断算法和所述第一信息,对所述样例数据进行分析,其中包括选取最优属性后,根据此属性的取值,对样例数据所在的集合进行划分,得到子数据集,再将每个子数据集当作完整数据集,迭代进行最优属性的选取,直到数据集中样本都是同一个分类标签时,决策树生成过程结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310618458.2A CN116343980B (zh) | 2023-05-30 | 2023-05-30 | 一种基于智慧医疗复诊随访数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310618458.2A CN116343980B (zh) | 2023-05-30 | 2023-05-30 | 一种基于智慧医疗复诊随访数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116343980A CN116343980A (zh) | 2023-06-27 |
CN116343980B true CN116343980B (zh) | 2023-08-29 |
Family
ID=86882656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310618458.2A Active CN116343980B (zh) | 2023-05-30 | 2023-05-30 | 一种基于智慧医疗复诊随访数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116343980B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913451B (zh) * | 2023-09-12 | 2023-11-28 | 西南医科大学 | 一种医疗随访系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110364236A (zh) * | 2019-07-22 | 2019-10-22 | 卫宁健康科技集团股份有限公司 | 放射影像报告的智能随访方法、系统、设备及存储介质 |
CN112216361A (zh) * | 2020-10-15 | 2021-01-12 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的随访计划单生成方法、装置、终端及介质 |
WO2021189971A1 (zh) * | 2020-10-26 | 2021-09-30 | 平安科技(深圳)有限公司 | 基于知识图谱表征学习的医疗方案推荐系统及方法 |
CN114299291A (zh) * | 2021-12-30 | 2022-04-08 | 四川可示见科技有限公司 | 一种可解释的人工智能医疗图像语义分割方法 |
CN114942947A (zh) * | 2022-07-04 | 2022-08-26 | 上海市胸科医院 | 一种基于智慧医疗的复诊随访数据处理方法及系统 |
CN115148332A (zh) * | 2021-03-30 | 2022-10-04 | 广东易生活信息科技有限公司 | 一种骨髓瘤智能随访系统及方法 |
CN115394393A (zh) * | 2022-09-09 | 2022-11-25 | 中国平安人寿保险股份有限公司 | 智能诊疗数据处理方法、装置、电子设备及存储介质 |
CN115547439A (zh) * | 2022-09-20 | 2022-12-30 | 广西医科大学第一附属医院 | 患者随访跟踪分析装置、方法、系统及介质 |
WO2023029506A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 病情分析方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220172841A1 (en) * | 2020-12-02 | 2022-06-02 | Predicta Med Ltd | Methods of identifying individuals at risk of developing a specific chronic disease |
-
2023
- 2023-05-30 CN CN202310618458.2A patent/CN116343980B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110364236A (zh) * | 2019-07-22 | 2019-10-22 | 卫宁健康科技集团股份有限公司 | 放射影像报告的智能随访方法、系统、设备及存储介质 |
CN112216361A (zh) * | 2020-10-15 | 2021-01-12 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的随访计划单生成方法、装置、终端及介质 |
WO2021189971A1 (zh) * | 2020-10-26 | 2021-09-30 | 平安科技(深圳)有限公司 | 基于知识图谱表征学习的医疗方案推荐系统及方法 |
CN115148332A (zh) * | 2021-03-30 | 2022-10-04 | 广东易生活信息科技有限公司 | 一种骨髓瘤智能随访系统及方法 |
WO2023029506A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 病情分析方法、装置、电子设备及存储介质 |
CN114299291A (zh) * | 2021-12-30 | 2022-04-08 | 四川可示见科技有限公司 | 一种可解释的人工智能医疗图像语义分割方法 |
CN114942947A (zh) * | 2022-07-04 | 2022-08-26 | 上海市胸科医院 | 一种基于智慧医疗的复诊随访数据处理方法及系统 |
CN115394393A (zh) * | 2022-09-09 | 2022-11-25 | 中国平安人寿保险股份有限公司 | 智能诊疗数据处理方法、装置、电子设备及存储介质 |
CN115547439A (zh) * | 2022-09-20 | 2022-12-30 | 广西医科大学第一附属医院 | 患者随访跟踪分析装置、方法、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116343980A (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Stanfill et al. | Health information management: implications of artificial intelligence on healthcare data and information management | |
US11948298B2 (en) | System to collect and identify medical conditions from images and expert knowledge | |
CN109584975B (zh) | 医疗数据标准化处理方法及装置 | |
US7617078B2 (en) | Patient data mining | |
CN111863267A (zh) | 数据信息获取方法、数据分析方法、装置以及存储介质 | |
Carchiolo et al. | Medical prescription classification: a NLP-based approach | |
US20190311810A1 (en) | System and method for facilitating computational analysis of a health condition | |
CN113724848A (zh) | 基于人工智能的医疗资源推荐方法、装置、服务器及介质 | |
CN112420202A (zh) | 数据的处理方法、装置及设备 | |
CN113724815B (zh) | 基于决策分群模型的信息推送方法及装置 | |
CN116343980B (zh) | 一种基于智慧医疗复诊随访数据处理方法及系统 | |
JP6908977B2 (ja) | 医療情報処理システム、医療情報処理装置及び医療情報処理方法 | |
RU2699607C2 (ru) | Повышение эффективности и уменьшение частоты последующих лучевых исследований путем прогнозирования основания для следующего исследования | |
CN115579104A (zh) | 一种基于人工智能的肝癌全病程数字化管理方法及系统 | |
Singhal | Predicting Congestive Heart failure using predictive analytics in AI | |
CN112151187A (zh) | 信息查询方法、装置、计算机设备和存储介质 | |
CN117216322A (zh) | 一种电子病历的生成方法、装置、设备及存储介质 | |
Shahn et al. | Predicting health outcomes from high‐dimensional longitudinal health histories using relational random forests | |
CN113793677A (zh) | 一种电子病历管理方法、装置、存储介质及电子设备 | |
Cheung et al. | Developing an automated registry (autoregistry) of spine surgery using natural language processing and health system scale databases | |
CN110289065A (zh) | 一种辅助生成医学电子报告的控制方法以及装置 | |
Alhashem et al. | Diabetes Detection and Forecasting using Machine Learning Approaches: Current State-of-the-art | |
US11636933B2 (en) | Summarization of clinical documents with end points thereof | |
CN109003193B (zh) | 投保风险预测方法、装置、计算机设备和存储介质 | |
Kumath et al. | Parth Adokar |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |