CN115775609A - 一种基于人工智能的患者画像系统 - Google Patents
一种基于人工智能的患者画像系统 Download PDFInfo
- Publication number
- CN115775609A CN115775609A CN202211599062.XA CN202211599062A CN115775609A CN 115775609 A CN115775609 A CN 115775609A CN 202211599062 A CN202211599062 A CN 202211599062A CN 115775609 A CN115775609 A CN 115775609A
- Authority
- CN
- China
- Prior art keywords
- patient
- information
- data
- axis
- medical record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于大数据医疗技术领域,具体涉及一种基于人工智能的患者画像系统,包括:信息获取单元,用于通过各平台实时获取患者的病历信息;信息处理单元,与信息获取单元连接用于接收患者的病历信息,对信息按照患者轴和疾病轴对数据进行分类处理;画像生成单元,用于根据患者轴和疾病轴的数据结合患者的身份表示融合构建患者画像;所述病历信息包括患者的基础信息、疾病表征、检查检验结果、诊断数据以及治疗方法;所述患者轴的数据以诊断数据为中心,用于多角度的展示患者的信息。克服了现有技术的不足,分别以患者轴和疾病轴为中心,从患者个人诊疗和群体诊疗角度描绘患者的特征,构建更为细致的患者画像,便于医生精准的制定医疗方案。
Description
技术领域
本发明属于大数据医疗技术领域,具体涉及一种基于人工智能的患者画像系统。
背景技术
目前我国大医院的门诊和急诊量非常大,值诊医生仅有5-6分钟就需要接待一名患者,医生虽然有强烈的意愿去全面了解患者情况,但是受制于时间和精力以及患者医学知识的局限性,医生往往还未能全面交流、认识患者的个体情况下,凭经验开出检查单或处方,即制定医疗方案时并不能充分考虑患者个体情况做出准确的判断。医生超负荷工作,患者不理解,无形中造成医患关系紧张。
专利申请号为CN201610996025.0公开了一种基于医疗大数据的患者画像方法及装置,其中公开了以首先标签体系提取和计算是建立在医学知识库的基础上,有很强的专业性,因此使得患者画像系统的精确性得到很大程度上的提高;其次,考虑了标签特征的风险因子、增衰因子和关联因子,更符合疾病发展规律;再者,让患者参与到画像的确认和管理中来,解决了标签的计算偏差;最后在患者画像数据的个人隐私方面引入了区块链技术,从技术上降低了敏感医疗数据泄露的风险。
上述患者画像以患者自身为中心,但是医生在制定医疗方案时更需要将患者的情况与其他患者的情况进行联系,更好精准的对患者进行治疗。
发明内容
本发明的目的在于提供一种基于人工智能的患者画像系统,克服了现有技术的不足,分别以患者轴和疾病轴为中心,从患者个人诊疗和群体诊疗角度描绘患者的特征,构建更为细致的患者画像,便于医生精准的制定医疗方案。
为解决上述问题,本发明所采取的技术方案如下:
一种基于人工智能的患者画像系统,包括:
信息获取单元,用于通过各平台实时获取患者的病历信息;
信息处理单元,与信息获取单元连接用于接收患者的病历信息,对信息按照患者轴和疾病轴对数据进行分类处理;
画像生成单元,用于根据患者轴和疾病轴的数据结合患者的身份表示融合构建患者画像。
进一步,所述病历信息包括患者的基础信息、疾病表征、检查检验结果、诊断数据以及治疗方法;
所述患者轴的数据以诊断数据为中心,用于多角度的展示患者的信息,快速做出诊断,得出治疗方案;
所述疾病轴以疾病表征、检查检验结果以及治疗方法为中心,对不同患者的相同特征进行统计。
进一步,所述信息获取单元定时利用爬虫技术从指定的医院平台爬取患者相关的病历信息;具体步骤包括:
S1、设置目标爬虫地址,对网站的html语言进行简单解析,按照模板完成爬虫的框架,得到病历信息;
S2、根据病历信息的URL作为标识在数据库中进行查找,以此来判断该病历信息是否重复;
S3、设定定时功能,使得爬虫程序按照用户预设的时间定期爬取。
进一步,所述信息处理单元包括数据清洗模块、预分类模块以及细分类模块,所述数据清洗模块用于将病例信息进行清洗形成结构化数据,所述预分类模块用于根据病历信息的类别进行分类处理,所述细分类模块用于分别以患者轴和疾病轴为中心抽取对应分类的数据进行处理。
进一步,所述数据清洗模块对接收的信息流进行解析,通过正则表达式、strip函数、replace函数等进行数据降噪和清洗,所述清洗包括清洗无意义的转义字符、标记符号、空行、回车数据。
进一步,所述画像生成单元的具体处理步骤包括:
S1、将分类处理后的数据分别同步输入实体识别模型,获取各层编码器的文本表示向量;
S2、将获取的各层文本表示向量进行动态权重融合,然后利用BiLSTM网络捕获序列特征信息,再使用条件随机场限制标签间的序列关系,完成病历文本中的实体识别;
S3、在真实的自主标注电子病历语料与电子病历数据集上验证模型效果。
进一步,所述将获取的各层文本表示向量进行动态权重融合,具体包括:将各层编码层生成的文本表示向量赋予一个初始权重,而后在训练的过程中确定权重的值,将每一层生成的表示向量进行加权,动态融合各层文本表示信息后降至512维,然后作为输入下接BiLSTM网络。
本发明与现有技术相比较,具有以下有益效果:
1、本发明分别以患者轴和疾病轴为中心,从患者个人诊疗和群体诊疗角度描绘患者的特征,构建更为细致的患者画像,便于医生精准的制定医疗方案。
2、本发明通过爬虫定时爬取病历数据,利用更新的病历数据不断优化患者的画像,使得输出结果更加的准确。
附图说明
图1为一种基于人工智能的患者画像系统的原理结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明所述一种基于人工智能的患者画像系统,包括:
信息获取单元,用于通过各平台实时获取患者的病历信息;
信息处理单元,与信息获取单元连接用于接收患者的病历信息,对信息按照患者轴和疾病轴对数据进行分类处理;
画像生成单元,用于根据患者轴和疾病轴的数据结合患者的身份表示融合构建患者画像。
病历信息包括患者的基础信息、疾病表征、检查检验结果、诊断数据以及治疗方法;患者轴的数据以诊断数据为中心,用于多角度的展示患者的信息,快速做出诊断,得出治疗方案;疾病轴以疾病表征、检查检验结果以及治疗方法为中心,对不同患者的相同特征进行统计。
患者轴在构建患者画像时以诸多诊断数据中的诊断数据为中心,具体的标签信息来自患者的基本信息、主要表现、检查检验、诊断数据和治疗方式这5个维度,患者画像可以从多个角度展示患者信息,医生可以根据画像快速浏览患者信息,做出快速诊断,科研人员也可以根据患者数据做进一步研究分析,如根据患者症状体征、检查检验记录等做疾病辅助诊断、疾病风险预测,还可以计算患者的相似度来推荐治疗方案。
疾病轴在构建以共病模式为画像中心,包含主要表现、检验检查和治疗方式这3个维度信息的共病患者健康画像。将某共病模式下全部患者的个人画像中主要表现、检验检查、治疗方式这三个维度的内容,筛选其中频率大于0.5的标签实体,将其作为共病患者健康画像对应维度的标签内容,以此来反映群体规律。随着之后各共病模式下患者数据的积累,可以进行持续性研究,逐步更新与完善群体画像内容,为各共病模式下患者的预防、诊断和治疗提供参考。
信息获取单元定时利用爬虫技术从指定的医院平台爬取患者相关的病历信息;具体步骤包括:
S1、设置目标爬虫地址,对网站的html语言进行简单解析,按照模板完成爬虫的框架,得到病历信息;
S2、根据病历信息的URL作为标识在数据库中进行查找,以此来判断该病历信息是否重复;
S3、设定定时功能,使得爬虫程序按照用户预设的时间定期爬取。
信息处理单元包括数据清洗模块、预分类模块以及细分类模块,数据清洗模块用于将病例信息进行清洗形成结构化数据,预分类模块用于根据病历信息的类别进行分类处理,细分类模块用于分别以患者轴和疾病轴为中心抽取对应分类的数据进行处理;数据清洗模块对接收的信息流进行解析,通过正则表达式、strip函数、replace函数等进行数据降噪和清洗,清洗包括清洗无意义的转义字符、标记符号、空行、回车数据。
画像生成单元的具体处理步骤包括:
S1、将分类处理后的数据分别同步输入实体识别模型,获取各层编码器的文本表示向量;
S2、将获取的各层文本表示向量进行动态权重融合,然后利用BiLSTM网络捕获序列特征信息,再使用条件随机场限制标签间的序列关系,完成病历文本中的实体识别;
S3、在真实的自主标注电子病历语料与电子病历数据集上验证模型效果。
将获取的各层文本表示向量进行动态权重融合,具体包括:将各层编码层生成的文本表示向量赋予一个初始权重,而后在训练的过程中确定权重的值,将每一层生成的表示向量进行加权,动态融合各层文本表示信息后降至512维,然后作为输入下接BiLSTM网络。
Neo4j是一个开源的、高性能的、可拓展的图形数据库,在知识图谱研究领域应用广泛,在Neo4j图形数据库中,支持节点和边的存储,分别对应知识图谱中的实体和关系,同时实体还可以拥有下级属性节点。本实施例中选择Neo4j图形数据库进行标签实体信息的存储,将同一共病模式下患者的主要表现、检验检查和治疗方式这3个维度的标签实体进行统计筛选后,即可在该数据库中完成共病患者健康画像可视化。
综上,本发明所述一种基于人工智能的患者画像系统,该系统通过预设目标爬虫地址,使得爬虫程序定时爬取该地址的病历信息,在进行查找后删除重复的信息,将不重复的信息上传至信息处理单元,信息处理单元首先对信息进行数据清洗得到结构化数据,然后按照信息类型进行预分类,然后在根据患者轴和疾病轴分别对数据进行处理分类;将分类后的信息上传到画像生成单元,通过实体识别模型和BiLSTM网络对数据信息动态融合,从患者个人诊疗和群体诊疗角度描绘患者的特征,构建更为细致的患者画像,便于医生精准的制定医疗方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (7)
1.一种基于人工智能的患者画像系统,其特征在于:包括:
信息获取单元,用于通过各平台实时获取患者的病历信息;
信息处理单元,与信息获取单元连接用于接收患者的病历信息,对信息按照患者轴和疾病轴对数据进行分类处理;
画像生成单元,用于根据患者轴和疾病轴的数据结合患者的身份表示融合构建患者画像。
2.根据权利要求1所述的一种基于人工智能的患者画像系统,其特征在于:所述病历信息包括患者的基础信息、疾病表征、检查检验结果、诊断数据以及治疗方法;
所述患者轴的数据以诊断数据为中心,用于多角度的展示患者的信息,快速做出诊断,得出治疗方案;
所述疾病轴以疾病表征、检查检验结果以及治疗方法为中心,对不同患者的相同特征进行统计。
3.根据权利要求1所述的一种基于人工智能的患者画像系统,其特征在于:所述信息获取单元定时利用爬虫技术从指定的医院平台爬取患者相关的病历信息;具体步骤包括:
S1、设置目标爬虫地址,对网站的html语言进行简单解析,按照模板完成爬虫的框架,得到病历信息;
S2、根据病历信息的URL作为标识在数据库中进行查找,以此来判断该病历信息是否重复;
S3、设定定时功能,使得爬虫程序按照用户预设的时间定期爬取。
4.根据权利要求1所述的一种基于人工智能的患者画像系统,其特征在于:所述信息处理单元包括数据清洗模块、预分类模块以及细分类模块,所述数据清洗模块用于将病例信息进行清洗形成结构化数据,所述预分类模块用于根据病历信息的类别进行分类处理,所述细分类模块用于分别以患者轴和疾病轴为中心抽取对应分类的数据进行处理。
5.根据权利要求4所述的一种基于人工智能的患者画像系统,其特征在于:所述数据清洗模块对接收的信息流进行解析,通过正则表达式、strip函数、replace函数等进行数据降噪和清洗,所述清洗包括清洗无意义的转义字符、标记符号、空行、回车数据。
6.根据权利要求1所述的一种基于人工智能的患者画像系统,其特征在于:所述画像生成单元的具体处理步骤包括:
S1、将分类处理后的数据分别同步输入实体识别模型,获取各层编码器的文本表示向量;
S2、将获取的各层文本表示向量进行动态权重融合,然后利用BiLSTM网络捕获序列特征信息,再使用条件随机场限制标签间的序列关系,完成病历文本中的实体识别;
S3、在真实的自主标注电子病历语料与电子病历数据集上验证模型效果。
7.根据权利要求6所述的一种基于人工智能的患者画像系统,其特征在于:所述将获取的各层文本表示向量进行动态权重融合,具体包括:将各层编码层生成的文本表示向量赋予一个初始权重,而后在训练的过程中确定权重的值,将每一层生成的表示向量进行加权,动态融合各层文本表示信息后降至512维,然后作为输入下接BiLSTM网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211599062.XA CN115775609A (zh) | 2022-12-14 | 2022-12-14 | 一种基于人工智能的患者画像系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211599062.XA CN115775609A (zh) | 2022-12-14 | 2022-12-14 | 一种基于人工智能的患者画像系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115775609A true CN115775609A (zh) | 2023-03-10 |
Family
ID=85392112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211599062.XA Pending CN115775609A (zh) | 2022-12-14 | 2022-12-14 | 一种基于人工智能的患者画像系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115775609A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913519A (zh) * | 2023-07-24 | 2023-10-20 | 东莞莱姆森科技建材有限公司 | 基于智能镜的健康监护方法、装置、设备及存储介质 |
-
2022
- 2022-12-14 CN CN202211599062.XA patent/CN115775609A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913519A (zh) * | 2023-07-24 | 2023-10-20 | 东莞莱姆森科技建材有限公司 | 基于智能镜的健康监护方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101873926B1 (ko) | 빅데이터 기반 의료자문 서비스 제공 방법 | |
CN109192310A (zh) | 一种基于大数据的大学生心理行为异动系统方案设计方法 | |
CN113724848A (zh) | 基于人工智能的医疗资源推荐方法、装置、服务器及介质 | |
CN112349369A (zh) | 医疗影像大数据智能分析方法、系统及存储介质 | |
WO2021068781A1 (zh) | 一种疲劳状态识别方法、装置和设备 | |
CN113808738B (zh) | 一种基于自识别影像的疾病识别系统 | |
CN113362960B (zh) | 结合多源数据的城市居民公共健康影响因素可视分析系统及方法 | |
CN115862831B (zh) | 一种智能在线预约诊疗管理系统及方法 | |
CN115775609A (zh) | 一种基于人工智能的患者画像系统 | |
CN110827159B (zh) | 基于关系图的金融医疗保险诈骗预警方法、装置及终端 | |
CN117237351B (zh) | 一种超声图像分析方法以及相关装置 | |
Weber et al. | A client/server based online environment for the calculation of medical segmentation scores | |
Proulx et al. | Avian flu case study with nspace and geotime | |
Wang et al. | [Retracted] Student Physical Fitness Test System and Test Data Analysis System Based on Computer Vision | |
CN112397195B (zh) | 用于生成体格检查模型的方法、装置、电子设备和介质 | |
Rammal et al. | Heart failure prediction models using big data techniques | |
TW201118773A (en) | Medical information integrated system and method | |
Pivithuru et al. | E-patient Card: An Integrated Electronic Health Recording System for Patient | |
CN110289065A (zh) | 一种辅助生成医学电子报告的控制方法以及装置 | |
Zhou et al. | Improved GCN framework for human motion recognition | |
Thai-Nghe et al. | Intelligent Systems and Data Science: First International Conference, ISDS 2023, Can Tho, Vietnam, November 11–12, 2023, Proceedings, Part I | |
CN109784637A (zh) | 应用于处理平台数据分析的方法和装置 | |
Patil et al. | Tuberculosis Detection Using a Deep Neural Network | |
CN117954101B (zh) | 基于人工智能的肺癌存活率预测模型的搭建方法及系统 | |
Shekar et al. | Clinical data mining–an approach for identification of refractive errors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |