CN116028689B - 基于妇幼服务平台的数据管控方法及系统 - Google Patents

基于妇幼服务平台的数据管控方法及系统 Download PDF

Info

Publication number
CN116028689B
CN116028689B CN202310307713.1A CN202310307713A CN116028689B CN 116028689 B CN116028689 B CN 116028689B CN 202310307713 A CN202310307713 A CN 202310307713A CN 116028689 B CN116028689 B CN 116028689B
Authority
CN
China
Prior art keywords
data set
user medical
medical data
description knowledge
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310307713.1A
Other languages
English (en)
Other versions
CN116028689A (zh
Inventor
夏凌云
张喆
刘君
刘力嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Ceres Technology Co ltd
Original Assignee
Sichuan Ceres Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Ceres Technology Co ltd filed Critical Sichuan Ceres Technology Co ltd
Priority to CN202310307713.1A priority Critical patent/CN116028689B/zh
Publication of CN116028689A publication Critical patent/CN116028689A/zh
Application granted granted Critical
Publication of CN116028689B publication Critical patent/CN116028689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请提供的基于妇幼服务平台的数据管控方法及系统,该方法能够确定出的用户医疗数据集描述知识变量中不仅涵盖了用户医疗数据集本身的信息,还包括与用户医疗数据集相关的多个不同维度的信息以及不断更新的用户医疗数据集,因此获得用户医疗数据集对应数据的数据量是十分庞大的,在进行数据管理时,可能导致相关设备死机或者不能正常工作的情况,本申请只对上述问题进行优化,能够有效的改善由于数据量过大导致服务平台不能正常工作的情况,从而保障数据管理的可靠性,提高用户的体验感。

Description

基于妇幼服务平台的数据管控方法及系统
技术领域
本申请涉及数据管控技术领域,具体而言,涉及基于妇幼服务平台的数据管控方法及系统。
背景技术
医疗健康大数据服务平台是一个包含多个业务系统、多个自身管理软件、是一系列软、硬件和人员、政策支持的综合系统体系,统一建设医疗健康云计算服务中心,集中存储居民医疗卫生信息和居民电子健康档案等数据,满足社会大众、医务工作者、各级卫生主管部门、第三方机构的应用需求。
现目前,随着信息化时代的不断发展和进步,妇幼医院通过服务平台能够将用户信息通过电脑或手机等方式进行输入,服务平台能够在医院电脑上共享用户的信息,这样一来,不同的医生通过服务平台能实时获得该用户的历史信息,提高诊断的效率,但是,随着时间的推移,用户越来越多,用户对应的信息也越来也多,服务平台针对大量的数据如何进行管控是现目前难以解决的一个技术问题。
发明内容
为改善相关技术中存在的技术问题,本申请提供了基于妇幼服务平台的数据管控方法及系统。
第一方面,提供一种基于妇幼服务平台的数据管控方法,所述方法包括:获得待分析用户医疗数据集的所述用户医疗数据集对应数据包括所述待分析用户医疗数据集的用户医疗数据集目录、所述待分析用户医疗数据集的匹配用户或所述待分析用户医疗数据集的匹配用户医疗数据集的至少一项;获得所述待分析用户医疗数据集以及所述用户医疗数据集对应数据中各类信息的原始描述知识变量;确定所述待分析用户医疗数据集对应的匹配关系,其中,所述匹配关系为所述待分析用户医疗数据集和所述用户医疗数据集对应数据中各类信息之间的匹配关系;通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,以通过所述用户医疗数据集描述知识变量进行所述待分析用户医疗数据集的处理,获得处理结果,对所述处理结果进行分类管理。
可以理解的是,本申请实施例所提供的方案,在获得用户医疗数据集的描述知识变量时,除了考虑待分析用户医疗数据集本身之前,还考虑了该用户医疗数据集的用户医疗数据集对应数据,具体的,用户医疗数据集对应数据包括待分析用户医疗数据集的用户医疗数据集目录、待分析用户医疗数据集的匹配用户或待分析用户医疗数据集的匹配用户医疗数据集的至少一项,用户医疗数据集目录是能够反映了用户医疗数据集中的各个用户的描述内容,匹配用户医疗数据集可以反映就诊者个人情况,即匹配用户医疗数据集能够从另一个方面反映待分析用户医疗数据集的用户医疗数据集特征,而待分析用户医疗数据集通常也是与匹配用户对应的私人信息相关,因此匹配用户也是能够从一定程度与能够反映用户医疗数据集特征的对应数据,因此,确定出的用户医疗数据集描述知识变量中不仅涵盖了用户医疗数据集本身的信息,还包括与用户医疗数据集相关的多个不同维度的信息以及不断更新的用户医疗数据集,因此获得用户医疗数据集对应数据的数据量是十分庞大的,在进行数据管理时,可能导致相关设备死机或者不能正常工作的情况,本申请只对上述问题进行优化,能够有效的改善由于数据量过大导致服务平台不能正常工作的情况,从而保障数据管理的可靠性,提高用户的体验感。
在一种独立实施的实施例中,所述确定所述待分析用户医疗数据集对应的匹配关系,包括:通过所述用户医疗数据集对应数据以及所述待分析用户医疗数据集,搭建所述待分析用户医疗数据集对应的描述知识链,所述描述知识链表示了所述匹配关系;其中,所述描述知识链中的数据块包括所述待分析用户医疗数据集对应的数据块、以及所述用户医疗数据集对应数据中各类信息各自对应的数据块,所述描述知识链的边缘包括所述待分析用户医疗数据集和所述用户医疗数据集对应数据中各类信息对应的数据块之间的关联情况;所述通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:通过各所述原始描述知识变量以及所述描述知识链,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量。
可以理解的是,通过搭建分析用户医疗数据集对应的描述知识链,这样能够更加准确地确定出匹配关系。
在一种独立实施的实施例中,所述用户医疗数据集对应数据包括至少一个用户医疗数据集目录,所述描述知识链的边缘还包括各用户医疗数据集目录所对应的数据块之间的关联情况。
在一种独立实施的实施例中,所述通过各所述原始描述知识变量以及所述描述知识链,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:对于所述描述知识链中目标数据块,通过所述目标数据块的每一个种类的各相似数据块对应的原始描述知识变量,抽取得到每一个种类的信息对应的第一描述知识变量,所述目标数据块为所述待分析用户医疗数据集对应的数据块,所述用户医疗数据集对应数据中的每一种信息对应的数据块属于一种种类的数据块;通过所述目标数据块所对应的各第一描述知识变量和所述目标数据块的原始描述知识变量,抽取所述待分析用户医疗数据集的用户医疗数据集描述知识变量。
可以理解的是,通过各原始描述知识变量以及所述描述知识链时,改善存在原始描述知识变量不准确的问题,从而能够精确地确定待分析用户医疗数据集的用户医疗数据集描述知识变量。
在一种独立实施的实施例中,所述方法还包括:对于所述描述知识链中每一数据块,通过执行不少于一轮以下操作抽取该数据块的数据块描述知识变量:基于该数据块的每一个种类的各相似数据块的实时描述知识变量,抽取得到该种类的信息对应的第二描述知识变量;基于该数据块的实时描述知识变量和该数据块对应的各第二描述知识变量,得到该数据块的目标描述知识变量;其中,若所述操作确定为一轮,所述实时描述知识变量为所述原始描述知识变量,所述目标描述知识变量为所述数据块描述知识变量,若所述操作确定为不少于两次,第一轮操对应的实时描述知识变量为所述原始描述知识变量,除所述第一轮操作之前对应的实时描述知识变量为前一轮操作得到的目标描述知识变量,所述数据块描述知识变量为最后一轮操作得到的目标描述知识变量;所述通过所述目标数据块的每一个种类的各相似数据块对应的原始描述知识变量,抽取得到每一个该种类的信息对应的第一描述知识变量,包括:对于每一种种类,将所述目标数据块的该种类的各相似数据块的数据块描述知识变量进行组合,得到该种类的信息对应的第一描述知识变量;所述通过所述目标数据块对应的各第一描述知识变量和所述目标数据块的原始描述知识变量,抽取所述待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:将所述目标数据块对应的各第一描述知识变量和所述目标数据块的数据块描述知识变量进行整合;基于整合后的描述知识变量,抽取所述待分析用户医疗数据集的用户医疗数据集描述知识变量。
在一种独立实施的实施例中,将各种所述种类的信息对应的第一描述知识变量和所述目标数据块的数据块描述知识变量进行整合,包括:获得各所述种类的信息对应的第一占比系数,以及所述待分析用户医疗数据集对应的第二占比系数;通过各所述种类的信息对应的第一占比系数,对各所述种类的信息对应的第一描述知识变量进行处理,得到各所述种类的信息对应的第二描述知识变量;通过所述第二占比系数,对所述目标数据块的数据块描述知识变量进行处理,得到第三描述知识变量;对各所述种类的信息对应的第二描述知识变量和所述第三描述知识变量进行整合。
在一种独立实施的实施例中,所述获得所述待分析用户医疗数据集以及所述用户医疗数据集对应数据中各类信息的原始描述知识变量,包括:获得所述待分析用户医疗数据集的用户医疗数据集标签,抽取所述用户医疗数据集标签对应的标签描述知识变量,将所述标签描述知识变量确定为所述待分析用户医疗数据集的原始描述知识变量;若所述用户医疗数据集对应数据包括所述匹配用户,对于随机一个所述匹配用户,获得所述匹配用户对应的示例用户医疗数据集,通过所述示例用户医疗数据集确定所述匹配用户的原始描述知识变量。
在一种独立实施的实施例中,通过所述用户医疗数据集描述知识变量进行所述待分析用户医疗数据集的处理,包括:通过所述待分析用户医疗数据集的用户医疗数据集描述知识变量和第一用户医疗数据集中各待解析用户医疗数据集的用户医疗数据集描述知识变量的关联度,从第一用户医疗数据集中确定出目标解析用户医疗数据集,将所述目标解析用户医疗数据集发送给目标用户,其中,所述待分析用户医疗数据集为所述目标用户查询过的用户医疗数据集;或者,基于第二用户医疗数据集中各用户医疗数据集的用户医疗数据集描述知识变量之间的共性权重,对所述第二用户医疗数据集中的各用户医疗数据集进行划分处理,其中,所述待分析用户医疗数据集为第二用户医疗数据集中的每一用户医疗数据集。
在一种独立实施的实施例中,所述通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量是描述知识链人工智能线程实现的,所述描述知识链人工智能线程是通过以下方式配置得到的:获得配置数据,所述配置数据中包括多个范例数据,每一个范例数据包括一个示例用户医疗数据集对应的范例描述知识链以及该范例描述知识链中各数据块的原始描述知识变量,其中,随机一个范例描述知识链中的各数据块包括示例用户医疗数据集对应的第一数据块和各第一信息对应第二数据块,所述第一信息为示例用户医疗数据集的用户医疗数据集对应数据中随机一个项信息,所述范例描述知识链的边缘包括所述第一数据块与各所述第二数据块之间的关联情况;将各所述范例数据加载至原始人工智能线程,得到每一个所述范例数据对应的各数据块的回归分析描述知识变量;对于每一个所述范例数据,基于该范例数据的范例描述知识链中第一数据块的回归分析描述知识变量和各第二数据块的回归分析描述知识变量之间的共性权重,确定所述范例数据对应的第一配置质量评估结果;通过各所述范例数据对应的第一配置质量评估结果,确定所述描述知识链人工智能线程对应的全局配置质量评估结果;若所述全局配置质量评估结果符合配置终止要求,则终止配置,并将配置终止时对应的线程确定为所述描述知识链人工智能线程,否则,调试所述描述知识链人工智能线程的线程系数,并通过所述配置数据对所述描述知识链人工智能线程继续进行配置。
在一种独立实施的实施例中,对于每一个所述范例描述知识链,所述范例描述知识链中还包括各第二信息对应的第三数据块,所述第二信息包括与所述示例用户医疗数据集非相关且与所述第一信息中的至少一项信息相关的信息,对于每一所述第一信息,所述范例描述知识链的边缘还包括该第一信息对应的第二数据块与所述第二信息中与该第一信息相关的信息对应的第三数据块之间的关联情况;所述方法还包括:对于每一个所述范例数据,通过各所述第三数据块的回归分析描述知识变量和所述第一数据块的回归分析描述知识变量之间的共性权重,确定所述范例数据对应的第二配置质量评估结果;所述通过各所述范例数据对应的第一配置质量评估结果,确定所述描述知识链人工智能线程对应的全局配置质量评估结果,包括:通过各所述范例数据对应的第一配置质量评估结果和所述第二配置质量评估结果,确定所述全局配置质量评估结果。
第二方面,提供一种基于妇幼服务平台的数据管控系统,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
本申请实施例所提供的基于妇幼服务平台的数据管控方法及系统,本申请实施例所提供的方案,在获得用户医疗数据集的描述知识变量时,除了考虑待分析用户医疗数据集本身之前,还考虑了该用户医疗数据集的用户医疗数据集对应数据,具体的,用户医疗数据集对应数据包括待分析用户医疗数据集的用户医疗数据集目录、待分析用户医疗数据集的匹配用户或待分析用户医疗数据集的匹配用户医疗数据集的至少一项,用户医疗数据集目录是能够反映了用户医疗数据集中的各个用户的描述内容,匹配用户医疗数据集可以反映就诊者个人情况,即匹配用户医疗数据集能够从另一个方面反映待分析用户医疗数据集的用户医疗数据集特征,而待分析用户医疗数据集通常也是与匹配用户对应的私人信息相关,因此匹配用户也是能够从一定程度与能够反映用户医疗数据集特征的对应数据,因此,确定出的用户医疗数据集描述知识变量中不仅涵盖了用户医疗数据集本身的信息,还包括与用户医疗数据集相关的多个不同维度的信息以及不断更新的用户医疗数据集,因此获得用户医疗数据集对应数据的数据量是十分庞大的,在进行数据管理时,可能导致相关设备死机或者不能正常工作的情况,本申请只对上述问题进行优化,能够有效的改善由于数据量过大导致服务平台不能正常工作的情况,从而保障数据管理的可靠性,提高用户的体验感。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种基于妇幼服务平台的数据管控方法的流程图。
图2为本申请实施例所提供的一种基于妇幼服务平台的数据管控装置的框图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,示出了一种基于妇幼服务平台的数据管控方法,该方法可以包括以下步骤S110-步骤S140所描述的技术方案。
步骤S110:获得待分析用户医疗数据集的用户医疗数据集对应数据,用户医疗数据集对应数据包括待分析用户医疗数据集的用户医疗数据集目录、待分析用户医疗数据集的匹配用户或待分析用户医疗数据集的匹配用户医疗数据集的至少一项。
进一步地,本申请中不限定待分析用户医疗数据集是从用户平台用户注册信息或者登入信息或者医院现场用户登记信息等信息中获取的。
在一种可能实施的实施例中,用户医疗数据集对应数据指的是与待分析用户医疗数据集的用户医疗数据集本身内容具有直接匹配关系的信息,包括待分析用户医疗数据集的用户医疗数据集目录、待分析用户医疗数据集的匹配用户或待分析用户医疗数据集的匹配用户医疗数据集中的至少一项。
其中,一个用户医疗数据集中可同时具体该用户的一个或多个用户医疗数据集目录(因为患者来就诊时,次数可能是多次,每次就诊的原因可能不同,因此可能存在一个或多个用户医疗数据集目录)。用户医疗数据集目录可以表示用户医疗数据集的用户医疗数据集种类或者用户医疗数据集中的某些内容信息,譬如,某个用户医疗数据集的用户医疗数据集目录为患者医疗信息,则该用户医疗数据集属于患者医疗信息类的用户医疗数据集。举例而言,用户医疗数据集目录可以是预先人工标注的或者通过用户医疗数据集识别自动确定的,譬如,可以通过抽取待分析用户医疗数据集中的关键信息,基于该关键信息自动为待分析用户医疗数据集添加用户医疗数据集目录,或者对待分析用户医疗数据集进行用户医疗数据集划分处理,基于分类结果确定用户医疗数据集的目录。
举例而言,用户医疗数据集目录可以以文字或字符的形式显示在用户医疗数据集的标签中。本申请中不限定用户医疗数据集目录的具体表现形式。
举例而言,匹配用户包括待分析用户医疗数据集的目标就诊者或待分析用户医疗数据集的发布者中的至少一项;匹配用户医疗数据集包括待分析用户医疗数据集的目标就诊者所查询的目标用户医疗数据集,目标用户医疗数据集为医生在查询待分析用户医疗数据集之前和/或之后的至少一个用户医疗数据集。
其中,匹配用户医疗数据集为目标就诊者在查询待分析用户医疗数据集之前和/或之后所查询的至少一个用户医疗数据集,通过匹配用户医疗数据集可反映出用户的用户医疗数据集属性(用户医疗数据集属性可以理解为用户医疗数据集内容,具体可以包括用户的资料信息以及用户的用药信息等)。
举例而言,获得待分析用户医疗数据集的目标就诊者,包括:获得待分析用户医疗数据集的各原始就诊者,以及各原始就诊者对待分析用户医疗数据集的查询时长;通过各就诊者对应的查询时长,将各原始就诊者的查询时长中大于或等于第一设定时长的原始就诊者确定为目标就诊者,或者,通过各就诊者对应的查询时长,将各原始就诊者中查询时长较长的设定个数的原始就诊者确定为目标就诊者。
其中,原始就诊者指的是所有查询过待分析用户医疗数据集的用户,查询时长指的是一轮查询待分析用户医疗数据集对应的时长,查询时长表示待分析用户医疗数据集对应的该用户的信息比较多。
举例而言,获得匹配用户医疗数据集可通过以下至少一种方式:将查询的用户医疗数据集按照查询时长进行排列分布,将排列分布后的各用户医疗数据集中,待分析用户医疗数据集之前的第一设定个数的用户医疗数据集或之后的第二设定个数的用户医疗数据集中的至少一项确定为待分析用户医疗数据集的匹配用户医疗数据集。
将目标就诊者查询的用户医疗数据集按照查询的先后顺序进行排列分布,将排列分布后的各用户医疗数据集中,待分析用户医疗数据集之前的第三设定个数的用户医疗数据集或之后的第四设定个数的用户医疗数据集中的至少一项确定为待分析用户医疗数据集的匹配用户医疗数据集。
将待分析用户医疗数据集的目标就诊者在第二设定时长内查询的用户医疗数据集确定为匹配用户医疗数据集,第二设定时长是指相对于待分析用户医疗数据集的查询时间的时长。
其中,待分析用户医疗数据集与匹配用户医疗数据集是一段时间内所查询的用户医疗数据集。待分析用户医疗数据集的查询时长指的是查询待分析用户医疗数据集所用的时间。第二设定时长是指相对于待分析用户医疗数据集的查询时间的时长,表示了查询匹配用户医疗数据集与查询待分析用户医疗数据集的时间间隔较小。即匹配用户医疗数据集是查询待分析用户医疗数据集之前的一段时间(第二设定时长)内所查询的用户医疗数据集,或之后的一段时间内所查询的用户医疗数据集。
步骤S120,获得待分析用户医疗数据集以及用户医疗数据集对应数据中各类信息的原始描述知识变量。
其中,待分析用户医疗数据集的原始描述知识变量可以反映待分析用户医疗数据集的特征,用户医疗数据集对应数据中各类信息的原始描述知识变量可以反映各类信息的特征。
在一种可替换的实施例中,获得待分析用户医疗数据集以及用户医疗数据集对应数据中各类信息的原始描述知识变量,包括:获得待分析用户医疗数据集的用户医疗数据集标签,抽取用户医疗数据集标签对应的标签描述知识变量,将标签描述知识变量确定为待分析用户医疗数据集的原始描述知识变量;若用户医疗数据集对应数据包括匹配用户,对于随机一个匹配用户,获得匹配用户对应的示例用户医疗数据集,基于示例用户医疗数据集确定匹配用户的原始描述知识变量。
其中,用户医疗数据集标签可反映用户医疗数据集的相关特征,则可将用户医疗数据集标签的标签描述知识变量确定为待分析用户医疗数据集对应数据块的原始描述知识变量。
举例而言,抽取用户医疗数据集标签对应的标签描述知识变量可通过以下方式实现:对用户医疗数据集标签进行分类处理,得到用户医疗数据集标签中涵盖的各分类;抽取各分类的词描述知识变量;通过各分类的词描述知识变量,确定标签描述知识变量。举例而言,可对各分类的词描述知识变量求平均,得到标签描述知识变量。
其中,匹配用户在查询或发布待分析用户医疗数据集之前查询或发布的示例用户医疗数据集可以反映出该匹配用户的用户医疗数据集属性,则通过示例用户医疗数据集的用户医疗数据集描述知识变量可表示匹配用户对应数据块的原始描述知识变量。
举例而言,可对各示例用户医疗数据集的用户医疗数据集描述知识变量求平均,将该平均确定为目标就诊者或发布者对应数据块的原始描述知识变量。
举例而言,可在实时时刻之前的第一设定时长内所查询的至少一个用户医疗数据集中挑选近期(与查询待分析用户医疗数据集的时间间隔较小)查询的用户医疗数据集确定为示例用户医疗数据集。近期查询的用户医疗数据集可以更加精确的反应用户的属性变化(属性变化可以理解为近期患者信息的变化),使得确定的目标就诊者对应数据块的原始描述知识变量更加精确且可信。
举例而言,可在实时时刻之前的第二设定时长内所发布的至少一个用户医疗数据集中挑选近期生成的用户医疗数据集确定为示例用户医疗数据集。近期生成的用户医疗数据集可以更加精确的反应用户的属性变化,使得确定对应数据块的原始描述知识变量更加精确。
在一种可替换的实施例中,若用户医疗数据集对应数据包括待分析用户医疗数据集的用户医疗数据集目录,用户医疗数据集目录为文本,对于随机一个用户医疗数据集目录对应的数据块,可基于与用户医疗数据集标签同样的处理方法,得到用户医疗数据集目录对应的目录描述知识变量,将目录描述知识变量确定为用户医疗数据集目录对应数据块的原始描述知识变量。如果用户医疗数据集目录不是文本,可将用户医疗数据集目录转化为文本,然后基于上述相同的方法确定用户医疗数据集目录对应数据块的原始描述知识变量。
上述确定原始描述知识变量的过程中,某些信息对应数据块的原始描述知识变量是基于目标就诊者查询用户医疗数据集的行为信息确定的,则通过原始描述知识变量不仅可以反映出各信息本身的特征,还可以反映出目标就诊者与各信息之间的互动特征(查询用户医疗数据集的行为信息对应的特征),从而使得基于原始描述知识变量确定的待分析用户医疗数据集的用户医疗数据集描述知识变量更加精确。
步骤S130:确定待分析用户医疗数据集对应的匹配关系,其中,匹配关系为待分析用户医疗数据集和用户医疗数据集对应数据中各类信息之间的匹配关系。
步骤S140:通过各原始描述知识变量以及匹配关系,确定待分析用户医疗数据集的用户医疗数据集描述知识变量,以基于用户医疗数据集描述知识变量进行待分析用户医疗数据集的处理;获得处理结果,对所述处理结果进行分类管理。
其中,由于匹配关系可以反映待分析用户医疗数据集与用户医疗数据集对应数据中各类信息之间的匹配关系,各原始描述知识变量可以反映待分析用户医疗数据集的用户医疗数据集本身特征,以及用户医疗数据集对应数据中各类信息的信息本身的特征,因此,通过各原始描述知识变量以及匹配关系确定的用户医疗数据集描述知识变量对于用户医疗数据集的表达更加精确。
基于待分析用户医疗数据集的用户医疗数据集描述知识变量可对待分析用户医疗数据集进行相关处理,譬如,基于待分析用户医疗数据集的用户医疗数据集描述知识变量进行用户医疗数据集解析。
本申请实施例所提供的方案,在获得用户医疗数据集的描述知识变量时,除了考虑待分析用户医疗数据集本身之前,还考虑了该用户医疗数据集的用户医疗数据集对应数据,具体的,用户医疗数据集对应数据包括待分析用户医疗数据集的用户医疗数据集目录、待分析用户医疗数据集的匹配用户或待分析用户医疗数据集的匹配用户医疗数据集的至少一项,用户医疗数据集目录是能够反映了用户医疗数据集中的各个用户的描述内容,匹配用户医疗数据集可以反映就诊者个人情况,即匹配用户医疗数据集能够从另一个方面反映待分析用户医疗数据集的用户医疗数据集特征,而待分析用户医疗数据集通常也是与匹配用户对应的私人信息相关,因此匹配用户也是能够从一定程度与能够反映用户医疗数据集特征的对应数据,因此,确定出的用户医疗数据集描述知识变量中不仅涵盖了用户医疗数据集本身的信息,还包括与用户医疗数据集相关的多个不同维度的信息以及不断更新的用户医疗数据集,因此获得用户医疗数据集对应数据的数据量是十分庞大的,在进行数据管理时,可能导致相关设备死机或者不能正常工作的情况,本申请只对上述问题进行优化,能够有效的改善由于数据量过大导致服务平台不能正常工作的情况,从而保障数据管理的可靠性,提高用户的体验感。
在一种可替换的实施例中,确定待分析用户医疗数据集对应的匹配关系,包括:基于用户医疗数据集对应数据以及待分析用户医疗数据集,搭建待分析用户医疗数据集对应的描述知识链,该描述知识链表示了匹配关系;其中,描述知识链中的数据块包括待分析用户医疗数据集对应的数据块、以及用户医疗数据集对应数据中各类信息各自对应的数据块,描述知识链的边缘包括待分析用户医疗数据集和用户医疗数据集对应数据中各类信息对应的数据块之间的关联情况;通过各原始描述知识变量以及匹配关系,确定待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:通过各原始描述知识变量以及描述知识链,确定待分析用户医疗数据集的用户医疗数据集描述知识变量。
其中,通过描述知识链表示用户医疗数据集对应数据与待分析用户医疗数据集之间的匹配关系。
举例而言,由于用户医疗数据集对应数据与待分析用户医疗数据集属于不同种类的信息,则可通过异常描述知识链表示上述信息,异常描述知识链为涵盖不同种类的数据块的描述知识链。用户医疗数据集对应数据和匹配信息中涵盖的每一种信息对应的数据块属于一种种类的数据块。譬如,用户医疗数据集对应数据中包括用户医疗数据集目录和匹配用户,每一个用户医疗数据集目录对应一个数据块,每一个匹配用户对应一个数据块,所有用户医疗数据集目录对应的数据块为一种种类的数据块,所有匹配用户对应的数据块为另一种种类的数据块。
在一种可替换的实施例中,用户医疗数据集对应数据包括至少一个用户医疗数据集目录,描述知识链的边缘还包括各用户医疗数据集目录所对应的数据块之间的关联情况。
其中,如果用户医疗数据集对应数据中包括至少两个用户医疗数据集目录,即待分析用户医疗数据集具有至少两个目录时,由于多个用户医疗数据集目录均是该待分析用户医疗数据集的目录,是具有匹配关系的,因此,描述知识链的边缘还可以包括各用户医疗数据集目录所对应的数据块之间的关联情况,以通过该联系来表示该联系所连接的数据块对应的都是该处理用户医疗数据集的目录,从而通过该描述知识链更精确、细化的表达了待分析用户医疗数据集和待分析用户医疗数据集的各用户医疗数据集目录之间的匹配关系,基于该描述知识链结构可以获得到更精确的待分析用户医疗数据集的特征表达即用户医疗数据集描述知识变量。
在一种可替换的实施例中,通过各原始描述知识变量以及描述知识链,确定待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:对于描述知识链中目标数据块(数据块可以理解为数据量),基于目标数据块的每一个种类的各相似数据块对应的原始描述知识变量,抽取得到每一个种类的信息对应的第一描述知识变量,目标数据块为待分析用户医疗数据集对应的数据块,用户医疗数据集对应数据中的每一种信息对应的数据块属于一种种类的数据块;基于目标数据块所对应的各第一描述知识变量和目标数据块的原始描述知识变量,抽取待分析用户医疗数据集的用户医疗数据集描述知识变量。
其中,目标数据块的相似数据块指的是与目标数据块有联系的数据块,相似数据块可以反映出目标数据块的某些特征,为此,抽取目标数据块对应的用户医疗数据集描述知识变量时,需要参考目标数据块的各相似数据块的描述知识变量。
不同种类的相似数据块对应反映的数据块特征不同,因此,在抽取各相似数据块的数据块描述知识变量(第一描述知识变量)时,可以按照相似数据块的种类进行抽取。同一种类的信息对应一个第一描述知识变量。
可以理解的是,对于描述知识链中的每一个数据块,均需要基于该数据块的每一个种类的信息对应的原始描述知识变量,抽取得到该数据块对应的每一个种类的信息对应的第一描述知识变量。
在一种可替换的实施例中,该方法还可以包括:对于描述知识链中每一数据块,通过执行不少于一轮以下操作抽取该数据块的数据块描述知识变量:基于该数据块的每一个种类的各相似数据块的实时描述知识变量,抽取得到该种类的信息对应的第二描述知识变量;基于该数据块的实时描述知识变量和该数据块对应的各第二描述知识变量,得到该数据块的目标描述知识变量;其中,若操确定为一轮,实时描述知识变量为原始描述知识变量,目标描述知识变量为数据块描述知识变量,若操确定为不少于两次,第一轮操对应的实时描述知识变量为原始描述知识变量,除第一轮操作之前对应的实时描述知识变量为前一轮操作得到的目标描述知识变量,数据块描述知识变量为最后一轮操作得到的目标描述知识变量;其中,基于描述知识链中各数据块的原始描述知识变量,对各数据块进行进一步的特征抽取,得到各数据块的数据块描述知识变量,通过数据块描述知识变量更深层次的表示数据块的特征。
其中,对于描述知识链中的每一数据块,在得到该数据块的原始描述知识变量之后,可基于该数据块的原始描述知识变量,对该数据块进行不少于一轮的特征抽取,得到该数据块的数据块描述知识变量,即一轮操作对应一轮特征抽取。实时次操作得到的目标描述知识变量确定为下一轮操作的实时描述知识变量。
基于目标数据块的每一个种类的各相似数据块对应的原始描述知识变量,抽取得到每一个该种类的信息对应的第一描述知识变量,包括:对于每一种种类,将目标数据块的该种类的各相似数据块的数据块描述知识变量进行组合,得到该种类的信息对应的第一描述知识变量。
基于目标数据块对应的各第一描述知识变量和目标数据块的原始描述知识变量,抽取待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:将目标数据块对应的各第一描述知识变量和目标数据块的数据块描述知识变量进行整合;基于整合后的描述知识变量,抽取待分析用户医疗数据集的用户医疗数据集描述知识变量。
其中,对应随机一个种类的各相似数据块,不同相似数据块的数据块描述知识变量反映了不同的特征,将各相似数据块的数据块描述知识变量进行组合,将组合后的描述知识变量确定为该种类的信息对应的第一描述知识变量。对于描述知识链中的目标数据块的每一个种类的各相似数据块均进行相同的处理,得到该目标数据块的各种类的信息对应的第一描述知识变量。
其中,在得到各种种类的信息对应的第一描述知识变量之后,可对各种种类的信息对应的第一描述知识变量和目标数据块的数据块描述知识变量进行整合,得到整合后的描述知识变量,该整合后的描述知识变量中涵盖了各相似数据块的描述知识变量以及目标数据块的描述知识变量,则对该整合后的描述知识变量进行进一步的特征抽取得到的待分析用户医疗数据集的用户医疗数据集描述知识变量更加精确。
在一种可替换的实施例中,将各种种类的信息对应的第一描述知识变量和目标数据块的数据块描述知识变量进行整合,包括:获得各种类的信息对应的第一占比系数,以及待分析用户医疗数据集对应的第二占比系数;通过各种类的信息对应的第一占比系数,对各种类的信息对应的第一描述知识变量进行处理,得到各种类的信息对应的第二描述知识变量;基于第二占比系数,对目标数据块的数据块描述知识变量进行处理,得到第三描述知识变量;对各种类的信息对应的第二描述知识变量和第三描述知识变量进行整合。
其中,由于不同种类的信息对于待分析用户医疗数据集的用户医疗数据集描述知识变量的重要程度不同,则可通过各种类的信息对应的第一占比系数,以及待分析用户医疗数据集对应的第二占比系数,对各种种类的信息对应的第一描述知识变量和目标数据块的数据块描述知识变量进行整合,以使得到的整合后的描述知识变量中充分考虑到了不同种类的信息对用户医疗数据集描述知识变量的干扰,从而使得最终确定的用户医疗数据集描述知识变量更加精确。
举例而言,第一占比系数可以为占比系数队列,对于目标数据块,该目标数据块对应的占比系数队列中的每一个要素对应于该目标数据块的每一个种类的信息对应的第一描述知识变量。
举例而言,描述知识链中的不同数据块的各种类的信息对应的第一占比系数可以不同。
在得到了待分析用户医疗数据集的用户医疗数据集描述知识变量之后,可基于该用户医疗数据集描述知识变量对待分析用户医疗数据集进行处理,处理的方式有很多,具体处理方式再次不进行逐一限定。下面以用户医疗数据集解析和用户医疗数据集归类为例进行进一步的说明:在一种可替换的实施例中,待分析用户医疗数据集为用户查询的用户医疗数据集,基于用户医疗数据集描述知识变量进行待分析用户医疗数据集的处理,包括:基于待分析用户医疗数据集的用户医疗数据集描述知识变量和第一用户医疗数据集中各待解析用户医疗数据集的用户医疗数据集描述知识变量的关联度,从第一用户医疗数据集中确定出目标解析用户医疗数据集,将目标解析用户医疗数据集发送给目标用户,其中,待分析用户医疗数据集为目标用户查询过的用户医疗数据集;或者,基于第二用户医疗数据集中各用户医疗数据集的用户医疗数据集描述知识变量之间的共性权重,对第二用户医疗数据集中的各用户医疗数据集进行划分处理,其中,待分析用户医疗数据集为第二用户医疗数据集中的每一用户医疗数据集。
其中,基于待分析用户医疗数据集的用户医疗数据集描述知识变量,从第一用户医疗数据集中确定与待分析用户医疗数据集相匹配的待解析用户医疗数据集的一种可实现方案为:基于确定待分析用户医疗数据集的用户医疗数据集描述知识变量相同的方法,确定第一用户医疗数据集中的各待解析用户医疗数据集的用户医疗数据集描述知识变量,然后基于待分析用户医疗数据集的用户医疗数据集描述知识变量和各待解析用户医疗数据集的用户医疗数据集描述知识变量之间的共性权重,确定待分析用户医疗数据集相匹配的目标解析用户医疗数据集。
其中,目标用户指的是查询过待分析用户医疗数据集的随机一个用户。
在一种可替换的实施例中,通过各原始描述知识变量以及匹配关系,确定待分析用户医疗数据集的用户医疗数据集描述知识变量是描述知识链人工智能线程实现的,描述知识链人工智能线程是通过以下方式配置得到的:获得配置数据,配置数据中包括多个范例数据,每一个范例数据包括一个示例用户医疗数据集对应的范例描述知识链以及该范例描述知识链中各数据块的原始描述知识变量,其中,随机一个范例描述知识链中的各数据块包括示例用户医疗数据集对应的第一数据块和各第一信息对应第二数据块,第一信息为示例用户医疗数据集的用户医疗数据集对应数据中随机一个项信息,范例描述知识链的边缘包括第一数据块与各第二数据块之间的关联情况;将各范例数据加载至原始人工智能线程,得到每一个范例数据对应的各数据块的回归分析描述知识变量;对于每一个范例数据,基于该范例数据的范例描述知识链中第一数据块的回归分析描述知识变量和各第二数据块的回归分析描述知识变量之间的共性权重,确定范例数据对应的第一配置质量评估结果;通过各范例数据对应的第一配置质量评估结果,确定描述知识链人工智能线程对应的全局配置质量评估结果;若全局配置质量评估结果符合配置终止要求,则终止配置,并将配置终止时对应的线程确定为描述知识链人工智能线程,否则,调试描述知识链人工智能线程的线程系数,并基于配置数据对描述知识链人工智能线程继续进行配置。
其中,范例描述知识链指的是示例用户医疗数据集对应的描述知识链,范例描述知识链中各数据块的原始描述知识变量可基于前文所描述的待分析用户医疗数据集对应的描述知识链中各数据块的原始描述知识变量的方式确定,在此不再赘述。
其中,对于一个范例数据,通过原始人工智能线程得到该范例数据对应的示例用户医疗数据集对应的数据块(第一数据块)的回归分析描述知识变量的具体确定过程,可参照前文描述的通过各原始描述知识变量以及匹配关系,确定待分析用户医疗数据集的用户医疗数据集描述知识变量的方式确定,在此不再赘述。对于该范例数据对应的范例描述知识链中的其他数据块,可以采用上述相同的方式确定其他数据块中各数据块对应的回归分析描述知识变量,譬如,对于将范例描述知识链中除示例用户医疗数据集对应的数据块之外其他数据块中的随机一个数据块,可基于该数据块的数据块描述知识变量以及该数据块的相似数据块对应的第一描述知识变量,确定该数据块的回归分析描述知识变量。
对于每一个范例数据,第一配置质量评估结果表示了该范例数据的范例描述知识链中第一数据块的回归分析描述知识变量和各第二数据块的回归分析描述知识变量之间的差异。该质量评估结果越大,表明第一数据块的回归分析描述知识变量和第二数据块之间的差异越大。对于该线程,全局配置质量评估结果越小,表示线程的性能越好,即基于线程确定出的用户医疗数据集描述知识变量越精确。
在一种可替换的实施例中,对于每一个范例描述知识链,范例描述知识链中还包括各第二信息对应的第三数据块,第二信息包括与示例用户医疗数据集非相关且与第一信息中的至少一项信息相关的信息,对于每一第一信息,范例描述知识链的边缘还包括该第一信息对应的第二数据块与第二信息中与该第一信息相关的信息对应的第三数据块之间的关联情况;该方法还可以包括:对于每一个范例数据,通过各第三数据块的回归分析描述知识变量和第一数据块的回归分析描述知识变量之间的共性权重,确定范例数据对应的第二配置质量评估结果;通过各范例数据对应的第一配置质量评估结果,确定描述知识链人工智能线程对应的全局配置质量评估结果,包括:通过各范例数据对应的第一配置质量评估结果和第二配置质量评估结果,确定全局配置质量评估结果。
通过第二配置质量评估结果对全局配置质量评估结果进行约束,第二配置质量评估结果表示了各第二信息对应的第三数据块的回归分析描述知识变量和第一数据块的回归分析描述知识变量之间的差异。
在配置之前,首先获得多个示例用户医疗数据集,对于每一个示例用户医疗数据集,获得该示例用户医疗数据集的用户医疗数据集对应数据,用户医疗数据集对应数据包括该示例用户医疗数据集的用户医疗数据集目录、该示例用户医疗数据集的匹配用户或该示例用户医疗数据集的匹配用户医疗数据集的至少一项。在本示例中,用户医疗数据集对应数据包括至少两个用户医疗数据集目录。
对于每一个示例用户医疗数据集,基于该示例用户医疗数据集和该示例用户医疗数据集的用户医疗数据集对应数据,搭建该示例用户医疗数据集对应的描述知识链(本示例中,可称为范例描述知识链,或者也可为异常描述知识链)。其中,该异常描述知识链中的数据块包括该用户医疗数据集对应数据对应的数据块以及该示例用户医疗数据集对应的数据块,该异常描述知识链的边缘包括该示例用户医疗数据集对应的数据块和该用户医疗数据集对应数据中各类信息各自对应的数据块之间的关联情况,以及各用户医疗数据集目录所对应的数据块之间的关联情况。用户医疗数据集对应数据中的每一种信息对应的数据块属于一种种类的数据块,则该异常描述知识链中包括4种种类的数据块。
对每一个示例用户医疗数据集均进行上述相同的处理,得到各示例用户医疗数据集对应的异常描述知识链。
对于每一个异常描述知识链,获得该异常描述知识链中各数据块的原始描述知识变量,具体实现方式可参见前文描述的获得待分析用户医疗数据集对应描述知识链中各数据块的原始描述知识变量的方式,在此不再赘述。
在得到各示例用户医疗数据集对应的异常描述知识链和各异常描述知识链中各数据块的原始描述知识变量之后,将一个示例用户医疗数据集对应的异常描述知识链和该异常描述知识链中各数据块的原始描述知识变量确定为一个范例数据,得到多个范例数据。
对于配置阶段,将各范例数据加载至原始人工智能线程,通过原始人工智能线程执行以下操作得到每一个范例数据对应的各数据块的回归分析描述知识变量:具体的:对于每一个范例数据,基于该范例数据对应的异常描述知识链,确定该范例数据中示例用户医疗数据集对应的数据块的各相似数据块。为描述方便,下文将该示例用户医疗数据集对应的数据块称为第一数据块,将该第一数据块的相似数据块称为第二数据块(即各第一信息对应的第二数据块)。
对于每一个范例数据,基于该范例数据对应的异常描述知识链中各数据块的原始描述知识变量,抽取该异常描述知识链中各数据块的数据块描述知识变量。
对于每一个范例数据中每一个种类的相似数据块,对该种类的各相似数据块的数据块描述知识变量进行组合,得到该种类的信息对应的第一描述知识变量。
然后,对于每一个范例数据,获得各种类的信息对应的第一占比系数,以及该范例数据中的示例用户医疗数据集对应的第二占比系数;通过各种类的信息对应的第一占比系数,对各种类的信息对应的第一描述知识变量进行处理,得到各种类的信息对应的第二描述知识变量;基于第二占比系数,对第一数据块的数据块描述知识变量进行处理,得到第三描述知识变量;对各种类的信息对应的第二描述知识变量和第三描述知识变量进行整合,基于整合后的描述知识变量,抽取示例用户医疗数据集对应数据块的回归分析描述知识变量。
基于上述相同的方法,对该范例数据对应的异常描述知识链中的每一个数据块均执行以上操作,得到该异常描述知识链中各数据块的回归分析描述知识变量。
对于每一个范例数据,基于该范例数据的范例描述知识链中第一数据块的回归分析描述知识变量和各第二数据块的回归分析描述知识变量之间的共性权重,确定范例数据对应的第一配置质量评估结果。并通过各第三数据块的回归分析描述知识变量和第一数据块的回归分析描述知识变量之间的共性权重,确定范例数据对应的第二配置质量评估结果。
通过各范例数据对应的第一配置质量评估结果和第二配置质量评估结果,确定描述知识链人工智能线程对应的全局配置质量评估结果。
表示第二配置质量评估结果, 对应的队列中的每一个要素表示两个回归分析描述知识变量(第一数据块对应的回归分析描述知识变量表示与第三数据块的回归分析描述知识变量)之间的共性权重,该队列中,各要素对应的共性权重越低越好,即第一数据块与第三数据块之间的越不相似,线程的性能越好。 表示一个范例数据对应的全局配置质量评估结果,该质量评估结果越小,线程的性能越好。
若线程对应的全局配置质量评估结果符合配置终止要求,则终止配置,并将配置终止时对应的线程确定为描述知识链人工智能线程,否则,调试描述知识链人工智能线程的线程系数,并基于配置数据对描述知识链人工智能线程继续进行配置。
其中,配置终止要求可以为小于设定阈值,则在全局配置质量评估结果小于设定阈值时,终止配置。将配置终止时对应的线程确定为描述知识链人工智能线程,否则,调试描述知识链人工智能线程的线程系数,并基于配置数据对描述知识链人工智能线程继续进行配置。
在配置得到上述描述知识链人工智能线程之后,可基于该描述知识链人工智能线程确定用户医疗数据集的用户医疗数据集描述知识变量。
譬如,对于用户查询的一个用户医疗数据集,可将该用户医疗数据集对应的异常描述知识链以及该异常描述知识链中各数据块的原始描述知识变量加载至配置好的描述知识链人工智能线程,得到该用户医疗数据集的用户医疗数据集描述知识变量,然后基于该用户医疗数据集的用户医疗数据集描述知识变量,从第一用户医疗数据集中确定出该用户医疗数据集相关的待解析用户医疗数据集,并将待解析用户医疗数据集发送给用户。
在上述基础上,请结合参阅图2,提供了一种基于妇幼服务平台的数据管控装置200,所述装置包括:
数据获得模块210,用于获得待分析用户医疗数据集的所述用户医疗数据集对应数据包括所述待分析用户医疗数据集的用户医疗数据集目录、所述待分析用户医疗数据集的匹配用户或所述待分析用户医疗数据集的匹配用户医疗数据集的至少一项;
变量获得模块220,用于获得所述待分析用户医疗数据集以及所述用户医疗数据集对应数据中各类信息的原始描述知识变量;
数据匹配模块230,用于确定所述待分析用户医疗数据集对应的匹配关系,其中,所述匹配关系为所述待分析用户医疗数据集和所述用户医疗数据集对应数据中各类信息之间的匹配关系;
数据管理模块240,用于通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,以通过所述用户医疗数据集描述知识变量进行所述待分析用户医疗数据集的处理,获得处理结果,对所述处理结果进行分类管理。
在上述基础上,示出了一种基于妇幼服务平台的数据管控系统300,包括互相之间通信的处理器310和存储器320,所述处理器310用于从所述存储器320中读取计算机程序并执行,以实现上述的方法。
在上述基础上,还提供了一种计算机可读存储介质,其上存储的计算机程序在运行时实现上述的方法。
综上,基于上述方案,本申请实施例所提供的方案,在获得用户医疗数据集的描述知识变量时,除了考虑待分析用户医疗数据集本身之前,还考虑了该用户医疗数据集的用户医疗数据集对应数据,具体的,用户医疗数据集对应数据包括待分析用户医疗数据集的用户医疗数据集目录、待分析用户医疗数据集的匹配用户或待分析用户医疗数据集的匹配用户医疗数据集的至少一项,用户医疗数据集目录是能够反映了用户医疗数据集中的各个用户的描述内容,匹配用户医疗数据集可以反映就诊者个人情况,即匹配用户医疗数据集能够从另一个方面反映待分析用户医疗数据集的用户医疗数据集特征,而待分析用户医疗数据集通常也是与匹配用户对应的私人信息相关,因此匹配用户也是能够从一定程度与能够反映用户医疗数据集特征的对应数据,因此,确定出的用户医疗数据集描述知识变量中不仅涵盖了用户医疗数据集本身的信息,还包括与用户医疗数据集相关的多个不同维度的信息以及不断更新的用户医疗数据集,因此获得用户医疗数据集对应数据的数据量是十分庞大的,在进行数据管理时,可能导致相关设备死机或者不能正常工作的情况,本申请只对上述问题进行优化,能够有效的改善由于数据量过大导致服务平台不能正常工作的情况,从而保障数据管理的可靠性,提高用户的体验感。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (7)

1.一种基于妇幼服务平台的数据管控方法,其特征在于,所述方法包括:
获得待分析用户医疗数据集的所述用户医疗数据集对应数据包括所述待分析用户医疗数据集的用户医疗数据集目录、所述待分析用户医疗数据集的匹配用户或所述待分析用户医疗数据集的匹配用户医疗数据集的至少一项;
获得所述待分析用户医疗数据集以及所述用户医疗数据集对应数据中各类信息的原始描述知识变量;
确定所述待分析用户医疗数据集对应的匹配关系,其中,所述匹配关系为所述待分析用户医疗数据集和所述用户医疗数据集对应数据中各类信息之间的匹配关系;
通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,以通过所述用户医疗数据集描述知识变量进行所述待分析用户医疗数据集的处理,获得处理结果,对所述处理结果进行分类管理;
其中,所述确定所述待分析用户医疗数据集对应的匹配关系,包括:通过所述用户医疗数据集对应数据以及所述待分析用户医疗数据集,搭建所述待分析用户医疗数据集对应的描述知识链,所述描述知识链表示了所述匹配关系;其中,所述描述知识链中的数据块包括所述待分析用户医疗数据集对应的数据块、以及所述用户医疗数据集对应数据中各类信息各自对应的数据块,所述描述知识链的边缘包括所述待分析用户医疗数据集和所述用户医疗数据集对应数据中各类信息对应的数据块之间的关联情况;
所述通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:通过各所述原始描述知识变量以及所述描述知识链,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量;
其中,所述通过各所述原始描述知识变量以及所述描述知识链,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:
对于所述描述知识链中目标数据块,通过所述目标数据块的每一个种类的各相似数据块对应的原始描述知识变量,抽取得到每一个种类的信息对应的第一描述知识变量,所述目标数据块为所述待分析用户医疗数据集对应的数据块,所述用户医疗数据集对应数据中的每一种信息对应的数据块属于一种种类的数据块;
通过所述目标数据块所对应的各第一描述知识变量和所述目标数据块的原始描述知识变量,抽取所述待分析用户医疗数据集的用户医疗数据集描述知识变量;
其中,所述方法还包括:对于所述描述知识链中每一数据块,通过执行不少于一轮以下操作抽取该数据块的数据块描述知识变量:
基于该数据块的每一个种类的各相似数据块的实时描述知识变量,抽取得到该种类的信息对应的第二描述知识变量;
基于该数据块的实时描述知识变量和该数据块对应的各第二描述知识变量,得到该数据块的目标描述知识变量;其中,若所述操作确定为一轮,所述实时描述知识变量为所述原始描述知识变量,所述目标描述知识变量为所述数据块描述知识变量,若所述操作确定为不少于两次,第一轮操作对应的实时描述知识变量为所述原始描述知识变量,除所述第一轮操作之外对应的实时描述知识变量为前一轮操作得到的目标描述知识变量,所述数据块描述知识变量为最后一轮操作得到的目标描述知识变量;
所述通过所述目标数据块的每一个种类的各相似数据块对应的原始描述知识变量,抽取得到每一个该种类的信息对应的第一描述知识变量,包括:对于每一种种类,将所述目标数据块的该种类的各相似数据块的数据块描述知识变量进行组合,得到该种类的信息对应的第一描述知识变量;
所述通过所述目标数据块对应的各第一描述知识变量和所述目标数据块的原始描述知识变量,抽取所述待分析用户医疗数据集的用户医疗数据集描述知识变量,包括:将所述目标数据块对应的各第一描述知识变量和所述目标数据块的数据块描述知识变量进行整合;基于整合后的描述知识变量,抽取所述待分析用户医疗数据集的用户医疗数据集描述知识变量。
2.如权利要求1所述的方法,其特征在于,所述用户医疗数据集对应数据包括至少一个用户医疗数据集目录,所述描述知识链的边缘还包括各用户医疗数据集目录所对应的数据块之间的关联情况。
3.如权利要求1所述的方法,其特征在于,将各种所述种类的信息对应的第一描述知识变量和所述目标数据块的数据块描述知识变量进行整合,包括:
获得各所述种类的信息对应的第一占比系数,以及所述待分析用户医疗数据集对应的第二占比系数;
通过各所述种类的信息对应的第一占比系数,对各所述种类的信息对应的第一描述知识变量进行处理,得到各所述种类的信息对应的第二描述知识变量;
通过所述第二占比系数,对所述目标数据块的数据块描述知识变量进行处理,得到第三描述知识变量;
对各所述种类的信息对应的第二描述知识变量和所述第三描述知识变量进行整合。
4.如权利要求3所述的方法,其特征在于,所述获得所述待分析用户医疗数据集以及所述用户医疗数据集对应数据中各类信息的原始描述知识变量,包括:
获得所述待分析用户医疗数据集的用户医疗数据集标签,抽取所述用户医疗数据集标签对应的标签描述知识变量,将所述标签描述知识变量确定为所述待分析用户医疗数据集的原始描述知识变量;
若所述用户医疗数据集对应数据包括所述匹配用户,对于随机一个所述匹配用户,获得所述匹配用户对应的示例用户医疗数据集,通过所述示例用户医疗数据集确定所述匹配用户的原始描述知识变量。
5.如权利要求1所述的方法,其特征在于,通过所述用户医疗数据集描述知识变量进行所述待分析用户医疗数据集的处理,包括:
通过所述待分析用户医疗数据集的用户医疗数据集描述知识变量和第一用户医疗数据集中各待解析用户医疗数据集的用户医疗数据集描述知识变量的关联度,从第一用户医疗数据集中确定出目标解析用户医疗数据集,将所述目标解析用户医疗数据集发送给目标用户,其中,所述待分析用户医疗数据集为所述目标用户查询过的用户医疗数据集;
或者,基于第二用户医疗数据集中各用户医疗数据集的用户医疗数据集描述知识变量之间的共性权重,对所述第二用户医疗数据集中的各用户医疗数据集进行划分处理,其中,所述待分析用户医疗数据集为第二用户医疗数据集中的每一用户医疗数据集。
6.如权利要求1所述的方法,其特征在于,所述通过各所述原始描述知识变量以及所述匹配关系,确定所述待分析用户医疗数据集的用户医疗数据集描述知识变量是描述知识链人工智能线程实现的,所述描述知识链人工智能线程是通过以下方式配置得到的:
获得配置数据,所述配置数据中包括多个范例数据,每一个范例数据包括一个示例用户医疗数据集对应的范例描述知识链以及该范例描述知识链中各数据块的原始描述知识变量,其中,随机一个范例描述知识链中的各数据块包括示例用户医疗数据集对应的第一数据块和各第一信息对应第二数据块,所述第一信息为示例用户医疗数据集的用户医疗数据集对应数据中随机一个项信息,所述范例描述知识链的边缘包括所述第一数据块与各所述第二数据块之间的关联情况;
将各所述范例数据加载至原始人工智能线程,得到每一个所述范例数据对应的各数据块的回归分析描述知识变量;
对于每一个所述范例数据,基于该范例数据的范例描述知识链中第一数据块的回归分析描述知识变量和各第二数据块的回归分析描述知识变量之间的共性权重,确定所述范例数据对应的第一配置质量评估结果;
通过各所述范例数据对应的第一配置质量评估结果,确定所述描述知识链人工智能线程对应的全局配置质量评估结果;
若所述全局配置质量评估结果符合配置终止要求,则终止配置,并将配置终止时对应的线程确定为所述描述知识链人工智能线程,否则,调试所述描述知识链人工智能线程的线程系数,并通过所述配置数据对所述描述知识链人工智能线程继续进行配置;
其中,对于每一个所述范例描述知识链,所述范例描述知识链中还包括各第二信息对应的第三数据块,所述第二信息包括与所述示例用户医疗数据集非相关且与所述第一信息中的至少一项信息相关的信息,对于每一所述第一信息,所述范例描述知识链的边缘还包括该第一信息对应的第二数据块与所述第二信息中与该第一信息相关的信息对应的第三数据块之间的关联情况;所述方法还包括:对于每一个所述范例数据,通过各所述第三数据块的回归分析描述知识变量和所述第一数据块的回归分析描述知识变量之间的共性权重,确定所述范例数据对应的第二配置质量评估结果;
所述通过各所述范例数据对应的第一配置质量评估结果,确定所述描述知识链人工智能线程对应的全局配置质量评估结果,包括:通过各所述范例数据对应的第一配置质量评估结果和所述第二配置质量评估结果,确定所述全局配置质量评估结果。
7.一种基于妇幼服务平台的数据管控系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-6任一项所述的方法。
CN202310307713.1A 2023-03-28 2023-03-28 基于妇幼服务平台的数据管控方法及系统 Active CN116028689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310307713.1A CN116028689B (zh) 2023-03-28 2023-03-28 基于妇幼服务平台的数据管控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310307713.1A CN116028689B (zh) 2023-03-28 2023-03-28 基于妇幼服务平台的数据管控方法及系统

Publications (2)

Publication Number Publication Date
CN116028689A CN116028689A (zh) 2023-04-28
CN116028689B true CN116028689B (zh) 2023-06-06

Family

ID=86077885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310307713.1A Active CN116028689B (zh) 2023-03-28 2023-03-28 基于妇幼服务平台的数据管控方法及系统

Country Status (1)

Country Link
CN (1) CN116028689B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558393B (zh) * 2024-01-12 2024-03-19 成都市龙泉驿区中医医院 基于人工智能的肛肠患者信息整理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125724A (zh) * 2018-10-31 2020-05-08 崔旭 一种基于区块链技术的权益自主的数据集交易方法和系统
CN112866990A (zh) * 2021-01-07 2021-05-28 哈尔滨工业大学(深圳) 一种具有激励机制的条件身份匿名隐私保护公共审计方法
CN114969137A (zh) * 2021-02-22 2022-08-30 苏州超块链信息科技有限公司 一种时序网络数据集的规则化分散及收拢方法
CN115063092A (zh) * 2022-08-19 2022-09-16 大汉电子商务有限公司 基于物联网和区块链技术的订单核定系统和方法
CN115732050A (zh) * 2022-09-26 2023-03-03 刘永皓 一种医疗大数据信息智能采集方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3942740A1 (en) * 2019-03-20 2022-01-26 Verint Systems Ltd. System and method for de-anonymizing actions and messages on networks
US20220292543A1 (en) * 2021-03-09 2022-09-15 Alexandra Valentina Henderson Pop-up retial franchising and complex econmic system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125724A (zh) * 2018-10-31 2020-05-08 崔旭 一种基于区块链技术的权益自主的数据集交易方法和系统
CN112866990A (zh) * 2021-01-07 2021-05-28 哈尔滨工业大学(深圳) 一种具有激励机制的条件身份匿名隐私保护公共审计方法
CN114969137A (zh) * 2021-02-22 2022-08-30 苏州超块链信息科技有限公司 一种时序网络数据集的规则化分散及收拢方法
CN115063092A (zh) * 2022-08-19 2022-09-16 大汉电子商务有限公司 基于物联网和区块链技术的订单核定系统和方法
CN115732050A (zh) * 2022-09-26 2023-03-03 刘永皓 一种医疗大数据信息智能采集方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Analysis of Blockchain in the Healthcare Sector: Application and Issues;Ammar Odeh 等;《Symmetry》;第14卷(第9期);1-22 *
Factors influencing blockchain adoption in supply chain management practices: A study based on the oil industry;Javed Aslam 等;《Journal of Innovation & Knowledge》;第6卷(第2期);124-134 *
云计算服务中的区块链技术研究;李嘉兴;《中国博士学位论文全文数据库 信息科技辑》(第08(2021)期);I138-4 *
区块链系统下的多方密钥协商协议;唐春明 等;《信息网络安全》(第12期);17-21 *

Also Published As

Publication number Publication date
CN116028689A (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
US11232365B2 (en) Digital assistant platform
US20210374610A1 (en) Efficient duplicate detection for machine learning data sets
US20200050968A1 (en) Interactive interfaces for machine learning model evaluations
CA3046247C (en) Data platform for automated data extraction, transformation, and/or loading
US7788213B2 (en) System and method for a multiple disciplinary normalization of source for metadata integration with ETL processing layer of complex data across multiple claim engine sources in support of the creation of universal/enterprise healthcare claims record
US20130086040A1 (en) Systems and methods for dynamic on-going decision support and trending based on a flexible data model
US20080306984A1 (en) System and method for semantic normalization of source for metadata integration with etl processing layer of complex data across multiple data sources particularly for clinical research and applicable to other domains
US20150347599A1 (en) Systems and methods for electronic health records
US11222731B2 (en) Balancing provenance and accuracy tradeoffs in data modeling
US20200311610A1 (en) Rule-based feature engineering, model creation and hosting
US20150006543A1 (en) Determining mappings for application integration based on user contributions
US20170286843A1 (en) Data driven featurization and modeling
CN116028689B (zh) 基于妇幼服务平台的数据管控方法及系统
Li et al. Using association rule mining for phenotype extraction from electronic health records
Alshammari et al. Developing a predictive model of predicting appointment no-show by using machine learning algorithms
CN114496140B (zh) 查询条件的数据匹配方法、装置、设备及介质
US20240037065A1 (en) Data archival system and method
Rudd et al. A global perspective on data powering responsible AI solutions in health applications
Hong et al. Shiny FHIR: an integrated framework leveraging Shiny R and HL7 FHIR to empower standards-based clinical data applications
Stiles et al. Behind-the-scenes of patient-centered care: content analysis of electronic messaging among primary care clinic providers and staff
Martsenyuk et al. On an approach of the solution of machine learning problems integrated with data from the open-source system of electronic medical records: Application for fractures prediction
CN114496139A (zh) 电子病历的质控方法、装置、设备、系统及可读介质
Kryszyn et al. Comparison of OpenEHR and HL7 FHIR Standards
Shan et al. Digital transformation method for healthcare data
US20230153757A1 (en) System and Method for Rapid Informatics-Based Prognosis and Treatment Development

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant