CN115017221A - Ai数据云测质量的提升方法、装置、设备及存储介质 - Google Patents

Ai数据云测质量的提升方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115017221A
CN115017221A CN202210845285.3A CN202210845285A CN115017221A CN 115017221 A CN115017221 A CN 115017221A CN 202210845285 A CN202210845285 A CN 202210845285A CN 115017221 A CN115017221 A CN 115017221A
Authority
CN
China
Prior art keywords
data
data set
standard
metadata
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210845285.3A
Other languages
English (en)
Inventor
舒振峰
杨政
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Compass Medical Technology Co ltd
Original Assignee
Shenzhen Compass Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Compass Medical Technology Co ltd filed Critical Shenzhen Compass Medical Technology Co ltd
Priority to CN202210845285.3A priority Critical patent/CN115017221A/zh
Publication of CN115017221A publication Critical patent/CN115017221A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Epidemiology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明属于临床数据处理技术领域,公开了一种AI数据云测质量的提升方法、装置、设备及存储介质。该方法包括:对各医疗数据库内数据进行整合,确定第一数据集;基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集;将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库;对所述原始规则及元数据初筛内容数据库中的指标元数据集合进行数据质量评估,得到新标准数据集;将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。通过上述方式,能够有效提高临床应用数据的质量。

Description

AI数据云测质量的提升方法、装置、设备及存储介质
技术领域
本发明涉及临床数据处理技术领域,尤其涉及一种AI数据云测质量的提升方法、装置、设备及存储介质。
背景技术
临床数据的质量是生成临床医疗质量指标的关键,而临床数据的质量受多方面因素影响,比如,在院内数据是有限的情况下,医务工作者因规则太多而无法记住相关规则或最新规则的改变时,会对临床数据的质量造成影响,还比如,医务工作者只做了简单的数据匹配,而对应标准的数据匹配才能得到高质量的临床数据,这也会对临床数据的质量造成影响。
发明内容
本发明的主要目的在于提供一种AI数据云测质量的提升方法、装置、设备及存储介质,旨在解决现有技术中临床数据质量不高的技术问题。
为实现上述目的,本发明提供了一种AI数据云测质量的提升方法,所述方法包括以下步骤:
S10、对各医疗数据库内数据进行整合,确定第一数据集;
S20、基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集;
S30、将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库;
S40、对所述数据库中的指标元数据集合进行数据质量评估,得到新标准数据集;
S50、将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。
优选地,所述预设标准包括地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准;
所述基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集,包括:
基于地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的共有标准,对所述第一数据集进行比对及智能运算,得到第一相关数据;
基于地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的非共有标准,对所述第一数据集进行交叉比对及智能运算,得到第二相关数据;
基于所述第一相关数据和所述第二相关数据,得到第二数据集。
优选地,所述将所述第一数据集和所述第二数据集进行规则变更,包括:
将所述第一数据集和所述第二数据集用标准数据模板进行梳理。
优选地,所述利用经过规则变更后的第一数据集和第二数据集来建库,得到原始规则及元数据初筛内容数据库,包括:
通过对经过规则变更后的第一数据集和第二数据集进行字段确定和提取,得到第一指标元数据集;
通过对经过规则变更后的第一数据集和第二数据集进行文本结构化处理,得到第二指标元数据集;
通过对经过规则变更后的第一数据集和第二数据集进行名称编码,得到第三指标元数据集;
基于所述第一指标元数据集、所述第二指标元数据集及所述第三指标元数据集,生成指标元数据集合,得到原始规则及元数据初筛内容数据库。
优选地,在所述步骤S40之前,还包括;
对经过规则变更后的第一数据集和第二数据集进行可用性评估,其中,所述可用性评估包括数据一致性评估、代码和名称一致性评估及数据精确性评估;
根据评估结果来更新所述原始规则及元数据初筛内容数据库。
优选地,在所述步骤S40之前,还包括:
基于所述经过规则变更后的第一数据集和第二数据集,通过大数据挖掘和推算算法融合推算出新数据;
根据所述新数据来更新所述原始规则及元数据初筛内容数据库。
优选地,在所述步骤S50之后,还包括:
S60、将所述临床应用数据集输入到卷积神经网络中,获取未知元数据;
S70、在将所述未知元数据与所述指标元数据集合进行比对之后,更新所述指标元数据集合,并根据新的指标元数据集合来重复步骤S40-S70。
此外,为实现上述目的,本发明还提出一种AI数据云测质量的提升装置,所述AI数据云测质量的提升装置包括:
确定模块,用于对各医疗数据库内数据进行整合,确定第一数据集;
所述确定模块,用于基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集;
建库模块,用于将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库;
评估模块,用于对所述原始规则及元数据初筛内容数据库中的指标元数据集合进行数据质量评估,得到新标准数据集;
生成模块,用于将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。
此外,为实现上述目的,本发明还提出一种AI数据云测质量的提升设备,所述AI数据云测质量的提升设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的AI数据云测质量的提升程序,所述AI数据云测质量的提升程序配置为实现如上文所述的AI数据云测质量的提升方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有AI数据云测质量的提升程序,所述AI数据云测质量的提升程序被处理器执行时实现如上文所述AI数据云测质量的提升方法的步骤。
本发明实施例提供的AI数据云测质量的提升方法、装置、设备及存储介质,通过对各医疗数据库内数据进行模糊逻辑整合得到第一数据集,再第一数据集与预设标准进行交叉比对及智能运算,得到第二数据集,将第一数据集与第二数据集统一成一个标准后生成指标元数据集合并存储于数据库中,为了进一步提高AI数据质量,先对指标元数据集合进行数据质量评估后再输入至深度学习网络中,通过深度学习网络确定新标准数据集中需要应用到的数据集的概率或者准确度,从中筛选出概率或者准确度大于一定数值的数据作为临床应用数据集,能够有效提高最终生成的临床应用数据集的质量,进而提高生成临床医疗质量指标。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的AI数据云测质量的提升设备的结构示意图;
图2为本发明AI数据云测质量的提升方法第一实施例的流程示意图;
图3为本发明AI数据云测质量的提升方法第二实施例的流程示意图;
图4为本发明AI数据云测质量的提升方法第三实施例的流程示意图;
图5为本发明AI数据云测质量的提升方法第三实施例中的循环流程图;
图6为本发明AI数据云测质量的提升装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的AI数据云测质量的提升设备结构示意图。
如图1所示,该AI数据云测质量的提升设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成AI数据云测质量的提升设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及AI数据云测质量的提升程序。
在图1所示的AI数据云测质量的提升设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明AI数据云测质量的提升设备中的处理器1001、存储器1005可以设置AI数据云测质量的提升设备中,所述AI数据云测质量的提升设备通过处理器1001调用存储器1005中存储的AI数据云测质量的提升程序,并执行本发明实施例提供的AI数据云测质量的提升方法。
本发明实施例提供了一种AI数据云测质量的提升方法,参照图2,图2为本发明一种AI数据云测质量的提升方法第一实施例的流程示意图。
本实施例中,所述AI数据云测质量的提升方法包括以下步骤:
步骤S10:对各医疗数据库内数据进行整合,确定第一数据集。
具体地,各医疗数据库包括:医疗管理信息系统(HIS系统)、实验室信息管理系统(LIS系统)、医学影像存档与通讯系统(PACS系统)、临床信息系统(CIS系统)、计算机化病历系统(EMR数据)、手术麻醉系统、院内决策系统、急诊系统、重症系统及护理系统。以病人信息为逻辑点,将各医疗数据库内的数据通过模糊逻辑整合起来,得到基于病人标准的数据集即第一数据集,示例性地,病人信息可以为病人的ID、病人的病症、病人的检验指标及病人的首次诊断,其中,病人的首次诊断指的是每次看病时未出检验结果前的诊断,可以确定的是病人信息越多时,得到的第一数据集中的数据噪声将会越小,在此不对病人信息做限定。在本步骤中,集成了很多的医院系统,能够确保用于诊疗分析研究数据的可用性,示例性地,心电图和心脏彩超的影响着心血管疾病的诊疗,也是疗效评估的依据,如果仅仅通过HIS系统和LIS系统来确定第一数据集,那么就会因为第一数据集中缺乏心电图和心脏彩超数据,而影响心血管疾病的诊疗。
步骤S20:基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集。
需要说明的是,交叉比对即为从数据集的各个维度进行比对;智能运算包括但不限于模糊逻辑和语义分析,其中,语义分析的模型公式为:
Figure 725547DEST_PATH_IMAGE001
其中,Zλ表示归一化因子,x表示第一数据集的其中一个元素,y表示元素对应的输出,λi表示第i个系统参数,fi(x,y)表示元素函数,用于表示某个元素对某个输出是否有影响的事实,pλ(y|x)表示给定x之后输出y的分布。
具体地,所述预设标准包括地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准,在大多数情况下,不同标准对同一病种的判定条件是相同,但也存有在不同标准下,对同一病种的判定条件是不同的,示例性地,α病种在地区高发病症医学诊疗临床数据下的判定条件与在国际医学级国内临床数据共识标准下的判定条件不同,在地区高发病症医学诊疗临床数据下,α病种的判定条件为A+B+C,即只有病人存在A症状,B症状以及C症状时,才能根据地区高发病症医学诊疗临床数据判定病人属于α病种;在国际医学级国内临床数据共识标准下,α病种的判定条件为A+B,即只要病人存在A症状和B症状时,就能通过国际医学级国内临床数据共识标准判定病人属于α病种。
具体地,基于地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的共有标准,对所述第一数据集进行比对及智能运算,得到第一相关数据;和,基于地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的非共有标准,对所述第一数据集进行交叉比对及智能运算,得到第二相关数据;基于所述第一相关数据和所述第二相关数据,得到第二数据集。
其中,共有标准可以理解为某一病种在地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准下的判定条件是相同的,非共有标准可以理解为某一病种在不同标准下的判定条件是不同的,也可以理解在不同标准下对同一病种所运用到的相关术语不同,还可以理解为在某一病种存在于国际医学级国内临床数据共识标准中而不存在于地区高发病症医学诊疗临床数据中。示例性地,β病种在国际医学级国内临床数据共识标准下的判断条件为A+B+D,β病种在国际医学级国内临床数据共识标准下的判断条件为A+B+C,那么在整合数据时,病人符合A+B+D的症状或者符合A+B+C的症状时,都能归到β病种中。以病种来整理所有数据,得到基于预设标准的数据集即第二数据集。第一数据集和第二数据集均为原始数据集,是依据医疗数据库中已有的数据信息进行整合得到的。
需要说明的是,第二数据集为标准集对比结果数据集。
步骤S30:将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库。
具体地,规则变更可以理解为通过自主数据库规则对数据集进行内容添加、修正、纠错以及运算,将所述第一数据集和所述第二数据集进行规则变更即为通过自主数据库规则分别对第一数据集和第二数据集进行内容添加、修正、纠错以及运算。
具体地,将所述第一数据集和所述第二数据集用标准数据模板进行梳理,自动提取所述第一数据集与所述第二数据集中与所述标准数据模板相匹配的数据即经过规则变更后的第一数据集和第二数据集。经过规则变更后的第一数据集和第二数据集是统一成一个标准的数据。利用经过规则变更后的第一数据集和第二数据集来建库,主要是为了将第一数据集和第二数据集整合成一类数据集,此次建库套用新的标准,生成更加精准的数据集,示例性地,将胃疼、下胃有点疼、胃周疼,这三种不同的说法变成一个标准的数据集,并存储到数据库中。
具体地,通过对经过规则变更后的第一数据集和第二数据集进行字段确定和提取,得到第一指标元数据集;通过对经过规则变更后的第一数据集和第二数据集进行文本结构化处理,得到第二指标元数据集;通过对经过规则变更后的第一数据集和第二数据集进行名称编码,得到第三指标元数据集;基于所述第一指标元数据集、所述第二指标元数据集及所述第三指标元数据集,生成指标元数据集合,得到原始规则及元数据初筛内容数据库。
需要说明的是,可以通过ETL算法来对数据集进行字段确定和提取,具体地ETL 算法可以是全历史拉链模型算法:拉链表是一张至少存在PK字段、跟踪变化的字段、开链日期、闭链日期组成的数据仓库ETL数据表即数据集;根据开链、闭链日期可以从数据集中快速提取对应日期有效数据,进而完成通过ETL算法来对数据集进行字段确定和提取。
具体地,对经过规则变更后的第一数据集和第二数据集进行文本结构化处理方式为:
由于两个词语在不同的上下文中可以互相替换使用而不改变文本语义的可能性越大,两者的相似度就越高,否则相似度越低。相似度以一个数值表示,一般取值范围在[0,1]之间。一个词语与其本身的语义相似度为1,如果两个词语在任何上下文中都不可替换,那么其相似度为0。词语距离是度量两个词语关系的另一个重要指标,用一个[0,∞)之间的实数表示。词语距离和词语相似度之间一定是存在某种关系的:1、两个词语距离为0时,其相似度为1,即,一个词语与其本身的距离为0;2、两个词语距离为无穷大时,其相似度为0;3、两个词语的距离越大,其相似度越小。可以将第一数据集以及第二数据集中的数据进行文本结构化处理,示例性地,可以将词语相似度记为sim(w1,w2),而将词语距离记为dis(w1,w2),那么可以得到
Figure 962811DEST_PATH_IMAGE004
其中,b为可调节参数,通过对第一数据集和第二数据集的文本数据中词语进行词语距离标记,再确定词语之间的相似度,进而完成对第一数据集以及第二数据集中数据的文本结构化处理。
步骤S40:对所述数据库中的指标元数据集合进行数据质量评估,得到新标准数据集。
具体地,指标元数据可以用来描述指标数据的属性信息,需要操作一份数据时需要先得到它的元数据,在对数据库中的数据进行质量评估时,通过指标元数据集合即电子式目录即可找到对应的数据,通过质量评估的数据即为标准数据集中的数据。
步骤S50:将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。
需要说明的是,AI数据云测即临床应用数据集。
具体地,将新标准数据集输入到深度学习网络中,能够输出新标准数据集中需要应用到的数据集的概率或者准确度,从中筛选出概率或者准确度大于预定数值的数据集来作为临床应用数据集,该预定数值可以提前设定好于该AI数据云测质量提升设备中。
本发明实施例提供的AI数据云测质量的提升方法,通过对各医疗数据库内数据进行模糊逻辑整合得到第一数据集,再第一数据集与预设标准进行交叉比对,得到第二数据集,将第一数据集与第二数据集统一成一个标准后生成指标元数据集合并存储于数据库中,为了进一步提高数据质量,先对指标元数据集合进行数据质量评估后再输入至深度学习网络中,通过深度学习网络确定新标准数据集中需要应用到的数据集的概率或者准确度,从中筛选出概率或者准确度大于一定数值的数据作为临床应用数据集,能够有效提高最终生成的临床应用数据集的质量,进而提高生成临床医疗质量指标。
参考图3,图3为本发明一种AI数据云测质量的提升方法第二实施例的流程示意图。
基于上述第一实施例,本实施例AI数据云测质量的提升方法,在所述步骤S40之前,还包括:
步骤S301:对经过规则变更后的第一数据集和第二数据集进行可用性评估,其中,所述可用性评估包括数据一致性评估、代码和名称一致性评估及数据精确性评估;和,基于所述经过规则变更后的第一数据集和第二数据集,通过大数据挖掘和推算算法融合推算出新数据。
步骤S302:根据评估结果和/或所述新数据来更新所述数据初筛内容数据库。
具体地,对经过规则变更后的第一数据集和第二数据集进行可用性评估时,数据集需要同时符合可用性评估中的三个评估条件才能存储到数据库中。还可以根据经过规则变更后的第一数据集和第二数据集利用大数据挖掘和推算算法来推选出新的数据。
本实施例在建立数据初筛内容数据库时,通过可用性评估的方式来确定新数据集以及通过大数据挖掘和推算算法来确定新数据集,并将这些数据集存储到数据库中,能够在保证最终生成的应用数据集的质量的同时有效丰富数据库中的数据量。
参考图4,图4为本发明一种AI数据云测质量的提升方法第三实施例的流程示意图。
基于上述第一实施例,本实施例AI数据云测质量的提升方法,在所述步骤S50之后,还包括:
步骤S60:将所述应用数据集输入到卷积神经网络中,获取未知元数据。
具体地,未知元数据可以理解为预测数据,示例性地,一个病人可能有多次住院的电子病历信息,在对其进行疾病预测的时候,需要考虑多次住院的电子病历序列,而不是某次住院的电子病历,而使用传统的特征抽取方法难以捕捉到病人历次住院之间的变化信息。本步骤中的卷积神经网络采用LSTM模型来对病人历次住院病历进行建模,LSTM模型是对RNN模型的一种改进,它能够选择性地记忆前面节点的信息,因而可以获得更长的最大稳定序列长度,这也更加符合病人的时间关系特点,即一个病人的前一次住院情况总是部分地影响下一次住院时的情况。在用LSTM模型建模时具体使用(sequence to sequence,Seq2Seq)思想构造住院病人向量特征对已知的病患数据进行再次生成并能得知相关疾病可能出现的元数据。
步骤S70:在将所述未知元数据与所述指标元数据集合进行比对之后,更新所述指标元数据集合,并根据新的指标元数据集合来重复步骤S40-S70。
如图5所示,将生成的未知元数据与数据库中的指标元数据进行比对,能够反推回元数据的相关信息关联信息集合点,将反推过程中产生的新数据更新到数据库中的,在不断更新数据库中数据的同时,还能不断提高生成临床应用数据集的质量。
本实施通过LSTM模型来生成预测数据,再将预测数据与数据库中的指标元数据集合进行比对后根据比对结果来更新数据库,在不断丰富数据库中的数据的同时,还能不断地提高生成临床应用数据集的质量。
参照图6,图6为本发明AI数据云测质量的提升装置第一实施例的结构框图。
如图6所示,本发明实施例提出的AI数据云测质量的提升装置包括:
确定模块100,用于对各医疗数据库内数据进行整合,确定第一数据集。
所述确定模块100,用于基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集。
建库模块200,用于将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库。
评估模块300,用于对所述数据库中的指标元数据集合进行数据质量评估,得到新标准数据集。
生成模块400,用于将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。
在一实施例中,所述确定模块100,还用于:
基于地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的共有标准,对所述第一数据集进行比对及智能运算,得到第一相关数据;和,
基于地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的非共有标准,对所述第一数据集进行交叉比对及智能运算,得到第二相关数据;
基于所述第一相关数据和所述第二相关数据,得到第二数据集
在一实施例中,所述建库模块200,还用于:
将所述第一数据集和所述第二数据集用标准数据模板进行梳理。
在一实施例中,所述建库模块200,还用于:
通过对经过规则变更后的第一数据集和第二数据集进行字段确定和提取,得到第一指标元数据集;和,
通过对经过规则变更后的第一数据集和第二数据集进行文本结构化处理,得到第二指标元数据集;和,
通过对经过规则变更后的第一数据集和第二数据集进行名称编码,得到第三指标元数据集;
基于所述第一指标元数据集、所述第二指标元数据集及所述第三指标元数据集,生成指标元数据集合,得到原始规则及元数据初筛内容数据库。
在一实施例中,所述建库模块200,还用于:
对经过规则变更后的第一数据集和第二数据集进行可用性评估,其中,所述可用性评估包括数据一致性评估、代码和名称一致性评估及数据精确性评估;
根据评估结果来更新所述数据库。
在一实施例中,所述建库模块200,还用于:
基于所述经过规则变更后的第一数据集和第二数据集,通过大数据挖掘和推算算法融合推算出新数据;
根据所述新数据来更新所述数据库。
在一实施例中,所述建库模块200,还用于:
将所述应用数据集输入到卷积神经网络中,获取未知元数据;
在将所述未知元数据与所述指标元数据集合进行比对之后,更新所述指标元数据集合。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
由于本发明AI数据云测质量的提升装置采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不一一赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有AI数据云测质量的提升程序,所述AI数据云测质量的提升程序被处理器执行时实现如上文所述的AI数据云测质量的提升方法的步骤。
由于本发明存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不一一赘述。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的AI数据云测质量的提升方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种AI数据云测质量的提升方法,其特征在于,所述AI数据云测质量的提升方法包括:
S10、对各医疗数据库内数据进行整合,确定第一数据集;
S20、基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集;
S30、将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库;
S40、对所述原始规则及元数据初筛内容数据库中的指标元数据集合进行数据质量评估,得到新标准数据集;
S50、将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。
2.如权利要求1所述的方法,其特征在于,所述预设标准包括地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准以及专家共识推荐结果标准;
所述基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集,包括:
基于所述地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的共有标准,对所述第一数据集进行比对及智能运算,得到第一相关数据;
基于所述地区高发病症医学诊疗临床数据、国际医学级国内临床数据共识标准、医学文献标准、医学各分支专家根据历年数据验证结果标准、专家共识推荐结果标准中的非共有标准,对所述第一数据集进行交叉比对及智能运算,得到第二相关数据;
基于所述第一相关数据和所述第二相关数据,得到第二数据集。
3.如权利要求1所述的方法,其特征在于,所述将所述第一数据集和所述第二数据集进行规则变更,包括:
将所述第一数据集和所述第二数据集用标准数据模板进行梳理。
4.如权利要求1所述的方法,其特征在于,所述利用经过规则变更后的第一数据集和第二数据集来建库,得到原始规则及元数据初筛内容数据库,包括:
通过对经过规则变更后的第一数据集和第二数据集进行字段确定和提取,得到第一指标元数据集;
通过对经过规则变更后的第一数据集和第二数据集进行文本结构化处理,得到第二指标元数据集;
通过对经过规则变更后的第一数据集和第二数据集进行名称编码,得到第三指标元数据集;
基于所述第一指标元数据集、所述第二指标元数据集及所述第三指标元数据集,生成指标元数据集合,得到原始规则及元数据初筛内容数据库。
5.如权利要求1所述的方法,其特征在于,在步骤S40之前,还包括;
对经过规则变更后的第一数据集和第二数据集进行可用性评估,其中,所述可用性评估包括数据一致性评估、代码和名称一致性评估及数据精确性评估;
根据评估结果来更新所述原始规则及元数据初筛内容数据库。
6.如权利要求1-5任一项所述的方法,其特征在于,在步骤S40之前,还包括:
基于所述经过规则变更后的第一数据集和第二数据集,通过大数据挖掘和推算算法融合推算出新数据;
根据所述新数据来更新所述原始规则及元数据初筛内容数据库。
7.如权利要求1-5任一项所述的方法,其特征在于,在步骤S50之后,还包括:
S60、将所述临床应用数据集输入到卷积神经网络中,获取未知元数据;
S70、在将所述未知元数据与所述指标元数据集合进行比对之后,更新所述指标元数据集合,并根据新的指标元数据集合重复执行步骤S40-S70。
8.一种AI数据云测质量的提升装置,其特征在于,所述AI数据云测质量的提升装置包括:
确定模块,用于对各医疗数据库内数据进行整合,确定第一数据集;
所述确定模块,用于基于预设标准对所述第一数据集进行交叉比对及智能运算,得到第二数据集;
建库模块,用于将所述第一数据集和所述第二数据集进行规则变更,并利用经过规则变更后的第一数据集和第二数据集来进行建库,得到原始规则及元数据初筛内容数据库;
评估模块,用于对所述原始规则及元数据初筛内容数据库中的指标元数据集合进行数据质量评估,得到新标准数据集;
生成模块,用于将所述新标准数据集输入到深度学习网络中,得到临床应用数据集。
9.一种AI数据云测质量的提升设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的AI数据云测质量的提升程序,所述AI数据云测质量的提升程序配置为实现如权利要求1至7中任一项所述AI数据云测质量的提升方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有AI数据云测质量的提升程序,所述AI数据云测质量的提升程序被处理器执行时实现如权利要求1至7任一项所述AI数据云测质量的提升方法的步骤。
CN202210845285.3A 2022-07-19 2022-07-19 Ai数据云测质量的提升方法、装置、设备及存储介质 Pending CN115017221A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210845285.3A CN115017221A (zh) 2022-07-19 2022-07-19 Ai数据云测质量的提升方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210845285.3A CN115017221A (zh) 2022-07-19 2022-07-19 Ai数据云测质量的提升方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115017221A true CN115017221A (zh) 2022-09-06

Family

ID=83080033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210845285.3A Pending CN115017221A (zh) 2022-07-19 2022-07-19 Ai数据云测质量的提升方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115017221A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104487972A (zh) * 2014-09-29 2015-04-01 曹庆恒 一种多维度用药信息处理方法、系统和设备
US20160259899A1 (en) * 2015-03-04 2016-09-08 Expeda ehf Clinical decision support system for diagnosing and monitoring of a disease of a patient
CN109473149A (zh) * 2018-11-09 2019-03-15 天津开心生活科技有限公司 数据质量评估方法、装置、电子设备及计算机可读介质
CN110867237A (zh) * 2019-11-15 2020-03-06 曹庆恒 一种对合理及合规用药系统的规则库进行管理的方法、系统和设备
CN112768059A (zh) * 2021-01-25 2021-05-07 武汉大学 一种对医疗数据中等级资料进行标准化的方法
CN113468138A (zh) * 2021-06-22 2021-10-01 曹庆恒 一种医疗数据库规则完善的方法、系统和计算机介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104487972A (zh) * 2014-09-29 2015-04-01 曹庆恒 一种多维度用药信息处理方法、系统和设备
WO2016049795A1 (zh) * 2014-09-29 2016-04-07 曹庆恒 一种多维度用药信息处理方法、系统和设备
US20160259899A1 (en) * 2015-03-04 2016-09-08 Expeda ehf Clinical decision support system for diagnosing and monitoring of a disease of a patient
CN109473149A (zh) * 2018-11-09 2019-03-15 天津开心生活科技有限公司 数据质量评估方法、装置、电子设备及计算机可读介质
CN110867237A (zh) * 2019-11-15 2020-03-06 曹庆恒 一种对合理及合规用药系统的规则库进行管理的方法、系统和设备
CN112768059A (zh) * 2021-01-25 2021-05-07 武汉大学 一种对医疗数据中等级资料进行标准化的方法
CN113468138A (zh) * 2021-06-22 2021-10-01 曹庆恒 一种医疗数据库规则完善的方法、系统和计算机介质

Similar Documents

Publication Publication Date Title
CN109670054B (zh) 知识图谱构建方法、装置、存储介质及电子设备
CN109830303A (zh) 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
CN112329964B (zh) 用于推送信息的方法、装置、设备以及存储介质
CN112149414B (zh) 文本相似度确定方法、装置、设备及存储介质
WO2022116430A1 (zh) 基于大数据挖掘的模型部署方法、装置、设备及存储介质
CN112365171B (zh) 基于知识图谱的风险预测方法、装置、设备及存储介质
CN102222081B (zh) 将人物的模型应用于搜索结果
CN111260448A (zh) 基于人工智能的药品推荐方法及相关设备
CN113724848A (zh) 基于人工智能的医疗资源推荐方法、装置、服务器及介质
WO2021151302A1 (zh) 基于机器学习的药品质控分析方法、装置、设备及介质
Li et al. Marrying medical domain knowledge with deep learning on electronic health records: a deep visual analytics approach
WO2021169203A1 (zh) 基于多层级结构相似度的单基因病名称推荐方法和系统
CN113724815A (zh) 基于决策分群模型的信息推送方法及装置
CN114330267A (zh) 一种基于语义学关联的结构化报告模板的设计方法
CN114153995B (zh) 医学术语的处理方法、装置、计算机设备和存储介质
CN111696656A (zh) 一种互联网医疗平台的医生评价方法、装置
CN115438040A (zh) 一种病理档案信息管理方法及系统
CN113436725A (zh) 数据处理方法、系统、计算机设备及计算机可读存储介质
CN115017221A (zh) Ai数据云测质量的提升方法、装置、设备及存储介质
Permanasari et al. A web-based decision support system of patient time prediction using iterative dichotomiser 3 algorithm
CN115472257A (zh) 一种招募用户的方法、装置、电子设备及存储介质
CN110010231A (zh) 一种数据处理系统及计算机可读存储介质
CN114664458A (zh) 患者分类装置、计算机设备及存储介质
CN110334055B (zh) 一种获取材料计算数据的方法
WO2022079593A1 (en) A system and a way to automatically monitor clinical trials - virtual monitor (vm) and a way to record medical history

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220906

RJ01 Rejection of invention patent application after publication