CN112445845A - 基于大数据挖掘的模型部署方法、装置、设备及存储介质 - Google Patents

基于大数据挖掘的模型部署方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112445845A
CN112445845A CN202011386029.XA CN202011386029A CN112445845A CN 112445845 A CN112445845 A CN 112445845A CN 202011386029 A CN202011386029 A CN 202011386029A CN 112445845 A CN112445845 A CN 112445845A
Authority
CN
China
Prior art keywords
data
mining
model
data mining
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011386029.XA
Other languages
English (en)
Inventor
黄丽媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011386029.XA priority Critical patent/CN112445845A/zh
Publication of CN112445845A publication Critical patent/CN112445845A/zh
Priority to PCT/CN2021/083486 priority patent/WO2022116430A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及人工智能领域,公开了一种基于大数据挖掘的模型部署方法、装置、设备及存储介质。该方法应用于大数据挖掘平台,包括:通过平台层从多个机构数据库中爬取业务数据,并将业务数据更新至基础层中;通过业务层获取数据挖掘请求,并对数据挖掘请求进行语义分析,确定数据挖掘请求对应的挖掘内容;通过平台层从预置算法库中匹配挖掘内容对应的训练算法,并从基础层中选取挖掘内容对应的业务数据;以选取的业务数据为样本,采用训练算法,通过平台层搭建对应的业务模型,并将业务模型部署到功能层中。本发明还涉及区块链技术,业务数据存储于区块链中。本发明实现了业务模型的智能部署,提升了对海量业务数的挖掘效率。

Description

基于大数据挖掘的模型部署方法、装置、设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种基于大数据挖掘的模型部署方法、装置、设备及存储介质。
背景技术
区域医疗信息系统中的医疗数据是典型的大数据,大数据具有4V特性(Volume,Velocity,variety,value),包括:(1)更大的容量(Volume):区域医疗数据通常是来自于拥有上百万人口和上百家医疗机构的区域,并且数据量持续增长。按照医疗行业的相关规定,一个患者的数据通常需要保留50年以上;(2)更快的生成速度(Velocity):医疗信息服务中可能包含大量在线或实时数据分析处理的需求。例如:临床决策支持中的诊断和用药建议、流行病分析报表生成、健康指标预警等;(3)更高的多样性(Vanety):医疗数据通常会包含各种结构化数据表、非(半)结构化文本文档(XML和叙述文本)、医疗影像等多种多样的数据存储形式;(4)更多的价值(Value):医疗数据的价值不必多说,它不仅与我们个人生活息息相关,更可用于国家乃至全球的疾病防控、新药研发和顽疾攻克。
目前业内对于医疗数据的采集、保存、挖掘、应用均独立进行,尤其是从医疗数据挖掘与医疗有关的信息时,无法一步到位采集最新数据、筛选可用目标医疗数据作为样本,搭建及部署分析模型、对模型输出结果进行可视化处理等,全部挖掘工作仍需从头做起,导致医疗数据挖掘效率低。
发明内容
本发明的主要目的在于解决医疗数据挖掘效率低且部署不够灵活的技术问题。
本发明第一方面提供了一种基于大数据挖掘的模型部署方法,应用于大数据挖掘平台,所述大数据挖掘平台由上至下依次包括:业务层、功能层、平台层和基础层,所述基于大数据挖掘的模型部署方法包括:
每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
可选的,在本发明第一方面的第一种实现方式中,所述平台层中包含数据收集引擎,所述通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中包括:
通过所述数据收集引擎从多个机构数据库中爬取业务数据,并对所述业务数据进行标准化处理;
将标准化处理后的业务数据转换为预置的语义格式,并基于所述语义格式,确定所述转换后的业务数据的语义特征;
获取所述基础层中数据存储模型的文档语义框架,并根据所述文档语义框架,关联对应的语义特征;
基于关联后的文档语义框架与语义特征,将所述转换后的业务数据存储至所述数据存储模型中。
可选的,在本发明第一方面的第二种实现方式中,所述对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容包括:
解析所述数据挖掘请求,得到对应的数据挖掘信息,并对所述数据挖掘信息进行分词处理,得到多个挖掘要点分词;
将所述各挖掘要点分词输入预置语义分析模型中进行语义分析,得到多个数据挖掘标签;
基于所述数据挖掘标签,确定所述数据挖掘请求对应的挖掘内容。
可选的,在本发明第一方面的第三种实现方式中,所述平台层中还包含算法搜索引擎,所述获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法包括:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘属性,并基于所述数据挖掘属性,确定对应的多层算法标签;
基于所述多层算法标签,通过所述算法搜索引擎,获取预置算法库中与所述挖掘内容匹配的模型训练算法。
可选的,在本发明第一方面的第四种实现方式中,所述平台层中还包含数据检索引擎,所述从所述基础层中选取与所述挖掘内容对应的业务数据包括:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘索引值;
根据所述数据挖掘索引值,通过所述数据检索引擎,确定与所述挖掘内容对应的业务数据的存储位置并进行获取。
可选的,在本发明第一方面的第五种实现方式中,所述以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型包括:
通过所述平台层将选取的业务数据作为训练样本,并对所述训练样本进行标注,得到对应的标注文件;
根据所述模型训练算法,生成业务训练模型,并将所述训练样本和所述标注文件输入所述业务训练模型中,输出挖掘结果;
基于所述挖掘结果,计算所述业务训练模型的损失值,并基于所述损失值对所述业务训练模型进行训练,直到所述损失值小于预置损失值时停止训练,输出对应的业务模型。
本发明第二方面提供了一种基于大数据挖掘的模型部署装置,应用于大数据挖掘平台,所述大数据挖掘平台由上至下依次包括:业务层、功能层、平台层和基础层,所述基于大数据挖掘的模型部署装置包括:
爬取模块,用于每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
语义分析模块,用于获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
选取模块,用于获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
部署模块,用于以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
可选的,在本发明第二方面的第一种实现方式中,所述平台层中包含数据收集引擎,所述爬取模块包括:
数据标准化处理单元,用于通过所述数据收集引擎从多个机构数据库中爬取业务数据,并对所述业务数据进行标准化处理;
格式转换单元,用于将标准化处理后的业务数据转换为预置的语义格式,并基于所述语义格式,确定所述转换后的业务数据的语义特征;
关联单元,用于获取所述基础层中数据存储模型的文档语义框架,并根据所述文档语义框架,关联对应的语义特征;
存储单元,用于基于关联后的文档语义框架与语义特征,将所述转换后的业务数据存储至所述数据存储模型中。
可选的,在本发明第二方面的第二种实现方式中,所述语义分析模块包括:
分词单元,用于解析所述数据挖掘请求,得到对应的数据挖掘信息,并对所述数据挖掘信息进行分词处理,得到多个挖掘要点分词;
语义分析单元,用于将所述各挖掘要点分词输入预置语义分析模型中进行语义分析,得到多个数据挖掘标签;基于所述数据挖掘标签,确定所述数据挖掘请求对应的挖掘内容。
可选的,在本发明第二方面的第三种实现方式中,所述平台层中还包含算法搜索引擎,所述选取模块包括算法搜索单元,所述算法搜索单元用于:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘属性,并基于所述数据挖掘属性,确定对应的多层算法标签;
基于所述多层算法标签,通过所述算法搜索引擎,获取预置算法库中与所述挖掘内容匹配的模型训练算法。
可选的,在本发明第二方面的第四种实现方式中,所述平台层中还包含数据检索引擎,所述选取模块还包括数据检索单元,所述数据检索单元用于:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘索引值;
根据所述数据挖掘索引值,通过所述数据检索引擎,确定与所述挖掘内容对应的业务数据的存储位置并进行获取。
可选的,在本发明第二方面的第五种实现方式中,所述部署模块包括:
标注单元,用于通过所述平台层将选取的业务数据作为训练样本,并对所述训练样本进行标注,得到对应的标注文件;
训练单元,用于根据所述模型训练算法,生成业务训练模型,并将所述训练样本和所述标注文件输入所述业务训练模型中,输出挖掘结果;基于所述挖掘结果,计算所述业务训练模型的损失值,并基于所述损失值对所述业务训练模型进行训练,直到所述损失值小于预置损失值时停止训练,输出对应的业务模型。
本发明第三方面提供了一种基于大数据挖掘的模型部署设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于大数据挖掘的模型部署设备执行上述的基于大数据挖掘的模型部署方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于大数据挖掘的模型部署方法。
本发明提供的技术方案中,在不进行业务数据挖掘时,可通过平台层从多个机构数据库中爬取业务数据,并将业务数据更新至基础层中;在进行业务数据挖掘时,则先通过业务层获取数据挖掘请求并进行语义分析,以确定当前业务数据挖掘的挖掘内容;然后通过平台层一方面匹配挖掘内容对应的训练算法,并搭建业务训练模型,另一方面从基础层中选取挖掘内容对应的业务数据,并将业务数据作为样本输入业务训练模型中进行训练,以搭建用于数据挖掘的业务模型,并将业务模型部署到功能层中待命即可。本发明实现了业务模型的智能部署,提升了对海量业务数的挖掘效率。
附图说明
图1为本发明中基于大数据挖掘的模型部署方法的一个实施例示意图;
图2为本发明中基于大数据挖掘的模型部署方法的另一个实施例示意图;
图3为本发明中基于大数据挖掘的模型部署装置的一个实施例示意图;
图4为本发明中基于大数据挖掘的模型部署装置的另一个实施例示意图;
图5为本发明中基于大数据挖掘的模型部署设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种基于大数据挖掘的模型部署方法、装置、设备及存储介质,通过平台层从多个机构数据库中爬取业务数据,并将业务数据更新至基础层中;通过业务层获取数据挖掘请求,并对数据挖掘请求进行语义分析,确定数据挖掘请求对应的挖掘内容;通过平台层匹配挖掘内容对应的训练算法,并从基础层中选取挖掘内容对应的业务数据;以选取的业务数据为样本,采用训练算法,通过平台层搭建对应的业务模型,并将业务模型部署到功能层中。本发明还涉及区块链技术,业务数据存储于区块链中。本发明实现了业务模型的智能部署,提升了对海量业务数的挖掘效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在进行实施例的说明之前,以医疗领域为例,先对大数据挖掘平台进行介绍。大数据挖掘平台中至少可以包含基础层、平台层、功能层、业务层,具体如下所示:
(1)基础层:存储有大量的医疗数据,比如医学影像资料中常见的CT(ComputedTomography,电子计算机断层扫描)、MRI(Magnetic Resonance Imaging,磁共振成象)的图像数据、医生诊断报告数据等,根据不同的医疗数据类型,以对应的固定数据存储格式进行存储;而数据库可以采用传统的集中存储和HDFS(Hadoop Distributed File System,分布式文件系统)相结合的文件存储架构,利用HBase中行键、列键、列族设计的灵活性,将多维医疗数据有效地组织在一起,实现传统数据仓库中的多维数据存储模型。
(2)平台层:作为数据处理的主要区域,至少包含有数据收集引擎、算法搜索引擎、数据检索引擎等功能模块;另外亦作为业务模型训练的场所。
对于数据收集引擎,可以以MapReduce(映射-归约)为计算核心,采用Flume/Sqoop(一种数据收集系统)实现从多个医疗机构数据库中)抽取数据、再进行标准化处理、转换格式并装载入基础层的数据存储区域中;
对于算法搜索引擎,可以采用Hadoop ML/Mahout进行搭建,关联算法库,可提供贝叶斯判别分析、聚类、决策树、关联度算法、推荐算法等多种训练算法,为辅助临床疾病诊断、行为分析等医疗数据挖掘提供算法支撑;
对于数据检索引擎,可以采用Apache Hive(一种数据库工具)提供的类SQL(Structured Query Language,结构化查询语言)查询的接口,为分析人员提供便捷的数据获取方式。
(3)功能层:各类型业务模型训练完成后的部署场所,通过各类型业务模型,提供医疗数据的即时查询、统计分析、深度挖掘、机器学习等功能,为业务层提供功能支持。
(4)业务层:直接对接客户终端,在功能层的支撑下,提供与功能层相对应的医疗数据的即时查询、统计分析、深度挖掘、机器学习等应用。
接下来为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于大数据挖掘的模型部署方法的第一个实施例包括:
S101、每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
可以理解的是,本发明的执行主体可以为基于大数据挖掘的模型部署装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。需要强调的是,为进一步保证上述业务数据的私密和安全性,上述业务数据还可以存储于一区块链的节点中。另外,业务数据可包括医疗数据、保险数据、交通数据、用户数据、网购数据等,各类型业务数据使用发明方法进行数据挖掘时,步骤流程本质上相同,本实施例中不一一举例,下面以医疗数据为例进行说明。
本实施例中,大数据挖掘平台在不执行医疗数据的挖掘任务时,持续更新基础层中的医疗数据,以供后面执行挖掘任务时,可及时提供最新医疗数据进行数据挖掘,无需重新检查及爬取最新医疗数据,增加医疗数据的挖掘效率。其中,对于基础层中医疗数据的更新,自动检验每条医疗数据是否已存在索引,当医疗数据已经存在索引,则以当前的医疗数据替代对应的原医疗数据的字段值,若未存在索引值,则将医疗数据新插入基础层中,完成医疗数据的更新。对于不同的医疗机构,预设周期可以不同,采用异步方式进行医疗数据的爬取,比如对于大型的医疗机构,可每天依次采集医疗数据,即预设周期为24小时,而对于研究所,由于医疗数据更新数量较少,故可设置更长的周期进行爬取,比如一个星期或者一个月。
平台层中有专门的数据收集引擎从各医疗机构中获取医疗数据,而基础层中有固定存储医疗数据的存储区域,并以固定格式的数据存储模型进行存储;对于数据存储模型,每一个数据存储模型具有模型编号,各数据存储模型中包含多张数据表,以表格编号进行标识,各数据表中行编号、列编号,故每一条医疗数据可通过模型编号+表编号+行编号+列编号进行唯一标识。
S102、获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
本实施例中,业务层直接与客户终端对接,客户终端收到的数据挖掘请求中包含有数据挖掘信息,可依据用户单选或者复选的内容、文本框输入的内容得到,根据数据挖掘信息,可通过语义分析模型,分析数据挖掘信息中的具体挖掘内容,并以数据挖掘标签进行表示。而具体的语义分析过程如下所示:
(1)解析所述数据挖掘请求,得到对应的数据挖掘信息,并对所述数据挖掘信息进行分词处理,得到多个挖掘要点分词;
(2)将所述各挖掘要点分词输入预置语义分析模型中进行语义分析,得到多个数据挖掘标签;
(3)基于所述数据挖掘标签,确定所述数据挖掘请求对应的挖掘内容。
本实施例中,数据挖掘请求中除用户身份认证信息等,还包含数据挖掘信息,比如“心脑血管的患者行为分析”、“冠心病的辅助临床决策”、“胰腺炎疾控预警”等;在分词处理后,比如“心脑血管的患者行为分析”即可分为三个挖掘要点分词:“心脑血管”、“患者行为”、“分析”;然后使用预置语义分析模型对挖掘要点分词进行分析,语义分析模型中带有专家数据库,将各挖掘要点分词映射至实质意思相同的数据挖掘标签,比如“心脑血管”映射至“心血管”数据挖掘标签、“脑血管”数据挖掘标签。
S103、获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
本实施例中,由于医疗数据数量庞大,比如单个用户的每一个影像或报告大小都是以兆计算,如此多的医疗数据存储在基础层,需要借助机器学习和数据挖掘算法来自动分析医疗数据,从大量医疗数据中获取有效的、新颖的、潜在有用的、可理解的医疗数据,能够发现隐含在大规模医疗数据中的特性知识。
首先根据挖掘内容初步选取指定疾病与数据应用相关的医疗数据;然后为挖掘内容筛选合适的模型训练算法,构建业务训练模型,以从初步选取的医疗数据中进一步提取疾病与应用相关的共性特征,比如对于“心脑血管的患者行为分析”,可得到训练内容为“患者行为分析”,则可以选取基于邻域的算法,隐语义模型、基于图的随机游走算法等。
S104、以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
本实施例中,将医疗数据作为训练样本,并根据医疗数据中的诊断内容、医疗图像特征区域等对训练样本进行标注;然后根据模型训练算法生成对应的业务训练模型,并采用训练样本进行训练,以生成对应的业务模型;而最终将业务模型部署在功能层中进行使用,当有用户请求,比如“患者行为预测指令”、“疾病预警指令”、“数据挖掘指令”进入时,即在功能层调用业务模型对对应的传入信息进行数据挖掘即可。而业务模型的具体搭建过程如下所示:
(1)通过所述平台层将选取的业务数据作为训练样本,并对所述训练样本进行标注,得到对应的标注文件;
(2)根据所述模型训练算法,生成业务训练模型,并将所述训练样本和所述标注文件输入所述业务训练模型中,输出挖掘结果;
(3)基于所述挖掘结果,计算所述业务训练模型的损失值,并基于所述损失值对所述业务训练模型进行训练,直到所述损失值小于预置损失值时停止训练,输出对应的业务模型。
本实施例中,训练样本从基础层中自动获取,模型训练算法从预置算法库中自动获取,将模型训练算法写入预先写好的模型框架中,即可得到对应的业务训练模型,然后通过训练样本和标注文件对业务训练模型进行训练,而模型的损失函数亦根据挖掘内容而定,比如对于患者行为分析,可通过逻辑回归损失函数对模型进行衡量。
本发明实施例中,在不进行业务数据挖掘时,可通过平台层从多个机构数据库中爬取业务数据,并将业务数据更新至基础层中;在进行业务数据挖掘时,则先通过业务层获取数据挖掘请求并进行语义分析,以确定当前业务数据挖掘的挖掘内容;然后通过平台层一方面匹配挖掘内容对应的预置算法,并搭建业务训练模型,另一方面从基础层中选取挖掘内容对应的业务数据,并将业务数据作为样本输入业务训练模型中进行训练,以搭建用于数据挖掘的业务模型,并将业务模型部署到功能层中待命即可。本发明实现了业务模型的智能部署,提升了对海量业务数的挖掘效率。
请参阅图2,本发明实施例中基于大数据挖掘的模型部署方法的第二个实施例包括:
S201、每隔预设周期,通过所述数据收集引擎从多个机构数据库中爬取业务数据,并对所述业务数据进行标准化处理;
本实施例中,平台层包含数据收集引擎,用于从多个医疗机构中获取最新的医疗数据,并对医疗数据进行标准化处理,包括主要包括数据清洗、预处理、错值纠正、缺失值填补、连续值离散化、去掉异常值、以及数据归一化的过程。
S202、将标准化处理后的业务数据转换为预置的语义格式,并基于所述语义格式,确定所述转换后的业务数据的语义特征;
S203、获取所述基础层中数据存储模型的文档语义框架,并根据所述文档语义框架,关联对应的语义特征;
S204、基于关联后的文档语义框架与语义特征,将所述转换后的业务数据存储至所述数据存储模型中;
本实施例中,在医疗数据标准化处理后,还需对其转化为固定的语义格式,而不同的语义格式具有对应的文档语义框架,同一语义格式的医疗数据依据其语义特征,在对应的文档语义框架进行存储即可得到对应的数据存储模型,且数据存储模型具有可扩展性。不同医疗机构的医疗数据本身带有数据属性,比如机构名称、患者信息、检查信息、诊断信息、治疗信息等医疗活动过程的记录,比如对于电子病历中的医疗数据,存储时需采用基于语义网的临床文档框架(一种文档语义框架)格式的可扩展标记语言(一种语义格式)文档来保存语义数据,而前面提及的机构名称、患者信息、检查信息、诊断信息、治疗信息等数据属性,即为对应的语义特征,在文档语义框架中,不同的语义特征,其医疗数据存储在不同的表格、表行、表列对应的位置中。
而根据数据属性,可以将医疗数据以多级标签的方式转换为固定的语义格式,第一级标签为文档语义框架,可以根据不同类型的医疗数据确定,比如图像数据、电子病历的文本数据、第二级标签为数据表,可以根据不同类型疾病、不同医疗机构或者不同患者进行确定,第三集标签为表列或者表行,根据各条患者信息、历史病历内容等进行确定。
医疗数据依照对应固定的语义格式进行存储,根据不同类型的医疗数据,针对特定的数据属性,查找其存储数据,将对应数据属性的存储数据作为该医疗数据的语义特征即可,比如对应电子病历中,有存储用户信息的表格,其中的用户年龄、血型属性相应的存储数据即可作为医疗数据进行用户行为分析时的语义特征,其中,语义特征通过固定的编码规则进行编码即可,并存储至相应数据存储模型中的相应位置中。
所述平台层中还包含算法搜索引擎,所述获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法包括:
S205、基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘属性,并基于所述数据挖掘属性,确定对应的多层算法标签;
S206、基于所述多层算法标签,通过所述算法搜索引擎,获取预置算法库中与所述挖掘内容匹配的模型训练算法;
本实施例中,平台层中还包含算法搜索引擎,与预置算法库相关联,可用于从预置算法库中搜索挖掘内容所需的的模型训练算法,根据模型训练算法搭建业务训练模型,并后续输入医疗数据进行训练,以得到最终的业务模型;而根据不同的数据挖掘类型(基于数据挖掘标签确定),包括疾病预警、临床诊断、患者行为分析等,确定不同的数据挖掘属性,并将多个数据挖掘属性区分为多层算法标签,以确定最终使用的模型训练算法。
比如对于数据挖掘标签“疾病预警”,从“疾病预警”可以得到数据挖掘属性:“机器学习”、“逻辑回归”,“多分类”、“半监督学习”,根据得到的数据挖掘属性,可确定以下四层算法标签(即多层算法标签)如下所示:
第一层为“半监督学习”;
第二层为“机器学习”;
第三层为“逻辑回归”;
第四层为“多分类”;
通过上面四层算法标签,即可搜索到“softmax”算法。
所述平台层中还包含数据检索引擎,所述从所述基础层中选取与所述挖掘内容对应的业务数据包括:
S207、基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘索引值;
S208、根据所述数据挖掘索引值,通过所述数据检索引擎,确定与所述挖掘内容对应的业务数据的存储位置并进行获取;
本实施例中,平台层中还包含数据检索引擎,可根据数据挖掘索引值从基础层中检索对应的医疗数据,而数据挖掘标签可映射到对应的数据挖掘索引值,比如“心血管”、“脑血管”可映射到字段a、b、c、d、e五个数据挖掘索引值,通过字段a、b、c、d、e的索引值,即可找到对应数据存储模型、数据表、表行或者表列中数据,可以是某一个数据存储模型的医疗数据,也可以是某一数据表、表行、表列中的全部数据。
在选取得到所述挖掘内容对应的模型训练算法和业务数据后,则可进行以下业务模型的训练:
S209、以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型。
本发明实施例中,通过平台层中的数据收集引擎,从多个业务机构中爬取业务数据以供备用;然后通过算法搜索引擎,从预置的多个算法库中选择合适的算法库部署业务训练模型;再通过数据检索引擎选取合适的业务数据作为样本,输入业务训练模型中进行训练,以搭建数据挖掘所需的业务模型,实现业务模型的智能部署。
上面对本发明实施例中基于大数据挖掘的模型部署方法进行了描述,下面对本发明实施例中基于大数据挖掘的模型部署装置进行描述,请参阅图3,本发明实施例中基于大数据挖掘的模型部署装置一个实施例包括:
爬取模块301,用于每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
语义分析模块302,用于获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
选取模块303,用于获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
部署模块304,用于以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
本发明实施例中,在不进行业务数据挖掘时,可通过平台层从多个机构数据库中爬取业务数据,并将业务数据更新至基础层中;在进行业务数据挖掘时,则先通过业务层获取数据挖掘请求并进行语义分析,以确定当前业务数据挖掘的挖掘内容;然后通过平台层一方面匹配挖掘内容对应的预置算法,并搭建业务训练模型,另一方面从基础层中选取挖掘内容对应的业务数据,并将业务数据作为样本输入业务训练模型中进行训练,以搭建用于数据挖掘的业务模型,并将业务模型部署到功能层中待命即可。本发明实现了业务模型的智能部署,提升了对海量业务数的挖掘效率。
请参阅图4,本发明实施例中基于大数据挖掘的模型部署装置的另一个实施例包括:
爬取模块301,用于每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
语义分析模块302,用于获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
选取模块303,用于获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
部署模块304,用于以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
具体的,所述平台层中包含数据收集引擎,所述爬取模块301包括:
数据标准化处理单元3011,用于通过所述数据收集引擎从多个机构数据库中爬取业务数据,并对所述业务数据进行标准化处理;
格式转换单元3012,用于将标准化处理后的业务数据转换为预置的语义格式,并基于所述语义格式,确定所述转换后的业务数据的语义特征;
关联单元3013,用于获取所述基础层中数据存储模型的文档语义框架,并根据所述文档语义框架,关联对应的语义特征;
存储单元3014,用于基于关联后的文档语义框架与语义特征,将所述转换后的业务数据存储至所述数据存储模型中。
具体的,所述语义分析模块302包括:
分词单元3021,用于解析所述数据挖掘请求,得到对应的数据挖掘信息,并对所述数据挖掘信息进行分词处理,得到多个挖掘要点分词;
语义分析单元3022,用于将所述各挖掘要点分词输入预置语义分析模型中进行语义分析,得到多个数据挖掘标签;基于所述数据挖掘标签,确定所述数据挖掘请求对应的挖掘内容。
具体的,所述平台层中还包含算法搜索引擎,所述选取模块303包括算法搜索单元3031,所述算法搜索单元3031用于:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘属性,并基于所述数据挖掘属性,确定对应的多层算法标签;
基于所述多层算法标签,通过所述算法搜索引擎,获取预置算法库中与所述挖掘内容匹配的模型训练算法。
具体的,所述平台层中还包含数据检索引擎,所述选取模块303还包括数据检索单元3032,所述数据检索单元3032用于:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘索引值;
根据所述数据挖掘索引值,通过所述数据检索引擎,确定与所述挖掘内容对应的业务数据的存储位置并进行获取。
具体的,所述部署模块304包括:
标注单元3041,用于通过所述平台层将选取的业务数据作为训练样本,并对所述训练样本进行标注,得到对应的标注文件;
训练单元3042,用于根据所述模型训练算法,生成业务训练模型,并将所述训练样本和所述标注文件输入所述业务训练模型中,输出挖掘结果;基于所述挖掘结果,计算所述业务训练模型的损失值,并基于所述损失值对所述业务训练模型进行训练,直到所述损失值小于预置损失值时停止训练,输出对应的业务模型。
本发明实施例中,平台层中的数据收集引擎、算法搜索引擎和数据检索引擎,首先从多个业务机构中爬取业务数据以供备用;然后从预置的多个算法库中选择合适的算法库部署业务训练模型;再选取合适的业务数据作为样本,输入业务训练模型中进行训练,以搭建数据挖掘所需的业务模型,实现业务模型的智能部署,提升业务数据的挖掘效率。
上面图3和图4从模块化功能实体的角度对本发明实施例中的基于大数据挖掘的模型部署装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于大数据挖掘的模型部署设备进行详细描述。
图5是本发明实施例提供的一种基于大数据挖掘的模型部署设备的结构示意图,该基于大数据挖掘的模型部署设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于大数据挖掘的模型部署设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在基于大数据挖掘的模型部署设备500上执行存储介质530中的一系列指令操作。
基于大数据挖掘的模型部署设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的基于大数据挖掘的模型部署设备结构并不构成对基于大数据挖掘的模型部署设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种基于大数据挖掘的模型部署设备,所述基于大数据挖掘的模型部署设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述基于大数据挖掘的模型部署方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于大数据挖掘的模型部署方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于大数据挖掘的模型部署方法,应用于大数据挖掘平台,其特征在于,所述大数据挖掘平台由上至下依次包括:业务层、功能层、平台层和基础层,所述基于大数据挖掘的模型部署方法包括:
每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
2.根据权利要求1所述的基于大数据挖掘的模型部署方法,其特征在于,所述平台层中包含数据收集引擎,所述通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中包括:
通过所述数据收集引擎从多个机构数据库中爬取业务数据,并对所述业务数据进行标准化处理;
将标准化处理后的业务数据转换为预置的语义格式,并基于所述语义格式,确定所述转换后的业务数据的语义特征;
获取所述基础层中数据存储模型的文档语义框架,并根据所述文档语义框架,关联对应的语义特征;
基于关联后的文档语义框架与语义特征,将所述转换后的业务数据存储至所述数据存储模型中。
3.根据权利要求1所述的基于大数据挖掘的模型部署方法,其特征在于,所述对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容包括:
解析所述数据挖掘请求,得到对应的数据挖掘信息,并对所述数据挖掘信息进行分词处理,得到多个挖掘要点分词;
将所述各挖掘要点分词输入预置语义分析模型中进行语义分析,得到多个数据挖掘标签;
基于所述数据挖掘标签,确定所述数据挖掘请求对应的挖掘内容。
4.根据权利要求3所述的基于大数据挖掘的模型部署方法,其特征在于,所述平台层中还包含算法搜索引擎,所述获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法包括:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘属性,并基于所述数据挖掘属性,确定对应的多层算法标签;
基于所述多层算法标签,通过所述算法搜索引擎,获取预置算法库中与所述挖掘内容匹配的模型训练算法。
5.根据权利要求3所述的基于大数据挖掘的模型部署方法,其特征在于,所述平台层中还包含数据检索引擎,所述从所述基础层中选取与所述挖掘内容对应的业务数据包括:
基于所述数据挖掘标签,确定所述数据挖掘内容对应的数据挖掘索引值;
根据所述数据挖掘索引值,通过所述数据检索引擎,确定与所述挖掘内容对应的业务数据的存储位置并进行获取。
6.根据权利要求1-5中任一项所述的基于大数据挖掘的模型部署方法,其特征在于,所述以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型包括:
通过所述平台层将选取的业务数据作为训练样本,并对所述训练样本进行标注,得到对应的标注文件;
根据所述模型训练算法,生成业务训练模型,并将所述训练样本和所述标注文件输入所述业务训练模型中,输出挖掘结果;
基于所述挖掘结果,计算所述业务训练模型的损失值,并基于所述损失值对所述业务训练模型进行训练,直到所述损失值小于预置损失值时停止训练,输出对应的业务模型。
7.一种基于大数据挖掘的模型部署装置,应用于大数据挖掘平台,其特征在于,所述大数据挖掘平台由上至下依次包括:业务层、功能层、平台层和基础层,所述基于大数据挖掘的模型部署装置包括:
爬取模块,用于每隔预设周期,通过所述平台层从各机构数据库中爬取业务数据,并将所述业务数据更新至所述基础层中;
语义分析模块,用于获取所述业务层收到的数据挖掘请求,并对所述数据挖掘请求进行语义分析,确定所述数据挖掘请求对应的挖掘内容;
选取模块,用于获取所述平台层的预置算法库中与所述挖掘内容匹配的模型训练算法,并从所述基础层中选取与所述挖掘内容对应的业务数据;
部署模块,用于以选取的业务数据为训练样本,采用所述模型训练算法进行训练,生成对应业务模型并部署到所述功能层以及对外提供访问所述业务模型的接口。
8.根据权利要求7中所述的基于大数据挖掘的模型部署装置,其特征在于,所述平台层中包含数据收集引擎,所述爬取模块包括:
数据标准化处理单元,用于通过所述数据收集引擎从多个机构数据库中爬取业务数据,并对所述业务数据进行标准化处理;
格式转换单元,用于将标准化处理后的业务数据转换为预置的语义格式,并基于所述语义格式,确定所述转换后的业务数据的语义特征;
关联单元,用于获取所述基础层中数据存储模型的文档语义框架,并根据所述文档语义框架,关联对应的语义特征;
存储单元,用于基于关联后的文档语义框架与语义特征,将所述转换后的业务数据存储至所述数据存储模型中。
9.一种基于大数据挖掘的模型部署设备,其特征在于,所述基于大数据挖掘的模型部署设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于大数据挖掘的模型部署设备执行如权利要求1-6中任一项所述的基于大数据挖掘的模型部署方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的基于大数据挖掘的模型部署方法。
CN202011386029.XA 2020-12-02 2020-12-02 基于大数据挖掘的模型部署方法、装置、设备及存储介质 Pending CN112445845A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011386029.XA CN112445845A (zh) 2020-12-02 2020-12-02 基于大数据挖掘的模型部署方法、装置、设备及存储介质
PCT/CN2021/083486 WO2022116430A1 (zh) 2020-12-02 2021-03-29 基于大数据挖掘的模型部署方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011386029.XA CN112445845A (zh) 2020-12-02 2020-12-02 基于大数据挖掘的模型部署方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112445845A true CN112445845A (zh) 2021-03-05

Family

ID=74740466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011386029.XA Pending CN112445845A (zh) 2020-12-02 2020-12-02 基于大数据挖掘的模型部署方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN112445845A (zh)
WO (1) WO2022116430A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420017A (zh) * 2021-06-21 2021-09-21 上海特高信息技术有限公司 一种机器人导航算法训练数据集获取的区块链应用方法
CN114492448A (zh) * 2021-12-16 2022-05-13 航天信息股份有限公司 一种确定智能语义分析模型的方法及系统
WO2022116430A1 (zh) * 2020-12-02 2022-06-09 平安科技(深圳)有限公司 基于大数据挖掘的模型部署方法、装置、设备及存储介质
CN114880462A (zh) * 2022-02-25 2022-08-09 北京百度网讯科技有限公司 医用文档的分析方法、装置、设备以及存储介质
WO2023082871A1 (zh) * 2021-11-15 2023-05-19 中兴通讯股份有限公司 流业务建模方法、装置、平台、电子设备和存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098784A (zh) * 2022-07-18 2022-09-23 李圣刚 一种数据挖掘方法及数据挖掘系统
CN115766795A (zh) * 2022-11-28 2023-03-07 福州大学 一种基于区块链的可信电子文件平台的智能服务方法
CN116483872B (zh) * 2023-06-20 2023-09-12 合肥青谷信息科技有限公司 一种复杂数据处理方法、装置及电子设备
CN116842238B (zh) * 2023-07-24 2024-03-22 右来了(北京)科技有限公司 基于大数据分析的企业数据可视化实现方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117208B2 (en) * 2000-09-28 2006-10-03 Oracle Corporation Enterprise web mining system and method
CN104699985A (zh) * 2015-03-26 2015-06-10 西安电子科技大学 一种医疗大数据采集分析系统及方法
CN111125061A (zh) * 2019-12-18 2020-05-08 甘肃省卫生健康统计信息中心(西北人口信息中心) 一种规范和促进健康医疗大数据的方法
CN111709941B (zh) * 2020-06-24 2023-05-09 上海迪影科技有限公司 一种面向病理图像的轻量级自动化深度学习系统及方法
CN112015962A (zh) * 2020-07-24 2020-12-01 北京艾巴斯智能科技发展有限公司 一种政务智能大数据中心体系架构
CN112445845A (zh) * 2020-12-02 2021-03-05 平安科技(深圳)有限公司 基于大数据挖掘的模型部署方法、装置、设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022116430A1 (zh) * 2020-12-02 2022-06-09 平安科技(深圳)有限公司 基于大数据挖掘的模型部署方法、装置、设备及存储介质
CN113420017A (zh) * 2021-06-21 2021-09-21 上海特高信息技术有限公司 一种机器人导航算法训练数据集获取的区块链应用方法
CN113420017B (zh) * 2021-06-21 2023-10-13 上海特高信息技术有限公司 一种机器人导航算法训练数据集获取的区块链应用方法
WO2023082871A1 (zh) * 2021-11-15 2023-05-19 中兴通讯股份有限公司 流业务建模方法、装置、平台、电子设备和存储介质
CN114492448A (zh) * 2021-12-16 2022-05-13 航天信息股份有限公司 一种确定智能语义分析模型的方法及系统
CN114880462A (zh) * 2022-02-25 2022-08-09 北京百度网讯科技有限公司 医用文档的分析方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
WO2022116430A1 (zh) 2022-06-09

Similar Documents

Publication Publication Date Title
CN112445845A (zh) 基于大数据挖掘的模型部署方法、装置、设备及存储介质
Rehman et al. Leveraging big data analytics in healthcare enhancement: trends, challenges and opportunities
CN110415831A (zh) 一种医疗大数据云服务分析平台
CN109830303A (zh) 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
US11915127B2 (en) Prediction of healthcare outcomes and recommendation of interventions using deep learning
Berger et al. Data mining as a tool for research and knowledge development in nursing
CN108962394B (zh) 一种医疗数据决策支持方法及系统
CN109074858A (zh) 没有明显准标识符的去识别的健康护理数据库的医院匹配
Khan et al. Towards development of health data warehouse: Bangladesh perspective
Chen et al. A Bibliometric Analysis of the Development of ICD‐11 in Medical Informatics
Chauhan et al. A robust model for big healthcare data analytics
Shaikh et al. Big data for better Indian healthcare
Carvalho et al. Knowledge Graph Embeddings for ICU readmission prediction
CN112655047A (zh) 对医学记录分类的方法
Leng et al. Bi-level artificial intelligence model for risk classification of acute respiratory diseases based on Chinese clinical data
Vathy-Fogarassy et al. Multi-level process mining methodology for exploring disease-specific care processes
Shyni et al. Applications of big data analytics for diagnosing diabetic mellitus: issues and challenges
Loku et al. Automated medical data analyses of diseases using big data
Sharma et al. Biomedical data classification using fuzzy clustering
CN114188036A (zh) 一种手术方案评估方法、装置、系统及存储介质
Tsumoto et al. Mining clinical pathways using dual clustering
Chauhan et al. Real-time BigData and Predictive Analytical Architecture for healthcare application
Fatima et al. Big Data Analytics in Health Care
Neamtu et al. The impact of Big Data on making evidence-based decisions
Anandi et al. Descriptive and Predictive Analytics on Electronic Health Records using Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination