CN115223722A - 一种基于医疗的数据分析系统 - Google Patents

一种基于医疗的数据分析系统 Download PDF

Info

Publication number
CN115223722A
CN115223722A CN202210899688.6A CN202210899688A CN115223722A CN 115223722 A CN115223722 A CN 115223722A CN 202210899688 A CN202210899688 A CN 202210899688A CN 115223722 A CN115223722 A CN 115223722A
Authority
CN
China
Prior art keywords
data
information
analysis
mapping
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210899688.6A
Other languages
English (en)
Other versions
CN115223722B (zh
Inventor
许宁
孙标
徐宗宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Medical Lijie Shanghai Information Technology Co ltd
Original Assignee
Medical Lijie Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medical Lijie Shanghai Information Technology Co ltd filed Critical Medical Lijie Shanghai Information Technology Co ltd
Priority to CN202210899688.6A priority Critical patent/CN115223722B/zh
Publication of CN115223722A publication Critical patent/CN115223722A/zh
Application granted granted Critical
Publication of CN115223722B publication Critical patent/CN115223722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于医疗的数据分析系统,该系统包括设置模块,用以预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期;采集模块用以在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统;处理模块对所述待处理数据集进行转化,分析模块对所述目标数据集进行分析;展示模块展示所述分析结果。通过对采集到的待处理数据集进行处理转化,获得目标数据集,对目标数据集进行描述性分析和机器学习分析,并将分析结果展示出来,实现了定时自动采集数据并对数据进行处理,提高了数据处理分析的效率。

Description

一种基于医疗的数据分析系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于医疗的数据分析系统。
背景技术
近年来,国内医疗信息化投资规模也呈现不断扩大趋势。随着医疗信息化的持续发展,医学临床数据日渐累积,数量庞大,种类繁多,但大多数临床数据仅服务于诊疗过程,并没有在科研教学和循证医学方面发挥更大的作用,且医院多数信息系统独立建设、缺乏集成、元数据不统一、标准不统一,给数据的重用带来重重困难。因此,需要数据分析系统对临床数据进行采集、存储、分布计算等处理,对数据信息进行深度挖掘。
目前现有技术中数据分析系统主要有SAS系统(Statistics Analysis System)和SPSS(Statistical Product Service Solutions)软件等软件。SAS系统虽具有完善的分析语法,方便做大规模的复杂运算,但采集数据需人工操作,包括手动直接输入、从外部原始数据文件中导入和从其它软件中的数据文件导入;SPSS软件虽安装方便,点击式操作界面完善,但采集数据仍需要人工导入数据。
上述数据分析系统在采集数据时需人工手动操作,降低了数据处理分析的效率,不满足研究人员对临床数据的分析处理。
发明内容
为此,本发明提供一种基于医疗的数据分析系统,解决了数据处理分析的效率低的问题。
为实现上述目的,本发明提供一种基于医疗的数据分析系统,包括:
设置模块,用以预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,所述采集周期内包含若干采集时间间隔;
采集模块,用以在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,形成待处理数据集。
进一步地,所述采集模块包括提取单元和识别单元,所述提取单元用以提取数据信息,所述识别单元内设置有映射矩阵,所述映射矩阵的输入为数据信息对应的地址信息,当所述提取单元在提取到对应的数据信息不为空时,则根据映射矩阵,将提取单元内的数据信息作为符合映射关系的数据信息。
进一步地,所述识别单元内的所述映射矩阵设置有若干映射函数,根据数据信息内的关键字信息获取与该数据信息对应的目标领域信息,确定所述目标领域信息后,从所述映射函数中选择与所述目标领域信息匹配的目标映射函数作为主函数,所述目标领域信息为映射函数的函数因子,所述主函数不唯一,将数据信息根据主函数的关系进行采集。
进一步地,所述关键字信息为一个时,根据所述第一关键字信息 a获取数据信息对应的第一目标领域信息,在所述映射函数中选择与所述第一目标领域信息A匹配的目标映射函数作为主函数,
若映射函数内函数因子包含第一目标领域信息A,则所述映射函数可作为主函数,
若映射函数内函数因子不包含第一目标领域信息A,则所述映射函数不可作为主函数。
进一步地,所述关键字信息为两个时,根据所述第二关键字信息 b和第三关键字信息c获取数据信息对应的第二目标领域信息B和第三目标领域信息C,在所述映射函数中选择与所述第二目标领域信息 B和第三目标领域信息C匹配的目标映射函数作为主函数,
若映射函数内函数因子同时包含第二目标领域信息B和第三目标领域信息C,则所述映射函数可作为主函数,
若映射函数内函数因子不同时包含第二目标领域信息B和第三目标领域信息C,则所述映射函数不可作为主函数。
进一步地,还本发明提供的一种基于医疗的数据分析系统还包括:
处理模块,用以对所述待处理数据集进行转化,形成目标数据集;
分析模块,用以对所述目标数据集进行分析,获取分析结果;
展示模块,用以展示所述分析结果。
进一步地,所述处理模块对采集到的待处理数据进行转化时,定义特征值,根据所述特征值通过7个数据处理服务包对采集到的待处理数据进行转化,形成目标数据集。
进一步地,所述7个数据处理服务包包括:数据过滤、值替换、类型转换、归一化、离散化和自定义字段。
进一步地,所述分析模块对目标数据集进行分析时,通过描述性分析和机器学习分析的方式,呈现目标数据集特征值的分布图和进行数据挖掘计算,所述描述性分析包括:柱状图、折线图、气泡图、散点图、平行图、直方图、箱线图和排列图,
所述机器学习分析的方式包括:分类分析、回归分析、聚类分析、关联规则、时间序列和关系网络以及线性回归算法和回归树算法。
进一步地,所述展示模块展示所述分析结果时,通过自定义排版和仪表盘呈现,所述内置布局方式包括田子型、工字型、左右类型和上下类型。
与现有技术相比,本发明的有益效果在于,设置模块预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,采集模块在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,处理模块对所述待处理数据集进行转化,分析模块对所述目标数据集进行分析,展示模块展示所述分析结果。通过对采集到的待处理数据集进行处理转化,获得目标数据集,对目标数据集进行描述性分析和机器学习分析,并将分析结果展示出来,实现了定时自动采集数据并对数据进行处理,提高了数据处理分析的效率。
尤其,在所述采集模块提取单元对数据源进行数据提取时,判断数据信息对应的地址信息,若所述提取单元在提取到对应的数据信息不为空时,实现了数据的提取的自动进行,提高了数据采集的效率。
尤其,所述采集模块识别单元设置有所述映射矩阵设置的若干映射函数,根据数据信息内的关键字信息获取与该数据信息对应的目标领域信息,确定所述目标领域信息后,从所述映射函数中选择与所述目标领域信息匹配的目标映射函数作为主函数,所述目标领域信息为映射函数的函数因子,将数据信息根据主函数的关系进行采集,提高了数据采集的准确性。
尤其,在所述处理模块对采集到的待处理数据进行转化时,定义特征值,根据所述特征值通过数据过滤、值替换、类型转换、归一化、标准化、离散化和自定义字段对采集到的待处理数据进行转化,形成目标数据集,实现了对采集到的待处理数据转化为机器学习算法要求的目标数据集,提高了数据分析的效率。
尤其,在所述分析模块对目标数据集进行分析时,通过描述性分析获取目标数据集特征值的图形化分布图和含有13种处理服务包的机器学习,实现了对目标数据集的分析并获得了目标数据集的分析结果,通过可视化操作页面,降低了本系统的学习门槛。
尤其,在所述展示模块展示所述分析结果时,通过自定义布局排版和内置布局方式排版,得到了数据分析结果的可视化布局,实现了数据分析结果的可视化表达,提高了数据处理效率,满足了研究人员对数据分析的可视化表达的要求。
附图说明
图1为本发明提供一种基于医疗的数据分析系统的结构示意图;
图2为本发明提供一种基于医疗的数据分析系统的应用流程图;
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
本发明提供一种基于医疗的数据分析系统,包括:设置模块,用以预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,所述采集周期内包含若干采集时间间隔;
采集模块,用以在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,形成待处理数据集。
具体而言,本发明实施例通过对采集到的待处理数据集进行处理转化,获得目标数据集,对目标数据集进行描述性分析和机器学习分析,并将分析结果展示出来,实现了定时自动采集数据并对数据进行处理,提高了数据处理分析的效率。
请参阅图1所示,本发明另一实施例中的基于医疗的数据分析系统包括:设置模块100,用以预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,所述采集周期内包含若干采集时间间隔;
采集模块200,用以在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,形成待处理数据集;
处理模块300,用以对所述待处理数据集进行转化,形成目标数据集;
分析模块400,用以对所述目标数据集进行分析,获取分析结果;
展示模块500,用以展示所述分析结果。
具体而言,本发明实施例中设置模块预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,接着采集模块在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,形成待处理数据集,处理模块对所述待处理数据集进行转化,形成目标数据集,分析模块对所述目标数据集进行分析,获取分析结果,展示模块展示所述分析结果。通过映射关系、数据采集时间间隔和数据采集周期的设置,根据所述映射关系、数据采集时间间隔和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,实现了无需人工导入数据,降低了数据采集的错误率,提高了数据处理分析的效率。通过对所述待处理数据集进行转化,形成目标数据集,对所述目标数据集进行分析,获取分析结果,并展示所述分析结果,实现了对数据的处理分析及图形化展示,提高了数据处理的效率。
本系统可通过手工从医院临床系统中导出数据文件,再经过execl处理后导入SAS、SPSS和Stata等分析软件进行数据计算,形成结果后再通过第三方行为识别系统,例如Finebi、TempoBI、Sugar BI、Quick BI等大数据分析工具呈现数据或者采用Execl的图形呈现功能展示数据图文结果的方式进行替换。
具体而言,所述采集模块包括提取单元和识别单元,所述提取单元用以提取数据信息,所述识别单元内设置有映射矩阵,所述映射矩阵的输入为数据信息对应的地址信息,当所述提取单元在提取到对应的数据信息不为空时,则根据映射矩阵将提取单元内的数据信息作为符合映射关系的数据信息。
具体而言,在所述识别单元内的所述映射矩阵设置有若干映射函数,根据数据信息内的关键字信息获取与该数据信息对应的目标领域信息,确定所述目标领域信息后,从所述映射函数中选择与所述目标领域信息匹配的目标映射函数作为主函数,所述目标领域信息为映射函数的函数因子,所述主函数不唯一,将数据信息根据主函数的关系进行采集。
具体而言,所述关键字信息为一个时,根据所述第一关键字信息 a获取数据信息对应的第一目标领域信息A,在所述映射函数中选择与所述第一目标领域信息A匹配的目标映射函数作为主函数。
具体而言,若映射函数内函数因子包含第一目标领域信息A,则所述映射函数可作为主函数,例如M1=f(A)、M2=f(A,B)、 M3=f(A,B,C)等函数。
若映射函数内函数因子不包含第一目标领域信息A,则所述映射函数不可作为主函数,例如M4=f(B)、M5=f(B,C)、M6=f(B, C,D)等函数。
具体而言,所述关键字信息为两个时,根据所述第二关键字信息 b和第三关键字信息c获取数据信息对应的第二目标领域信息B和第三目标领域信息C,在所述映射函数中选择与所述第二目标领域信息 B和第三目标领域信息C匹配的目标映射函数作为主函数。
具体而言,若映射函数内函数因子同时包含第二目标领域信息B 和第三目标领域信息C,则所述映射函数可作为主函数,例如M3=f (A,B,C)、M5=f(B,C)、M6=f(B,C,D)、M7=f(B,C, E)等函数。
若映射函数内函数因子不同时包含第二目标领域信息B和第三目标领域信息C,则所述映射函数不可作为主函数,例如M1=f(A)、 M2=f(A,B)、M8=f(E,F)等函数。
具体而言,所述数据源包括医院信息系统HIS(Hospital Information System)、临床信息系统CIS(Clinical Information System)、实验室信息管理系统LIS(LaboratoryInformation Management System)和计算机化病案系统EMR(Electronic MedicalRecord)等数据库。
具体而言,本发明实施例在所述采集模块在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统形成待处理数据集时,通过映射关系、数据采集时间间隔和数据采集周期的设置,根据所述映射关系、数据采集时间间隔和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,实现了无需人工导入数据,降低了数据采集的错误率,提高了数据处理分析的效率。
具体而言,在所述设置模块预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期时,所述采集周期内包含若干采集时间间隔,
所述映射关系包括单表映射、sql映射、elasticsearch映射、关系型数据库映射和jdbc连接数据源。
所述时间间隔的时间单位包括毫秒(ms)、秒(s)、分钟(min),本发明实施例中所述时间间隔设置为“1s”,即每隔1秒的时间,数据分析系统就会对数据源进行采集数据并处理分析。
所述采集周期的时间单位包括分钟(min)、小时(h)、日(d),本发明实施例中所述采集周期设置为“1d”,即每隔1天的时间,数据分析系统就会将这1天采集到的数据进行处理分析并存储为单独数据集。
具体而言,本发明实施例中设置模块预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,实现了数据的定时自动采集参数的设置,简化了系统流程,提高了系统的工作效率。
具体而言,在所述处理模块对采集到的待处理数据集进行转化时,定义特征值,根据所述特征值通过7个数据处理服务包对采集到的待处理数据集进行转化,形成目标数据集。
具体而言,所述特征值包括年龄、身高和体重等临床数据信息。
具体而言,所述7个数据处理服务包,包括数据过滤,对所述特征值数据进行过滤筛选,在数据过滤基本信息界面中,定义处理服务名称,例如“年龄大于50”,定义符合当前过滤条件的数据状态,例如“启用”,在过滤条件界面中,定义数据集字段,例如“年龄”,定义条件字段,例如“大于”,定义值字段,例如“50”。即可将年龄大于50 岁的患者的相关临床数据过滤出来。
具体而言,在所述数据过滤基本信息界面可根据研究目标添加过滤条件,定义处理服务名称,例如“体重大于50”,定义符合当前过滤条件的数据状态,例如“启用”,在过滤条件界面中,定义数据集字段,例如“体重”,定义条件字段,例如“大于”,定义值字段,例如“50”,即可将体重大于50岁的患者的相关临床数据过滤出来。
具体而言,在所述数据过滤基本信息界面可根据研究目标删除过滤条件,在过滤条件界面可通过“×”删除该筛选条件。
具体而言,所述7个数据处理服务包包括值替换,对所述特征值数据进行替换,在值替换原始字段界面定义字段名称,例如“婚否”,定义字段类型,例如“布尔”,定义需要处理的值,例如“固定值”,在值替换新字段界面定义字段名称,例如“是否结婚”,定义处理后的值,例如“固定值”,即可将原始字段“婚否”替换为新字段“是否结婚”。
具体而言,所述7个数据处理服务包包括类型转换,对所述特征值数据类型进行转换,在类型转换基本信息界面定义处理服务名称,例如“获取年份”,在类型转换原始字段界面定义字段名称,例如“出生日期”,定义字段类型,例如“日期”,在类型转换新字段界面定义字段名称,例如“年份”,定义处理方式,例如“取年”,即可将临床数据中患者的出生日期替换为出生的年份,以满足特殊数据挖掘算法的要求。
具体而言,所述7个数据处理服务包包括归一化,对所述特征值数据进行归一化处理,在归一化原始字段界面定义字段名称,例如“年龄”,定义字段类型,例如“整型”,在归一化新字段界面定义处理方式,例如“Max-Min归一化”。
具体而言,所述7个数据处理服务包包括标准化,对特征值数据进行标准化处理,在标准化原始字段界面定义字段名称,例如“年龄”,定义字段类型,在标准化新字段界面定义处理方式。
具体而言,所述7个数据处理服务包包括离散化,对所述特征值数据进行离散化处理,在离散化原始字段界面定义字段名称,例如“年龄”,定义字段类型,在离散化新字段界面定义处理方式。
具体而言,所述7个数据处理服务包包括自定义字段,在引用字段界面定义字段名,在引用函数界面引用函数,在展示区域展示最终表达式,在字段界面查看字段详情。
具体而言,所述字段详情包括属性和说明;所述属性包括标识、名称、大小、字段类型和描述。
具体而言,本发明实施例在所述处理模块对采集到的待处理数据进行转化时,定义特征值,根据所述特征值通过数据过滤、值替换、类型转换、归一化、标准化、离散化和自定义字段对采集到的待处理数据进行转化,形成目标数据集,实现了对采集到的待处理数据转化为机器学习算法要求的目标数据集,提高了数据分析的效率。
具体而言,在所述分析模块对目标数据集进行分析时,通过描述性分析和机器学习分析的方式,呈现目标数据集特征值的分布、趋势等情况和进行数据挖掘计算。
具体而言,所述描述性分析利用图形组件呈现需要分析的目标数据集特征值的图形化分布图情况,在描述性分析界面定义列(X轴、类别轴)拖入字段,例如“姓名”,定义行(Y轴、值轴)拖入字段,例如“年龄”,定义统计方式,例如“平均值”,即可进行图形化呈现。
具体而言,所述图形化分布图包括柱状图、折线图、气泡图、散点图、平行图、直方图、箱线图和排列图,通过对目标数据集特征值的图形化呈现,目标数据集特征值数学规律逐渐明确,为后续数据挖掘提供依据和线索。
具体而言,对所述图形化分布图进行存储。
具体而言,所述机器学习分析通过定义分析类型和算法对目标数据集进行挖掘计算,获取目标数据集挖掘结果,在创建数据挖掘界面定义分析模型名称,例如“线性回归算法”,定义分析模型说明,定义分析模型类型,例如“回归分析”,定义算法,例如“线性回归”。
具体而言,所述分析模型类型包括分类分析、回归分析、聚类分析、关联规则、时间序列、关系网络;
具体而言,所述算法包括线性回归和回归树。
具体而言,在字段设置界面定义字段,在输入字段界面进行字段选择,例如“【01】【guiyi】/【归一】”,在模型信息界面可查看基本信息、参数和高级参数。
具体而言,所述基本信息包括模型名称、模型算法和模型生成时间;所述参数包括分析字段、输入字段和抽样比率。
具体而言,所述高级参数包括字段选择方式、是否自动忽略共线字段和岭参数。
具体而言,对所述目标数据集挖掘结果进行存储。
具体而言,本发明实施例在所述分析模块对目标数据集进行分析时,通过描述性分析获取目标数据集特征值的图形化分布图和含有 13种处理服务包的机器学习,实现了对目标数据集的分析并获得了目标数据集的分析结果,通过可视化操作页面,降低了本系统的学习门槛。
具体而言,在所述展示模块展示所述分析结果时,通过自定义排版和仪表盘呈现,实现了以图文的方式存储并显示仪表盘界面。
具体而言,所述自定义排版对数据进行自定义布局排版和内置布局方式排版,所述自定义布局排版根据所述分析结果自定义排版方式,在模型应用界面定义分析模型,在应用参数界面定义参数。。
具体而言,所述内置布局方式包括田子型、工字型、左右类型和上下类型。
具体而言,所述仪表盘呈现对定义好的保存到不同分组中的仪表盘界面进行呈现,实现了数据分析结果的可视化表达。
具体而言,本发明实施例在所述展示模块展示所述分析结果时,通过自定义布局排版和内置布局方式排版,得到了数据分析结果的可视化布局,实现了数据分析结果的可视化表达,提高了数据处理效率,满足了研究人员对数据分析的可视化表达的要求。
具体而言,如图2所示,本发明实施例提供的基于医疗的数据分析系统的应用流程包括:
对数据源进行定义选择;定义映射关系并根据映射关系进行数据采集,判断采集到的待处理数据是否为增量数据,若采集到的待处理数据为增量数据,则数据处理系统将创建数据集并将数据更新到数据集里面,若采集到的待处理数据不为增量数据,则数据处理系统将同步数据集并将数据抽取到数据集里面;根据实际处理需求定义特征值,对所述特征值进行数据过滤、值替换、类型转换、归一化、标准化、离散化和自定义字段处理转化;对所述处理转化结果进行图形化定义并存储,根据实际处理需求在分类分析、回归分析、聚类分析、关联规则、时间序列、关系网络定义机器学习的算法,并将计算结果进行存储;对所述计算结果进行排版,并在仪表盘界面输出所述排版。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于医疗的数据分析系统,其特征在于,包括:
设置模块,用以预先设置有至少一种映射关系、数据采集时间间隔和数据采集周期,所述采集周期内包含若干采集时间间隔;
采集模块,用以在采集周期内采集数据,按照所述数据采集时间间隔和和数据采集周期将数据源内的符合映射关系的数据信息采集至数据分析系统,形成待处理数据集。
2.根据权利要求1所述的基于医疗的数据分析系统,其特征在于,所述采集模块包括提取单元和识别单元,所述提取单元用以提取数据信息,所述识别单元内设置有映射矩阵,所述映射矩阵的输入为数据信息对应的地址信息,当所述提取单元在提取到对应的数据信息不为空时,则根据映射矩阵,将提取单元内的数据信息作为符合映射关系的数据信息。
3.根据权利要求2所述的基于医疗的数据分析系统,其特征在于,所述识别单元内的所述映射矩阵设置有若干映射函数,根据数据信息内的关键字信息获取与该数据信息对应的目标领域信息,确定所述目标领域信息后,从所述映射函数中选择与所述目标领域信息匹配的目标映射函数作为主函数,所述目标领域信息为映射函数的函数因子,所述主函数不唯一,将数据信息根据主函数的关系进行采集。
4.根据权利要求3所述的基于医疗的数据分析系统,其特征在于,所述关键字信息为一个时,根据所述第一关键字信息a获取数据信息对应的第一目标领域信息,在所述映射函数中选择与所述第一目标领域信息A匹配的目标映射函数作为主函数,
若映射函数内函数因子包含第一目标领域信息A,则所述映射函数可作为主函数,
若映射函数内函数因子不包含第一目标领域信息A,则所述映射函数不可作为主函数。
5.根据权利要求4所述的基于医疗的数据分析系统,其特征在于,
所述关键字信息为两个时,根据所述第二关键字信息b和第三关键字信息c获取数据信息对应的第二目标领域信息B和第三目标领域信息C,在所述映射函数中选择与所述第二目标领域信息B和第三目标领域信息C匹配的目标映射函数作为主函数,
若映射函数内函数因子同时包含第二目标领域信息B和第三目标领域信息C,则所述映射函数可作为主函数,
若映射函数内函数因子不同时包含第二目标领域信息B和第三目标领域信息C,则所述映射函数不可作为主函数。
6.根据权利要求5所述的基于医疗的数据分析系统,其特征在于,还包括:
处理模块,用以对所述待处理数据集进行转化,形成目标数据集;
分析模块,用以对所述目标数据集进行分析,获取分析结果;
展示模块,用以展示所述分析结果。
7.根据权利要求6所述的基于医疗的数据分析系统,其特征在于,所述处理模块对采集到的待处理数据进行转化时,定义特征值,根据所述特征值通过7个数据处理服务包对采集到的待处理数据进行转化,形成目标数据集。
8.根据权利要求7所述的基于医疗的数据分析系统,其特征在于,所述7个数据处理服务包包括:数据过滤、值替换、类型转换、归一化、离散化和自定义字段。
9.根据权利要求8所述的基于医疗的数据分析系统,其特征在于,所述分析模块对目标数据集进行分析时,通过描述性分析和机器学习分析的方式,呈现目标数据集特征值的分布图和进行数据挖掘计算,所述描述性分析包括:柱状图、折线图、气泡图、散点图、平行图、直方图、箱线图和排列图,
所述机器学习分析的方式包括:分类分析、回归分析、聚类分析、关联规则、时间序列和关系网络以及线性回归算法和回归树算法。
10.根据权利要求9所述的基于医疗的数据分析系统,其特征在于,所述展示模块展示所述分析结果时,通过自定义排版和仪表盘呈现,所述内置布局方式包括田子型、工字型、左右类型和上下类型。
CN202210899688.6A 2022-07-28 2022-07-28 一种基于医疗的数据分析系统 Active CN115223722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210899688.6A CN115223722B (zh) 2022-07-28 2022-07-28 一种基于医疗的数据分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210899688.6A CN115223722B (zh) 2022-07-28 2022-07-28 一种基于医疗的数据分析系统

Publications (2)

Publication Number Publication Date
CN115223722A true CN115223722A (zh) 2022-10-21
CN115223722B CN115223722B (zh) 2023-03-24

Family

ID=83613860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210899688.6A Active CN115223722B (zh) 2022-07-28 2022-07-28 一种基于医疗的数据分析系统

Country Status (1)

Country Link
CN (1) CN115223722B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158875A (zh) * 2010-12-01 2011-08-17 中兴通讯股份有限公司 一种设备信息采集方法及系统
KR20200057611A (ko) * 2019-09-30 2020-05-26 지의소프트 주식회사 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
CN112925964A (zh) * 2021-04-01 2021-06-08 王琪 基于云计算服务的大数据采集方法及大数据采集服务系统
CN113535758A (zh) * 2021-09-09 2021-10-22 浩鲸云计算科技股份有限公司 一种把传统数据库脚本批量转换上云的大数据系统和方法
CN114036183A (zh) * 2021-11-24 2022-02-11 杭州安恒信息技术股份有限公司 一种数据etl处理方法、装置、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158875A (zh) * 2010-12-01 2011-08-17 中兴通讯股份有限公司 一种设备信息采集方法及系统
KR20200057611A (ko) * 2019-09-30 2020-05-26 지의소프트 주식회사 통계 데이터베이스의 데이터를 대화형으로 제공하는 질의 답변 시스템
CN112925964A (zh) * 2021-04-01 2021-06-08 王琪 基于云计算服务的大数据采集方法及大数据采集服务系统
CN113535758A (zh) * 2021-09-09 2021-10-22 浩鲸云计算科技股份有限公司 一种把传统数据库脚本批量转换上云的大数据系统和方法
CN114036183A (zh) * 2021-11-24 2022-02-11 杭州安恒信息技术股份有限公司 一种数据etl处理方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丁治明 等: "面向物联网海量传感器采样数据管理的数据库集群系统框架", 《计算机学报》 *

Also Published As

Publication number Publication date
CN115223722B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
US7707169B2 (en) Specification-based automation methods for medical content extraction, data aggregation and enrichment
CN110335647A (zh) 一种临床数据标准化系统及标准化数据采集方法
CN110136837B (zh) 一种医疗数据处理平台
WO2002035392A2 (en) Knowledge pattern integration system
CN111081329A (zh) 临床数据自动录入方法及装置、电子设备、存储介质
CN112349369A (zh) 医疗影像大数据智能分析方法、系统及存储介质
CN115497631A (zh) 一种临床科研大数据分析系统
Pecoraro et al. Designing ETL tools to feed a data warehouse based on electronic healthcare record infrastructure
CN107480435A (zh) 一种应用于临床数据的自动搜索机器学习系统及方法
KR20200037151A (ko) Xml 기반의 의료 기관 데이터베이스 통합 관리 시스템
CN115630839A (zh) 一种基于数据挖掘的生产智能反馈调控系统
CN114121295A (zh) 一种知识图谱驱动的肝癌诊疗方案推荐系统的构建方法
US20120259661A1 (en) Systems and methods for data mining of DICOM structured reports
CN113223726A (zh) 医疗大数据中数据治理方式与治理结果的可视化交互系统
CN115223722B (zh) 一种基于医疗的数据分析系统
US20170255752A1 (en) Continuous adapting system for medical code look up
CN110321556A (zh) 一种医生诊疗医保控费智能推荐方案的方法及其系统
JP2001175724A (ja) 診療報酬明細書分析システム
CN115881259A (zh) 病历数据处理方法、装置、设备及存储介质
CN116010439A (zh) 一种可视化中文sql系统及构建查询方法
CN110010231A (zh) 一种数据处理系统及计算机可读存储介质
CN111259633A (zh) 一种将文档转化格式并自动建立数据库的系统
CN113270201A (zh) 一种医疗信息数据校验方法及系统、计算机可读存储介质
CN111161824A (zh) 自动化报告解读方法及系统
CN104680022B (zh) 液体出入量计算系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Medical Based Data Analysis System

Effective date of registration: 20230830

Granted publication date: 20230324

Pledgee: Shanghai Rural Commercial Bank Co.,Ltd. Xuhui sub branch

Pledgor: Medical Lijie (Shanghai) Information Technology Co.,Ltd.

Registration number: Y2023310000509