CN111882203B - 一种中医药云服务实验系统 - Google Patents
一种中医药云服务实验系统 Download PDFInfo
- Publication number
- CN111882203B CN111882203B CN202010725488.XA CN202010725488A CN111882203B CN 111882203 B CN111882203 B CN 111882203B CN 202010725488 A CN202010725488 A CN 202010725488A CN 111882203 B CN111882203 B CN 111882203B
- Authority
- CN
- China
- Prior art keywords
- data
- layer
- user
- module
- traditional chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003814 drug Substances 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 70
- 238000007726 management method Methods 0.000 claims description 53
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 16
- 238000004140 cleaning Methods 0.000 claims description 13
- 238000000034 method Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000002474 experimental method Methods 0.000 claims description 9
- 238000003032 molecular docking Methods 0.000 claims description 9
- 238000007418 data mining Methods 0.000 claims description 8
- 238000005065 mining Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000012098 association analyses Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 238000007635 classification algorithm Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000013468 resource allocation Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 238000011068 loading method Methods 0.000 claims description 3
- 238000013079 data visualisation Methods 0.000 claims description 2
- 238000005538 encapsulation Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000003745 diagnosis Methods 0.000 abstract description 4
- 238000011161 development Methods 0.000 abstract description 3
- 238000013486 operation strategy Methods 0.000 abstract 1
- 238000011269 treatment regimen Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 11
- 238000011160 research Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000036541 health Effects 0.000 description 4
- 229940126680 traditional chinese medicines Drugs 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000692870 Inachis io Species 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229940126678 chinese medicines Drugs 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Educational Technology (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种中医药云服务实验系统,本发明以高校管理、教学中产生的数据、老中医医案以及网络爬虫爬取网络信息作为数据来源,利用本系统对这些数据进行多样化处理,归纳整理老中医和老师的学术思想和临证经验,传承和学习名老中医的诊疗策略,提高临床水平,还能对合作机构的医院运营数据进行标准KPI指标计算,充分把握医院运营动向,用于辅助院方制定运营策略;并且通过系统中的爬虫功能,爬取中医药相关信息,向中医研究人员提供中医新闻热点以及发展趋势等信息。
Description
技术领域
本发明涉及中医学领域,尤其涉及一种中医药云服务实验系统。
背景技术
当前在互联网+的背景下,网络技术越来越发达,对各行各业都产生了重要影响。信息时代的到来意味着数字信息技术的升级和大数据创新的突破,信息化高度发展,给教学、科研、学习、生活带来了高速便捷的服务,同时也产生了大量记录高新日常管理和教学工作的数据,这些数据随着时间的积累构成了一个庞大的大数据资源,这些资源具有很高的价值,因此搭建一个高效的大数据实验共享平台,将满足师生对大数据内容的学习和实践,利用实验室的功能辅助教学和科研是各高校急需解决的课题。
中国目前有一半以上的人患病没有就医,有超过1/3的人应该住院而没有住院;在寻求医疗服务人群中,有近三成的人到药店购药,超过四成的人到三级大医院就医;大医院门庭若市,一二级医院门可罗雀。这些现象的直接原因是近20年来,我们忽视了社区在提供公共服务中不可替代的平台作用。整个医疗卫生行业趋利气氛浓重,医疗机构重治轻防、忽视健康的行为普遍存在,医疗卫生资源配置结构严重失衡,而“看病难”的问题已成为全国面临的一个共性问题,而我省人口基数大,农村经济基础较薄弱,省内名老中医大多集中在省、市级医院,社区、县、乡卫生资源相对不足,群众“看病难”的问题就显得更加突出。因此,如何优化配置中医医疗资源,使患者能够在有限的医疗资源下享受到名老中医的辅助诊治是目前待解决的问题。
发明内容
针对上述存在的问题,本发明旨在提供一种中医药云服务实验系统,能够将高校中产生的大数据资源得到高校利用,并能最大限度解决目前中医人才不足的问题。
为了实现上述目的,本发明所采用的技术方案如下:
一种中医药云服务实验系统,其特征在于,包括基础服务层、数据资源层、平台服务层、组件支持层、应用服务层、服务展现层、用户服务层;
基础服务层,主要包括基础网络、硬件设备、系统软件、机房设施,用于为系统的运行提供环境支持;
数据资源层,是整个系统的核心,由资源调配服务,提供外部数据进入的接口,并对外部数据进行数据抽取、转换、加载并通过运算后形成规则数据;
平台服务层,能调用数据资源层中的数据,并利用各类算法对数据进行规格化处理,为系统提供规格化的数据;
组件支持层,收集前端交互界面中用户的自定义数据、算法条件,并传递给后端的平台服务层和数据资源层,形成完整的算法-数据逻辑,以待后续处理;
应用服务层,其是对接数据资源层进行逻辑封装与应用,包括基于数据资源层所定制的各种应用软件;
服务展现层向下对接数据资源层,向上为用户提供友好的交互界面以及数据可视化展示界面;
用户服务层为用户提供可调用的RESTful API,向下对接平台服务层,用户可调用不同的RESTful API实现对算法和数据的组合处理。
进一步地,所述数据资源层包括资源对接模块、非关系型数据库、关系型数据库、ETL模块、数据项管理模块、数据集管理模块、统计项管理模块、数据仓库以及运算模块;
资源对接模块提供外部数据进入的接口,用于将外部数据导入所述非关系型数据库以及关系型数据库中;
ETL模块用于将所述非关系型数据库、关系型数据库中的数据进行清洗、转换、汇总、抽取,用于形成标准数据,构建数据仓库;
数据项管理模块和数据集管理模块用于制定数据清洗规则以及数据仓库中标准数据的模板,并且提供给ETL模块以及数据仓库使用;
统计项管理模块用于制定基于数据仓库中标准数据的统计规则;
运算模块用于根据统计项管理模块中所制定的统计规则,对数据仓库中的数据进行计算、统计后形成标准统计数据并返回数据仓库。
进一步地,所述用户服务层包括RESTful API、算法模块以及数据模块,用于为用户提供丰富的标准可调用接口,以满足不同用户的需求。
进一步地,所述算法模块包括分类算法、聚类算法、回归算法、关联分析和神经网络,所述算法模块通过所述RESTful API调用。
进一步地,所述平台服务层调用所述算法模块中的各类算法对数据进行规格化处理,其具体步骤包括:
S1:调用所述数据仓库中的数据;
S2:通过所述算法模块中的各类算法对所述数据进行挖掘;
S3: 将数据挖掘后的结果再次存放在数据仓库中;
S4: 数据仓库中的得到的数据为规格化数据。
进一步地,所述组件支持层中包括用户管理模块、文件管理模块、权限管理模块和日志管理模块;
用户管理模块中对用户进行角色分配,每个角色对应不同的权限,只有通过身份验证合法时才可以进入系统;
权限管理模块中对不同的角色赋予不同的功能权限,角色和用户相关联;
文件管理模块中采用多种加密机制、自定义数据格式确保本地存取和网络传输的安全性;
日志管理模块用于对日常的敏感操作进行日志记录,用于当出现问题时可以追溯。
进一步地,所述应用服务层中包括报告生成系统和日志后台系统,报告生成系统用于针对不同的数据来源,将数据的分析结果生成对应的报告;日志后台系统用于在数据资源层、服务展现层和用户服务层中自动生成日志。
本发明的有益效果是:
1、本平台的建设综合了中医的经验及用药规律,通过完整的医案与案例数据将名老中医的经验进行分析、传承。通过数据资源层对数据进行清洗、转换、汇总、抽取,并利用用户服务层中的算法模块,充分发掘名老中医的辨证与用药规律,便于中医工作者进行学习,促进年轻中医大夫的成长,诊疗过程中可以进行诊疗辅助。
2、本平台利用数据资源层中的资源对接模块,能够导入合作机构医院的运营数据,针对合作机构的医院运营数据利用系统中的算法模块对其进行标准KPI指标计算,分析运营状况,充分展示医院日常运营情况,把握运营动向,为院方指定运营决策提供数据服务,并且还能通过应用服务层中的报告生成系统生成运营分析报告。
3、本系统提供了数据爬取功能,可以采集中医药相关的新闻信息。并对数据进行动态分析,丰富了平台中医数据宽度与深度,并且可以对该数据进行分析,从而挖掘近期中医新闻的热点、发展趋势等信息。
4、本系统具备生成完备分析报告的功能,可针对数据资源层中导入的不同数据源,利用用户服务层中算法模块中的丰富的算法,对数据进行多样化分析(回归、聚类、关联等),并能将结果通过报告生成系统输出到报告模板中,形成完备的数据分析报告,用于科研、教学、医院日常运营分析等用途。
附图说明
图1为本系统的总体架构图。
图2为本系统的平台总体技术框架图。
图3为本系统的数据资源层数据流向及工作流程。
图4为本系统的用户服务层数据流向以及工作流程。
图5为本系统的具体实施过程示意图。
图6 为本系统中的数据挖掘体系结构示意图。
图7 为本系统中提供的思维脑图工具。
图8 为本系统中提供的NLP工具。
图9 为本系统中算法模块中算法浏览示意图。
图10为本系统中回归算法回归分析结果示意图。
具体实施方式
为了使本领域的普通技术人员能更好的理解本发明的技术方案,下面结合实施例对本发明的技术方案做进一步的描述。
参考附图1-10可以看出,一种中医药云服务实验系统,包括基础服务层、数据资源层、平台服务层、组件支持层、应用服务层、服务展现层、用户服务层;
基础服务层为物理层,是整个系统的物理基础,主要包括基础网络、硬件设备、系统软件、机房设施,用于为系统的运行提供环境支持;
数据资源层是整个系统的核心,其搭载在基础服务层之上,由资源调配服务,提供外部数据进入的接口,并对外部数据进行数据抽取、转换、加载并通过运算后形成规则数据,用于实现对不同来源的各类信息和数据(用户数据库、专家库、知识库、病案数据库),以及其他各类电子文档、图片、视频等资料的集中存储与管理;
进一步地,所述数据资源层包括资源对接模块、非关系型数据库、关系型数据库、ETL模块、数据项管理模块、数据集管理模块、统计项管理模块、数据仓库以及运算模块;
资源对接模块提供外部数据进入的接口,用于将外部数据导入本系统的非关系型数据库以及关系型数据库中;
ETL模块用于将所述非关系型数据库、关系型数据库中的数据进行清洗、转换、汇总、抽取,用于形成标准数据,构建数据仓库;其构建数据仓库的步骤包括:
步骤一:读取非关系型数据库、关系型数据库中的数据;
步骤二:对所述数据进行清洗、转换,即就是对数据进行加工;
其中数据清洗即通过分析“脏数据”的产生原因和存在形式,利用现有的技术手段和方法去清洗“脏数据”,将原有的不符合要求的数据转化为满足数据质量或应用要求的数据,从而提高数据集的数据质量。在本系统中提供了数据清洗必备的环境、库,用户可以通过调用用户服务层的接口进行数据清洗,例如本系统中集成了Python专门处理数据的Pandas库,用户可以将数据转换成dataframe格式,进而清洗脏数据、处理离群值等;
数据转换是指将半结构化、非结构化的数据通过本系统提供的特定功能转化成结构化数据,以方便进一步研究。例如,互联网采集的数据多是半结构化文本数据,对于本结构化数据不能直接进行利用,需要对数据进行加工处理。
步骤三:对加工后的数据进行汇总、抽取,得到标准数据;
步骤四:将得到的标准数据存入数据仓库,从而构建数据仓库。
数据项管理模块和数据集管理模块用于制定数据清洗规则以及数据仓库中标准数据的模板,并且提供给ETL模块以及数据仓库;
统计项管理模块用于结合业务需求,制定基于数据仓库中标准数据的统计规则;
运算模块用于抽取数据仓库中的相关数据并根据统计项管理模块中所制定的统计规则,对数据进行计算、统计后形成标准统计数据返回至数据仓库。
优选地,所述资源对接模块中所导入的外部数据包括爬虫数据、自建平台数据、合作平台数据;
其中,合作平台数据是指合作机构提供脱敏后的数据库文件(SQLServer),平台定期导入,例如从合作医院的数据获取接口得到的医院的运营信息数据;
爬虫数据是利用系统中的爬虫功能采集互联网数据,对指定网站(中国中医药管理局等)中医药相关的新闻信息进行定期、实时采集;且系统中还对爬取到的数据还提供挖掘分析的功能,由于爬取的互联网数据为非结构化的文本数据,先通过大量人工标注数据,例如标注出药方中的药名、症状、机构、人名、地理位置等,利用训练医药领域专用NER神经网络(BILSTM+CRF),提取本文信息中的目标信息,从而转存入关系型数据库中;
自建平台数据是指与自己搭设的网站(名老中医网,不仅限于此系统得到的数据)进行对接,定期抽取数据。
参考附图3可以得出,数据资源层的工作流程是:首先,将外部数据通过资源对接模块导入非关系型数据库(采集数据)和关系型数据库(自建平台数据、合作平台数据)中;
其次,再将非关系型数据库和关系型数据库中的数据通过ETL模块进行抽取、转换、加载后形成标准数据再存入数据仓库,待后续使用;
再次,所述数据项管理模块、数据集管理模块定制数据清洗规则以及数据仓库中标准数据的模板,再返回给ETL模块和数据仓库,ETL模块再根据制定的规则和模板对数据进行处理,构建数据仓库;
最后,所述统计项管理模块结合业务需求,制定基于数据仓库中标准数据的统计规则,通过运算模块抽取数据仓库中相关数据进行计算、统计,再形成标准统计数据后返回至数据仓库,以待后用。
用户服务层为用户提供可调用的RESTful API,向下对接平台服务层,用户可调用不同的RESTful API实现对算法和数据的组合处理。
进一步地,参考附图4可以看出,用户服务层包括RESTful API、算法模块以及数据模块,用于为用户提供丰富的标准可调用接口,以满足不同用户的需求;
其中,RESTful API用于为系统提供完备的调用接口,满足用户深度开发应用,外部用户只需要按照接口规范传递提交参数请求,本系统可自动调用相关算法对数据进行处理,并返回最终结果,接口只提供算法调用、数据统计等功能,确保数据安全性;
算法模块提供各类算法,即就是与平台服务层对接的各种算法,通过调用接口,用户可以方便的调用平台中的各类算法;
数据模块指与所述数据仓库中数据交互的模块;
参考附图4可以看出,用户服务层的工作流程是:首先,通过RESTful API模块中的接口调用算法模块;其次,再由算法模块去数据仓库指定的数据集中抽取数据进行运算,既保证接口快速灵活使用,又保证数据安全性;最后,算法模块将运算结果反馈给RESTfulAPI模块,从而返回给用户统计数据。
进一步地,参考附图2可以看出,所述算法模块包括分类算法、聚类算法、回归算法、关联分析和神经网络;其中,分类算法是指用于有监督学习的分类场景,如针对不同病症的中医药方研究,根据现有药方数据,以病症为监督项,采用分类算法进行建模训练;
聚类算法用于无监督数据,如根据不同患者的病症情况,采用聚类算法可判定患者的病症所属,从而进行患者数据的研究;
回归算法可用于在患者治愈周期中,中医用药剂量的变化特性及药物的作用周期计算;
关联分析,用于挖掘频繁项集,如在大量同类病症的药方中进行关联分析,可以针对该病症常用中药及常用重要组合,对不同中药的药性进行关联性的分析;
神经网络可用于基础的分类场景,或者用于基于文本数据的挖掘分析,如NER等,可以从大量的药方、医案文本数据中识别出中药名、病症名等;
参考附图1、5可以看出,平台服务层对接用户服务层,可调用数据仓库中的数据,利用数据资源层处理模块对数据进行规格化处理,用于为系统提供规格化数据;
再结合附图2可以看出,数据应用是指对外部数据可以进行的应用操作类型,主要包括数据清洗、特征分析、算法验证、数据建模、参数优化、模型验证等;其中,算法验证是指使用不同的算法,对相同的数据(训练集、测试集、验证集)进行模型训练,分别计算每个模型的相关指标,如分类模型AUC、F1score,回归模型的MSER等,并根据这些指标选取最优的算法;模型验证是指选取算法后,训练算法模型,然后交叉验证、留一法等方法,检验模型指标。
进一步地,平台服务层调用数据仓库中的数据并利用各类算法对数据进行规格化处理的具体步骤包括:
S1:调用所述数据仓库中的数据;
S2:通过所述算法模块中的各类算法对所述数据进行挖掘;
S3: 将数据挖掘后的结果再次存放在数据仓库中;
S4: 数据仓库中的得到的数据为规格化数据。
在S2中所述的对数据仓库中的数据进行挖掘,是以数据仓库为基础,以数据挖掘体系结构为核心对数据仓库中的数据进行挖掘,将分析的结果再次存放到数据仓库中,其中数据挖掘体系结构如附图6所示,其总体分为挖掘表现模块、数据分析模块、算法应用模块、数据整理模块和数据收集模块,利用多种数据挖掘算法对数据进行处理,用户只需要通过点击选择数据源、算法,系统即可自动运行计算结果;例如附图9为系统所提供的算法的浏览示意图,比如当用户选择回归算法后,系统利用回归算法对上传的数据就行回归分析后生成的回归分析结果如附图10所示。
组件支持层收集前端交互界面中用户的自定义数据、算法条件,并传递给后端平台服务层和数据资源层,形成完整的算法-数据逻辑,系统根据用户自定义数据以及输入的算法条件并通过平台服务层调用数据资源层中的数据和用户服务层算法模块中的各类算法对数据根据算法、逻辑进行处理;
应用服务层可根据用户特殊业务场景需求,对接数据资源层进行逻辑封装与应用,具有良好的可扩展性,能快速实现对于不同用户个性化需求的支撑与实现,其包括基于数据资源层所定制的各种应用软件,包括提供基于医药数据、药方数据、医院运营数据产生的定制化数据报告服务;提供OCR识别程序,供用户使用,识别图片中的文本数据;思维脑图工具以及NLP工具,为用户提供在线服务的NLP工具;
例如,参考附图7可以看出,平台提供的思维脑图工具,用户可以在该工具中绘制思维脑图,再结合附图8可以看到平台提供的NLP工具,用户能够粘贴文本数据到其中,NLP工具可根据用户粘贴的文本数据与选择的算法进行运算,并将结果展示到页面上。
服务展现层向下对接数据资源层,向上为用户提供友好的交互界面以及数据可视化展示界面,是系统与用户的交互层;
进一步地,所述组件支持层中包括用户管理模块、文件管理模块、权限管理模块和日志管理模块;
用户管理模块中对用户进行角色分配,每个角色对应不同的权限,只有通过身份验证合法时才可以进入系统;
权限管理模块中对不同的角色赋予不同的功能权限,角色和用户相关联;
文件管理模块中采用多种加密机制、自定义数据格式确保本地存取和网络传输的安全性;
日志管理模块用于对日常的敏感操作进行日志记录,当出现问题时可以追溯。
进一步地,所述应用服务层中包括报告生成系统和日志后台系统,报告生成系统用于针对不同的数据来源,将数据的分析结果生成对应的报告,用户可以根据用户服务层提供的各类服务,调取相关算法和数据进行计算,最终自动生成报告并反馈给客户;日志后台系统用于在数据资源层、服务展现层和用户服务层中自动生成日志。
系统的日志包括三种:第一、数据资源层产生的日志,在对接外部数据时,该层会产生相应的日志,用于记录对接数据的时间、来源等信息;第二、服务展现层中产生的日志,当用户登录时,记录用户登录的时间及相关操作信息;第三、用户服务层产生的日志,即用户操作日志,记录用户通过平台或者API进行的相关操作。
实施例:
结合附图5可以看出,本发明具体操作的步骤包括:第一,数据服务层通过数据接口对接合作医院或者自建平台授权的数据接口,进行定期数据抽取,这些抽取到的数据包括结构化数据(合作医院数据、自建平台数据),同时利用数据采集功能采集互联网上的信息,获得非结构化数据(爬虫数据);
第二,对于结构化数据,存入关系型数据库中,对于非结构化数据,如文本数据,存入到非关系型数据库中;
第三,对于关系型数据库中的数据,进行数据清洗处理,再根据数据资源层中的数据项管理模块、数据集管理模块和统计项管理模块中所设定好的约束条件和统计规则对数据进行标准化处理得到标准化数据,再对标准化数据进行数据持久化,然后将其存储到数据仓库中;
第四,对于非关系型数据库中的数据,需要根据业务逻辑进行数据映射,即就是通过文本分析(如神经网络NER),将文本数据转化成标准格式(即实体-关系属性等数据),再通过数据标准化处理以及数据持久化处理,最终将非关系型数据映射成关系型数据,并形成一一对应关系,然后存储到数据仓库中;
第五,外部用户通过用户界面或者用户服务层中的RESTful API调用相关组件支持,形成格式规范的调用命令,通过平台服务层和应用服务层使用各类算法,对数据仓库中的数据进行访问、统计分析并生成报告等。
最后,将统计分析结果和生成的报告返回给服务展现层,从而直观得展示给客户,对数据进行可视化展示并提供报告展示、下载功能。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (5)
1.一种中医药云服务实验系统,其特征在于,包括基础服务层、数据资源层、平台服务层、组件支持层、应用服务层、服务展现层、用户服务层;
基础服务层,主要包括基础网络、硬件设备、系统软件、机房设施,用于为系统的运行提供环境支持;
数据资源层,是整个系统的核心,由资源调配服务,提供外部数据进入的接口,并对外部数据进行数据抽取、转换、加载并通过运算后形成规则数据;
平台服务层,能调用数据资源层中的数据,并利用各类算法对数据进行规格化处理,为系统提供规格化的数据;
组件支持层,收集前端交互界面中用户的自定义数据、算法条件,并传递给后端的平台服务层和数据资源层,形成完整的算法-数据逻辑,以待后续处理;
应用服务层,其是对接数据资源层进行逻辑封装与应用,包括基于数据资源层所定制的各种应用软件;
服务展现层向下对接数据资源层,向上为用户提供友好的交互界面以及数据可视化展示界面;
用户服务层为用户提供可调用的RESTful API,向下对接平台服务层,用户可调用不同的RESTful API实现对算法和数据的组合处理;
所述数据资源层包括资源对接模块、非关系型数据库、关系型数据库、ETL模块、数据项管理模块、数据集管理模块、统计项管理模块、数据仓库以及运算模块;
资源对接模块提供外部数据进入的接口,用于将外部数据导入所述非关系型数据库以及关系型数据库中;
ETL模块用于将所述非关系型数据库、关系型数据库中的数据进行清洗、转换、汇总、抽取,用于形成标准数据,构建数据仓库;
数据项管理模块和数据集管理模块用于制定数据清洗规则以及数据仓库中标准数据的模板,并且提供给ETL模块以及数据仓库使用;
统计项管理模块用于制定基于数据仓库中标准数据的统计规则;
运算模块用于根据统计项管理模块中所制定的统计规则,对数据仓库中的数据进行计算、统计后形成标准统计数据并返回数据仓库;
所述平台服务层调用算法模块中的各类算法对数据进行规格化处理,其具体步骤包括:
S1:调用所述数据仓库中的数据;
S2:通过所述算法模块中的各类算法对所述数据进行挖掘;
S3:将数据挖掘后的结果再次存放在数据仓库中;
S4:数据仓库中的得到的数据为规格化数据。
2.根据权利要求1所述的一种中医药云服务实验系统,其特征在于:所述用户服务层包括RESTful API、算法模块以及数据模块,用于为用户提供丰富的标准可调用接口,以满足不同用户的需求。
3.根据权利要求1所述的一种中医药云服务实验系统,其特征在于:所述算法模块包括分类算法、聚类算法、回归算法、关联分析和神经网络,所述算法模块通过所述RESTful API接口调用。
4.根据权利要求1所述的一种中医药云服务实验系统,其特征在于:所述组件支持层中包括用户管理模块、文件管理模块、权限管理模块和日志管理模块;
用户管理模块中对用户进行角色分配,每个角色对应不同的权限,只有通过身份验证合法时才可以进入系统;
权限管理模块中对不同的角色赋予不同的功能权限,角色和用户相关联;
文件管理模块中采用多种加密机制、自定义数据格式确保本地存取和网络传输的安全性;
日志管理模块用于对日常的敏感操作进行日志记录,用于当出现问题时可以追溯。
5.根据权利要求1所述的一种中医药云服务实验系统,其特征在于:所述应用服务层中包括报告生成系统和日志后台系统,报告生成系统用于针对不同的数据来源,将数据的分析结果生成对应的报告;日志后台系统用于在数据资源层、服务展现层和用户服务层中自动生成中间处理过程的日志。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010725488.XA CN111882203B (zh) | 2020-07-24 | 2020-07-24 | 一种中医药云服务实验系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010725488.XA CN111882203B (zh) | 2020-07-24 | 2020-07-24 | 一种中医药云服务实验系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111882203A CN111882203A (zh) | 2020-11-03 |
CN111882203B true CN111882203B (zh) | 2022-12-02 |
Family
ID=73201238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010725488.XA Active CN111882203B (zh) | 2020-07-24 | 2020-07-24 | 一种中医药云服务实验系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111882203B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559351B (zh) * | 2020-12-16 | 2022-06-14 | 中船重工奥蓝托无锡软件技术有限公司 | 一种cfd软件验证与确认数据库平台 |
CN112766690A (zh) * | 2021-01-12 | 2021-05-07 | 上海汇付数据服务有限公司 | 混合云资源管理系统 |
CN117371534B (zh) * | 2023-12-07 | 2024-02-27 | 同方赛威讯信息技术有限公司 | 一种基于bert的知识图谱构建方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846076A (zh) * | 2018-06-08 | 2018-11-20 | 山大地纬软件股份有限公司 | 支持接口适配的海量多源异构数据etl方法及系统 |
CN110361609A (zh) * | 2019-06-05 | 2019-10-22 | 国网浙江省电力有限公司电力科学研究院 | 特高压设备监测系统及方法 |
CN111260251A (zh) * | 2020-02-14 | 2020-06-09 | 中国科学院电子学研究所 | 一种运维服务管理平台及其运行方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060167983A1 (en) * | 2005-01-07 | 2006-07-27 | Exacore Corporation | Inter-networked knowledge services (INKS) |
CN107948216A (zh) * | 2016-10-09 | 2018-04-20 | 四川智康科技有限责任公司 | 一种基于soa构架的医院集中数据分析应用云平台 |
CN107358371A (zh) * | 2017-07-22 | 2017-11-17 | 北京羽客信息技术有限公司 | 用于企业经营改善的pdca循环分析系统 |
CN109559258B (zh) * | 2018-10-24 | 2023-05-09 | 宁夏立思辰银山教育产业有限公司 | 教育资源公共服务系统 |
CN110471965A (zh) * | 2019-06-26 | 2019-11-19 | 国家电网有限公司 | 一种电网设备nqi一站式服务云平台系统 |
CN111125061A (zh) * | 2019-12-18 | 2020-05-08 | 甘肃省卫生健康统计信息中心(西北人口信息中心) | 一种规范和促进健康医疗大数据的方法 |
-
2020
- 2020-07-24 CN CN202010725488.XA patent/CN111882203B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846076A (zh) * | 2018-06-08 | 2018-11-20 | 山大地纬软件股份有限公司 | 支持接口适配的海量多源异构数据etl方法及系统 |
CN110361609A (zh) * | 2019-06-05 | 2019-10-22 | 国网浙江省电力有限公司电力科学研究院 | 特高压设备监测系统及方法 |
CN111260251A (zh) * | 2020-02-14 | 2020-06-09 | 中国科学院电子学研究所 | 一种运维服务管理平台及其运行方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111882203A (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110415831B (zh) | 一种医疗大数据云服务分析平台 | |
CN111882203B (zh) | 一种中医药云服务实验系统 | |
Ross et al. | The HMO research network virtual data warehouse: a public data model to support collaboration | |
CN110335647A (zh) | 一种临床数据标准化系统及标准化数据采集方法 | |
CN109785927A (zh) | 基于互联网一体化医疗平台的临床文档结构化处理方法 | |
Panda et al. | Big data in health care: A mobile based solution | |
US20230031792A1 (en) | Design Method of Oncological Computerized Physician Order Entry System with Intelligent Clinical Decision Recommendation Function | |
CN101986333A (zh) | 一种医院辅助决策支持系统 | |
CN103955531A (zh) | 基于命名实体库的在线知识地图 | |
CN112349369A (zh) | 医疗影像大数据智能分析方法、系统及存储介质 | |
Ae Chun et al. | Social health data integration using semantic Web | |
CN107330111A (zh) | 基于通用形式化本体的领域本体的检索方法及装置 | |
CN112635071A (zh) | 融合中西医知识的糖尿病知识图谱构建方法 | |
Jiang et al. | A domain ontology approach in the ETL process of data warehousing | |
Xiong et al. | Design and evaluation of a prescription drug monitoring program for Chinese patent medicine based on knowledge graph | |
Yang et al. | Network information security platform based on artificial intelligence for the elderly’s health “Integration of Physical, Medical, and Nursing Care” | |
Keenan et al. | The HANDS project: studying and refining the automated collection of a cross-setting clinical data set | |
Shi et al. | Global output on artificial intelligence in the field of nursing: A bibliometric analysis and science mapping | |
Burkhart et al. | Mapping parish nurse documentation into the nursing interventions classification: a research method | |
Almeida et al. | Exporting data from an openEHR repository to standard formats | |
Jin et al. | Research on the construction and application of breast cancer-specific database system based on full data lifecycle | |
Xie | Big data Analysis on The Management Content of College Students' Mental Health Education | |
Jiang et al. | TCM Physical Health Management Training and Nursing Effect Evaluation Based on Digital Twin | |
Wang et al. | Clinical source data production and quality control in real-world studies: proposal for development of the eSource record system | |
Su et al. | [Retracted] Design and Application of Intelligent Management Platform Based on Big Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |