CN114610748B - 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 - Google Patents
基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 Download PDFInfo
- Publication number
- CN114610748B CN114610748B CN202210258771.5A CN202210258771A CN114610748B CN 114610748 B CN114610748 B CN 114610748B CN 202210258771 A CN202210258771 A CN 202210258771A CN 114610748 B CN114610748 B CN 114610748B
- Authority
- CN
- China
- Prior art keywords
- data
- module
- disease
- medical
- solution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 197
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 197
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 54
- 208000024891 symptom Diseases 0.000 claims abstract description 54
- 238000001228 spectrum Methods 0.000 claims abstract description 23
- 238000013480 data collection Methods 0.000 claims abstract description 13
- 239000002245 particle Substances 0.000 claims description 131
- 238000001514 detection method Methods 0.000 claims description 29
- 238000005457 optimization Methods 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 claims description 20
- 238000012544 monitoring process Methods 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims 1
- 238000002360 preparation method Methods 0.000 claims 1
- 238000005316 response function Methods 0.000 claims 1
- 238000013523 data management Methods 0.000 abstract description 6
- 238000007726 management method Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 24
- 208000011597 CGF1 Diseases 0.000 description 8
- 230000004039 social cognition Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Security & Cryptography (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种医疗数据管理系统,尤其为基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用,包括数据收集单元、数据处理单元、数据分类单元、数据匹配单元和数据建库单元,数据收集单元用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元,数据处理单元用于对收集到的医疗疾病数据进行聚类处理,并对其安全性进行监测,数据分类单元用于将数据处理单元聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下,数据匹配单元用于将归类后的医疗疾病数据与各种症状进行匹配,并生成各类症状可能归属的疾病图表,数据建库单元用于将疾病图表和医疗疾病数据结合进行统一建库。
Description
技术领域
本发明涉及一种医疗数据管理系统,尤其是基于人工智能的医疗疾病数据的安全快速精准有效管理系统。
背景技术
疾病分析统计数据库(Disease DataBase,DDB)是一种将疾病按病种或术种进行分类,使数据标准化,存放在计算机数据库中,以备研究使用的数据管理与分析系统。随着信息时代的发展,各种疾病及病谱更新速度快。应用于不同人群时,各个疾病表现出的新症状也层出不穷,如果不能有效地对医疗疾病数据实时更新管理,那么通过网络进行就诊的患者很可能因为症状判断错误也延误就医时间。
发明内容
本发明的目的是通过提出基于人工智能的医疗疾病数据的安全快速精准有效管理系统,以解决上述背景技术中提出的缺陷。
本发明采用的技术方案如下:
提供基于人工智能的医疗疾病数据的安全快速精准有效管理系统,包括数据收集单元、数据处理单元、数据分类单元、数据匹配单元和数据建库单元,所述数据收集单元、数据处理单元、数据分类单元、数据匹配单元和数据建库单元依次通过以太网信号连接,所述数据收集单元用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元,所述数据处理单元用于对收集到的医疗疾病数据进行聚类处理,并对其安全性进行监测,所述数据分类单元用于将所述数据处理单元聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下,所述数据匹配单元用于将归类后的医疗疾病数据与各种症状进行匹配,并生成各类症状可能归属的疾病图表,所述数据建库单元用于将疾病图表和医疗疾病数据结合进行统一建库。
作为本发明的一种优选技术方案:所述数据收集单元包括医疗数据库访问模块、字词查找模块、数据加密模块和数据传输模块,所述医疗数据库访问模块通过以太网与各医疗机构的医疗数据库连接,所述医疗数据库访问模块、字词查找模块、数据加密模块和数据传输模块依次通过以太网信号连接,所述医疗数据库访问模块用于连接各医疗机构的医疗数据库,并定期访问各医疗机构的医疗数据库,进行数据比对,所述字词查找模块用于从各医疗机构的医疗数据库中通过字词来查找需要的医疗疾病数据,并对其进行提取,所述数据加密模块用于对提取的医疗疾病数据进行加密打包,所述数据传输模块用于对加密打包的医疗疾病数据进行分散传输给数据处理单元。
作为本发明的一种优选技术方案:所述数据处理单元包括安全监测模块、数据解码模块、聚类处理模块和粒子优化模块,所述安全监测模块、数据解码模块、聚类处理模块和粒子优化模块依次通过以太网信号连接,所述安全监测模块用于对数据传输模块传输的医疗疾病数据进行安全性校验,所述数据解码模块用于对加密打包的医疗疾病数据进行解码,所述聚类处理模块用于对解码后的医疗疾病数据进行聚类处理,所述粒子优化模块用于对聚类处理模块进行优化。
作为本发明的一种优选技术方案:所述数据分类单元包括病谱更新模块、疾病归类模块、分类校验模块和分类替换模块,所述病谱更新模块、疾病归类模块、分类校验模块和分类替换模块依次通过以太网信号连接,所述病谱更新模块用于根据权威病谱网站上的信息事实对病谱进行更新,所述疾病归类模块用于将各疾病数据归类到相应的病谱目录下,所述分类校验模块用于定期对归类后的疾病数据进行校验,并对错误的分类进行标记,所述分类替换模块用于将正确的疾病数据替换被所述分类校验模块标记的疾病数据。
作为本发明的一种优选技术方案:所述数据匹配单元与所述数据分类单元进行实时交互,所述数据匹配单元包括症状提取模块、大数据筛查模块、临床比对模块和图表生成模块依次通过以太网信号连接,所述症状提取模块用于提取各种医疗机构数据库中记录的症状,所述大数据筛查模块用于使用爬虫对互联网上各种用户的症状搜索和咨询进行筛选获取,所述临床比对模块用于提取互联网上各种临床确定信息并与所述症状提取模块和大数据筛查模块中提取到的信息进行比对,所述图表生成模块用于将确认的症状临床信息与对应的若干种疾病数据及其病谱生成图表。
作为本发明的一种优选技术方案:所述数据建库单元包括病种生成模块、年龄生成模块、症状生成模块和数据备份模块,所述病种生成模块、年龄生成模块、症状生成模块和数据备份模块依次通过以太网信号连接,所述病种生成模块用于在数据库中生成病种标签,所述年龄生成模块用于在各个病种标签上生成易发年龄段索引,所述症状生成模块用于在各个病种标签上生成对应症状索引,所述数据备份模块用于定期对数据库中的数据进行备份。
作为本发明的一种优选技术方案:所述聚类处理模块采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理,其具体包括如下步骤:
步骤1:对隶属度U使用之间进行均匀分布的初始化,使其满足约束条件;
步骤2:根据U和迭代公式计算出聚类中心zj;
步骤3:计算函数J,若其结果小于某个阈值,或与上一个J的变化小于某阈值,则算法停止;
步骤4:根据迭代公式计算新的U,返回步骤2。
作为本发明的一种优选技术方案:所述根据U和迭代公式计算出聚类中心zj具体为:
其中,m为数据集大小,i=1,2,…,m,uij为第i个数据对第j个中心点的隶属度,并且0<uij<1,α为超参数,xi为第i个数据。
作为本发明的一种优选技术方案:所述粒子优化模块对聚类处理模块进行优化具体包括采用粒子群算法确定所述FCM聚类算法的初始聚类中心,其具体为:
步骤1:给定类别数c,模糊指数m,群体规模N,学习因子c1和c2,交叉概率PC,变异概率Pm,惯性权重ω,阈值ε,最大迭代次数T,粒子变化范围;
步骤2:初始化随机生成N个聚类中心,形成N个第1代粒子,每个粒子的当前位置为其pbesti,当前种群所有粒子中的最好位置为gbest,用适应度函数计算适应度值,此时每个粒子的最优适应度个体为其自身,群体中最优适应度个体为所有粒子中适应度值最大的粒子;
步骤3:对每个粒子进行速度和位置更新,依据交叉概率PC,变异概率Pm,进行选择、交叉和变异操作,产生下一代的粒子群:
步骤4:用适应度函数计算新粒子群中每个个体的适应度值,先与个体上一代比较,若大于上一代适应度值,则取代上一代个体成为pbesti,且适应度值为个体最优适应度值,否则保持原样;
步骤5:再与群体最优个体适应度比较,若大于群体最优个体适应度值,则用该个体替代全局最优个体gbest,其适应度值为此时群体最优适应度值,否则群体最优和群体最优适应度值保持原样;
步骤6:迭代次数T=T+1;
步骤7:当算法达到进化的最大迭代次数或设定的阈值ε,即种群的适应度没有改进时,算法停止,否则,跳转到步骤3;
步骤8:产生适应度最好的种群,即适应度最好的初始聚类中心;
步骤9:在FCM中输入产生的初始聚类中心进行图像分割;
步骤10:输出分割结果。
作为本发明的一种优选技术方案:所述适应度函数具体为:
其中,k为常数,J(U,V)为FCM的目标函数;
所述对每个粒子进行速度和位置更新具体包括:
v(i+1)d=ωvid+c1rand1(Pid-xid)+c2rand2(Pgd-xid)
x(i+1)d=xid+v(i+1)d
其中,rand1和rand2为两个在[0,1]范围内变化的随机函数,第i个粒子表示为Xi=(xi1,xi2,…,xid),粒子经历过的最好位置记为Pi=(pi1,pi2,…,pid),粒子i的速度用Vi=(vi1,vi2,…,vid)表示。
本发明提供的于人工智能的医疗疾病数据管理系统,与现有技术相比,具有如下有益效果:
1、本发明通过医疗数据库访问模块能够定期访问各医疗机构的医疗数据库,通过字词查找模块以预设关键词在该数据库中检索相应的数据,数据检索到后统一通过数据加密模块进行加密打包,此操作是为了防止医疗数据外泄,其次,数据传输模块能够对加密打包的医疗疾病数据进行分散传输给数据处理单元,能够将数据包按照特定顺序进行打乱,分成一个个加密的数据包,在传输过程中即使被爬取,被打乱的数据包并不能从中提取有效数据,有效保证了数据传输的机密性和安全性。
2、本发明通过安全监测模块校验传输后的数据包是否和传输前打包时一致,保证数据传输的完整性。另一方面能够校验传输后的数据包是否在传输过程中混入其他恶意程序,能够防止服务器被恶意攻击。数据解码模块在解码数据后按照原先顺序对数据进行组合,重新提取数据,进一步保证了数据的安全获取。
3、本发明采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理,并采用粒子群算法确定所述FCM聚类算法的初始聚类中心。由于FCM聚类算法不同的聚类中心产生的分割效果是不同的,其目标函数式越小分割效果越好,而在混合优化算法中不同聚类中心的适应度越大越好,因此使用倒数来评价每个粒子的适应度,由于FCM算法在选取初始聚类中心时是随机选取的,容易使迭代过程陷入局部最优解,因此把进化寻优算法引入到模糊聚类分割中,可达到全局寻优、快速收敛的效果。
4、本发明通过病谱更新模块能够实时对病谱进行更新,能够进一步保证医疗疾病数据归类的精准性,其次,将各疾病数据归类到相应的病谱目录下,期对归类后的疾病数据进行校验,并对错误的分类进行标记,且将正确的疾病数据替换被分类校验模块标记的疾病数据,这是为了防止在病谱实时更新后带来的病种与新的病谱产生不对应的情况,采用分类校验模块和分类替换模块就能够定期校验,保证数据库中始终保持病谱和病种对应的情况,能够进一步保证医疗疾病数据的精准有效。
5、本发明通过数据匹配单元在病谱和病种归类的情况下,进一步通过网络上的症状搜索和咨询进行以及医疗机构中的新症状来对病种进行图表生成,即哪一种疾病会有哪些病症,这种获取方式效率极高,因现在网络发达,患者不仅会去医院就诊,还会在互联网上根据自己的病症进行咨询和搜索。这样相对于只从医疗机构获取病症信息而言,其搜集范围有效扩大。能够更加快速地获取更精准的病症信息。
6、通过数据建库单元进行重新建库。其中利用上述的图表形式,生成症状索引和年龄段索引,后期与客户端对接时,用户可直接根据自己的年龄和症状来直接进行索引。
附图说明
图1为本发明优选实施例的整体系统模块图;
图2为本发明优选实施例中数据收集单元的模块示意图;
图3为本发明优选实施例中数据处理单元的模块示意图;
图4为本发明优选实施例中数据分类单元的模块示意图;
图5为本发明优选实施例中数据匹配单元的模块示意图;
图6为本发明优选实施例中数据建库单元的模块示意图。
图中:100、数据收集单元;101、医疗数据库访问模块;102、字词查找模块;103、数据加密模块;104、数据传输模块;200、数据处理单元;201、安全监测模块;202、数据解码模块;203、聚类处理模块;204、粒子优化模块;300、数据分类单元;301、病谱更新模块;302、疾病归类模块;303、分类校验模块;304、分类替换模块;400、数据匹配单元;401、症状提取模块;402、大数据筛查模块;403、临床比对模块;404、图表生成模块;500、数据建库单元;501、病种生成模块;502、年龄生成模块;503、症状生成模块;504、数据备份模块。
具体实施方式
需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1-6,本发明优选实施例提供了基于人工智能的医疗疾病数据的安全快速精准有效管理系统,包括数据收集单元100、数据处理单元200、数据分类单元300、数据匹配单元400和数据建库单元500,数据收集单元100、数据处理单元200、数据分类单元300、数据匹配单元400和数据建库单元500依次通过以太网信号连接,数据收集单元100用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元200,数据处理单元200用于对收集到的医疗疾病数据进行聚类处理,并对其安全性进行监测,数据分类单元300用于将数据处理单元200聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下,数据匹配单元400用于将归类后的医疗疾病数据与各种症状进行匹配,并生成各类症状可能归属的疾病图表,数据建库单元500用于将疾病图表和医疗疾病数据结合进行统一建库。
数据收集单元100包括医疗数据库访问模块101、字词查找模块102、数据加密模块103和数据传输模块104,医疗数据库访问模块101通过以太网与各医疗机构的医疗数据库连接,医疗数据库访问模块101、字词查找模块102、数据加密模块103和数据传输模块104依次通过以太网信号连接,医疗数据库访问模块101用于连接各医疗机构的医疗数据库,并定期访问各医疗机构的医疗数据库,进行数据比对,字词查找模块102用于从各医疗机构的医疗数据库中通过字词来查找需要的医疗疾病数据,并对其进行提取,数据加密模块103用于对提取的医疗疾病数据进行加密打包,数据传输模块104用于对加密打包的医疗疾病数据进行分散传输给数据处理单元200。在本实施例中,医疗数据库访问模块101能够定期访问各医疗机构的医疗数据库,通过字词查找模块102以预设关键词在该数据库中检索相应的数据,数据检索到后统一通过数据加密模块103进行加密打包,此操作是为了防止医疗数据外泄,其次,数据传输模块104能够对加密打包的医疗疾病数据进行分散传输给数据处理单元200,分散传输是将数据包按照特定顺序进行打乱,分成一个个加密的数据包,在传输过程中即使被爬取,被打乱的数据包并不能从中提取有效数据,有效保证了数据传输的机密性和安全性。
具体的,为了定期访问各医疗机构的医疗数据库时能够提高效率和节省资源,本实施例中医疗数据库访问模块101具体访问时间t0通过如下方式进行计算。
其中,D为该医疗机构近5天就诊人数,S为该医疗机构的科室数量,T为该医疗机构数据库更新时间。
其次,数据处理单元200包括安全监测模块201、数据解码模块202、聚类处理模块203和粒子优化模块204,安全监测模块201、数据解码模块202、聚类处理模块203和粒子优化模块204依次通过以太网信号连接,安全监测模块201用于对数据传输模块104传输的医疗疾病数据进行安全性校验,数据解码模块202用于对加密打包的医疗疾病数据进行解码,聚类处理模块203用于对解码后的医疗疾病数据进行聚类处理,粒子优化模块204用于对聚类处理模块203进行优化。安全监测模块201主要用于校验传输后的数据包是否和传输前打包时一致,保证数据传输的完整性。另一个是校验传输后的数据包是否在传输过程中混入其他恶意程序,能够防止服务器被恶意攻击。数据解码模块202在解码数据后按照原先顺序对数据进行组合。接下来就是聚类的操作。具体的:聚类处理模块203采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理,其具体包括如下步骤:
步骤1:对隶属度U使用0,1之间进行均匀分布的初始化,使其满足约束条件;
步骤2:根据U和迭代公式计算出聚类中心zj;
步骤3:计算函数J,若其结果小于某个阈值,或与上一个J的变化小于某阈值,则算法停止;
步骤4:根据迭代公式计算新的U,返回步骤2。
根据U和迭代公式计算出聚类中心zj具体为:
其中,m为数据集大小,i=1,2,…,m,uij为第i个数据对第j个中心点的隶属度,并且0<uij<1,α为超参数,xi为第i个数据。
进一步地,粒子优化模块204对聚类处理模块203进行优化具体包括采用粒子群算法确定FCM聚类算法的初始聚类中心,其具体为:
步骤1:给定类别数c,模糊指数m,群体规模N,学习因子c1和c2,交叉概率PC,变异概率Pm,惯性权重ω,阈值ε,最大迭代次数T,粒子变化范围;
步骤2:初始化随机生成N个聚类中心,形成N个第1代粒子,每个粒子的当前位置为其pbesti,当前种群所有粒子中的最好位置为gbest,用适应度函数计算适应度值,此时每个粒子的最优适应度个体为其自身,群体中最优适应度个体为所有粒子中适应度值最大的粒子;
步骤3:对每个粒子进行速度和位置更新,依据交叉概率PC,变异概率Pm,进行选择、交叉和变异操作,产生下一代的粒子群:
步骤4:用适应度函数计算新粒子群中每个个体的适应度值,先与个体上一代比较,若大于上一代适应度值,则取代上一代个体成为pbesti,且适应度值为个体最优适应度值,否则保持原样;
步骤5:再与群体最优个体适应度比较,若大于群体最优个体适应度值,则用该个体替代全局最优个体gbest,其适应度值为此时群体最优适应度值,否则群体最优和群体最优适应度值保持原样;
步骤6:迭代次数T=T+1;
步骤7:当算法达到进化的最大迭代次数或设定的阈值ε,即种群的适应度没有改进时,算法停止,否则,跳转到步骤3;
步骤8:产生适应度最好的种群,即适应度最好的初始聚类中心;
步骤9:在FCM中输入产生的初始聚类中心进行图像分割;
步骤10:输出分割结果。
适应度函数具体为:
其中,k为常数,J(U,V)为FCM的目标函数;J(U,V)越小就代表聚类效果越好,则粒子适应度f(xi)就越高。
具体的,对每个粒子进行速度和位置更新具体包括:
v(i+1)d=ωvid+c1rand1(Pid-xid)+c2rand2(Pgd-xid)
x(i+1)d=xid+v(i+1)d
其中,rand1和rand2为两个在[0,1]范围内变化的随机函数,第i个粒子表示为Xi=(xi1,xi2,…,xid),粒子经历过的最好位置记为Pi=(pi1,pi2,…,pid),粒子i的速度用Vi=(vi1,vi2,…,vid)表示。
对于FCM聚类算法来说,不同的聚类中心产生的分割效果是不同的,其目标函数式越小分割效果越好,而在混合优化算法中不同聚类中心的适应度越大越好,因此可使用倒数来评价每个粒子的适应度,由于FCM算法在选取初始聚类中心时是随机选取的,容易使迭代过程陷入局部最优解,因此把进化寻优算法引入到模糊聚类分割中,可达到全局寻优、快速收敛的效果。
数据分类单元300包括病谱更新模块301、疾病归类模块302、分类校验模块303和分类替换模块304,病谱更新模块301、疾病归类模块302、分类校验模块303和分类替换模块304依次通过以太网信号连接,病谱更新模块301用于根据权威病谱网站上的信息事实对病谱进行更新,疾病归类模块302用于将各疾病数据归类到相应的病谱目录下,分类校验模块303用于定期对归类后的疾病数据进行校验,并对错误的分类进行标记,分类替换模块304用于将正确的疾病数据替换被分类校验模块303标记的疾病数据。病谱更新模块301能够实时对病谱进行更新,由于目前医疗技术发展相当迅速,为了保证病谱实时准确,所以对其进行实时更新,能够进一步保证医疗疾病数据归类的精准性,其次,将各疾病数据归类到相应的病谱目录下,期对归类后的疾病数据进行校验,并对错误的分类进行标记,且将正确的疾病数据替换被分类校验模块303标记的疾病数据,这是为了防止在病谱实时更新后带来的病种与新的病谱产生不对应的情况,采用分类校验模块303和分类替换模块304就能够定期校验,保证数据库中始终保持病谱和病种对应的情况,能够进一步保证医疗疾病数据的精准有效。
数据匹配单元400与数据分类单元300进行实时交互,数据匹配单元400包括症状提取模块401、大数据筛查模块402、临床比对模块403和图表生成模块404依次通过以太网信号连接,症状提取模块401用于提取各种医疗机构数据库中记录的症状,大数据筛查模块402用于使用爬虫对互联网上各种用户的症状搜索和咨询进行筛选获取,临床比对模块403用于提取互联网上各种临床确定信息并与症状提取模块401和大数据筛查模块402中提取到的信息进行比对,图表生成模块404用于将确认的症状临床信息与对应的若干种疾病数据及其病谱生成图表。数据匹配单元400的实际作用是在病谱和病种归类的情况下,进一步通过网络上的症状搜索和咨询进行以及医疗机构中的新症状来对病种进行图表生成,即哪一种疾病会有哪些病症,这种获取方式效率极高,因现在网络发达,患者不仅会去医院就诊,还会在互联网上根据自己的病症进行咨询和搜索。这样相对于只从医疗机构获取病症信息而言,其搜集范围有效扩大。能够更加快速地获取更精准的病症信息。
数据建库单元500包括病种生成模块501、年龄生成模块502、症状生成模块503和数据备份模块504,病种生成模块501、年龄生成模块502、症状生成模块503和数据备份模块504依次通过以太网信号连接,病种生成模块501用于在数据库中生成病种标签,年龄生成模块502用于在各个病种标签上生成易发年龄段索引,症状生成模块503用于在各个病种标签上生成对应症状索引,数据备份模块504用于定期对数据库中的数据进行备份。在上述操作都完成后,为了方便患者后期通过客户端对应寻症,本实施例通过数据建库单元500进行重新建库。其中利用上述的图表形式,生成症状索引和年龄段索引,后期与客户端对接时,用户可直接根据自己的年龄和症状来直接进行索引。
其中,还包括用户终端,用户终端通过APP访问数据建库单元500中建立的数据库,APP可通过症状索引和年龄段索引直接检索出相应的病种和病谱图表,其次,用户终端会自动从互联网上获取上述检索出的病种和病谱图表对应的病种症状图表,附于病种和病谱图表上,这样用户即可一目了然地看出自己属于哪种病种。
在另一个实施例中,采用FCM聚类算法对医疗疾病数据进行分类处理,并采用粒子群算法确定FCM聚类算法对医疗疾病数据进行分类的初始聚类中心,应用FCM聚类算法的目标函数计算各粒子的适应度函数值,FCM聚类算法的目标函数值越小,粒子的适应度函数值越小,聚类效果越好,从而提高FCM聚类算法的聚类精度。其还可以是如下方法:
优选的,在采用粒子群算法确定FCM聚类算法对医疗疾病数据进行分类的初始聚类中心时,采用下列方式确定粒子群中各粒子的更新方式:
(1)对种群中各粒子的历史最优解和全局最优解进行检测;
(2)根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式。
优选的,采用下列方式对种群中各粒子的历史最优解和全局最优解进行检测:
设Xi(t)表示种群中粒子i在第t次迭代后的解,Pbesti(t)表示粒子i在第t次迭代后的历史最优解,Gbest(t)表示种群在第t次迭代后的全局最优解,设置Ωi(t)为粒子i在第t次迭代后的检测区域,当解Xi(t)、Pbesti(t)和Gbest(t)不在一条直线上时,Ωi(t)为以解Xi(t)、Pbesti(t)和Gbest(t)为三个顶点形成的三角形区域,当解Xi(t)、Pbesti(t)和Gbest(t)在一条直线上时,Ωi(t)为连接解Xi(t)、Pbesti(t)和Gbest(t)三个点的线段,在检测区域Ωi(t)中对粒子i的历史最优解Pbesti(t)和全局最优解Gbest(t)进行检测:
定义ρi(Pbesti(t))表示历史最优解Pbesti(t)在检测区域Ωi(t)中的引导成功率,ρi(Gbest(t))表示全局最优解Gbest(t)在检测区域Ωi(t)中的引导成功率,ρi(Pbesti(t))和ρi(Gbest(t))的值分别为:
在上述公式中,Ni(Pbesti(t))为用于在检测区域Ωi(t)中对历史最优解Pbesti(t)进行检测的标志性解集合,Ni(Gbest(t))为用于在检测区域Ωi(t)中对全局最优解Gbest(t)进行检测的标志性解集合,且Ni(Pbesti(t))和Ni(Gbest(t))中的解为采用下列方式在检测区域Ωi(t)中筛选所得:设Xij(t)为检测区域Ωi(t)中的第j个解,且j=1,2,...,Mi(t),Mi(t)表示检测区域Ωi(t)中解的数量,Xij(t-1)为解Xij(t)所对应的粒子在第(t-1)次迭代后的解,d(Xij(t),Pbesti(t))表示解Xij(t)和历史最优解Pbesti(t)之间的欧式距离,d(Xij(t-1),Pbesti(t))表示解Xij(t-1)和历史最优解Pbesti(t)之间的欧式距离,d(Xij(t),Gbest(t))表示解Xij(t)和全局最优解Gbest(t)之间的欧式距离,d(Xij(t-1),Gbest(t))表示解Xij(t-1)和全局最优解Gbest(t)之间的欧式距离,当解Xij(t)同时满足:Xij(t-1)∈Ωi(t)且d(Xij(t),Pbesti(t))<d(Xij(t-1),Pbesti(t))且d(Xij(t),Gbest(t))>d(Xij(t-1),Gbest(t))时,将解Xij(t)加入标志性解集合Ni(Pbesti(t))中,当解Xij(t)同时满足:Xij(t-1)∈Ωi(t)且d(Xij(t),Gbest(t))<d(Xij(t-1),Gbest(t))且d(Xij(t),Pbesti(t))>d(Xij(t-1),Pbesti(t))时,则将解Xij(t)加入集合Ni(Gbest(t))中;fij(t)表示解Xij(t)的适应度函数值,fij(t-1)表示解Xij(t-1)的适应度函数值,Xil(t)为标志性解集合Ni(Pbesti(t))中的第l个解,Xil(t-1)为解Xil(t)所对应的粒子在第(t-1)次迭代后的解,βil(t)表示解Xil(t)的进化成功系数,且fil(t)表示解Xil(t)的适应度函数值,fil(t-1)表示解Xil(t-1)的适应度函数值,Mi(Pbesti(t))表示标志性解集合Ni(Pbesti(t))中解的数量,Xik(t)为标志性解集合Ni(Gbest(t))中的第k个解,Xik(t-1)为解Xik(t)所对应的粒子在第(t-1)次迭代后的解,βik(t)表示解Xik(t)的进化成功系数,且fik(t)表示解Xik(t)的适应度函数值,fik(t-1)表示解Xik(t-1)的适应度函数值,Mi(Gbest(t))表示标志性解集合Ni(Gbest(t))中解的数量。
优选的,根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式:
设Xi(t)表示粒子i在第t次迭代后的解,Xi(t+1)表示粒子i在第(t+1)次迭代后的解,设置粒子i采用下列方式对解Xi(t)进行更新,从而获得解Xi(t+1):
Xi(t+1)=Xi(t)+Vi(t+1)
在上述更新公式中,Vi(t+1)表示粒子i在进行第(t+1)次迭代更新时的步长,Vi(t+1)的值为:
Vi(t+1)=ω(t)Vi(t)+ci1(t)r1(Pbesti(t)-Xi(t))+ci2(t)r2(Gbest(t)-Xi(t))
在上述Vi(t+1)的计算公式中,Vi(t)表示粒子i在进行第t次迭代更新时的步长,ω(t)表示种群在第t次迭代后的惯性权重因子,且ωmax和ωmin分别为给定的最大和最小惯性权重因子,Tmax为给定的最大迭代次数,r1和r2分别为0到1之间的随机数,Pbesti(t)表示粒子i在第t次迭代后的历史最优解,Gbest(t)表示种群在第t次迭代后的全局最优解,ci1(t)为粒子i在第t次迭代后的自我认知系数,ci2(t)为粒子i在第t次迭代后的社会认知系数,且ci1(t)和ci2(t)的值分别为:
在上述ci1(t)和ci2(t)的计算公式中,c0为给定的标准认知系数值,且cmax和cmin分别为给定的最大和最小认知系数值,cmax的值可以取2.5,cmin的值可以取0.5,ρi(Pbesti(t))表示历史最优解Pbesti(t)在检测区域Ωi(t)中的引导成功率,ρi(Gbest(t))表示全局最优解Gbest(t)在检测区域Ωi(t)中的引导成功率,其中,Ωi(t)为粒子i在第t次迭代后的检测区域,当解Xi(t)、Pbesti(t)和Gbest(t)不在一条直线上时,Ωi(t)为以解Xi(t)、Pbesti(t)和Gbest(t)为三个顶点形成的三角形区域,当解Xi(t)、Pbesti(t)和Gbest(t)在一条直线上时,Ωi(t)为连接解Xi(t)、Pbesti(t)和Gbest(t)三个点的线段。
具体的,针对粒子群算法存在的局部寻优精度低,以及寻优精度和收敛速度难以平衡的缺陷,本实施例对种群中各粒子的历史最优解和全局最优解进行检测,并根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式,从而提高粒子的局部寻优精度的同时,平衡算法的寻优精度和收敛速度。在粒子群算法中,粒子在迭代更新过程中通过向其历史最优解和当前的全局最优解进行学习,从而确定下一次解的位置,在标准粒子群算法中,粒子在更新过程中的步长由三部分组成,第一部分表示了粒子保持当前速度的趋势,第二部分决定了粒子局部搜索的能力,即通过自己寻优过程中找到的历史最优解引导自己的寻优,并且通过自我认知系数来调节其历史最优解对最终步长影响程度的大小,第三部分决定了粒子的全局搜索的能力,即利用种群迄今为止获得的全局最优解引导粒子的寻优,并且通过社会认知系数来调节该全局最优解对最终步长影响程度的大小,从上述可以看出,粒子迭代更新时的步长中的自我认知系数决定了粒子的局部搜索程度,社会认知系数决定了粒子的全局搜索程度,在现有技术中,粒子的自我认知系数和社会认知系数通常被设置为固定常数,或者根据当前迭代次数进行自适应调节,但这些针对种群整体设置的认知系数并不能适应种群中各粒子当前的实际寻优情况,种群中每个粒子寻找到的历史最优解不同,粒子的解、其历史最优解和全局最优解的分布也不同,因此所面临的寻优情况也存在区别,为了使得粒子的步长能够引导粒子获得更好的寻优结果,本实施例提出一种新的自我认知系数和社会认知系数的设置方式,首先对粒子进行检测,通过粒子当前的解、其历史最优解和全局最优解构造粒子的检测区域,所述粒子在下一次迭代时具有较大概率是在该检测区域内进行移动获得新的解,因此在该检测区域内对粒子的历史最优解和全局最优解进行检测,在该检测区域中选取在上一次迭代时明显向着历史最优解方向进行移动更新的粒子作为历史最优解的标志性解,同时在该检测区域中选取在上一次迭代时明显向着全局最优解方向进行移动更新的粒子作为全局最优解的标志性解,通过定义的历史最优解的引导成功率衡量在该检测区域内向着历史最优解方向进行移动获得更新的解的进化成功性,而全局最优解的引导成功率用于衡量在该检测区域内向着全局最优解方向进行移动获得更新的解的进化成功性,当在该检测区域内粒子向着历史最优解方向进行移动相较于向着全局最优解方向进行移动获得的成功性高时,设置粒子具有较大的自我认知系数和较小的社会认知系数,使得粒子在下一次迭代时向着其历史最优解方向进行移动更新,从而获得较好的寻优结果,提高了粒子的寻优精度,相反的,当粒子在该检测区域内向着全局最优解方向进行移动相较于向着其历史最优解方向进行移动获得的成功性高时,设置粒子具有较小的自我认知系数和较大的社会认知系数,使得粒子在下一次迭代时向着全局最优解方向进行移动更新,从而获得较好的寻优结果,并提高了粒子收敛速度,即通过粒子、其历史最优解和全局最优解的实际情况设置粒子的更新方式,保证了粒子每一次更新时都能够获取较好的寻优结果的同时,能够有效的平衡算法的局部搜索和全局搜索,从而保证算法具有较高的寻优精度和收敛速度。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (6)
1.一种基于人工智能的医疗疾病数据的安全快速精准有效管理系统,其特征在于:包括数据收集单元(100)、数据处理单元(200)、数据分类单元(300)、数据匹配单元(400)和数据建库单元(500),所述数据收集单元(100)、数据处理单元(200)、数据分类单元(300)、数据匹配单元(400)和数据建库单元(500)依次通过以太网信号连接,所述数据收集单元(100)用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元(200),所述数据处理单元(200)用于对收集到的医疗疾病数据进行聚类处理,并对其安全性进行监测,所述数据分类单元(300)用于将所述数据处理单元(200)聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下,所述数据匹配单元(400)用于将归类后的医疗疾病数据与各种症状进行匹配,并生成各类症状可能归属的疾病图表,所述数据建库单元(500)用于将疾病图表和医疗疾病数据结合进行统一建库;所述数据处理单元(200)包括安全监测模块(201)、数据解码模块(202)、聚类处理模块(203)和粒子优化模块(204),所述安全监测模块(201)、数据解码模块(202)、聚类处理模块(203)和粒子优化模块(204)依次通过以太网信号连接,所述安全监测模块(201)用于对数据传输模块(104)传输的医疗疾病数据进行安全性校验,所述数据解码模块(202)用于对加密打包的医疗疾病数据进行解码,所述聚类处理模块(203)用于对解码后的医疗疾病数据进行聚类处理,所述粒子优化模块(204)用于对聚类处理模块(203)进行优化;
所述聚类处理模块(203)采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理,其具体包括如下步骤:
步骤1:对隶属度U使用(0,1)之间进行均匀分布的初始化,使其满足约束条件;
步骤2:根据U和迭代公式计算出聚类中心zj;
步骤3:计算函数J,若其结果小于某个阈值,或与上一个J的变化小于某阈值,则算法停止;
步骤4:根据迭代公式计算新的U,返回步骤2;
采用粒子群算法确定所述FCM聚类算法的初始聚类中心为如下步骤:
S1:对种群中各粒子的历史最优解和全局最优解进行检测;
S2:根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式采用下列方式对种群中各粒子的历史最优解和全局最优解进行检测:
设Xi(t)表示种群中粒子i在第t次迭代后的解,Pbesti(t)表示粒子i在第t次迭代后的历史最优解,Gbest(t)表示种群在第t次迭代后的全局最优解,设置Ωi(t)为粒子i在第t次迭代后的检测区域,当解Xi(t)、Pbesti(t)和Gbest(t)不在一条直线上时,Ωi(t)为以解Xi(t)、Pbesti(t)和Gbest(t)为三个顶点形成的三角形区域,当解Xi(t)、Pbesti(t)和Gbest(t)在一条直线上时,Ωi(t)为连接解Xi(t)、Pbesti(t)和Gbest(t)三个点的线段,在检测区域Ωi(t)中对粒子i的历史最优解Pbesti(t)和全局最优解Gbest(t)进行检测:
定义ρi(Pbesti(t))表示历史最优解Pbesti(t)在检测区域Ωi(t)中的引导成功率,ρi(Gbest(t))表示全局最优解Gbest(t)在检测区域Ωi(t)中的引导成功率,ρi(Pbesti(t))和ρi(Gbest(t))的值分别为:
其中,Ni(Pbesti(t))为用于在检测区域Ωi(t)中对历史最优解Pbesti(t)进行检测的标志性解集合,Ni(Gbest(t))为用于在检测区域Ωi(t)中对全局最优解Gbest(t)进行检测的标志性解集合,且Ni(Pbesti(t))和Ni(Gbest(t))中的解为采用下列方式在检测区域Ωi(t)中筛选所得:设Xij(t)为检测区域Ωi(t)中的第j个解,且j=1,2,...,Mi(t),Mi(t)表示检测区域Ωi(t)中解的数量,Xij(t-1)为解Xij(t)所对应的粒子在第(t-1)次迭代后的解,d(Xij(t),Pbesti(t))表示解Xij(t)和历史最优解Pbesti(t)之间的欧式距离,d(Xij(t-1),Pbesti(t))表示解Xij(t-1)和历史最优解Pbesti(t)之间的欧式距离,d(Xij(t),Gbest(t))表示解Xij(t)和全局最优解Gbest(t)之间的欧式距离,d(Xij(t-1),Gbest(t))表示解Xij(t-1)和全局最优解Gbest(t)之间的欧式距离,当解Xij(t)同时满足:Xij(t-1)∈Ωi(t)且d(Xij(t),Pbesti(t))<d(Xij(t-1),Pbesti(t))且d(Xij(t),Gbest(t))>d(Xij(t-1),Gbest(t))时,将解Xij(t)加入标志性解集合Ni(Pbesti(t))中,当解Xij(t)同时满足:Xij(t-1)∈Ωi(t)且d(Xij(t),Gbest(t))<d(Xij(t-1),Gbest(t))且d(Xij(t),Pbesti(t))>d(Xij(t-1),Pbesti(t))时,则将解Xij(t)加入集合Ni(Gbest(t))中;fij(t)表示解Xij(t)的适应度函数值,fij(t-1)表示解Xij(t-1)的适应度函数值,Xil(t)为标志性解集合Ni(Pbesti(t))中的第l个解,Xil(t-1)为解Xil(t)所对应的粒子在第(t-1)次迭代后的解,βil(t)表示解Xil(t)的进化成功系数,且fil(t)表示解Xil(t)的适应度函数值,fil(t-1)表示解Xil(t-1)的适应度函数值,Mi(Pbesti(t))表示标志性解集合Ni(Pbesti(t))中解的数量,Xik(t)为标志性解集合Ni(Gbest(t))中的第k个解,Xik(t-1)为解Xik(t)所对应的粒子在第(t-1)次迭代后的解,βik(t)表示解Xik(t)的进化成功系数,且fik(t)表示解Xik(t)的适应度函数值,fik(t-1)表示解Xik(t-1)的适应度函数值,Mi(Gbest(t))表示标志性解集合Ni(Gbest(t))中解的数量。
2.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统,其特征在于:所述数据收集单元(100)包括医疗数据库访问模块(101)、字词查找模块(102)、数据加密模块(103)和数据传输模块(104),所述医疗数据库访问模块(101)通过以太网与各医疗机构的医疗数据库连接,所述医疗数据库访问模块(101)、字词查找模块(102)、数据加密模块(103)和数据传输模块(104)依次通过以太网信号连接,所述医疗数据库访问模块(101) 用于连接各医疗机构的医疗数据库,并定期访问各医疗机构的医疗数据库,进行数据比对,所述字词查找模块(102)用于从各医疗机构的医疗数据库中通过字词来查找需要的医疗疾病数据,并对其进行提取,所述数据加密模块(103)用于对提取的医疗疾病数据进行加密打包,所述数据传输模块(104)用于对加密打包的医疗疾病数据进行分散传输给数据处理单元(200)。
3.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统,其特征在于:所述数据分类单元(300)包括病谱更新模块(301)、疾病归类模块(302)、分类校验模块(303)和分类替换模块(304),所述病谱更新模块(301)、疾病归类模块(302)、分类校验模块(303)和分类替换模块(304)依次通过以太网信号连接,所述病谱更新模块(301)用于根据权威病谱网站上的信息事实对病谱进行更新,所述疾病归类模块(302)用于将各疾病数据归类到相应的病谱目录下,所述分类校验模块(303)用于定期对归类后的疾病数据进行校验,并对错误的分类进行标记,所述分类替换模块(304)用于将正确的疾病数据替换被所述分类校验模块(303)标记的疾病数据。
4.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统,其特征在于:所述数据匹配单元(400)与所述数据分类单元(300)进行实时交互,所述数据匹配单元(400)包括症状提取模块(401)、大数据筛查模块(402)、临床比对模块(403)和图表生成模块(404)依次通过以太网信号连接,所述症状提取模块(401)用于提取各种医疗机构数据库中记录的症状,所述大数据筛查模块(402)用于使用爬虫对互联网上各种用户的症状搜索和咨询进行筛选获取,所述临床比对模块(403)用于提取互联网上各种临床确定信息并与所述症状提取模块(401)和大数据筛查模块(402)中提取到的信息进行比对,所述图表生成模块(404)用于将确认的症状临床信息与对应的若干种疾病数据及其病谱生成图表。
5.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统,其特征在于:所述数据建库单元(500)包括病种生成模块(501)、年龄生成模块(502)、症状生成模块(503)和数据备份模块(504),所述病种生成模块(501)、年龄生成模块(502)、症状生成模块(503)和数据备份模块(504)依次通过以太网信号连接,所述病种生成模块(501)用于在数据库中生成病种标签,所述年龄生成模块(502)用于在各个病种标签上生成易发年龄段索引,所述症状生成模块(503)用于在各个病种标签上生成对应症状索引,所述数据备份模块(504)用于定期对数据库中的数据进行备份。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210258771.5A CN114610748B (zh) | 2022-03-16 | 2022-03-16 | 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210258771.5A CN114610748B (zh) | 2022-03-16 | 2022-03-16 | 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114610748A CN114610748A (zh) | 2022-06-10 |
CN114610748B true CN114610748B (zh) | 2022-09-09 |
Family
ID=81862310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210258771.5A Active CN114610748B (zh) | 2022-03-16 | 2022-03-16 | 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114610748B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116455B (zh) * | 2023-10-24 | 2024-01-23 | 湖北大学 | 一种物联智控方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915560A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法 |
CN108538395A (zh) * | 2018-04-02 | 2018-09-14 | 上海市儿童医院 | 一种通用的医疗专病数据系统的构建方法 |
CN110969179A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 一种谱聚类算法中心点的选取方法和装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150339411A1 (en) * | 2014-05-22 | 2015-11-26 | Schlumberger Technology Corporation | Automated surface network generation |
CN107145704B (zh) * | 2017-03-27 | 2020-11-13 | 西安电子科技大学 | 一种面向社区的健康医疗监护、评测系统及其方法 |
CN109344962A (zh) * | 2018-09-05 | 2019-02-15 | 山东师范大学 | 基于直觉模糊认知图的时间序列预测方法 |
CN111556631A (zh) * | 2020-05-06 | 2020-08-18 | 东华大学 | 基于pso和rbfnn的隧道交通照明系统智能控制方法 |
CN112599252A (zh) * | 2021-03-04 | 2021-04-02 | 北京冠新医卫软件科技有限公司 | 慢性病案特征分类处理方法、装置及终端 |
CN112907604A (zh) * | 2021-03-16 | 2021-06-04 | 南通大学 | 一种用于眼底棉绒斑图像分割的自适应超像素fcm方法 |
CN113077839A (zh) * | 2021-04-19 | 2021-07-06 | 梅里医疗科技(洋浦)有限责任公司 | 基于基因大数据的疾病预测、生物靶点、药物研发一体化大健康平台 |
CN113282756B (zh) * | 2021-06-29 | 2023-01-10 | 华南农业大学 | 一种基于混合聚类的文本聚类智能评估方法 |
-
2022
- 2022-03-16 CN CN202210258771.5A patent/CN114610748B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915560A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法 |
CN108538395A (zh) * | 2018-04-02 | 2018-09-14 | 上海市儿童医院 | 一种通用的医疗专病数据系统的构建方法 |
CN110969179A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 一种谱聚类算法中心点的选取方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114610748A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Entity embedding-based anomaly detection for heterogeneous categorical events | |
Zhang et al. | Taxogen: Unsupervised topic taxonomy construction by adaptive term embedding and clustering | |
WO2022105115A1 (zh) | 问答对匹配方法、装置、电子设备及存储介质 | |
CN111916215B (zh) | 一种群集性/慢性疾病早期自动报警、初步特征分析与风险评估系统 | |
CN109036577B (zh) | 糖尿病并发症分析方法及装置 | |
Pathan et al. | Identifying stroke indicators using rough sets | |
CN112035741B (zh) | 基于用户体检数据的预约方法、装置、设备及存储介质 | |
CN111612041A (zh) | 异常用户识别方法及装置、存储介质、电子设备 | |
CN112151130B (zh) | 一种基于文献检索的决策支持系统和构建方法 | |
Zhang et al. | Taxogen: Constructing topical concept taxonomy by adaptive term embedding and clustering | |
CN114003734A (zh) | 乳腺癌风险因素知识体系模型、知识图谱系统及构建方法 | |
CN111696656B (zh) | 一种互联网医疗平台的医生评价方法、装置 | |
CN114610748B (zh) | 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用 | |
Comito et al. | AI-driven clinical decision support: enhancing disease diagnosis exploiting patients similarity | |
CN114092729A (zh) | 基于聚类匿名化与差分隐私保护的异构用电数据发布方法 | |
Velu et al. | Data mining in predicting liver patients using classification model | |
Omran et al. | Breast cancer identification from patients’ tweet streaming using machine learning solution on spark | |
Adi et al. | Stroke risk prediction model using machine learning | |
Li et al. | A mixed data clustering algorithm with noise-filtered distribution centroid and iterative weight adjustment strategy | |
CN114358202A (zh) | 基于药物分子图像分类的信息推送方法及装置 | |
Dutta | Detecting Lung Cancer Using Machine Learning Techniques. | |
Sehgal et al. | Identifying relevant data for a biological database: Handcrafted rules versus machine learning | |
Ting et al. | Data mining in biomedicine: Current applications and further directions for research | |
Elezaj et al. | Data-driven machine learning approach for predicting missing values in large data sets: A comparison study | |
Shawi et al. | Interpretable local concept-based explanation with human feedback to predict all-cause mortality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A secure, fast, accurate, and effective management system for medical disease data based on artificial intelligence and its application Granted publication date: 20220909 Pledgee: Hua Xia Bank Co.,Ltd. Kunming Branch Pledgor: Yunnan Shengyue Information Technology Co.,Ltd. Registration number: Y2024980005240 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |