CN114610748B

CN114610748B - 基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用

Info

Publication number: CN114610748B
Application number: CN202210258771.5A
Authority: CN
Inventors: 徐昆
Original assignee: Yunnan Shengyue Information Technology Co ltd
Current assignee: Yunnan Shengyue Information Technology Co ltd
Priority date: 2022-03-16
Filing date: 2022-03-16
Publication date: 2022-09-09
Anticipated expiration: 2042-03-16
Also published as: CN114610748A

Abstract

本发明涉及一种医疗数据管理系统，尤其为基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用，包括数据收集单元、数据处理单元、数据分类单元、数据匹配单元和数据建库单元，数据收集单元用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元，数据处理单元用于对收集到的医疗疾病数据进行聚类处理，并对其安全性进行监测，数据分类单元用于将数据处理单元聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下，数据匹配单元用于将归类后的医疗疾病数据与各种症状进行匹配，并生成各类症状可能归属的疾病图表，数据建库单元用于将疾病图表和医疗疾病数据结合进行统一建库。

Description

基于人工智能的医疗疾病数据的安全快速精准有效管理系统及应用

技术领域

本发明涉及一种医疗数据管理系统，尤其是基于人工智能的医疗疾病数据的安全快速精准有效管理系统。

背景技术

疾病分析统计数据库(Disease DataBase，DDB)是一种将疾病按病种或术种进行分类，使数据标准化，存放在计算机数据库中，以备研究使用的数据管理与分析系统。随着信息时代的发展，各种疾病及病谱更新速度快。应用于不同人群时，各个疾病表现出的新症状也层出不穷，如果不能有效地对医疗疾病数据实时更新管理，那么通过网络进行就诊的患者很可能因为症状判断错误也延误就医时间。

发明内容

本发明的目的是通过提出基于人工智能的医疗疾病数据的安全快速精准有效管理系统，以解决上述背景技术中提出的缺陷。

本发明采用的技术方案如下：

提供基于人工智能的医疗疾病数据的安全快速精准有效管理系统，包括数据收集单元、数据处理单元、数据分类单元、数据匹配单元和数据建库单元，所述数据收集单元、数据处理单元、数据分类单元、数据匹配单元和数据建库单元依次通过以太网信号连接，所述数据收集单元用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元，所述数据处理单元用于对收集到的医疗疾病数据进行聚类处理，并对其安全性进行监测，所述数据分类单元用于将所述数据处理单元聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下，所述数据匹配单元用于将归类后的医疗疾病数据与各种症状进行匹配，并生成各类症状可能归属的疾病图表，所述数据建库单元用于将疾病图表和医疗疾病数据结合进行统一建库。

作为本发明的一种优选技术方案：所述数据收集单元包括医疗数据库访问模块、字词查找模块、数据加密模块和数据传输模块，所述医疗数据库访问模块通过以太网与各医疗机构的医疗数据库连接，所述医疗数据库访问模块、字词查找模块、数据加密模块和数据传输模块依次通过以太网信号连接，所述医疗数据库访问模块用于连接各医疗机构的医疗数据库，并定期访问各医疗机构的医疗数据库，进行数据比对，所述字词查找模块用于从各医疗机构的医疗数据库中通过字词来查找需要的医疗疾病数据，并对其进行提取，所述数据加密模块用于对提取的医疗疾病数据进行加密打包，所述数据传输模块用于对加密打包的医疗疾病数据进行分散传输给数据处理单元。

作为本发明的一种优选技术方案：所述数据处理单元包括安全监测模块、数据解码模块、聚类处理模块和粒子优化模块，所述安全监测模块、数据解码模块、聚类处理模块和粒子优化模块依次通过以太网信号连接，所述安全监测模块用于对数据传输模块传输的医疗疾病数据进行安全性校验，所述数据解码模块用于对加密打包的医疗疾病数据进行解码，所述聚类处理模块用于对解码后的医疗疾病数据进行聚类处理，所述粒子优化模块用于对聚类处理模块进行优化。

作为本发明的一种优选技术方案：所述数据分类单元包括病谱更新模块、疾病归类模块、分类校验模块和分类替换模块，所述病谱更新模块、疾病归类模块、分类校验模块和分类替换模块依次通过以太网信号连接，所述病谱更新模块用于根据权威病谱网站上的信息事实对病谱进行更新，所述疾病归类模块用于将各疾病数据归类到相应的病谱目录下，所述分类校验模块用于定期对归类后的疾病数据进行校验，并对错误的分类进行标记，所述分类替换模块用于将正确的疾病数据替换被所述分类校验模块标记的疾病数据。

作为本发明的一种优选技术方案：所述数据匹配单元与所述数据分类单元进行实时交互，所述数据匹配单元包括症状提取模块、大数据筛查模块、临床比对模块和图表生成模块依次通过以太网信号连接，所述症状提取模块用于提取各种医疗机构数据库中记录的症状，所述大数据筛查模块用于使用爬虫对互联网上各种用户的症状搜索和咨询进行筛选获取，所述临床比对模块用于提取互联网上各种临床确定信息并与所述症状提取模块和大数据筛查模块中提取到的信息进行比对，所述图表生成模块用于将确认的症状临床信息与对应的若干种疾病数据及其病谱生成图表。

作为本发明的一种优选技术方案：所述数据建库单元包括病种生成模块、年龄生成模块、症状生成模块和数据备份模块，所述病种生成模块、年龄生成模块、症状生成模块和数据备份模块依次通过以太网信号连接，所述病种生成模块用于在数据库中生成病种标签，所述年龄生成模块用于在各个病种标签上生成易发年龄段索引，所述症状生成模块用于在各个病种标签上生成对应症状索引，所述数据备份模块用于定期对数据库中的数据进行备份。

作为本发明的一种优选技术方案：所述聚类处理模块采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理，其具体包括如下步骤：

步骤1：对隶属度U使用之间进行均匀分布的初始化，使其满足约束条件；

步骤2：根据U和迭代公式计算出聚类中心z_j；

步骤3：计算函数J,若其结果小于某个阈值，或与上一个J的变化小于某阈值，则算法停止；

步骤4：根据迭代公式计算新的U,返回步骤2。

作为本发明的一种优选技术方案：所述根据U和迭代公式计算出聚类中心z_j具体为：

其中，m为数据集大小，i＝1,2，…，m，u_ij为第i个数据对第j个中心点的隶属度,并且0＜u_ij＜1，α为超参数，x_i为第i个数据。

作为本发明的一种优选技术方案：所述粒子优化模块对聚类处理模块进行优化具体包括采用粒子群算法确定所述FCM聚类算法的初始聚类中心,其具体为：

步骤1：给定类别数c，模糊指数m，群体规模N，学习因子c₁和c₂，交叉概率P_C，变异概率P_m，惯性权重ω，阈值ε，最大迭代次数T，粒子变化范围；

步骤2：初始化随机生成N个聚类中心，形成N个第1代粒子，每个粒子的当前位置为其p_besti，当前种群所有粒子中的最好位置为g_best，用适应度函数计算适应度值，此时每个粒子的最优适应度个体为其自身，群体中最优适应度个体为所有粒子中适应度值最大的粒子；

步骤3：对每个粒子进行速度和位置更新，依据交叉概率P_C，变异概率P_m，进行选择、交叉和变异操作，产生下一代的粒子群：

步骤4：用适应度函数计算新粒子群中每个个体的适应度值，先与个体上一代比较，若大于上一代适应度值，则取代上一代个体成为p_besti，且适应度值为个体最优适应度值，否则保持原样；

步骤5：再与群体最优个体适应度比较，若大于群体最优个体适应度值，则用该个体替代全局最优个体g_best，其适应度值为此时群体最优适应度值，否则群体最优和群体最优适应度值保持原样；

步骤6：迭代次数T＝T+1；

步骤7：当算法达到进化的最大迭代次数或设定的阈值ε，即种群的适应度没有改进时，算法停止，否则，跳转到步骤3；

步骤8：产生适应度最好的种群，即适应度最好的初始聚类中心；

步骤9：在FCM中输入产生的初始聚类中心进行图像分割；

步骤10：输出分割结果。

作为本发明的一种优选技术方案：所述适应度函数具体为：

其中，k为常数，J(U,V)为FCM的目标函数；

所述对每个粒子进行速度和位置更新具体包括：

v_(i+1)d＝ωv_id+c₁rand₁(P_id-x_id)+c₂rand₂(P_gd-x_id)

x_(i+1)d＝x_id+v_(i+1)d

其中，rand₁和rand₂为两个在[0，1]范围内变化的随机函数，第i个粒子表示为X_i＝(x_i1,x_i2,…,x_id),粒子经历过的最好位置记为P_i＝(p_i1,p_i2,…,p_id),粒子i的速度用V_i＝(v_i1,v_i2,…,v_id)表示。

本发明提供的于人工智能的医疗疾病数据管理系统，与现有技术相比，具有如下有益效果：

1、本发明通过医疗数据库访问模块能够定期访问各医疗机构的医疗数据库，通过字词查找模块以预设关键词在该数据库中检索相应的数据，数据检索到后统一通过数据加密模块进行加密打包，此操作是为了防止医疗数据外泄，其次，数据传输模块能够对加密打包的医疗疾病数据进行分散传输给数据处理单元，能够将数据包按照特定顺序进行打乱，分成一个个加密的数据包，在传输过程中即使被爬取，被打乱的数据包并不能从中提取有效数据，有效保证了数据传输的机密性和安全性。

2、本发明通过安全监测模块校验传输后的数据包是否和传输前打包时一致，保证数据传输的完整性。另一方面能够校验传输后的数据包是否在传输过程中混入其他恶意程序，能够防止服务器被恶意攻击。数据解码模块在解码数据后按照原先顺序对数据进行组合，重新提取数据，进一步保证了数据的安全获取。

3、本发明采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理，并采用粒子群算法确定所述FCM聚类算法的初始聚类中心。由于FCM聚类算法不同的聚类中心产生的分割效果是不同的，其目标函数式越小分割效果越好，而在混合优化算法中不同聚类中心的适应度越大越好，因此使用倒数来评价每个粒子的适应度，由于FCM算法在选取初始聚类中心时是随机选取的，容易使迭代过程陷入局部最优解，因此把进化寻优算法引入到模糊聚类分割中，可达到全局寻优、快速收敛的效果。

4、本发明通过病谱更新模块能够实时对病谱进行更新，能够进一步保证医疗疾病数据归类的精准性，其次，将各疾病数据归类到相应的病谱目录下，期对归类后的疾病数据进行校验，并对错误的分类进行标记，且将正确的疾病数据替换被分类校验模块标记的疾病数据，这是为了防止在病谱实时更新后带来的病种与新的病谱产生不对应的情况，采用分类校验模块和分类替换模块就能够定期校验，保证数据库中始终保持病谱和病种对应的情况，能够进一步保证医疗疾病数据的精准有效。

5、本发明通过数据匹配单元在病谱和病种归类的情况下，进一步通过网络上的症状搜索和咨询进行以及医疗机构中的新症状来对病种进行图表生成，即哪一种疾病会有哪些病症，这种获取方式效率极高，因现在网络发达，患者不仅会去医院就诊，还会在互联网上根据自己的病症进行咨询和搜索。这样相对于只从医疗机构获取病症信息而言，其搜集范围有效扩大。能够更加快速地获取更精准的病症信息。

6、通过数据建库单元进行重新建库。其中利用上述的图表形式，生成症状索引和年龄段索引，后期与客户端对接时，用户可直接根据自己的年龄和症状来直接进行索引。

附图说明

图1为本发明优选实施例的整体系统模块图；

图2为本发明优选实施例中数据收集单元的模块示意图；

图3为本发明优选实施例中数据处理单元的模块示意图；

图4为本发明优选实施例中数据分类单元的模块示意图；

图5为本发明优选实施例中数据匹配单元的模块示意图；

图6为本发明优选实施例中数据建库单元的模块示意图。

图中：100、数据收集单元；101、医疗数据库访问模块；102、字词查找模块；103、数据加密模块；104、数据传输模块；200、数据处理单元；201、安全监测模块；202、数据解码模块；203、聚类处理模块；204、粒子优化模块；300、数据分类单元；301、病谱更新模块；302、疾病归类模块；303、分类校验模块；304、分类替换模块；400、数据匹配单元；401、症状提取模块；402、大数据筛查模块；403、临床比对模块；404、图表生成模块；500、数据建库单元；501、病种生成模块；502、年龄生成模块；503、症状生成模块；504、数据备份模块。

具体实施方式

需要说明的是，在不冲突的情况下，本实施例中的实施例及实施例中的特征可以相互组合，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1-6，本发明优选实施例提供了基于人工智能的医疗疾病数据的安全快速精准有效管理系统，包括数据收集单元100、数据处理单元200、数据分类单元300、数据匹配单元400和数据建库单元500，数据收集单元100、数据处理单元200、数据分类单元300、数据匹配单元400和数据建库单元500依次通过以太网信号连接，数据收集单元100用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元200，数据处理单元200用于对收集到的医疗疾病数据进行聚类处理，并对其安全性进行监测，数据分类单元300用于将数据处理单元200聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下，数据匹配单元400用于将归类后的医疗疾病数据与各种症状进行匹配，并生成各类症状可能归属的疾病图表，数据建库单元500用于将疾病图表和医疗疾病数据结合进行统一建库。

数据收集单元100包括医疗数据库访问模块101、字词查找模块102、数据加密模块103和数据传输模块104，医疗数据库访问模块101通过以太网与各医疗机构的医疗数据库连接，医疗数据库访问模块101、字词查找模块102、数据加密模块103和数据传输模块104依次通过以太网信号连接，医疗数据库访问模块101用于连接各医疗机构的医疗数据库，并定期访问各医疗机构的医疗数据库，进行数据比对，字词查找模块102用于从各医疗机构的医疗数据库中通过字词来查找需要的医疗疾病数据，并对其进行提取，数据加密模块103用于对提取的医疗疾病数据进行加密打包，数据传输模块104用于对加密打包的医疗疾病数据进行分散传输给数据处理单元200。在本实施例中，医疗数据库访问模块101能够定期访问各医疗机构的医疗数据库，通过字词查找模块102以预设关键词在该数据库中检索相应的数据，数据检索到后统一通过数据加密模块103进行加密打包，此操作是为了防止医疗数据外泄，其次，数据传输模块104能够对加密打包的医疗疾病数据进行分散传输给数据处理单元200，分散传输是将数据包按照特定顺序进行打乱，分成一个个加密的数据包，在传输过程中即使被爬取，被打乱的数据包并不能从中提取有效数据，有效保证了数据传输的机密性和安全性。

具体的，为了定期访问各医疗机构的医疗数据库时能够提高效率和节省资源，本实施例中医疗数据库访问模块101具体访问时间t₀通过如下方式进行计算。

其中，D为该医疗机构近5天就诊人数，S为该医疗机构的科室数量，T为该医疗机构数据库更新时间。

其次，数据处理单元200包括安全监测模块201、数据解码模块202、聚类处理模块203和粒子优化模块204，安全监测模块201、数据解码模块202、聚类处理模块203和粒子优化模块204依次通过以太网信号连接，安全监测模块201用于对数据传输模块104传输的医疗疾病数据进行安全性校验，数据解码模块202用于对加密打包的医疗疾病数据进行解码，聚类处理模块203用于对解码后的医疗疾病数据进行聚类处理，粒子优化模块204用于对聚类处理模块203进行优化。安全监测模块201主要用于校验传输后的数据包是否和传输前打包时一致，保证数据传输的完整性。另一个是校验传输后的数据包是否在传输过程中混入其他恶意程序，能够防止服务器被恶意攻击。数据解码模块202在解码数据后按照原先顺序对数据进行组合。接下来就是聚类的操作。具体的：聚类处理模块203采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理，其具体包括如下步骤：

步骤1：对隶属度U使用0,1之间进行均匀分布的初始化，使其满足约束条件；

步骤2：根据U和迭代公式计算出聚类中心z_j；

步骤4：根据迭代公式计算新的U,返回步骤2。

根据U和迭代公式计算出聚类中心z_j具体为：

进一步地，粒子优化模块204对聚类处理模块203进行优化具体包括采用粒子群算法确定FCM聚类算法的初始聚类中心,其具体为：

步骤6：迭代次数T＝T+1；

步骤9：在FCM中输入产生的初始聚类中心进行图像分割；

步骤10：输出分割结果。

适应度函数具体为：

其中，k为常数，J(U,V)为FCM的目标函数；J(U,V)越小就代表聚类效果越好，则粒子适应度f(x_i)就越高。

具体的，对每个粒子进行速度和位置更新具体包括：

v_(i+1)d＝ωv_id+c₁rand₁(P_id-x_id)+c₂rand₂(P_gd-x_id)

x_(i+1)d＝x_id+v_(i+1)d

对于FCM聚类算法来说，不同的聚类中心产生的分割效果是不同的，其目标函数式越小分割效果越好，而在混合优化算法中不同聚类中心的适应度越大越好，因此可使用倒数来评价每个粒子的适应度，由于FCM算法在选取初始聚类中心时是随机选取的，容易使迭代过程陷入局部最优解，因此把进化寻优算法引入到模糊聚类分割中，可达到全局寻优、快速收敛的效果。

数据分类单元300包括病谱更新模块301、疾病归类模块302、分类校验模块303和分类替换模块304，病谱更新模块301、疾病归类模块302、分类校验模块303和分类替换模块304依次通过以太网信号连接，病谱更新模块301用于根据权威病谱网站上的信息事实对病谱进行更新，疾病归类模块302用于将各疾病数据归类到相应的病谱目录下，分类校验模块303用于定期对归类后的疾病数据进行校验，并对错误的分类进行标记，分类替换模块304用于将正确的疾病数据替换被分类校验模块303标记的疾病数据。病谱更新模块301能够实时对病谱进行更新，由于目前医疗技术发展相当迅速，为了保证病谱实时准确，所以对其进行实时更新，能够进一步保证医疗疾病数据归类的精准性，其次，将各疾病数据归类到相应的病谱目录下，期对归类后的疾病数据进行校验，并对错误的分类进行标记，且将正确的疾病数据替换被分类校验模块303标记的疾病数据，这是为了防止在病谱实时更新后带来的病种与新的病谱产生不对应的情况，采用分类校验模块303和分类替换模块304就能够定期校验，保证数据库中始终保持病谱和病种对应的情况，能够进一步保证医疗疾病数据的精准有效。

数据匹配单元400与数据分类单元300进行实时交互，数据匹配单元400包括症状提取模块401、大数据筛查模块402、临床比对模块403和图表生成模块404依次通过以太网信号连接，症状提取模块401用于提取各种医疗机构数据库中记录的症状，大数据筛查模块402用于使用爬虫对互联网上各种用户的症状搜索和咨询进行筛选获取，临床比对模块403用于提取互联网上各种临床确定信息并与症状提取模块401和大数据筛查模块402中提取到的信息进行比对，图表生成模块404用于将确认的症状临床信息与对应的若干种疾病数据及其病谱生成图表。数据匹配单元400的实际作用是在病谱和病种归类的情况下，进一步通过网络上的症状搜索和咨询进行以及医疗机构中的新症状来对病种进行图表生成，即哪一种疾病会有哪些病症，这种获取方式效率极高，因现在网络发达，患者不仅会去医院就诊，还会在互联网上根据自己的病症进行咨询和搜索。这样相对于只从医疗机构获取病症信息而言，其搜集范围有效扩大。能够更加快速地获取更精准的病症信息。

数据建库单元500包括病种生成模块501、年龄生成模块502、症状生成模块503和数据备份模块504，病种生成模块501、年龄生成模块502、症状生成模块503和数据备份模块504依次通过以太网信号连接，病种生成模块501用于在数据库中生成病种标签，年龄生成模块502用于在各个病种标签上生成易发年龄段索引，症状生成模块503用于在各个病种标签上生成对应症状索引，数据备份模块504用于定期对数据库中的数据进行备份。在上述操作都完成后，为了方便患者后期通过客户端对应寻症，本实施例通过数据建库单元500进行重新建库。其中利用上述的图表形式，生成症状索引和年龄段索引，后期与客户端对接时，用户可直接根据自己的年龄和症状来直接进行索引。

其中，还包括用户终端，用户终端通过APP访问数据建库单元500中建立的数据库，APP可通过症状索引和年龄段索引直接检索出相应的病种和病谱图表，其次，用户终端会自动从互联网上获取上述检索出的病种和病谱图表对应的病种症状图表，附于病种和病谱图表上，这样用户即可一目了然地看出自己属于哪种病种。

在另一个实施例中，采用FCM聚类算法对医疗疾病数据进行分类处理，并采用粒子群算法确定FCM聚类算法对医疗疾病数据进行分类的初始聚类中心，应用FCM聚类算法的目标函数计算各粒子的适应度函数值，FCM聚类算法的目标函数值越小，粒子的适应度函数值越小，聚类效果越好，从而提高FCM聚类算法的聚类精度。其还可以是如下方法：

优选的，在采用粒子群算法确定FCM聚类算法对医疗疾病数据进行分类的初始聚类中心时，采用下列方式确定粒子群中各粒子的更新方式：

(1)对种群中各粒子的历史最优解和全局最优解进行检测；

(2)根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式。

优选的，采用下列方式对种群中各粒子的历史最优解和全局最优解进行检测：

设X_i(t)表示种群中粒子i在第t次迭代后的解，Pbest_i(t)表示粒子i在第t次迭代后的历史最优解，Gbest(t)表示种群在第t次迭代后的全局最优解，设置Ω_i(t)为粒子i在第t次迭代后的检测区域，当解X_i(t)、Pbest_i(t)和Gbest(t)不在一条直线上时，Ω_i(t)为以解X_i(t)、Pbest_i(t)和Gbest(t)为三个顶点形成的三角形区域，当解X_i(t)、Pbest_i(t)和Gbest(t)在一条直线上时，Ω_i(t)为连接解X_i(t)、Pbest_i(t)和Gbest(t)三个点的线段，在检测区域Ω_i(t)中对粒子i的历史最优解Pbest_i(t)和全局最优解Gbest(t)进行检测：

定义ρi(Pbest_i(t))表示历史最优解Pbest_i(t)在检测区域Ω_i(t)中的引导成功率，ρ_i(Gbest(t))表示全局最优解Gbest(t)在检测区域Ω_i(t)中的引导成功率，ρ_i(Pbest_i(t))和ρ_i(Gbest(t))的值分别为：

在上述公式中，N_i(Pbest_i(t))为用于在检测区域Ω_i(t)中对历史最优解Pbest_i(t)进行检测的标志性解集合，N_i(Gbest(t))为用于在检测区域Ω_i(t)中对全局最优解Gbest(t)进行检测的标志性解集合，且N_i(Pbest_i(t))和N_i(Gbest(t))中的解为采用下列方式在检测区域Ω_i(t)中筛选所得：设X_ij(t)为检测区域Ω_i(t)中的第j个解，且j＝1，2，...，M_i(t)，M_i(t)表示检测区域Ω_i(t)中解的数量，X_ij(t-1)为解X_ij(t)所对应的粒子在第(t-1)次迭代后的解，d(X_ij(t)，Pbest_i(t))表示解X_ij(t)和历史最优解Pbest_i(t)之间的欧式距离，d(X_ij(t-1)，Pbest_i(t))表示解X_ij(t-1)和历史最优解Pbest_i(t)之间的欧式距离，d(X_ij(t)，Gbest(t))表示解X_ij(t)和全局最优解Gbest(t)之间的欧式距离，d(X_ij(t-1)，Gbest(t))表示解X_ij(t-1)和全局最优解Gbest(t)之间的欧式距离，当解X_ij(t)同时满足：X_ij(t-1)∈Ω_i(t)且d(X_ij(t)，Pbest_i(t))＜d(X_ij(t-1)，Pbest_i(t))且d(X_ij(t)，Gbest(t))＞d(X_ij(t-1)，Gbest(t))时，将解X_ij(t)加入标志性解集合N_i(Pbest_i(t))中，当解X_ij(t)同时满足：X_ij(t-1)∈Ω_i(t)且d(X_ij(t)，Gbest(t))＜d(X_ij(t-1)，Gbest(t))且d(X_ij(t)，Pbest_i(t))＞d(X_ij(t-1)，Pbest_i(t))时，则将解X_ij(t)加入集合N_i(Gbest(t))中；f_ij(t)表示解X_ij(t)的适应度函数值，f_ij(t-1)表示解X_ij(t-1)的适应度函数值，X_il(t)为标志性解集合N_i(Pbest_i(t))中的第l个解，X_il(t-1)为解X_il(t)所对应的粒子在第(t-1)次迭代后的解，β_il(t)表示解X_il(t)的进化成功系数，且

f_il(t)表示解X_il(t)的适应度函数值，f_il(t-1)表示解X_il(t-1)的适应度函数值，M_i(Pbest_i(t))表示标志性解集合N_i(Pbest_i(t))中解的数量，X_ik(t)为标志性解集合N_i(Gbest(t))中的第k个解，X_ik(t-1)为解X_ik(t)所对应的粒子在第(t-1)次迭代后的解，β_ik(t)表示解X_ik(t)的进化成功系数，且

f_ik(t)表示解X_ik(t)的适应度函数值，f_ik(t-1)表示解X_ik(t-1)的适应度函数值，M_i(Gbest(t))表示标志性解集合N_i(Gbest(t))中解的数量。

优选的，根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式：

设X_i(t)表示粒子i在第t次迭代后的解，X_i(t+1)表示粒子i在第(t+1)次迭代后的解，设置粒子i采用下列方式对解X_i(t)进行更新，从而获得解X_i(t+1)：

X_i(t+1)＝X_i(t)+V_i(t+1)

在上述更新公式中，V_i(t+1)表示粒子i在进行第(t+1)次迭代更新时的步长，V_i(t+1)的值为：

V_i(t+1)＝ω(t)V_i(t)+c_i1(t)r₁(Pbest_i(t)-X_i(t))+c_i2(t)r₂(Gbest(t)-X_i(t))

在上述V_i(t+1)的计算公式中，V_i(t)表示粒子i在进行第t次迭代更新时的步长，ω(t)表示种群在第t次迭代后的惯性权重因子，且

ω_max和ω_min分别为给定的最大和最小惯性权重因子，T_max为给定的最大迭代次数，r₁和r₂分别为0到1之间的随机数，Pbest_i(t)表示粒子i在第t次迭代后的历史最优解，Gbest(t)表示种群在第t次迭代后的全局最优解，c_i1(t)为粒子i在第t次迭代后的自我认知系数，c_i2(t)为粒子i在第t次迭代后的社会认知系数，且c_i1(t)和c_i2(t)的值分别为：

在上述c_i1(t)和c_i2(t)的计算公式中，c₀为给定的标准认知系数值，且

c_max和c_min分别为给定的最大和最小认知系数值，c_max的值可以取2.5，c_min的值可以取0.5，ρ_i(Pbest_i(t))表示历史最优解Pbest_i(t)在检测区域Ω_i(t)中的引导成功率，ρ_i(Gbest(t))表示全局最优解Gbest(t)在检测区域Ω_i(t)中的引导成功率，其中，Ω_i(t)为粒子i在第t次迭代后的检测区域，当解X_i(t)、Pbest_i(t)和Gbest(t)不在一条直线上时，Ω_i(t)为以解X_i(t)、Pbest_i(t)和Gbest(t)为三个顶点形成的三角形区域，当解X_i(t)、Pbest_i(t)和Gbest(t)在一条直线上时，Ω_i(t)为连接解X_i(t)、Pbest_i(t)和Gbest(t)三个点的线段。

具体的，针对粒子群算法存在的局部寻优精度低，以及寻优精度和收敛速度难以平衡的缺陷，本实施例对种群中各粒子的历史最优解和全局最优解进行检测，并根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式，从而提高粒子的局部寻优精度的同时，平衡算法的寻优精度和收敛速度。在粒子群算法中，粒子在迭代更新过程中通过向其历史最优解和当前的全局最优解进行学习，从而确定下一次解的位置，在标准粒子群算法中，粒子在更新过程中的步长由三部分组成，第一部分表示了粒子保持当前速度的趋势，第二部分决定了粒子局部搜索的能力，即通过自己寻优过程中找到的历史最优解引导自己的寻优，并且通过自我认知系数来调节其历史最优解对最终步长影响程度的大小，第三部分决定了粒子的全局搜索的能力，即利用种群迄今为止获得的全局最优解引导粒子的寻优，并且通过社会认知系数来调节该全局最优解对最终步长影响程度的大小，从上述可以看出，粒子迭代更新时的步长中的自我认知系数决定了粒子的局部搜索程度，社会认知系数决定了粒子的全局搜索程度，在现有技术中，粒子的自我认知系数和社会认知系数通常被设置为固定常数，或者根据当前迭代次数进行自适应调节，但这些针对种群整体设置的认知系数并不能适应种群中各粒子当前的实际寻优情况，种群中每个粒子寻找到的历史最优解不同，粒子的解、其历史最优解和全局最优解的分布也不同，因此所面临的寻优情况也存在区别，为了使得粒子的步长能够引导粒子获得更好的寻优结果，本实施例提出一种新的自我认知系数和社会认知系数的设置方式，首先对粒子进行检测，通过粒子当前的解、其历史最优解和全局最优解构造粒子的检测区域，所述粒子在下一次迭代时具有较大概率是在该检测区域内进行移动获得新的解，因此在该检测区域内对粒子的历史最优解和全局最优解进行检测，在该检测区域中选取在上一次迭代时明显向着历史最优解方向进行移动更新的粒子作为历史最优解的标志性解，同时在该检测区域中选取在上一次迭代时明显向着全局最优解方向进行移动更新的粒子作为全局最优解的标志性解，通过定义的历史最优解的引导成功率衡量在该检测区域内向着历史最优解方向进行移动获得更新的解的进化成功性，而全局最优解的引导成功率用于衡量在该检测区域内向着全局最优解方向进行移动获得更新的解的进化成功性，当在该检测区域内粒子向着历史最优解方向进行移动相较于向着全局最优解方向进行移动获得的成功性高时，设置粒子具有较大的自我认知系数和较小的社会认知系数，使得粒子在下一次迭代时向着其历史最优解方向进行移动更新，从而获得较好的寻优结果，提高了粒子的寻优精度，相反的，当粒子在该检测区域内向着全局最优解方向进行移动相较于向着其历史最优解方向进行移动获得的成功性高时，设置粒子具有较小的自我认知系数和较大的社会认知系数，使得粒子在下一次迭代时向着全局最优解方向进行移动更新，从而获得较好的寻优结果，并提高了粒子收敛速度，即通过粒子、其历史最优解和全局最优解的实际情况设置粒子的更新方式，保证了粒子每一次更新时都能够获取较好的寻优结果的同时，能够有效的平衡算法的局部搜索和全局搜索，从而保证算法具有较高的寻优精度和收敛速度。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种基于人工智能的医疗疾病数据的安全快速精准有效管理系统，其特征在于：包括数据收集单元(100)、数据处理单元(200)、数据分类单元(300)、数据匹配单元(400)和数据建库单元(500)，所述数据收集单元(100)、数据处理单元(200)、数据分类单元(300)、数据匹配单元(400)和数据建库单元(500)依次通过以太网信号连接，所述数据收集单元(100)用于从各医疗机构的医疗数据库中收集所需医疗疾病数据并传输至数据处理单元(200)，所述数据处理单元(200)用于对收集到的医疗疾病数据进行聚类处理，并对其安全性进行监测，所述数据分类单元(300)用于将所述数据处理单元(200)聚类处理后的医疗疾病数据进行分类并归类到相应的病谱下，所述数据匹配单元(400)用于将归类后的医疗疾病数据与各种症状进行匹配，并生成各类症状可能归属的疾病图表，所述数据建库单元(500)用于将疾病图表和医疗疾病数据结合进行统一建库；所述数据处理单元(200)包括安全监测模块(201)、数据解码模块(202)、聚类处理模块(203)和粒子优化模块(204)，所述安全监测模块(201)、数据解码模块(202)、聚类处理模块(203)和粒子优化模块(204)依次通过以太网信号连接，所述安全监测模块(201)用于对数据传输模块(104)传输的医疗疾病数据进行安全性校验，所述数据解码模块(202)用于对加密打包的医疗疾病数据进行解码，所述聚类处理模块(203)用于对解码后的医疗疾病数据进行聚类处理，所述粒子优化模块(204)用于对聚类处理模块(203)进行优化；

所述聚类处理模块(203)采用FCM聚类算法对归一化处理后的医疗疾病数据进行聚类处理，其具体包括如下步骤：

步骤1：对隶属度U使用(0，1)之间进行均匀分布的初始化，使其满足约束条件；

步骤2：根据U和迭代公式计算出聚类中心z_j；

步骤3：计算函数J，若其结果小于某个阈值，或与上一个J的变化小于某阈值，则算法停止；

步骤4：根据迭代公式计算新的U，返回步骤2；

采用粒子群算法确定所述FCM聚类算法的初始聚类中心为如下步骤：

S1：对种群中各粒子的历史最优解和全局最优解进行检测；

S2：根据粒子的历史最优解和全局最优解的检测结果确定粒子的更新方式采用下列方式对种群中各粒子的历史最优解和全局最优解进行检测：

定义ρ_i(Pbest_i(t))表示历史最优解Pbest_i(t)在检测区域Ω_i(t)中的引导成功率，ρ_i(Gbest(t))表示全局最优解Gbest(t)在检测区域Ω_i(t)中的引导成功率，ρ_i(Pbest_i(t))和ρ_i(Gbest(t))的值分别为：

其中，N_i(Pbest_i(t))为用于在检测区域Ω_i(t)中对历史最优解Pbest_i(t)进行检测的标志性解集合，N_i(Gbest(t))为用于在检测区域Ω_i(t)中对全局最优解Gbest(t)进行检测的标志性解集合，且N_i(Pbest_i(t))和N_i(Gbest(t))中的解为采用下列方式在检测区域Ω_i(t)中筛选所得：设X_ij(t)为检测区域Ω_i(t)中的第j个解，且j＝1，2，...，M_i(t)，M_i(t)表示检测区域Ω_i(t)中解的数量，X_ij(t-1)为解X_ij(t)所对应的粒子在第(t-1)次迭代后的解，d(X_ij(t)，Pbest_i(t))表示解X_ij(t)和历史最优解Pbest_i(t)之间的欧式距离，d(X_ij(t-1)，Pbest_i(t))表示解X_ij(t-1)和历史最优解Pbest_i(t)之间的欧式距离，d(X_ij(t)，Gbest(t))表示解X_ij(t)和全局最优解Gbest(t)之间的欧式距离，d(X_ij(t-1)，Gbest(t))表示解X_ij(t-1)和全局最优解Gbest(t)之间的欧式距离，当解X_ij(t)同时满足：X_ij(t-1)∈Ω_i(t)且d(X_ij(t)，Pbest_i(t))＜d(X_ij(t-1)，Pbest_i(t))且d(X_ij(t)，Gbest(t))＞d(X_ij(t-1)，Gbest(t))时，将解X_ij(t)加入标志性解集合N_i(Pbest_i(t))中，当解X_ij(t)同时满足：X_ij(t-1)∈Ω_i(t)且d(X_ij(t)，Gbest(t))＜d(X_ij(t-1)，Gbest(t))且d(X_ij(t)，Pbest_i(t))＞d(X_ij(t-1)，Pbest_i(t))时，则将解X_ij(t)加入集合N_i(Gbest(t))中；f_ij(t)表示解X_ij(t)的适应度函数值，f_ij(t-1)表示解X_ij(t-1)的适应度函数值，X_il(t)为标志性解集合N_i(Pbest_i(t))中的第l个解，X_il(t-1)为解X_il(t)所对应的粒子在第(t-1)次迭代后的解，β_il(t)表示解X_il(t)的进化成功系数，且

2.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统，其特征在于：所述数据收集单元(100)包括医疗数据库访问模块(101)、字词查找模块(102)、数据加密模块(103)和数据传输模块(104)，所述医疗数据库访问模块(101)通过以太网与各医疗机构的医疗数据库连接，所述医疗数据库访问模块(101)、字词查找模块(102)、数据加密模块(103)和数据传输模块(104)依次通过以太网信号连接，所述医疗数据库访问模块(101) 用于连接各医疗机构的医疗数据库，并定期访问各医疗机构的医疗数据库，进行数据比对，所述字词查找模块(102)用于从各医疗机构的医疗数据库中通过字词来查找需要的医疗疾病数据，并对其进行提取，所述数据加密模块(103)用于对提取的医疗疾病数据进行加密打包，所述数据传输模块(104)用于对加密打包的医疗疾病数据进行分散传输给数据处理单元(200)。

3.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统，其特征在于：所述数据分类单元(300)包括病谱更新模块(301)、疾病归类模块(302)、分类校验模块(303)和分类替换模块(304)，所述病谱更新模块(301)、疾病归类模块(302)、分类校验模块(303)和分类替换模块(304)依次通过以太网信号连接，所述病谱更新模块(301)用于根据权威病谱网站上的信息事实对病谱进行更新，所述疾病归类模块(302)用于将各疾病数据归类到相应的病谱目录下，所述分类校验模块(303)用于定期对归类后的疾病数据进行校验，并对错误的分类进行标记，所述分类替换模块(304)用于将正确的疾病数据替换被所述分类校验模块(303)标记的疾病数据。

4.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统，其特征在于：所述数据匹配单元(400)与所述数据分类单元(300)进行实时交互，所述数据匹配单元(400)包括症状提取模块(401)、大数据筛查模块(402)、临床比对模块(403)和图表生成模块(404)依次通过以太网信号连接，所述症状提取模块(401)用于提取各种医疗机构数据库中记录的症状，所述大数据筛查模块(402)用于使用爬虫对互联网上各种用户的症状搜索和咨询进行筛选获取，所述临床比对模块(403)用于提取互联网上各种临床确定信息并与所述症状提取模块(401)和大数据筛查模块(402)中提取到的信息进行比对，所述图表生成模块(404)用于将确认的症状临床信息与对应的若干种疾病数据及其病谱生成图表。

5.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统，其特征在于：所述数据建库单元(500)包括病种生成模块(501)、年龄生成模块(502)、症状生成模块(503)和数据备份模块(504)，所述病种生成模块(501)、年龄生成模块(502)、症状生成模块(503)和数据备份模块(504)依次通过以太网信号连接，所述病种生成模块(501)用于在数据库中生成病种标签，所述年龄生成模块(502)用于在各个病种标签上生成易发年龄段索引，所述症状生成模块(503)用于在各个病种标签上生成对应症状索引，所述数据备份模块(504)用于定期对数据库中的数据进行备份。

6.根据权利要求1所述的基于人工智能的医疗疾病数据的安全快速精准有效管理系统，其特征在于：所述根据U和迭代公式计算出聚类中心z_j具体为：

其中，m为数据集大小，i＝1，2，…，m，u_ij为第i个数据对第j个中心点的隶属度，并且0＜u_ij＜1，α为超参数，x_i为第i个数据。