CN116386830B

CN116386830B - 一种基于大数据的医院管理系统

Info

Publication number: CN116386830B
Application number: CN202310371782.9A
Authority: CN
Inventors: 闫加祥; 尹卫华
Original assignee: Shandong Bopeng Information Technology Co ltd
Current assignee: Shandong Bopeng Information Technology Co ltd
Priority date: 2023-04-10
Filing date: 2023-04-10
Publication date: 2023-09-22
Anticipated expiration: 2043-04-10
Also published as: CN116386830A

Abstract

本发明属于智慧医疗技术领域，涉及一种基于大数据的医院管理系统。该系统包括：数据标记单元，配置用于将医院内的所有数据按照设定的最小单位进行划分，得到最小单位数据，系统内的所有数据均以最小单位数据形式存在，并对每个最小单位数据设定一个三维坐标值，每个最小单位数据的三维坐标值均与其他的最小单位数据的三维坐标值不同，该三维坐标值作为每个最小单位数据的主键。该系统以患者为中心，将医院系统内的所有数据进行三维化后，再针对每个需求向量来进行数据的分析和验证，不仅能够发现系统内的异常数据，还能针对每个患者获得在每个需求向量方向的投影数据，以在不失去空间特征的情况下进行患者的数据分析，使得结果更加准确。

Description

一种基于大数据的医院管理系统

技术领域

本发明属于智慧医疗技术领域，具体涉及一种基于大数据的医院管理系统。

背景技术

近年来随着医疗卫生信息化的发展，医疗卫生领域已进入到了大数据时代。医疗业务过程同样也是个医疗大数据累积的过程，并对医疗卫生行业产生巨大的影响。

由于大数据是一个不断累积的过程，针对各个患者的数据也是不断地在增加。因此，数据异常发生的概率也在不断增大。

如何针对每个患者进行数据分析，以发现数据的异常，以及更快捷地对每个患者的数据进行处理是一个非常重要的问题。因为这不仅关系到数据处理的效率，更关系到如何对医院的大数据进行维护的问题。如果任由系统内的异常数据累积，很容易导致整个大数据系统随着时间的发展而失去其存在的意义。

发明内容

本发明的主要目的在于提供一种基于大数据的医院管理系统，所述系统以患者为中心，将医院系统内的所有数据进行三维化后，再针对每个需求向量来进行数据的分析和验证，不仅能够发现系统内的异常数据，还能针对每个患者获得在每个需求向量方向的投影数据，以在不失去空间特征的情况下进行患者的数据分析，使得结果更加准确。

为达到上述目的，本发明的技术方案是这样实现的：

一种基于大数据的医院管理系统，所述系统包括：数据标记单元，配置用于将医院内的所有数据按照设定的最小单位进行划分，得到最小单位数据，系统内的所有数据均以最小单位数据形式存在，并对每个最小单位数据设定一个三维坐标值，每个最小单位数据的三维坐标值均与其他的最小单位数据的三维坐标值不同，该三维坐标值作为每个最小单位数据的主键；数据获取单元，配置用于以每个患者的身份信息为数据中心，获取与该数据中心相关联的所有关联数据，将数据中心与其对应的所有关联数据组成一个数据组；三维数据构建单元，配置用于将每个数据组中的所有数据按照其三维坐标值映射到三维空间中的一个点，并在三维空间中，将数据中心对应的点与其他关联数据对应的点进行连接，得到该数据组对应的三维数据组；多方向降维单元，配置用于将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据；数据分析单元，配置用于结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度，根据契合度判断该数据组中的数据是否出现异常，若出现异常，则进行提示。

进一步的，所述设定的最小单位包括两个参数，分别为：数据长度值和数据类别值；所述数据长度值定义为数据的长度，单位为比特；所述数据类别值定义为数据中包括的数据项的个数。

进一步的，所述每个最小单位数据的三维坐标值的设定规则为：将每个最小单位数据中每个数据项的存储地址按照先后顺序依次顺次连接，然后将连接后的存储地址平均分割成三部分，将每一部分对应的二进制值转换为10进制值，得到其对应的在三维空间中的坐标值。

进一步的，所述需求向量的生成过程具体包括：依据关联数据在三维空间中的坐标值与数据中心在三维空间中的坐标值，以数据中心为原点，计算得到数据中心与关联数据在三维空间中的方向向量，根据方向向量计算得到方向向量与水平面的夹角，将该夹角值作为需求向量的值。

进一步的，所述多方向降维单元，将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据的方法包括：设定一个单位三维立体领域，根据单位三维立体领域将三维数据转化成投影形式，得到多个投影样本；计算投影样本间的投影距离；根据投影距离，构建投影近邻图；根据投影近邻图选择补丁样本集；根据选择矩阵将局部补丁合成整体，并计算校准矩阵；通过交替最小二乘计算稀疏最优函数得投影矩阵；用求得的投影矩阵把投影样本投影到低维投影子空间中。

进一步的，所述设定一个单位三维立体领域，根据单位三维立体领域将三维数据转化成投影形式，得到多个投影样本的方法包括：将单位三维立体领域作为一个窗口立体领域遍历整个三维数据构成的三维空间，在遍历过程中，每间隔设定的间隔长度，就将单位三维立体领域所处的三维空间中的部分作为投影样本。

进一步的，所述校准矩阵使用如下公式计算得到：；其中，/>为校正矩阵；/>为投影样本，/>为第一个投影样本；/>为投影距离；/>为投影样本对应的需求向量的值；/>为投影样本的个数；/>为设定得间隔长度，/>为底数为10的对数运算符；所述投影样本之间的投影距离定义为投影样本彼此之间的欧式距离；所述投影近邻图定义为各个投影样本与其投影距离最近的三个样本拼接组成的新样本；所述补丁样本集的选择过程包括：将投影近邻图中平面面积小于设定的阈值的投影近邻图选择出来，作为补丁样本集。

进一步的，所述投影矩阵的计算过程包括：通过交替最小二乘计算稀疏最优函数：；将稀疏最优函数中的自变量以一个设定的集合序列中的元素值代入，然后分别按照先后顺序乘以投影样本，得到投影矩阵；其中，/>为交替最小二乘计算稀疏最优函数的输出结果；/>为投影样本，/>为因子矩阵；/>为函数自变量；/>为投影样本对应的需求向量的值；/>为矩阵转秩运算；/>为调整系数，取值范围为：1~3。

进一步的，所述数据分析单元，结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度的方法包括：生成二维数据的函数表达式，并计算二维数据的归一化斜率值，比较归一化斜率值与需求向量的值的正弦值的差值，该差值的倒数为契合度。

进一步的，所述归一化斜率值为二维数据在二维平面中构成的函数的曲线中每一点的斜率值进行加和后得到的和值的算术平均值。

本发明的一种基于大数据的医院管理系统，具有如下有益效果：传统的数据异常分析算法往往需要对所有的数据进行整体的综合交叉分析，运算量大，且由于算法复杂度高，准确度也受到影响。在实践中，如何找到一种方法对数据整体进行异常分析验证，不仅能够提升异常分析的效率，还能保证准确率。本发明中，首先以患者为中心构建了三维数据，三维数据由于保有二维数据和一维数据不具备的空间特征，更能为后续异常分析提供支持，且通过投影的方式来降低数据的维度，以降低数据分析的复杂度，更能保证效率；同时，在进行后续的数据分析时，还能根据需求向量对各个方向的数据进行单独分析，提升数据分析的准确率和针对性。

附图说明

图1为本发明实施例提供的一种基于大数据的医院管理系统的系统结构示意图；

图2为本发明实施例提供的一种基于大数据的医院管理系统的窗口立体领域遍历整个三维空间的原理示意图。

具体实施方式

下面结合附图及本发明的实施例对本发明的方法作进一步详细的说明。

实施例1，如图1所示，一种基于大数据的医院管理系统，所述系统包括：数据标记单元，配置用于将医院内的所有数据按照设定的最小单位进行划分，得到最小单位数据，系统内的所有数据均以最小单位数据形式存在，并对每个最小单位数据设定一个三维坐标值，每个最小单位数据的三维坐标值均与其他的最小单位数据的三维坐标值不同，该三维坐标值作为每个最小单位数据的主键；数据获取单元，配置用于以每个患者的身份信息为数据中心，获取与该数据中心相关联的所有关联数据，将数据中心与其对应的所有关联数据组成一个数据组；三维数据构建单元，配置用于将每个数据组中的所有数据按照其三维坐标值映射到三维空间中的一个点，并在三维空间中，将数据中心对应的点与其他关联数据对应的点进行连接，得到该数据组对应的三维数据组；多方向降维单元，配置用于将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据；数据分析单元，配置用于结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度，根据契合度判断该数据组中的数据是否出现异常，若出现异常，则进行提示。

具体的，由于在实际中医院获取到的数据大多数不是孤立一项存在的，构建最小单位数据是将多项同属一个内容的数据进行分组，这样可以降低分析和管理的复杂度。

三维空间数据的构建是以患者为中心的，构建得到的三维立体数据将反应一个患者的整体特征。

由于三维空间数据具备空间特征，所以其相较于二维数据或一维数据更能反应数据的状况。

但由于三维数据的复杂度很高，如果直接对所有数据进行分析，算法复杂度会非常高，导致结果准确率降低，效率降低。本发明采用的手段是进行降维，降维的过程是基于多方向的降维。每个方向对应一个需求向量。针对每个方向进行数据分析，则需要获得该方向的需求向量，以此进行后续的异常分析，能够得到该方向下的数据是否出现异常的结论。这种方式能够针对每个需求的方向进行异常分析，而无须对所有的数据进行异常分析，虽然得到的结果数量会更少，但整体来来说可以降低非必要的方向的异常分析，以此来提升效率。

具体的，系统在执行过程中，首先将医院内的所有数据按照设定的最小单位进行划分，得到最小单位数据。例如，医院中的一条患者数据可能包含的信息条目为：患者姓名、患者年龄、患者职业和患者性别等等。如果设定的最小数据单位为存储的数据库中的一张表格中的一项，即前述四项数据类型的任一一项。

在这种情况下，将该最小单位数据设定一个起始的三维坐标值，这个坐标值为有限随机任意值，但与其他的任一最小单位数据的均不相同。如：年龄（1，15，202），这个三维坐标值成为唯一标志该最小单位数据的主键。

之后，数据获取单元以每个患者的身份信息为数据中心，获取与该数据中心相关联的所有关联数据。在这里，如果患者的身份信息为患者姓名，则可以构建以患者姓名为中心的关联数据组。例如，若其中任意一例患者的数据为：患者姓名（2，15，6）、患者年龄（1，15，202）、患者职业（5，7，9）和患者性别（10，22，15）；其中患者姓名为中心，其他数据与其相互关联。由此，构成“主键-数据值-其他关联数据”的关系。

将这些所有的数据映射到三维坐标系中的一个点，用每个点来标志数据值。由于在设定三维数据坐标值是有限随机的，使得三维坐标值虽然随机各不相同，但在一定程度上又遵循一定的限制关系。在本发明中，有限随机定义为满足一定约束条件的随机。例如，在1到10的整数中随机。这就使得有关联得数据在三维空间坐标系中，距离较近。反应到实际中，就是与某个患者有关的数据距离较近。

最后，多方向降维单元，将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据，结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度，根据契合度判断该数据组中的数据是否出现异常。

实施例2，在上一实施例的基础上，所述设定的最小单位包括两个参数，分别为：数据长度值和数据类别值；所述数据长度值定义为数据的长度，单位为比特；所述数据类别值定义为数据中包括的数据项的个数。

具体的，数据类别值和数据长度值在实际中需要满足一定的设定关系，这种设定关系可以约束数据类别值和数据长度值两者的关系，以此来限制数据类别值和数据长度值在设定的范围内。

实施例3，在上一实施例的基础上，所述每个最小单位数据的三维坐标值的设定规则为：将每个最小单位数据中每个数据项的存储地址按照先后顺序依次顺次连接，然后将连接后的存储地址平均分割成三部分，将每一部分对应的二进制值转换为10进制值，得到其对应的在三维空间中的坐标值。

具体的，不同数据除了数据值本身不同以外，还体现在其存储位置上，存储位置的不同可以表征数据的类别不同。反映到三维空间中，则是坐标值的不同。

实施例4，在上一实施例的基础上，所述需求向量的生成过程具体包括：依据关联数据在三维空间中的坐标值与数据中心在三维空间中的坐标值，以数据中心为原点，计算得到数据中心与关联数据在三维空间中的方向向量，根据方向向量计算得到方向向量与水平面的夹角，将该夹角值作为需求向量的值。

实施例5，在上一实施例的基础上，所述多方向降维单元，将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据的方法包括：设定一个单位三维立体领域，根据单位三维立体领域将三维数据转化成投影形式，得到多个投影样本；计算投影样本间的投影距离；根据投影距离，构建投影近邻图；根据投影近邻图选择补丁样本集；根据选择矩阵将局部补丁合成整体，并计算校准矩阵；通过交替最小二乘计算稀疏最优函数得投影矩阵；用求得的投影矩阵把投影样本投影到低维投影子空间中。

具体的，参考图2，在图2中，小圆A代表的就是单位三维立体领域的平面图，大圆B代表的是整个三维数据构成的三维空间的平面图。在本发明中单位三维立体领域本质上是一个窗函数，本发明采用窗函数的方式对整个三维空间数据进行了遍历。然后转换为投影形式，得到多个投影样本。

投影样本在一定程度上反映了在该需求向量的方向下的三维数据的投影，因此，针对这些投影后样本进行校准后，然后投影到低维度影子空间中，就可以得到对应的二维数据。

实施例6，在上一实施例的基础上，所述设定一个单位三维立体领域，根据单位三维立体领域将三维数据转化成投影形式，得到多个投影样本的方法包括：将单位三维立体领域作为一个窗口立体领域遍历整个三维数据构成的三维空间，在遍历过程中，每间隔设定的间隔长度，就将单位三维立体领域所处的三维空间中的部分作为投影样本。

实施例7，在上一实施例的基础上，所述校准矩阵使用如下公式计算得到：；其中，/>为校正矩阵；/>为投影样本，/>为第一个投影样本；/>为投影距离；/>为投影样本对应的需求向量的值；/>为投影样本的个数；/>为设定得间隔长度，/>为底数为10的对数运算符；所述投影样本之间的投影距离定义为投影样本彼此之间的欧式距离；所述投影近邻图定义为各个投影样本与其投影距离最近的三个样本拼接组成的新样本；所述补丁样本集的选择过程包括：将投影近邻图中平面面积小于设定的阈值的投影近邻图选择出来，作为补丁样本集。

具体的，使用发明的算法得到的校正矩阵，可以避免因为投影带来的数据失真，且保留三维数据的空间特征。以此来得到的投影矩阵进行投影得到的低维度数据更加准确。

实施例8，在上一实施例的基础上，所述投影矩阵的计算过程包括：通过交替最小二乘计算稀疏最优函数：；将稀疏最优函数中的自变量以一个设定的集合序列中的元素值代入，然后分别按照先后顺序乘以投影样本，得到投影矩阵；其中，/>为交替最小二乘计算稀疏最优函数的输出结果；/>为投影样本，/>为因子矩阵；/>为函数自变量；/>为投影样本对应的需求向量的值；/>为矩阵转秩运算；/>为调整系数，取值范围为：1~3。

具体的，本发明在得到投影矩阵时，使用了稀疏最优函数来对校正矩阵进行运算得到，进一步降低数据的复杂度。

具体的，ALS即交替最小二乘计算的实现原理是迭代式求解一系列最小二乘回归问题。在每一次迭代时，固定用户因子矩阵或是物品因子矩阵中的一个，然后用固定的这个矩阵以及评级数据来更新另一个矩阵。之后，被更新的矩阵被固定住，再更新另外一个矩阵。如此迭代，直到模型收敛（或是迭代了预设好的次数）。

所以在MLlib的ALS算法中，首先对U或者I矩阵随机化生成，在每一次迭代时，固定用户因子矩阵或是物品因子矩阵中的一个，然后用固定的这个矩阵以及评级数据来更新另一个矩阵，然后利用被求取的矩阵对象去求随机化矩阵。最后两个对象相互迭代计算，直到模型收敛。

在矩阵分解（matrix factorization）中使用的一种算法。有一个稀疏矩阵，假设这个矩阵是低阶的，可以分解成两个小矩阵相乘。然后交替对两个小矩阵使用最小二乘法，算出这两个小矩阵，就可以估算出稀疏矩阵缺失的值。与坐标下降法有点相似。

实施例9，在上一实施例的基础上，所述数据分析单元，结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度的方法包括：生成二维数据的函数表达式，并计算二维数据的归一化斜率值，比较归一化斜率值与需求向量的值的正弦值的差值，该差值的倒数为契合度。

实施例10，在上一实施例的基础上，所述归一化斜率值为二维数据在二维平面中构成的函数的曲线中每一点的斜率值进行加和后得到的和值的算术平均值。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这些具体实施方式仅是举例说明，本领域的技术人员在不脱离本发明的原理和实质的情况下，可以对上述方法和系统的细节进行各种省略、替换和改变。例如，合并上述方法步骤，从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此，本发明的范围仅由所附权利要求书限定。

Claims

1.一种基于大数据的医院管理系统，其特征在于，所述系统包括：数据标记单元，配置用于将医院内的所有数据按照设定的最小单位进行划分，得到最小单位数据，系统内的所有数据均以最小单位数据形式存在，并对每个最小单位数据设定一个三维坐标值，每个最小单位数据的三维坐标值均与其他的最小单位数据的三维坐标值不同，该三维坐标值作为每个最小单位数据的主键；数据获取单元，配置用于以每个患者的身份信息为数据中心，获取与该数据中心相关联的所有关联数据，将数据中心与其对应的所有关联数据组成一个数据组；三维数据构建单元，配置用于将每个数据组中的所有数据按照其三维坐标值映射到三维空间中的一个点，并在三维空间中，将数据中心对应的点与其他关联数据对应的点进行连接，得到该数据组对应的三维数据组；多方向降维单元，配置用于将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据；数据分析单元，配置用于结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度，根据契合度判断该数据组中的数据是否出现异常，若出现异常，则进行提示；

所述需求向量的生成过程具体包括：依据关联数据在三维空间中的坐标值与数据中心在三维空间中的坐标值，以数据中心为原点，计算得到数据中心与关联数据在三维空间中的方向向量，根据方向向量计算得到方向向量与水平面的夹角，将该夹角值作为需求向量的值；

所述多方向降维单元，将三维数据基于需求向量，在需求向量的方向进行降维，得到该需求向量对应的二维数据的方法包括：设定一个单位三维立体领域，根据单位三维立体领域将三维数据转化成投影形式，得到多个投影样本；计算投影样本间的投影距离；根据投影距离，构建投影近邻图；根据投影近邻图选择补丁样本集；根据选择矩阵将局部补丁合成整体，并计算校准矩阵；通过交替最小二乘计算稀疏最优函数得投影矩阵；用求得的投影矩阵把投影样本投影到低维投影子空间中；

所述设定一个单位三维立体领域，根据单位三维立体领域将三维数据转化成投影形式，得到多个投影样本的方法包括：将单位三维立体领域作为一个窗口立体领域遍历整个三维数据构成的三维空间，在遍历过程中，每间隔设定的间隔长度，就将单位三维立体领域所处的三维空间中的部分作为投影样本；

所述校准矩阵使用如下公式计算得到：

其中，/>为校正矩阵；为投影样本，/>为第一个投影样本；/>为投影距离；/>为投影样本对应的需求向量的值；/>为投影样本的个数；/>为设定得间隔长度，/>为底数为10的对数运算符；所述投影样本之间的投影距离定义为投影样本彼此之间的欧式距离；所述投影近邻图定义为各个投影样本与其投影距离最近的三个样本拼接组成的新样本；所述补丁样本集的选择过程包括：将投影近邻图中平面面积小于设定的阈值的投影近邻图选择出来，作为补丁样本集；

所述投影矩阵的计算过程包括：通过交替最小二乘计算稀疏最优函数：；将稀疏最优函数中的自变量以一个设定的集合序列中的元素值代入，然后分别按照先后顺序乘以投影样本，得到投影矩阵；其中，/>为交替最小二乘计算稀疏最优函数的输出结果；/>为投影样本，/>为因子矩阵；/>为函数自变量；/>为投影样本对应的需求向量的值；/>为矩阵转秩运算；/>为调整系数，取值范围为：1~3；

所述数据分析单元，结合需求向量与其对应的二维数据，计算需求向量与其二维数据的契合度的方法包括：生成二维数据的函数表达式，并计算二维数据的归一化斜率值，比较归一化斜率值与需求向量的值的正弦值的差值，该差值的倒数为契合度；

所述归一化斜率值为二维数据在二维平面中构成的函数的曲线中每一点的斜率值进行加和后得到的和值的算术平均值。

2.如权利要求1所述的系统，其特征在于，所述设定的最小单位包括两个参数，分别为：数据长度值和数据类别值；所述数据长度值定义为数据的长度，单位为比特；所述数据类别值定义为数据中包括的数据项的个数。

3.如权利要求2所述的系统，其特征在于，所述每个最小单位数据的三维坐标值的设定规则为：将每个最小单位数据中每个数据项的存储地址按照先后顺序依次顺次连接，然后将连接后的存储地址平均分割成三部分，将每一部分对应的二进制值转换为10进制值，得到其对应的在三维空间中的坐标值。