CN111739643B

CN111739643B - 一种健康风险评估系统

Info

Publication number: CN111739643B
Application number: CN202010840196.0A
Authority: CN
Inventors: 金硕; 胡茂华; 余安生; 章晶晶
Original assignee: Yaofang Information Technology Shanghai Co ltd
Current assignee: Yiyaowang Technology (Shanghai) Co.,Ltd.
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2020-12-15
Anticipated expiration: 2040-08-20
Also published as: CN111739643A

Abstract

本发明涉及健康风险评估领域，公开了一种健康风险评估系统。包括：一处理单元，用于根据复数个不同的病症的患者信息构建所有病症的病症特征字典；一接收单元，与处理单元连接，用于根据病症特征字典接收并处理待测用户的用户信息；一检测单元，与接收单元、处理单元连接，用于根据用户信息和病症特征字典获取用户信息对应的稀疏向量和残差向量，并根据稀疏向量和残差向量得到用户对应于每个病症的重构残差，将所有重构残差作为风险评估结果输出。本发明的技术方案有益效果在于：提供一种健康风险评估系统，不仅能够得到准确的风险评估结果，还能缩短风险评估结果的处理时间。

Description

一种健康风险评估系统

技术领域

本发明涉及健康风险评估领域，公开了一种健康风险评估系统。

背景技术

由于病症在不同时期有着不同的症状，相应的病症确诊也需要结合患者的症状进行处理。特别是慢性病症，患者的症状随着患病的不同时间也在逐渐发展变化，期间还常并伴随着多种并发症出现。并且慢性病征随着患病时间的增长，诊断治疗的难度也将逐渐增加，就算耗费大量的时间、金钱，治疗效果也不是非常显著。由此如何尽早且精确诊断病症特别是慢性病症显得极为重要。

发明内容

针对现有技术中存在的上述问题，现提供一种健康风险评估系统，其特征在于，包括：

一处理单元，用于根据复数个不同的病症的患者信息构建所有所述病症的病症特征字典；

一接收单元，与所述处理单元连接，用于根据所述病症特征字典接收并处理待测用户的用户信息；

一检测单元，与所述接收单元、所述处理单元连接，用于根据所述用户信息和所述病症特征字典获取所述用户信息对应的稀疏向量和残差向量，并根据所述稀疏向量和所述残差向量得到所述用户对应于每个所述病症的重构残差，将所有所述重构残差作为风险评估结果输出。

优选的，所述健康风险评估系统中还包括：

一筛选单元，连接所述处理单元，所述筛选单元中设有分别关联于每个所述病症的筛选条件，用于根据所述筛选条件筛选出对应于所述病症的所述患者信息；

所述处理单元根据筛选后的所述患者信息构建所述病症特征字典。

优选的，所述处理单元中包括：

第一处理模块，所述第一处理模块中预设关联于不同的所述病症的量化规则，所述第一处理模块用于根据所述量化规则对不同的所述病症对应的所有所述患者信息进行量化处理，并将量化处理后的所述患者信息输出；

第二处理模块，与所述第一处理模块连接，获取不同的所述病症对应的所述患者信息，生成对应于不同的所述病症的子特征字典；

第三处理模块，与所述第二处理模块连接，根据每个所述病症对应的所述子特征字典构建所述病症特征字典。

优选的，所述检测单元中包括：

第一检测模块，与所述处理单元连接，用于根据所述用户信息和所述病症特征字典，生成所述用户信息对应于所有所述患者信息的所述稀疏向量以及所述残差向量；

第二检测模块，与所述第一检测模块连接，用于根据所述稀疏向量和所述残差向量得到分别对应于每个所述病症的重构残差；

第三检测模块，与所述第二检测模块连接，用于根据所有所述重构残差得到所述用户确诊每个所述病症的概率，将所有所述概率作为所述风险评估结果输出。

优选的，所述第一检测模块中包括：

第一获取部件，与所述处理单元连接，用于获取所述用户信息和所述病症特征字典；

第一定义部件，与所述第一获取部件连接，用于根据所述用户信息定义组成所述残差向量的所有残差系数以及组成所述稀疏向量的所有稀疏系数；

第一计算部件，与所述第一定义部件连接，用于根据所述第一定义部件定义的所述残差系数与所述病症特征字典中的所有所述患者信息的内积绝对值，更新所述稀疏系数和所述残差系数；

第一生成部件，与所述第一计算部件连接，用于根据更新后的所述稀疏系数生成所述用户信息对应的所述稀疏向量，以及根据更新后的所述残差系数生成所述用户信息对应的所述残差向量。

优选的，所述第一生成部件生成的所述稀疏向量和所述残差向量通过下述公式表示为：

其中，

用于表示所述用户信息；

用于表示所述病症特征字典；

用于表示所述用户信息对应于所有所述患者信息的所述稀疏向量；

用于表示所述用户信息对应于所有所述患者信息的所述残差向量；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息，

用于表所述病症特征字典中的第

个病症的患者信息的总个数；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息，

用于表示所述病症特征字典中的第

个病症的患者信息的总个数；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息，

用于表示所述病症特征字典中的第

个病症中的患者信息的总个数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的稀疏系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的稀疏系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的稀疏系数。

用于表示所述用户信息对应于第

个病症的第

个患者信息的残差系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的残差系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的残差系数。

优选的，所述第一检测模块中还包括：

第一判断部件，与所述第一计算部件连接，所述第一判断部件中预设一稀疏临界值，所述第一判断部件用于获取所述第一计算部件中更新后的所述稀疏系数，并根据所述稀疏临界值对所有所述稀疏系数进行判断，根据判断结果控制所述第一计算部件更新的所述稀疏系数的个数。

优选的，所述第一检测模块中还包括：

第二判断部件，分别连接所述第一计算部件和所述第三检测模块，所述第二判断部件中预设一重合阈值，所述第二判断部件用于获取所述第一计算部件中更新后的所述稀疏系数，并根据重合阈值对更新后的所述稀疏系数对应的所述病症进行判断，根据判断结果生成所述用户确诊每个所述病症的概率并输出至所述第三检测模块。

优选的，所述重构残差通过下述公式表示为：

其中，

表示对应于所述用户信息对应于第

个病症的所述重构残差；

用于表示所述用户信息；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息；

用于表示所述用户信息对应于第

个病症中的第

个患者信息的所述稀疏向量，

用于表示所述病症特征字典中的第

个病症的患者信息的总个数。

优选的，所述用户确诊每个所述病症的所述概率通过下述公式表示为：

其中，

表示所述概率；

表示对应于所述第

个病症的所述重构残差。

本发明的技术方案有益效果在于：提供一种健康风险评估系统，不仅能够得到准确的风险评估结果，还能缩短风险评估结果的处理时间。

附图说明

参考所附附图，以更加充分的描述本发明的实施例。然而，所附附图仅用于说明和阐述，并不构成对本发明范围的限制。

图1为本发明的一种较优实施方式的结构示意图；

图2为本发明的一种较优实施方式的获取单元的结构示意图；

图3为本发明的一种较优实施方式的筛选单元的结构示意图；

图4为本发明的一种较优实施方式的处理单元的结构示意图；

图5为本发明的一种较优实施方式的检测单元的结构示意图；

图6为本发明的一种较优实施方式的第一检测模块的结构示意图；

图7为本发明的一种较优实施方式的第一判断部件的结构示意图；

图8为本发明的一种较优实施方式的第二判断部件的结构示意图；

图9为本发明的一种较优实施方式的其中一个患者信息的数据向量的显示图；

图10为本发明的一种较优实施方式的病症特征字典的显示图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

一种健康风险评估系统，如图1所示，包括：

一处理单元1，用于根据复数个不同的病症的患者信息构建所有病症的病症特征字典；

一接收单元2，与处理单元1连接，用于根据病症特征字典接收并处理待测用户的用户信息；

一检测单元3，与处理单元1、接收单元2连接，用于根据用户信息和病症特征字典获取用户信息对应的稀疏向量和残差向量，并根据稀疏向量和残差向量得到用户对应于每个病症的重构残差，将所有重构残差作为风险评估结果输出。

具体地，现有技术中的健康风险评估常根据训练数据构建评估模型以实现健康风险评估，然而现有技术中获取原始数据并进行数据训练的过程中常常因为原始数据过多、数据属性过于复杂、得到训练数据的维数过高导致最终无法快速地获得评估结果。此外，在训练数据以降低维数的训练过程中可能因训练过程出现偏差，导致删去一些能够表征病症特征的数据，使最终得到的评估结果不够准确。

由此，本发明提供的健康风险评估系统，通过对患者信息进行处理，使构建的病症特征字典在患者信息的数据量与数据准确性之间达到平衡，再根据病症特征字典接收并处理待测用户的用户信息，得到用户信息对应于所有病症的稀疏向量和残差向量，通过稀疏向量和残差向量得到待测用户的患病概率并作为风险评估结果输出，不仅能够得到准确的风险评估结果，还能提高风险评估结果的处理时间。

具体地，本申请将不同病症的患者信息作为病症的病症特征构建超高维的病症特征字典，能够在不破坏患者信息的情况下获取到所有病症的风险特征，再根据用户信息获取对应的稀疏向量和残差向量，此处的病症特征字典可视为一个超高维的矩阵，矩阵中的每一列表示一个患者对应的患者信息，如第一列表示第一个病症中的第一个患者对应的患者信息，矩阵中的每一行表示一个病症的病症特征，如吸烟频率、饮酒频率、运动频率等，相应的稀疏向量和残差向量均为列向量，稀疏向量与残差向量中包含的稀疏系数和残差系数可综合表征为当前的用户信息与每个病症的每个患者信息之间的匹配吻合程度，随后根据残差向量获取重构残差，重构残差越小，即用户信息与病症特征字典中的一个病症对应的所有患者信息重合程度越高，也就是用户患该病症的概率越大。

本发明的一种较优实施方式中，如图2所示，健康风险评估系统中可包括：

一获取单元4，获取单元4用于获取患者信息，并对获取到的所有患者信息中对应于相同病症的患者信息进行分析，根据分析结果调整获取的患者信息；

处理单元1，与获取单元4连接，用于根据获取单元4获取的患者信息构建病症特征字典。

具体地，为获取不同病症的患者信息以构建病症特征字典，健康风险评估系统中设置获取单元4，获取单元4获取不同病症的确诊患者的患者信息并输出至处理单元1，构建精确的病症特征字典。

作为一种优选实施方式，获取单元4在获取患者信息的过程中，将实时分析同一病症的患者信息之间的重合程度，生成对应的重合参数，获取单元根据重合参数实时调整患者信息的获取过程，并将最终获取的患者信息以及对应的重合参数共同输出至处理单元1。通过获取单元4的实时分析，实时调整能够获取与病症密切关联的患者信息，能够获取更多与病症相关的影响因素。

进一步地，获取单元4根据重合程度生成一个或多个重合参数，并将重合参数与患者信息共同输出至处理单元1，处理单元1将一个或多个重合参数对应作为构建病症特征字典中的其中一行或多行对应的病症特征，完成病症特征字典的构建，通过处理单元1生成的重合参数，能够在扩大病症特征字典的维数的同时，提高构建的病症特征字典的精确性。

具体地，当获取单元4对同一病症的患者信息进行重合度分析时，得到的分析结果为：同一病症信息的大部分确诊的患者信息中的地理位置高度重合，则获取单元4实时调整患者信息的获取过程，根据此时的地理信息获取对应的患者信息，将地理信息作为重合参数与获取的患者信息共同输出至处理单元1，处理单元1将地理信息作为要构建的病症特征字典的其中一行对应的病症特征，再处理患者信息，以完成病症特征字典的构建。

进一步地，此处的地理位置信息包括患者的居住地信息、工作地信息以及出行路线信息，获取单元4将分析不同患者信息中的居住地信息、工作地信息以及出行路线信息对应的重合程度，按照重合程度从居住地信息、工作地信息以及出行路线信息中提取一个或多个重合参数，若此时的重合程度相等，则将对应的居住地信息、工作地信息以及出行路线信息均作为重合参数输出至处理单元1，以完善病症特征字典的维数。

本发明的一种较优实施方式中，如图3所示，健康风险评估系统中还包括：

一筛选单元5，连接处理单元1，筛选单元5中设有关联于每个病症的筛选条件，用于根据筛选条件筛选出对应于病症的患者信息；

处理单元1根据筛选后的患者信息构建病症特征字典。

本发明的一种较优实施方式中，筛选条件关联于病症对应的所有患者信息。

具体地，考虑到现有技术中训练的数据样本过多，数据属性较为复杂，无法在最小的数据处理量以及最完善的数据样本中获取平衡，因此，本发明提供的健康风险评估系统中还设置一筛选单元5。

健康风险评估系统通过获取单元4获取与病症密切关联的所有患者信息，用于扩大该病症构建的特征字典中的维数，即与该病症密切关联的病症属性。健康风险评估系统还通过筛选单元5筛选出所有患者信息中最为典型的患者信息，用于缩小该病症构建的特征字典中的患者基数。

需要注意的是，此处的筛选单元5并未对维数进行处理，进行降维，而是筛选单元5对患者信息进行筛选处理，降低选取的患者基数，减少数据处理量，以便于处理单元1根据筛选单元5和获取单元4处理后的患者信息构建病症特征字典，利用获取单元4获取当前病症对应的超高维的多个患者信息，再利用筛选单元5筛选出少量但具有代表性的患者信息，构建得到维数多、基数低的病症特征字典。

作为一种优选的实施方式，筛选单元5根据获取单元4发送至处理单元1的患者信息，对同一病症对应的所有患者信息进行重合度匹配，得到高度重合的多个患者信息并进行筛选处理，生成处理后的患者信息，用于缩减构建病症特征字典的患者信息的数量，以保证患者信息的准确性的同时缩减数据处理量。

相应的，筛选单元5对于不同的病症对应的所有患者信息分别进行重合度匹配，根据匹配结果进行筛选，即筛选单元5筛选不同病症对应的患者信息时的筛选标准是不同的，以保证病症特征字典中的不同病症分别对应的患者信息的多样性。

本发明的一种较优实施方式中，如图4所示，处理单元1中包括：

第一处理模块11，第一处理模块11中预设关联于不同的病症的量化规则，第一处理模块11用于根据量化规则对不同的病症对应的所有患者信息进行量化处理，并将量化处理后的患者信息输出；

第二处理模块12，与第一处理模块11连接，获取不同的病症对应的患者信息，生成对应于不同的病症的子特征字典；

第三处理模块13，与第二处理模块12连接，根据每个病症对应的子特征字典构建病症特征字典。

具体地，处理单元1用于根据患者信息构建病症特征字典，处理单元1中设置第一处理模块11、第二处理模块12和第三处理模块13，第一处理模块11用于量化患者信息，第二处理模块12用于获取对应一个病症的所有数据向量构建子特征字典，第三处理模块13用于获取所有病症的病症子特征字典以构建病症特征字典。

本发明的一种较优实施方式中，第一处理模块11根据量化规则对患者信息进行量化得到量化值，根据量化值生成对应于患者信息的数据向量，第二处理模块12根据所有患者信息对应的数据向量生成对应于不同病症的子特征字典。

本发明的一种较优实施方式中，患者信息包括基本信息、健康档案信息、生活习惯信息、智能硬件信息以及购药信息。

具体地，第一处理模块11中设置的多个量化规则，分别关联于患者信息中的基本信息、健康档案信息、生活习惯信息、智能硬件信息以及购药信息，通过量化规则进行量化生成量化后的患者信息。

作为一种优选实施方式，同一病症的确诊患者的患者信息对应的量化规则相同，以实现该病症对应的所有数据向量的量化规则统一。优选的，当患者信息中生活习惯信息包括吸烟频率时，则量化规则对应为：不吸烟对应的量化值为0；平均每日1-5根对应的量化值为1；平均每日6-10根对应的量化值为2；平均每日11-15根对应的量化值为3；平均每日16-20根对应的量化值为4；平均每日大于20根对应的量化值为5。该病症的所有患者信息的吸烟频率均通过此量化规则进行量化，以获取量化后的患者信息。

进一步地，第一处理模块11设置的量化规则与量化处理生成的量化值关联，当患者信息通过量化规则生成的量化值呈集中分布时，则对量化规则采用细化处理，当量化值呈分散分布时，则对量化规则采用整合处理。

具体地，当第一处理模块11进行量化后发现量化值始终为1与2之间，则细化量化规则，如上述的吸烟概率的量化规则，当患者信息对应的量化值多数处于1-2之间，则优化量化规则，平均每日1-2根对应的量化值为1，平均每日3-4根对应的量化值为2，平均每日5-6根对应的量化值为3，平均每日7-8根对应的量化值为4，平均每日9-10根对应的量化值为5，将量化值的分布情况反馈至处理单元1，处理单元1将根据分布情况调整量化规则。

作为本发明的一种较优实施方式中，处理单元1将分析病症与患者信息之间关联程度，并根据关联程度调整量化规则，当患者信息中的某项信息与该病症完全无关，则量化规则对该项信息进行量化处理产生的所有量化值均为0，以便于处理单元1后续在根据病症特征字典处理用户信息时能够快速降维。

本发明的一种较优实施方式中，病症特征字典采用下述公式表示：

（1）

其中，

用于表示病症特征字典；

用于表示第

个病症的子特征字典，

用于表示病症在所有病症中的排序序号；

用于表示病症的总个数。

具体地，第

个病症对应的子特征字典由确诊该病症的患者对应的患者信息组成，相应的，可以表示为：

（2）

其中，

用于表示确诊第

个病症中对应的第1个患者信息，该患者信息中包括多个不同属性的病症特征，为便于处理单元1进行信息处理，通过对患者信息中的所有病症特征进行量化处理，具体可表示为：

（3）

其中，

用于表示患者信息中的第

项病症特征对应的量化值，

用于表示患者信息中的病症特征总个数，由于处理单元1中处理的患者信息最终用于构建病症特征字典，所以每个患者信息的处理的病症特征需要完全保持一致，因此，

同时也是病症特征字典的总行数。

由此可见，本申请中的病症特征字典表示为超高维的矩阵，其中的每一列为一个患者信息，总列数为所有病症对应的所有患者信息的总个数，其中的每一行为一个病症特征，即上文中所述的病症特征。

本发明的一种较优实施方式中，接收单元2与处理单元1连接，用于根据病症特征字典以及量化规则接收并处理待测用户的用户信息。

具体地，首先，接收单元2根据构建病症特征字典获取待测用户的用户信息，如病症特征字典中包括3维的病症特征，如吸烟频率、饮酒频率、运动频率，相应的接收单元2也接收用户信息的吸烟频率、饮酒频率、运动频率；随后，接收单元2根据量化规则处理用户信息，得到对应的量化后的用户信息。需要注意的是，接收单元2接收到的用户信息的维数与构建的病症特征字典的维数完全对应一致，以及接收单元2使用的量化规则是经由处理单元调整的，用于最终构建病症特征字典的量化规则。

接收单元2接收处理的用户信息，可表示为：

（4）

其中，

用于表示用户信息中的第

项病症特征对应的量化值。

本发明的一种较优实施方式中，如图5所示，检测单元3中包括：

第一检测模块31，与处理单元1连接，用于根据用户信息和病症特征字典，生成用户信息对应于所有患者信息的稀疏向量以及残差向量；

第二检测模块32，与第一检测模块31连接，用于根据稀疏向量和残差向量分别得到对应于每个病症的重构残差；

第三检测模块33，与第二检测模块32连接，用于根据所有重构残差得到用户确诊每个病症的概率，将所有概率作为风险评估结果输出。

具体地，由上述可知，此处的病症特征字典具有超高维的数据，因此第一检测模块31根据用户信息和病症特征字典得到用户信息对应的稀疏向量和残差向量，第二检测模块32则获取重构残差，第三检测模块33根据重构残差获取该待测用户对应于每个病症的患病概率。

本发明的一种较优实施方式中，如图6所示，第一检测模块31中包括：

第一获取部件311，与处理单元连接，用于获取用户信息和病症特征字典；

第一定义部件312，与第一获取部件311连接，用于根据用户信息定义组成残差向量的所有残差系数以及组成稀疏向量的所有稀疏系数；

第一计算部件313，与第一定义部件312连接，用于根据第一定义部件312定义的残差系数与病症特征字典中的所有患者信息的内积绝对值，更新稀疏系数和残差系数；

第一生成部件314，与第一计算部件313连接，用于根据更新后的稀疏系数生成用户信息对应的稀疏向量，以及根据更新后的残差系数生成用户信息对应的残差向量。

本发明的一种较优实施方式中，第一生成部件314生成的稀疏向量和残差向量通过下述公式表示为：

（5）

其中，

用于表示用户信息；

用于表示病症特征字典；

用于表示用户信息对应于所有患者信息的稀疏向量；

用于表示用户信息对应于所有患者信息的残差向量；

用于表示病症特征字典中的第1个病症对应的第

个患者信息，

用于表病症特征字典中的第1个病症的患者信息的总个数；

用于表示病症特征字典中的第

个病症对应的第

个患者信息，

用于表示病症特征字典中的第

个病症的患者信息的总个数；

用于表示病症特征字典中的第

个病症对应的第

个患者信息，

用于表示病症特征字典中的第

个病症中的患者信息的总个数；

用于表示用户信息对应于第1个病症的第

个患者信息的稀疏系数；

用于表示用户信息对应于第

个病症的第

个患者信息的稀疏系数；

用于表示用户信息对应于第

个病症的第

个患者信息的稀疏系数。

用于表示用户对应于第

个病症的残差系数。

具体地，为得到最终生成的稀疏向量和残差向量能够完全满足上述公式（4），本申请中的具体计算流程如下：

第一获取部件311获取用户信息，用户信息经由接收单元2处理为超高维的列向量，此处的用户信息可表示为：

（6）

其中，

用于表示用户信息中的第

项病症特征对应的量化值，此处，接收单元2根据构建病症特征字典的量化规则对用户信息进行量化处理。

第一定义部件312根据用户信息定义组成残差向量的残差系数和组成稀疏向量的稀疏系数，残差向量和稀疏向量均为列向量，对应的残差系数和稀疏系数均为列向量中的元素。

第一次定义的残差向量

和稀疏向量

，可采用下述公式表示为：

（7）

其中，未更新的稀疏向量为0，也就是说，组成稀疏向量中的所有稀疏系数从

到

均为0，残差向量为用户信息，也就是说组成残差向量的残差系数与用户信息中的所有量化值一一对应。

随后，第一计算部件313对稀疏向量

和残差向量

进行更新，具体过程为：

首先，从病症特征字典中找到与当前的残差向量

中的所有残差系数的内积绝对值最大的那列患者信息，为便于表述，假设此时确定的内积绝对值最大的那列患者信息为

，在病症特征字典中的列数表示为

列；

随后，通过从当前的残差向量

减去其在对应的患者信息

所张成空间上的正交投影得到更新后的残差向量

，采用下述公式表示为：

（8）

并更新对应于第

列的稀疏系数

，采用下述公式表示为：

（9）

此时的稀疏系数

的值由0更新为

；

进行重复运算；

根据残差向量

进行更新，得到病症特征字典中除患者信息

以外的其他患者信息中，与残差向量

的内积绝对值最大的患者信息，此时内积绝对值最大的对应的那一列患者信息为

，对应的列为第

列，再对残差向量

进行更新，得到更新后的残差向量

，采用下述公式表示为：

（11）

此时的稀疏系数

的值由0更新为

；

经多次重复运算，更新得到所有稀疏系数和残差向量并输出至第一生成部件314。

需要注意的是，在更新过程中，首先确定与当前的残差向量的内积绝对值最大的那一列，随后更新残差向量中的所有残差系数，得到更新后的残差向量，再更新稀疏向量中对应于那一列的一个稀疏系数，经过多次更新，最终得到更新后的残差向量以及对应于不同列的稀疏系数，将所有稀疏系数组成稀疏向量，将最后更新的残差向量为最终确定的残差向量输出，也就是说，每次更新过程中，更新整个残差向量，即残差向量中的所有残差系数，以及对应一列的一个稀疏系数。此种迭代更新的方式能够更加精确地获取稀疏向量和残差向量。

第一生成部件314，根据更新后的稀疏系数生成用户信息对应的稀疏向量，以及根据更新后的残差系数生成用户信息对应的残差向量。

本发明的一种较优实施方式中，如图7所示，第一检测模块31中还包括：

第一判断部件315，与第一计算部件313连接，第一判断部件315中预设一稀疏临界值，第一判断部件315用于获取第一计算部件中更新后的稀疏系数，并根据稀疏临界值对所有稀疏系数进行判断，根据判断结果控制更加控制第一计算部件313更新的稀疏系数的个数。

具体地，为减少资源占用，更快速获取风险评估结果，第一判断部件315预设稀疏临界值

，对包括更新的稀疏系数在内的所有稀疏系数进行0范数计算，将计算结果与稀疏临界值

进行比较，当计算0范数的结果小于稀疏临界值

时，控制第一计算部件313停止计算，将此时更新的稀疏系数与未更新的稀疏系数共同输出，以生成对应的稀疏向量。

本发明的一种较优实施方式中，如图8所示，第一检测模块31中还包括：

第二判断部件316，分别连接第一计算部件313和第三检测模块33，第二判断部件316中预设一重合阈值，第二判断部件316用于获取第一计算部件中更新后的稀疏系数，并根据重合阈值对更新后的稀疏系数对应的病症进行判断，根据判断结果生成用户确诊每个病症的概率并输出至第三检测模块。

具体地，为更快速获取风险评估结果，第二判断部件316对更新的稀疏系数对应的病症进行重合匹配，当更新的多个稀疏系数对应于同一个病症，即在更新后的所有的稀疏系数中，对应于一个病症的稀疏系数在所有的稀疏系数的占比超过重合阈值时，则计算对应同一病症的稀疏系数在此时更新的所有稀疏系数占比，并将占比作为用户确诊每个病症的概率并输出至第三检测模块33。

本发明的一种较优实施方式中，重构残差通过下述公式表示为：

（12）

其中，

表示对应于用户信息对应于第

个病症的重构残差；

用于表示用户信息；

用于表示病症特征字典中的第

个病症对应的第

个患者信息；

用于表示用户信息对应于第

个病症中的第

个患者信息的稀疏向量，

用于表示病症特征字典中的第

个病症的患者信息的总个数。

具体地，依次对该用户信息对应于每个病症的残差向量进行二范数计算，获取重构残差。

本发明的一种较优实施方式中，用户确诊每个病症的概率通过下述公式表示为：

（13）

其中，

表示概率；

表示对应于第

个病症的重构残差。

具体地，通过计算待测用户对应于所有病症的重构残差获取患病概率。对应于一病症的重构残差越小，患该病的概率则越大，相应的健康风险评估结果也显示为待测用户患该病症的风险越高。

具体地，本发明的一种较优实施方式为：处理单元1根据获取单元4获取并处理生成一个超高维的患者信息对应的数据向量，这里的维数为256维，即=256，如图9所示，患者信息中的基本信息，包括性别，年龄，身高，体重，是否婚育；健康档案信息，包括本人是否已确诊各种病症，是否有家属确诊各种病症，生活习惯信息，包括吸烟频率、饮酒频率、运动频率、熬夜频率、饮食爱好、荤素偏好、早餐习惯、三餐习惯、晚餐通常是三餐中最丰盛的、餐后马上吃水果、食欲不振、经常感到疲惫、经常头疼，腰酸腿疼或肩膀疼、睡眠开始时间、平均睡眠时长；智能硬件信息，包括低压、高压、血糖、心率(次/分钟)、血氧（百分比）、日均步数、压力值（百分制）、睡眠分（百分制）、脂肪率（百分比）、水分率（百分比）、基础代谢率（kcal/天）、蛋白质（百分比）、骨盐量（kg）、肌肉量（kg）、内脏脂肪等级(1-18，保留1位小数)的测量数值；购药信息，包括：200种指标商品购药信息、其中100种指标商品由各种病症对应的各种药品组成，每个病种的商品由销量前十的主治用药和辅助用药组成。

随后构造十种慢性病症对应的病症特征字典，即，如图10所示，此处的病症特征字典可由一个256*1000维的矩阵构成，每一列是一个患者信息对应的数据向量，维度是256*1，每种疾病可按照获取单元4获取的患者信息成比方式筛选，选取不同数量的患者，也可不同病症均匀获取相同数量的患者信息，筛选单元5选取1000名患者时，可按照年龄段成比方式分布，方式如30岁以下100名，30-40岁100名，40-50岁200名，50-60岁200名，60-70岁200名，70-80岁100名，80岁以上100名，最终构建的慢病特征字典可以表示为

。

本申请提供的健康风险评估系统能够用于病症的潜伏期检测、病症和并发症的组合检测。

本申请的健康风险评估系统还可根据输出的风险评估结果中的不同风险情况生成对应的预防警示和药品推荐，以便于待测用户使用查看。

以上仅为本发明较佳的实施例，并非因此限制本发明的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本发明的保护范围内。

Claims

1.一种健康风险评估系统，其特征在于，应用于对慢性病症进行风险评估，包括：

一处理单元，用于根据复数个不同的病症的患者信息构建所有所述病症的超高维的病症特征字典；

一检测单元，与所述接收单元、所述处理单元连接，用于根据所述用户信息和所述病症特征字典获取所述用户信息对应的稀疏向量和残差向量，并根据所述稀疏向量和所述残差向量得到所述用户对应于每个所述病症的重构残差，将所有所述重构残差作为风险评估结果输出；

所述检测单元中包括：

所述第一检测模块中包括：

第一计算部件，与所述第一定义部件连接，用于获取所述第一定义部件定义的所述残差系数与所述病症特征字典中的所有所述患者信息之间的内积绝对值，并根据所述内积绝对值更新所述稀疏系数和所述残差系数；

第一生成部件，与所述第一计算部件连接，用于根据更新后的所述稀疏系数生成所述用户信息对应的所述稀疏向量，以及根据更新后的所述残差系数生成所述用户信息对应的所述残差向量；

所述残差向量和所述稀疏向量均为列向量，对应的所述残差系数和所述稀疏系数均为列向量中的元素；

所述第一计算部件包括：

第一计算部分，用于从所述病症特征字典中找到与当前的残差向量

中的所有残差系数的内积绝对值最大的那一列

所对应的患者信息

，将对应的患者信息

作为最大患者信息；

第二计算部分，连接所述第一计算部分，用于从当前的所述残差向量

减去当前的所述残差向量

在对应的所述最大患者信息

所张成空间上的正交投影，得到更新后的所述残差向量

以及更新后对应于第

列的所述稀疏系数

，其中更新后的所述残差向量采用下述公式表示为：

以及更新后对应于第

列的所述稀疏系数采用下述公式表示为：

此时的稀疏系数

的值由初始状态下的0值更新为

；

更新后的所述残差向量

作为当前的所述残差向量并参与循环更新的过程；得到病症特征字典中除患者信息

以外的其他患者信息中，与残差向量

，对应的列为第

列，再对残差向量

进行再次更新，得到再次更新后的残差向量

以及对应于第

列的稀疏系数

，其中再次更新后的残差向量

用下述公式表示为：

以及再次更新后对应于第

列的稀疏系数

采用下述公式表示为：

此时的稀疏系数

的值由初始状态下的0值更新为

；

所述第一计算部件采用循环更新的方式，每次更新过程中更新整个所述残差向量以及对应一列中的一个所述稀疏系数，直至更新后的所述稀疏系数满足预设条件为止；

所述第一计算部件得到更新后的残差向量以及对应于不同列的稀疏系数，将所有稀疏系数组成所述稀疏向量，将最后更新的残差向量为最终确定的残差向量。

2.根据权利要求1所述的健康风险评估系统，其特征在于，所述健康风险评估系统中还包括：

3.根据权利要求1所述的健康风险评估系统，其特征在于，所述处理单元中包括：

4.根据权利要求1所述的健康风险评估系统，其特征在于，所述检测单元中包括：

5.根据权利要求4所述的健康风险评估系统，其特征在于，所述第一生成部件生成的所述稀疏向量和所述残差向量通过下述公式表示为：

其中，

用于表示所述用户信息；

用于表示所述病症特征字典；

用于表示所述病症特征字典中的第个病症对应的第个患者信息，用于表示所述病症特征字典中的第个病症的患者信息的总个数；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息，

用于表示所述病症特征字典中的第

个病症的患者信息的总个数；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息，

用于表示所述病症特征字典中的第

个病症中的患者信息的总个数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的稀疏系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的稀疏系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的稀疏系数；

用于表示所述用户信息对应于第个病症的第个患者信息的残差系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的残差系数；

用于表示所述用户信息对应于第

个病症的第

个患者信息的残差系数。

6.根据权利要求4所述的健康风险评估系统，其特征在于，所述第一检测模块中还包括：

7.根据权利要求4所述的健康风险评估系统，其特征在于，所述第一检测模块中还包括：

第二判断部件，分别连接所述第一计算部件和所述第三检测模块，所述第二判断部件中预设一重合阈值，所述第二判断部件用于获取所述第一计算单元中更新后的所述稀疏系数，并根据重合阈值对更新后的所述稀疏系数对应的所述病症进行判断，根据判断结果生成所述用户确诊每个所述病症的概率并输出至所述第三检测模块。

8.根据权利要求4所述的健康风险评估系统，其特征在于，所述重构残差通过下述公式表示为：

其中，

用于表示对应于所述用户信息对应于第

个病症的所述重构残差；

用于表示所述用户信息；

用于表示所述病症特征字典中的第

个病症对应的第

个患者信息；

用于表示所述用户信息对应于第

个病症中的第

个患者信息的所述稀疏系数，

用于表示所述病症特征字典中的第

个病症的患者信息的总个数。

9.根据权利要求4所述的健康风险评估系统，其特征在于，所述用户确诊每个所述病症的所述概率通过下述公式表示为：

其中，

用于表示所述概率；

用于表示对应于第

个所述病症的重构残差；

用于表示所述病症的总个数。