CN117954036A - 基于大数据的健康管理方法及系统 - Google Patents
基于大数据的健康管理方法及系统 Download PDFInfo
- Publication number
- CN117954036A CN117954036A CN202410345634.4A CN202410345634A CN117954036A CN 117954036 A CN117954036 A CN 117954036A CN 202410345634 A CN202410345634 A CN 202410345634A CN 117954036 A CN117954036 A CN 117954036A
- Authority
- CN
- China
- Prior art keywords
- station
- data management
- health
- health data
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 62
- 238000013523 data management Methods 0.000 claims abstract description 190
- 238000000034 method Methods 0.000 claims abstract description 98
- 238000005457 optimization Methods 0.000 claims abstract description 63
- 238000012216 screening Methods 0.000 claims abstract description 40
- 238000012423 maintenance Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000001514 detection method Methods 0.000 claims description 91
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 230000000739 chaotic effect Effects 0.000 claims description 16
- 238000012217 deletion Methods 0.000 claims description 14
- 230000037430 deletion Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 claims 2
- 230000000694 effects Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000011895 specific detection Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据管理技术领域,本发明公开了基于大数据的健康管理方法及系统;包括基于筛选准则筛选出目标特征,将目标特征导入工位生成健康数据管理单元,采集综合质量参数,生成数据管理波动值,判定数据库是否进入数据维稳模式,并制定局部优化指令或整体优化指令,从而执行局部补录操作或执行整体补录操作;相对于现有技术,可以从包含信息繁多且复杂的用户健康数据中筛选出所需的目标特征,组合成独立的健康数据管理单元,从而准确的评估出用户健康数据当前的数据状态,对用户健康数据进行针对性的优化补录处理,避免用户健康数据出现丢失、混乱或不匹配的现象,确保海量的用户健康数据都能够保持准确、稳定且完整的状态。
Description
技术领域
本发明涉及数据管理技术领域,更具体地说,本发明涉及基于大数据的健康管理方法及系统。
背景技术
用户健康数据是用户平日生活中、医疗过程中所产生的和个人健康相关的数据,通过采集并分析用户健康数据中包含的信息,可以对用户的自身健康状态进行较为准确的评估和判断,而为了对用户健康状态进行准确的评估和判断,要确保用户健康数据保持完整和准确,因此需要对用户健康数据进行针对性的管理。
申请公开号为CN114781996A的中国专利申请公开了一种基于大数据的大健康智能管理系统及方法,其依据现如今随身携带的智能设备获取用户的数据信息,对用户的健康数据进行监测和管理;通过分析群体内健康数据的整体趋势,再分别对用户个体进行初步判断,有效的将群体中身体处于健康趋势、亚健康趋势和不健康趋势的人群区分开来,以不同时间进行监测可以快速的捕捉健康趋势走下坡路的用户;分析用户特征数据之间的关联性是进一步精确的分析用户实际的情况,提高在群体用户数据中精确分析用户本体健康状况的精确性;
现有技术存在以下不足:
现有的用户健康数据在管理时,通常将大量的用户健康数据进行统一储存并管理,使得大量相同类型或相近类型的用户健康数据之间容易发生交叉混乱的现象,并且在对相同类型或者相近类型的用户健康数据进行系统删减时,容易因为识别错误而导致误删减的现象,造成用户健康数据出现丢失、混乱或不匹配的现象,降低了用户健康数据的完整度,进而导致用户健康状态评估判断结果的不准确,不利于用户健康数据的高效、准确管理。
鉴于此,本发明提出基于大数据的健康管理方法及系统以解决上述问题。
发明内容
为了克服现有技术的上述缺陷,为实现上述目的,本发明提供如下技术方案:基于大数据的健康管理方法,应用于数据库服务器,包括:
S1:标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征;
S2:构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元;
S3:采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值;
S4:基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式;若数据库进入数据维稳模式,执行S5-S6;若数据库不进入数据维稳模式,重复执行S3-S4;
S5:在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令;
S6:根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作。
进一步的,健康特征的标记方法包括:
通过自然语言处理技术对数据库内的用户健康数据进行语义处理,获得带有关键字的语义词组;
逐一提取语义词组的关键字,并对关键字进行识别;
将关键字为姓名、性别、年龄、项目名称、检测时间或检测值所在的语义词组标记为健康特征。
进一步的,筛选准则为:保留语义词组中直接表示用户健康状态信息的目标字词,并剔除其余的无用字词;
目标特征的筛选方法包括:
将姓名、性别和年龄标记为无用字词,将项目名称、检测时间和检测值标记为目标字词;
将健康特征对应的语义词组中的关键字与无用字词和目标字词匹配;
剔除掉语义词组中的关键字与无用字词匹配一致的健康特征,将关键字与目标字词匹配一致的语义词组标记为目标词组;
基于计算机视觉技术选定目标词组中为项目名称、检测时间或检测值的目标区域,并剔除掉目标区域之外的字词,余下的项目名称、检测时间或检测值即为目标特征。
进一步的,健康数据管理单元的生成方法包括:
构建具有三个独立工位且零容量的三个工位,三个工位分别标记为第一工位、第二工位和第三工位;
将目标特征中的项目名称和检测时间分别导入到第一工位和第二工位中,形成填充后的第一工位和第二工位;
标记第二工位中的检测时间所在的时刻,并从目标特征中筛选与检测时间所在的时刻一致的检测值,将筛选到的检测值导入第三工位中,形成填充后的第三工位;
将填充后的第一工位、第二工位和第三工位均备注同一个编号后汇总,获得无备注管理单元;
将无备注管理单元备注上与第一工位、第二工位和第三工位一致的编号,获得健康数据管理单元。
进一步的,综合质量参数包括成功匹配衰减值、有效缺失占比值和编号混乱度;
成功匹配衰减值的获取方法包括:
A1:从数据库内随机选择个健康数据管理单元,分别获得/>个第一工位、/>个第二工位和/>个第三工位;
A2:以个第一工位的编号为基础,分别将/>个第二工位的编号和/>个第三工位的编号依次与/>个第一工位的编号对比;
A3:将第一工位的编号、第二工位的编号和第三工位的编号一致的健康数据管理单元标记为成功匹配单元,并统计成功匹配单元的数量;
A4:将成功匹配单元的数量与健康数据管理单元的数量比较,获得成功匹配率;
A5:重复执行次A1-A4的步骤,获得/>个成功匹配率;
成功匹配率的表达式为:
;
式中,为第/>个成功匹配率,/>为第/>个成功匹配单元的数量;
A6:将第个成功匹配率与第/>个成功匹配率作差比较,获得/>成功匹配差值;
成功匹配差值的表达式为:
;
式中,为第/>个成功匹配差值,/>为第/>个成功匹配率;
A7:将个成功匹配差值累加后求平均,获得成功匹配衰减值;
成功匹配衰减值的表达式为:
;
式中,为成功匹配衰减值,/>为第/>个成功匹配差值。
进一步的,有效缺失占比值的获取方法包括:
以预设单元数量为标准,将数据库内的所有健康数据管理单元等分为个子集合;
分别识别个子集合内的健康数据管理单元中第一工位、第二工位和第三工位的容量;
将容量为零的第一工位、第二工位和第三工位标记为异常工位,并统计异常工位的数量,获得个异常工位值;
将个异常工位值分别与/>个子集合内的第一工位、第二工位和第三工位的总量比较,获得/>个子占比值;
子占比值的表达式为:
;
式中,为第/>个子占比值,/>为第/>个异常工位值,/>为预设单元数量;
去掉子占比值的最大值和最小值,将余下的个子占比值累加后求平均,获得有效缺失占比值;
有效缺失占比值的表达式为:
;
式中,为有效缺失占比值,/>为第/>个子占比值。
进一步的,编号混乱度的获取方法包括:
B1:从数据库内随机选择个健康数据管理单元,将/>个健康数据管理单元的编号作为标准编号,获得/>个标准编号;
B2:依次识别个健康数据管理单元内的第一工位、第二工位和第三工位的编号,分别获得/>个第一编号、/>个第二编号和/>个第三编号;
B3:将个第一编号、/>个第二编号和/>个第三编号分别与/>个标准编号进行一致对比;
B4:将存在第一编号、第二编号或第三编号与标准编号不一致的健康数据管理单元标记为混乱管理单元,并统计混乱管理单元的数量;
B5:将混乱管理单元的数量与健康数据管理单元的数量比较,获得子混乱度;
B6:重复执行次B1-B5的步骤,获得/>个子混乱度;
子混乱度的表达式为:
;
式中,为第/>个子混乱度,/>为第/>个混乱管理单元的数量;
B7:将个子混乱度累加后求平均,获得编号混乱度;
编号混乱度的表达式为:
;
式中,为编号混乱度,/>为第/>个子混乱度;
数据管理波动值的表达式为:
;
式中,为数据管理波动值,/>、/>、/>为权重因子,/>自然常数。
进一步的,数据库是否进入数据维稳模式的判定方法包括:
将数据管理波动值与预设的数据管理波动阈值/>比较;
当大于等于/>时,判定数据库进入数据维稳模式;
当小于/>时,判定数据库不进入数据维稳模式;
波动差值的生成方法包括:
将数据管理波动值与预设的数据管理波动阈值作差比较,获得波动差值;
波动差值的表达式为:
;
式中,为波动差值;
局部优化指令或整体优化指令的制定方法包括:
将波动差值与预设的波动差阈值/>比较;
当小于/>时,制定局部优化指令;
当大于等于/>时制定整体优化指令。
进一步的,局部补录操作的执行方法包括:
将同一个健康数据管理单元中第二工位的编号和第三工位的编号分别与第一工位的编号对比;
当第二工位的编号或第三工位的编号与第一工位的编号不一致时,剔除检测时间或检测值;
从数据库内筛选出编号与第一工位的编号一致的检测时间或检测值,补录到第二工位或第三工位上;
整体补录操作的执行方法包括:
将健康数据管理单元的编号和与之对应的第一工位的编号对比;
当健康数据管理单元的编号与第一工位的编号不一致时,剔除项目名称、检测时间和检测值;
从数据库内筛选出编号与健康数据管理单元的编号一致的项目名称、检测时间和检测值,分别补录到第一工位、第二工位和第三工位上。
基于大数据的健康管理系统,应用于数据库服务器,用于实现所述的基于大数据的健康管理方法,包括目标特征筛选模块、管理单元生成模块、波动值计算模块、对比分析模块、指令制定模块和指令执行模块,其中,各个模块之间通过有线或无线网络方式连接;
目标特征筛选模块,用于标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征;
管理单元生成模块,用于构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元;
波动值计算模块,用于采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值;
对比分析模块,用于基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式;
指令制定模块,用于在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令;
指令执行模块,用于根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作。
本发明基于大数据的健康管理方法及系统的技术效果和优点:
本发明通过标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征,构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元,采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值,基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式,在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令,根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作;相对于现有技术,可以从包含信息繁多且复杂的用户健康数据中筛选出所需的目标特征,并组合成独立的健康数据管理单元,实现用户健康数据的简化效果,并通过对健康数据管理单元内各个工位的状态识别和分析,从而准确的评估出用户健康数据当前的数据状态,并根据评估的数据状态,对用户健康数据进行针对性的优化补录处理,避免用户健康数据出现丢失、混乱或不匹配的现象,确保海量的用户健康数据都能够保持准确、稳定且完整的状态,也方便第三方对用户健康数据的管理、查询和调阅。
附图说明
图1为本发明实施例1提供的基于大数据的健康管理方法的流程示意图;
图2为本发明实施例2提供的基于大数据的健康管理系统的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:请参阅图1所示,本实施例所述基于大数据的健康管理方法,应用于数据库服务器,包括:
S1:标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征;
健康特征是指用户健康数据中所包含的能够表示用户全部健康状态的信息,通过获取健康特征可以较为全面的识别用户健康数据所包含和指代的用户健康真实信息;
健康特征的标记方法包括:
通过自然语言处理技术对数据库内的用户健康数据进行语义处理,获得带有关键字的语义词组;
逐一提取语义词组的关键字,并对关键字进行识别;关键字是指语义词组中可以表示用户健康状态的字词,由于表示用户健康状态的字词类型不唯一,所以关键字的类型也不唯一;
将关键字为姓名、性别、年龄、项目名称、检测时间或检测值所在的语义词组标记为健康特征;
需要说明的是,姓名为用户健康数据对应的用户名字,性别为用户健康数据对应的用户性别,年龄为用户健康数据对应的用户年龄,项目名称表示用户健康数据中对应的用户健康检测项目名称,检测时间和检测值分别对应用户健康检测项目名称的检测具体时刻和检测具体数值,通过姓名、性别、年龄、项目名称、检测时间和检测值的识别,可以对用户健康状态进行多样化的表示;
当健康特征获取之后,需要对健康特征进行再次筛选,以获取到能够直接表明用户健康状态的目标特征,使得目标特征可以作为后续用户健康管理的基础,同时也能够更大程度的反映用户健康状态,而在对健康特征进行筛选时,需要遵守筛选准则,以确保目标特征的筛选准确性;
筛选准则为:保留语义词组中直接表示用户健康状态信息的目标字词,并剔除其余的无用字词;
目标特征的筛选方法包括:
将姓名、性别和年龄标记为无用字词,将项目名称、检测时间和检测值标记为目标字词;无用字词是表示该字词并不能直接参与后续用户健康数据的管理,而不是说无用没有任何意义,同样的,目标字词是表示该字词能够直接参与后续用户健康数据的管理;
将健康特征对应的语义词组中的关键字与无用字词和目标字词匹配;
剔除掉语义词组中的关键字与无用字词匹配一致的健康特征,将关键字与目标字词匹配一致的语义词组标记为目标词组;
基于计算机视觉技术选定目标词组中为项目名称、检测时间或检测值的目标区域,并剔除掉目标区域之外的字词,余下的项目名称、检测时间或检测值即为目标特征;当目标词组中剔除掉无用字词后,则剩下的字词全部为目标字词,从而可以从字词较多的语义词组中获取简洁且准确的信息,方便后续的用户健康数据的管理;
S2:构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元;
健康数据管理单元是指用于对目标特征对应的信息进行分类储存和管理的最小数据集合,通过生成健康数据管理单元,能够方便且直观的观察到用户健康状态的重要数据,并基于健康数据管理单元可以采集后续对用户健康数据进行管理维护的数据基础;
健康数据管理单元的生成方法包括:
构建具有三个独立工位且零容量的三个工位,三个工位分别标记为第一工位、第二工位和第三工位;相互独立的工位可以确保相邻工位之间不会发生相互干扰的现象,确保每一个工位之间的独立自主性,零容量也能够确保工位初始状态下没有残留信息,从而不会对后续导入的目标特征造成干扰影响;
将目标特征中的项目名称和检测时间分别导入到第一工位和第二工位中,形成填充后的第一工位和第二工位;
标记第二工位中的检测时间所在的时刻,并从目标特征中筛选与检测时间所在的时刻一致的检测值,将筛选到的检测值导入第三工位中,形成填充后的第三工位;由于检测值是在不同的项目名称处于不同检测时间下的检测结果,所有检测值的正确与否直接影响到用户健康数据的真实与否,所有检测值需要在项目名称和检测时间都导入到对应位置后,再单独对检测值进行导入,以避免检测值在导入时发生偏差、错误的现象;
将填充后的第一工位、第二工位和第三工位均备注同一个编号后汇总,获得无备注管理单元;
将无备注管理单元备注上与第一工位、第二工位和第三工位一致的编号,获得健康数据管理单元;
S3:采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值;
综合质量参数是指能表示健康数据管理单元中的数据整体稳定程度的多样化数据,通过采集综合质量参数,可以对健康数据管理单元内的数据稳定性的影响参数进行准确采集,并为后续的判断和管理提供支持;
综合质量参数包括成功匹配衰减值、有效缺失占比值和编号混乱度;
成功匹配衰减值是指健康数据管理单元中各工位编号能够成功匹配的概率的降低程度,当成功匹配衰减值越大时,说明健康数据管理单元中各工位编号成功匹配的概率越大,此时健康数据管理单元内的数据管理稳定性的波动幅度会越小,则数据管理波动值越小;
成功匹配衰减值的获取方法包括:
A1:从数据库内随机选择个健康数据管理单元,分别获得/>个第一工位、/>个第二工位和/>个第三工位;
A2:以个第一工位的编号为基础,分别将/>个第二工位的编号和/>个第三工位的编号依次与/>个第一工位的编号对比;由于第一工位内导入的用户健康数据为项目名称,而项目名称是检测时间和检测值的前提,因此将第一工位的编号作为基础,从而便于后续第二工位的编号和第三工位的编号对比操作;
A3:将第一工位的编号、第二工位的编号和第三工位的编号一致的健康数据管理单元标记为成功匹配单元,并统计成功匹配单元的数量;
A4:将成功匹配单元的数量与健康数据管理单元的数量比较,获得成功匹配率;
A5:重复执行次A1-A4的步骤,获得/>个成功匹配率;
成功匹配率的表达式为:
;
式中,为第/>个成功匹配率,/>为第/>个成功匹配单元的数量;
A6:将第个成功匹配率与第/>个成功匹配率作差比较,获得/>成功匹配差值;
成功匹配差值的表达式为:
;
式中,为第/>个成功匹配差值,/>为第/>个成功匹配率;
A7:将个成功匹配差值累加后求平均,获得成功匹配衰减值;
成功匹配衰减值的表达式为:
;
式中,为成功匹配衰减值,/>为第/>个成功匹配差值;
有效缺失占比值是指健康数据管理单元中的三个工位中存在数据缺失的工位数量与所有工位数量之间的占比大小,当有效缺失占比值越大时,说明三个工位中存在数据缺失的工位数量越多,则数据管理波动值越大;
有效缺失占比值的获取方法包括:
以预设单元数量为标准,将数据库内的所有健康数据管理单元等分为个子集合;预设单元数量是用于对子集合内健康数据管理单元的数量进行限制的数值依据,使得每一个子集合内的健康数据管理单元的数量能够保持在相对合理的范围内,避免每一个子集合内健康数据管理单元的数量大小不一而造成采集数据样本数量的不一致,从而可以提高数据采集量的一致性,进而提高数据计算准确度;预设单元数量基于数据库内健康数据管理单元的总量进行比例设置,示例性的,预设单元数量为数据库内健康数据管理单元的总量的十分之一;
分别识别个子集合内的健康数据管理单元中第一工位、第二工位和第三工位的容量;
将容量为零的第一工位、第二工位和第三工位标记为异常工位,并统计异常工位的数量,获得个异常工位值;当工位的容量为零时,说明该工位上没有用户健康数据,则该工位上出现了数据缺失的现象;
将个异常工位值分别与/>个子集合内的第一工位、第二工位和第三工位的总量比较,获得/>个子占比值;
子占比值的表达式为:
;
式中,为第/>个子占比值,/>为第/>个异常工位值,/>为预设单元数量;
去掉子占比值的最大值和最小值,将余下的个子占比值累加后求平均,获得有效缺失占比值;去掉子占比值的最大值和最小值的方式可以对大量容量为零或极少量容量为零的工位因划分在一个子集合内而导致子占比值过大或过小的现象进行剔除,从而保证子占比值的稳定性,提高后续有效缺失占比值的计算准确性;
有效缺失占比值的表达式为:
;
式中,为有效缺失占比值,/>为第/>个子占比值;
编号混乱度是指健康数据管理单元中三个工位上编号处于不一致情况下的混乱程度,当编号混乱度越大,说明健康数据管理单元内三个工位上的编号不一致的数量较多,则数据管理波动值越大;
编号混乱度的获取方法包括:
B1:从数据库内随机选择个健康数据管理单元,将/>个健康数据管理单元的编号作为标准编号,获得/>个标准编号;标准编号是作为后续各个工位编号对比的标准和基础,由于健康数据管理单元的编号有且只有一个,而每一个健康数据管理单元中工位的编号有三个,因此将健康数据管理单元的编号作为标准,并对工位编号是否出现混乱现象进行评判;
B2:依次识别个健康数据管理单元内的第一工位、第二工位和第三工位的编号,分别获得/>个第一编号、/>个第二编号和/>个第三编号;
B3:将个第一编号、/>个第二编号和/>个第三编号分别与/>个标准编号进行一致对比;
B4:将存在第一编号、第二编号或第三编号与标准编号不一致的健康数据管理单元标记为混乱管理单元,并统计混乱管理单元的数量;每一个混乱管理单元内的编号不一致的数量可以为一个、两个或三个,只要出现了编号不一致的情况,就会被标记为混乱管理单元;
B5:将混乱管理单元的数量与健康数据管理单元的数量比较,获得子混乱度;
B6:重复执行次B1-B5的步骤,获得/>个子混乱度;
子混乱度的表达式为:
;
式中,为第/>个子混乱度,/>为第/>个混乱管理单元的数量;
B7:将个子混乱度累加后求平均,获得编号混乱度;
编号混乱度的表达式为:
;
式中,为编号混乱度,/>为第/>个子混乱度;
数据管理波动值是健康数据管理单元中三个工位发生丢失、混乱或不匹配现象严重程度的数值表示,当数据管理波动值越大时,说明健康数据管理单元中用户健康数据发生丢失、混乱或不匹配的程度越严重,则用户健康数据的波动幅度越大;
数据管理波动值的表达式为:
;
式中,为数据管理波动值,/>、/>、/>为权重因子,/>自然常数;
其中,,示例性的,/>为0.42,/>为0.33,/>为0.25;
需要说明的是,权重因子的大小是为了将各个数据进行量化得到的一个具体的数值,便于后续比较,关于权重因子的大小,取决于综合质量参数的多少及本领域技术人员对每一组综合质量参数初步设定对应的权重因子;
S4:基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式;
数据维稳模式是指当用户健康数据出现较大波动幅度的现象,需要对健康数据管理单元内的用户健康数据制定维持稳定措施时的模式,当数据库进入数据维稳模式时,此时就需要对健康数据管理单元内的用户健康数据进行后续维稳措施的制定;
数据库是否进入数据维稳模式的判定方法包括:
将数据管理波动值与预设的数据管理波动阈值/>比较;预设的数据管理波动阈值是用于对数据管理波动值大小进行区分的数值依据,从而可以将数据管理波动值的大小进行准确区分,判定出健康数据管理单元内的用户健康数据出现波动的幅度是大还是小;预设的数据管理波动阈值通过采集历史大量的数据库进入数据维稳模式时对应的数据管理波动值后,经由系数优化后得到的;
当大于等于/>时,说明数据管理波动值大于等于预设的数据管理波动阈值,此时健康数据管理单元内的用户健康数据出现波动的幅度较大,则判定数据库进入数据维稳模式;
当小于/>时,说明数据管理波动值小于预设的数据管理波动阈值,此时健康数据管理单元内的用户健康数据出现波动的幅度较小,则判定数据库不进入数据维稳模式;/>
S5:在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令;
当数据库处于数据维稳模式时,此时的数据管理波动值大于等于预设的数据管理波动阈值,则两者之间会具有数据差,而两者之间的数据差则被称为波动差值,从而对数据管理波动值与预设的数据管理波动阈值之间的差距进行大小表示;
波动差值的生成方法包括:
将数据管理波动值与预设的数据管理波动阈值作差比较,获得波动差值;
波动差值的表达式为:
;
式中,为波动差值;
当波动差值生成后,需要根据波动差值的大小,制定出与健康数据管理单元相适应的优化指令,将丢失、混乱或不匹配的用户健康数据进行优化处理,提高数据库内健康数据管理单元的平稳度,而为了实现具体优化指令的制定,就需要对波动差值的大小进行具体细分,进而实现局部优化指令和整体优化指令的制定;
局部优化指令或整体优化指令的制定方法包括:
将波动差值与预设的波动差阈值/>比较;预设的波动差阈值是用于将波动差值进行大小区分的数值依据,使得波动差值能够分别对应不同优化指令,并将波动差值的优化指令区分为局部优化指令或整体优化指令;预设的波动差阈值通过采集历史大量的制定局部优化指令时波动差值的最大值和制定整体优化指令的波动差值的最小值后,求最大值和最小值的平均值后,经由多次系数调试而来的;
当小于/>时,说明波动差值小于预设的波动差阈值,此时健康数据管理单元的波动幅度没有达到需要整体优化的范围,仅需要对局部进行优化处理,则制定局部优化指令;
当大于等于/>时,说明波动差值大于等于预设的波动差阈值,此时健康数据管理单元的波动幅度达到了需要整体优化的范围,需要对整体进行优化处理,则制定整体优化指令;
S6:根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作;
当制定了局部优化指令和整体优化指令时,说明健康数据管理单元内的用户健康数据出现了丢失、混乱或不匹配的现象,此时该健康数据管理单位则被标记为异常的健康数据管理单元,需要对异常的健康数据管理单元中丢失、混乱或不匹配的用户健康数据进行补录操作;
当执行局部补录操作时,需要对健康数据管理单元内对应的工位上的用户健康数据进行局部补录即可;
局部补录操作的执行方法包括:
将同一个健康数据管理单元中第二工位的编号和第三工位的编号分别与第一工位的编号对比;
当第二工位的编号与第一工位的编号不一致时,剔除第二工位上的检测时间,并从数据库内筛选出编号与第一工位的编号一致的检测时间,补录到第二工位上;
当第三工位的编号与第一工位的编号不一致时,剔除第三工位上的检测值,从数据库内筛选出编号与第一工位的编号一致的检测值,补录到第三工位上;
当执行整体补录操作时,需要对健康数据管理单元内所有工位上的用户健康数据进行整体补录;
整体补录操作的执行方法包括:
将健康数据管理单元的编号和与之对应的第一工位的编号对比;
当健康数据管理单元的编号与第一工位的编号不一致时,剔除第一工位、第二工位和第三工位上的项目名称、检测时间和检测值;
从数据库内筛选出编号与健康数据管理单元的编号一致的项目名称、检测时间和检测值;
将筛选到的项目名称、检测时间和检测值分别对应补录到第一工位、第二工位和第三工位上;
本实施例中,通过标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征,构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元,采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值,基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式,在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令,根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作;相对于现有技术,可以从包含信息繁多且复杂的用户健康数据中筛选出所需的目标特征,并组合成独立的健康数据管理单元,实现用户健康数据的简化效果,并通过对健康数据管理单元内各个工位的状态识别和分析,从而准确的评估出用户健康数据当前的数据状态,并根据评估的数据状态,对用户健康数据进行针对性的优化补录处理,避免用户健康数据出现丢失、混乱或不匹配的现象,确保海量的用户健康数据都能够保持准确、稳定且完整的状态,也方便第三方对用户健康数据的管理、查询和调阅。
实施例2:请参阅图2所示,本实施例未详细叙述部分见实施例1描述内容,提供基于大数据的健康管理系统,应用于数据库服务器,用于实现基于大数据的健康管理方法,包括目标特征筛选模块、管理单元生成模块、波动值计算模块、对比分析模块、指令制定模块和指令执行模块,其中,各个模块之间通过有线或无线网络方式连接;
目标特征筛选模块,用于标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征;
管理单元生成模块,用于构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元;
波动值计算模块,用于采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值;
对比分析模块,用于基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式;
指令制定模块,用于在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令;
指令执行模块,用于根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.基于大数据的健康管理方法,应用于数据库服务器,其特征在于,包括:
S1:标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征;
S2:构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元;
S3:采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值;
S4:基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式;若数据库进入数据维稳模式,执行S5-S6;若数据库不进入数据维稳模式,重复执行S3-S4;
S5:在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令;
S6:根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作。
2.根据权利要求1所述的基于大数据的健康管理方法,其特征在于,所述健康特征的标记方法包括:
通过自然语言处理技术对数据库内的用户健康数据进行语义处理,获得带有关键字的语义词组;
逐一提取语义词组的关键字,并对关键字进行识别;
将关键字为姓名、性别、年龄、项目名称、检测时间或检测值所在的语义词组标记为健康特征。
3.根据权利要求2所述的基于大数据的健康管理方法,其特征在于,所述筛选准则为:保留语义词组中直接表示用户健康状态信息的目标字词,并剔除其余的无用字词;
目标特征的筛选方法包括:
将姓名、性别和年龄标记为无用字词,将项目名称、检测时间和检测值标记为目标字词;
将健康特征对应的语义词组中的关键字与无用字词和目标字词匹配;
剔除掉语义词组中的关键字与无用字词匹配一致的健康特征,将关键字与目标字词匹配一致的语义词组标记为目标词组;
基于计算机视觉技术选定目标词组中为项目名称、检测时间或检测值的目标区域,并剔除掉目标区域之外的字词,余下的项目名称、检测时间或检测值即为目标特征。
4.根据权利要求3所述的基于大数据的健康管理方法,其特征在于,所述健康数据管理单元的生成方法包括:
构建具有三个独立工位且零容量的三个工位,三个工位分别标记为第一工位、第二工位和第三工位;
将目标特征中的项目名称和检测时间分别导入到第一工位和第二工位中,形成填充后的第一工位和第二工位;
标记第二工位中的检测时间所在的时刻,并从目标特征中筛选与检测时间所在的时刻一致的检测值,将筛选到的检测值导入第三工位中,形成填充后的第三工位;
将填充后的第一工位、第二工位和第三工位均备注同一个编号后汇总,获得无备注管理单元;
将无备注管理单元备注上与第一工位、第二工位和第三工位一致的编号,获得健康数据管理单元。
5.根据权利要求4所述的基于大数据的健康管理方法,其特征在于,所述综合质量参数包括成功匹配衰减值、有效缺失占比值和编号混乱度;
成功匹配衰减值的获取方法包括:
A1:从数据库内随机选择个健康数据管理单元,分别获得/>个第一工位、/>个第二工位和/>个第三工位;
A2:以个第一工位的编号为基础,分别将/>个第二工位的编号和/>个第三工位的编号依次与/>个第一工位的编号对比;
A3:将第一工位的编号、第二工位的编号和第三工位的编号一致的健康数据管理单元标记为成功匹配单元,并统计成功匹配单元的数量;
A4:将成功匹配单元的数量与健康数据管理单元的数量比较,获得成功匹配率;
A5:重复执行次A1-A4的步骤,获得/>个成功匹配率;
成功匹配率的表达式为:
;
式中,为第/>个成功匹配率,/>为第/>个成功匹配单元的数量;
A6:将第个成功匹配率与第/>个成功匹配率作差比较,获得/>成功匹配差值;
成功匹配差值的表达式为:
;
式中,为第/>个成功匹配差值,/>为第/>个成功匹配率;
A7:将个成功匹配差值累加后求平均,获得成功匹配衰减值;
成功匹配衰减值的表达式为:
;
式中,为成功匹配衰减值,/>为第/>个成功匹配差值。
6.根据权利要求5所述的基于大数据的健康管理方法,其特征在于,所述有效缺失占比值的获取方法包括:
以预设单元数量为标准,将数据库内的所有健康数据管理单元等分为个子集合;
分别识别个子集合内的健康数据管理单元中第一工位、第二工位和第三工位的容量;
将容量为零的第一工位、第二工位和第三工位标记为异常工位,并统计异常工位的数量,获得个异常工位值;
将个异常工位值分别与/>个子集合内的第一工位、第二工位和第三工位的总量比较,获得/>个子占比值;
子占比值的表达式为:
;
式中,为第/>个子占比值,/>为第/>个异常工位值,/>为预设单元数量;
去掉子占比值的最大值和最小值,将余下的个子占比值累加后求平均,获得有效缺失占比值;
有效缺失占比值的表达式为:
;
式中,为有效缺失占比值,/>为第/>个子占比值。
7.根据权利要求6所述的基于大数据的健康管理方法,其特征在于,所述编号混乱度的获取方法包括:
B1:从数据库内随机选择个健康数据管理单元,将/>个健康数据管理单元的编号作为标准编号,获得/>个标准编号;
B2:依次识别个健康数据管理单元内的第一工位、第二工位和第三工位的编号,分别获得/>个第一编号、/>个第二编号和/>个第三编号;
B3:将个第一编号、/>个第二编号和/>个第三编号分别与/>个标准编号进行一致对比;
B4:将存在第一编号、第二编号或第三编号与标准编号不一致的健康数据管理单元标记为混乱管理单元,并统计混乱管理单元的数量;
B5:将混乱管理单元的数量与健康数据管理单元的数量比较,获得子混乱度;
B6:重复执行次B1-B5的步骤,获得/>个子混乱度;
子混乱度的表达式为:
;
式中,为第/>个子混乱度,/>为第/>个混乱管理单元的数量;
B7:将个子混乱度累加后求平均,获得编号混乱度;
编号混乱度的表达式为:
;
式中,为编号混乱度,/>为第/>个子混乱度;
数据管理波动值的表达式为:
;
式中,为数据管理波动值,/>、/>、/>为权重因子,/>自然常数。
8.根据权利要求7所述的基于大数据的健康管理方法,其特征在于,所述数据库是否进入数据维稳模式的判定方法包括:
将数据管理波动值与预设的数据管理波动阈值/>比较;
当大于等于/>时,判定数据库进入数据维稳模式;
当小于/>时,判定数据库不进入数据维稳模式;
波动差值的生成方法包括:
将数据管理波动值与预设的数据管理波动阈值作差比较,获得波动差值;
波动差值的表达式为:
;
式中,为波动差值;
局部优化指令或整体优化指令的制定方法包括:
将波动差值与预设的波动差阈值/>比较;
当小于/>时,制定局部优化指令;
当大于等于/>时制定整体优化指令。
9.根据权利要求8所述的基于大数据的健康管理方法,其特征在于,所述局部补录操作的执行方法包括:
将同一个健康数据管理单元中第二工位的编号和第三工位的编号分别与第一工位的编号对比;
当第二工位的编号或第三工位的编号与第一工位的编号不一致时,剔除检测时间或检测值;
从数据库内筛选出编号与第一工位的编号一致的检测时间或检测值,补录到第二工位或第三工位上;
整体补录操作的执行方法包括:
将健康数据管理单元的编号和与之对应的第一工位的编号对比;
当健康数据管理单元的编号与第一工位的编号不一致时,剔除项目名称、检测时间和检测值;
从数据库内筛选出编号与健康数据管理单元的编号一致的项目名称、检测时间和检测值,分别补录到第一工位、第二工位和第三工位上。
10.基于大数据的健康管理系统,应用于数据库服务器,用于实现权利要求1-9中任一项所述的基于大数据的健康管理方法,其特征在于,包括目标特征筛选模块、管理单元生成模块、波动值计算模块、对比分析模块、指令制定模块和指令执行模块,其中,各个模块之间通过有线或无线网络方式连接;
目标特征筛选模块,用于标记出用户健康数据中的健康特征,基于筛选准则,从健康特征中筛选出目标特征;
管理单元生成模块,用于构建零容量的工位,将目标特征对应导入工位内,生成健康数据管理单元;
波动值计算模块,用于采集数据库内健康数据管理单元的综合质量参数,基于综合质量参数,生成数据管理波动值;
对比分析模块,用于基于数据管理波动值和预设的数据管理波动阈值,判定数据库是否进入数据维稳模式;
指令制定模块,用于在数据维稳模式下,生成波动差值,基于波动差值,制定局部优化指令或整体优化指令;
指令执行模块,用于根据局部优化指令,对健康数据管理单元执行局部补录操作;根据整体优化指令,对健康数据管理单元执行整体补录操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410345634.4A CN117954036B (zh) | 2024-03-26 | 2024-03-26 | 基于大数据的健康管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410345634.4A CN117954036B (zh) | 2024-03-26 | 2024-03-26 | 基于大数据的健康管理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117954036A true CN117954036A (zh) | 2024-04-30 |
CN117954036B CN117954036B (zh) | 2024-06-07 |
Family
ID=90793088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410345634.4A Active CN117954036B (zh) | 2024-03-26 | 2024-03-26 | 基于大数据的健康管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117954036B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108877939A (zh) * | 2018-05-10 | 2018-11-23 | 重庆大学 | 一种具有智能特征提取功能的健康管理系统 |
WO2019070200A1 (en) * | 2017-10-05 | 2019-04-11 | Integral Technologies (S) Pte. Ltd. | HEALTH CARE INFORMATION MANAGEMENT SYSTEM |
WO2021135429A1 (zh) * | 2020-07-28 | 2021-07-08 | 平安科技(深圳)有限公司 | 基于知识图谱的健康信息推荐方法、装置、设备及介质 |
CN113345544A (zh) * | 2021-07-06 | 2021-09-03 | 北京京东拓先科技有限公司 | 一种病例评分方法、装置、设备及计算机可读存储介质 |
KR20220043618A (ko) * | 2020-09-29 | 2022-04-05 | 주식회사 셀바스에이아이 | 건강검진 정보를 이용한 건강 관리 방법 및 서버 |
WO2022121171A1 (zh) * | 2020-12-10 | 2022-06-16 | 平安科技(深圳)有限公司 | 相似文本匹配方法、装置、电子设备及计算机存储介质 |
CN115101202A (zh) * | 2022-06-13 | 2022-09-23 | 戎誉科技(深圳)有限公司 | 一种基于大数据的健康检测数据管理系统 |
CN115292391A (zh) * | 2022-10-10 | 2022-11-04 | 山东宝德龙健身器材有限公司 | 一种康复训练数据分析管理系统 |
CN116230223A (zh) * | 2022-12-23 | 2023-06-06 | 王力杰 | 一种基于人体运动数据的健康管理系统及方法 |
CN116469503A (zh) * | 2023-04-06 | 2023-07-21 | 海军军医大学第三附属医院东方肝胆外科医院 | 一种基于大数据的健康数据处理方法及服务器 |
-
2024
- 2024-03-26 CN CN202410345634.4A patent/CN117954036B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019070200A1 (en) * | 2017-10-05 | 2019-04-11 | Integral Technologies (S) Pte. Ltd. | HEALTH CARE INFORMATION MANAGEMENT SYSTEM |
CN108877939A (zh) * | 2018-05-10 | 2018-11-23 | 重庆大学 | 一种具有智能特征提取功能的健康管理系统 |
WO2021135429A1 (zh) * | 2020-07-28 | 2021-07-08 | 平安科技(深圳)有限公司 | 基于知识图谱的健康信息推荐方法、装置、设备及介质 |
KR20220043618A (ko) * | 2020-09-29 | 2022-04-05 | 주식회사 셀바스에이아이 | 건강검진 정보를 이용한 건강 관리 방법 및 서버 |
WO2022121171A1 (zh) * | 2020-12-10 | 2022-06-16 | 平安科技(深圳)有限公司 | 相似文本匹配方法、装置、电子设备及计算机存储介质 |
CN113345544A (zh) * | 2021-07-06 | 2021-09-03 | 北京京东拓先科技有限公司 | 一种病例评分方法、装置、设备及计算机可读存储介质 |
CN115101202A (zh) * | 2022-06-13 | 2022-09-23 | 戎誉科技(深圳)有限公司 | 一种基于大数据的健康检测数据管理系统 |
CN115292391A (zh) * | 2022-10-10 | 2022-11-04 | 山东宝德龙健身器材有限公司 | 一种康复训练数据分析管理系统 |
CN116230223A (zh) * | 2022-12-23 | 2023-06-06 | 王力杰 | 一种基于人体运动数据的健康管理系统及方法 |
CN116469503A (zh) * | 2023-04-06 | 2023-07-21 | 海军军医大学第三附属医院东方肝胆外科医院 | 一种基于大数据的健康数据处理方法及服务器 |
Non-Patent Citations (2)
Title |
---|
司富春;高燕;宋雪杰;: "加快推进中医药健康医疗大数据的开发与应用", 中医研究, no. 12, 10 December 2018 (2018-12-10) * |
张凡军: ""浅析大数据在健康管理中的应用研究进展"", 《医疗与信息化》, 8 May 2019 (2019-05-08), pages 138 * |
Also Published As
Publication number | Publication date |
---|---|
CN117954036B (zh) | 2024-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109101483B (zh) | 一种针对电力巡检文本的错误识别方法 | |
CN111709668A (zh) | 基于数据挖掘技术的电网设备参数风险识别方法及装置 | |
CN113704389A (zh) | 一种数据评估方法、装置、计算机设备及存储介质 | |
CN112990386A (zh) | 用户价值聚类方法、装置、计算机设备和存储介质 | |
CN116313158A (zh) | 患者安全esb业务数据的监测方法、装置及系统 | |
CN117154716B (zh) | 一种分布式电源接入配电网的规划方法及系统 | |
US20240168835A1 (en) | Hard disk failure prediction method, system, device and medium | |
CN112768058B (zh) | 一种计量信息类型的医疗数据的处理方法及装置 | |
CN117954036B (zh) | 基于大数据的健康管理方法及系统 | |
CN113961549A (zh) | 基于数据仓库的医疗数据整合方法及系统 | |
CN112434886A (zh) | 一种预测客户抵押贷款违约概率的方法 | |
CN116975520A (zh) | Ab实验的可信度评估方法、装置、设备和存储介质 | |
CN114496231B (zh) | 基于知识图谱的体质识别方法、装置、设备和存储介质 | |
CN110990384A (zh) | 一种大数据平台bi分析方法 | |
CN116126807A (zh) | 一种日志分析方法及相关装置 | |
CN113656652B (zh) | 医保违规行为的检测方法、装置、设备及存储介质 | |
CN113392086B (zh) | 基于物联网的医疗数据库构建方法、装置及设备 | |
CN113870987A (zh) | 一种医用智能床位柜的使用方法 | |
CN110010231A (zh) | 一种数据处理系统及计算机可读存储介质 | |
CN112100294A (zh) | 一种面向网络平台的用户关系分析方法、装置及相关设备 | |
CN112199388A (zh) | 陌电识别方法、装置、电子设备及存储介质 | |
CN112349364A (zh) | 一种临床数据的采集方法 | |
CN113780713A (zh) | 人员风险评估方法、终端以及存储装置 | |
CN114238630A (zh) | 一种不良事件影响因素分析系统及方法 | |
CN114493899A (zh) | 一种可认证状态的分类预测模型构建方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |