CN115274123B - 体能水平预测方法、系统、设备、介质及程序产品 - Google Patents
体能水平预测方法、系统、设备、介质及程序产品 Download PDFInfo
- Publication number
- CN115274123B CN115274123B CN202210830562.3A CN202210830562A CN115274123B CN 115274123 B CN115274123 B CN 115274123B CN 202210830562 A CN202210830562 A CN 202210830562A CN 115274123 B CN115274123 B CN 115274123B
- Authority
- CN
- China
- Prior art keywords
- methylation
- index data
- physical ability
- site
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开是关于一种体能水平预测方法、系统、设备、介质及程序产品,包括:获取待预测样本的特定甲基化位点水平和体能指标数据;将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平。本申请使用的特定甲基化位点水平和体能指标数据的特征简单易得,且输入到预训练的体能预测模型能够高效快速的完成计算,适合大规模人群下的预测和应用,且获取的预测值准确率较高。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种体能水平预测方法、系统、设备、介质及程序产品。
背景技术
随着测序技术的不断发展,研究者试图对人体各项生理表征背后的组学变化进行研究,试图解释其背后的机制机理。当前相关研究针对人的体能变化背后的组学动态变化已经揭示了随着体能相关锻炼的过程,人的体能能够得到改善,同时也会不断积累相关的组学变化,这使得基于组学数据辅助结合其他生理特征指标对体能状况进行预测成为可能。当前相关研究已经发现了大量生理特征指标和组学特征指标与体能之前存在密切关系。如基础血清生理指标对于体能的预测能力很弱,而相对的,皮质醇指标与体能恢复能力存在明显的正相关。睾酮与体能耐力具有明显的正相关关系,而硫酸脱氢表雄酮则与体能复原能力存在负相关。这些研究均表明,利用组学数据和生理特征数据来预测特定人员的体能指标是具有可行性的,而现有技术中还没有一种准确的组学数据和生理特征数据来预测特定人员的体能指标。
发明内容
为克服相关技术中存在的问题,本公开提供一种体能水平预测方法、系统、设备、介质及程序产品。
根据本公开实施例的第一方面,提供一种体能水平预测方法,包括:获取待预测样本的特定甲基化位点水平和体能指标数据;
将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平,
其中,所述体能预测模型是基于如下方式预先训练好的:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
在一些实施例中,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的,包括:
基于负二项式分布检验方法,获取所述平原汉族甲基化组与所述高原汉族甲基化组的第一甲基化差异位点集合;
基于负二项式分布检验方法,获取所述高原汉族甲基化组与所述高原藏族族甲基化组的第二甲基化差异位点集合;
基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平。
进一步的,基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平,包括:
获取所述第一甲基化差异位点集合和所述第二甲基化差异位点集合的交集位点;
对所述交集位点进行标记,获取所述交集位点的甲基化位点基因;
基于所述交集位点的甲基化位点基因获取所述特定甲基化位点水平。
在一些实施例中,预处理所述体能指标数据,包括:
将所述体能指标数据进行特征编码;
将特征编码后的所述体能指标数据进行归一化;
将归一化处理后的所述体能指标数据降维处理成一组线性独立的特征向量。
在一些实施例中,基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型,包括:
基于gene ontology及KEGG pathway数据库,筛选出所述特定甲基化位点水平中与缺氧环境相关的位点和基因;
多次随机获取体能指标数据中的三种数据,基于随机获取体能指标数据中的三种数据和所述特定甲基化位点水平中与缺氧环境相关的位点和基因对所述初步预测模型进行修正,获取所述体能预测模型。
根据本公开实施例的第二方面,提供一种体能水平预测模型训练方法,包括:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
根据本公开实施例的第三方面,提供一种体能水平预测系统,包括:
获取模块,用于获取待预测样本的特定甲基化位点水平和体能指标数据;
预测模块,用于将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平,
其中,所述体能预测模型是基于如下方式预先训练好的:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
根据本公开实施例的第四方面,提供一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现根据第一方面中任一所述的体能水平预测方法。
根据本公开实施例的第五方面,提供一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行根据第一方面中任一项所述的体能水平预测方法。
根据本公开实施例的第六方面,提供一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行根据第一方面中任一项所述的体能水平预测方法。
本公开的实施例提供的技术方案可以包括以下有益效果:本申请使用的特定甲基化位点水平和体能指标数据的特征简单易得,对环境和仪器的依赖程度小,更适应高原的作业环境,且在使用少量特征的前提下能够具有较高的准确性,且输入到预训练的体能预测模型能够高效快速的完成计算,适合大规模人群下的预测和应用,且获取的预测值准确率较高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种体能水平预测方法的流程图。
图2是根据一示例性实施例示出的一种体能水平预测系统的框图。
图3是根据一示例性实施例示出的一种用体能水平预测模型训练方法的流程图。
图4是根据一示例性实施例示出一种电子设备的内部结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种体能水平预测方法的流程图,如图1所示,包括:
在步骤S101中,获取待预测样本的特定甲基化位点水平和体能指标数据。
具体的,通过开发相应的甲基化测序芯片,可以高效快速的大批量获得受测人员的对应特定甲基化位点水平。同时获取受测人员的形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性共十个指标。其中,形态学主要对应三维,身高及体重;体成分对应胖瘦体重和体脂百分比,功能筛查对应功能性筛查检测,耐力对应3000米跑成绩,上肢力量对应握力和抛实心球;下肢力量对应立定跳远;爆发力对应纵跳摸高;速度对应30米冲刺;敏捷协调对应六边形跳和T形跑;柔韧性对应体前屈。
在步骤S102中,将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平。
具体的,将步骤S101获取的受测人员的特定甲基化位点水平和体能指标数据输入到预训练的体能预测模型中,输出为一个二分类的判别结果,分别表征受测人员在高原生活预设时间后其体能水平好或者不好。其中,体能预测模型是基于如下方式预先训练好的如图3所示的示出的一种体能水平预测模型训练方法的流程图,包括:
在步骤S301中,获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的。
具体的,结合具体实施例,获取300例汉族成年男性在平原和西藏高原生活时的体能指标数据和甲基化组数据,及300例藏族成年男性在西藏高原生活时的体能数据和甲基化组数据。基于被测甲基化位点的测序深度进行过滤,将测序深度读数小于10的位点去除,只保留每个测序样本中测序深度足够的甲基化位点。利用主成分分析方法,基于各个样本间共有的甲基化位点的甲基化水平进行主成分降维分析,并利用主成分1和主成分2绘制散点图,将其中明显偏离所属类别的离群点除去。确定之后对各个样本中的甲基化位点数据进行处理,利用bedtools等软件将单个甲基化位点的甲基化水平转化为基因的甲基化水平。同时通过平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定特定甲基化位点水平。
在一些实施例中,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的,包括:
基于负二项式分布检验方法,获取所述平原汉族甲基化组与所述高原汉族甲基化组的第一甲基化差异位点集合;
基于负二项式分布检验方法,获取所述高原汉族甲基化组与所述高原藏族族甲基化组的第二甲基化差异位点集合;
基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平。
具体的,通过比较平原生活汉族和高原生活汉族的甲基化位点甲基化水平差异,使用负二项式分布检验计算差异显著性,提取甲基化水平显著差异的甲基化位点,记作第一甲基化差异位点集合,即差异位点集合A。之后通过比较高原生活汉族和高原生活藏族的甲基化位点的甲基化水平差异,使用负二项式分布检验计算差异显著性,提取甲基化水平显著差异的甲基化位点,记作第二甲基化差异位点集合,即差异位点集合B。基于集合A和集合B获取特定甲基化位点水平。
进一步的,基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平,包括:
获取所述第一甲基化差异位点集合和所述第二甲基化差异位点集合的交集位点;
对所述交集位点进行标记,获取所述交集位点的甲基化位点基因;
基于所述交集位点的甲基化位点基因获取所述特定甲基化位点水平。
具体的,通过求取差异位点集合A和B的位点交集C,对交集C中的位点进行注释,选取交集C中甲基化位点所处基因,并计算基因对应的平均甲基化水平,进一步对甲基化组学数据进行降维,从而确定特定甲基化位点水平。
在步骤S302中,预处理所述体能指标数据。
具体的,由于体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性十个指标,为了对种类多样的体能指标数据进行整合,于是需要对体能指标数据进行预处理。
在一些实施例中,预处理所述体能指标数据,包括:
将所述体能指标数据进行特征编码;
将特征编码后的所述体能指标数据进行归一化;
将归一化处理后的所述体能指标数据降维处理成一组线性独立的特征向量。
具体的,将所有的不同的体能指标数据进行特征编码,使用主成分降维方法对体能数据进行处理,将所有体能数据数值化变为离散的数值,之后利用主成分分析法对体能数据构成的特征空间进行降维,并基于已有体能评价指标体系的先验知识判断各个指标对于体能能力评估的重要程度,并结合各个主成分进行投影映射,从而将主成分合并成为一个数值指标,该指标能够综合表征样本的体能能力的强弱,数值越高体能能力越强。这一指标被用于对样本的体能强度进行标签,将其分类为体能强和体能弱两类以用于后续分类。
在步骤S303中,基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型。
具体的,通过步骤S301和步骤S302获取的训练样本中的特定甲基化位点水平和预处理后的体能指标数据,构建训练集和预测集。且通过将样本随机抽取为70%的训练样本和30%的验证样本,并采取10倍交叉验证的方式对训练结果进行验证,通过在整体参数上预训练得到初步预测模型。
在步骤S304中,基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
具体的,为了使得初步预测模型更为准确,通过标定特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对初步预测模型进行修正,获取更为精确的体能预测模型。
在一些实施例中,基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型,包括:
基于gene ontology及KEGG pathway数据库,筛选出所述特定甲基化位点水平中与缺氧环境相关的位点和基因;
多次随机获取体能指标数据中的三种数据,基于随机获取体能指标数据中的三种数据和所述特定甲基化位点水平中与缺氧环境相关的位点和基因对所述初步预测模型进行修正,获取所述体能预测模型。
具体的,为了让预测模型计算规模合理并具有可使用性,分别对特定甲基化位点水平以及十种体能评测指标进行选择。其中,通过gene ontology及KEGG pathway中的功能注释,重点筛选特定甲基化位点水平中与缺氧环境相关的位点和基因。对于十种体能评测指标,每次随机选取三种体能指标作为模型的输入,通过反复迭代,获取体能预测模型。进而实现对高原生活后的体能状况的二分类预测,其预测结果为体能强或弱,这一体能预测模型的最终ROC指标为0.85。
图2是根据一示例性实施例示出的一种体能水平预测系统的框图。参照图2,该装置包括获取模块201,预测模块202。
获取模块201,用于获取待预测样本的特定甲基化位点水平和体能指标数据;
预测模块202,用于将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平,
其中,所述体能预测模型是基于如下方式预先训练好的:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
关于体能水平预测系统的具体限定可以参见上文中对于体能水平预测方法的限定,在此不再赘述。上述体能水平预测系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种电子设备,该电子设备可以是终端,其内部结构图可以如图4所示。该电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、近场通信(NFC)或其他技术实现。该计算机程序被处理器执行时以实现一种体能水平预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的体能水平预测系统可以实现为一种计算机程序的形式,计算机程序可在如图4所示的电子设备上运行。电子设备的存储器中可存储组成该体能水平预测系统的各个程序模块,比如,图2所示的获取模块201、预测模块202。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的一种体能水平预测方法中的步骤。
例如,图4所示的电子设备可以通过如图2所示的体能水平预测系统中的获取模块201,用于获取待预测样本的特定甲基化位点水平和体能指标数据;提取模块202,用于将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平。
本申请提供的电子设备通过存储器和处理器可以打开体能水平预测系统中的各个模块,本申请使用的特定甲基化位点水平和体能指标数据的特征简单易得,对环境和仪器的依赖程度小,更适应高原的作业环境,且在使用少量特征的前提下能够具有较高的准确性,且输入到预训练的体能预测模型能够高效快速的完成计算,适合大规模人群下的预测和应用,且获取的预测值准确率较高。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待预测样本的特定甲基化位点水平和体能指标数据;将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平。
本申请提供的非临时性计算机可读存储介质通过存储介质中的指令可以执行上述实施例中的一种体能水平预测方法,本申请使用的特定甲基化位点水平和体能指标数据的特征简单易得,对环境和仪器的依赖程度小,更适应高原的作业环境,且在使用少量特征的前提下能够具有较高的准确性,且输入到预训练的体能预测模型能够高效快速的完成计算,适合大规模人群下的预测和应用,且获取的预测值准确率较高。
在一个实施例中,提供了一种计算机程序产品,当计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行以下步骤:获取待预测样本的特定甲基化位点水平和体能指标数据;将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平。
本申请提供的计算机程序产品可以使移动终端执行上述实施例中的体能水平预测方法,本申请使用的特定甲基化位点水平和体能指标数据的特征简单易得,对环境和仪器的依赖程度小,更适应高原的作业环境,且在使用少量特征的前提下能够具有较高的准确性,且输入到预训练的体能预测模型能够高效快速的完成计算,适合大规模人群下的预测和应用,且获取的预测值准确率较高。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,比如静态随机存取存储器(Static Random Access Memory,SRAM)和动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个的技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种体能水平预测方法,其特征在于,包括:
获取待预测样本的特定甲基化位点水平和体能指标数据;
将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的,包括:
基于负二项式分布检验方法,获取所述平原汉族甲基化组与所述高原汉族甲基化组的第一甲基化差异位点集合;
基于负二项式分布检验方法,获取所述高原汉族甲基化组与所述高原藏族甲基化组的第二甲基化差异位点集合;
基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平;
其中,所述体能预测模型是基于如下方式预先训练好的:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
2.根据权利要求1所述的体能水平预测方法,其特征在于,基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平,包括:
获取所述第一甲基化差异位点集合和所述第二甲基化差异位点集合的交集位点;
对所述交集位点进行标记,获取所述交集位点的甲基化位点基因;
基于所述交集位点的甲基化位点基因获取所述特定甲基化位点水平。
3.根据权利要求1所述的体能水平预测方法,其特征在于,预处理所述体能指标数据,包括:
将所述体能指标数据进行特征编码;
将特征编码后的所述体能指标数据进行归一化;
将归一化处理后的所述体能指标数据降维处理成一组线性独立的特征向量。
4.根据权利要求1所述的体能水平预测方法,其特征在于,基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型,包括:
基于gene ontology及KEGG pathway数据库,筛选出所述特定甲基化位点水平中与缺氧环境相关的位点和基因;
多次随机获取体能指标数据中的三种数据,基于随机获取体能指标数据中的三种数据和所述特定甲基化位点水平中与缺氧环境相关的位点和基因对所述初步预测模型进行修正,获取所述体能预测模型。
5.一种体能水平预测模型训练方法,其特征在于,包括:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的,包括:
基于负二项式分布检验方法,获取所述平原汉族甲基化组与所述高原汉族甲基化组的第一甲基化差异位点集合;
基于负二项式分布检验方法,获取所述高原汉族甲基化组与所述高原藏族甲基化组的第二甲基化差异位点集合;
基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取体能预测模型。
6.一种体能水平预测系统,其特征在于,包括:
获取模块,用于获取待预测样本的特定甲基化位点水平和体能指标数据;
预测模块,用于将所述待预测样本的所述特定甲基化位点水平和所述体能指标数据输入到预训练的体能预测模型中,获取所述待预测样本在高原生活预设时间的体能水平,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的,包括:
基于负二项式分布检验方法,获取所述平原汉族甲基化组与所述高原汉族甲基化组的第一甲基化差异位点集合;
基于负二项式分布检验方法,获取所述高原汉族甲基化组与所述高原藏族甲基化组的第二甲基化差异位点集合;
基于所述第一甲基化差异位点集合和所述第二甲基化差异位点集合获取所述特定甲基化位点水平;
其中,所述体能预测模型是基于如下方式预先训练好的:
获取多个训练样本的特定甲基化位点水平和体能指标数据,所述体能指标数据至少包括形态学,体成分,功能筛查,耐力,上肢力量,下肢力量,爆发力,速度,敏捷协调,柔韧性,所述训练样本至少包括平原汉族、高原汉族、高原藏族,所述特定甲基化位点水平是基于平原汉族甲基化组、高原汉族甲基化组、高原藏族甲基化组确定的;
预处理所述体能指标数据;
基于所述特定甲基化位点水平和预处理后的所述体能指标数据构建训练集和预测集,以随机森林算法进行训练预测,以构建所述特定甲基化位点水平和预处理后的所述体能指标数据之间的映射关系作为初步预测模型;
基于所述特定甲基化位点水平中与缺氧环境相关的位点和基因及部分体能指标数据对所述初步预测模型进行修正,获取所述体能预测模型。
7.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现根据权利要求1-4中任一所述的体能水平预测方法。
8.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行根据权利要求1-4中任一项所述的体能水平预测方法。
9.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行根据权利要求1-4中任一项所述的体能水平预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210830562.3A CN115274123B (zh) | 2022-07-15 | 2022-07-15 | 体能水平预测方法、系统、设备、介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210830562.3A CN115274123B (zh) | 2022-07-15 | 2022-07-15 | 体能水平预测方法、系统、设备、介质及程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115274123A CN115274123A (zh) | 2022-11-01 |
CN115274123B true CN115274123B (zh) | 2023-03-24 |
Family
ID=83766443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210830562.3A Active CN115274123B (zh) | 2022-07-15 | 2022-07-15 | 体能水平预测方法、系统、设备、介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115274123B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101134981A (zh) * | 2006-09-01 | 2008-03-05 | 上海体育科学研究所 | 有氧运动能力相关的基因多态性及检测芯片和试剂盒 |
CN107247873A (zh) * | 2017-03-29 | 2017-10-13 | 电子科技大学 | 一种差异甲基化位点识别方法 |
CN111009290A (zh) * | 2019-12-12 | 2020-04-14 | 中国人民解放军总医院 | 高原适应性检测模型的训练方法、适应性识别方法和装置 |
CN114566224A (zh) * | 2022-03-09 | 2022-05-31 | 中国人民解放军总医院 | 一种用于鉴别或区分不同海拔人群的模型及其应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120040344A1 (en) * | 2009-01-30 | 2012-02-16 | Keith Malcolm Godfrey | PREDICTIVE USE OF CpG METHYLATION |
CN110364259B (zh) * | 2019-05-30 | 2022-05-31 | 中国人民解放军总医院 | 一种高原疾病预测方法、系统、介质及电子设备 |
CN112397204B (zh) * | 2020-11-16 | 2024-01-19 | 中国人民解放军空军特色医学中心 | 一种预测高原病的方法、装置、计算机设备和存储介质 |
CN113205883B (zh) * | 2021-04-12 | 2022-06-28 | 中国人民解放军陆军军医大学第二附属医院 | 由遗传信息和运动后生理参数预测心肺功能的方法及系统 |
-
2022
- 2022-07-15 CN CN202210830562.3A patent/CN115274123B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101134981A (zh) * | 2006-09-01 | 2008-03-05 | 上海体育科学研究所 | 有氧运动能力相关的基因多态性及检测芯片和试剂盒 |
CN107247873A (zh) * | 2017-03-29 | 2017-10-13 | 电子科技大学 | 一种差异甲基化位点识别方法 |
CN111009290A (zh) * | 2019-12-12 | 2020-04-14 | 中国人民解放军总医院 | 高原适应性检测模型的训练方法、适应性识别方法和装置 |
CN114566224A (zh) * | 2022-03-09 | 2022-05-31 | 中国人民解放军总医院 | 一种用于鉴别或区分不同海拔人群的模型及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN115274123A (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111243682A (zh) | 药物的毒性预测方法及装置、介质和设备 | |
CN109684118A (zh) | 异常数据的检测方法、装置、设备及计算机可读存储介质 | |
CN109376535B (zh) | 一种基于智能化符号执行的漏洞分析方法及系统 | |
CN110890137A (zh) | 一种化合物毒性预测模型建模方法、装置及其应用 | |
CN113299346B (zh) | 分类模型训练和分类方法、装置、计算机设备和存储介质 | |
CN112668809B (zh) | 建立自闭症儿童康复效果预测模型的方法 | |
CA3154621A1 (en) | Single cell rna-seq data processing | |
Stojmirović et al. | Robust and accurate data enrichment statistics via distribution function of sum of weights | |
CN115274123B (zh) | 体能水平预测方法、系统、设备、介质及程序产品 | |
CN117763126A (zh) | 知识检索方法、设备、存储介质及装置 | |
CN116564418B (zh) | 细胞类群相关性网络构建方法和装置、设备及存储介质 | |
US20200279148A1 (en) | Material structure analysis method and material structure analyzer | |
CN116864011A (zh) | 基于多组学数据的结直肠癌分子标志物识别方法及系统 | |
CN116525108A (zh) | 基于snp数据的预测方法、装置、设备及存储介质 | |
EP4143848B1 (en) | Patient stratification using latent variables | |
CN114936204A (zh) | 一种特征筛选方法、装置、存储介质及电子设备 | |
TWI762853B (zh) | 利用自動化機制挑選影響力指標的方法及電子裝置 | |
CN114300036A (zh) | 遗传变异致病性预测方法、装置、存储介质及计算机设备 | |
CN114678083A (zh) | 一种化学品遗传毒性预测模型的训练方法及预测方法 | |
Nair et al. | Hybridizing deep neural network for genes expression classification using histone modification | |
NZ766350A (en) | Sequencing data-based itd mutation ratio detecting apparatus and method | |
CN117787570B (zh) | 一种水环境重金属污染综合评价方法及系统 | |
CN114400049B (zh) | 肽段定量模型的训练方法、装置、计算机设备及存储介质 | |
CN111967254B (zh) | 相似问集合的评分方法、装置、计算机设备和存储介质 | |
CN115691669B (zh) | 一种基于量子卷积神经网络的蛋白质结构分类系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |