CN111477273A - 一种基于脑组织基因表达预测个体年龄信息的方法 - Google Patents

一种基于脑组织基因表达预测个体年龄信息的方法 Download PDF

Info

Publication number
CN111477273A
CN111477273A CN202010421537.0A CN202010421537A CN111477273A CN 111477273 A CN111477273 A CN 111477273A CN 202010421537 A CN202010421537 A CN 202010421537A CN 111477273 A CN111477273 A CN 111477273A
Authority
CN
China
Prior art keywords
age
brain tissue
regression model
individual
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010421537.0A
Other languages
English (en)
Inventor
刘伟
秦键
曾令李
沈辉
胡德文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010421537.0A priority Critical patent/CN111477273A/zh
Publication of CN111477273A publication Critical patent/CN111477273A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于脑组织基因表达预测个体年龄信息的方法、系统、介质及设备,属于年龄预测技术领域,用于解决目前年龄预测精度低的技术问题,采用的技术方案为:获取待预测个体的脑组织样本的全基因组表达数据;筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。本发明的基于脑组织基因表达预测个体年龄信息的方法、系统、介质及设备均具有准确率高、鲁棒性强、可以覆盖胚胎早期样本等优点。

Description

一种基于脑组织基因表达预测个体年龄信息的方法
技术领域
本发明涉及年龄预测技术领域,具体涉及一种基于脑组织基因表达预测个体年龄信息的方法、系统、介质及设备。
背景技术
个体年龄推断是法医学研究的重要部分。年龄信息不仅是追踪未知个体的重要线索,也是决定案件性质和当事人是否需要承担刑事责任的重要标准,可为缩小侦查范围提供有效参考信息。因此,多年以来,法医学研究者一直致力于寻找适用范围更广、准确性更高的年龄推断方法。
目前通过骨骼和牙齿等形态学特征推断年龄已经取得长足进展,但是这些方法不适用于对生物痕迹身源者的年龄推断。为充分满足法医实践需要,随着分子生物学的发展,一系列年龄相关的变化在分子水平上被检测到,并被尝试作为法医学年龄推断的候选标志物。
如2011年,Bocklandt S,Lin W,Sehl ME,et al.Epigenetic predictor of age[J].PLoS ONE,2011,6(6):e14821.使用Illumina Human Methylation 27芯片对34对同卵双胞胎的唾液样本(21~55岁)进行全基因组甲基化分析,发现了88个与年龄高度相关的基因座,建立了基于NPTX2、EDARADD和TOM1L1三个基因CpG位点甲基化的回归模型,详细步骤如下:
1)使用Illumina Human Methylation 27芯片对34对同卵双胞胎的唾液样本(21~55岁)进行全基因组甲基化分析;
2)通过计算各基因的甲基化水平与个体年龄的相关性,选择在多重比较中具有显著性的基因作为分类特征;
3)通过多重回归方法建立基于特征的年龄预测模型;
4)采用留一法评估年龄预测模型的性能,计算预测值与实际值之间的相关性和偏差程度。
目前基于DNA甲基化的年龄推断方法中需要进行DNA片段扩增,可能在扩增过程中引入错误。另外,DNA甲基化具有组织特异性,会受到疾病、营养条件和饮食、早期生活经历、衰老过程、污染暴露和社会环境等多种内在和外在因素的严重影响,甚至经常饮酒和吸烟会使基于甲基化的年龄估计偏高。由此可见,基于DNA甲基化的年龄预测模型会因组织来源、年龄阶段、性别、疾病、环境、生活方式和人群的不同而产生准确性和精度的变化,预测效能受限于生物系统甲基化修饰的波动幅度。由于衰老的生物复杂性,建立简单而准确的分子年龄推断方法并非易事。因此,要想真正提高年龄预测的准确度还需要引入不同预测指标和方法协同分析。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种准确率高、鲁棒性强、可以覆盖胚胎早期样本的基于脑组织基因表达预测个体年龄信息的方法、系统、介质及设备。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于脑组织基因表达预测个体年龄信息的方法,包括步骤:
S01、获取待预测个体的脑组织样本的全基因组表达数据;
S02、筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;
S03、将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。
作为上述技术方案的进一步改进:
在步骤S03中,所述年龄回归模型的建立过程为:
S31、提取多个样本个体中的脑组织样本,测量各脑组织样本的全基因组表达数据;
S32、记录各脑组织样本对应个体的年龄信息,计算所有全基因组表达数据与个体年龄之间的相关性,筛选具有显著相关关系的基因作为特征基因;
S33、根据训练集调整参数,在特征基因的基础上建立回归模型。
在步骤S33之后,还包括步骤S34、利用留一法评估年龄回归模型的性能,计算测试集中个体的预测年龄与实际年龄的相关系数,其中相关系数越大说明回归模型的性能更好。
在步骤34之后,还包括步骤S35、对年龄回归模型进行扰动试验,随机更换样本个体的年龄标签,重新建立年龄回归模型并计算性能指标,通过比较扰动试验与正确模型之间性能指标的差异计算扰动p值,如果扰动p值小于0.01,说明原年龄回归模型是有效的,否则原年龄回归模型的性能评估结果是无效的,原年龄回归模型建立不成功。
在步骤S35中之后,根据性能测试结果对年龄回归模型进行校正,调整模型中特征提取相关参数,重新建立年龄回归模型并进行年龄回归模型评估,直到达到预设结果。
在步骤S33中,利用支持向量机机器学习方法在特征基因的基础上建立年龄回归模型。
步骤S35中扰动试验的次数大于1000次。
本发明还公开了一种基于脑组织基因表达预测个体年龄信息的系统,包括
获取模块,用于获取待预测个体的脑组织样本的全基因组表达数据;
筛选模块,筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;
预测模块,将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。
本发明进一步公开了一种计算机存储介质,其上储存有计算机程序,所述计算机程序在被处理器运行时执行如上所述的基于脑组织基因表达预测个体年龄信息的方法的步骤。
本发明还公开了一种计算机设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述的基于脑组织基因表达预测个体年龄信息的方法的步骤。
与现有技术相比,本发明的优点在于:
(1)本发明的基于脑组织基因表达预测个体年龄信息的方法,基于全基因组的基因表达数据来筛选特征基本,相比少数特征基因能提供更多的有效特征和更好的预测准确率。
(2)本发明的基于脑组织基因表达预测个体年龄信息的方法,基于脑组织样本进行基因组表达数据采集,相比牙齿和骨骼样本具有更强的鲁棒性,并且可以覆盖胚胎早期样本。
(3)本发明的基于脑组织基因表达预测个体年龄信息的方法,基因表达数据相比甲基化数据,受个体所处环境的影响较小,能够更真实的反映个体的实际年龄,预测精度高。
附图说明
图1为本发明的方法在实施例的方法流程图。
图2为本发明中随p值改变的预测年龄与实际年龄的相关系数图。
图3为本发明中扰动试验和实际回归中预测年龄与实际年龄的相关系数比较图(柱状图为扰动试验结果,圆圈为实际回归结果)。
图4为本发明中SVR模型回归效果示意图(其中带环状阴影的点表示支持向量)。
图5为本发明中soft margin SVR的代价函数图。
具体实施方式
以下结合说明书附图和具体实施例对本发明作进一步描述。
如图1所示,本实施例的基于脑组织基因表达预测个体年龄信息的方法,包括步骤:
S01、获取待预测个体的脑组织样本的全基因组表达数据;
S02、筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;
S03、将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。
如图1所示,本实施例中,在步骤S03中,年龄回归模型的建立过程为:
S31、提取多个样本个体中的脑组织样本,采用基因芯片方法测量各脑组织样本的全基因组表达数据,对不同样本个体的基因芯片数据进行预处理和标定,使它们具有相同的均值和方差;
S32、记录样本个体对应的年龄信息,计算所有基因的表达量与个体年龄之间的相关性,筛选具有显著相关关系的基因作为特征基因;
S33、根据训练集调整参数,利用支持向量机等机器学习方法在特征基因的基础上建立年龄回归模型;
S34、利用留一法评估年龄回归模型的性能,计算测试集中样本个体的预测年龄与实际年龄的相关系数,相关系数越大说明年龄回归模型的性能更好;
S35、对年龄回归模型进行扰动试验,试验次数至少在1千次以上,随机更换样本个体的年龄标签,重新建立年龄回归模型并计算性能指标,通过比较扰动试验与正确模型之间性能指标的差异计算扰动p值,如果扰动p值小于0.01,说明原年龄回归模型是有效的,否则原年龄回归模型的性能评估结果是无效的,模型建立不成功;
S36、根据性能测试结果对年龄回归模型进行校正,调整模型中特征提取等相关参数,重新建立模型并进行模型评估,直到获得满意的结果。
本发明的基于脑组织基因表达预测个体年龄信息的方法,基于全基因组的基因表达数据来筛选特征基本,相比少数特征基因能提供更多的有效特征和更好的预测准确率。
本发明的基于脑组织基因表达预测个体年龄信息的方法,基于脑组织样本进行基因组表达数据采集,相比牙齿和骨骼样本具有更强的鲁棒性,并且可以覆盖胚胎早期样本。
本发明的基于脑组织基因表达预测个体年龄信息的方法,基因表达数据相比甲基化数据,受个体所处环境的影响较小,能够更真实的反映个体的实际年龄,预测精度高。
本发明经过数值模拟验证,具体为:
为了研究人脑转录体的时空动态,从艾伦脑图谱(http://www.brainspan.org)下载了人类大脑发育的基因表达数据集。只有临床上没有显著异常的捐赠者的大脑才被纳入研究(n=41;年龄,从胚胎8周至40岁;性别,22名男性和19名女性)。
为了准确地评估个体的相对功能成熟度,采用支持向量机模型对年龄进行回归分析(SVR),将年龄作为SVR脑成熟度预测的训练指标。当特征数目较大时,特征选择或降维是机器学习的重要步骤。计算所有基因的表达量与个体年龄之间的相关性,筛选具有显著相关关系的基因作为特征基因,以相关显著性p值作为特征筛选的可变参数。利用留一法评估回归模型的性能,计算测试集中个体的预测年龄与实际年龄的相关系数。改变显著性p值时对应留一法验证的相关性指标如图2所示,可以发现当选择p=10-43时,个体的预测年龄与实际年龄的相关系数达到最高,为0.95(p<0.001),相比已知的大部分其他方法预测准确率更高(基于牙齿和骨骼的年龄预测准确率为80%左右,基于DNA甲基化的预测准确率约为90%)。
所有留一法验证结果的统计显著性均采用置换试验进行评估。利用这种方法估计在零假设(无判别性)下分类器和预测精度的经验累积分布,即估计偶然观察到相同回归或预测性能的可能性。对于每个支持向量机分类器,将类标签(年龄)随机排列1000次,并对每一组随机类标签重新进行包括特征排序和筛选在内的整个回归过程。p值表示偶然观察到试验的准确度的概率,p值=((扰动试验的错误率<真实回归模型的错误率)的数目+1)/(扰动试验数量+1)。扰动试验结果如图3所示,扰动p值<0.001,说明原回归实验的结果是有效的。
其中支持向量回归模型(Support Vector Regression,SVR)是使用SVM来拟合曲线,做回归分析。分类和回归问题是有监督机器学习中最重要的两类任务。与分类的输出是有限个离散的值(例如上面的{-1,1}{-1,1})不同的是,回归模型的输出在一定范围内是连续的。
与SVM是使用一个条带来进行分类一样,SVR也是使用一个条带来拟合数据。这个条带的宽度可以自己设置,利用参数ε来控制,如图4所示。
在SVM模型中边界上的点以及两条边界内部违反margin的点被当做支持向量,并且在后续的预测中起作用;在SVR模型中边界上的点以及两条边界以外的点被当做支持向量,在预测中起作用。按照对偶形式的表示,最终的模型是所有训练样本的线性组合,其他不是支持向量的点的权重为0。下面补充SVR模型的代价函数的图形,如图5所示。
从图5中可以看到,在margin内部的这些点的error都为0,只有超出了margin的点才会计算error。因此SVR的任务就是利用一条固定宽度的条带(宽度由参数ε来控制)覆盖尽可能多的样本点,从而使得总误差尽可能的小。
本发明还公开了一种基于脑组织基因表达预测个体年龄信息的系统,包括
获取模块,用于获取待预测个体的脑组织样本的全基因组表达数据;
筛选模块,筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;
预测模块,将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。
本发明进一步公开了一种计算机存储介质,其上储存有计算机程序,所述计算机程序在被处理器运行时执行如上所述的基于脑组织基因表达预测个体年龄信息的方法的步骤。
本发明还公开了一种计算机设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述的基于脑组织基因表达预测个体年龄信息的方法的步骤。
本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现各种功能。存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件等。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (10)

1.一种基于脑组织基因表达预测个体年龄信息的方法,其特征在于,包括步骤:
S01、获取待预测个体的脑组织样本的全基因组表达数据;
S02、筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;
S03、将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。
2.根据权利要求1所述的基于脑组织基因表达预测个体年龄信息的方法,其特征在于,在步骤S03中,所述年龄回归模型的建立过程为:
S31、提取多个样本个体中的脑组织样本,测量各脑组织样本的全基因组表达数据;
S32、记录各脑组织样本对应个体的年龄信息,计算所有全基因组表达数据与个体年龄之间的相关性,筛选具有显著相关关系的基因作为特征基因;
S33、根据训练集调整参数,在特征基因的基础上建立回归模型。
3.根据权利要求2所述的基于脑组织基因表达预测个体年龄信息的方法,其特征在于,在步骤S33之后,还包括步骤S34、利用留一法评估年龄回归模型的性能,计算测试集中个体的预测年龄与实际年龄的相关系数,其中相关系数越大说明回归模型的性能更好。
4.根据权利要求3所述的基于脑组织基因表达预测个体年龄信息的方法,其特征在于,在步骤34之后,还包括步骤S35、对年龄回归模型进行扰动试验,随机更换样本个体的年龄标签,重新建立年龄回归模型并计算性能指标,通过比较扰动试验与正确模型之间性能指标的差异计算扰动p值,如果扰动p值小于0.01,说明原年龄回归模型是有效的,否则原年龄回归模型的性能评估结果是无效的,原年龄回归模型建立不成功。
5.根据权利要求4所述的基于脑组织基因表达预测个体年龄信息的方法,其特征在于,在步骤S35中之后,根据性能测试结果对年龄回归模型进行校正,调整模型中特征提取相关参数,重新建立年龄回归模型并进行年龄回归模型评估,直到达到预设结果。
6.根据权利要求2至5中任意一项所述的基于脑组织基因表达预测个体年龄信息的方法,其特征在于,在步骤S33中,利用支持向量机机器学习方法在特征基因的基础上建立年龄回归模型。
7.根据权利要求4所述的基于脑组织基因表达预测个体年龄信息的方法,其特征在于,步骤S35中扰动试验的次数大于1000次。
8.一种基于脑组织基因表达预测个体年龄信息的系统,其特征在于,包括
获取模块,用于获取待预测个体的脑组织样本的全基因组表达数据;
筛选模块,筛选全基因组表达数据中与年龄具有显著相关关系的基因,作为特征基因;
预测模块,将特征基因输入至预先建立的年龄回归模型中,预测待预测个体的年龄信息。
9.一种计算机存储介质,其上储存有计算机程序,其特征在于,所述计算机程序在被处理器运行时执行如权利要求1-7中任意一项所述的基于脑组织基因表达预测个体年龄信息的方法的步骤。
10.一种计算机设备,包括处理器和存储器,所述存储器上存储有计算机程序,其特征在于,所述计算机程序在被处理器运行时执行如权利要求1-7中任意一项所述的基于脑组织基因表达预测个体年龄信息的方法的步骤。
CN202010421537.0A 2020-05-18 2020-05-18 一种基于脑组织基因表达预测个体年龄信息的方法 Pending CN111477273A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010421537.0A CN111477273A (zh) 2020-05-18 2020-05-18 一种基于脑组织基因表达预测个体年龄信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010421537.0A CN111477273A (zh) 2020-05-18 2020-05-18 一种基于脑组织基因表达预测个体年龄信息的方法

Publications (1)

Publication Number Publication Date
CN111477273A true CN111477273A (zh) 2020-07-31

Family

ID=71763385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010421537.0A Pending CN111477273A (zh) 2020-05-18 2020-05-18 一种基于脑组织基因表达预测个体年龄信息的方法

Country Status (1)

Country Link
CN (1) CN111477273A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723254A (zh) * 2021-08-23 2021-11-30 三明学院 一种毛竹林分布的识别方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105745333A (zh) * 2012-11-09 2016-07-06 加利福尼亚大学董事会 用于预测年龄和鉴别诱发或者抑制早衰试剂的方法
CN106202989A (zh) * 2015-04-30 2016-12-07 中国科学院青岛生物能源与过程研究所 一种基于口腔微生物群落获得儿童个体生物年龄的方法
CN110392740A (zh) * 2017-01-25 2019-10-29 深圳华大生命科学研究院 确定人群样本生物指标集、预测生物学年龄的方法及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105745333A (zh) * 2012-11-09 2016-07-06 加利福尼亚大学董事会 用于预测年龄和鉴别诱发或者抑制早衰试剂的方法
CN106202989A (zh) * 2015-04-30 2016-12-07 中国科学院青岛生物能源与过程研究所 一种基于口腔微生物群落获得儿童个体生物年龄的方法
CN110392740A (zh) * 2017-01-25 2019-10-29 深圳华大生命科学研究院 确定人群样本生物指标集、预测生物学年龄的方法及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
0XNIRMAL: "《Predicting-Age-Gene-Expression》", 《HTTPS://GITHUB.COM/NKRISHN9/PREDICTING-AGE-GENE-EXPRESSION》 *
JACOB M. ZAHN 等;: "《AGEMAP: A Gene Expression Database for Aging in Mice》", 《PLOS GENETICS》 *
WILMA: "《Genome-wide age-related changes in DNA methylation and gene expression in human PBMCs》", 《SPRINGERLINK》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723254A (zh) * 2021-08-23 2021-11-30 三明学院 一种毛竹林分布的识别方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
Evin et al. The long and winding road: identifying pig domestication through molar size and shape
CA2877429C (en) Systems and methods for generating biomarker signatures with integrated bias correction and class prediction
CA2877430C (en) Systems and methods for generating biomarker signatures with integrated dual ensemble and generalized simulated annealing techniques
Kumar et al. Root phenotyping by root tip detection and classification through statistical learning
CN110604550B (zh) 一种肿瘤放疗后正常组织器官并发症预测模型的建立方法
Bossert et al. Gene tree estimation error with ultraconserved elements: an empirical study on Pseudapis bees
CN112183212B (zh) 一种杂草识别方法、装置、终端设备及可读存储介质
CN111710364B (zh) 一种菌群标记物的获取方法、装置、终端及存储介质
US10318892B2 (en) Feature selection algorithm under conditions of noisy data and limited recording
CN107463797B (zh) 高通量测序的生物信息分析方法及装置、设备及存储介质
Pink et al. Cranial nonmetric and morphoscopic data sets
CN112908414A (zh) 一种大规模单细胞分型方法、系统及存储介质
Bermejo Fish age classification based on length, weight, sex and otolith morphological features
CN111477273A (zh) 一种基于脑组织基因表达预测个体年龄信息的方法
Smart et al. A comprehensive appraisal of evolutionary diversity in venomous Asian coralsnakes of the genus Sinomicrurus (Serpentes: Elapidae) using Bayesian coalescent inference and supervised machine learning
Karaçalı Quasi-supervised learning for biomedical data analysis
CN116959585B (zh) 基于深度学习的全基因组预测方法
Wang et al. cDNA microarray adaptive segmentation
US20230245786A1 (en) Method for the prognosis of a desease following upon a therapeutic treatment, and corresponding system and computer program product
KR101771042B1 (ko) 질병 관련 유전자 탐색 장치 및 그 방법
Öz et al. Feature based quality assessment of DNA sequencing chromatograms
Fu et al. Mapping morphological shape as a high-dimensional functional curve
KR20170000707A (ko) 유전자 발현 데이터를 이용하여 표현형 특이적인 유전자 네트워크를 식별하는 방법 및 장치
Schwartz et al. Improving accuracy and power with transfer learning using a meta-analytic database
Wang et al. A comparison of fuzzy clustering approaches for quantification of microarray gene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200731

RJ01 Rejection of invention patent application after publication