CN113889274A - 一种孤独症谱系障碍的风险预测模型构建方法及装置 - Google Patents

一种孤独症谱系障碍的风险预测模型构建方法及装置 Download PDF

Info

Publication number
CN113889274A
CN113889274A CN202111182323.3A CN202111182323A CN113889274A CN 113889274 A CN113889274 A CN 113889274A CN 202111182323 A CN202111182323 A CN 202111182323A CN 113889274 A CN113889274 A CN 113889274A
Authority
CN
China
Prior art keywords
model
data table
asd
data
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111182323.3A
Other languages
English (en)
Other versions
CN113889274B (zh
Inventor
静进
李秀红
陈嘉洁
王馨
陈倩
戴美霞
林力孜
曹牧青
潘宁
林秀金
李海林
曾晶晶
刘斯宇
詹晓玲
金诚开
潘烁琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202111182323.3A priority Critical patent/CN113889274B/zh
Publication of CN113889274A publication Critical patent/CN113889274A/zh
Application granted granted Critical
Publication of CN113889274B publication Critical patent/CN113889274B/zh
Priority to PCT/CN2022/120423 priority patent/WO2023061174A1/zh
Priority to US18/232,363 priority patent/US20230386665A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种孤独症谱系障碍(ASD)的风险预测模型构建方法及装置,该方法包括根据样品集的病例信息,建立第一数据表和第二数据表,并根据预设的特征排列规则和标志分组规则,得到第一分组表集和第二分组表集,基于随机森林机器学习算法,对数据进行训练,并导入测试数据,得到第一最佳特征组合和第二特征组合;根据第一最佳特征组合和第二特征组合以及对第一数据表和第二数据表的分层抽样,并基于随机森林算法,分别得到第一模型和第二模型,经过组合后完成孤独症谱系障碍风险预测模型的构建。本发明能根据样品集中测试条目的数据,准确并快捷的构建模型,并对预测测试条目中的数据进行预测,解决了现有预测模型准确性不高的问题。

Description

一种孤独症谱系障碍的风险预测模型构建方法及装置
技术领域
本发明属于孤独症谱系障碍风险预测领域,特别涉及一种孤独症谱系障碍的风险预测模型的构建方法及装置。
背景技术
孤独症谱系障碍(Autism Spectrum Disorder,英文缩写ASD)是根据典型孤独症的核心症状进行扩展定义的广泛意义上的孤独症,是一种较为严重的神经发育障碍性疾病,主要有社交沟通障碍与狭隘、重复的兴趣或行为的核心症状。目前,孤独症谱系障碍的主要诊断方式仍依赖医生的临床观察、生长发育史的收集及精神检查,同时辅以多种筛查及症状评估量表对儿童的症状程度进行评估,例如眼球追踪技术、磁共振大脑成像技术等。
但目前的对儿童的症状程度进行评估的结果因人而异,没有统一的标准,而且在人工评估中,想要获得较准确的评估结果,对评估人员的专业性、经验性要求高,人工成本十分昂贵,现有技术中的用以预测ASD风险的模型大多存在评估条目多、耗时长等缺点,导致误差较大以及预测数据不准确等问题。
因此,本领域技术人员迫切需要一种能对ASD评估条目结果进行数据处理以及得出预测数据和结果的高准确度预测模型。
发明内容
本发明所要解决的技术问题在于,提供了一种孤独症谱系障碍的风险预测模型构建方法及装置,能有效提升现有技术中对ASD评估条目结果处理的高效性与所获得预测数据的准确性。
为了解决上述技术问题,本发明提供一种孤独症谱系障碍的风险预测模型构建方法,包括:
根据样品集的病例信息,建立第一数据表和第二数据表;其中,所述样品集包括:轻中度ASD病例样本、重度ASD病例样本和正常例样本;所述第一数据表记录了正常例样本与所有ASD病例样本的病例信息;所述第二数据表记录了轻中度ASD病例样本与重度ASD病例样本的病例信息;每个病例信息均包括特征、特征变量和标志;
根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集;其中,所述第一分组表集包括第一测试表集和第一训练表集,所述第二分组表集包括第二测试表集和第二训练表集;
根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合;
基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,并对所述第一模型和所述第二模型进行组合,完成ASD风险预测模型的构建。
进一步地,所述根据样品集的病例信息,建立第一数据表和第二数据表,具体为:
根据样品集中的轻中度ASD病例样本、重度ASD病例样本和正常例样本,进行ASD评估条目数据信息的收集与预处理,提取所述样品总体的特征、特征变量和标志,筛选出共有的特征变量,并根据预设的计分方式来计算各特征变量在ASD测试指标数据信息中的分数,筛选出能反应ASD测试指标数据信息得分情况的特征变量,建立第一数据表和第二数据表。
进一步地,所述根据预设的特征排列规则,分别对所述第一数据表、所述第二数据表执行特征排列,具体为:
基于预设的特征权重计算方式,计算数据表中各个特征的权重值,并依据各个特征的权重值对相应的特征进行排序,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,得到第一序列表集和第二序列表集;
其中,所述分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,具体为:
分别对特征排序后的第一数据表和第二数据表提取特征排列顺序前两个特征,分别组成第一子序列表和第二子序列表,随后分别依次向第一子序列表和第二子序列表添加特征排列顺序后一个的特征,直至第一数据表和第二数据表中所有特征分别都添加完毕,分别得到多个第一子序列表和多个第二子序列表,分别将多个第一子序列表和多个第二子序列表进行组合,分别得到第一序列表集和第二序列表集。
进一步地,所述根据预设的标志分组规则,分别对所述第一数据表、所述第二数据表执行标志分组,获得第一分组表集和第二分组表集,具体为:
根据预设的表格标志分组条件,分别对所述第一序列表集中所有第一子序列表和所述第二序列表集中所有第二子序列表进行标志的分层抽样,均分的标志比例相同,分别得到第一分组表集和第二分组表集。
进一步地,所述根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合,具体为:
根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;
将所述第一测试表集数据导入第一子模型集,得到每一个第一子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合;
将所述第二测试表集数据导入第二子模型集,得到每一个第二子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合。
进一步地,所述基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,具体为:
基于所述第一最佳特征组合,对第一数据表中符合第一最佳特征组合的特征进行分层抽样,结合随机森林机器学习算法,对分层抽样后的第一数据表进行迭代运算,得到第一模型;
基于所述第二最佳特征组合,对第二数据表中符合第二最佳特征组合的特征进行分层抽样,结合随机森林机器学习算法,对分层抽样后的第二数据表进行迭代运算,得到第二模型。
进一步地,所述对所述第一模型和所述第二模型进行组合测试,完成ASD风险预测模型的构建,具体为:
对分层抽样后的第一数据表和分层抽样后的第二数据表提取其中一个测试样品,将测试样品中符合第一最佳特征组合的数据信息输入至第一模型中,得到所述测试样品的第一预测概率;其中,所述第一预测概率包括所有ASD病例预测概率和正常例预测概率;
若所有ASD病例预测概率小于正常例预测概率,则判断结果为测试样品是正常例;若所有ASD病例大于正常例概率,则测试样品中符合第二最佳特征组合的数据信息输入至第二模型中,得到所述测试样品的第二预测概率;其中,所述第二预测概率包括轻中度ASD病例预测概率和重度ASD病例预测概率;
若轻中度ASD病例预测概率大于重度ASD病例预测概率,则判断结果为测试样品是轻中度ASD病例;若轻中度ASD病例预测概率小于重度ASD病例预测概率,则判断结果为测试样品是重度ASD病例;
若判断结果与测试样品的实际情况吻合,将所述第一模型和所述第二模型进行组合,即完成ASD风险预测模型的构建。
同时,本发明还提供了一种ASD的风险预测模型构建装置,包括:数据表建立模块、数据整理模块、特征提取模块和模型构建模块;
其中,所述数据表建立模块用于根据样品集的病例信息,建立第一数据表和第二数据表;其中,所述样品集包括:轻中度ASD病例样本、重度ASD病例样本和正常例样本;所述第一数据表记录了正常例样本与所有ASD病例样本的病例信息;所述第二数据表记录了轻中度ASD病例样本与重度ASD病例样本的病例信息;每个病例信息均包括特征、特征变量和标志;
所述数据整理模块用于根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集;其中,所述第一分组表集包括第一测试表集和第一训练表集,所述第二分组表集包括第二测试表集和第二训练表集;
所述特征提取模块用于根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合;
所述模型构建模块用于基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,并对所述第一模型和所述第二模型进行组合,完成ASD风险预测模型的构建。
进一步地,所述根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集,具体为:
基于预设的特征权重计算方式,计算数据表中各个特征的权重值,并依据各个特征的权重值对相应的特征进行排序,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,得到第一序列表集和第二序列表集;
其中,所述分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,具体为:分别对特征排序后的第一数据表和第二数据表提取特征排列顺序前两个特征,分别组成第一子序列表和第二子序列表,随后分别依次向第一子序列表和第二子序列表添加特征排列顺序后一个的特征,直至第一数据表和第二数据表中所有特征分别都添加完毕,分别得到多个第一子序列表和多个第二子序列表,分别将多个第一子序列表和多个第二子序列表进行组合,分别得到第一序列表集和第二序列表集;
根据预设的表格标志分组条件,分别对所述第一序列表集中所有第一子序列表和所述第二序列表集中所有第二子序列表进行标志的分层抽样,均分的标志比例相同,分别得到第一分组表集和第二分组表集。
进一步地,所述根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合,具体为:
根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;
将所述第一测试表集数据导入第一子模型集,得到每一个第一子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合;
将所述第二测试表集数据导入第二子模型集,得到每一个第二子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合。
实施本申请实施例,具有如下的有益效果:
本发明提供的一种孤独症谱系障碍的风险预测模型构建方法及装置,通过ASD的多方面评估条目作为特征信息数据,并对数据进行排序与分组,训练的模型能够解决现有技术中ASD风险预测模型存在的评估条目多、耗时长等问题,并在对评估条目的结果数据进行高效化以及准确化处理,提供了完整的分级结果预测,最后对模型进行组合与测试,进一步提高了风险预测模型输出预测结果的准确性。
附图说明
图1是本发明提供的孤独症谱系障碍的风险预测模型构建方法的一种实施例的流程示意图;
图2是本发明提供的孤独症谱系障碍的风险预测模型构建方法的一种实施例的第一序列表集和第二序列表集构建流程图;
图3是本发明提供的孤独症谱系障碍的风险预测模型构建方法的一种实施例的第一分组表集和第二分组表集构建流程图;
图4是本发明提供的孤独症谱系障碍的风险预测模型构建方法的一种实施例的第一特征组合和第二特征组合的建立流程图;
图5是本发明提供的孤独症谱系障碍的风险预测模型构建方法的一种实施例的第一模型和第二模型的构建流程图;
图6是本发明提供的孤独症谱系障碍的风险预测模型构建装置的一种实施例的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合本发明中的附图,对本发明实施例中的技术方案进一步详细说明。显然,此所描述的实施例仅是本发明一部分实施例,而不是全部实施例,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所用其他实施例,都属于本发明保护的范围。
请参阅图1,其是本发明实施例提供的一种孤独症谱系障碍的风险预测模型构建方法,包括以下步骤:
步骤S101:根据样品集的病例信息,建立第一数据表和第二数据表;其中,所述样品集包括:轻中度ASD病例样本、重度ASD病例样本和正常例样本;所述第一数据表记录了正常例样本与所有ASD病例样本的病例信息;所述第二数据表记录了轻中度ASD病例样本与重度ASD病例样本的病例信息;每个病例信息均包括特征、特征变量和标志。
优选地,在本实施例中,根据样品集中的轻中度ASD病例120例、重度ASD病例89例和正常例186例,进行ASD评估条目数据信息的收集与预处理,其中,ASD评估条目数据信息包括但不限于人口学特征、ASD常用症状评估量表、生活方式以及情绪状态。
优选地,在本实施例中,根据ASD评估条目数据信息,提取样品总体的特征、特征变量和标志,筛选出共有的特征变量509个,并根据预设的计分方式来计算各特征变量在ASD测试指标数据信息中的分数,筛选出能反应ASD测试指标数据信息得分情况的特征变量28个,剔除无效数据的样品,以特征为表列,以标志为表行,特征变量为表值,最终纳入数据分析共有251例,建立第一数据表和第二数据表,其中,正常例139例,轻中度ASD病例72例,重度ASD病例40例。
优选地,所述预设的计分方式依据ASD评估条目标准分数作为参照,对比计算样品实际评估条目的分数。
步骤S102:根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集;其中,所述第一分组表集包括第一测试表集和第一训练表集,所述第二分组表集包括第二测试表集和第二训练表集。
优选地,如图2所示,基于预设的特征权重计算方式,计算数据表中各个特征的权重值,并依据各个特征的权重值对相应的特征进行排序,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,得到第一序列表集和第二序列表集。
在本实施例中,如图2所示,将第一数据表中的28个特征与其标志放入随机森林机器学习算法中,以分类准确率作为特征重要性排序的依据以及特征权重的计算方式,得到28个特征权重值,并按照从大到小的顺序排列;将第二数据表中的28个特征与其标志放入随机森林机器学习算法中,以分类准确率作为特征重要性排序的依据,得到28个特征的重要性权重,按照从大到小的顺序排列。
优选地,如图2所示,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,具体为:分别对特征排序后的第一数据表和第二数据表提取特征排列顺序前两个特征,分别组成第一子序列表和第二子序列表,随后分别依次向第一子序列表和第二子序列表添加特征排列顺序后一个的特征,直至第一数据表和第二数据表中所有特征分别都添加完毕,分别得到多个第一子序列表和多个第二子序列表,分别将多个第一子序列表和多个第二子序列表进行组合,分别得到第一序列表集和第二序列表集。
在本实施例中,如图2所示,第一序列表集中共有27个第一子序列表,第1个的第一子序列表有2个特征,第2个的第一子序列表有3个特征,依次类推,第27个的第一子序列表有28个特征;第二序列表集共有27个第二子序列表,第1个的第二子序列表有2个特征,第2个的第二子序列表有3个特征,依次类推,第27个的第二子序列表有28个特征。
优选地,根据预设的表格标志分组条件,分别对所述第一序列表集中所有第一子序列表和所述第二序列表集中所有第二子序列表进行标志的分层抽样,均分的标志比例相同,分别得到第一分组表集和第二分组表集。
在本实施例中,如图3所示,根据预设的表格标志分组条件,对第一序列表集中所有的第一子序列表分别进行以标志为对象的分层抽样,均分成10组,每组中的正常例与所有ASD病例的比例相同。
具体地,在本实施例中,如图3左所示,i为分组的组别编号,每个第一子序列表都被分成10组,将每一个子序列表中第1组数据作为第一测试表,其余9组作为第一训练表;随后,将每一个子序列表中第2组数据作为第一测试表,其余9组作为第一训练表;依次类推,将每一个子序列表中第10组数据作为第一测试表,其余9组作为第一训练表;将所有的第一训练表和所有的第一测试表进行对应的组合,得到第一训练表集和第一测试表集,将第一训练表集和第一测试表集进行对应的组合,得到第一分组表集。
同理,具体地,在本实施例中,如图3右所示,j为分组的组别编号,每个第二子序列表都被分成10组,将每一个子序列表中第1组数据作为第二测试表,其余9组作为第二训练表;随后,将每一个子序列表中第2组数据作为第二测试表,其余9组作为第二训练表;依次类推,将每一个子序列表中第10组数据作为第二测试表,其余9组作为第二训练表;将所有的第二训练表和所有的第二测试表进行对应的组合,得到第二训练表集和第二测试表集,将第二训练表集和第二测试表集进行对应的组合,得到第二分组表集。
步骤S103:根据随机森林机器学习算法,分别将第一训练表集进行和第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入第二子模型集,得到第二最佳特征组合。
优选地,如图4所示,根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;将所述第一测试表集数据导入第一子模型集,得到每一个第一子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合。
在本实施例中,请参阅图4左,第一子模型集中共有270个第一子模型(每一组有27个,一共有10组),每个子模型对应于一个敏感度与特异度之和,对所属于同一组的第一训练集和第一测试集的敏感度与特异度之和求均值,再对比27个求均值后的敏感度与特异度之和,取最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合,即为12个特征的组合。
同理,优选地,将所述第二测试表集数据导入第二子模型集,得到每一个第二子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合。
在本实施例中,请参阅图4右,第二子模型集中共有270个第二子模型(每一组有27个,一共有10组),每个子模型对应于一个敏感度与特异度之和,对所属于同一组的第二训练集和第二测试集的敏感度与特异度之和求均值,再对比27个求均值后的敏感度与特异度之和,取最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合,即为3个特征的组合。
步骤S104基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,并对所述第一模型和所述第二模型进行组合,完成孤独症谱系障碍风险预测模型的构建。
优选地,基于所述第一最佳特征组合,对第一数据表中符合第一最佳特征组合的特征进行分层抽样,结合随机森林机器学习算法,对分层抽样后的第一数据表进行迭代运算,得到第一模型;基于所述第二最佳特征组合,对第二数据表中符合第二最佳特征组合的特征进行分层抽样,结合随机森林机器学习算法,对分层抽样后的第二数据表进行迭代运算,得到第二模型。
在本实施例中,请参阅图5,基于所述第一最佳特征组合和第二最佳特征组合,对第一数据表中符合第一最佳特征组合的特征进行筛选,对第二数据表中符合第二最佳特征组合的特征进行筛选,分别对筛选后的第一数据表和筛选后的第二数据表中所有标志进行分层抽样,均分成10组,每组中标志的数量是相同的;以第1组正常例、第1组轻中度ASD病例和第1组重度ASD病例的数据作为测试数据,剩余的9组正常例、9组轻中度ASD病例和9组重度ASD病例作为训练数据。
在本实施例中,请参阅图5,将9组轻中度ASD病例与9组重度ASD病例合并成9组所有ASD病例数据。在9组所有ASD病例数据和9组正常例数据中提取第一最佳特征组合中的12个特征的特征变量,输入至随机森林算法中,得到第一模型;在9组轻中度ASD病例数据和9组重度ASD病例数据中提取第二最佳特征组合中的3个特征的特征变量,输入至随机森林算法中,得到第二模型。
在本实施例中,请参阅图5,对第一模型和所述第二模型进行组合测试,完成ASD风险预测模型的构建。优选地,对分层抽样后的第一数据表和分层抽样后的第二数据表提取其中一个测试样品,将测试样品中符合第一最佳特征组合的数据信息输入至第一模型中,得到所述测试样品的第一预测概率;其中,所述第一预测概率包括所有ASD病例预测概率和正常例预测概率。
若所有ASD病例预测概率小于正常例预测概率,则判断结果为测试样品是正常例;若所有ASD病例大于正常例概率,则测试样品中符合第二最佳特征组合的数据信息输入至第二模型中,得到所述测试样品的第二预测概率;其中,所述第二预测概率包括轻中度ASD病例预测概率和重度ASD病例预测概率。
若轻中度ASD病例预测概率大于重度ASD病例预测概率,则判断结果为测试样品是轻中度ASD病例;若轻中度ASD病例预测概率小于重度ASD病例预测概率,则判断结果为测试样品是重度ASD病例。
根据所述测试样品的实际情况,所述判断结果与测试样品的实际情况吻合,即完成ASD风险预测模型的构建。
在本实施例中,请参阅图5,测试样品中有第1组正常例、第1组轻中度ASD病例以及第1组重度ASD病例;对于某一测试样品,先筛选出符合第一最佳特征组合中的12个特征的特征变量,输入至第一模型,得到该测试样品的第一预测概率,若预测的ASD病例预测概率小于正常例预测概率,则为正常例;若预测的ASD病例预测概率大于正常例预测概率,则先筛选出符合第二最佳特征组合中的3个特征的特征变量,输入至第二模型,得到该测试样品的第二预测概率,若轻中度ASD病例预测概率大于重度ASD病例预测概率,则该样本的模型预测结果为轻中度ASD病例;若轻中度ASD病例预测概率小于重度ASD病例预测概率,则为重度ASD病例。
在另一实施例中,重复执行步骤S104,以第2组正常例、第2组轻中度ASD病例和第2组重度ASD病例的数据作为测试数据,剩余的9组正常例、9组轻中度ASD病例和9组重度ASD病例作为训练数据。以此类推,直到以第10组正常例、第10组轻中度ASD病例和第10组重度ASD病例的数据作为测试数据,剩余的9组正常例、9组轻中度ASD病例和9组重度ASD病例作为训练数据。其中,执行该实施例时,会生成10组由第一模型和第二模型组成的ASD风险预测模型,并对10组ASD风险预测模型的敏感度、特异度分别计算均值,作为模型整体的敏感度、特异度,即模型的整体性能,重度ASD敏感度0.71,特异度0.95;轻中度ASD敏感度0.76,特异度0.90;正常儿童敏感度0.94,特异度0.91;计算10个模型的整体混淆矩阵并进行相加,得到模型的整体混淆矩阵A。
Figure BDA0003297766160000171
同时,请参阅图6,本发明还提供一种ASD的风险预测模型构建装置,包括:数据表建立模块601、数据整理模块602、特征提取模块603和模型构建模块604。
数据表建立模块601用于根据样品集的病例信息,建立第一数据表和第二数据表;其中,所述样品集包括:轻中度ASD病例样本、重度ASD病例样本和正常例样本;所述第一数据表记录了正常例样本与所有ASD病例样本的病例信息;所述第二数据表记录了轻中度ASD病例样本与重度ASD病例样本的病例信息;每个病例信息均包括特征、特征变量和标志。
数据整理模块602用于根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集;其中,所述第一分组表集包括第一测试表集和第一训练表集,所述第二分组表集包括第二测试表集和第二训练表集。
特征提取模块603用于根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合。
模型构建模块604用于基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,并对所述第一模型和所述第二模型进行组合测试,完成ASD风险预测模型的构建。
优选地,所述根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集,具体为:
基于分类准确率,计算数据表中各个特征的权重,并依据各个特征权重对相应的特征进行排序,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,得到第一序列表集和第二序列表集;其中,所述分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,具体为:分别对特征排序后的第一数据表和第二数据表提取特征排列顺序前两个特征,分别组成第一子序列表和第二子序列表,随后分别依次向第一子序列表和第二子序列表添加特征排列顺序后一个的特征,直至第一数据表和第二数据表中所有特征分别都添加完毕,分别得到多个第一子序列表和多个第二子序列表,分别将多个第一子序列表和多个第二子序列表进行组合,分别得到第一序列表集和第二序列表集。
进一步地,根据预设的表格标志分组条件,分别对所述第一序列表集中所有第一子序列表和所述第二序列表集中所有第二子序列表进行标志的分层抽样,均分的标志比例相同,分别得到第一分组表集和第二分组表集。
进一步地,所述根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合,具体为:根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;将所述第一测试表集数据导入第一子模型集,得到每一个第一子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合;将所述第二测试表集数据导入第二子模型集,得到每一个第二子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合。
实施本发明实施例,具有如下效果:
本发明实施例提供了一种孤独症谱系障碍的风险预测模型构建方法及装置,能够更准确地将预测ASD条目的信息进行进一步的优化与处理,数据表的建立使得数量繁多的评估条目能够更准确被调用,对数据的整理以及特征的提取,进一步地使预测结果的准确性提高,优化模型构建的步骤,模型构建过程涉及迭代,能保证每一数据在随机森林算法中能被精准的预测,提高了模型构建的便捷性以及模型预测准确性。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,包括:
根据孤独症谱系障碍(ASD)样品集的病例信息,建立第一数据表和第二数据表;其中,所述样品集包括:轻中度ASD病例样本、重度ASD病例样本和正常例样本;所述第一数据表记录了正常例样本与所有ASD病例样本的病例信息;所述第二数据表记录了轻中度ASD病例样本与重度ASD病例样本的病例信息;每个病例信息均包括特征、特征变量和标志;
根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集;其中,所述第一分组表集包括第一测试表集和第一训练表集,所述第二分组表集包括第二测试表集和第二训练表集;
根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合;
基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,并对所述第一模型和所述第二模型进行组合,完成ASD风险预测模型的构建。
2.如权利要求1所述的一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,所述根据样品集的病例信息,建立第一数据表和第二数据表,具体为:
根据样品集中的轻中度ASD病例样本、重度ASD病例样本和正常例样本,进行ASD评估条目数据信息的收集与预处理,提取样本的特征、特征变量和标志,筛选出共有的特征变量,并根据预设的计分方式来计算各特征变量在ASD测试指标数据信息中的分数,筛选出能反应ASD测试指标数据信息得分情况的特征变量,建立第一数据表和第二数据表。
3.如权利要求2所述的一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,所述根据预设的特征排列规则,分别对所述第一数据表、所述第二数据表执行特征排列,具体为:
基于预设的特征权重计算方式,计算数据表中各个特征的权重值,并依据各个特征的权重值对相应的特征进行排序,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,得到第一序列表集和第二序列表集;
其中,所述分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,具体为:
分别对特征排序后的第一数据表和第二数据表提取特征排列顺序前两个特征,分别组成第一子序列表和第二子序列表,随后分别依次向第一子序列表和第二子序列表添加特征排列顺序后一个的特征,直至第一数据表和第二数据表中所有特征分别都添加完毕,分别得到多个第一子序列表和多个第二子序列表,分别将多个第一子序列表和多个第二子序列表进行组合,分别得到第一序列表集和第二序列表集。
4.如权利要求3所述的一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,所述根据预设的标志分组规则,分别对所述第一数据表、所述第二数据表执行标志分组,获得第一分组表集和第二分组表集,具体为:
根据预设的表格标志分组条件,分别对所述第一序列表集中所有第一子序列表和所述第二序列表集中所有第二子序列表进行标志的分层抽样,均分的标志比例相同,分别得到第一分组表集和第二分组表集。
5.如权利要求4所述的一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,所述根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合,具体为:
根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;
将所述第一测试表集数据导入至第一子模型集,得到每一个第一子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合;
将所述第二测试表集数据导入至第二子模型集,得到每一个第二子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合。
6.如权利要求5所述的一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,所述基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,具体为:
基于所述第一最佳特征组合,对第一数据表中符合第一最佳特征组合的特征进行分层抽样,结合随机森林机器学习算法,对分层抽样后的第一数据表进行迭代运算,得到第一模型;
基于所述第二最佳特征组合,对第二数据表中符合第二最佳特征组合的特征进行分层抽样,结合随机森林机器学习算法,对分层抽样后的第二数据表进行迭代运算,得到第二模型。
7.如权利要求6所述的一种孤独症谱系障碍的风险预测模型构建方法,其特征在于,所述对所述第一模型和所述第二模型进行组合测试,完成ASD风险预测模型的构建,具体为:
对分层抽样后的第一数据表和分层抽样后的第二数据表提取其中一个测试样本,将测试样品中符合第一最佳特征组合的数据信息输入至第一模型中,得到所述测试样品的第一预测概率;其中,所述第一预测概率包括所有ASD病例预测概率和正常例预测概率;
若所有ASD病例预测概率小于正常例预测概率,则判断结果为测试样品是正常例;若所有ASD病例大于正常例概率,则测试样品中符合第二最佳特征组合的数据信息输入至第二模型中,得到所述测试样品的第二预测概率;其中,所述第二预测概率包括轻中度ASD病例预测概率和重度ASD病例预测概率;
若轻中度ASD病例预测概率大于重度ASD病例预测概率,则判断结果为测试样品是轻中度ASD病例;若轻中度ASD病例预测概率小于重度ASD病例预测概率,则判断结果为测试样品是重度ASD病例;
若判断结果与测试样品的实际情况吻合,将所述第一模型和所述第二模型进行组合,即完成ASD风险预测模型的构建。
8.一种孤独症谱系障碍的风险预测模型构建装置,其特征在于,包括:数据表建立模块、数据整理模块、特征提取模块和模型构建模块;
其中,所述数据表建立模块用于根据样品集的病例信息,建立第一数据表和第二数据表;其中,所述样品集包括:轻中度ASD病例样本、重度ASD病例样本和正常例样本;所述第一数据表记录了正常例样本与所有ASD病例样本的病例信息;所述第二数据表记录了轻中度ASD病例样本与重度ASD病例样本的病例信息;每个病例信息均包括特征、特征变量和标志;
所述数据整理模块用于根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集;其中,所述第一分组表集包括第一测试表集和第一训练表集,所述第二分组表集包括第二测试表集和第二训练表集;
所述特征提取模块用于根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合;
所述模型构建模块用于基于所述第一最佳特征组合和所述第二最佳特征组合,以及对第一数据表和第二数据表进行的分层抽样,结合随机森林算法,分别得到第一模型和第二模型,并对所述第一模型和所述第二模型进行组合,完成ASD风险预测模型的构建。
9.如权利要求8所述的一种孤独症谱系障碍的风险预测模型构建装置,其特征在于,所述根据预设的特征排列规则和标志分组规则,分别对所述第一数据表、所述第二数据表执行特征排列和标志分组,获得第一分组表集和第二分组表集,具体为:
基于预设的特征权重计算方式,计算数据表中各个特征的权重值,并依据各个特征的权重值对相应的特征进行排序,分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,得到第一序列表集和第二序列表集;
其中,所述分别对特征排序后的第一数据表和第二数据表进行特征提取与添加,具体为:分别对特征排序后的第一数据表和第二数据表提取特征排列顺序前两个特征,分别组成第一子序列表和第二子序列表,随后分别依次向第一子序列表和第二子序列表添加特征排列顺序后一个的特征,直至第一数据表和第二数据表中所有特征分别都添加完毕,分别得到多个第一子序列表和多个第二子序列表,分别将多个第一子序列表和多个第二子序列表进行组合,分别得到第一序列表集和第二序列表集;
根据预设的表格标志分组条件,分别对所述第一序列表集中所有第一子序列表和所述第二序列表集中所有第二子序列表进行标志的分层抽样,均分的标志比例相同,分别得到第一分组表集和第二分组表集。
10.如权利要求9所述的一种孤独症谱系障碍的风险预测模型构建装置,其特征在于,所述根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集,将所述第一测试表集导入至第一子模型集,得到第一最佳特征组合;将所述第二测试表集导入至第二子模型集,得到第二最佳特征组合,具体为:
根据随机森林机器学习算法,分别将所述第一训练表集进行和所述第二训练表集进行训练建模,得到第一子模型集和第二子模型集;
将所述第一测试表集数据导入至第一子模型集,得到每一个第一子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第一子模型中的特征组合,作为第一最佳特征组合;
将所述第二测试表集数据导入至第二子模型集,得到每一个第二子模型对应的敏感度与特异度,经过均值求和后,得到最大敏感度与特异度之和所对应的第二子模型中的特征组合,作为第二最佳特征组合。
CN202111182323.3A 2021-10-11 2021-10-11 一种孤独症谱系障碍的风险预测模型构建方法及装置 Active CN113889274B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111182323.3A CN113889274B (zh) 2021-10-11 2021-10-11 一种孤独症谱系障碍的风险预测模型构建方法及装置
PCT/CN2022/120423 WO2023061174A1 (zh) 2021-10-11 2022-09-22 一种孤独症谱系障碍的风险预测模型构建方法及装置
US18/232,363 US20230386665A1 (en) 2021-10-11 2023-08-10 Method and device for constructing autism spectrum disorder (asd) risk prediction model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111182323.3A CN113889274B (zh) 2021-10-11 2021-10-11 一种孤独症谱系障碍的风险预测模型构建方法及装置

Publications (2)

Publication Number Publication Date
CN113889274A true CN113889274A (zh) 2022-01-04
CN113889274B CN113889274B (zh) 2022-09-13

Family

ID=79006045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111182323.3A Active CN113889274B (zh) 2021-10-11 2021-10-11 一种孤独症谱系障碍的风险预测模型构建方法及装置

Country Status (3)

Country Link
US (1) US20230386665A1 (zh)
CN (1) CN113889274B (zh)
WO (1) WO2023061174A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023061174A1 (zh) * 2021-10-11 2023-04-20 中山大学 一种孤独症谱系障碍的风险预测模型构建方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110840468A (zh) * 2019-11-18 2020-02-28 深圳市铱硙医疗科技有限公司 自闭症风险评估方法及装置、终端设备、存储介质
JP2020057053A (ja) * 2018-09-28 2020-04-09 学校法人慶應義塾 術後合併症予測方法、術後合併症予測プログラム及び術後合併症予測装置
US20200219619A1 (en) * 2018-12-20 2020-07-09 Oregon Health & Science University Subtyping heterogeneous disorders using functional random forest models
US20200321121A1 (en) * 2019-04-02 2020-10-08 Kpn Innovations, Llc Methods and systems for an artificial intelligence support network for vibrant constitutional guidance
CN112163512A (zh) * 2020-09-25 2021-01-01 杨铠郗 一种基于机器学习的孤独症谱系障碍人脸筛查方法
CN112289412A (zh) * 2020-10-09 2021-01-29 深圳市儿童医院 自闭症谱系障碍分类器的构建方法、其装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130123124A1 (en) * 2010-03-12 2013-05-16 Children's Medical Center Corporation Methods and compositions for characterizing autism spectrum disorder based on gene expression patterns
CN107967942B (zh) * 2017-12-13 2021-10-01 东南大学 一种基于近红外脑成像图谱特征的儿童孤独症谱系障碍分析系统
CN109272259A (zh) * 2018-11-08 2019-01-25 梁月竹 一种孤独症谱系障碍儿童情绪能力干预系统及方法
JP2022160012A (ja) * 2019-08-30 2022-10-19 国立研究開発法人国立成育医療研究センター 予測方法及び予測装置
CN113889274B (zh) * 2021-10-11 2022-09-13 中山大学 一种孤独症谱系障碍的风险预测模型构建方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020057053A (ja) * 2018-09-28 2020-04-09 学校法人慶應義塾 術後合併症予測方法、術後合併症予測プログラム及び術後合併症予測装置
US20200219619A1 (en) * 2018-12-20 2020-07-09 Oregon Health & Science University Subtyping heterogeneous disorders using functional random forest models
US20200321121A1 (en) * 2019-04-02 2020-10-08 Kpn Innovations, Llc Methods and systems for an artificial intelligence support network for vibrant constitutional guidance
CN110840468A (zh) * 2019-11-18 2020-02-28 深圳市铱硙医疗科技有限公司 自闭症风险评估方法及装置、终端设备、存储介质
CN112163512A (zh) * 2020-09-25 2021-01-01 杨铠郗 一种基于机器学习的孤独症谱系障碍人脸筛查方法
CN112289412A (zh) * 2020-10-09 2021-01-29 深圳市儿童医院 自闭症谱系障碍分类器的构建方法、其装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHAON BHATTA SHUVO ET AL.: "A Data Mining Based Approach to Predict Autism Spectrum Disorder Considering Behavioral Attributes", 《2019 10TH INTERNATIONAL CONFERENCE ON COMPUTING, COMMUNICATION AND NETWORKING TECHNOLOGIES》 *
李雨彤 等: "基于随机森林算法构建孤独症谱系障碍儿童辅助诊断模型", 《中国学校卫生》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023061174A1 (zh) * 2021-10-11 2023-04-20 中山大学 一种孤独症谱系障碍的风险预测模型构建方法及装置

Also Published As

Publication number Publication date
US20230386665A1 (en) 2023-11-30
WO2023061174A1 (zh) 2023-04-20
CN113889274B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN109086799A (zh) 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN111343147B (zh) 一种基于深度学习的网络攻击检测装置及方法
CN112597038B (zh) 软件缺陷预测方法及系统
CN110059183B (zh) 一种基于大数据的汽车行业用户观点情感分类方法
CN109711424B (zh) 一种基于决策树的行为规则获取方法、装置及设备
CN113053535A (zh) 一种医疗信息预测系统及医疗信息预测方法
CN112016618A (zh) 一种用于对图像语义分割模型泛化能力的度量方法
CN111833310A (zh) 一种基于神经网络架构搜索的表面缺陷分类方法
CN113889274B (zh) 一种孤独症谱系障碍的风险预测模型构建方法及装置
CN115170874A (zh) 一种基于解耦蒸馏损失的自蒸馏实现方法
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
CN111863135B (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
CN116738172A (zh) 一种基于机器学习的大型混合暴露数据分析方法
CN114048320B (zh) 一种基于课程学习的多标签国际疾病分类训练方法
CN112598202B (zh) 试题难度评估方法、装置及存储介质、计算设备
CN115510969A (zh) 一种基于机器学习的公共卫生数据可靠性评估系统
CN116224950A (zh) 面向无人生产线自组织重构的智能故障诊断方法和系统
CN114936204A (zh) 一种特征筛选方法、装置、存储介质及电子设备
CN110265151B (zh) 一种基于ehr中异构时态数据的学习方法
CN112836754A (zh) 一种面向图像描述模型泛化能力评估方法
Keskin et al. Cohort fertility heterogeneity during the fertility decline period in Turkey
Nikolikj et al. Sensitivity Analysis of RF+ clust for Leave-one-problem-out Performance Prediction
CN115062300B (zh) 一种基于多通道深度卷积的入侵检测方法和系统
CN117393171B (zh) 直肠癌术后lars发展轨迹预测模型构建方法及系统
CN112037911B (zh) 基于机器学习的精神评估的筛查系统及其训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant