CN107341347A - 基于评分模型对乳腺癌进行风险评分的方法及装置 - Google Patents
基于评分模型对乳腺癌进行风险评分的方法及装置 Download PDFInfo
- Publication number
- CN107341347A CN107341347A CN201710500788.6A CN201710500788A CN107341347A CN 107341347 A CN107341347 A CN 107341347A CN 201710500788 A CN201710500788 A CN 201710500788A CN 107341347 A CN107341347 A CN 107341347A
- Authority
- CN
- China
- Prior art keywords
- risk score
- user
- data
- breast cancer
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提出一种基于评分模型对乳腺癌进行风险评分的方法及装置,其中,该基于评分模型对乳腺癌进行风险评分的方法包括:获取用户的基因检测结果和外部致病特征数据;根据基因检测结果、外部致病特征数据和预先训练的评分模型,确定用户的乳腺癌的风险评分;根据风险评分获取对应的建议信息,并将风险评分以及对应的建议信息提供给用户。本发明的基于评分模型对乳腺癌进行风险评分的方法,提供了一种通过评分模型准确评估用户的乳腺癌的风险评分的方法,方便了用户获取乳腺癌的风险评分以及方便用户根据风险评分了解自身患病的风险,相对于传统方法,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
Description
技术领域
本发明涉及医学数据处理领域,特别涉及一种基于评分模型对乳腺癌进行风险评分的方法及装置。
背景技术
乳腺癌是危害人类健康甚至危及生命的常见恶性肿瘤,其发病率呈逐年上升且年轻化趋势,乳腺癌已成为上升幅度最快的恶性肿瘤之一,严重威胁着患者的身心健康。
相关技术中,乳腺癌诊断一般过程为:用户到医院,经过医生和精密仪器的诊断,例如,医生根据乳房摄影术的检测结果和触诊检测结果确定用户是否患有乳腺癌,然而,由于早期乳腺癌大多是无痛性肿物,身体可以无任何不适,即不影响生活,也不影响工作,大部分女性容易忽视,不会到医院进行检查,并且去医院检测所消耗的时间和成本较高,从而导致乳腺癌早期诊断率不足30%。因此,如何精准的评估乳腺癌风险,对于用户十分重要。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于评分模型对乳腺癌进行风险评分的方法,该方法提供了一种通过评分模型准确评估用户的乳腺癌的风险评分的方法,方便了用户获取乳腺癌的风险评分以及方便用户根据风险评分了解自身患病的风险,相对于传统方法,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
本发明的第二个目的在于提出一种基于评分模型对乳腺癌进行风险评分的装置。
本发明的第三个目的在于提出一种基于评分模型对乳腺癌进行风险评分的装置。
本发明的第四个目的在于提出一种非易失性计算机存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于评分模型对乳腺癌进行风险评分的方法,包括:获取用户的基因检测结果和外部致病特征数据;根据所述基因检测结果、外部致病特征数据和预先训练的评分模型,确定所述用户的乳腺癌的风险评分;根据所述风险评分获取对应的建议信息,并将所述风险评分以及对应的建议信息提供给所述用户。
本发明实施例的基于评分模型对乳腺癌进行风险评分的方法,通过将所获取的用户的基因检测结果和外部致病特征数据输入至预先训练的评分模型中,通过评分模型确定出用户的乳腺癌的风险评分,并根据风险评分获取对应的建议信息,并将用户患乳腺癌的风险评分以及对应的建议信息提供给用户,由此,提供了一种通过评分模型准确评估用户的乳腺癌的风险评分的方法,方便了用户获取乳腺癌的风险评分,以及方便用户根据风险评分了解自身患病的风险,相对于传统方法,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
为达上述目的,本发明第二方面实施例提出了一种使基于评分模型对乳腺癌进行风险评分的装置,包括:获取模块,用于获取用户的基因检测结果和外部致病特征数据;确定模块,用于根据所述基因检测结果、外部致病特征数据和预先训练的评分模型,确定所述用户的乳腺癌的风险评分;处理模块,用于根据所述风险评分获取对应的建议信息,并将所述风险评分以及对应的建议信息提供给所述用户。
本发明实施例的基于评分模型对乳腺癌进行风险评分的装置,通过将所获取的用户的基因检测结果和外部致病特征数据输入至预先训练的评分模型中,通过评分模型确定出用户的乳腺癌的风险评分,并根据风险评分获取对应的建议信息,并将用户患乳腺癌的风险评分以及对应的建议信息提供给用户,由此,方便了用户获取乳腺癌的风险评分,以及方便用户根据风险评分了解自身患病的风险,相对于传统方法,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
本发明第三方面实施例提出了一种基于评分模型对乳腺癌进行风险评分的装置,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取用户的基因检测结果和外部致病特征数据;根据所述基因检测结果、外部致病特征数据和预先训练的评分模型,确定所述用户的乳腺癌的风险评分;根据所述风险评分获取对应的建议信息,并将所述风险评分以及对应的建议信息提供给所述用户。
本发明第四方面实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备执行以本发明第一方面实施例的基于评分模型对乳腺癌进行风险评分的方法。
本发明第五方面实施例提供了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于评分模型对乳腺癌进行风险评分的方法,所述方法包括:获取用户的基因检测结果和外部致病特征数据;根据所述基因检测结果、外部致病特征数据和预先训练的评分模型,确定所述用户的乳腺癌的风险评分;根据所述风险评分获取对应的建议信息,并将所述风险评分以及对应的建议信息提供给所述用户。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的基于评分模型对乳腺癌进行风险评分的方法的流程图;
图2为训练评分模型的细化流程图;
图3为根据本发明另一个实施例的基于评分模型对乳腺癌进行风险评分的方法的流程图;
图4为根据本发明一个实施例的基于评分模型对乳腺癌进行风险评分的装置的结构示意图;
图5为根据本发明另一个实施例的基于评分模型对乳腺癌进行风险评分的装置的结构示意图;
图6为根据本发明又一个实施例的基于评分模型对乳腺癌进行风险评分的装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的基于评分模型对乳腺癌进行风险评分的方法及装置。
图1为根据本发明一个实施例的基于评分模型对乳腺癌进行风险评分的方法的流程图。
如图1所示,根据本发明实施例的基于评分模型对乳腺癌进行风险评分的方法,包括以下步骤。
S11,获取用户的基因检测结果和外部致病特征数据。
作为一种示例性的实施方式,接收用户通过终端上传的基因检测结果和外部致病特征数据。
其中,终端可以为计算机、平板电脑、智能手机等具有各种操作系统的硬件设备。
举例而言,在智能手机的过程中,用户可通过智能手机将自身的基因检测结果和外部致病特征数据上传至服务器。
其中,基因检测结果中包含与乳腺癌的发生有密切关系的基因数据。
例如,基因检测结果中可以包括BRCA1以及BRCA2,其中,肿瘤抑制基因BRCA1和BRCA2与乳腺癌发病的关系较为密切。
其中,外部致病特征数据是指除基因因素之外的与引起乳腺癌有关的其他外部因素。
其中,外部致病特征数据可以包括但不限于生活方式数据、家族病史数据、药物史数据和身体特征数据。
其中,生活方式数据可以包括但不限于是否偏好高脂肪食品、是否喜爱饮酒,平均运动量等数据。
家族病时数据可以包括三代直系女性亲属乳腺癌的患病情况,即确定三代直系女性亲属中是否患有乳腺癌。
药物史数据可以包括一些外援性雌激素的药物(例如避孕药)的使用情况。
身体特征数据可以包括但不限于个人的身体质量指数BMI(Body Mass Index),初潮时间,停经时间,生育时间,胸部是否接受过放射治疗等数据。
作为一种示例性的实施方式,可为用户提供一种包括生活方式、家族病史、药物史和身体特征等必填选项的问卷调查,并根据用户在问卷调查中填写的数据获取生活方式数据、家族病史数据、药物史数据和身体特征数据等外部致病特征数据。
举例而言,在用户通过终端打开评估乳腺风险的产品时,评估乳腺风险的产品可提示用户上传自身的基因检测结果,并提供包含生活方式、家族病史、药物史和身体特征等必填选项的用户界面,并接收用户针对相应选项所填写的相关数据,并将用户所填写的相关数据上传至服务器,以使服务器获取用户的生活方式数据、家族病史数据、药物史数据和身体特征数据等外部致病特征数据。
作为另一种示例性的实施方式,接收用户通过终端上传的基因检测结果,以及从预先保存用户的外部致病特征数据的数据库中获取对应用户的外部致病特征数据。
其中,需要说明的是,上述数据库中所保存的用户的外部致病特征数据可通过多种方式获得,例如,在用户注册时,可填写上述外部致病特征数据,或者,服务器从其他医护系统中获取用户的外部致病特征数据。
S12,根据基因检测结果、外部致病特征数据和预先训练的评分模型,确定用户的乳腺癌的风险评分。
在本发明的一个实施例中,在获取用户的基因检测结果和外部致病特征数据后,可将基因检测结果和外部致病特征数据输入至预先训练的评分模型,评分模型通过分析基因检测结果和外部致病特征数据确定出用户的乳腺癌的风险评分。
在本发明的一个实施例中,训练评分模型的具体过程,如图2所示,可以包括:
S21,获取样本用户的样本基因检测结果和样本外部致病特征数据。
作为一种示例性的实施方式,在通过问卷调查的方式获取样本用户的样本外部致病特征数据时,在获取样本用户的问卷调查结果后,可判断问卷调查结果中的样本外部致病特征数据是否完整,在确定出问卷调查结果中的样本外部致病特征数据不完整时,可将对应的问卷调查结果删除,以减少不完整的样本外部致病特征数据对后续训练评分模型的影响。
作为另一种示例性的实施方式,在通过问卷调查的方式获取样本用户的样本外部致病特征数据时,在获取样本用户的问卷调查结果后,可判断问卷调查结果中的样本外部致病特征数据是否完整,在确定出问卷调查结果中的样本外部致病特征数据不完整时,可进一步判断样本外部致病特征数据中不完整的比例是否超过预设阈值,如果超过预设阈值,将对应的问卷调查结果删除,以减少不完整的样本外部致病特征数据对后续训练评分模型的影响。
如果判断样本外部致病特征数据中不完整的比例未超过预设阈值,则根据其他样本外部致病特征数据完整的问卷调整结果对该问卷调整结果中不完整的部分进行处理,以使该问卷调整结果中的样本外部致病特征数据完整。
其中,预设阈值是预先设置的。
举例而言,假设当前问卷调整结果中没有包含年龄信息,并且确定当前问卷调整结果样本外部致病特征数据不完整的比例未超过预设阈值,此时,如果根据其他样本外部致病特征数据完整的问卷调整结果确定年龄的平均值为30岁,则将30岁作为当前问卷调整结果中的年龄信息。
S22,获取与样本基因检测结果和样本外部致病特征数据对应的评分标注数据。
S23,对样本基因检测结果、样本外部致病特征数据和评分标注数据进行训练,以得到评分模型。
作为一种示例性的实施方式,服务器可利用机器学习方法对大量样本用户的样本基因检测结果、样本外部致病特征数据和评分标注数据进行训练,以确定出样本基因检测结果、样本外部致病特征数据与评分标注数据之间的对应关系,并根据所获得的对应关系建立评分模型。
也就是说,该实施例通过机器学习方法对关于乳腺癌相关的大量医学数据进行分析,通过机器学习和数据挖掘的方法,找到了乳腺癌的潜在规律,训练出了高精度高性能的评估风险的模型。
其中,评分标注数据是根据样本用户的样本基因检测结果和样本外部致病特征数据预先标注的乳腺癌的风险评分。
其中,需要理解的是,风险评分的高低与以下面因素有关:样本用户的样本基因检测结果确定与乳腺癌相关的一些关键的蛋白质是否发生突变,以及确定样本基因检测结果中与乳腺癌相关的基因是否发生突变,以及在发生突变时,确定基因突变的类型,以及突变的来源。
其中,突变的来源可来自于父系或母系。
其中,突变的来源可通过样本用户的父系或母系的基因检测结果确定。
在本发明的一个实施例中,为了准确建立评分模型,可基于随机森林算法,对样本基因检测结果、样本外部致病特征数据和评分标注数据进行训练,以得到评分模型。
具体而言,在获取样本基因检测结果、样本外部致病特征数据和评分标注数据后,可先通过随机森林算法对样本基因检测结果、样本外部致病特征数据和评分标注数据进行训练,以获取训练出的评分模型。
在获取样本基因检测结果、样本外部致病特征数据和评分标注数据后,可先通过随机森林算法对样本基因检测结果、样本外部致病特征数据和评分标注数据进行训练,以获取训练出的评分模型。
在训练出评分模型后,可获取测试数据集合,其中,测试数据集合中包括测试基因检测结果、测试外部致病特征数据和对应的评分标注数据。然后,将测试基因检测结果、测试外部致病特征数据输入至评分模型中,以获取评分模型中输出的风险评分结果,之后,通过评分模型中输出的风险评分结果和测试数据集合中对应的评分标注数据确定评分模型的准确度是否超过预先设置的准确度阈值,如果未超过预先设置的准确度阈值,则对评分模型的模型参数进行调优处理,以通过调整模型参数来提高评分模型的准确度。
其中,需要说明的是,测试数据集合是预先获取的,例如,可将预先收集的数据按比例随机分成训练数据集和测试数据集,以通过该方式获取测试数据集合。
其中,需要理解的是,在使用评分模型的过程中,为了不断提高评分模型的准确性,可间隔预设时间后基于更新后的训练数据集合对评分模型进行更新。
S13,根据风险评分获取对应的建议信息,并将风险评分以及对应的建议信息提供给用户。
其中,需要理解的是,风险评分越小表明用户患乳腺癌的风险越低。
本发明实施例的基于评分模型对乳腺癌进行风险评分的方法,通过将所获取的用户的基因检测结果和外部致病特征数据输入至预先训练的评分模型中,通过评分模型确定出用户的乳腺癌的风险评分,并根据风险评分获取对应的建议信息,并将用户患乳腺癌的风险评分以及对应的建议信息提供给用户,由此,提供了一种通过评分模型准确评估用户的乳腺癌的风险评分的方法,方便了用户获取乳腺癌的风险评分,以及方便用户根据风险评分了解自身患病的风险,相对于传统方法,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
图3为根据本发明另一个实施例的基于评分模型对乳腺癌进行风险评分的方法的流程图。
如图3所示,根据本发明实施例的基于评分模型对乳腺癌进行风险评分的方法,包括以下步骤。
S31,获取用户的基因检测结果和外部致病特征数据。
S32,根据基因检测结果、外部致病特征数据和预先训练的评分模型,确定用户的乳腺癌的风险评分。
其中,需要说明的是,对步骤S11-S12的解释说明也适用于步骤S31-S32,此处不赘述。
S33,判断风险评分是否超过预设阈值,若是,则执行步骤S34,否则执行步骤S35。
其中,预设阈值是预先设置的风险评分的阈值。
S34,向用户提供风险评分和进一步检查的建议信息。
也就是说,在判断出用户的乳腺癌的风险评分超过预设阈值时,可确定用户极有可能患有乳腺癌,为了及时发现并治疗,此时,可建议用户对医院进行一步检查。
S35,向用户提供风险评分和预防乳腺癌的建议信息。
其中,预防乳腺癌的建议信息可以包括但不限于饮食建议、运动建议、乳腺护理建议等。
本发明实施例的基于评分模型对乳腺癌进行风险评分的方法,通过将所获取的用户的基因检测结果和外部致病特征数据输入至预先训练的评分模型中,通过评分模型确定出用户的乳腺癌的风险评分,并根据风险评分给用户合理的建议信息,方便了用户根据建议信息进一步检查或者了解与预防乳腺癌有关的信息,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
为了实现上述实施例,本发明还提出了一种基于评分模型对乳腺癌进行风险评分的装置。
图4为根据本发明一个实施例的基于评分模型对乳腺癌进行风险评分的装置的结构示意图。
如图4所示,该基于评分模型对乳腺癌进行风险评分的装置包括获取模块110、确定模块120和处理模块130,其中:
获取模块110用于获取用户的基因检测结果和外部致病特征数据。
其中,外部致病特征数据可以包括但不限于生活方式数据、家族病史数据、药物史数据和身体特征数据。
其中,生活方式数据可以包括但不限于是否偏好高脂肪食品、是否喜爱饮酒,平均运动量等数据。
家族病时数据可以包括三代直系女性亲属乳腺癌的患病情况,即确定三代直系女性亲属中是否患有乳腺癌。
药物史数据可以包括一些外援性雌激素的药物(例如避孕药)的使用情况。
身体特征数据可以包括但不限于个人的身体质量指数BMI(Body Mass Index),初潮时间,停经时间,生育时间,胸部是否接受过放射治疗等数据。
确定模块120用于根据基因检测结果、外部致病特征数据和预先训练的评分模型,确定用户的乳腺癌的风险评分。
处理模块130用于根据风险评分获取对应的建议信息,并将风险评分以及对应的建议信息提供给用户。
在本发明的一个实施例中,为了通过评分模型准确评估用户的乳腺癌的风险评分,在图4所示的实施例的基础上,如图5所示,该装置还可以包括训练模块140,其中,训练模块140用于获取样本用户的样本基因检测结果和样本外部致病特征数据,并获取与样本基因检测结果和样本外部致病特征数据对应的评分标注数据,以及对样本基因检测结果、样本外部致病特征数据和评分标注数据对进行训练,以得到评分模型。
在本发明的一个实施例中,为了训练得到准确的评分模型,训练模块140具体用于:基于随机森林算法,对样本基因检测结果、样本外部致病特征数据和评分标注数据进行训练,以得到评分模型。
其中,需要理解的是,在通过训练模块140训练出评分模型后,该装置还可以包括测试模块(图中未示出),测试模块用于获取测试数据集合,其中,测试数据集合中包括测试基因检测结果、测试外部致病特征数据和对应的评分标注数据。然后,将测试基因检测结果、测试外部致病特征数据输入至评分模型中,以获取评分模型中输出的风险评分结果,之后,通过评分模型中输出的风险评分结果和测试数据集合中对应的评分标注数据确定评分模型的准确度是否超过预先设置的准确度阈值,如果未超过预先设置的准确度阈值,则对评分模型的模型参数进行调优处理,以通过调整模型参数来提高评分模型的准确度。
其中,需要理解的是,在使用评分模型的过程中,为了不断提高评分模型的准确性,可间隔预设时间后基于更新后的训练数据集合对评分模型进行更新。
在本发明的一个实施例中,为了给用户合理的建议,在图5所示的实施例的基础上,如图6所示,该处理模块130可以包括,其中:
判断单元131用于判断风险评分是否超过预设阈值。
第一提供单元132用于:在判断风险评分超过预设阈值时,向用户提供风险评分和进一步检查的建议信息。
第二提供单元133用于在判断风险评分未超过预设阈值时,向用户提供风险评分和预防乳腺癌的建议信息。
其中,需要说明的是,前述对基于评分模型对乳腺癌进行风险评分的方法实施例的解释说明也适用于该实施例的基于评分模型对乳腺癌进行风险评分的装置,此处不再赘述。
本发明实施例的基于评分模型对乳腺癌进行风险评分的装置,通过将所获取的用户的基因检测结果和外部致病特征数据输入至预先训练的评分模型中,通过评分模型确定出用户的乳腺癌的风险评分,并根据风险评分获取对应的建议信息,并将用户患乳腺癌的风险评分以及对应的建议信息提供给用户,由此,方便了用户获取乳腺癌的风险评分,以及方便用户根据风险评分了解自身患病的风险,相对于传统方法,减少了用户获取乳腺癌的风险评分的时间和成本,提高了用户的用户体验度。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于评分模型对乳腺癌进行风险评分的方法,其特征在于,包括以下步骤:
获取用户的基因检测结果和外部致病特征数据;
根据所述基因检测结果、外部致病特征数据和预先训练的评分模型,确定所述用户的乳腺癌的风险评分;
根据所述风险评分获取对应的建议信息,并将所述风险评分以及对应的建议信息提供给所述用户。
2.如权利要求1所述的方法,其特征在于,所述训练评分模型,包括:
获取样本用户的样本基因检测结果和样本外部致病特征数据;
获取与所述样本基因检测结果和样本外部致病特征数据对应的评分标注数据;
对所述样本基因检测结果、样本外部致病特征数据和所述评分标注数据进行训练,以得到所述评分模型。
3.如权利要求2所述的方法,其特征在于,所述对所述样本基因检测结果、样本外部致病特征数据和所述评分标注数据进行训练,以得到所述评分模型,包括:
基于随机森林算法,根据所述样本基因检测结果、样本外部致病特征数据和所述评分标注数据对评分模型进行训练。
4.如权利要求1所述的方法,其特征在于,所述根据所述风险评分获取对应的建议信息,所述方法还包括:
判断所述风险评分是否超过预设阈值;
若判断所述风险评分超过预设阈值,则向所述用户提供所述风险评分和进一步检查的建议信息;
若判断所述风险评分未超过预设阈值,则向所述用户提供所述风险评分和预防乳腺癌的建议信息。
5.如权利要求1-4任一项所述的方法,其特征在于,所述外部致病特征数据包括生活方式数据、家族病史数据、药物史数据和身体特征数据。
6.一种基于评分模型对乳腺癌进行风险评分的装置,其特征在于,包括:
获取模块,用于获取用户的基因检测结果和外部致病特征数据;
确定模块,用于根据所述基因检测结果、外部致病特征数据和预先训练的评分模型,确定所述用户的乳腺癌的风险评分;
处理模块,用于根据所述风险评分获取对应的建议信息,并将所述风险评分以及对应的建议信息提供给所述用户。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
训练模块,用于获取样本用户的样本基因检测结果和样本外部致病特征数据,并获取与所述样本基因检测结果和样本外部致病特征数据对应的评分标注数据,以及对所述样本基因检测结果、样本外部致病特征数据和所述评分标注数据进行训练,以得到所述评分模型。
8.如权利要求6所述的装置,其特征在于,所述训练模块,具体用于:
基于随机森林算法,对所述样本基因检测结果、样本外部致病特征数据和所述评分标注数据进行训练,以得到所述评分模型。
9.如权利要求6所述的装置,其特征在于,所述处理模块包括:
判断单元,用于判断所述风险评分是否超过预设阈值;
第一提供单元,用于在判断所述风险评分超过预设阈值时,向所述用户提供所述风险评分和进一步检查的建议信息;
第二提供单元,用于在判断所述风险评分未超过预设阈值时,向所述用户提供所述风险评分和预防乳腺癌的建议信息。
10.如权利要求6-9任一项所述的装置,其特征在于,所述外部致病特征数据包括生活方式数据、家族病史数据、药物史数据和身体特征数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710500788.6A CN107341347A (zh) | 2017-06-27 | 2017-06-27 | 基于评分模型对乳腺癌进行风险评分的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710500788.6A CN107341347A (zh) | 2017-06-27 | 2017-06-27 | 基于评分模型对乳腺癌进行风险评分的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107341347A true CN107341347A (zh) | 2017-11-10 |
Family
ID=60220903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710500788.6A Pending CN107341347A (zh) | 2017-06-27 | 2017-06-27 | 基于评分模型对乳腺癌进行风险评分的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107341347A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108986878A (zh) * | 2018-08-03 | 2018-12-11 | 武汉白原科技有限公司 | 基于基因检测的健康指导报告生成方法、装置及服务器 |
WO2020124585A1 (zh) * | 2018-12-21 | 2020-06-25 | 北京哲源科技有限责任公司 | 获得细胞内确定性事件的方法、电子设备及存储介质 |
CN113299400A (zh) * | 2021-06-23 | 2021-08-24 | 复旦大学附属儿科医院 | 新生儿危重症遗传风险评估方法、装置及设备 |
CN114331304A (zh) * | 2020-09-30 | 2022-04-12 | 上海近屿智能科技有限公司 | 一种综合招聘难度模型的构建方法及招聘难度的评估方法 |
CN115602328A (zh) * | 2022-11-16 | 2023-01-13 | 深圳技术大学(Cn) | 急性白血病的预警方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101103124A (zh) * | 2004-11-19 | 2008-01-09 | Oy朱里拉布有限公司 | 用于检测原发性动脉高压风险的方法和试剂盒 |
CN102144036A (zh) * | 2008-07-07 | 2011-08-03 | 解码遗传学私营有限责任公司 | 用于乳腺癌风险评估的遗传变型 |
CN104364654A (zh) * | 2012-05-11 | 2015-02-18 | 弗莱德哈钦森癌症研究中心 | 预测和检测癌症风险的方法 |
CN106295241A (zh) * | 2015-06-25 | 2017-01-04 | 杭州圣庭生物技术有限公司 | 基于brca1和brca2突变的乳腺癌患病风险评估算法 |
CN107201401A (zh) * | 2017-05-23 | 2017-09-26 | 深圳市第二人民医院 | 一种用于乳腺癌发病风险预测的多因素模型及其建立方法 |
-
2017
- 2017-06-27 CN CN201710500788.6A patent/CN107341347A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101103124A (zh) * | 2004-11-19 | 2008-01-09 | Oy朱里拉布有限公司 | 用于检测原发性动脉高压风险的方法和试剂盒 |
CN102144036A (zh) * | 2008-07-07 | 2011-08-03 | 解码遗传学私营有限责任公司 | 用于乳腺癌风险评估的遗传变型 |
CN104364654A (zh) * | 2012-05-11 | 2015-02-18 | 弗莱德哈钦森癌症研究中心 | 预测和检测癌症风险的方法 |
CN106295241A (zh) * | 2015-06-25 | 2017-01-04 | 杭州圣庭生物技术有限公司 | 基于brca1和brca2突变的乳腺癌患病风险评估算法 |
CN107201401A (zh) * | 2017-05-23 | 2017-09-26 | 深圳市第二人民医院 | 一种用于乳腺癌发病风险预测的多因素模型及其建立方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108986878A (zh) * | 2018-08-03 | 2018-12-11 | 武汉白原科技有限公司 | 基于基因检测的健康指导报告生成方法、装置及服务器 |
WO2020124585A1 (zh) * | 2018-12-21 | 2020-06-25 | 北京哲源科技有限责任公司 | 获得细胞内确定性事件的方法、电子设备及存储介质 |
CN111602201A (zh) * | 2018-12-21 | 2020-08-28 | 北京哲源科技有限责任公司 | 获得细胞内确定性事件的方法、电子设备及存储介质 |
CN111602201B (zh) * | 2018-12-21 | 2023-08-01 | 北京哲源科技有限责任公司 | 获得细胞内确定性事件的方法、电子设备及存储介质 |
CN114331304A (zh) * | 2020-09-30 | 2022-04-12 | 上海近屿智能科技有限公司 | 一种综合招聘难度模型的构建方法及招聘难度的评估方法 |
CN113299400A (zh) * | 2021-06-23 | 2021-08-24 | 复旦大学附属儿科医院 | 新生儿危重症遗传风险评估方法、装置及设备 |
CN113299400B (zh) * | 2021-06-23 | 2023-02-21 | 复旦大学附属儿科医院 | 新生儿危重症遗传风险评估方法、装置及设备 |
CN115602328A (zh) * | 2022-11-16 | 2023-01-13 | 深圳技术大学(Cn) | 急性白血病的预警方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341347A (zh) | 基于评分模型对乳腺癌进行风险评分的方法及装置 | |
EP3043318B1 (en) | Analysis of medical images and creation of a report | |
CN109943636B (zh) | 一种结直肠癌微生物标志物及其应用 | |
Gierach et al. | Relationships between computer-extracted mammographic texture pattern features and BRCA1/2 mutation status: a cross-sectional study | |
Girgis et al. | Screening for Melanoma by Primary Health Care Physicians: A Cost—Effectiveness Analysis | |
CN107423560A (zh) | 基于评分模型对二型糖尿病进行风险评分的方法及装置 | |
US11828949B1 (en) | Using images and voice recordings to facilitate underwriting life insurance | |
Sartor et al. | Mammographic density in relation to tumor biomarkers, molecular subtypes, and mode of detection in breast cancer | |
Armato III et al. | Observer variability in mesothelioma tumor thickness measurements: defining minimally measurable lesions | |
Panthofer et al. | Derivation and validation of thoracic sarcopenia assessment in patients undergoing thoracic endovascular aortic repair | |
Schuh et al. | Reproducibility of three classification systems of ductal carcinoma in situ of the breast using a web-based survey | |
Cheddad et al. | Enhancement of mammographic density measures in breast cancer risk prediction | |
Engelken et al. | Volumetric breast composition analysis: reproducibility of breast percent density and fibroglandular tissue volume measurements in serial mammograms | |
Anyene et al. | Body composition from single versus multi‐slice abdominal computed tomography: concordance and associations with colorectal cancer survival | |
Moshina et al. | Comparison of subjective and fully automated methods for measuring mammographic density | |
Wang et al. | Application of digital mammography-based radiomics in the differentiation of benign and malignant round-like breast tumors and the prediction of molecular subtypes | |
Naser et al. | Deep learning auto-segmentation of cervical skeletal muscle for sarcopenia analysis in patients with head and neck cancer | |
Toguzbayeva et al. | Impact of screening on breast cancer incidence in Kazakhstan: Results of component analysis | |
Smith | The density conundrum: does legislation help or hurt? | |
Stegeman et al. | Cancer risk models and preselection for screening | |
Yoong et al. | Performance of the Palliative Prognostic Index for cancer patients: A systematic review and meta-analysis | |
van Luijt et al. | The role of pre-invasive disease in overdiagnosis: A microsimulation study comparing mass screening for breast cancer and cervical cancer | |
KR102561175B1 (ko) | 의료 영상으로부터 바이오마커 발현을 예측하는 방법 및 시스템 | |
Hoover et al. | Prophylactic mastectomy in high risk patients: a practice-based review of the indications. Do we follow guidelines? | |
Gérvas | Screening for serious illness: limits to the power of medicine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171110 |
|
RJ01 | Rejection of invention patent application after publication |