CN114300044B - 基因评估方法、装置、存储介质及计算机设备 - Google Patents

基因评估方法、装置、存储介质及计算机设备 Download PDF

Info

Publication number
CN114300044B
CN114300044B CN202111679088.0A CN202111679088A CN114300044B CN 114300044 B CN114300044 B CN 114300044B CN 202111679088 A CN202111679088 A CN 202111679088A CN 114300044 B CN114300044 B CN 114300044B
Authority
CN
China
Prior art keywords
target
phenotype
target user
gene
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111679088.0A
Other languages
English (en)
Other versions
CN114300044A (zh
Inventor
尹烨
杨姣博
周戬
晋向前
贺增泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huada Medical Laboratory
Original Assignee
Shenzhen Huada Medical Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huada Medical Laboratory filed Critical Shenzhen Huada Medical Laboratory
Priority to CN202111679088.0A priority Critical patent/CN114300044B/zh
Publication of CN114300044A publication Critical patent/CN114300044A/zh
Application granted granted Critical
Publication of CN114300044B publication Critical patent/CN114300044B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本申请提供的基因评估方法、装置、存储介质及计算机设备,当接收到目标用户发送的基因评估请求时,由于该基因评估请求中包含了目标用户的变异位点集合以及目标用户选择的待评估类型,因此可以根据该变异位点集合来确定与待评估类型对应的目标表型集合,并根据目标表型集合来对目标用户在待评估类型下的基因特征进行评估后,即可得到与用户的基因相关的评估结果;例如,当某一目标用户有关于自身基因的饮食或护肤指导需求时,可以根据该目标用户的变异位点集合来确定与饮食或护肤相关的目标表型集合,通过对该目标表型集合进行评估后,即可得到与该目标用户的饮食或护肤相关的评估结果,目标用户可以根据该评估结果来进行相应的饮食或护肤。

Description

基因评估方法、装置、存储介质及计算机设备
技术领域
本申请涉及基因分析技术领域,尤其涉及一种基因评估方法、装置、存储介质及计算机设备。
背景技术
基因(遗传因子)指的是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能,储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关,它也是决定生命健康的内在因素。
现代医学实验证明,群体演化、生物体的形态、结构和生理、生化等特性均与人类的基因突变或变异有关,而随着高通量测序技术的快速发展,测序成本的大幅下降,普通用户对于自身基因在群体演化、护肤、饮食、代谢等方面的指导存在一定的需求,以及多个用户之间进行群体活动时基于基因层面的运动指导、饮食指导等的需求也越来越大,然而现有技术无法为用户提供基于基因层面的指导需求。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中无法为用户提供基于基因层面的指导需求的技术缺陷。
本申请提供了一种基因评估方法,所述方法包括:
接收目标用户发送的基因评估请求,所述基因评估请求包括所述目标用户的基因组数据以及待评估类型,所述基因组数据中包括所述目标用户的变异位点集合;
确定所述目标用户的变异位点集合中与所述待评估类型对应的目标表型集合;
基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,并将评估结果发送给所述目标用户。
可选地,所述确定所述目标用户的变异位点集合中与所述待评估类型对应的目标表型集合,包括:
参考预先设定的每一变异位点与表型信息之间的对应关系,确定所述目标用户的变异位点集合中的每一变异位点对应的目标表型,以及各个目标表型的类别;
根据各个目标表型的类别,确定与所述待评估类型对应的目标表型集合。
可选地,所述每一变异位点与表型信息之间的对应关系的确定过程,包括:
获取若干用户的基因组数据及对应的表型信息,所述基因组数据中包括用户的变异位点集合;
基于各个用户的基因组数据与表型信息的对应关系,确定每一变异位点与表型信息间的对应关系。
可选地,所述基于各个用户的基因组数据与表型信息的对应关系,确定每一变异位点与表型信息间的对应关系,包括:
确定各个用户的基因组数据中各变异位点与表型信息的对应关系;
统计每个变异位点与每个表型信息间对应关系的出现次数;
针对每一变异位点,选取与所述变异位点对应关系出现次数最多的表型信息,作为所述变异位点对应的表型信息,得到所述变异位点与所述表型信息之间的对应关系。
可选地,若所述目标用户的数量为多个;
所述基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,包括:
根据每个目标用户的目标表型集合,确定每个目标用户在所述待评估类型下的基因特征;
基于各个目标用户在所述待评估类型下的基因特征,对各个目标用户进行相似度匹配,得到相似度匹配结果;
根据所述相似度匹配结果对各个目标用户在所述待评估类型下的基因特征进行评估。
可选地,所述基于每一目标用户在所述待评估类型下的基因特征,对各个目标用户进行相似度匹配,得到相似度匹配结果,包括:
基于各个目标用户在所述待评估类型下的基因特征,对各个目标用户之间进行两两相似度匹配,得到第一相似度匹配结果;
基于各个目标用户在所述待评估类型下的基因特征,确定每一目标用户与其余目标用户间的整体相似度,得到第二相似度匹配结果。
可选地,所述待评估类型包括运动、饮酒、护肤、营养、代谢、遗传疾病、群体演化中的一种或多种。
本申请还提供了一种基因评估装置,包括:
数据接收模块,用于接收目标用户发送的基因评估请求,所述基因评估请求包括所述目标用户的基因组数据以及待评估类型,所述基因组数据中包括所述目标用户的变异位点集合;
表型确定模块,用于确定所述目标用户的变异位点集合中与所述待评估类型对应的目标表型集合;
基因评估模块,用于基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,并将评估结果发送给所述目标用户。
本申请还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述基因评估方法的步骤。
本申请还提供了一种计算机设备,包括:一个或多个处理器,以及存储器;
所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述基因评估方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请提供的基因评估方法、装置、存储介质及计算机设备,在为目标用户提供基于基因层面的指导时,可以先接收该目标用户发送的基因评估请求,该基因评估请求不仅包含目标用户的基因组数据中的变异位点集合,还包含目标用户所选择的待评估类型,接着可以根据目标用户的变异位点集合来确定与待评估类型对应的目标表型集合,由于目标用户的目标表型集合表征该目标用户在待评估类型下的形态、结构和生理、生化等基因特征,因此,根据目标用户的目标表型集合来对目标用户在待评估类型下的基因特征进行评估后,即可得到与用户的基因相关的评估结果;例如,当某一目标用户有关于自身基因的饮食或护肤指导需求时,可以根据该目标用户的变异位点集合来确定与饮食或护肤相关的目标表型集合,通过对该目标表型集合进行评估后,即可得到与该目标用户的饮食或护肤相关的评估结果,目标用户可以根据该评估结果来进行相应的饮食或护肤。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种基因评估方法的流程示意图;
图2为本申请实施例提供的一种基因评估装置的结构示意图;
图3为本申请实施例提供的一种计算机设备的内部结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在一个实施例中,如图1所示,图1为本申请实施例提供的一种基因评估方法的流程示意图;本申请提供了一种基因评估方法,所述方法包括:
S110:接收目标用户发送的基因评估请求。
本步骤中,当用户想要进行基因相关的饮食、运动、护肤、代谢等方面的指导时,可以访问基因平台,并在基因平台上触发基因评估请求,基因平台可以根据用户发送的基因评估请求来对用户进行评估,从而为用户提供基因相关的指导建议。
其中,本申请可以将发送基因评估请求的用户作为目标用户,且目标用户的个数至少为一个,当个人用户发送基因评估请求时,基因平台可以根据该用户自身的基因信息进行评估,当多个用户发送基因评估请求时,基因平台可以根据多个用户之间的基因信息进行评估。
进一步地,本申请的基因评估请求可以包括目标用户的基因组数据以及待评估类型,其中,基因组数据又包括该目标用户的变异位点集合。
可以理解的是,这里的基因组数据指的是目标用户的全部基因数据,用户可以通过基因测序仪等来完成全部基因数据的分析、注释、解读,从而得到自身的基因组数据;而基因组数据中的变异位点指的是通过对基因组数据进行测序和序列比对等方式获得的变异位点;这里的待评估类型指的是与用户的需求相关的指导类型,如护肤、饮食、运动、代谢等。
本申请中通过测序和序列比对等方式获得的变异位点时,可以预先获取目标用户的含有核酸的待测样本,核酸的类型并不受特别限制,可以是脱氧核糖核酸(DNA),也可以是核糖核酸(RNA),优选DNA。而对于RNA,也可以通过实验方法逆转录成DNA,进行后续检测和分析。
具体地,本申请获取到目标用户的待测样本后,可以通过序列比对的方式来确定待测样本的变异位点集合。例如,本申请可以通过基因测序仪来检测待测样本的基因序列,并得到基因组数据,接着将该基因组数据映射到参考基因组序列上,与参考基因组序列进行比对,从而查找出基因组数据中与参考基因组序列不一样的单碱基位点,即变异位点。
可以理解的是,这里的参考基因组序列指的是具有唯一碱基排列方式的基因序列片段,通过与这种片段的比对可以准确的定位染色体上的位置。本申请实施例中可以采用版本号为hg38、hg19或hg18的参考基因组序列,在此不做限制。
更进一步地,由于一个人的基因组数据可以挖掘到四百万个SNVs(跟参考基因组不一样的单碱基位点),还有五十万的indels(insertions or deletions),因此,本申请中一个目标用户的变异位点可以有多个,并形成变异位点集合。
另外,当用户在基因平台上触发基因评估请求时,可以通过NFC、蓝牙、GPRS、zigbee技术、wifi技术或二维码进行安全信息的验证和相关路径信息的传输。
S120:确定目标用户的变异位点集合中与待评估类型对应的目标表型集合。
本步骤中,由于不同的变异位点的位置底座不同,比如三号染色体第3000个位点的A碱基突变成T碱基,因而每一变异位点都有其对应的基因型。进一步地,由于用户的基因型与表型之间存在对应关系,继而使得每一变异位点与表型之间也存在对应关系,在该对应关系下,即可确定与目标用户的变异位点集合对应的表型信息集合。
可以理解的是,这里的表型指的是表现型,是指具有特定基因型的个体,在一定环境条件下,所表现出来的性状特征的总和。所谓性状,即指生物体的形态、结构和生理、生化等特性。
这里的基因型是指某一生物个体全部基因组合的总称。它反映生物体的遗传构成,即从双亲获得的全部基因的总和。遗传学中具体使用的基因型,往往是指某一性状的基因型。两个生物只要有一个基因型不同,那么它们的基因型就不相同,因此基因型指的是一个个体所有等位基因的所有基因座上的所有组合。基因型一般不能直接看到,需要通过杂交(测交)试验从表现型来推知。据估计,人类的结构基因约有5万对。因此,整个生物的基因型是无法表示的,遗传学中具体使用的基因型,往往是指某一性状的基因型。
而本申请在确定与目标用户的变异位点集合对应的表型信息集合后,接着可以根据目标用户所选择的待评估类型,筛选出该变异位点集合中与目标用户所选择的待评估类型对应的目标表型集合。
例如,当用户选择的待评估类型为护肤时,可以从目标用户的变异位点集合中筛选出与皮肤相关的目标表型集合,如是否为过敏性皮肤,皮肤屏障是否容易受损,皮肤表皮恢复能力,长雀斑、长痣的风险,以便基因平台根据目标用户的目标表型集合来评估用户的皮肤状态,从而实现科学护肤。
而当用户选择的待评估类型为饮食时,可以从目标用户的变异位点集合中筛选出与饮食相关的目标表型集合,如饮酒能力,甜食和苦味偏好、情绪性饮食风险、易胖风险、脂肪代谢能力、饱腹感敏感度、咖啡因代谢、乳糖代谢、贴代谢能力、果糖不耐风险、酒精代谢能力、不饱和脂肪酸含量代谢能力、叶酸代谢能力和空腹血糖等。
S130:基于目标表型集合对目标用户在待评估类型下的基因特征进行评估,并将评估结果发送给目标用户。
本步骤中,通过S120确定目标用户的变异位点集合中与待评估类型对应的目标表型集合后,可以基于该目标表型集合来对目标用户在待评估类型下的基因特征进行评估,并将评估结果发送给目标用户,以供目标用户参考。
例如,当用户选择的待评估类型为饮食时,可以从目标用户的变异位点集合中筛选出与饮食相关的目标表型集合,如饮酒能力,甜食和苦味偏好、情绪性饮食风险、易胖风险、脂肪代谢能力、饱腹感敏感度、咖啡因代谢、乳糖代谢、贴代谢能力、果糖不耐风险、酒精代谢能力、不饱和脂肪酸含量代谢能力、叶酸代谢能力、空腹血糖,以及高血压、糖尿病、高尿酸、高血脂、精神疾病、癌症化疗、抗菌、抗病毒感染、抗抑郁、心率失常、手术、肠胃消化系统等用药,还有阿尔茨海默病、老年黄斑等多种疾病的得病风险和遗传风险等。
通过上述过程获取到目标用户在饮食这一待评估类型下的目标表型集合后,可以根据目标表型集合来对目标用户的基因特征进行评估。如目标用户偏爱甜食,但果糖不耐风险较高、乳糖代谢能力较低时,则该目标用户的评估结果可以是少量摄取甜食;若目标用户的酒精代谢能力一般,则该目标用户的评估结果可以是少量饮酒。
当得到评估结果后,用户可以在电脑、手机、pad、智能眼镜、车辆等多种移动端获得该评估结果,并根据该评估结果中的指导建议进行饮食、护肤相关的调整等。
上述实施例中,在为目标用户提供基于基因层面的指导时,可以先接收该目标用户发送的基因评估请求,该基因评估请求不仅包含目标用户的基因组数据中的变异位点集合,还包含目标用户所选择的待评估类型,接着可以根据目标用户的变异位点集合来确定与待评估类型对应的目标表型集合,由于目标用户的目标表型集合表征该目标用户在待评估类型下的形态、结构和生理、生化等基因特征,因此,根据目标用户的目标表型集合来对目标用户在待评估类型下的基因特征进行评估后,即可得到与用户的基因相关的评估结果;例如,当某一目标用户有关于自身基因的饮食或护肤指导需求时,可以根据该目标用户的变异位点集合来确定与饮食或护肤相关的目标表型集合,通过对该目标表型集合进行评估后,即可得到与该目标用户的饮食或护肤相关的评估结果,目标用户可以根据该评估结果来进行相应的饮食或护肤。
在一个实施例中,S120中确定所述目标用户的变异位点集合中与所述待评估类型对应的目标表型集合,可以包括:
S121:参考预先设定的每一变异位点与表型信息之间的对应关系,确定所述目标用户的变异位点集合中的每一变异位点对应的目标表型,以及各个目标表型的类别。
S122:根据各个目标表型的类别,确定与所述待评估类型对应的目标表型集合。
本实施例中,由于不同的变异位点的位置底座不同,因而每一变异位点都有其对应的基因型,根据变异位点注释数据库,即可确定每一变异位点的基因型与表型信息之间的对应关系,继而确定每一变异位点与表型信息之间的对应关系,在该对应关系下,即可确定与目标用户的变异位点集合中的每一变异位点对应的目标表型。
例如,当确定基因平台中所有用户上传的变异位点与表型信息之间的对应关系后,若目标用户发送基因评估请求,即可根据目标用户的变异位点集合,查找基因平台中保存的与该变异位点集合对应的变异位点,并根据每一变异位点与表型信息之间的对应关系,确定该变异位点集合中每一变异位点对应的目标表型。
本申请中,在确定目标用户的变异位点集合中每一变异位点对应的目标表型后,还可以确定该目标表型的类别,根据该目标表型的类别,即可确定与待评估类型对应的目标表型集合。
例如,当目标表型为单眼皮、宽鼻翼、招风耳时,便可将该目标表型的类别划分为面部特征类;当目标表型为脂肪代谢能力、咖啡因代谢、乳糖代谢、酒精代谢能力时,便可将该目标表型的类别划分为代谢类。
当确定目标用户的变异位点集合中每一变异位点对应的目标表型的类别,以及目标用户所选择的待评估类型后,即可确定与待评估类型对应的目标表型集合。举例来说,当待评估类型为运动类型时,可以筛选出目标用户的表型信息中与运动相关的目标表型,如先天耐力、爆发力、运动恢复能力、最大摄氧量、软组织损伤风险等,从而汇聚成目标表型集合。
在一个实施例中,S121中每一变异位点与表型信息之间的对应关系的确定过程,可以包括:
S1211:获取若干用户的基因组数据及对应的表型信息,所述基因组数据中包括用户的变异位点集合。
S1212:基于各个用户的基因组数据与表型信息的对应关系,确定每一变异位点与表型信息间的对应关系。
本实施例中,在确定每一变异位点与表型信息之间的对应关系时,可以获取大量用户的基因组数据及对应的表型信息,并建立大量用户的基因组数据中变异位点与对应表型信息的关联关系,从而根据每一变异位点与各个表型信息之间的关联关系,来对每一变异位点进行分类,从而确定与每一变异位点对应的表型信息。
进一步地,本申请还可以预先获取部分用户的基因组数据及对应的表型信息,获取的方式包括但不限于已有的公共平台的数据、文章、平台用户等。获取到部分用户的基因组数据及对应的表型信息后,即可建立部分用户的基因组数据中变异位点与表型信息的关联关系模型,利用部分用户的基因组数据及对应的表型信息对模型进行训练后,将训练完成的模型保存至数据库中,当基因平台中持续注入新的用户时,可以在原有的模型的基础上,利用新用户的基因组数据及对应的表型信息对模型再次进行训练,当模型再次进行训练时,由于有了前一次训练后留下的模型参数,从而使得本次训练的训练过程较短,且能够在训练过程中修正前一次训练后得到的模型参数,使得模型的输出结果更加准确,变异位点与表型信息之间的关联关系更加精确。
在一个实施例中,S1212中基于各个用户的基因组数据与表型信息的对应关系,确定每一变异位点与表型信息间的对应关系,可以包括:
S210:确定各个用户的基因组数据中各变异位点与表型信息的对应关系。
S211:统计每个变异位点与每个表型信息间对应关系的出现次数。
S212:针对每一变异位点,选取与所述变异位点对应关系出现次数最多的表型信息,作为所述变异位点对应的表型信息,得到所述变异位点与所述表型信息之间的对应关系。
本实施例中,在确定每一变异位点与表型信息间的对应关系时,可以先确定各个用户的基因组数据中各变异位点与表型信息的对应关系,接着统计每一变异位点与每一表型信息间对应关系的出现次数,针对每一变异位点,选取与该变异位点对应关系出现次数最多的表型信息,作为该变异位点对应的表型信息,由此可以得到每一变异位点与表型信息之间的对应关系。
进一步地,由于不同的变异位点的位置底座不同,因而每一变异位点都有其对应的基因型,根据变异位点注释数据库,即可确定每一变异位点的基因型与表型信息之间的对应关系,继而确定每一变异位点与表型信息之间的对应关系。因此,本申请可以建立基因型与表型信息之间的关联关系,并通过关联关系来统计每个基因型与每个表型信息间对应关系的出现次数,继而得到每个变异位点与每个表型信息间对应关系的出现次数,具体参见如下:
(1)假设有大量用户的基因型gi及表型信息hi,首先建立基因型与表型信息的关联向量x,如根据gi与各个hi关联的次数生成一个向量x;
(2)通过softmax函数计算每个基因型gi的分类情况,公式如下:
Figure BDA0003453437960000101
其中,i为第i个基因型,或第i个表型信息,或第i个向量。
由上述公式可以计算出与每一基因型关联程度最高的表型信息,该表型信息即为与该基因型对应的变异位点的表型信息。
在一个实施例中,若所述目标用户的数量为多个;S130中基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,可以包括:
S131:根据每个目标用户的目标表型集合,确定每个目标用户在所述待评估类型下的基因特征。
S132:基于各个目标用户在所述待评估类型下的基因特征,对各个目标用户进行相似度匹配,得到相似度匹配结果。
S133:根据所述相似度匹配结果对各个目标用户在所述待评估类型下的基因特征进行评估。
本实施例中,当目标用户为多个时,可以将多个目标用户的基因组数据发送至基因平台,基因平台根据每个目标用户的基因组数据中与待评估类型对应的目标表型集合,来确定每个目标用户在该待评估类型下的基因特征,接着基因平台可以根据各个目标用户在该待评估类型下的基因特征,来对各个目标用户进行相似度匹配,并得到相似度匹配结果,最后基因平台可以根据该相似度匹配结果来对各个目标用户在该待评估类型下的基因特征进行评估。
举例来说,当两个或两个以上的用户想要选择一些饮食、运动等基因评估场景时,基因平台可以根据各个用户的基因组数据中的变异位点集合来获得对应的表型信息,从而确定每一用户在饮食、运动等基因评估场景下的基因特征。例如,用户A偏爱甜食,但体型偏胖,其基因特征为果糖不耐风险较高、乳糖代谢能力较低;用户B偏爱甜食,但体型偏瘦,其基因特征为果糖不耐风险偏低、乳糖代谢能力较强。
可以理解的是,由于用户的基因型是个人独有且加密的,当用户同意对应场景的基因型匹配后,需要在手机\ipad等交互端进行匹配认证,后台会进行计算,计算结果由两人共享;用户之间的连接支持多种移动端互联、包括电脑、手机、pad、智能眼镜、车辆等通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把这些移动端与互联网相连接,进行基因信息的交换和通信。
进一步地,当确定每一个目标用户在待评估类型下的基因特征后,可以基于各个目标用户在待评估类型下的基因特征,对各个目标用户进行相似度匹配,得到相似度匹配结果,最后基因平台可以根据该相似度匹配结果来对各个目标用户在该待评估类型下的基因特征进行评估。
例如,针对多个用户之间饮食等场景可给出甜品、苦味、咸淡比例,含维生素B、维生素D和铁等食物的推荐;针对饮酒能力、易胖风险、糖类代谢、脂类代谢等给出饮食建议;针对皮肤雀斑、抗皱等给出护肤建议;针对运动给出登山、短跑、长跑、散步、划船等运动建议。
另外,当目标用户为多个时,若每一目标用户所选择的待评估类型有所不同,可以将各个目标用户中选择的指导类型最多的类型作为待评估类型;并且,待评估类型的选择个数也可以依据用户的需求进行调整,从而满足不同用户的需求。
更进一步地,本申请中,用户自身可以了解个人基因组和表型相关的信息和遗传代谢风险,以及个人基因在全世界的演化轨迹,与中国华中华南、华北哪个部分的人群最相似、与亚洲、欧洲、非洲、拉丁美洲、韩国、日本等地区人口的相似程度,以及部分基因和姓氏的相似关系。
在一个实施例中,S132中基于每一目标用户在所述待评估类型下的基因特征,对各个目标用户进行相似度匹配,得到相似度匹配结果,可以包括:
S1321:基于各个目标用户在所述待评估类型下的基因特征,对各个目标用户之间进行两两相似度匹配,得到第一相似度匹配结果。
S1322:基于各个目标用户在所述待评估类型下的基因特征,确定每一目标用户与其余目标用户间的整体相似度,得到第二相似度匹配结果。
本实施例中,当多个用户之间进行相似度匹配时,可以基于各个目标用户在待评估类型下的基因特征,对各个目标用户之间进行两两相似度匹配,以及确定每一目标用户与其余目标用户间的整体相似度,从而得到第一相似度匹配结果和第二相似度匹配结果。该第一相似度匹配结果和第二相似度匹配结果量化了多个目标用户在所选场景下的相似性,从而更好地得到评估结果。
进一步地,在对各个目标用户之间进行两两相似度匹配,以及确定每一目标用户与其余目标用户间的整体相似度时,可以选择不同的算法来计算相似度,也可以选择相同的算法来计算相似度,目前较多使用的相似度算法有pearson correlation coefficient(皮尔逊相关系数)、cosine-based similarity(余弦相似度)。本申请可以使用皮尔逊相关系数来计算相似度匹配结果,并根据该相似度匹配结果来推荐合适的指导意见,具体公式如下:
Figure BDA0003453437960000131
其中,u表示用户u,v表示用户u,i表示特征信息中的单个信息,例如表型信息中的单个表型、基因型中的某个位点的基因型等,Iu表示用户u所有的特征信息,ru,i表示用户u的特征信息i的量化值,
Figure BDA0003453437960000132
表示用户u的所有特征信息的平均值,Iv表示用户v所有的特征信息,rv,i表示用户v的特征信息i的量化值,
Figure BDA0003453437960000133
表示用户v的所有特征信息的平均值。
上述通过协同过滤方法来寻找用户的相似性,并进行匹配度打分,进行俩人或多人表型信息和对应基因型的一致性匹配度进行计算,从而得到各个目标用户之间进行两两相似度匹配后的第一相似度匹配结果,接着,可以根据每两个用户之间的第一相似度匹配结果来确定每一目标用户与其余目标用户间的整体相似度,或直接使用皮尔逊相关系数来计算第二相似度匹配结果。
在一个实施例中,所述待评估类型可以包括运动、饮酒、护肤、营养、代谢、遗传疾病、群体演化中的一种或多种。
本申请中,用户自身可以了解个人基因组和表型相关的信息和遗传代谢风险,以及个人基因在全世界的演化轨迹,与中国华中华南、华北哪个部分的人群最相似、与亚洲、欧洲、非洲、拉丁美洲、韩国、日本等地区人口的相似程度,以及部分基因和姓氏的相似关系。
两个或两个以上用户若想进行基因相关的饮食、运动、疾病预防等方面的指导,可访问基因平台,筛选个人希望匹配的表型信息,如护肤场景下,了解长雀斑、长痣的风险以便科学护肤;用餐场景下,匹配饮酒能力,甜食和苦味偏好、情绪性饮食风险、易胖风险、脂肪代谢能力、饱腹感敏感度、咖啡因代谢、乳糖代谢、贴代谢能力、果糖不耐风险、酒精代谢能力、不饱和脂肪酸含量代谢能力、叶酸代谢能力和空腹血糖等,确定怎么吃更营养、健康、尽心;运动场景下,用户进行基因型匹配,给出适合两人先天耐力、爆发力、运动恢复能力、最大摄氧量、软组织损伤风险的运动指导建议;或者抗疫、出国等场景下,了解先天对易感病毒、艾滋病毒、疟疾、麻风病等的抵抗力,减肥、护肤、后代遗传等不同场景下的建议。
下面对本申请实施例提供的基因评估装置进行描述,下文描述的基因评估装置与上文描述的基因评估方法可相互对应参照。
在一个实施例中,如图2所示,图2为本申请实施例提供的一种基因评估装置的结构示意图;本申请还提供了一种基因评估装置,包括数据接收模块210、表型确定模块220、基因评估模块230,具体包括如下:
数据接收模块210,用于接收目标用户发送的基因评估请求,所述基因评估请求包括所述目标用户的基因组数据以及待评估类型,所述基因组数据中包括所述目标用户的变异位点集合。
表型确定模块220,用于确定所述目标用户的变异位点集合中与所述待评估类型对应的目标表型集合。
基因评估模块230,用于基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,并将评估结果发送给所述目标用户。
上述实施例中,在为目标用户提供基于基因层面的指导时,可以先接收该目标用户发送的基因评估请求,该基因评估请求不仅包含目标用户的基因组数据中的变异位点集合,还包含目标用户所选择的待评估类型,接着可以根据目标用户的变异位点集合来确定与待评估类型对应的目标表型集合,由于目标用户的目标表型集合表征该目标用户在待评估类型下的形态、结构和生理、生化等基因特征,因此,根据目标用户的目标表型集合来对目标用户在待评估类型下的基因特征进行评估后,即可得到与用户的基因相关的评估结果;例如,当某一目标用户有关于自身基因的饮食或护肤指导需求时,可以根据该目标用户的变异位点集合来确定与饮食或护肤相关的目标表型集合,通过对该目标表型集合进行评估后,即可得到与该目标用户的饮食或护肤相关的评估结果,目标用户可以根据该评估结果来进行相应的饮食或护肤。
在一个实施例中,本申请还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述基因评估方法的步骤。
在一个实施例中,本申请还提供了一种计算机设备,包括:一个或多个处理器,以及存储器。
所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如上述实施例中任一项所述基因评估方法的步骤。
示意性地,如图3所示,图3为本申请实施例提供的一种计算机设备的内部结构示意图,该计算机设备300可以被提供为一服务器。参照图3,计算机设备300包括处理组件302,其进一步包括一个或多个处理器,以及由存储器301所代表的存储器资源,用于存储可由处理组件302的执行的指令,例如应用程序。存储器301中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件302被配置为执行指令,以执行上述任意实施例的基因评估方法。
计算机设备300还可以包括一个电源组件303被配置为执行计算机设备300的电源管理,一个有线或无线网络接口304被配置为将计算机设备300连接到网络,和一个输入输出(I/O)接口305。计算机设备300可以操作基于存储在存储器301的操作系统,例如WindowsServer TM、Mac OS XTM、Unix TM、Linux TM、Free BSDTM或类似。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种基因评估方法,其特征在于,所述方法包括:
接收目标用户发送的基因评估请求,所述基因评估请求包括所述目标用户的基因组数据以及待评估类型,所述基因组数据中包括所述目标用户的变异位点集合;
参考预先设定的每一变异位点与表型信息之间的对应关系,确定所述目标用户的变异位点集合中的每一变异位点对应的目标表型,以及各个目标表型的类别;根据各个目标表型的类别,确定与所述待评估类型对应的目标表型集合;
基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,并将评估结果发送给所述目标用户;
若所述目标用户的数量为多个;所述基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,包括:
根据每个目标用户的目标表型集合,确定每个目标用户在所述待评估类型下的基因特征;
基于各个目标用户在所述待评估类型下的基因特征,对各个目标用户之间进行两两相似度匹配,得到第一相似度匹配结果;
基于各个目标用户在所述待评估类型下的基因特征,确定每一目标用户与其余目标用户间的整体相似度,得到第二相似度匹配结果;
根据所述第一相似度匹配结果和所述第二相似度匹配结果对各个目标用户在所述待评估类型下的基因特征进行评估。
2.根据权利要求1所述的方法,其特征在于,所述每一变异位点与表型信息之间的对应关系的确定过程,包括:
获取若干用户的基因组数据及对应的表型信息,所述基因组数据中包括用户的变异位点集合;
基于各个用户的基因组数据与表型信息的对应关系,确定每一变异位点与表型信息间的对应关系。
3.根据权利要求2所述的方法,其特征在于,所述基于各个用户的基因组数据与表型信息的对应关系,确定每一变异位点与表型信息间的对应关系,包括:
确定各个用户的基因组数据中各变异位点与表型信息的对应关系;
统计每个变异位点与每个表型信息间对应关系的出现次数;
针对每一变异位点,选取与所述变异位点对应关系出现次数最多的表型信息,作为所述变异位点对应的表型信息,得到所述变异位点与所述表型信息之间的对应关系。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述待评估类型包括运动、饮酒、护肤、营养、代谢、遗传疾病、群体演化中的一种或多种。
5.一种基因评估装置,其特征在于,包括:
数据接收模块,用于接收目标用户发送的基因评估请求,所述基因评估请求包括所述目标用户的基因组数据以及待评估类型,所述基因组数据中包括所述目标用户的变异位点集合;
表型确定模块,用于参考预先设定的每一变异位点与表型信息之间的对应关系,确定所述目标用户的变异位点集合中的每一变异位点对应的目标表型,以及各个目标表型的类别;根据各个目标表型的类别,确定与所述待评估类型对应的目标表型集合;
基因评估模块,用于基于所述目标表型集合对所述目标用户在所述待评估类型下的基因特征进行评估,并将评估结果发送给所述目标用户;
若所述目标用户的数量为多个;所述基因评估模块被配置为:
根据每个目标用户的目标表型集合,确定每个目标用户在所述待评估类型下的基因特征;
基于各个目标用户在所述待评估类型下的基因特征,对各个目标用户之间进行两两相似度匹配,得到第一相似度匹配结果;
基于各个目标用户在所述待评估类型下的基因特征,确定每一目标用户与其余目标用户间的整体相似度,得到第二相似度匹配结果;
根据所述第一相似度匹配结果和所述第二相似度匹配结果对各个目标用户在所述待评估类型下的基因特征进行评估。
6.一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至4中任一项所述基因评估方法的步骤。
7.一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如权利要求1至4中任一项所述基因评估方法的步骤。
CN202111679088.0A 2021-12-31 2021-12-31 基因评估方法、装置、存储介质及计算机设备 Active CN114300044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111679088.0A CN114300044B (zh) 2021-12-31 2021-12-31 基因评估方法、装置、存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111679088.0A CN114300044B (zh) 2021-12-31 2021-12-31 基因评估方法、装置、存储介质及计算机设备

Publications (2)

Publication Number Publication Date
CN114300044A CN114300044A (zh) 2022-04-08
CN114300044B true CN114300044B (zh) 2023-04-18

Family

ID=80975757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111679088.0A Active CN114300044B (zh) 2021-12-31 2021-12-31 基因评估方法、装置、存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN114300044B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3859739A1 (en) * 2020-02-03 2021-08-04 Atlas Biomed Group Limited Phenotype inference based on incomplete genetic data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010045470A2 (en) * 2008-10-15 2010-04-22 Dana-Farber Cancer Institute, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of hepatic disorders
EP3077942A4 (en) * 2013-12-07 2017-11-22 Colby, Brandon System and method for real-time personalization utilizing an individual's genomic data
CN106667490B (zh) * 2017-01-09 2017-12-29 北京师范大学 一种基于磁共振脑影像的被试对象间个体差异的数据间关系分析方法
CN108629153A (zh) * 2017-03-23 2018-10-09 广州康昕瑞基因健康科技有限公司 医学基因分析方法和系统
CN107391908A (zh) * 2017-06-28 2017-11-24 天方创新(北京)信息技术有限公司 运动风险评估方法及装置
WO2020043560A1 (en) * 2018-08-28 2020-03-05 Koninklijke Philips N.V. Method for assessing genome alignment basis
CN110246581A (zh) * 2019-07-02 2019-09-17 广东瑞昊生物技术有限公司 基于基因检测的评估系统
EP3792923A1 (en) * 2019-09-16 2021-03-17 Siemens Healthcare GmbH Method and device for exchanging information regarding the clinical implications of genomic variations
CN111883223B (zh) * 2020-06-11 2021-05-25 国家卫生健康委科学技术研究所 患者样本数据中结构变异的报告解读方法及系统
CN113761393A (zh) * 2021-09-26 2021-12-07 广州华多网络科技有限公司 商品协同推荐方法及其装置、设备、介质、产品

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3859739A1 (en) * 2020-02-03 2021-08-04 Atlas Biomed Group Limited Phenotype inference based on incomplete genetic data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Laura M Amendola 等.Actionable exomic incidental findings in 6503 participants: challenges of variant classification.《Genome Res.》.2015,第25卷(第3期),第305-315页. *

Also Published As

Publication number Publication date
CN114300044A (zh) 2022-04-08

Similar Documents

Publication Publication Date Title
US10950335B2 (en) Health tracking device
Kirk et al. Precision nutrition: A systematic literature review
Shah et al. Data mining and genetic algorithm based gene/SNP selection
US20170206327A1 (en) Self-improving method of using online communities to predict health-related outcomes
JP5633080B2 (ja) 属性値推定装置、属性値推定方法、プログラム及び記録媒体
Pham et al. Body mass index and facial cues in Sasang typology for young and elderly persons
US20220165389A1 (en) Personalized meal diet and exercise providing method using integrated health information and service system
US20220365934A1 (en) Linking individual datasets to a database
JP2019063027A (ja) 月経タイプ特定システム及びプログラム
CN114207726A (zh) 实现肌肤咨询的基因检查方法
US20140180599A1 (en) Methods and apparatus for analyzing genetic information
CN114300044B (zh) 基因评估方法、装置、存储介质及计算机设备
KR20180103305A (ko) 문진 데이터 및 카메라 데이터에 기반한 진단용 데이터 처리 장치 및 그 시스템
JP6992505B2 (ja) 情報処理装置、方法及びプログラム
WO2004012128A1 (ja) 分子時刻表作成装置及び体内時計推定装置
US20220164935A1 (en) Photo composites
KR102438323B1 (ko) 피부 솔루션을 제공하는 장치 및 방법
CN110473616B (zh) 一种语音信号处理方法、装置及系统
JP3315109B1 (ja) 体質判定システム
US20220093233A1 (en) Nutrient intake amount estimation system, nutrient intake amount estimation method, nutrient intake amount estimation device, storage medium, and nutrient intake amount output method
Rahman Quantifying human biological age: A machine learning approach
US20230342364A1 (en) Filtering individual datasets in a database
CN109545277B (zh) 一种猝死基因突变点位的评分方法及系统
Plemons The Interaction between Genetics and Climate on Craniofacial Variation: Examining the Causative Forces of Macromorphoscopic Trait Expression
Lu et al. Hierarchical Fisher Kernels for longitudinal data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40066398

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant