CN109658984B - 一种信息推荐和信息推荐模型训练方法、相关装置 - Google Patents

一种信息推荐和信息推荐模型训练方法、相关装置 Download PDF

Info

Publication number
CN109658984B
CN109658984B CN201811549844.6A CN201811549844A CN109658984B CN 109658984 B CN109658984 B CN 109658984B CN 201811549844 A CN201811549844 A CN 201811549844A CN 109658984 B CN109658984 B CN 109658984B
Authority
CN
China
Prior art keywords
information
disease
cell line
compound
fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811549844.6A
Other languages
English (en)
Other versions
CN109658984A (zh
Inventor
管峥
王丽君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Deep Intelligent Pharma Technology Co ltd
Original Assignee
Beijing Deep Intelligent Pharma Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Deep Intelligent Pharma Technology Co ltd filed Critical Beijing Deep Intelligent Pharma Technology Co ltd
Priority to CN201811549844.6A priority Critical patent/CN109658984B/zh
Publication of CN109658984A publication Critical patent/CN109658984A/zh
Application granted granted Critical
Publication of CN109658984B publication Critical patent/CN109658984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请实施例公开了一种信息推荐和信息推荐模型训练方法、相关装置,在对待分析化合物能够治疗的疾病病种进行预测时,可以确定第一细胞系指纹,第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;将第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数,信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的。由于疾病信息匹配指数可以较为准确地反映出待分析化合物治疗不同疾病的可能性,因此,根据疾病信息匹配指数向用户推荐的疾病信息即待分析化合物可能治疗的疾病。与传统方式相比,本申请实施例不依赖于人类的经验知识,能够准确地确定出待分析化合物可能治疗的疾病,为药物研发提供依据。

Description

一种信息推荐和信息推荐模型训练方法、相关装置
技术领域
本申请涉及药品研发领域,特别是涉及一种信息推荐和信息推荐模型训练方法、相关装置。
背景技术
药物是用于治疗疾病的特殊商品,药物是由化合物构成的,可能构成药物的化合物针对不同细胞系的药理作用,可以反映出该化合物可能治疗疾病病种,这样,当针对特定疾病研发药物时,根据各个化合物的药理作用可以确定出药物的组成,从而研发出治疗特定疾病的药物。可见,确定化合物可能治疗疾病病种对于药物研发具有重要的作用。
目前,确定化合物可能治疗疾病病种的方法主要是进行大量基于细胞系的试验,即将候选成药物的每个化合物在不同细胞系中进行试验,检测这些化合物对不同细胞系的药理活性等指标。这些指标能够从一定程度上体现出某些候选成药物化合物潜在的药理作用,但是试验中得到的化合物的药理活性等指标并不能直接指导该化合物对于哪些疾病会有比较大可能性产生治疗作用,还需要专家依据药物开发经验并通过丰富的生物学和药理学知识综合判断,从而确定候选成药物的化合物可能治疗某类或某几类疾病。
然而,这种方法依赖于专家经验知识,取决于专家的个人医学水平,不同专家确定出的结果可能有所不同,因此,这种方法可能出现难以确定出疾病病种或者确定结果不够准确的情况。
发明内容
为了解决上述技术问题,本申请提供了一种信息推荐和信息推荐模型训练方法、相关装置,不依赖于人类的经验知识,能够准确地确定出待分析化合物可能治疗的疾病,为药物研发提供依据。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种信息推荐方法,所述方法包括:
确定第一细胞系指纹,所述第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;
将所述第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数;所述信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的;所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值;所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
根据所述疾病信息匹配指数向用户推荐疾病信息。
可选的,所述确定第一细胞系指纹,包括:
将所述待分析化合物的化合物信息输入到指纹模型得到所述第一细胞系指纹,所述指纹模型是根据所述各个历史化合物的化合物信息和第二细胞系指纹训练得到的。
可选的,所述确定第一细胞系指纹,包括:
根据细胞系试验结果获取所述第一细胞系指纹。
可选的,所述根据所述疾病信息匹配指数向用户推荐疾病信息,包括:
向所述用户推荐所述疾病信息匹配指数满足预设条件的疾病信息。
可选的,所述细胞疾病相关性信息是根据细胞系的生物信息特征和疾病的生物信息特征构建的。
第二方面,本申请实施例提供了一种信息推荐装置,所述装置包括确定单元、输入单元和推荐单元:
所述确定单元,用于确定第一细胞系指纹,所述第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;
所述输入单元,用于将所述第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数;所述信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的;所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值;所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
所述推荐单元,用于根据所述疾病信息匹配指数向用户推荐疾病信息。
可选的,所述确定单元,具体用于将所述待分析化合物的化合物信息输入到指纹模型得到所述第一细胞系指纹,所述指纹模型是根据所述各个历史化合物的化合物信息和第二细胞系指纹训练得到的。
可选的,所述确定单元,具体用于根据细胞系试验结果获取所述第一细胞系指纹。
可选的,所述推荐单元,具体用于向所述用户推荐所述疾病信息匹配指数满足预设条件的疾病信息。
可选的,所述细胞疾病相关性信息是根据细胞系的生物信息特征和疾病的生物信息特征构建的。
第三方面,本申请实施例提供了一种信息推荐模型的构建方法,所述方法包括:
确定第二细胞系指纹和细胞疾病相关性信息,所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值,所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建所述信息推荐模型。
可选的,所述方法还包括:
利用已上市药物对所述信息推荐模型进行校正优化
第四方面,本申请实施例提供了一种信息推荐模型的构建装置,所述装置包括确定单元和构建单元:
所述确定单元,用于确定第二细胞系指纹和细胞疾病相关性信息,所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值,所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
所述构建单元,用于根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建所述信息推荐模型。
可选的,所述装置还包括优化单元:
所述优化单元,用于利用已上市药物对所述信息推荐模型进行校正优化。
由上述技术方案可以看出,本申请实施例具有以下优点:
在对待分析化合物能够治疗的疾病病种进行预测时,可以确定第一细胞系指纹,第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;将第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数,信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的,第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值,细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性。由于信息推荐模型考虑到疾病所对应的细胞疾病相关性信息,即能够反映出发生疾病时细胞系在体内的真实变异情况,故,疾病信息匹配指数可以较为准确地反映出待分析化合物治疗不同疾病的可能性,因此,根据疾病信息匹配指数向用户推荐的疾病信息即待分析化合物可能治疗的疾病。与传统方式相比,本申请实施例不依赖于人类的经验知识,能够准确地确定出待分析化合物可能治疗的疾病,为药物研发提供依据。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种信息推荐方法的流程图;
图2为本申请实施例提供的一种指纹模型训练过程的示例图;
图3为本申请实施例提供的一种信息推荐模型的构建方法的流程图;
图4为本申请实施例提供的一种细胞疾病相关性信息的示例图;
图5为本申请实施例提供的一种信息推荐模型的示例图;
图6为本申请实施例提供的一种信息推荐装置的结构图;
图7为本申请实施例提供的一种信息推荐模型的构建装置的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
在传统方法中,由于基于细胞系的试验是在体外进行的,长期在体外的细胞系和在体内的细胞系的生物特征可能会有所不同,并且细胞系在体内时,该化合物也不一定能到达该细胞系所在部位,因此,还需要专家依据药物开发经验并通过丰富的生物学和药理学知识综合判断,从而确定候选成药物的化合物可能治疗某类或某几类疾病。这种方法依赖于专家经验知识,取决于专家的个人医学水平,不同专家确定出的结果可能有所不同,因此,这种方法可能出现难以确定出疾病病种或者确定结果不够准确的情况。
为此,本申请实施例提供了一种信息推荐方法,该方法利用信息推荐模型得到疾病信息匹配指数,进而根据疾病信息匹配指数向用户推荐疾病信息,由于推荐模型考虑到疾病所对应的细胞疾病相关性信息,即能够反映出发生疾病时细胞系在体内的真实变异情况,故,疾病信息匹配指数可以较为准确地反映出待分析化合物对治疗不同疾病的可能性。因此,根据疾病信息匹配指数向用户推荐的疾病信息即待分析化合物可能治疗的疾病。本申请实施例提供的信息推荐方法不依赖于人类的经验知识,能够准确地确定出待分析化合物可能治疗的疾病,为药物研发提供依据。
接下来,将结合附图对本申请实施例提供的信息推荐方法进行介绍。
参见图1,图1示出了一种信息推荐方法的流程图,该方法包括:
S101、确定第一细胞系指纹,所述第一细胞系指纹体现待分析化合物对于不同细胞系的活性值。
需要说明的是,确定第一细胞系指纹的方式可以包括多种,本实施例将以两种进行介绍。第一种确定第一细胞系指纹的方法可以是:将所述待分析化合物的化合物信息输入到指纹模型得到所述第一细胞系指纹,所述指纹模型是根据所述各个历史化合物的化合物信息和第二细胞系指纹训练得到的。
其中,第二细胞系指纹可以是根据历史数据确定的。具体的,可以首先获取历史数据,所述历史数据可以从生物学、药物化学、药理学的开源数据库中获取,例如:有机小分子生物活性数据(PubChem),化学品数据库(ChEMBL)等;也可以从历史化合物与不同细胞系进行试验的试验结果获取。然后,通过数据处理和自然语言处理方法提取出以下信息:历史化合物的化合物信息、细胞系信息和历史化合物在不同细胞系中测试出的活性数据,化合物信息例如包括历史化合物的身份标识(Identification,简称ID)、结构信息、分子描述信息等,细胞系信息例如包括细胞系ID、细胞系名称,细胞系描述信息等,历史化合物在不同细胞系中测试出的活性数据包括半抑制浓度(50%inhibitory concentration,简称IC50)、半最大效应浓度(concentration for 50%of maximal effect,简称EC50)等,一般情况下,IC50或EC50的值越小,表示历史化合物对某细胞系的抑制效果越好。
为了便于建立指纹模型,细胞系的活性数据可以从连续性数据处理为分级数据,例如采用二元数据分级的方法,将IC50小于预设阈值的活性数据设置为0,IC50大于预设阈值的活性数据设置为1。对得到的细胞系的活性数据进一步处理,例如剔除异常值,归一化,将活性数据整理为可以建立指纹模型的形式。例如表1所示:
表1
Figure BDA0001910357050000061
在表1中,对于每一个化合物ID标识的历史化合物,对应的维度包括结构编码,分子描述信息和其在不同细胞系中的活性数据。其中,每个历史化合物的不同细胞系活性可以组成一个特定的“第二细胞系指纹”。以活性数据以二元数据分级为例,例如对于化合物ID为1的历史化合物,其在n种细胞系(细胞系1,细胞系2……细胞系n)中的活性数据可以组成一个第二细胞系指纹为:101…1(长度为n)。
接着,根据各个历史化合物的化合物信息和第二细胞系指纹训练指纹模型,例如,可以通过机器学习或者深度学习对指纹模型进行训练,如图2所示。这样,当给定一个新化合物例如待分析化合物后,通过此指纹模型可以根据输入此指纹模型的待分析化合物的化合物信息生成该待分析化合物对应的第一细胞系指纹。
第二种确定第一细胞系指纹的方法可以是:利用待分析化合物对不同的细胞系进行试验,从而根据细胞系试验结果确定第一细胞系指纹。
S102、将所述第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数。
所述信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的,所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值;所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性,一个细胞系的生物信息特征和一种疾病的生物信息特征之间的相关性高,可以认为发生该疾病时,该细胞系发生变异。
也就是说,该信息推荐模型可以将待分析化合物可以抑制的细胞系所具有的生物信息特征与疾病所具有的生物信息特征进行匹配,生物信息特征例如可以是基因突变、特定蛋白表达等。当待分析化合物可以抑制的细胞系所具有的生物信息特征与某一疾病所具有的生物信息特征相匹配时,可以认为待分析化合物对该疾病具有积极作用,二者相匹配的生物信息特征数量越多,待分析化合物对该疾病的治疗效果越好,疾病信息匹配指数也会相应的增大。
其中,疾病信息匹配指数可以用分数来表示,待分析化合物可以抑制的细胞系所具有的生物信息特征与某一疾病所具有的生物信息特征存在一个生物信息特征相匹配,则疾病信息匹配指数可以增加1。
需要说明的是,所述细胞疾病相关性信息可以是根据细胞系的生物信息特征和疾病的生物信息特征构建的,其中生物信息特征又可以称为生信特征。细胞系的生信特征具体可以包括基因组、转录组、蛋白质组等。疾病的生信特征具体可以包括基因突变位点、频率,蛋白表达异常信息等。细胞疾病相关性信息和信息推荐模型的构建方法将在后续进行详细介绍。
针对待分析化合物,可以利用S102确定出待分析化合物针对不同疾病的疾病信息匹配指数,以便后续利用疾病信息匹配指数确定出待分析化合物可能治疗的疾病。
以待分析化合物为化合物1为例,若其在n种细胞系(细胞系1,细胞系2……细胞系n)中的活性数据组成的第一细胞系指纹为:101…0,其中,0表示化合物1对该细胞系的活性较好,即化合物1可以抑制该细胞系,1表示化合物1对该细胞系的活性较差,即化合物1难以抑制该细胞系,因此,第一细胞系指纹可以表示化合物1难以抑制细胞系1、可以抑制细胞系2、难以抑制细胞系3、……可以抑制细胞系n等。而细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性,根据细胞疾病相关性信息可以确定针对某种疾病,该发生该疾病时哪些细胞系正常,哪些细胞系发生变异,例如,针对疾病1,其所对应的细胞疾病相关性信息反映出发生疾病1时,细胞系1异常、细胞系2变异、细胞系3正常、……细胞系n变异。由此可知,化合物1难以抑制细胞系1,且发生疾病1时细胞系1变异,说明化合物1难以抑制发生疾病1时细胞系1的变异,疾病信息匹配指数不变;化合物1可以抑制细胞系2,且发生疾病1时细胞系2变异,那么,化合物1可以抑制发生疾病1时细胞系2的变异,疾病信息匹配指数增加1,依次类推,直到完成全部匹配过程,确定出化合物1针对疾病1的疾病信息匹配指数。同理,还可以利用S102确定出化合物1细胞系2其他疾病的疾病信息匹配指数。
S103、根据所述疾病信息匹配指数向用户推荐疾病信息。
疾病信息匹配指数反映出待分析化合物治疗不同疾病的可能性,疾病信息匹配指数越大,待分析化合物治疗该疾病的可能性越大。
向用户推荐疾病信息可以作为研发药物的依据,一般情况下,向用户推荐的疾病信息应该是疾病信息匹配指数较高的疾病信息,这样,据此研发出的药物对这些疾病才可以具有较好的治疗效果。因此,在一种实现方式中,S103的实现方式可以是向所述用户推荐所述疾病信息匹配指数满足预设条件的疾病信息,所述预设条件可以是疾病信息匹配指数超出预设阈值。当然,在一种实现方式中,S103的实现方式也可以是向所述用户推荐所述疾病信息匹配指数最大的疾病信息。
由上述技术方案可以看出,在对待分析化合物能够治疗的疾病病种进行预测时,可以确定第一细胞系指纹,第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;将第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数,信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的,第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值,细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性。由于信息推荐模型考虑到疾病所对应的细胞疾病相关性信息,即能够反映出发生疾病时细胞系在体内的真实变异情况,故,疾病信息匹配指数可以较为准确地反映出待分析化合物治疗不同疾病的可能性,因此,根据疾病信息匹配指数向用户推荐的疾病信息即待分析化合物可能治疗的疾病。与传统方式相比,本申请实施例不依赖于人类的经验知识,能够准确地确定出待分析化合物可能治疗的疾病,为药物研发提供依据。
接下来,将对信息推荐模型的构建方法进行介绍。参见图3,所述方法包括:
S301、确定第二细胞系指纹和细胞疾病相关性信息。
所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值,所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性。
第二细胞系指纹的确定方法在图1对应的实施例中已经进行了介绍,此处不再赘述。本实施例主要介绍细胞疾病相关性信息的确定方法。
在确定细胞疾病相关性信息时,首先,收集相关数据并建立细胞系与疾病的数据库。例如,可以从肿瘤细胞系数据库(Cancer Cell Line Encyclopedia,简称CCLE)、癌症基因突变数据库(COSMIC)、肿瘤基因组图谱(The Cancer Genome Atlas,简称TCGA)等数据库的收集相关数据,建立两个数据库,第一个数据库包含了不同细胞系的生信特征,另一个数据库包含了不同疾病的生信特征。
根据细胞系的生信特征和疾病的生信特征,可以构建出每个细胞系和疾病的生物信息矩阵,并且以疾病为维度建立每个疾病的细胞疾病相关性信息,参见图4所示。
S302、根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建所述信息推荐模型。
将第二细胞系指纹和细胞疾病相关性信息进行匹配,例如,可以通过数学方法计算二者的相似度进行匹配从而建立信息推荐模型。信息推荐模型可以参见图5所示,这样,信息推荐模型可以反映出不同化合物可能治疗的疾病,例如图5中,化合物1可能治疗疾病2,化合物4可能治疗疾病n。
在一种实现方式中,为了保证信息推荐模型的准确、可靠,可以利用已上市药物对所述信息推荐模型进行校正优化。
由上述技术方案可知,根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建的信息推荐模型,由于细胞疾病相关性信息能够反映出细胞系的生物信息特征和疾病的生物信息特征之间的相关性,匹配结果反映出历史化合物对于发生疾病时体内变异细胞系的抑制作用,进而反映出历史化合物对于不同疾病的治疗可能性,因此,根据该信息推荐模型可以较为准确地确定出待分析化合物可能治疗的疾病。
基于前述实施例提供的一种信息推荐方法,本实施例提供一种信息推荐装置,参见图6,所述装置包括确定单元601、输入单元602和推荐单元603:
所述确定单元601,用于确定第一细胞系指纹,所述第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;
所述输入单元602,用于将所述第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数;所述信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的;所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值;所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
所述推荐单元603,用于根据所述疾病信息匹配指数向用户推荐疾病信息。
可选的,所述确定单元601,具体用于将所述待分析化合物的化合物信息输入到指纹模型得到所述第一细胞系指纹,所述指纹模型是根据所述各个历史化合物的化合物信息和第二细胞系指纹训练得到的。
可选的,所述确定单元601,具体用于根据细胞系试验结果获取所述第一细胞系指纹。
可选的,所述推荐单元603,具体用于向所述用户推荐所述疾病信息匹配指数满足预设条件的疾病信息。
可选的,所述细胞疾病相关性信息是根据细胞系的生物信息特征和疾病的生物信息特征构建的。
由上述技术方案可以看出,在对待分析化合物能够治疗的疾病病种进行预测时,可以确定第一细胞系指纹,第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;将第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数,信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的,第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值,细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性。由于信息推荐模型考虑到疾病所对应的细胞疾病相关性信息,即能够反映出发生疾病时细胞系在体内的真实变异情况,故,疾病信息匹配指数可以较为准确地反映出待分析化合物治疗不同疾病的可能性,因此,根据疾病信息匹配指数向用户推荐的疾病信息即待分析化合物可能治疗的疾病。与传统方式相比,本申请实施例不依赖于人类的经验知识,能够准确地确定出待分析化合物可能治疗的疾病,为药物研发提供依据。
本实施例还提供一种信息推荐模型的构建装置,参见图7,所述装置包括确定单元701和构建单元702:
所述确定单元701,用于确定第二细胞系指纹和细胞疾病相关性信息,所述第二细胞系指纹体现所述各个历史化合物分别对于不同细胞系的活性值,所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
所述构建单元702,用于根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建所述信息推荐模型。
可选的,所述装置还包括优化单元:
所述优化单元,用于利用已上市药物对所述信息推荐模型进行校正优化。
由上述技术方案可知,根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建的信息推荐模型,由于细胞疾病相关性信息能够反映出细胞系的生物信息特征和疾病的生物信息特征之间的相关性,匹配结果反映出历史化合物对于发生疾病时体内变异细胞系的抑制作用,进而反映出历史化合物对于不同疾病的治疗可能性,因此,根据该信息推荐模型可以较为准确地确定出待分析化合物可能治疗的疾病。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-onlymemory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种信息推荐方法,其特征在于,所述方法包括:
确定第一细胞系指纹,所述第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;
将所述第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数;所述信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的;所述第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值;所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;所述信息推荐模型用于将所述待分析化合物抑制的细胞系所具有的生物信息特征与疾病所具有的生物信息特征进行匹配,以得到所述疾病信息匹配指数;
根据所述疾病信息匹配指数向用户推荐疾病信息。
2.根据权利要求 1 所述的方法,其特征在于,所述确定第一细胞系指纹,包括:
将所述待分析化合物的化合物信息输入到指纹模型得到所述第一细胞系指纹,所述指纹模型是根据所述各个历史化合物的化合物信息和第二细胞系指纹训练得到的。
3.根据权利要求 1 所述的方法,其特征在于,所述确定第一细胞系指纹,包括:
根据细胞系试验结果获取所述第一细胞系指纹。
4.根据权利要求 1 所述的方法,其特征在于,所述根据所述疾病信息匹配指数向用户推荐疾病信息,包括:
向所述用户推荐所述疾病信息匹配指数满足预设条件的疾病信息。
5.根据权利要求 1 所述的方法,其特征在于,所述细胞疾病相关性信息是根据细胞系的生物信息特征和疾病的生物信息特征构建的。
6.一种信息推荐装置,其特征在于,所述装置包括确定单元、输入单元和推荐单元:
所述确定单元,用于确定第一细胞系指纹,所述第一细胞系指纹体现待分析化合物对于不同细胞系的活性值;
所述输入单元,用于将所述第一细胞系指纹输入到信息推荐模型得到疾病信息匹配指数;所述信息推荐模型是根据第二细胞系指纹和细胞疾病相关性信息的匹配结果构建的;所述第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值;所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;所述信息推荐模型用于将所述待分析化合物抑制的细胞系所具有的生物信息特征与疾病所具有的生物信息特征进行匹配,以得到所述疾病信息匹配指数;
所述推荐单元,用于根据所述疾病信息匹配指数向用户推荐疾病信息。
7.根据权利要求 6 所述的装置,其特征在于,所述确定单元,具体用于将所述待分析化合物的化合物信息输入到指纹模型得到所述第一细胞系指纹,所述指纹模型是根据所述各个历史化合物的化合物信息和第二细胞系指纹训练得到的。
8.一种信息推荐模型的构建方法,其特征在于,所述方法包括:
确定第二细胞系指纹和细胞疾病相关性信息,所述第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值,所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建所述信息推荐模型;所述信息推荐模型用于将待分析化合物抑制的细胞系所具有的生物信息特征与疾病所具有的生物信息特征进行匹配,以得到疾病信息匹配指数。
9.根据权利要求 8 所述的方法,其特征在于,所述方法还包括:
利用已上市药物对所述信息推荐模型进行校正优化。
10.一种信息推荐模型的构建装置,其特征在于,所述装置包括确定单元和构建单元:
所述确定单元,用于确定第二细胞系指纹和细胞疾病相关性信息,所述第二细胞系指纹体现各个历史化合物分别对于不同细胞系的活性值,所述细胞疾病相关性信息体现细胞系的生物信息特征和疾病的生物信息特征之间的相关性;
所述构建单元,用于根据所述第二细胞系指纹和所述细胞疾病相关性信息的匹配结果构建所述信息推荐模型;所述信息推荐模型用于将待分析化合物抑制的细胞系所具有的生物信息特征与疾病所具有的生物信息特征进行匹配,以得到疾病信息匹配指数。
CN201811549844.6A 2018-12-18 2018-12-18 一种信息推荐和信息推荐模型训练方法、相关装置 Active CN109658984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811549844.6A CN109658984B (zh) 2018-12-18 2018-12-18 一种信息推荐和信息推荐模型训练方法、相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811549844.6A CN109658984B (zh) 2018-12-18 2018-12-18 一种信息推荐和信息推荐模型训练方法、相关装置

Publications (2)

Publication Number Publication Date
CN109658984A CN109658984A (zh) 2019-04-19
CN109658984B true CN109658984B (zh) 2021-12-03

Family

ID=66113377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811549844.6A Active CN109658984B (zh) 2018-12-18 2018-12-18 一种信息推荐和信息推荐模型训练方法、相关装置

Country Status (1)

Country Link
CN (1) CN109658984B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0003386B8 (pt) * 2000-08-08 2021-05-25 Cristalia Produtos Quim Farmaceuticos Ltda pró-droga homo ou heterodiméricas úteis no tratamento de doenças ou disfunções mediadas por fosfodiesterases; composições farmacêuticas contendo a pró-droga ou seus sais farmacêuticos aceitáveis; processo de obtenção destas pró-drogas
CN101013111B (zh) * 2007-02-13 2010-05-19 段为钢 中药有效成分谱筛选方法
CN101182535A (zh) * 2007-11-21 2008-05-21 清华大学 一种与TGF-β信号通路相关药物的筛选模型及其专用载体
CN102507883B (zh) * 2011-11-16 2014-10-08 上海生物信息技术研究中心 一种基于生物过程预测药物新疗效的方法及应用
CN102879486B (zh) * 2012-09-05 2014-08-13 山东大学 一种筛选中药药效相关成分的方法及模型建立方法
CN104298891B (zh) * 2014-09-23 2017-11-21 山东大学 一种以crac通道为靶点的抗炎、抗免疫药物的虚拟筛选方法
WO2017040311A1 (en) * 2015-08-28 2017-03-09 The Trustees Of Columbia University In The City Of New York Systems and methods for matching oncology signatures
CN107731309B (zh) * 2017-08-31 2020-01-21 武汉百药联科科技有限公司 一种药物活性的预测方法及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Reversal of cancer gene expression correlates with drug efficacy and reveals therapeutic targets;Bin Chen,and etc;《Nature Communications》;20170712;第1-12页 *

Also Published As

Publication number Publication date
CN109658984A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
Zhavoronkov et al. Artificial intelligence for aging and longevity research: Recent advances and perspectives
Zhavoronkov et al. Deep biomarkers of aging and longevity: from research to applications
Padula et al. Machine learning methods in health economics and outcomes research—the PALISADE checklist: a good practices report of an ISPOR task force
WO2016201564A1 (en) Neural network architectures for linking biological sequence variants based on molecular phenotype, and systems and methods therefor
Zhang et al. Discerning novel splice junctions derived from RNA-seq alignment: a deep learning approach
CN113012770B (zh) 基于多模态深度神经网络药物-药物相互作用事件预测
CN113597645A (zh) 用于重建药物应答和疾病网络的方法和系统以及其用途
US20140089003A1 (en) Patient health record similarity measure
Sughasiny et al. Application of machine learning techniques, big data analytics in health care sector–a literature survey
WO2014052921A2 (en) Patient health record similarity measure
US20240197245A1 (en) Methods and systems for utilizing diagnostics for informed vibrant constituional guidance
CN115954072A (zh) 一种智能临床试验方案生成方法及相关装置
Wang et al. Subpopulation detection and their comparative analysis across single-cell experiments with scPopCorn
Rama et al. AliClu-Temporal sequence alignment for clustering longitudinal clinical data
CN112071439B (zh) 药物副作用关系预测方法、系统、计算机设备和存储介质
CN116486899A (zh) 药物和靶点匹配的判断方法、系统、设备及介质
CN109658984B (zh) 一种信息推荐和信息推荐模型训练方法、相关装置
US20140089004A1 (en) Patient cohort laboratory result prediction
US20170169183A1 (en) Quantitative assessment of drug recommendations
US20240303544A1 (en) Graph database techniques for machine learning
Golder et al. Best practices on big data analytics to address sex-specific biases in our understanding of the etiology, diagnosis, and prognosis of diseases
Krainc et al. Shifting the trajectory of therapeutic development for neurological and psychiatric disorders
Cui et al. Using Electronic Medical Records and Clinical Notes to Predict the Outcome of Opioid Treatment Program
Feng et al. Knowledge Graph-based Thought: a knowledge graph enhanced LLMs framework for pan-cancer question answering
US20230253115A1 (en) Methods and systems for predicting in-vivo response to drug therapies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant