CN109448853B - 一种基于矩阵分解的食物-疾病关联预测方法 - Google Patents

一种基于矩阵分解的食物-疾病关联预测方法 Download PDF

Info

Publication number
CN109448853B
CN109448853B CN201811072187.0A CN201811072187A CN109448853B CN 109448853 B CN109448853 B CN 109448853B CN 201811072187 A CN201811072187 A CN 201811072187A CN 109448853 B CN109448853 B CN 109448853B
Authority
CN
China
Prior art keywords
food
disease
matrix
similarity
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811072187.0A
Other languages
English (en)
Other versions
CN109448853A (zh
Inventor
王嫄
张耀功
陈赠光
杨巨成
李政
史艳翠
赵青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Science and Technology
Original Assignee
Tianjin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Science and Technology filed Critical Tianjin University of Science and Technology
Priority to CN201811072187.0A priority Critical patent/CN109448853B/zh
Publication of CN109448853A publication Critical patent/CN109448853A/zh
Application granted granted Critical
Publication of CN109448853B publication Critical patent/CN109448853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Nutrition Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种基于矩阵分解的食物‑疾病关联预测方法,利用成分表构建食物相似度网络;利用国际疾病分类数据构建疾病相关度网络;正则化食物相似度网络;正则化疾病相关度网络;构造已知的二元食物‑疾病关联网络;随机初始化要预测的食物‑疾病关联矩阵;引入捕捉真实食物相似度的矩阵和疾病真实相关度的矩阵,迭代学习模型参数,输出预测的食物和疾病关联矩阵Y、食物相似度真实情况的拟合矩阵和疾病相关度真实情况的拟合矩阵。本发明结合食物之间相似度和疾病相关度,对已知关联和要预测关联进行矩阵近似建模,可在人力物力消耗极低的情况下,为食物疾病关联研究提供指导,减少数据噪音的影响,提升食物和疾病关联预测模型的准确性。

Description

一种基于矩阵分解的食物-疾病关联预测方法
技术领域
本发明属于食品安全领域,尤其是一种基于矩阵分解的食物-疾病关联预测方法。
背景技术
随着我国国民经济的迅速发展和人民健康意识的不断提高,人们对生命质量的要求也越来越高,为追求健康,对饮食指南的需求越来越强烈。已有研究表明,膳食与疾病的发生、发展有着密切的关系,典型的如内分泌代谢疾病与高脂食物之间,粗粮饮食与乳腺癌之间;喝咖啡与结肠癌之间的、盐渍萝卜和腌制肉类与胃癌之间存在的相关关系等。
目前,为了研究上述关系,只能通过局部人口学采样、调查问卷、口述内容或者活体实验得到相关数据,并进行统计分析。但这种关联获取方式需要消耗极大的人力物力,尤其置信度高的活体实验,仍旧存在较大的风险,难以满足人民细致的食物-疾病关联的知情需求。典型的风险主要在于调查问卷被调查对象错误信息的填写,调查问卷中指标的有偏统计,被调查者多方面因素综合作用,并非单一食品变量因素。活体实验中实验者的操作也是风险来源之一。此外,随着食品种类的快速增长,实验和调查的成本成指数级增长,而由于人力物力限制,事实研究不能及时更新,只能集中在少数疾病和少数食品范畴。
综上所述,食品与疾病的关联是目前热门的关注领域。对于广泛的食品和疾病的关联尚未出现置信度高、受众广的预测方法。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于矩阵分解的食物-疾病关联预测方法,解决食物疾病预测任务的准确性低以及采用随机试验带来的大量的人力和资源的消耗。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于矩阵分解的食物-疾病关联预测方法,包括以下步骤:
步骤1:利用成分表构建食物相似度网络W1
步骤2:利用国际疾病分类数据构建疾病相关度网络W2
步骤3:正则化食物相似度网络,得到正则化的食物相似度网络
Figure BDA0001799831790000011
步骤4:正则化疾病相关度网络,得到正则化的疾病相关度网络
Figure BDA0001799831790000012
步骤5:构造已知的二元食物-疾病关联网络
Figure BDA0001799831790000013
步骤6:随机初始化要预测的食物-疾病关联矩阵Y;
步骤7:引入捕捉真实食物相似度的矩阵S1和疾病真实相关度的矩阵S2,迭代学习模型参数,输出预测的食物和疾病关联矩阵Y、食物相似度真实情况的拟合矩阵S1和疾病相关度真实情况的拟合矩阵S2
进一步,所述步骤1的具体实现方法为:将每一个节点设置为“食物-量-食用方法”的组合,在“量-食用方法”不同的情况下,将两两节点关系置为0;在“量-食用方法”相同的情况下,根据食物成分表,利用余弦公式,计算两两食物之间的相似度,作为节点关系值,从而得到食物相似度网络W1
进一步,所述步骤2的具体实现方法为:根据国际疾病分类数据,如果两种疾病同属同一类目,则相关度设置为k,如果两种疾病同属同一亚目,则相关度设置为2k,如果两种疾病同属同一细目,则相关度设置为3k,其中3k<1,从而得到疾病相关度网络W2
进一步,所述步骤3的具体实现方法为:设n为“食物名-量-食用方法”的组合数,W1∈Rn×n是食物相似度网络,则W1用于构造正则化的食物相似度网络
Figure BDA0001799831790000021
为:
Figure BDA0001799831790000022
其中,D1是W1的对角化矩阵,对角线上元素为对应的W1的行和。
进一步,所述步骤4的具体实现方法为:设m为疾病数,W2∈Rm×m是疾病相关度网络,则W2用于构造正则化的疾病相关度网络
Figure BDA0001799831790000023
为:其中,D2是对角化矩阵,对角线上元素为对应的W2的行和。
进一步,所述步骤5的具体实现方法为:设已知的食物-疾病关联由二进制矩阵
Figure BDA0001799831790000025
表示,将细化食物与疾病的关联,利用“食物名-量-食用方法-疾病”进行建模,对于已验证关联的四元组设置为1,否则为0。
进一步,所述步骤6的具体实现方法为:通过对食物-疾病关联矩阵Y中的每一个值赋予0-1之间的任意数作为初始化。
进一步,所述步骤7的具体实现方法为:对食物-疾病关联进行建模,在建模过程中进行如下设定:相似度高的食物可能会导致同一个疾病、同一种食物可能会导致密切相似的疾病、食物相似度矩阵和疾病相关度矩阵的数值是含噪的;引入捕捉真实食物相似度的矩阵S1和疾病真实相关度的矩阵S2,在拟学习的食物-疾病关联矩阵Y上传播食物相似和疾病相似关系,设计如下损失函数:
Figure BDA0001799831790000026
其中,Ψ1(Y,S1)、Ψ2(Y,S2)分别为疾病关联矩阵Y与真实食物相似度的矩阵S1的损失函数和疾病关联矩阵Y与疾病真实相关度的矩阵S2的损失函数;μ、ζ、ν、η分别为对应项的权重,权重均为人为指定的超参数;I为单位矩阵,该单位矩阵对角线元素全部为1,其他元素全部为0;tr(A)是矩阵A的主对角线上各个元素的总和;是A矩阵中所有不为0的元素的平方和;YT是指Y矩阵的转置,即将矩阵Y中元素的角标前后交换。
本发明的优点和积极效果是:
1、本发明在不考虑由于致病因子导致的食源性疾病的情况下,结合食物之间相似度和疾病相关度,对已知关联和要预测关联进行矩阵近似建模,在建模过程中,添加约束项同时考虑食物同构网络、疾病同构网络,考虑相似度高的食物可能会导致相同疾病的可能以及相关度高的疾病可能是由同种食物导致的,使用食物与疾病关联研究的机器学习方法,可在人力物力消耗极低的情况下,为进一步的食物疾病关联研究提供指导,可作为营养学家食物优选的参考;改善了以往采用的交替迭代学习方法时食物相似度网络只能用作固定输入,食物相似度网络中偏差的问题,大大有助于减少数据干扰,提高食物疾病预测任务的预测准确性。
2、通过食物相似度网络和疾病相关网络关系在原始的食物-疾病关联网络上传播相似关系,避免了已知疾病食物关联较少时的方法失效。同时,通过将食物相似度网络矩阵和疾病相关度矩阵也作为预测矩阵建模,模拟了食物相似度和疾病相关性描述不准确的潜在偏差,进行异构网络端到端的建模,增强了模型的鲁棒性。
附图说明
图1是本发明的整体处理流程图;
图2是本发明的算法实现流程图。
具体实施方式
以下结合附图对本发明实施例做进一步详述。
本发明的设计思想是:
在营养学和食品安全领域,利用机器学习理论和技术,通过结合食物相似性网络、疾病相关度网络、食物-疾病关联网络,来构建异质网络。受标签传播算法,本发明在构建的异质网络上设计矩阵分解框架。本发明假设相似度高的食物会导致同一种疾病,相关度高的疾病可能由同一种食物导致更新网络,以此交替学习参数。进一步地,本发明受食物相似度网络中假阳性关系启发,假阳性关系启发本发明将食物相似度网络和疾病相关度网络视为需要学习的变量,而不是一个固定输入,以此减少和修正原始网络的噪音,防止模型过拟合。在具体求解过程中,本发明提出了一种有效的闭合解决方案来提高计算效率。
基于上述设计思想,本发明的基于矩阵分解的食物-疾病关联预测方法,如图1所示,包括以下步骤:
步骤1:利用成分表构建食物相似度网络W1
食物相似度网络中,每一个节点为“食物-量-食用方法”的组合。在“量-食用方法”不同的情况下,两两节点关系置为0;在“量-食用方法”相同的情况下,根据食物成分表,利用余弦公式,计算两两食物表示向量的余弦值作为两两食物相似度,作为节点关系值,得到食物相似度网络W1
其中,成分表指的是每100克该食物的可食用部分所能提供的热量、食物、膳食纤维、钙、镁、铁、锰、锌等元素的值。此处使用的余弦公式如下:
其中,a,b分别为两个食物成分向量。
步骤2:利用国际疾病分类数据构建疾病相关度网络W2
利用国际疾病分类数据,如果两种疾病同属同一类目,则相似度设置为k,如果两种疾病同属同一亚目,则相似度设置为2k,如果两种疾病同属同一细目,则相似度设置为3k,其中3k<1。
此处,k设置的小,则认为类目、亚目、细目之间的差异不大;k设置的大,则认为类目、亚目、细目之间的差异大。
步骤3:正则化食物相似度网络,得到正则化食物相似度网络的
Figure BDA0001799831790000032
设n为“食物名-量-食用方法”的组合数,W1∈Rn×n是二进制食物相关度网络,则W1用于构造正则化网络其中,D1是W1的对角化矩阵,对角线上元素为对应的W1的行和。
步骤4:正则化疾病相关度网络,得到正则化的疾病相关度网络
Figure BDA0001799831790000042
设m为疾病数,W2∈Rm×m是二进制疾病相关网络,则W2用于构造正则化网络
Figure BDA0001799831790000043
其中,D2是对角化矩阵,对角线上元素为对应的W2的行和。
步骤5:构造已知的二元食物-疾病关联网络
Figure BDA0001799831790000044
在本实施例中,已知的食物-疾病关联由二进制矩阵
Figure BDA0001799831790000045
表示,此处,细化食物与疾病的关联,利用“食物名-量-食用方法-疾病”进行建模,对于已验证关联的四元组设置为1,否则为0。
步骤6:随机初始化要预测的食物-疾病关联矩阵Y。
步骤的具体实现方法如下:随机初始化要预测的食物-疾病关联矩阵Y,即通过对Y矩阵中的每一个值赋予0-1之间的任意数作为初始化。
步骤7:引入捕捉真实食物相似度的矩阵S1和疾病真实相关度的矩阵S2,迭代学习模型参数,输出预测的食物和疾病关联矩阵Y,食物相似度真实情况的拟合矩阵S1,疾病相关度真实情况的拟合矩阵S2
在本步骤中,首先声明下列公式中项的含义。n为“食物名-量-食用方法”的组合数,m为疾病数,X为矩阵X的第i行,X·j为矩阵X的第j行,W1∈Rn×n是食品相似度网络,W2∈Rm×m是二进制疾病相关网络,
Figure BDA0001799831790000046
是正则化的食物相似度网络,计算方法为
Figure BDA0001799831790000048
其中D1是对角化矩阵,对角线上元素为W1的行和。
Figure BDA0001799831790000049
是正则化的疾病相关度网络,计算方法为
Figure BDA00017998317900000410
其中D2是对角化矩阵,对角线上元素为W2的行和,
Figure BDA00017998317900000411
是已知的二元食品-疾病关联网络(用于训练),Y∈Rn×m是要预测的食物-疾病关联矩阵,S1∈Rn×n真实食物相似度网络,S2∈Rm×m真实疾病相关度矩阵。α,β,γ,α',β',γ',μ,ζ,ν,η分别为对应项的权重,是人为指定的超参数。由于约束α+β=1和α′+β′=1的存在,β和β′的值随着α和α′的确定而确定,α和α′在{0.0001,0.001,0.01,0.1,1}中选择,γ和γ′在{1,10,100,1,000,10,000},μ,ζ,ν,η是推导公式过程中的参数,在模型训练过程中α,β,γ,α',β',γ'替代,关系如下
Figure BDA00017998317900000412
I为单位矩阵,即对角线元素全部为1,其他元素全部为0。其中,tr(A)指的是计算A矩阵的迹,即矩阵A的主对角线(从左上方至右下方的对角线)上各个元素的总和。
Figure BDA00017998317900000413
是A矩阵的L2正则化值,即A矩阵中所有不为0的元素的平方和。
在本步骤中,对食物-疾病关联进行建模,建模过程中引入三个假设,a)相似度高的食物可能会导致同一个疾病,b)同一种食物可能会导致密切相似的疾病,c)食物相似度矩阵和疾病相关度矩阵的数值是含噪的。针对假设c)引入捕捉真实食物相似度的矩阵S1和疾病真实相关度的矩阵S2,针对假设a)和b)建模过程中在拟学习的食物-疾病关联矩阵上传播食物相似和疾病相似关系,设计损失函数,
参照链式法则,交替优化Ψ1(Y,S1)和Ψ2(Y,S2),输出预测的食物和疾病关联矩阵Y,食物相似度真实情况的拟合矩阵S1,疾病相关度真实情况的拟合矩阵S2
根据食物相似度网络中的假阳性食物相似度表明,
Figure BDA0001799831790000052
不是准确的食物相似度矩阵。因此,一个直观的想法是引入一个变量S1,试图捕捉食物在导致疾病过程中的真实相似关系。首先,本发明将常量矩阵
Figure BDA0001799831790000053
替换成变量矩阵S1,可以得到变形的拉普拉斯约束项
Figure BDA0001799831790000054
然后引入正则化项
Figure BDA0001799831790000055
来保持食物的关联数值与它的初始值相似。通过针对S1来优化这两项从而消除噪音。对于给定的疾病p,对应以下损失函数,
Figure BDA0001799831790000056
接下来扩展预测该食物与所有疾病的关联,具体表示如下,
Figure BDA0001799831790000057
为了最小化上式中的损失函数,本发明采用交替迭代更新模式,优化一个变量在固定其他变量的时候。
关于Y和S1的解析解可以表示为:
Figure BDA0001799831790000059
Figure BDA00017998317900000510
疾病相关度矩阵
Figure BDA00017998317900000511
也可以被认为是不准确全面的疾病相关关系。本发明引入一个变量S2来试图捕捉疾病的真实关系。首先,本发明用变量矩阵S2替换常量矩阵
Figure BDA00017998317900000512
本发明可以得到变换的拉普拉斯约束项z(I-S2)zT,其中z是
Figure BDA00017998317900000513
中与食物g相关的行向量。然后引入正则化项
Figure BDA00017998317900000514
以保持学习到疾病的相关度值与它的初始值比较接近。可以通过以S2的方式优化这两项来消除噪音。给定食物g,有以下损失函数,
Figure BDA00017998317900000515
对于所有的食物来说,上式还可以扩展到预测关联,
Figure BDA0001799831790000061
关于Y和S2的解析解可以表示为:
Figure BDA0001799831790000062
Figure BDA0001799831790000063
在参数学习时,设定超参数α,β,γ,α′,β′,γ′;由于约束α+β=1和α′+β′=1的存在,β和β′的值随着α和α′的确定而确定。
对于交叉检验的数据,本发明使用五折交叉检验方式选择参数值:将数据分为五份,选用80%数据作为训练数据,20%的数据进行验证,这个过程重复五次,每次轮流把每一折作为验证集。五折的平均结果用于选择最佳参数。参数值的选择中,本发明考虑以下值的所有组合:α和α′在{0.0001,0.001,0.01,0.1,1}中选择,γ和γ′在{1,10,100,1,000,10,000}中选择。
最后,输出预测的食物和疾病关联矩阵Y,食物相似度真实情况的拟合矩阵S1,疾病相关度真实情况的拟合矩阵S2
本发明的上述方法可以通过图2所示的算法流程在计算机上实现。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (1)

1.一种基于矩阵分解的食物-疾病关联预测方法,其特征在于包括以下步骤:
步骤1:利用成分表构建食物相似度网络W1
步骤2:利用国际疾病分类数据构建疾病相关度网络W2
步骤3:正则化食物相似度网络,得到正则化的食物相似度网络
步骤4:正则化疾病相关度网络,得到正则化的疾病相关度网络
Figure FDA0002264966580000012
步骤5:构造已知的二元食物-疾病关联网络
Figure FDA0002264966580000013
步骤6:随机初始化要预测的食物-疾病关联矩阵Y;
步骤7:引入捕捉食物相似度真实情况的拟合矩阵S1和疾病相关度真实情况的拟合矩阵S2,迭代学习模型参数,输出预测的食物-疾病关联矩阵Y、食物相似度真实情况的拟合矩阵S1和疾病相关度真实情况的拟合矩阵S2
所述步骤1的具体实现方法为:将每一个节点设置为“食物-量-食用方法”的组合,在“量-食用方法”不同的情况下,将两两节点关系置为0;在“量-食用方法”相同的情况下,根据食物成分表,利用余弦公式,计算两两食物之间的相似度,作为节点关系值,从而得到食物相似度网络W1
所述步骤2的具体实现方法为:根据国际疾病分类数据,如果两种疾病同属同一类目,则相关度设置为k,如果两种疾病同属同一亚目,则相关度设置为2k,如果两种疾病同属同一细目,则相关度设置为3k,其中3k∈(0,1),从而得到疾病相关度网络W2
所述步骤3的具体实现方法为:设n为“食物名-量-食用方法”的组合数,W1∈Rn×n是食物相似度网络,则W1用于构造正则化的食物相似度网络
Figure FDA0002264966580000014
为:
Figure FDA0002264966580000015
其中,D1是W1的对角化矩阵,对角线上元素为对应的W1的行和;
所述步骤4的具体实现方法为:设m为疾病数,W2∈Rm×m是疾病相关度网络,则W2用于构造正则化的疾病相关度网络
Figure FDA0002264966580000016
为:
Figure FDA0002264966580000017
其中,D2是对角化矩阵,对角线上元素为对应的W2的行和;
所述步骤5的具体实现方法为:设已知的食物-疾病关联由二进制矩阵
Figure FDA0002264966580000018
表示,将细化食物与疾病的关联,利用“食物名-量-食用方法-疾病”进行建模,对于已验证关联的四元组设置为1,否则为0;
所述步骤6的具体实现方法为:通过对食物-疾病关联矩阵Y中的每一个值赋予0-1之间的任意数作为初始化;
所述步骤7的具体实现方法为:对食物-疾病关联进行建模,在建模过程中进行如下设定:相似度高的食物可能会导致同一个疾病、同一种食物可能会导致密切相似的疾病、食物相似度矩阵和疾病相关度矩阵的数值是含噪的;引入捕捉食物相似度真实情况的拟合矩阵S1和疾病相关度真实情况的拟合矩阵S2,在拟学习的食物-疾病关联矩阵Y上传播食物相似和疾病相似关系,设计如下损失函数:
Figure FDA0002264966580000021
参照链式法则,交替优化Ψ1(Y,S1)和Ψ2(Y,S2),输出预测的食物-疾病关联矩阵Y、食物相似度真实情况的拟合矩阵S1、疾病相关度真实情况的拟合矩阵S2
其中,Ψ1(Y,S1)、Ψ2(Y,S2)分别为食物-疾病关联矩阵Y与食物相似度真实情况的拟合矩阵S1的损失函数和食物-疾病关联矩阵Y与疾病相关度真实情况的拟合矩阵S2的损失函数;μ、ζ、ν、η分别为对应项的权重,权重均为人为指定的超参数;I为单位矩阵,该单位矩阵对角线元素全部为1,其他元素全部为0;tr(A)是矩阵A的主对角线上各个元素的总和;
Figure FDA0002264966580000022
是A矩阵中所有不为0的元素的平方和;YT是指Y矩阵的转置,即将矩阵Y中元素的角标前后交换。
CN201811072187.0A 2018-09-14 2018-09-14 一种基于矩阵分解的食物-疾病关联预测方法 Active CN109448853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811072187.0A CN109448853B (zh) 2018-09-14 2018-09-14 一种基于矩阵分解的食物-疾病关联预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811072187.0A CN109448853B (zh) 2018-09-14 2018-09-14 一种基于矩阵分解的食物-疾病关联预测方法

Publications (2)

Publication Number Publication Date
CN109448853A CN109448853A (zh) 2019-03-08
CN109448853B true CN109448853B (zh) 2020-01-14

Family

ID=65530574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811072187.0A Active CN109448853B (zh) 2018-09-14 2018-09-14 一种基于矩阵分解的食物-疾病关联预测方法

Country Status (1)

Country Link
CN (1) CN109448853B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111564201A (zh) * 2020-05-08 2020-08-21 深圳市万佳安人工智能数据技术有限公司 一种基于粒子群优化的儿童饮食智能预测方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574474A (zh) * 2014-10-14 2016-05-11 中国科学院大连化学物理研究所 一种基于质谱信息的生物特征图像识别方法
CN106779941A (zh) * 2016-12-14 2017-05-31 山东大学 基于矩阵和张量联合分解的汽车推荐方法及系统
CN107610784A (zh) * 2017-09-15 2018-01-19 中南大学 一种预测微生物和疾病关系的方法
CN108121896A (zh) * 2017-12-19 2018-06-05 深圳先进技术研究院 一种基于miRNA的疾病间关系分析方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506608B (zh) * 2017-09-29 2020-09-29 杭州电子科技大学 一种改进的基于协同过滤的miRNA-疾病关联预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574474A (zh) * 2014-10-14 2016-05-11 中国科学院大连化学物理研究所 一种基于质谱信息的生物特征图像识别方法
CN106779941A (zh) * 2016-12-14 2017-05-31 山东大学 基于矩阵和张量联合分解的汽车推荐方法及系统
CN107610784A (zh) * 2017-09-15 2018-01-19 中南大学 一种预测微生物和疾病关系的方法
CN108121896A (zh) * 2017-12-19 2018-06-05 深圳先进技术研究院 一种基于miRNA的疾病间关系分析方法和装置

Also Published As

Publication number Publication date
CN109448853A (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
US20210012486A1 (en) Image synthesis with generative adversarial network
CN107808278A (zh) 一种基于稀疏自编码器的Github开源项目推荐方法
CN109801269B (zh) 一种基于竞争的挤压和激励神经网络的舌苔体质分类方法
Kook et al. Deep and interpretable regression models for ordinal outcomes
Matsui Variable and boundary selection for functional data via multiclass logistic regression modeling
CN108510013A (zh) 基于低秩核心矩阵的改进稳健张量主成分分析方法
CN108804565A (zh) 一种基于知识表示学习的协同矩阵分解方法
Tang et al. Bayesian variable selection and estimation in semiparametric joint models of multivariate longitudinal and survival data
Kowal Fast, optimal, and targeted predictions using parameterized decision analysis
CN109448853B (zh) 一种基于矩阵分解的食物-疾病关联预测方法
CN114300081B (zh) 基于电子病历多模态数据的预测设备、系统和存储介质
Luo et al. SGD-rα: A real-time α-suffix averaging method for SGD with biased gradient estimates
Liu et al. Modal-regression-based broad learning system for robust regression and classification
Zhang et al. Multi-scale and multi-channel neural network for click-through rate prediction
Marbac et al. Model-based clustering for conditionally correlated categorical data
Huo et al. Collaborative learning with unreliability adaptation for semi-supervised image classification
CN106156488A (zh) 基于贝叶斯个性化排序的知识图链接预测方法
Wang et al. Are deep learning models superior for missing data imputation in surveys? Evidence from an empirical comparison
JP7247292B2 (ja) 加齢による黄斑変性症用の分類モデルを学習させる電子機器及び方法
Mao et al. Bone age assessment method based on fine-grained image classification using multiple regions of interest
CN114861065A (zh) 基于多行为的级联残差图卷积网络的个性化推荐方法
Xu et al. Improving proximal policy optimization with alpha divergence
Bhandari et al. From Beginning to BEGANing: Role of Adversarial Learning in Reshaping Generative Models
Tenace et al. Inferential logic: A machine learning inspired paradigm for combinational circuits
Li et al. Tree-regularized Bayesian latent class analysis for improving weakly separated dietary pattern subtyping in small-sized subpopulations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant