CN108565004A - 一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法 - Google Patents

一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法 Download PDF

Info

Publication number
CN108565004A
CN108565004A CN201810370377.4A CN201810370377A CN108565004A CN 108565004 A CN108565004 A CN 108565004A CN 201810370377 A CN201810370377 A CN 201810370377A CN 108565004 A CN108565004 A CN 108565004A
Authority
CN
China
Prior art keywords
association
food
diabetic
degree
diet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810370377.4A
Other languages
English (en)
Other versions
CN108565004B (zh
Inventor
何丽莉
欧阳丹彤
李轩
白洪涛
姜宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201810370377.4A priority Critical patent/CN108565004B/zh
Publication of CN108565004A publication Critical patent/CN108565004A/zh
Application granted granted Critical
Publication of CN108565004B publication Critical patent/CN108565004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Nutrition Science (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

本发明公开了一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,包括:步骤一、建立糖尿病患者的饮食偏好特征集合U={u1,u2,…,un}和食物的属性特征集合V={v1,v2,…,vm},记录糖尿病患者饮食,提取偏好特征和食物属性特征,形成糖尿病患者饮食偏好矩阵U∈RK×M和食物属性特征V∈RK×N;步骤二、通过将糖尿病患者的饮食偏好与食物的属性特征之间的关联度量化来确定糖尿病患者的饮食偏好与食物的属性特征之间的关联强度;步骤三、对所述关联度进行权值分布得到基本分类后,训练数据集更新权值分布,将所有关联度赋予权重进行分类排除不必要的食物,得到最终的如下关联度分类:步骤四、根据所述条件概率和所述关联度分类得到所述个性化饮食。

Description

一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法
技术领域
本发明涉及智能医药领域,具体涉及一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法。
背景技术
随着网络时代的步伐逐渐加快伴随而来的是信息量的暴涨,为用户提供推荐服务的技术也相应的被运用到各种领域,从而帮助用户更精确地找到他们想要的信息。
当前针对糖尿病患者的饮食推荐方法主要是基于关联规则的推荐、基于内容的推荐、协同过滤推荐、基于约束的推荐等方法:(1)基于关联规则的推荐主要代表就是Apriori算法,其核心思想就是在频集中产生强关联规则,定义出来的规则必须满足最小置信度和最小支持度,关联分析的目的是找出数据中隐藏的关联网,是对数据之间的关系的一种描述;但是,当设置了最小支持度阈值和最小置信度阈值的时候,进行关联分析,只要关联规则的最小置信度和最小支持度不满足事先设置好的阈值,就会采取“剪枝”处理,人为设置的最小置信度和最小支持度,必然会导致在“剪枝”处理过程中丢失一些食物的属性对糖尿病患者的饮食偏好特征的贡献因子,再就是,基于关联规则的推荐其规则提取较为复杂、同义性问题不好处理、个性化程度不高;(2)基于内容的推荐是将糖尿病患者和食物分别建模,然后通过糖尿病患者对食物的历史行为产生信息再与食物模型进行比较,将相似度高的食物推荐给糖尿病患者;虽然基于内容的推荐方法没有人为的参与是一个无监督学习的过程,体现出高度的自动化,能够处理复杂的对象,但是,面对新添加的糖尿病患者,则无法进行学习建模;因此,基于内容的推荐在冷启动和扩展性问题上存在不足;(3)协同过滤推荐方法必须是在有用户对项目的评分或者是行为基础上进行的,根据评分记录计算用户或者项目之间相似度,通过相似度计算目标用户或者目标项目的最近邻数据集,再从最近邻数据集中的用户或者项目计算目标用户对待选择的项目的喜好程度,据此推荐;但是,如果项目的属性变得复杂,无法再通过用户对项目的一个评分或者是行为计算相似度。该方法没有对属性的权重进行分配,并且项目的属性针对不同用户重要性行也不同。所以说协同过滤推荐方法针对复杂的事物属性处理极其困难;(4)基于约束的推荐方法主要是依靠项目的属性,就是从项目集合中推荐能够匹配用户需求、偏好特征和硬性需求的项目,通过一些标准硬性约束了糖尿病患者的饮食结构,虽然看上去既符合患者在医学上的指标要求,又符合患者对食物的偏好特征;其实不然,在约束求解过程中如果出现需求冲突或者是空解时,基于约束求解可能处理问题就比较麻烦了,即使在后续对基于约束的推荐方法的改进,即采取通过计算冲突需求来逐渐放宽约束限制来获取解,虽然避免了需求冲突和空解,但是由于放宽了约束限制,就可能会导致个别的在医学上针对某个糖尿病患者的饮食标准不吻合的食物渗入到推荐数据集中。
由于因多种原因使糖尿病患者的身体状况指标不定期变化,导致以上一些传统方法存在一定的局限性:(1)传统的糖尿病饮食推荐方法,在食物选取上容易丢失一些对糖尿病患者有价值的食物;(2)传统的糖尿病饮食推荐方法对待糖尿病患者的方式具有普遍性,忽略了患者的特殊性;(3)传统的糖尿病饮食推荐方法在医学指标和糖尿病患者的意愿上无法平衡,要么一味地追求患者的饮食偏好特征实现个性化要求,要么以医学标准为主,忽视了患者个性化的饮食偏好特征,导致患者厌恶而无法入食,展示出“伪推荐”效果。
发明内容
本发明设计开发了一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,本发明的发明目的将根据患者的饮食偏好特征和食物所具备的属性之间的关联度进行个性化饮食推荐。
本发明提供的技术方案为:
一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,包括如下步骤:
步骤一、建立糖尿病患者的饮食偏好特征集合U={u1,u2,…,un}和食物的属性特征集合V={v1,v2,…,vm},记录糖尿病患者饮食,提取偏好特征和食物属性特征,形成糖尿病患者饮食偏好矩阵U∈RK×M和食物属性特征V∈RK×N;其中,K<<min{M,N};
步骤二、通过将糖尿病患者的饮食偏好与食物的属性特征之间的关联度量化来确定糖尿病患者的饮食偏好与食物的属性特征之间的关联强度;
其中,所述关联度rij量化表示为:
式中,Ν(x|μ,σ2)为均值μ、方差σ2的高斯分布密度函数;观测关联强度的条件概率表示为:
式中,Iij为指示函数,如果糖尿病患者i对食物j有过行为,则Iij取值为1,否则取值为0;
步骤三、对所述关联度进行权值分布得到基本分类后,训练数据集更新权值分布,将所有关联度赋予权重进行分类排除不必要的食物,得到最终的如下关联度分类:
式中,Gm(x)为基本分类,αm为Gm(x)在最终关联度rij集合中的重要程度 em为训练数据集上的分类误差率,提取所有的关联度rij(rij≠0)分别对应x1,x2,…,xN,形成集合为T={(x1,y1),(x2,y2),…,(xN,yN)},yi为标记集合{+1,-1};
步骤四、根据所述条件概率和所述关联度分类得到所述个性化饮食,表示如下:
优选的是,在所述步骤三中,排除不必要的食物是通过筛选归类过程中排除不符合的关联度,在排除过程中不断减少误差e满足以下条件:
优选的是,在所述步骤三中,进行权值分布时,关联度rij开始均赋予相同的权重,均为1/N。
优选的是,在所述步骤三中,更新训练数据集的权值分布使关联度集合特征要不断逼近直接影响糖尿病患者的阈值,在新的权值分布的训练数据集下,用于下一次迭代,包括:
式中,Zm是规范化因子,
本发明与现有技术相比较所具有的有益效果:
1、本发明在研究传统糖尿病饮食推荐方法的基础上,引用了概率矩阵分解并引入Adaboost分类器因子进行强化,将二者相结合提出了糖尿病个性化饮食推荐方法,该方法充分考虑到了临床患者的饮食偏好特征与在医学领域身体各项指标的彼此约束关系,更进一步做到了个性化推荐;
2、相比传统的糖尿病饮食推荐方法,在准确率和患者的满意度上(多样性方面)具有很大的优势;
3、较传统的糖尿病饮食推荐方法,虽然在个性化上虽然打了折扣,但是仍然不失个性化的表现,正是因为糖尿病个性化饮食推荐方法考虑了多种因素,而这些因素又是极其复杂的,推荐出的食物结果集既符合医学指标,又满足了糖尿病患者的饮食偏好需求,所以糖尿病个性化饮食推荐方法才真正做到了“个性化”饮食推荐的效果;
4、该方法具有的良好的可移植性和拓展性,未来可以进一步优化。
附图说明
图1为本发明所述的评分分布图。
图2为本发明所述的多样化比较图。
图3为本发明所述的个性化饮食准确率分布图。
图4为本发明所述的医学指标饮食准确率分布图。
图5为本发明所述的准确率与多样性的关系图。
图6为本发明所述的血浆葡萄糖含量走势图。
图7为本发明所述的体重走势图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
本发明提供一种基于引入Adaboost概率矩阵分解糖尿病个性化饮食的方法,根据患者的饮食偏好特征和食物所具备的属性之间的关联度,寻找对关联度具有贡献的隐因子,在将具备贡献的隐因子进行分类,找出贡献更大的隐因子,那么这些隐因子所对应的糖尿病患者和食物的关联就更符合医学指标和个性化饮食二者的要求;Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器);本发明中把某个糖尿病患者的饮食偏好与一种食物所具有的属性之间分布的关联度看成弱分类器,再通过Adaboost算法将每个糖尿病患者饮食偏好与食物属性之间的关联度(弱分类器)集合筛选成为强分类器,同时排除不必要的食物(训练数据特征);通过实验结果表明,该方法在糖尿病饮食推荐领域相比传统的糖尿病饮食推荐方法可以有效平衡医学指标和个性化饮食的权重,避免因某种因素导致推荐结果的不准确性、不全面性,提高了推荐效果。
实施例
本发明的推荐方法具体包括如下步骤:
步骤一、设糖尿病患者的饮食偏好特征集合为U={u1,u2,…,un}和食物的属性特征集合为V={v1,v2,…,vm},如表1所示;
表1糖尿病患者-食物特征关联度
其中,矩阵中共有n行代表一个糖尿病患者的n个饮食偏好特征,m列代表食物所具备的属性特征;假设某一个糖尿病患者对一个食物有过行为,则r的取值会分布在矩阵中,通过对r的计算来确定糖尿病患者与食物的关系是否既满足个性化,又满足医学指标。
取某位体型过胖的糖尿病患者的特征属性:体重(过胖)、口味偏好(爱吃甜食)、血浆葡萄糖(高于正常水平,差)、血压(偏高)。取白菜的特征属性:热量(少)、碳水化合物(少)、脂肪(少)、蛋白质(适中)、多种维生素(种类多且含量少)、味道(淡味偏甜)、分值。
形成如下糖尿病患者——食物特征矩阵:
步骤二、概率矩阵分解的基本假设是仅有少量的隐因子对用户偏好和项目特征存在贡献,映射到糖尿病个性化饮食推荐方法当中,本发明可以将它看成有少量的隐因子对糖尿病患者饮食偏好和食物的属性特征存在贡献。
将糖尿病患者的平时饮食记录,提取偏好特征,形成低维的矩阵U∈RK×M,将食物的属性特征提取形成低维矩阵V∈RK×N,其中K<<min{M,N},然后使用矩阵U和V的内积形成“糖尿病患者—食物特征关联度”矩阵。
给定糖尿病患者饮食偏好特征向量Ui和食物的属性特征向量Vi,将糖尿病患者的饮食偏好与食物的属性特征之间的关联度rij量化以此来显示彼此之间关联的强度,则rij的分布为:
其中,Ν(x|μ,σ2)为均值μ、方差σ2的高斯分布密度函数,假设每个rij是独立的,可以观测关联强度的条件概率为:
其中,Iij是指示函数,如果糖尿病患者i对食物j有过行为,则Iij取值为1,否则取值为0。
步骤三、在如表1所示的糖尿病患者-食物特征关联度的表格当中,以行优先提取所有的rij(rij≠0)分别对应x1,x2,…,xN,形成集合为T={(x1,y1),(x2,y2),…,(xN,yN)},yi属于标记集合{+1,-1};
首先,对集合T中的关联度rij进行权值分布;其中,每一个rij最开始都被赋予相同的权重1/N:D1=(w11,w12,…,w1i,…,w1N),w1i=1/N,i=1,2,…,N;进行多次迭代,用m=1,2,…,M表示迭代的次数,使用具有权值分布Dm的训练数据集学习,得到基本分类器Gm(x):Gm(x):
计算Gm(x)在训练数据集上的分类误差率:
Gm(x)在训练数据集上的误差率em就是被Gm(x)误分类样本的权值之和,计算Gm(x)的系数,αm表示Gm(x)在最终关联度rij集合中的重要程度,采用这种方式的目的就是得到每一个关联度在最终关联度集合中所占权重,这样是为了判断是否既符合医学指标又满足个性化需求;其中时,αm≥0,且αm随着em的减小而增大,这就意味着关联度分类误差率越小的基本关联度集合在最终的关联度集合中越对糖尿病患者有影响;
然后,更新训练数据集的权值分布,因为之前的关联度已经按照一定特征集分类归并,但并不是对糖尿病患者的影响很直接,所以关联度集合特征要不断逼近直接影响糖尿病患者的阈值;在新的权值分布的训练数据集下,用于下一次迭代:
本发明使基本关联度集合Gm(x)误差类关联度样本的权值增大,使被正确分类的关联度集合样本权值减小,找到那些较难分类的关联度样本,我们可以认为是不对糖尿病患者有影响,因此可以筛除;其中,Zm是Adaboost引入的规范化因子,它的作用可以使得Dm+1成为一个概率分布:
最后,本发明将所有的关联度(一位糖尿病患者的饮食偏好与一种食物所有属性之间产生的关联度表)赋予权重,进行分类,又对每个分类赋予权重进行分类,也就是组合各个集合:
从而最终得到关联度分类,如下:
步骤四、在概率矩阵分解中,每个关联度rij是独立的,当通过Adaboost分类器将所有不为零的关联度rij进行了分类划分,在引用公式(2)的基础上结合公式(8)就有如下公式:
其中,Ν(x|μ,σ2)为均值μ、方差σ2的高斯分布密度函数,Iij是指示函数,如果糖尿病患者i对食物j有过行为,则Iij取值为1,否则取值为0。Gm(rij)则是通过Adaboost分类器将每个rij进行筛选归类。
在糖尿病患者和食物特征属性分解之后的矩阵基础上,Adaboost能在学习过程中不断减少训练误差,在训练数据集上的分类误差率会做到增大权值误差率小的弱分类器的权值,不管是在每一轮的表决权中还是在最终的表决权中都会起较大作用。相反,减小分类误差率大的弱分类器的权值,在过程中也许会受到关注慢慢转变为增大权值误差率小的弱分类器,如果最终还属于减小分类误差率大的弱分类器,则在表决权中起较小作用。
在本实施例中,糖尿病个性化饮食推荐方法不需要人为的设定阈值,这样就避免了因为“剪枝”而丢失有价值的数据,即使有新的糖尿病患者添加也不会出现无法建模的问题,因为可以根据患者自己主动选定的饮食偏好或者是患者过去的饮食记录与食物属性之间的关联性进行绑定;同时,糖尿病个性化饮食推荐方法就是针对放宽的约束、属性多且复杂的问题进行分析,过程中不会出现空解,即一定会在现有范围中推荐相对最佳的结果,提供给糖尿病患者,糖尿病个性化饮食推荐方法推荐的结果一定是在既符合医学指标又满足个性化要求的前提下。
当把所有的不为零的关联度rij筛选归类完毕,最终将关联度归类的集合为误差上界,筛选归类过程中排除不符合的关联度,在排除过程中就是不断减小误差e:
那么超过误差上界的关联度集合,糖尿病个性化饮食推荐方法会自动抛弃,认为不符合医学指标或者个性化要求,要么二者都没有达到要求。
虽然有关糖尿病饮食推荐方面的方法种类很多,但是目前主流的推荐方法则是基于内容的推荐和基于协同过滤的糖尿病饮食推荐;基于内容的糖尿病饮食推荐要求食物的基本属性(热量、蛋白质、脂肪、碳水化合物)和糖尿病患者过去的饮食记录;基于协同过滤的糖尿病饮食推荐方法要求的数据有糖尿病患者对每次可食用食物的评分和食物的重量、热量;糖尿病个性化饮食推荐方法具备的数据有糖尿病患者对每次可以食用的食物进行评分,将食物的基本属性标明(热量、蛋白质、脂肪、碳水化合物),再将糖尿病患者的身体基本指标标明(体重、血压、糖化血红蛋白、血浆葡萄糖等)和饮食偏好(口味,爱吃的食物种类等)。
试验例1
采用基于协同过滤的糖尿病饮食推荐方法进行饮食推荐包括如下步骤:
首先,进行评分矩阵、食物的热量和重量的数据确定;
然后,确定推荐的模拟情况下的食物结果集,具体包括:
(1)取K个最近若干食物属性相似邻居节点数据;
(2)将数据集合拆分为测试集和训练集,其中为测试集,取不同的K≤m-1,在相同的随机种子条件下可得到不同的测试集和训练集;
(3)计算食物向量ItemA和ItemB的相似性量化为相似度,形成食物相似性矩阵;
(4)对食物相似性矩阵排序,通过K个食物属性相似近邻,计算糖尿病患者对食物的兴趣程度矩阵;
(5)通过兴趣程度矩阵,推荐模拟情况下的食物结果。
试验例2
采用基于内容推荐的推荐方法进行饮食推荐包括如下步骤:
首先,进行食物的基本属性和糖尿病患者的饮食记录;
然后,确定模拟情况下的食物结果集,具体包括:
(1)将食物的属性建模V;
(2)将糖尿病患者的历史饮食记录建模U;
(3)如果待选的食物的属性和患者的历史饮食记录中的食物属性相似度达到预定阈值,则认为是糖尿病患者感兴趣的食物;
(4)将匹配度高的食物生成矩阵,推荐结果集。
试验例3
采用基于糖尿病个性化饮食推荐方法进行饮食推荐包括如下步骤:
首先,确定评分矩阵、食物的基本属性、糖尿病患者的身体指标、饮食偏好;
然后,确定模拟状况下的食物结果集,具体包括:
(1)在提供的实际食物列表中,分别讨论每个食物的基本属性集合V={v1,v2,…,vm}和糖尿病患这的饮食偏好特征集U={u1,u2,…,un},形成关联度矩阵,其中关联度量化的值为rij
(2)对rij进行多次循环迭代归类;
(3)每一次归类都要与ΠmZm进行筛选比对,小于等于ΠmZm,则为符合要求的归类;
(4)经过多次循环迭代,结果为f(rij)Gm(rij)=sign(f(rij));
(5)经过Adaboost分类rij,综合对一个模拟情况下的食物对糖尿病患者的影响;
(6)对所有食物进行分析,反馈给患者推荐的食物结果集。
通过实施例1可以看出进行AB测试,将一组数据分成四份,四分之一的数据进行训练学习,形成一套训练模型,在用剩下的四分之三的数据对这套训练模型进行测试,在形成相似性矩阵,最后形成兴趣程度矩阵,这样其时间复杂度为3×O(n2);实施例2中先对食物和糖尿病患者历史饮食记录生成矩阵,然后在n模型级别基础上进行食物和历史饮食记录的匹配,则时间复杂度为2×O(k)+O(n2);实施例3中先形成关联度矩阵,在对矩阵进行归类筛选,其时间复杂度为O(n2)+O(k)。
试验例结果比较
食物基本属性包含热量、脂肪、蛋白质、碳水化合物,并且对食物的基本属性都进行量化,糖尿病患者的身体指标包括血浆葡萄糖、糖化血红蛋白、血压、体重、总胆固醇、甘油三酯、低密度脂蛋白、高密度脂蛋白、尿微量白蛋白等,还有糖尿病患者对食物的喜好评分和饮食偏好特征。
传统的推荐系统,为了衡量推荐方法的优劣,通过准确率、召回率、覆盖率等进行判断考核;然而,针对医学领域的实验,本文只计算准确率,但是还要采取测试数据实验验证,并且糖尿病食疗法方面只需要考虑准确率和多样性的比较,医疗领域并不像电商领域那样要求推荐商品的覆盖率、召回率等从而挖掘长尾数据,医疗领域首要考虑的是患者的健康,所以糖尿病个性化饮食推荐方法着眼于准确率,同时为了丰富患者的饮食实现个性化,追求多样性。
本发明将基于内容的糖尿病饮食推荐方法,基于协同过滤的糖尿病饮食推荐方法和糖尿病个性化饮食推荐方法进行对比分析;取最近邻居的个数K分别为20、40、60、80、100、120、140、160、180、200,代表糖尿病患者的数量增多,方法能否适用越来越多的用户;通过糖尿病患者对推荐的食物结果集的评分评判各个方法对个性化的满足程度,同时,将K值逐渐扩大,并且范围变宽广K取5、10、20、40、80、160、320,以此进行对比各个方法推荐结果集的多样性。
本发明研究的是糖尿病个性化饮食范畴,所以要在医学指标的准确率和个性化指标的准确率两方面进行各个方法的比较;
首先,随机的提取一名患者,进行模拟仿真,以4小时为单位代表每次饮食,在个性化饮食准确率方面,将方法推荐的食物与模拟的糖尿病患者选取的食物进行比较,计算准确率;在医学指标饮食准确率方面,将糖尿病患者的身体指标(体重、血压、糖化血红蛋白、血浆葡萄糖等)与推荐的食物结果集所含有的营养成分(热量、脂肪、蛋白质、碳水化合物)进行比较,计算准确率。
然后,观察糖尿病个性化饮食推荐方法在多样性和准确率两方面的关系进行分析,判断二者的走势。
最后,采用追踪测试数据结果;在模拟的糖尿病患者的身体指标(只观察血浆葡萄糖和体重)下,比较各个方法对模拟糖尿病患者身体指标的影响。
如图1、图2所示,以时间为种子随机生成糖尿病患者,同时模拟每一个糖尿病患者的身体指标和饮食偏好特征,然后取最近邻的个数K分别为20、40、60、80、100、120、140、160、180、200,在K逐渐取值变大的同时扩展其范围,K取值分别为5、10、20、40、80、160、320,根据糖尿病患者的饮食偏好特征,模拟糖尿病患者对方法推荐的食物结果集的评分,再计算各个方法所推荐的食物结果集的多样性;因为本试验例1~3研究的是个性化饮食范畴,所以观察各个方法在个性化方面达到的程度。
通过图1可以发现糖尿病个性化饮食推荐方法所推荐的食物结果集得到模拟糖尿病患者的青睐,平均分偏高,在K为80的地方基于内容的糖尿病饮食推荐方法之所以落差很大,就是由其自身的缺点,即面对新添加的糖尿病患者,则无法进行学习建模导致的。
通过图2可以发现糖尿病个性化饮食推荐方法的多样性高于其他方法,原因在于糖尿病个性化饮食推荐方法是针对复杂属性进行解决的,糖尿病个性化饮食推荐方法将模拟的糖尿病患者的身体指标和饮食偏好特征,结合食物的属性,综合分析推荐出来的结果,而其他两种方法是无法解决复杂属性问题的。
如图3、图4所示,糖尿病个性化饮食推荐方法是在两方面,即个性化方面和医学指标方面进行食物推荐的,所以在准确率上要考虑两点:个性化饮食准确率和医学指标饮食准确率。
通过图3可以看出糖尿病个性化饮食推荐方法在个性化准确率上低于其他方法,这正是本方法所期望的结果。原因就是糖尿病患者在选择食材的时候总是以自己的意志为转移,也就是饮食偏好特征在驱使患者选择自己喜欢的食材,但是选择过程中已经抛弃了身体各项指标能够承受的食材所含有的营养成分比例。
这里还需要注意的是多样性和个性化,本文对二者的理解认为这是两个不同的毫无关联的概念;参照图2和图3进行比较,根据公式(12)可知,多样性是方法推荐的食物结果集与糖尿病可饮食的所有食物的关系;而个性化则是糖尿病患者的饮食偏好与方法推荐的食物结果集的关系。
通过图4可以看出糖尿病个性化饮食推荐方法良好的食疗效果,其他方法过于满足患者的饮食偏好,导致推荐的食物结果集所含有的营养成分比例很多是不符合当前糖尿病患者在医学指标要求下的身体所需营养成分比例。
如图5所示,综合个性化饮食准确率和医学指标饮食准确率,分析准确率与多样性的关系。
通过准确率与多应性的反比关系图,能够看出糖尿病个性化饮食推荐方法折中了临床食疗和传统的糖尿病饮食推荐系统,优点如下:
(1)在保证针对糖尿病患者的饮食推荐过程中的准确率的同时是会牺牲多样性,但与患者临床对应的配餐要丰盛多了;
(2)比传统的糖尿病饮食推荐方法在多样性上处于优势,同时准确率也优于其他方法。
同时,本发明采用追踪测试数据的方法,观察模拟的糖尿病患者在三种推荐方法推荐的食物结果集摄取的效果,即比较糖尿病患者的身体指标,体重和血浆葡萄糖。
如图6、图7所示,本文在最初模拟糖尿病患者的身体指标时,设置了每一位患者的体重为59Kg,血浆葡萄糖含量为8.5mmol/L,以4小时为单位,代表患者进行一次饮食,每个时间单位都是对前一次饮食效果的检测,按照糖尿病患者的普遍症状“三多一少”,模拟患者每小时体重消耗0.005Kg,血浆葡萄糖含量每小时增高0.001mmol/L,随机抽取模拟的糖尿病患者,在三天72小时内,对其进行身体指标检测。
通过图6可以看出,虽然三种方法都会将血浆葡萄糖含量降低,但是基于内容的糖尿病饮食推荐方法和基于协同过滤的糖尿病饮食推荐方法,对血浆葡萄糖降低到一定程度就不会在降低,在第三天的时候基本趋于稳定状态;而糖尿病个性化饮食推荐方法则优于其他两种方法。根据医学指标血浆葡萄糖含量(优4.4-6.1,良<=7.0,差>7.0,单位mmol/L),可以判断出糖尿病个性化饮食推荐方法会将模拟的糖尿病患者的血浆葡萄糖含量降到良的级别。
在饮食的第一天,三种方法对患者的食疗效果都是尽可能的减少体重的消耗,糖尿病个性化饮食推荐方法效果优于其他方法。到了第二天结束的时候,转折点出现了,糖尿病个性化饮食推荐方法使模拟的糖尿病患者的体重发生增长,并且持续一段时间保持住了体重的平衡,而另外两种方法只能最大化降低体重的消耗。到了第三天,可以看到患者只是在另外两种方法的食疗作用下,体重变化率减小了。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (4)

1.一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,其特征在于,包括如下步骤:
步骤一、建立糖尿病患者的饮食偏好特征集合U={u1,u2,…,un}和食物的属性特征集合V={v1,v2,…,vm},记录糖尿病患者饮食,提取偏好特征和食物属性特征,形成糖尿病患者饮食偏好矩阵U∈RK×M和食物属性特征V∈RK×N;其中,K<<min{M,N};
步骤二、通过将糖尿病患者的饮食偏好与食物的属性特征之间的关联度量化来确定糖尿病患者的饮食偏好与食物的属性特征之间的关联强度;
其中,所述关联度rij量化表示为:
式中,Ν(x|μ,σ2)为均值μ、方差σ2的高斯分布密度函数;观测关联强度的条件概率表示为:
式中,Iij为指示函数,如果糖尿病患者i对食物j有过行为,则Iij取值为1,否则取值为0;
步骤三、对所述关联度进行权值分布得到基本分类后,训练数据集更新权值分布,将所有关联度赋予权重进行分类排除不必要的食物,得到最终的如下关联度分类:
式中,Gm(x)为基本分类,αm为Gm(x)在最终关联度rij集合中的重要程度 em为训练数据集上的分类误差率,提取所有的关联度rij(rij≠0)分别对应x1,x2,…,xN,形成集合为T={(x1,y1),(x2,y2),…,(xN,yN)},yi为标记集合{+1,-1};
步骤四、根据所述条件概率和所述关联度分类得到所述个性化饮食,表示如下:
2.如权利要求1所述的引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,其特征在于,在所述步骤三中,排除不必要的食物是通过筛选归类过程中排除不符合的关联度,在排除过程中不断减少误差e满足以下条件:
3.如权利要求2所述的引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,其特征在于,在所述步骤三中,进行权值分布时,关联度rij开始均赋予相同的权重,均为1/N。
4.如权利要求3所述的引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法,其特征在于,在所述步骤三中,更新训练数据集的权值分布使关联度集合特征要不断逼近直接影响糖尿病患者的阈值,在新的权值分布的训练数据集下,用于下一次迭代,包括:
Dm+1=(wm+1,1,wm+1,2,…wm+1,i…,wm+1,N),
式中,Zm是规范化因子,
CN201810370377.4A 2018-04-24 2018-04-24 一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法 Active CN108565004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810370377.4A CN108565004B (zh) 2018-04-24 2018-04-24 一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810370377.4A CN108565004B (zh) 2018-04-24 2018-04-24 一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法

Publications (2)

Publication Number Publication Date
CN108565004A true CN108565004A (zh) 2018-09-21
CN108565004B CN108565004B (zh) 2021-05-07

Family

ID=63536238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810370377.4A Active CN108565004B (zh) 2018-04-24 2018-04-24 一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法

Country Status (1)

Country Link
CN (1) CN108565004B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461492A (zh) * 2018-11-01 2019-03-12 广州仁生健康科技有限公司 一种用于缓解痛风的智能配餐及饮食管理方法
CN109509538A (zh) * 2018-11-05 2019-03-22 苏州帕诺米克生物医药科技有限公司 健康管理方法、装置及存储介质
CN110717529A (zh) * 2019-09-25 2020-01-21 南京旷云科技有限公司 一种数据采样方法及装置
CN111159539A (zh) * 2019-12-09 2020-05-15 中国科学院计算技术研究所 基于多模态信息关联分析的食物推荐方法和系统
CN111489806A (zh) * 2020-04-09 2020-08-04 南通大学 一种智能化糖尿病热量管理方法及系统
CN113010783A (zh) * 2021-03-17 2021-06-22 华南理工大学 基于多模态心血管疾病信息的医疗推荐方法、系统及介质
CN116434916A (zh) * 2023-06-15 2023-07-14 北京四海汇智科技有限公司 一种用于肿瘤康复的数字营养管理方法
CN118069931A (zh) * 2024-04-18 2024-05-24 大连陆桥科技有限公司 基于人工智能的糖尿病患者饮食智能推荐方法
CN118069931B (zh) * 2024-04-18 2024-06-28 大连陆桥科技有限公司 基于人工智能的糖尿病患者饮食智能推荐方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074279A1 (en) * 2004-09-29 2006-04-06 Evgeny Brover Interactive dieting and exercise system
CN101964063A (zh) * 2010-09-14 2011-02-02 南京信息工程大学 一种改进的AdaBoost分类器构造方法
CN102915448A (zh) * 2012-09-24 2013-02-06 西北工业大学 一种基于AdaBoost的三维模型自动分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074279A1 (en) * 2004-09-29 2006-04-06 Evgeny Brover Interactive dieting and exercise system
CN101964063A (zh) * 2010-09-14 2011-02-02 南京信息工程大学 一种改进的AdaBoost分类器构造方法
CN102915448A (zh) * 2012-09-24 2013-02-06 西北工业大学 一种基于AdaBoost的三维模型自动分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIWANG YANG: "A survey of collaborative filtering based social recommender systems", 《COMPUTER COMMUNICATION》 *
郭弘毅: "融合社区结构和兴趣聚类的协同过滤推荐算法", 《计算机研究与发展》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461492A (zh) * 2018-11-01 2019-03-12 广州仁生健康科技有限公司 一种用于缓解痛风的智能配餐及饮食管理方法
CN109509538A (zh) * 2018-11-05 2019-03-22 苏州帕诺米克生物医药科技有限公司 健康管理方法、装置及存储介质
CN110717529A (zh) * 2019-09-25 2020-01-21 南京旷云科技有限公司 一种数据采样方法及装置
CN110717529B (zh) * 2019-09-25 2022-09-30 南京旷云科技有限公司 一种数据采样方法及装置
CN111159539A (zh) * 2019-12-09 2020-05-15 中国科学院计算技术研究所 基于多模态信息关联分析的食物推荐方法和系统
CN111159539B (zh) * 2019-12-09 2023-09-22 中国科学院计算技术研究所 基于多模态信息关联分析的食物推荐方法和系统
CN111489806A (zh) * 2020-04-09 2020-08-04 南通大学 一种智能化糖尿病热量管理方法及系统
CN113010783A (zh) * 2021-03-17 2021-06-22 华南理工大学 基于多模态心血管疾病信息的医疗推荐方法、系统及介质
CN116434916A (zh) * 2023-06-15 2023-07-14 北京四海汇智科技有限公司 一种用于肿瘤康复的数字营养管理方法
CN116434916B (zh) * 2023-06-15 2023-08-22 北京四海汇智科技有限公司 一种用于肿瘤康复的数字营养管理方法
CN118069931A (zh) * 2024-04-18 2024-05-24 大连陆桥科技有限公司 基于人工智能的糖尿病患者饮食智能推荐方法
CN118069931B (zh) * 2024-04-18 2024-06-28 大连陆桥科技有限公司 基于人工智能的糖尿病患者饮食智能推荐方法

Also Published As

Publication number Publication date
CN108565004B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN108565004A (zh) 一种引入Adaboost概率矩阵分解糖尿病个性化饮食推荐方法
Rostami et al. A novel time-aware food recommender-system based on deep learning and graph clustering
CN104303185B (zh) 用于营养物摄取量的用户特定调节的系统和方法
TWI353555B (en) Personalized meal planning method and system there
US20110131240A1 (en) Personalized Nutrition Advisor
US11854684B2 (en) Methods and systems for nourishment refinement using psychiatric markers
US11461700B2 (en) Methods and systems for using artificial intelligence to analyze user activity data
CN108877896A (zh) 一种人工智能生成体重管理方法
CN110223757A (zh) 食谱方案的推荐方法、装置、介质、电子设备
WO2021025793A1 (en) Methods and systems for using artificial intelligence to analyze user activity data
CN111261260A (zh) 一种膳食推荐系统
CN106548006A (zh) 一种基于用户典型口味的膳食推荐方法
CN116417115B (zh) 妊娠期糖尿病患者个性化营养方案推荐方法及系统
CN108597572A (zh) 一种智能健康规划系统
CN110379487A (zh) 营养方案管理系统
CN110119479A (zh) 一种餐馆推荐方法、装置、设备及可读存储介质
CN112614564A (zh) 一种基于多源异构数据融合的智能化营养膳食推荐方法
AU2022332666A1 (en) System and method for generating personalised dietary recommendation
CN112951374B (zh) 数据分析方法、系统、计算机设备及存储介质
Bouvier et al. The gendering of healthy diets: a multimodal discourse study of food packages marketed at men and women
Chen et al. The Method of Selecting the Evaluation Model for the State of Children's Growth Based on Machine Learning
Khatimah et al. Relationship between body image and breakfast on nutritional status
US20230274812A1 (en) Methods and systems for calculating an edible score in a display interface
Sadhasivam et al. Diet and workout recommendation using ML
Roy et al. Stay-Healthy: an expert system to suggest a healthy diet

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant