CN113672817B - 一种菜谱推荐方法、系统、存储介质和电子设备 - Google Patents

一种菜谱推荐方法、系统、存储介质和电子设备 Download PDF

Info

Publication number
CN113672817B
CN113672817B CN202111225734.6A CN202111225734A CN113672817B CN 113672817 B CN113672817 B CN 113672817B CN 202111225734 A CN202111225734 A CN 202111225734A CN 113672817 B CN113672817 B CN 113672817B
Authority
CN
China
Prior art keywords
outlier
data
user
adjacent
actual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111225734.6A
Other languages
English (en)
Other versions
CN113672817A (zh
Inventor
曾峰
周建东
杜锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Wuyu Zhilian Technology Co ltd
Discovery Technology Shenzhen Co ltd
Original Assignee
Shenzhen Wuyu Zhilian Technology Co ltd
Discovery Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Wuyu Zhilian Technology Co ltd, Discovery Technology Shenzhen Co ltd filed Critical Shenzhen Wuyu Zhilian Technology Co ltd
Priority to CN202111225734.6A priority Critical patent/CN113672817B/zh
Publication of CN113672817A publication Critical patent/CN113672817A/zh
Application granted granted Critical
Publication of CN113672817B publication Critical patent/CN113672817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于智能菜谱技术领域,提供了一种菜谱推荐方法、系统、存储介质和电子设备,菜谱推荐方法包括如下步骤:获取实际数据中的离群数据,所述离群数据包括离群用户信息数据集、离群用户的菜谱数据集;获取离群相邻用户信息数据集,所述离群相邻用户信息数据集与所述离群用户信息数据集相邻,得到离群相邻用户;将所述离群用户的菜谱数据集推荐给所述离群相邻用户。本发明提供了菜谱推荐方法、系统、存储介质和电子设备能够完善菜谱数据库,便于发现系统问题,并加强了用户使用的满意度。

Description

一种菜谱推荐方法、系统、存储介质和电子设备
技术领域
本发明涉及智能菜谱技术领域,尤其是涉及一种菜谱推荐方法、系统、存储介质和电子设备。
背景技术
随着社会的发展以及用户生活水平的提高,用户对饮食要求也越来越高,希望品尝到新鲜美味且种类不同的菜品。因此,用户在做饭之前,通常会习惯性地在网上搜索菜谱,其中,菜谱中可以包括烹饪步骤,用户可以根据菜谱中的烹饪步骤完成烹饪操作。
然而,实际应用中,用户在网上搜索到的菜谱的数量往往是很多的,而现有技术中,或者,通过点击量排序的方法为客户推荐菜品,从而这种方式没有考虑到用户对菜谱数据库内各数字菜谱所表现出来的欢迎与否的情况,导致推荐出的菜谱因推荐过程所依据的维度单一,不能全面、很好地反应每一个数字菜谱对于用户欢迎程度的真实热度情况,将用户困在点击量多的菜谱中,无法获知其他可能感兴趣的菜谱,同时当用户发现自己推荐的菜谱跟自己的点击量有绝对关系时,用户会产生反感心理。
或者,通过综合用户的各方面信息通过现有的相似度匹配方法进行相似度匹配,从而将相似度高的菜谱推荐给相邻用户,但通过相似度高推荐菜谱的方法忽略了相似度低的用户,降低了低相似度用户的好感,从而丧失了低相似度用户,同时,过度的关注高相似度用户将一定程度导致服务器中存储的菜谱数据库进一步偏向高相似度用户,从而导致菜谱数据库向高相似度用户形成内卷且无法自拔。
综上所述,现有技术中存在的技术问题如下:
1. 现有技术中,用户做饭前搜索菜谱已成为常态,急需能够协助用户快速找到目标菜谱的智能推荐菜谱技术;
2. 现有技术中的智能菜谱通过点击量对菜谱进行排序,导致菜谱数据库中推荐的菜谱未能真实反映用户的真实需求,进而降低了用户的好感;
3. 现有技术中的智能菜谱通过相似度匹配的方法将相似度高的菜谱推荐给用户,忽略了低相似度用户的使用体验,从而不仅造成了用户的流失,还使得菜谱数据库中的数据偏向性进一步恶化。
发明内容
本发明的目的是提供一种避免现有菜谱数据库中数据偏差大,扩展菜谱数据库中的数据,增强用户满意度的一种菜谱推荐方法、系统、存储介质和电子设备。
本发明第一方面提供了一种菜谱推荐方法,包括如下步骤:
步骤S10:获取实际数据中的离群数据,所述离群数据包括离群用户信息数据集、离群用户的菜谱数据集;
步骤S20:获取离群相邻用户信息数据集,所述离群相邻用户信息数据集与所述离群用户信息数据集相邻,得到离群相邻用户;
步骤S30:将所述离群用户的菜谱数据集推荐给所述离群相邻用户。
进一步的,步骤S10中,所述离群数据的获取方法包括如下步骤:
步骤S11:获取实际数据,所述实际数据包括实际用户信息数据集;
步骤S12:通过实际用户信息数据集得到平均相邻距离和实际相邻用户数据;
步骤S13:通过实际相邻用户数据得到平均次相邻距离;
步骤S14:通过平均相邻距离和平均次相邻距离得到距离因子;
步骤S15:若距离因子小于等于预设离群系数时,则将距离因子对应的实际数据作为离群数据;若距离因子大于预设离群系数时,则将距离因子对应的实际数据作为非离群数据。
进一步的,实际用户信息数据集X=[X 1 X 2 X 3 、...、X i 、...、X n ],其中,i为实际用户信息数据集的序号,i为整数且i=1、2、3、...、nn为实际用户信息数据集的总数量,X i 为第i号实际用户信息数据集,X n 为第n号实际用户信息数据集,所述实际用户信息数据集X i 包括第i号实际用户信息数据集的q个实际用户维度数据,所述实际用户维度数据为
Figure 441634DEST_PATH_IMAGE001
j为实际用户维度数据
Figure 109375DEST_PATH_IMAGE001
的序号,j为整数且j=1、2、3、...、qq为实际用户维度数据
Figure 371730DEST_PATH_IMAGE001
的总维度数量。
进一步的,所述平均相邻距离
Figure 630673DEST_PATH_IMAGE002
的计算公式为
Figure 853844DEST_PATH_IMAGE003
;其中,D ik 为相邻距离,所述相邻距离为实际用户与实际相邻用户之间的距离,所述相邻距离D ik 的计算公式为
Figure 135396DEST_PATH_IMAGE004
Figure 658781DEST_PATH_IMAGE005
为第j号实际相邻用户维度数据的权重;
Figure 682101DEST_PATH_IMAGE006
为实际相邻用户维度数据;k为实际相邻用户维度数据
Figure 392568DEST_PATH_IMAGE006
的序号,k为整数且k=1、2、3、...、mm为实际相邻用户维度数据
Figure 933270DEST_PATH_IMAGE006
的预设相邻数量,实际相邻用户维度数据
Figure 920949DEST_PATH_IMAGE006
为与实际用户维度数据
Figure 256116DEST_PATH_IMAGE001
最相邻的实际用户维度数据,实际相邻用户维度数据
Figure 781775DEST_PATH_IMAGE006
与实际用户维度数据
Figure 595010DEST_PATH_IMAGE001
属于同一维度集。
进一步的,所述平均次相邻距离
Figure 92987DEST_PATH_IMAGE007
的计算公式为:
Figure 943263DEST_PATH_IMAGE008
,其中,
Figure 956218DEST_PATH_IMAGE009
为次相邻距离,所述次相邻距离为实际相邻用户与实际次相邻用户之间的距离,所述实际次相邻用户为与实际相邻用户相邻的用户,所述次相邻距离
Figure 838724DEST_PATH_IMAGE009
的计算公式为
Figure 660049DEST_PATH_IMAGE010
Figure 212384DEST_PATH_IMAGE011
为实际次相邻用户维度数据,g为实际次相邻用户维度数据
Figure 650319DEST_PATH_IMAGE011
的序号,g为整数且g=1、2、3、...、rr为实际次相邻用户维度数据
Figure 539778DEST_PATH_IMAGE011
的预设相邻数量。
进一步的,所述距离因子L i 的计算公式如下:
Figure 809085DEST_PATH_IMAGE012
进一步的,步骤S20中,所述离群相邻用户信息数据集的获取,包括如下步骤:
步骤S21:所述离群用户信息数据集XL=[XL 1 XL 2 XL 3 、...、XL y 、...、XL z ],其中,y为离群用户信息数据集的序号,z为离群用户信息数据集的总数量,XL y 为第y号离群用户信息数据集,XL n 为第n号离群用户信息数据集;离群用户信息数据集XL y 包括离群用户维度数据xl y
步骤S22:计算离群用户维度数据xl y 与离群相邻用户维度数据xl y,u 的相似度J(y, u),所述离群相邻用户维度数据xl y,u 为与离群用户维度数据xl y 最相邻的离群用户维度数据,所述离群用户维度数据xl y 与所述离群相邻用户维度数据xl y,u 的相似度;
步骤S23:相似度小于等于预设相似系数时,则将所有离群用户维度数据xl y 作为离群相邻用户信息数据集;若相似度大于预设相似系数时,则将相似度小于等于相似系数的离群用户维度数据xl y 作为相邻离群邻用户信息数据集。
本发明第二方面提供了一种菜谱推荐系统,离群数据获取模块,用于获取离群数据;离群相邻用户获取模块,用于获取离群相邻用户信息数据集,并得到离群相邻用户;执行模块,用于将离群用户的菜谱数据集推荐给离群相邻用户。
本发明第三方面提供了一种计算机可读存储介质,用于存储程序,所述程序被执行时,用于实现所述的菜谱推荐方法。
本发明第四方面一种电子设备,包括:一个或多个处理器;存储器,其上存储有一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的菜谱推荐方法。
综上所述,本发明至少具有如下技术效果:
1. 本发明通过离群数据,并以离群数据为对象在预定范围内建立一个或多个离群相邻用户,将离群数据相关的菜谱推荐给所述离群相邻用户,从而进一步拓展并完善了菜谱数据库中的数据,避免离群数据被系统遗弃,避免了菜谱数据库内卷的发生,扩大了用户群体,加强了用户使用的满意度;
2. 本发明通过离群数据,实现了对实际数据、度量范围、度量角度或执行方法等方面错误的反馈,有助于智能菜谱的系统开发人员快速发现问题,解决问题,有效提高系统研发效率;
3. 本发明通过离群数据的建立,能够进一步提高现有技术中相似度匹配的精度,同时从更多维度考虑了用户的需求和喜好,进一步提升了客户的好感;
4. 本发明通过将相邻实际用户信息数据集中的相邻用户维度数据作为离群数据计算的影响因素,综合考虑了不同用户维度数据的距离,使得离群结果的计算更加准确并接近实际情况。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明中菜谱推荐方法的示意图;
图2是本发明中实际用户维度数据的编号示意图;
图3是本发明中实际相邻用户维度数据的示意图;
图4是本发明中实际次相邻用户维度数据的示意图;
图5是本发明中离群相邻用户维度数据的示意图;
图6是本发明中菜谱推荐系统的示意图。
具体实施方式
以下的说明提供了许多不同的实施例、或是例子,用来实施本发明的不同特征。以下特定例子所描述的元件和排列方式,仅用来精简的表达本发明,其仅作为例子,而并非用以限制本发明。
在本发明的描述中,需要理解的是,术语"上"、"下"、"前"、"后"、"左"、"右"、"垂直"、"水平"、"顶"、"底"、"内"、"外"等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语"第一"、"第二"仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有"第一"、"第二"的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,"多个"的含义是两个或两个以上,除非另有明确具体的限定。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语"安装"、"相连"、"连接"应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接:可以是机械连接,也可以是电连接或可以相互通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之"上"或之"下"可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征"之上"、"上方"和"上面"包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征"之下"、"下方"和"下面"包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度小于第二特征。
本发明可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本发明提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
如图1所示,本发明实施例1提供了一种菜谱推荐方法,包括如下步骤:
步骤S10:获取实际数据中的离群数据,所述离群数据包括离群用户信息数据集、离群用户的菜谱数据集;
步骤S20:获取离群相邻用户信息数据集,所述离群相邻用户信息数据集与所述离群用户信息数据集相邻,得到离群相邻用户;
步骤S30:将所述离群用户的菜谱数据集推荐给所述离群相邻用户。
离群数据为实际数据中处于离群状态的数据,离群用户信息数据集为离群数据中用户个人信息所形成的数据集合,多个离群用户的菜谱数据所形成的数据集合为离群用户的菜谱数据集。
离群相邻用户信息数据集包括离群相邻用户维度数据,离群用户信息数据集包括离群用户维度数据,离群相邻用户维度数据为与离群用户维度数据最相邻的离群用户维度数据。
可将所述离群用户的菜谱数据集全部推荐给所述离群相邻用户,也可根据预设权重将一定预设权重的离群用户的菜谱数据集推荐给离群相邻用户。决定所述预设权重的因素与离群相邻用户维度数据与离群用户维度数据之间的相邻距离、距离因子和/或相似度有关。
通过离群数据,并以离群数据为对象在预定范围内建立一个或多个离群相邻用户,将离群数据相关的菜谱推荐给所述离群相邻用户,从而拓展菜谱数据库中的数据,避免离群数据被系统遗弃,避免了菜谱数据库内卷的发生,扩大了用户群体,加强了用户使用的满意度。
通过离群数据,实现了对实际数据、度量范围、度量角度或执行方法等方面错误的反馈,有助于智能菜谱的系统开发人员快速发现问题,解决问题。
通过离群数据的建立,能够进一步提高现有技术中相似度匹配的精度,同时从更多维度考虑了用户的需求和喜好,进一步提升了客户的好感。
进一步的,步骤S10中,所述离群数据的获取方法包括如下步骤:
步骤S11:获取实际数据,所述实际数据包括实际用户信息数据集;
步骤S12:通过实际用户信息数据集得到平均相邻距离和实际相邻用户数据;
步骤S13:通过实际相邻用户数据得到平均次相邻距离;
步骤S14:通过平均相邻距离和平均次相邻距离得到距离因子;
步骤S15:若距离因子小于等于预设离群系数时,则将距离因子对应的实际数据作为离群数据;若距离因子大于预设离群系数时,则将距离因子对应的实际数据作为非离群数据。
所述实际数据为历史数据与实时更新数据的集合。所述预设离群系数为总体标准差的倍数、显著性水平、狄克逊系数、格拉布斯系数或查奈尔系数。
进一步的,实际用户信息数据集X=[X 1 X 2 X 3 、...、X i 、...、X n ],其中,i为实际用户信息数据集的序号,i为整数且i=1、2、3、...、nn为实际用户信息数据集的总数量,X i 为第i号实际用户信息数据集,X n 为第n号实际用户信息数据集,所述实际用户信息数据集X i 包括第i号实际用户信息数据集的q个实际用户维度数据,所述实际用户维度数据为
Figure 656955DEST_PATH_IMAGE013
j为实际用户维度数据
Figure 206621DEST_PATH_IMAGE013
的序号,j为整数且j=1、2、3、...、qq为实际用户维度数据
Figure 899771DEST_PATH_IMAGE013
的总维度数量。
所述实际用户维度数据x j i 包括年龄维度数据、疾病维度数据、预定时期维度数据、天气维度数据、地理位置维度数据,时间维度数据、温度维度数据和/或湿度维度数据。所述实际用户维度数据由对用户的维度特征信息数据进行归一化处理得到,所述用户的维度特征信息用于记录用户使用菜谱时的维度特征信息,同一用户由于使用次数或使用时间的不同具有多个实际用户维度数据。所述归一化处理方法为本领域技术人员常用的数据归一化的方法。
所述年龄维度数据由对用户年龄数据归一化处理之后得到,用户年龄数据用于记录菜谱使用者的年龄信息;所述疾病维度数据由对用户疾病数据归一化处理之后得到,用户疾病数据用于体现用户身体状况,如感冒、发烧、糖尿病、心脏病、肾病、胃溃疡等;所述预定时期维度数据由对用户预定时期数据归一化处理之后得到,用户预定时期数据用于体现用于在预定时间段内的状态信息,如孕期、哺乳期、高考准备期、减肥期、生理期等;所述天气维度数据由对用户天气数据归一化处理之后得到,用户天气数据用于体现用户浏览菜谱时的天气信息,如晴天、多云、小雨、大雨等;所述地理位置维度数据由对用户地理位置数据归一化处理之后得到,用户地理位置数据用于记录用户浏览菜谱时的地理位置信息;所述时间维度数据由对用户时间数据归一化处理之后得到,用户时间数据用于记录用户浏览菜谱时的时间信息;所述温度维度数据由对用户温度数据归一化处理之后得到,用户温度数据用于记录用户在浏览菜谱时的温度信息,可与用户天气数据选择使用,也可同时使用;所述湿度维度数据由对用户湿度数据归一化处理之后得到,用户湿度数据用于记录用户在浏览菜谱时的环境湿度,可通过设置外置传感器获得。
对上述用户的维度特征信息数据进行编号,如当将年龄维度数据作为第1号实际用户维度数据,即j=1,年龄维度数据为
Figure 23585DEST_PATH_IMAGE014
,如图2所示。
进一步的,所述平均相邻距离
Figure 652143DEST_PATH_IMAGE015
的计算公式为
Figure 64670DEST_PATH_IMAGE016
;其中,D ik 为相邻距离,所述相邻距离为实际用户与实际相邻用户之间的距离,所述相邻距离D ik 的计算公式为
Figure 561510DEST_PATH_IMAGE017
Figure 336568DEST_PATH_IMAGE018
为第j号实际相邻用户维度数据的权重;
Figure 791820DEST_PATH_IMAGE019
为实际相邻用户维度数据;k为实际相邻用户维度数据
Figure 239113DEST_PATH_IMAGE019
的序号,k为整数且k=1、2、3、...、mm为实际相邻用户维度数据
Figure 274065DEST_PATH_IMAGE019
的预设相邻数量,实际相邻用户维度数据
Figure 310155DEST_PATH_IMAGE019
为与实际用户维度数据
Figure 795363DEST_PATH_IMAGE013
最相邻的实际用户维度数据,实际相邻用户维度数据
Figure 182482DEST_PATH_IMAGE019
与实际用户维度数据
Figure 834174DEST_PATH_IMAGE013
属于同一维度集。
相邻用户维度数据
Figure 459190DEST_PATH_IMAGE019
所组成的集合为相邻实际用户信息数据集。通过将相邻实际用户信息数据集中的相邻用户维度数据
Figure 256245DEST_PATH_IMAGE019
作为离群数据计算的影响因素,综合考虑了不同用户维度数据的距离,使得离群结果的计算更加准确并接近实际情况。
当实际用户维度数据的总维度数量q=1时,如仅将年龄维度数据作为实际用户维度数据时,即j=1,当相邻年龄维度数据
Figure 724135DEST_PATH_IMAGE020
的预设相邻数量m=5时,如图3所示,即k=1、2、3、4、5,相对应的预设相邻距离分别为
Figure 366469DEST_PATH_IMAGE021
Figure 377151DEST_PATH_IMAGE022
Figure 889647DEST_PATH_IMAGE023
Figure 533249DEST_PATH_IMAGE024
Figure 776012DEST_PATH_IMAGE025
,因此,第i号实际用户与第i号实际用户的实际相邻用户之间的相邻距离为
Figure 906779DEST_PATH_IMAGE026
当实际用户维度数据的总维度数量q=2时,如将年龄维度数据和疾病维度数据作为实际用户维度数据时,即年龄维度数据为
Figure 780057DEST_PATH_IMAGE020
,疾病维度数据为
Figure 707693DEST_PATH_IMAGE027
,令预设相邻数量m=2时,关于年龄维度数据,第i号实际用户与第i号实际用户的相邻用户之间的年龄相邻距离
Figure 957408DEST_PATH_IMAGE028
;关于疾病维度数据,第i号实际用户与第i号实际用户的相邻用户之间的疾病相邻距离
Figure 739420DEST_PATH_IMAGE029
;当为年龄维度数据和疾病维度数据分别加上权重之后,第i号实际用户与第i号实际用户的相邻用户之间的相邻距离为
Figure 518020DEST_PATH_IMAGE030
。其中,
Figure 588744DEST_PATH_IMAGE031
为实际相邻年龄维度数据的权重,
Figure 254867DEST_PATH_IMAGE032
为实际相邻疾病维度数据的权重,具体的
Figure 563489DEST_PATH_IMAGE031
Figure 44149DEST_PATH_IMAGE032
可根据实际情况进行赋值;疾病维度数据可通过将各类疾病进行编号赋值后获得,如将感冒、发烧、糖尿病、心脏病、肾病、胃溃疡分别赋值为1、2、3、4、5、6,同时可根据需求扩展上述疾病类型,并进一步细化疾病种类,如若有与心脏病类似的风湿性心脏病、肺源性心脏病、高血压性心脏病、冠心病,可分别赋值为4.1、4.2、4.3、4.4。
进一步的,所述平均次相邻距离
Figure 133328DEST_PATH_IMAGE033
的计算公式为:
Figure 334633DEST_PATH_IMAGE034
,其中,
Figure 28919DEST_PATH_IMAGE035
为次相邻距离,所述次相邻距离为实际相邻用户与实际次相邻用户之间的距离,所述实际次相邻用户为与实际相邻用户相邻的用户,所述次相邻距离
Figure 414901DEST_PATH_IMAGE035
的计算公式为
Figure 256955DEST_PATH_IMAGE036
Figure 996372DEST_PATH_IMAGE037
为实际次相邻用户维度数据,g为实际次相邻用户维度数据
Figure 545165DEST_PATH_IMAGE038
的序号,g为整数且g=1、2、3、...、rr为实际次相邻用户维度数据
Figure 367628DEST_PATH_IMAGE038
的预设相邻数量。
当实际用户维度数据的总维度数量q=1时,如仅将疾病维度数据作为实际用户维度数据时,即j=1,当相邻疾病维度数据
Figure 228137DEST_PATH_IMAGE020
的预设相邻数量m=5,如图4所示,第5号实际相邻用户维度数据
Figure 161458DEST_PATH_IMAGE039
的实际次相邻用户维度数据为
Figure 377806DEST_PATH_IMAGE040
,通常本领域技术人员为数据可比性,将设置r=m,即此处r=5,则实际次相邻用户维度数据为
Figure 105591DEST_PATH_IMAGE041
Figure 594341DEST_PATH_IMAGE042
Figure 455987DEST_PATH_IMAGE043
Figure 448214DEST_PATH_IMAGE044
Figure 612479DEST_PATH_IMAGE045
通过计算所述平均距离
Figure 398645DEST_PATH_IMAGE033
得到实际用户信息数据集Xm个相邻实际用户信息数据集的平均距离。
进一步的,所述距离因子L i 的计算公式如下:
Figure 798402DEST_PATH_IMAGE046
所述距离因子L i 用于表示实际数据与其相邻实际数据之间的离群程度。
进一步的,步骤S20中,所述离群相邻用户信息数据集的获取,包括如下步骤:
步骤S21:所述离群用户信息数据集XL=[XL 1 XL 2 XL 3 、...、XL y 、...、XL z ],其中,y为离群用户信息数据集的序号,z为离群用户信息数据集的总数量,XL y 为第y号离群用户信息数据集,XL n 为第n号离群用户信息数据集;离群用户信息数据集XL y 包括离群用户维度数据xl y
步骤S22:计算离群用户维度数据xl y 与离群相邻用户维度数据xl y,u 的相似度J(y, u),所述离群相邻用户维度数据xl y,u 为与离群用户维度数据xl y 最相邻的离群用户维度数据,所述离群用户维度数据xl y 与所述离群相邻用户维度数据xl y,u 的相似度;
步骤S23:相似度小于等于预设相似系数时,则将所有离群用户维度数据xl y 作为离群相邻用户信息数据集;若相似度大于预设相似系数时,则将相似度小于等于相似系数的离群用户维度数据xl y 作为相邻离群邻用户信息数据集。
如图5所示,即当某一离群用户维度数据xl y ,所述离群相邻用户维度数据xl y,u 的总离群相邻数量为4时,离群相邻用户维度数据xl y,u xl y,1 、xl y,2 、xl y,3 xl y,4
所述相似度的计算方法为本领域技术人员常用的相似度算法,如:明可夫斯基距离(Minkowski distance)、余弦相似度(Cosine Similarity)、Jaccard系数、皮尔森相关系数(Pearson Correlation Coefficient)。
步骤S30中,根据离群用户维度数据xl y 对离群用户的菜谱数据集进行排序,所述离群用户维度数据xl y 包括年龄维度数据、疾病维度数据、预定时期维度数据、天气维度数据、地理位置维度数据,时间维度数据、温度维度数据和/或湿度维度数据。
实施例2:
如图6所示,本发明实施例2提供了一种菜谱推荐系统,离群数据获取模块,用于获取离群数据;离群相邻用户获取模块,用于获取离群相邻用户信息数据集,并得到离群相邻用户;执行模块,用于将离群用户的菜谱数据集推荐给离群相邻用户。
实施例3:
本发明实施例3提供了一种计算机可读存储介质,用于存储程序,所述程序被执行时,用于实现所述的菜谱推荐方法。
实施例4:
本发明实施例4一种电子设备,包括:一个或多个处理器;存储器,其上存储有一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的菜谱推荐方法。
本发明提供了一种菜谱推荐方法、系统、存储介质和电子设备,避免现有菜谱数据库中数据偏差大,用户满意度低的问题;创造性的通过寻找离群数据,并将离群数据的离群菜谱信息推荐给与离群数据相似度较高的离群相邻用户,从而根据离群相邻用户对离群菜谱信息的选择,进一步使得离群数据变为非离群数据,进而扩展了菜谱数据库中的数据,增强离群用户满意度,进而扩大了离群用户所处的用户群体,提升了客户的好感度。同时,可对离群数据进行数据分析、检查、纠错,有助于系统开发人员快速发现系统问题,进而做出相应改进,有效提高系统研发效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种菜谱推荐方法,其特征在于,包括如下步骤:
步骤S10:获取实际数据中的离群数据,所述离群数据包括离群用户信息数据集、离群用户的菜谱数据集;所述离群数据为实际数据中处于离群状态的数据,所述离群用户信息数据集为离群数据中用户个人信息所形成的数据集合,多个离群用户的菜谱数据所形成的数据集合为离群用户的菜谱数据集;
步骤S20:获取离群相邻用户信息数据集,所述离群相邻用户信息数据集与所述离群用户信息数据集相邻,得到离群相邻用户;
所述离群相邻用户信息数据集的获取,包括如下步骤:
步骤S21:所述离群用户信息数据集XL=[XL1、XL2、XL3、...、XLy、...、XLz],其中,y为离群用户信息数据集的序号,z为离群用户信息数据集的总数量,XLy为第y号离群用户信息数据集,XLn为第n号离群用户信息数据集;离群用户信息数据集XLy包括离群用户维度数据xly;
步骤S22:计算离群用户维度数据xly与离群相邻用户维度数据xly,u的相似度J(y,u),所述离群相邻用户维度数据xly,u为与离群用户维度数据xly最相邻的离群用户维度数据;
步骤S23:若相似度小于等于预设相似系数时,则将所有离群用户维度数据xly作为离群相邻用户信息数据集;若相似度大于预设相似系数时,则将相似度小于等于相似系数的离群用户维度数据xly作为相邻离群邻用户信息数据集;
步骤S30:将所述离群用户的菜谱数据集推荐给所述离群相邻用户。
2.如权利要求1所述的一种菜谱推荐方法,其特征在于,步骤S10中,所述离群数据的获取方法包括如下步骤:
步骤S11:获取实际数据,所述实际数据包括实际用户信息数据集;实际用户信息数据集X=[X 1 X 2 X 3 、...、X i 、...、X n ],其中,i为实际用户信息数据集的序号,i为整数且i=1、2、3、...、nn为实际用户信息数据集的总数量,X i 为第i号实际用户信息数据集,X n 为第n号实际用户信息数据集,所述实际用户信息数据集X i 包括第i号实际用户信息数据集的q个实际用户维度数据,所述实际用户维度数据为
Figure DEST_PATH_IMAGE001
j为实际用户维度数据
Figure 282424DEST_PATH_IMAGE001
的序号,j为整数且j=1、2、3、...、qq为实际用户维度数据
Figure 310423DEST_PATH_IMAGE001
的总维度数量;
步骤S12:通过实际用户信息数据集得到平均相邻距离和实际相邻用户数据;所述平均相邻距离
Figure 429689DEST_PATH_IMAGE002
的计算公式为
Figure DEST_PATH_IMAGE003
;其中,D ik 为相邻距离,所述相邻距离为实际用户与实际相邻用户之间的距离,所述相邻距离D ik 的计算公式为
Figure 619362DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
为第j号实际相邻用户维度数据的权重;
Figure 394551DEST_PATH_IMAGE006
为实际相邻用户维度数据;k为实际相邻用户维度数据
Figure 960661DEST_PATH_IMAGE006
的序号,k为整数且k=1、2、3、...、mm为实际相邻用户维度数据
Figure 262330DEST_PATH_IMAGE006
的预设相邻数量,实际相邻用户维度数据
Figure 560587DEST_PATH_IMAGE006
为与实际用户维度数据
Figure 947706DEST_PATH_IMAGE001
最相邻的实际用户维度数据,实际相邻用户维度数据
Figure 317508DEST_PATH_IMAGE006
与实际用户维度数据
Figure 145786DEST_PATH_IMAGE001
属于同一维度集;
步骤S13:通过实际相邻用户数据得到平均次相邻距离;所述平均次相邻距离
Figure DEST_PATH_IMAGE007
的计算公式为:
Figure 942841DEST_PATH_IMAGE008
,其中,
Figure DEST_PATH_IMAGE009
为次相邻距离,所述次相邻距离为实际相邻用户与实际次相邻用户之间的距离,所述实际次相邻用户为与实际相邻用户相邻的用户,所述次相邻距离
Figure 489360DEST_PATH_IMAGE009
的计算公式为
Figure 662852DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE011
为实际次相邻用户维度数据,g为实际次相邻用户维度数据
Figure 611217DEST_PATH_IMAGE011
的序号,g为整数且g=1、2、3、...、rr为实际次相邻用户维度数据
Figure 579173DEST_PATH_IMAGE011
的预设相邻数量;
步骤S14:通过平均相邻距离和平均次相邻距离得到距离因子;所述距离因子L i 的计算公式如下:
Figure 675305DEST_PATH_IMAGE012
步骤S15:若距离因子小于等于预设离群系数时,则将距离因子对应的实际数据作为离群数据;若距离因子大于预设离群系数时,则将距离因子对应的实际数据作为非离群数据。
3.一种菜谱推荐系统,其特征在于,离群数据获取模块,用于获取实际数据中的离群数据;离群相邻用户获取模块,用于获取离群相邻用户信息数据集,并得到离群相邻用户;执行模块,用于将离群用户的菜谱数据集推荐给离群相邻用户;所述离群数据为实际数据中处于离群状态的数据,所述离群用户信息数据集为离群数据中用户个人信息所形成的数据集合,多个离群用户的菜谱数据所形成的数据集合为离群用户的菜谱数据集;
所述离群相邻用户信息数据集的获取,包括如下步骤:
步骤S21:所述离群用户信息数据集XL=[XL1、XL2、XL3、...、XLy、...、XLz],其中,y为离群用户信息数据集的序号,z为离群用户信息数据集的总数量,XLy为第y号离群用户信息数据集,XLn为第n号离群用户信息数据集;离群用户信息数据集XLy包括离群用户维度数据xly;
步骤S22:计算离群用户维度数据xly与离群相邻用户维度数据xly,u的相似度J(y,u),所述离群相邻用户维度数据xly,u为与离群用户维度数据xly最相邻的离群用户维度数据;
步骤S23:若相似度小于等于预设相似系数时,则将所有离群用户维度数据xly作为离群相邻用户信息数据集;若相似度大于预设相似系数时,则将相似度小于等于相似系数的离群用户维度数据xly作为相邻离群邻用户信息数据集。
4.一种计算机可读存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1-2之一所述的菜谱推荐方法。
5.一种电子设备,其特征在于,包括:一个或多个处理器;存储器,其上存储有一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-2之一所述的菜谱推荐方法。
CN202111225734.6A 2021-10-21 2021-10-21 一种菜谱推荐方法、系统、存储介质和电子设备 Active CN113672817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111225734.6A CN113672817B (zh) 2021-10-21 2021-10-21 一种菜谱推荐方法、系统、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111225734.6A CN113672817B (zh) 2021-10-21 2021-10-21 一种菜谱推荐方法、系统、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN113672817A CN113672817A (zh) 2021-11-19
CN113672817B true CN113672817B (zh) 2022-02-11

Family

ID=78550754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111225734.6A Active CN113672817B (zh) 2021-10-21 2021-10-21 一种菜谱推荐方法、系统、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN113672817B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0904911D0 (en) * 2008-03-21 2009-05-06 Dressbot Inc System and method for collaborative shopping, business and entertainment
EP3506275A1 (en) * 2017-12-28 2019-07-03 Ethicon LLC Surgical network recommendations from real time analysis of procedure variables against a baseline highlighting differences from the optimal solution
CN110875090A (zh) * 2018-08-31 2020-03-10 北京京东尚科信息技术有限公司 智能冰箱及其信息交互方法、系统和计算机可存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287036A (zh) * 2020-10-19 2021-01-29 西安交通大学 一种基于谱聚类的离群点检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0904911D0 (en) * 2008-03-21 2009-05-06 Dressbot Inc System and method for collaborative shopping, business and entertainment
EP3506275A1 (en) * 2017-12-28 2019-07-03 Ethicon LLC Surgical network recommendations from real time analysis of procedure variables against a baseline highlighting differences from the optimal solution
CN110875090A (zh) * 2018-08-31 2020-03-10 北京京东尚科信息技术有限公司 智能冰箱及其信息交互方法、系统和计算机可存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于多维度特征的饮食健康推荐;喻兵等;《计算机应用与软件》;20190731;第110-116 *

Also Published As

Publication number Publication date
CN113672817A (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
US8774526B2 (en) Intelligent image search results summarization and browsing
US8239333B2 (en) Media tag recommendation technologies
US7720851B2 (en) Active context-based concept fusion
US9507778B2 (en) Summarization of media object collections
US8346767B2 (en) Image search result summarization with informative priors
US20120136896A1 (en) System and method for imputing missing values and computer program product thereof
WO2020113673A1 (zh) 一种基于多组学集成的癌症亚型分类方法
US7801674B2 (en) Terminal device, server, system and program for retrieving landmark name
US20120330962A1 (en) Method and Apparatus of Providing Suggested Terms
US10762163B2 (en) Probabilistic matrix factorization for automated machine learning
Sun et al. Multiple testing of composite null hypotheses in heteroscedastic models
Nagode et al. The rebmix algorithm and the univariate finite mixture estimation
CN112818222B (zh) 一种基于知识图谱的个性化饮食推荐方法及系统
CN104063555B (zh) 面向遥感信息智能分发的用户模型建模方法
Wang et al. Optimization of dynamic multi-response problems using grey multiple attribute decision making
CN113672817B (zh) 一种菜谱推荐方法、系统、存储介质和电子设备
CN108562867A (zh) 一种基于聚类的指纹定位方法及装置
Sinha et al. Extractive summarization of personal photos from life events
US8626772B2 (en) Double weighted correlation scheme
CN116308618A (zh) 一种推荐模型的训练方法、推荐模型及商品推荐方法
US20220147588A1 (en) Classifying job search queries for improved precision
Haixia et al. Classification of edible oils by infrared spectroscopy with optimized k-means clustering by a hybrid particle swarm algorithm
US20140093844A1 (en) Method for identification of food ingredients in multimedia content
TW202219980A (zh) 用於估算心肌梗塞機率之計算裝置
Cuny et al. On modeling wood formation using parametric and semiparametric regressions for count data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant