CN116484083A - 菜品信息的显示方法和装置、存储介质及电子装置 - Google Patents
菜品信息的显示方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN116484083A CN116484083A CN202310345233.4A CN202310345233A CN116484083A CN 116484083 A CN116484083 A CN 116484083A CN 202310345233 A CN202310345233 A CN 202310345233A CN 116484083 A CN116484083 A CN 116484083A
- Authority
- CN
- China
- Prior art keywords
- target
- dish
- food material
- information
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 235000013305 food Nutrition 0.000 claims abstract description 532
- 239000000463 material Substances 0.000 claims abstract description 518
- 238000012549 training Methods 0.000 claims description 58
- 238000009792 diffusion process Methods 0.000 claims description 57
- 238000010411 cooking Methods 0.000 claims description 52
- 230000004927 fusion Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 3
- 235000013601 eggs Nutrition 0.000 description 18
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 17
- 240000003768 Solanum lycopersicum Species 0.000 description 17
- 230000004044 response Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000010025 steaming Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000015219 food category Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种菜品信息的显示方法和装置、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,其中,上述方法包括:获取目标终端的菜品生成请求,其中,所述菜品生成请求用于请求使用一组参考食材生成匹配的菜品;将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,所述目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;响应于所述菜品生成请求,控制在所述目标终端的屏幕上显示所述目标菜品图片。通过本申请,解决了相关技术中的菜品信息的显示方法存在由于显示的菜品与输入食材的匹配度低导致菜品信息获取的耗时长的技术问题。
Description
技术领域
本申请涉及互联网领域,具体而言,涉及一种菜品信息的显示方法和装置、存储介质及电子装置。
背景技术
目前,用户在进行烹饪时,可以借助相关应用进行菜品搜索,从而参考搜索到的菜品以及相关的菜谱辅助进行菜品烹饪。在进行菜谱搜索时,用户通常输入当前已有的一个或多个食材,由应用后台根据菜谱评分、菜谱中的食材与输入食材的相关度、用户历史浏览等,为用户推送菜品以及相关的菜谱。
然而,上述菜品信息的显示方式,所推荐的菜品为已存在的、且包含该食材的菜品,同时,除了包含当前输入的食材以外,还可能包含其他类型的关联食材,如果此时用户没有其他关联食材,则无法完成烹饪,因此,需要用户花费较长时间翻找所显示的菜品列表才可能找到所需的菜品。
由此可见,相关技术中的菜品信息的显示方法,存在由于显示的菜品与输入食材的匹配度低导致菜品信息获取的耗时长的技术问题。
发明内容
本申请实施例提供了一种菜品信息的显示方法和装置、存储介质及电子装置,以至少解决相关技术中由于显示的菜品与输入食材的匹配度低导致菜品信息获取的耗时长的技术问题。
根据本申请实施例的一个方面,提供了一种菜品信息的显示方法,包括:获取目标终端的菜品生成请求,其中,所述菜品生成请求用于请求使用一组参考食材生成匹配的菜品;将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,所述目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;响应于所述菜品生成请求,控制在所述目标终端的屏幕上显示所述目标菜品图片。
在一个示例性实施例中,在所述获取目标终端发送的菜品生成请求之后,所述方法还包括:从所述菜品生成请求中提取出所述一组参考食材中的第一参考食材的食材图片、以及所述一组参考食材中的第二参考食材的食材标识,其中,所述第一参考食材的食材信息为所述第一参考食材的食材图片,所述第二参考食材的食材信息为所述第二参考食材的食材标识。
在一个示例性实施例中,所述将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,包括:将所述一组参考食材的食材信息、以及目标厨具的厨具信息输入到所述目标生成模型,得到所述目标菜品图片,其中,所述目标生成模型还用于将输入的食材信息、以及输入的厨具信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片。
在一个示例性实施例中,所述将所述一组参考食材的食材信息、以及目标厨具的厨具信息输入到所述目标生成模型,得到所述目标菜品图片,包括:将所述一组参考食材的食材信息、所述目标厨具的厨具信息、以及目标烹饪方式的指示信息输入到所述目标生成模型,得到所述目标菜品图片,其中,所述目标生成模型还用于将输入的食材信息、输入的厨具信息、以及输入的烹饪方式的指示信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片。
在一个示例性实施例中,在所述获取目标终端发送的菜品生成请求之后,所述方法还包括:在从所述菜品生成请求中提取出目标文本指令、且从所述目标文本指令中解析出厨具标识的情况下,将解析出的厨具标识确定为所述目标厨具的厨具信息;在从所述菜品生成请求中提取出目标文本指令、且未从所述目标文本指令中解析出厨具标识,或者,从所述菜品生成请求中未提取出文本指令的情况下,将所述一组参考食材的食材类别匹配的预设厨具信息,确定为所述目标厨具的厨具信息。
在一个示例性实施例中,所述将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,包括:将所述一组参考食材的食材信息中的每个参考食材的食材信息均作为一种控制条件输入到目标扩散模型,以通过所述目标扩散模型执行以下处理操作,其中,所述目标生成模型为所述目标扩散模型:对作为所述目标扩散模型的控制条件的每个输入信息分别转换为与所述每个输入信息对应的输入特征,其中,所述目标扩散模型的控制条件包括所述一组参考食材的食材信息;与所述每个输入信息对应的输入特征进行特征融合,得到目标融合特征,其中,所述目标融合特征用于表征所述目标扩散模型的控制条件;将初始噪声图片的图像特征和所述目标融合特征作为所述目标扩散模型中的去噪网络的注意力层的权重矩阵输入到所述注意力层中,得到所述去噪网络输出的目标菜品特征,其中,所述目标菜品特征是对所述初始噪声图片的图像特征进行去噪处理之后得到的图像特征;对所述目标菜品特征进行解码处理,得到所述目标菜品图片。
在一个示例性实施例中,所述方法还包括:获取训练菜品图片以及与所述训练菜品图片对应的一组训练食材的食材信息;将所述一组训练食材中的每个训练食材的食材信息分别作为初始生成模型的一种控制条件,使用所述训练菜品图片对所述初始生成模型进行模型训练,得到所述目标生成模型。
根据本申请实施例的另一个方面,还提供了一种菜品信息的显示装置,包括:第一获取单元,用于获取目标终端的菜品生成请求,其中,所述菜品生成请求用于请求使用一组参考食材生成匹配的菜品;输入单元,用于将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,所述目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;控制单元,用于响应于所述菜品生成请求,控制在所述目标终端的屏幕上显示所述目标菜品图片。
在一个示例性实施例中,所述装置还包括:提取单元,用于在所述获取目标终端发送的菜品生成请求之后,从所述菜品生成请求中提取出所述一组参考食材中的第一参考食材的食材图片、以及所述一组参考食材中的第二参考食材的食材标识,其中,所述第一参考食材的食材信息为所述第一参考食材的食材图片,所述第二参考食材的食材信息为所述第二参考食材的食材标识。
在一个示例性实施例中,所述输入单元包括:第一输入模块,用于将所述一组参考食材的食材信息、以及目标厨具的厨具信息输入到所述目标生成模型,得到所述目标菜品图片,其中,所述目标生成模型还用于将输入的食材信息、以及输入的厨具信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片。
在一个示例性实施例中,所述第一输入模块包括:输入子模块,用于将所述一组参考食材的食材信息、所述目标厨具的厨具信息、以及目标烹饪方式的指示信息输入到所述目标生成模型,得到所述目标菜品图片,其中,所述目标生成模型还用于将输入的食材信息、输入的厨具信息、以及输入的烹饪方式的指示信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片。
在一个示例性实施例中,所述装置还包括:第一确定单元,用于在所述获取目标终端发送的菜品生成请求之后,在从所述菜品生成请求中提取出目标文本指令、且从所述目标文本指令中解析出厨具标识的情况下,将解析出的厨具标识确定为所述目标厨具的厨具信息;第二确定单元,用于在从所述菜品生成请求中提取出目标文本指令、且未从所述目标文本指令中解析出厨具标识,或者,从所述菜品生成请求中未提取出文本指令的情况下,将所述一组参考食材的食材类别匹配的预设厨具信息,确定为所述目标厨具的厨具信息。
在一个示例性实施例中,所述输入单元包括:第二输入模块,用于将所述一组参考食材的食材信息中的每个参考食材的食材信息均作为一种控制条件输入到目标扩散模型,以通过所述目标扩散模型执行以下处理操作,其中,所述目标生成模型为所述目标扩散模型:对作为所述目标扩散模型的控制条件的每个输入信息分别转换为与所述每个输入信息对应的输入特征,其中,所述目标扩散模型的控制条件包括所述一组参考食材的食材信息;与所述每个输入信息对应的输入特征进行特征融合,得到目标融合特征,其中,所述目标融合特征用于表征所述目标扩散模型的控制条件;将初始噪声图片的图像特征和所述目标融合特征作为所述目标扩散模型中的去噪网络的注意力层的权重矩阵输入到所述注意力层中,得到所述去噪网络输出的目标菜品特征,其中,所述目标菜品特征是对所述初始噪声图片的图像特征进行去噪处理之后得到的图像特征;对所述目标菜品特征进行解码处理,得到所述目标菜品图片。
在一个示例性实施例中,所述装置还包括:第二获取单元,用于获取训练菜品图片以及与所述训练菜品图片对应的一组训练食材的食材信息;训练单元,用于将所述一组训练食材中的每个训练食材的食材信息分别作为初始生成模型的一种控制条件,使用所述训练菜品图片对所述初始生成模型进行模型训练,得到所述目标生成模型。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述菜品信息的显示方法。
根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的菜品信息的显示方法。
在本申请实施例中,采用将参考食材的食材信息作为生成模型的图片生成控制条件来自动生成菜品图片的方式,获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品;将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片,由于在获取到目标终端的菜品生成请求后,将参考食材的食材信息作为菜品图片生成模型的图片生成的控制条件(相当于是菜品生成的约束条件),从而可以通过图片生成模型自动生成与输入的食材信息所指示的食材匹配的菜品图片,由于菜品图片是直接生成而不是从已有菜品图片中匹配的,可以实现提高显示的菜品图片与输入的食材信息的匹配度的目的,达到减少菜品信息获取时长的技术效果,进而解决了相关技术中的菜品信息的显示方法存在由于显示的菜品与输入食材的匹配度低导致菜品信息获取的耗时长的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种可选的菜品信息的显示方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的菜品信息的显示方法的流程示意图;
图3是根据本申请实施例的另一种可选的菜品信息的显示方法的流程示意图;
图4是根据本申请实施例的又一种可选的菜品信息的显示方法的流程示意图;
图5是根据本申请实施例的一种可选的菜品信息的显示装置的结构框图;
图6是根据本申请实施例的一种可选的电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种菜品信息的显示方法。该菜品信息的显示方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述菜品信息的显示方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端设备或终端设备上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等等。
本申请实施例的菜品信息的显示方法可以由服务器104来执行,也可以由终端设备102来执行,还可以是由服务器104和终端设备102共同执行。其中,终端设备102执行本申请实施例的菜品信息的显示方法也可以是由安装在其上的客户端来执行。
以由服务器104来执行本实施例中的菜品信息的显示方法为例,图2是根据本申请实施例的一种可选的菜品信息的显示方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
步骤S202,获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品。
本实施例中的菜品信息的显示方法可以应用到基于一组参考食材的食材信息生成匹配菜品图片的场景。这里,参考食材的食材信息可以是图片、文本(标识)等多种模态,参考食材的种类可以是大于或者等于1的任意正整数,当使用两种及以上种类的参考食材时,可以多种信息模态任意组合使用,即,多模态输入,例如,可以都以图片形式,也可以都以文字形式,还可以既有以图片形式又有以文字形式,生成的菜品图片可以是包含参考食材的菜品图片,例如,可以是仅包含参考食材的菜品图片。
在现实生活中,用户可能会遇到这样的场景,当用户想烹饪菜肴时,可以借助相关应用进行菜品搜索,从而参考搜索到的菜品以及相关的菜谱辅助进行菜品烹饪。在进行菜谱搜索时,用户通常输入当前拥有的一个或多个食材的名称或者图片,由应用后台根据菜谱评分、菜谱中的食材与输入食材的相关度、用户历史浏览等,为用户推送菜品以及相关的菜谱。
然而,上述菜品信息的显示方式,所推荐的菜品为已存在的、且包含该食材的菜品,同时,除了包含当前输入的食材以外,还可能包含其他类型的关联食材,如果此时用户没有其他关联食材,则无法完成烹饪,因此,需要用户花费较长时间翻找所显示的菜品列表才可能找到所需的菜品。
为了解决上述问题的至少部分,在本实施例中,预训练好用于进行菜品生成的生成模型,该生成模型可以将输入的参考食材的食材信息作为一种图片生成的控制条件,直接生成与输入的参考食材匹配的菜品图片,生成的菜品图片所展示的可以是已有菜品,也可以是没有的菜品(即,已有菜谱体系下未尝试过的菜品),由于直接基于输入的参考食材的食材信息直接生成匹配的菜品图片,在目标终端的屏幕上直接进行菜品图片的展示,可以减少菜品信息获取时长,提高信息获取的效率,同时,生成没有过的菜品的菜品图片,可以提高信息展示的丰富度,提高用户对于创造新菜品的兴趣。这里,目标终端可以是智慧厨房生态下的智能家居设备(例如,智能冰箱),也可以是与用户相关的智能设备(例如,智能手机,智能平板等),此外,目标终端具有可以显示图片的屏幕。
在本实施例中,在用户需要查看预期制作的菜品的菜品图片时,可以首先通过语音输入唤醒词、手动触摸等唤醒操作来唤醒目标终端,在唤醒目标终端之后,该目标终端可以通过用户触发向目标服务器发送菜品生成请求,以请求使用一组参考食材生成匹配的菜品图片。对于目标服务器,目标服务器可以获取目标终端的菜品生成请求指令,对其进行解析,以确定一组参考食材的食材信息。
一组参考食材的食材信息可以是多模态形式,例如,图片、标识等,这里,一组参考食材中的每个参考食材的食材信息可以是该参考食材的食材图片,还可以是参考食材的食材标识(例如,食材名称、食材编号等)。一组参考食材的食材信息可以携带在菜品生成请求中,也可以是基于菜品生成请求中携带的一组参考食材的食材指示信息(例如,上述食材标识)确定的,例如,一组参考食材的食材信息为一组参考食材的食材图片,菜品生成请求中携带有某一参考食材的食材名称,由目标服务器从数据库中预置的食材图片中查找出与该参考食材的食材名称匹配的食材图片,得到该参考食材的食材图片。
可选地,一组参考食材的食材信息可以为一组参考食材的食材图片,且一组参考食材的食材图片携带在菜品生成请求中。对于目标终端,一组参考食材的食材信息可以通过用于进行菜品图片生成的菜品图片生成界面(可以是目标终端上运行的指定应用内的显示界面)内输入的。用户可以在菜品图片生成界面中直接从本地选取某些参考食材的食材图片,也可以调用其上的图像采集部件对参考食材进行拍摄或者扫描得到参考食材的食材图片,还可以直接输入参考食材的食材标识,由目标终端自动获取匹配的食材图片(本地获取或者从服务器侧获取)。例如,响应于在菜品图片生成界面输入的第三参考食材的食材图片,目标终端可以获取到第三参考食材的食材图片。又例如,响应于在菜品图片生成界面输入的第四参考食材的食材标识,可以获取第四参考食材的预设食材图片(终端本地保存或者从服务器获取),如果第四参考食材的预设食材图片为多张,可以在菜品图片生成界面显示第四参考食材的多张预设食材图片,并响应于接收到的对多张预设食材图片中的食材图片执行的选取操作,确定第四参考食材的食材图片为选取的食材图片。
可选地,一组参考食材的食材信息可以为一组参考食材的食材图片,且一组参考食材中的至少部分参考食材的食材图片是由目标服务器基于菜品生成请求中携带的至少部分参考食材的食材标识(例如,食材名称)按照前述方式从数据库中获取至少部分参考食材的食材图片。
可选地,一组参考食材的食材信息可以包含至少部分参考食材的食材图片以及除了至少部分参考食材的其他参考食材的食材标识,或者,一组参考食材的食材标识。对于上述场景,一组参考食材的食材信息可以携带在菜品生成请求中。
此外,菜品图片还可以是根据一组参考食材的食材信息和以下至少之一的信息生成的,用于指示烹饪一组参考食材所使用的烹饪厨具(例如,炒锅、砂锅、高压锅等)的厨具信息,用于指示一组参考食材的烹饪方式(例如,煎、炒、清蒸、红烧等)的烹饪参数。烹饪厨具的厨具信息可以是烹饪厨具的厨具图片,还可以是烹饪厨具的厨具标识。标识形式可以是文本形式(例如,铁锅)也可以是数字、符号(例如,1、*表示铁锅)等其他表示形式。可选地,烹饪厨具的厨具信息可以携带在菜品生成请求中,也可以是采用与前述获取食材信息类似的方式获取到的,本实施例中对此不做限定。
步骤S204,将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片。
在接收到菜品生成请求之后,目标服务器可以采用任一食材信息的获取方式获取到一组参考食材中的每个参考食材的食材信息,并将获取到的每个参考食材的食材信息输入到预训练好的生成模型,得到目标菜品图片,上述预训练好的生成模型为目标生成模型,目标菜品图片是与输入的参考食材的食材信息所指示的食材匹配的菜品图片,其可以只包含与前述一组参考食材的食材信息所指示的食材匹配的菜品图片。
这里,目标生成模型可以是多模态输入的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片的深度学习模型,其可以以已有菜谱数据为参考,模拟出与输入的参考食材匹配的菜品图片,这里的菜品图片是将输入的食材信息作为一种图片生成的控制条件自动生成的,而不是从已有的菜品图片中匹配出的,因此,可以表示已有菜谱数据中未出现过的菜品图片,这里,已有菜谱数据可以包括已有菜品的菜品图片,还可以包括其他的菜品参考信息,例如,食材名称,烹饪方法、使用厨具等,目标生成模型的训练和使用可以是同一设备,也可以是不同设备,本实施例中对此不做限定。
需要说明的是,目标生成模型可以包含一种或多种控制条件,其可以用于约束目标生成模型生成的菜品图片所包含的信息,这里,控制条件可以是条件机制(即,条件控制,Conditioning),从而可以自动生成满足控制条件的菜品图片。
例如,可以训练一个多模态输入的目标生成模型,将冰箱剩余的食材的照片输入该模型,让其生成最终的成品照片。如,输入食材的照片包括胡萝卜的照片和鸡蛋的照片,通过该模型生成最终可能做成菜品的照片。
步骤S206,响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片。
响应于菜品生成请求,可以控制在目标终端的屏幕上显示目标菜品图片,这里,在目标终端的屏幕上显示目标菜品图片可以是在目标服务器得到目标菜品图片之后,向目标终端发送菜品生成响应,菜品生成响应中可以携带有目标菜品图片,目标终端在接收到上述菜品生成响应之后,可以对其进行解析,从而获取目标菜品图片并在其屏幕上显示,这里,在目标终端的屏幕上显示目标菜品图片可以是在目标终端接收到菜品生成响应之后直接执行的,也可以是基于检测到的展示触发操作执行的,例如,目标终端的相应界面上可以显示有“查看菜品图片”等类似按键,以指示预期制作的菜品的菜品图片已生成,可以进行查看,通过用户点击“查看菜品图片”等触发操作,可以控制在目标终端的屏幕上显示目标菜品图片,还可以是其他的显示时机,本实施例中对此不做限定。
在将目标菜品图片在目标终端的屏幕上进行显示之前,目标终端的屏幕上可以显示“生成中”等加载标识或动画,以指示目标菜品图片正在生成,也可以显示已有的包含前述一组参考食材的菜谱、菜品图片等信息以供参考,还可以显示前述一组参考食材的信息简介,例如参考食材的作用功效、烹饪禁忌等,本实施例中对此不做限定,在将目标菜品图片在目标终端的屏幕上进行显示之后,用户可以根据这个图片来决定是否尝试烹饪,不仅能带来一定的娱乐功能,同时也具备一定的实用价值,用户看了生成的图片之后可能真的会去尝试,甚至可能开发出一个新的菜品,还可以对目标菜品图片进行调色、装饰等二次加工等操作,本实施例中对此不做限定。
需要说明的是,服务器与目标终端之间可以是基于WebSocket进行交互,WebSocket是一种在单个TCP(Transmission Control Protocol,传输控制协议)连接上进行全双工通信的协议,使得客户端和服务器之间的数据交换变得更加简单,允许服务器主动向客户端(例如,目标应用)推送数据。在WebSocket API(Application ProgrammingInterface,应用程序接口)中,客户端和服务器只需要完成一次握手,两者之间就直接可以创建持久性的连接,并进行双向数据传输。
通过上述步骤S202至步骤S206,获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品;将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片,解决了相关技术中的菜品信息的显示方法存在由于显示的菜品与输入食材的匹配度低导致菜品信息获取的耗时长的技术问题,缩短了菜品信息获取时长。
在一个示例性实施例中,在获取目标终端发送的菜品生成请求之后,上述方法还包括:
S11,从菜品生成请求中提取出一组参考食材中的第一参考食材的食材图片、以及一组参考食材中的第二参考食材的食材标识,其中,第一参考食材的食材信息为第一参考食材的食材图片,第二参考食材的食材信息为第二参考食材的食材标识。
在本实施例中,在接收到菜品生成请求之后,可以从菜品生成请求中提取出与一组参考食材相关的信息。与前述实施例中类似的,菜品生成请求中可以携带有一组参考食材中的至少部分参考食材的食材图片,例如,第一参考食材的食材图片,目标服务器可以从菜品生成请求中提取出第一参考食材的食材图片;菜品生成请求中可以携带有一组参考食材中的至少部分参考食材的食材标识,例如,第二参考食材的食材标识,目标服务器可以从菜品生成请求中提取出第二参考食材的食材标识,第一参考食材和第二参考食材的食材类型和数量可以根据需要由用户灵活设置。本实施例中对此不做限定。
在本实施例中,一组参考食材的食材信息可以包括:第一参考食材的食材图片,还可以包括第二参考食材的食材标识,或者,由第二参考食材的食材标识获取到的食材图片。这里,从菜品生成请求中提取出的也可以是其他表示烹饪参数信息的相应内容,例如,前述的烹饪厨具的厨具标识或者厨具图片,又例如,烹饪方式的指示信息。
例如,设定第一参考食材和第二参考食材的数量均为1,菜品生成请求中包含的食材西红柿的食材名称、食材鸡蛋的鸡蛋图片,在获取到目标终端发送的该菜品生成请求之后,可以从菜品生成请求中提取出食材标识(“西红柿”)和食材图片(鸡蛋图片),其中,鸡蛋属于上述第一参考食材,西红柿属于上述第二参考食材。
通过本实施例,从菜品生成请求中提取参考食材的食材图片和/或食材标识,可以食材信息配置的灵活性,提高用户的使用体验。
在一个示例性实施例中,将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,包括:
S21,将一组参考食材的食材信息、以及目标厨具的厨具信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型还用于将输入的食材信息、以及输入的厨具信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片。
在本实施例中,相同的食材使用不同的厨具所烹饪出的菜品之间存在区别,例如,西红柿炒牛肉和西红柿炖牛腩所使用的厨具分别为炒锅和砂锅或者高压锅,为了提高菜品图片生成的合理性,可以将每个参考食材的食材信息以及目标厨具的厨具信息输入到目标生成模型,得到目标菜品图片。
这里,每个参考食材的食材信息可以与前述实施例类似,在此不再赘述,目目标厨具的厨具信息可以是多模态的,例如,图片、标识等,例如目标厨具的厨具信息可以是默认的图片或者标识信息,也可以是菜品请求信息中携带的,其可以是从菜品请求信息中直接获取的图片形式,还可以是从菜品请求信息中直接获取的标识形式,或者是从菜品请求信息中获取的标识形式指示的图片(从本地保存或者服务器侧获取),此外,还可以是与输入的一组参考食材匹配的预设烹饪工具,其匹配关系可以是根据大数据生成的,也可以是基于用户使用习惯确定的,还可以是通过其他方式预设的。目标厨具可以包括但不限于电饭煲、燃气灶、蒸笼、高压锅等,本实施例中对目标厨具的类型、目标厨具的厨具信息的类型、目标厨具的确定方式均不做限定。
可选地,目标生成模型可以是预训练好的、用于将输入的食材信息、以及输入的厨具信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片的多模态输入模型。换句话说,目标生成模型的控制条件包括输入的一组参考食材中的每个参考食材的食材信息,还包括输入的目标厨具的厨具信息。
例如,菜品生成请求中包含厨具信息燃气灶的图片,食材西红柿的食材名称、食材鸡蛋的鸡蛋图片,将食材标识(“西红柿”)、食材图片(鸡蛋图片)以及厨具的厨具信息(燃气灶图片)输入目标生成模型,可以得到与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片(用燃气灶做的西红柿鸡蛋)。
通过本实施例,将输入的食材信息、以及输入的厨具信息作为控制条件输入到生成模型中,得到生成模型输出的菜品图片,可以提高菜品显示的匹配度,提高用户的使用体验。
在一个示例性实施例中,将一组参考食材的食材信息、以及目标厨具的厨具信息输入到目标生成模型,得到目标菜品图片,包括:
S31,将一组参考食材的食材信息、目标厨具的厨具信息、以及目标烹饪方式的指示信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型还用于将输入的食材信息、输入的厨具信息、以及输入的烹饪方式的指示信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片。
在本实施例中,相同的厨具可能有不止一种烹饪方式,例如,铁锅可以用来炒,也可以用来焖或者煎,为了提高菜品图片生成的合理性,得到与用户预期更贴近的菜品图片,可以将每个参考食材的食材信息、目标厨具的厨具信息、以及目标烹饪方式的指示信息输入到目标生成模型,得到与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片。
这里,目标烹饪方式的指示信息可以是前述烹饪参数,其可以携带在菜品请求信息中,也可以是基于目标厨具信息确定的,还可以根据一组参考食材确定的,目标烹饪方式的指示信息可以包括但不限于煎、炒、清蒸、红烧等多种类型。每个参考食材的食材信息以及目标厨具的厨具信息可以是与前述实施例中类似的,在此不再赘述。
可选地,目标生成模型可以是预训练好的、用于将输入的食材信息、输入的厨具信息、以及输入的烹饪方式的指示信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片的多模态输入模型。换句话说,目标生成模型的控制条件包括输入的一组参考食材中的每个参考食材的食材信息和输入的目标厨具的厨具信息,还包括目标烹饪方式的指示信息。
例如,菜品生成请求中包含烹饪方式的指示信息炒,厨具信息燃气灶的图片,食材西红柿的食材名称、食材鸡蛋的鸡蛋图片,将食材标识(“西红柿”)、食材图片(鸡蛋图片)、厨具的厨具信息(燃气灶图片)以及烹饪方式的指示信息炒输入目标生成模型,可以得到与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片(用燃气灶做的西红柿炒鸡蛋)。
通过本实施例,将输入的食材信息、输入的厨具信息以及输入的烹饪方式的指示信息作为控制条件输入到生成模型中,得到生成模型输出的菜品图片,可以提高生成的菜品图片与用户预期的匹配度,提高用户的使用体验。
在一个示例性实施例中,在获取目标终端发送的菜品生成请求之后,上述方法还包括:
S41,在从菜品生成请求中提取出目标文本指令、且从目标文本指令中解析出厨具标识的情况下,将解析出的厨具标识确定为目标厨具的厨具信息;
S42,在从菜品生成请求中提取出目标文本指令、且未从目标文本指令中解析出厨具标识,或者,从菜品生成请求中未提取出文本指令的情况下,将一组参考食材的食材类别匹配的预设厨具信息,确定为目标厨具的厨具信息。
在本实施例中,在目标终端发送的菜品生成请求中可以携带有目标文本指令,获取目标终端发送的菜品生成请求之后,可以从菜品生成请求中提取出目标文本指令,并对目标文本指令进行解析,从而确定出目标文本指令中所携带的信息类型,例如,厨具标识、食材标识、烹饪方式的指示信息等。
在一种可选的实施例中,在从菜品生成请求中提取出目标文本指令、且从目标文本指令中解析出厨具标识的情况下,可以将解析出的厨具标识确定为目标厨具的厨具信息,例如,菜品请求信息中包含的目标文本指令为“使用炒锅炒一个菜”,此时,从目标文本指令中可以解析出厨具标识“炒锅”,则将厨具标识“炒锅”确定为目标厨具的厨具信息。
在另一种可选的实施例中,在从菜品生成请求中提取出目标文本指令、但从目标文本指令中未解析出厨具标识(例如,从菜品生成请求中提取出目标文本指令为使用“西红柿做一个菜”),或者,从菜品生成请求中未提取出文本指令的情况下,可以基于输入的一组参考食材的食材类别匹配对应的预设厨具标识,将匹配到的厨具标识确定为目标厨具的厨具信息。这里,根据食材类别匹配的目标厨具,其匹配关系可以是基于用户的烹饪习惯设定的,也可以是根据大数据默认的,还可以是其他方式确定的匹配关系,本实施例中对此不做限定。
通过本实施例,从菜品生成请求中解析厨具信息或基于输入的参考食材匹配预设厨具信息,可以提高厨具选择的灵活性,提高用户的使用体验。
在一个示例性实施例中,将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,包括:
S51,将一组参考食材的食材信息中的每个参考食材的食材信息均作为一种控制条件输入到目标扩散模型,以通过目标扩散模型执行以下处理操作,其中,目标生成模型为目标扩散模型:
对作为目标扩散模型的控制条件的每个输入信息分别转换为与每个输入信息对应的输入特征,其中,目标扩散模型的控制条件包括一组参考食材的食材信息;
与每个输入信息对应的输入特征进行特征融合,得到目标融合特征,其中,目标融合特征用于表征目标扩散模型的控制条件;
将初始噪声图片的图像特征和目标融合特征作为目标扩散模型中的去噪网络的注意力层的权重矩阵输入到注意力层中,得到去噪网络输出的目标菜品特征,其中,目标菜品特征是对初始噪声图片的图像特征进行去噪处理之后得到的图像特征;
对目标菜品特征进行解码处理,得到目标菜品图片。
目标生成模型可以是目标扩散模型(Diffusion model),例如,基于条件的扩散模型,这里,扩散模型是一种图像生成的深度学习模型,即,基于编码-解码(Encoder-Decoder)架构的生成模型。在扩散模型的训练过程,分为扩散阶段(加噪过程)和逆扩散阶段(去噪过程)。在扩散阶段,通过不断对原始数据(例如,原始的菜品图片)添加噪声,使数据从原始分布变为期望的分布,例如,通过不断添加高斯噪声将原始数据分布变为正态分布;在逆扩散阶段,使用去噪神经网络将数据从正态分布恢复到原始数据分布,而扩散模型的使用过程可以是前述的逆扩散阶段。可选地,可以为扩散(diffusion)操作引入条件机制(Conditioning Mechanisms),通过跳跃注意力(cross-attention)的方式实现多模态训练,从而实现条件图片生成任务。
在本实施例中,可以将一组参考食材的食材信息中的每个参考食材的食材信息均作为一种控制条件输入到目标扩散模型,以指导反向生成(去噪)过程,这里,控制条件还可以包括目标厨具的厨具信息、烹饪方式的指示信息等,控制条件可以是多模态的,例如,文本、图像等,本实施例中对控制条件的内容和形式均不做限定。
基于多模态的控制条件,可以对作为目标扩散模型的控制条件的每个输入信息(例如,每个参考食材的食材信息、目标厨具的厨具信息、目标烹饪方式的指示信息等多模态信息)分别转换为与每个输入信息对应的输入特征,将每个输入信息对应的输入特征进行特征融合,可以得到目标融合特征,这里,目标融合特征的作用是表征目标扩散模型的控制条件,特征融合可以是基于拼接实现的,也可以是基于特定预训练好的的神经网络实现的,本实施例中对特征融合的方式不做限定。
将初始噪声图片的图像特征和目标融合特征作为目标扩散模型中的去噪网络的注意力层的权重矩阵输入到注意力层中,可以得到去噪网络输出的目标菜品特征,这里,目标菜品特征是对所述初始噪声图片的图像特征进行去噪处理之后得到的图像特征,初始噪声图片可以是各项特征独立的纯高斯噪声图片,其可以是模型训练过程中基于已有菜谱数据不断加噪得到的;对得到的目标菜品特征进行解码处理,可以得到目标菜品图片,这里,目标菜品图片可以是与控制条件匹配的、只包含输入的参考食材的菜品图片。
通过本实施例,通过使用基于条件的扩散模型进行菜品图片生成,可以提高菜品图片生成的效率和合理性,提升用户的使用体验。
在一个示例性实施例中,上述方法还包括:
S61,获取训练菜品图片以及与训练菜品图片对应的一组训练食材的食材信息;
S62,将一组训练食材中的每个训练食材的食材信息分别作为初始生成模型的一种控制条件,使用训练菜品图片对初始生成模型进行模型训练,得到目标生成模型。
目标生成模型的训练可以是以现有菜谱数据为参考的,在本实施例中,获取训练菜品图片以及与训练菜品图片对应的一组训练食材的食材信息,将一组训练食材中的每个训练食材的食材信息分别作为初始生成模型的一种控制条件,使用训练菜品图片对初始生成模型进行模型训练,可以得到目标生成模型。
这里,训练菜品图片可以是现有菜品图片,其可以是从网络侧获取的,也可以是本地保存的,与训练菜品图片对应的一组训练食材的食材信息可以是通过对训练菜品图片进行识别获取的,也可以是用户输入的,还可以是其他的获取方式,一组训练食材的食材信息可以是图片形式的,也可以是标识形式的,还可以是既有图片形式又有标识形式的多模态,初始生成模型可以是未经训练的可以用于生成菜品图片的生成模型,生成模型的训练和使用可以是同一设备,也可以是不同设备,本实施例对此不做限定,可选地,初始生成模型的控制条件还可以包括目标厨具的厨具信息、烹饪方式的指示信息等烹饪参数信息,其可以是获取的已有菜谱数据中包含的,也可以是基于获取到的食材信息反推的。
可选的,在本实施例中,可以基于获取的食材信息反推厨具信息,这里,反推出的厨具标识可以有一种或多种,在反推出的厨具标识只有一种时,可以直接以反推出的厨具标识作为初始生成模型的一种控制条件,在反推出的厨具标识有多种时,可以根据用户使用习惯优先推送使用频率高的厨具标识作为初始生成模型的一种控制条件的输入信息,也可以基于其他优先级确定的。
例如,目标生成模型训练过程可以包括以下步骤:
步骤1,收集菜谱数据,菜谱数据包含:菜品最终图片,食材名字,食材图片,制作方法;
步骤2,从制作方法反推能够使用的厨具;
步骤3,按照图3所示训练一个目标生成模型。
通过本实施例,基于参考菜品图片,使用对应食材信息和厨具标识对初始生成模型进行模型训练,得到训练好的生成模型,可以提高模型训练的可靠性,提升菜品图片生成的合理性。
下面结合可选示例对本申请实施例中的菜品信息的显示方法进行解释说明。本可选示例中提供了一种基于用户食材图片与指令的菜品生成的方案,可以根据输入的食材信息,生成匹配的菜品图片。结合图4所示,本可选示例中的菜品信息的显示方法的流程可以包括以下步骤:
步骤1,用户将菜品生成指令“使用燃气灶炒一个菜”以及西红柿和鸡蛋的食材信息输入预训练好的diffusion模型,其中,diffusion模型是以现有菜谱为参考预训练的,可以使用四种食材输入形式(西红柿的图片和鸡蛋的名称、西红柿的图片和鸡蛋的图片、西红柿的名称和鸡蛋的名称以及西红柿的名称和鸡蛋的图片)中的任意一种作为输入。
步骤2,获取diffusion模型输出菜品最终图片。
通过本可选示例,通过构造多模态输入的食材信息输入方式,并使用扩散模型生成菜品图片,可以生成没有在菜谱里出现过的菜式图片,可以在想尝试新的食材搭配时,给出可能的菜品图片,也可以在食材受限无法做出现有菜品时,能够生成一张最终菜品图片供参考,还可以在菜品研发时用来做初步的筛选,还可适用于其他的场景。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述菜品信息的显示方法的菜品信息的显示装置。图5是根据本申请实施例的一种可选的菜品信息的显示装置的结构框图,如图5所示,该装置可以包括:
第一获取单元502,用于获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品;
输入单元504,与第一获取单元502相连,用于将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;
控制单元506,与输入单元504相连,用于响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片。
需要说明的是,该实施例中的第一获取单元502可以用于执行上述步骤S202,该实施例中的输入单元504可以用于执行上述步骤S204,该实施例中的控制单元506可以用于执行上述步骤S206。
通过上述模块,获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品;将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片,解决了相关技术中的菜品信息的显示方法存在由于显示的菜品与输入食材的匹配度低导致菜品信息获取的耗时长的技术问题,缩短了菜品信息获取时长。
在一个示例性实施例中,上述装置还包括:
提取单元,用于在获取目标终端发送的菜品生成请求之后,从菜品生成请求中提取出一组参考食材中的第一参考食材的食材图片、以及一组参考食材中的第二参考食材的食材标识,其中,第一参考食材的食材信息为第一参考食材的食材图片,第二参考食材的食材信息为第二参考食材的食材标识。
在一个示例性实施例中,输入单元包括:
第一输入模块,用于将一组参考食材的食材信息、以及目标厨具的厨具信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型还用于将输入的食材信息、以及输入的厨具信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片。
在一个示例性实施例中,第一输入模块包括:
输入子模块,用于将一组参考食材的食材信息、目标厨具的厨具信息、以及目标烹饪方式的指示信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型还用于将输入的食材信息、输入的厨具信息、以及输入的烹饪方式的指示信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片。
在一个示例性实施例中,上述装置还包括:
第一确定单元,用于在获取目标终端发送的菜品生成请求之后,在从菜品生成请求中提取出目标文本指令、且从目标文本指令中解析出厨具标识的情况下,将解析出的厨具标识确定为目标厨具的厨具信息;
第二确定单元,用于在从菜品生成请求中提取出目标文本指令、且未从目标文本指令中解析出厨具标识,或者,从菜品生成请求中未提取出文本指令的情况下,将一组参考食材的食材类别匹配的预设厨具信息,确定为目标厨具的厨具信息。
在一个示例性实施例中,输入单元包括:
第二输入模块,用于将一组参考食材的食材信息中的每个参考食材的食材信息均作为一种控制条件输入到目标扩散模型,以通过目标扩散模型执行以下处理操作,其中,目标生成模型为目标扩散模型:
对作为目标扩散模型的控制条件的每个输入信息分别转换为与每个输入信息对应的输入特征,其中,目标扩散模型的控制条件包括一组参考食材的食材信息;
与每个输入信息对应的输入特征进行特征融合,得到目标融合特征,其中,目标融合特征用于表征目标扩散模型的控制条件;
将初始噪声图片的图像特征和目标融合特征作为目标扩散模型中的去噪网络的注意力层的权重矩阵输入到注意力层中,得到去噪网络输出的目标菜品特征,其中,目标菜品特征是对初始噪声图片的图像特征进行去噪处理之后得到的图像特征;
对目标菜品特征进行解码处理,得到目标菜品图片。
在一个示例性实施例中,上述装置还包括:
第二获取单元,用于获取训练菜品图片以及与训练菜品图片对应的一组训练食材的食材信息;
训练单元,用于将一组训练食材中的每个训练食材的食材信息分别作为初始生成模型的一种控制条件,使用训练菜品图片对初始生成模型进行模型训练,得到目标生成模型。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行本申请实施例中上述任一项菜品信息的显示方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品;
S2,将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;
S3,响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
根据本申请实施例的又一个方面,还提供了一种用于实施上述菜品信息的显示方法的电子装置,该电子装置可以是服务器、终端、或者其组合。
图6是根据本申请实施例的一种可选的电子装置的结构框图,如图6所示,包括处理器602、通信接口604、存储器606和通信总线608,其中,处理器602、通信接口604和存储器606通过通信总线608完成相互间的通信,其中,
存储器606,用于存储计算机程序;
处理器602,用于执行存储器606上所存放的计算机程序时,实现如下步骤:
S1,获取目标终端的菜品生成请求,其中,菜品生成请求用于请求使用一组参考食材生成匹配的菜品;
S2,将一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;
S3,响应于菜品生成请求,控制在目标终端的屏幕上显示目标菜品图片。
可选地,通信总线可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线、或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子装置与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,上述存储器606中可以但不限于包括上述菜品信息的显示装置中的第一获取单元502、输入单元504、以及控制单元506。此外,还可以包括但不限于上述菜品信息的显示装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,实施上述菜品信息的显示方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以至少两个单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种菜品信息的显示方法,其特征在于,包括:
获取目标终端的菜品生成请求,其中,所述菜品生成请求用于请求使用一组参考食材生成匹配的菜品;
将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,所述目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;响应于所述菜品生成请求,控制在所述目标终端的屏幕上显示所述目标菜品图片。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标终端发送的菜品生成请求之后,所述方法还包括:
从所述菜品生成请求中提取出所述一组参考食材中的第一参考食材的食材图片、以及所述一组参考食材中的第二参考食材的食材标识,其中,所述第一参考食材的食材信息为所述第一参考食材的食材图片,所述第二参考食材的食材信息为所述第二参考食材的食材标识。
3.根据权利要求1所述的方法,其特征在于,所述将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,包括:
将所述一组参考食材的食材信息、以及目标厨具的厨具信息输入到所述目标生成模型,得到所述目标菜品图片,其中,所述目标生成模型还用于将输入的食材信息、以及输入的厨具信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材和输入的厨具信息所指示的厨具匹配的菜品图片。
4.根据权利要求3所述的方法,其特征在于,所述将所述一组参考食材的食材信息、以及目标厨具的厨具信息输入到所述目标生成模型,得到所述目标菜品图片,包括:
将所述一组参考食材的食材信息、所述目标厨具的厨具信息、以及目标烹饪方式的指示信息输入到所述目标生成模型,得到所述目标菜品图片,其中,所述目标生成模型还用于将输入的食材信息、输入的厨具信息、以及输入的烹饪方式的指示信息分别作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材、输入的厨具信息所指示的厨具、以及输入的指示信息所指示的烹饪方式匹配的菜品图片。
5.根据权利要求3所述的方法,其特征在于,在所述获取目标终端发送的菜品生成请求之后,所述方法还包括:
在从所述菜品生成请求中提取出目标文本指令、且从所述目标文本指令中解析出厨具标识的情况下,将解析出的厨具标识确定为所述目标厨具的厨具信息;
在从所述菜品生成请求中提取出目标文本指令、且未从所述目标文本指令中解析出厨具标识,或者,从所述菜品生成请求中未提取出文本指令的情况下,将所述一组参考食材的食材类别匹配的预设厨具信息,确定为所述目标厨具的厨具信息。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,包括:
将所述一组参考食材的食材信息中的每个参考食材的食材信息均作为一种控制条件输入到目标扩散模型,以通过所述目标扩散模型执行以下处理操作,其中,所述目标生成模型为所述目标扩散模型:
对作为所述目标扩散模型的控制条件的每个输入信息分别转换为与所述每个输入信息对应的输入特征,其中,所述目标扩散模型的控制条件包括所述一组参考食材的食材信息;
与所述每个输入信息对应的输入特征进行特征融合,得到目标融合特征,其中,所述目标融合特征用于表征所述目标扩散模型的控制条件;
将初始噪声图片的图像特征和所述目标融合特征作为所述目标扩散模型中的去噪网络的注意力层的权重矩阵输入到所述注意力层中,得到所述去噪网络输出的目标菜品特征,其中,所述目标菜品特征是对所述初始噪声图片的图像特征进行去噪处理之后得到的图像特征;
对所述目标菜品特征进行解码处理,得到所述目标菜品图片。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取训练菜品图片以及与所述训练菜品图片对应的一组训练食材的食材信息;
将所述一组训练食材中的每个训练食材的食材信息分别作为初始生成模型的一种控制条件,使用所述训练菜品图片对所述初始生成模型进行模型训练,得到所述目标生成模型。
8.一种菜品信息的显示装置,其特征在于,包括:
第一获取单元,用于获取目标终端的菜品生成请求,其中,所述菜品生成请求用于请求使用一组参考食材生成匹配的菜品;
输入单元,用于将所述一组参考食材的食材信息输入到目标生成模型,得到目标菜品图片,其中,所述目标生成模型为预训练好的、用于将输入的食材信息作为一种图片生成的控制条件,自动生成与输入的食材信息所指示的食材匹配的菜品图片;
控制单元,用于响应于所述菜品生成请求,控制在所述目标终端的屏幕上显示所述目标菜品图片。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310345233.4A CN116484083A (zh) | 2023-03-31 | 2023-03-31 | 菜品信息的显示方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310345233.4A CN116484083A (zh) | 2023-03-31 | 2023-03-31 | 菜品信息的显示方法和装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116484083A true CN116484083A (zh) | 2023-07-25 |
Family
ID=87222359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310345233.4A Pending CN116484083A (zh) | 2023-03-31 | 2023-03-31 | 菜品信息的显示方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484083A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726908A (zh) * | 2024-02-07 | 2024-03-19 | 青岛海尔科技有限公司 | 图片生成模型的训练方法及装置、存储介质、电子装置 |
-
2023
- 2023-03-31 CN CN202310345233.4A patent/CN116484083A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726908A (zh) * | 2024-02-07 | 2024-03-19 | 青岛海尔科技有限公司 | 图片生成模型的训练方法及装置、存储介质、电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104473556B (zh) | 烹饪设备的控制方法及装置以及烹饪设备 | |
EP3211836B1 (en) | Cooking state alerting method and apparatus, computer program and recording medium | |
US10303136B2 (en) | Control method, recording medium, and information providing method for terminal device and information providing system | |
CN108334606B (zh) | 用于智能家居的语音交互方法、装置及服务器 | |
CN110706131A (zh) | 一种创作电子菜谱的方法、装置、电子设备及存储介质 | |
CN109300346A (zh) | 智能厨房系统及教学方法 | |
CN111103816A (zh) | 生成菜谱的方法、装置、电子设备及存储介质 | |
CN116484083A (zh) | 菜品信息的显示方法和装置、存储介质及电子装置 | |
CN110853733A (zh) | 一种创作电子菜谱的方法、装置、电子设备及存储介质 | |
CN112017754A (zh) | 菜谱推荐方法、装置、吸油烟机及存储介质 | |
CN114821236A (zh) | 智慧家庭环境感知方法、系统、存储介质及电子装置 | |
CN110858279A (zh) | 食材识别方法及装置 | |
CN113238508A (zh) | 一种烹饪提醒方法及装置 | |
CN115167164A (zh) | 设备场景的确定方法和装置、存储介质及电子装置 | |
CN112579873A (zh) | 烹饪食谱推荐方法、装置、存储介质及电子设备 | |
US20210212504A1 (en) | Recipe suggestion apparatus, recipe suggestion method, and non-transitory computer readable medium for recipe suggestion | |
AU2019302632B2 (en) | Method for operating a cooking appliance | |
CN109086367A (zh) | 一种智能烹饪器具的功能选项推荐方法及设备 | |
CN109545329A (zh) | 一种基于智能家居的食材推送方法及装置 | |
CN110716472B (zh) | 一种创作电子菜谱的方法、装置、电子设备及存储介质 | |
CN111444435A (zh) | 菜品搜索方法、装置、智能烹饪设备和存储介质 | |
CN116540556A (zh) | 基于用户习惯的设备控制方法及装置 | |
CN113325722B (zh) | 智能化烹饪的多模式实现方法及装置、智能橱柜 | |
CN115631832A (zh) | 烹饪计划的确定方法及装置、存储介质及电子装置 | |
CN111159831A (zh) | 食材新鲜度的预测方法及装置、家电设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |