CN111858694A - 菜品信息的识别方法及其装置 - Google Patents
菜品信息的识别方法及其装置 Download PDFInfo
- Publication number
- CN111858694A CN111858694A CN201910356078.XA CN201910356078A CN111858694A CN 111858694 A CN111858694 A CN 111858694A CN 201910356078 A CN201910356078 A CN 201910356078A CN 111858694 A CN111858694 A CN 111858694A
- Authority
- CN
- China
- Prior art keywords
- dish
- information
- dish information
- preset
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了菜品信息的识别方法及其装置,涉及信息处理技术领域。其中方法包括:对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。通过本申请的技术方案,能够有效提高菜品类别识别的准确度,以及进一步将与待识别菜品信息相近似的菜品信息推荐给用户,提升用户体验。
Description
技术领域
本申请涉及信息处理技术领域,尤其是涉及到菜品信息的识别方法及其装置。
背景技术
随着互联网技术的不断发展,人们针对本地生活服务的需求也越来越高。例如,在现有的菜品知识库建设中,通常需要利用语义聚合算法,对获取到的千万级菜品信息进行相似度计算。
现有针对菜品信息相似度计算存在的不足有:现有菜品信息获取困难,具体为,菜品知识库中菜品信息所包括的菜品维度信息的覆盖率较低,在全量菜品信息集合中,至少一个菜品维度信息被覆盖的菜品信息占比仅1%左右,即所获取的菜品信息不完整。若从用户评论中挖掘菜品维度信息,则需要对近百万的菜品信息进行菜品维度信息标注,人工成本较高,而仅对菜品信息中的菜品名称信息(即,超短文本,一般2-8个字符)进行相似度计算,难度较大且准确度较低,且对于后续基于菜品信息聚合的进一步应用影响较大。例如,无法准确地确定待识别菜品信息的菜品类别,从而无法将与待识别菜品信息相匹配的菜品信息推荐给用户,影响用户体验。
发明内容
有鉴于此,本申请提供了菜品信息的识别方法及其装置,主要目的在于解决目前现有技术中菜品信息相似度计算的准确度较低,无法准确地确定待识别菜品信息的菜品类别,从而无法将与待识别菜品信息相匹配的菜品信息推荐给用户,用户体验较差的技术问题。
根据本申请的一个方面,提供了菜品信息的识别方法,该方法包括:
对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
优选地,所述对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息,具体包括:
对预设的菜品信息进行预处理,得到规范化的菜品信息;
利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
优选地,所述根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度,具体包括:
根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量;
根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
优选地,所述根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到预设的菜品信息之间的相似度,具体还包括:
根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值;
根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值;
根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
优选地,所述对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,具体包括:
若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别;
根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
优选地,所述根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别,具体包括:
获取待识别菜品信息的多个菜品属性信息;
将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
优选地,根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别之后,具体还包括:
获取待识别菜品信息的菜品属性信息的详情信息;
根据所述菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
根据本申请的又一方面,提供了一种菜品信息的识别装置,该装置包括:
分词模块,用于对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
计算模块,用于根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
聚合模块,用于对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
识别模块,用于根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
所述分词模块,具体包括:
预处理单元,用于对预设的菜品信息进行预处理,得到规范化的菜品信息;
输出单元,用于利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
优选地,所述计算模块,具体包括:
向量单元,用于根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量;
相似度单元,用于根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
优选地,所述相似度单元,具体还包括:
根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值;以及,
根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值;以及,
根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
优选地,所述聚合模块,具体包括:
判断单元,用于若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别;
分类单元,用于根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
优选地,所述识别模块,具体包括:
获取单元,用于获取待识别菜品信息的多个菜品属性信息;
确定单元,用于将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
优选地,具体还包括:
详情模块,用于获取待识别菜品信息的菜品属性信息的详情信息;
更新模块,用于根据所述菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
依据本申请再一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述菜品信息的识别方法。
依据本申请再一个方面,提供了一种设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述菜品信息的识别方法。
借由上述技术方案,本申请提供的菜品信息的识别方法及其装置,与目前现有技术相比,本申请对菜品知识库中预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息,根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度,并对计算出的预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,以便在接收到用户输入的待识别菜品信息时,能够根据在前确定的多个菜品类别,对来自用户的待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别,有效提高菜品类别识别的准确度,以及进一步将与待识别菜品信息相近似的菜品信息推荐给用户,提升用户体验。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种菜品信息的识别方法的流程示意图;
图2示出了本申请实施例提供的另一种菜品信息的识别方法的流程示意图;
图3示出了本申请实施例提供的一种菜品信息的识别装置的结构示意图;
图4示出了本申请实施例提供的另一种菜品信息的识别装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
针对目前现有技术中存在的问题,本实施例提供了一种菜品信息的识别方法,可应用于客户端侧,可使得用户能够根据待识别菜品信息获得与待识别菜品信息相近似的菜品推荐服务,进而满足用户的体验需求,如图1所示,该方法包括:
步骤101、对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息。
在具体的应用场景中,预设的菜品信息是根据菜品知识库中的千万级初始化菜品信息进行初步筛选获取到的,具体为,剔除重复的初始化菜品信息,根据实际应用场景的需要,此处不对初步筛选的操作进行具体限定。
在本实施例中,菜品信息为菜品名称,根据实际应用场景的需要,菜品属性信息是根据菜品名称确定的,例如,可以包括:菜品食材、菜品做法、菜品口味、菜品图片中的一个或者多个,基于菜品食材维度,菜品属性信息还可以包括食材名称、食材形态、食材部位、食材配料等,基于应用维度,菜品属性信息还可以包括菜品规格、菜品容量、菜品评价等,可以基于某一维度信息,或多个维度信息确定菜品属性信息,此处不对菜品属性信息的确定进行具体限定。
步骤102、根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度。
根据实际应用场景的需要,可以根据得到的多个菜品属性信息,计算出的预设的菜品信息的菜品向量之间的相似度结果,和/或根据不同菜品属性信息的相似度计算得到的多个相似度结果确定预设的菜品信息之间的相似度,此处不对相似度算法,以及根据多个相似度结果确定预设的菜品信息之间的相似度进行具体限定。
步骤103、对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别。
根据实际应用场景的需要,预设的菜品信息之间的相似度计算,以及对预设的菜品信息之间的相似度的聚合可以通过离线计算来实现,以便根据得到的聚合结果确定预设的菜品信息的同簇结果,从而进一步根据同簇结果中包含的菜品属性信息实现多个预设的菜品信息的菜品属性信息的共享,此处不对网络连接状态进行具体限定。
进一步地,若预设的菜品信息包括多个菜品属性信息,对预设的菜品信息进行某一菜品属性信息的相似度计算,则针对该菜品属性信息对预设的菜品信息之间的相似度进行聚合,以便根据得到的针对该菜品属性信息的聚合结果确定针对该菜品属性信息的预设的菜品信息的同簇结果,从而实现针对该菜品属性信息的详情信息的共享。
例如,针对菜品信息(例如,菜品名称)进行相似度计算,将“猪肉炖粉条”和“东北杀猪菜”聚合到“同一菜品”的同簇结果中,从而将“猪肉炖粉条”的图片、做法、口味等菜品属性信息的详情信息传递给不包含图片、做法、口味等菜品属性信息的详情信息的“东北杀猪菜”。
步骤104、根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
根据实际应用场景的需要,此处的分类识别过程可由服务器侧来完成,即客户端将获取到的待识别菜品信息发送给服务器侧,由服务器根据接收到的待识别菜品信息,以及所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别,再由服务器根据待识别菜品信息的菜品类别,得到与该待识别菜品信息互为同簇的菜品信息及其相关信息并发送给客户端侧,以便将互为同簇的菜品信息显示在客户端侧,此处不对分类识别的执行侧进行具体限定。
本实施例提供的一种菜品信息的识别方法,与目前现有技术相比,本实施例能够对菜品知识库中预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息,根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度,并对计算出的预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,以便在接收到用户输入的待识别菜品信息时,能够根据在前确定的多个菜品类别,对来自用户的待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别,有效提高菜品类别识别的准确度,以及进一步将与待识别菜品信息相近似的菜品信息推荐给用户,提升用户体验。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的过程,提供了另一种菜品信息的识别方法,如图2所示,该方法包括:
步骤201、对预设的菜品信息进行预处理,得到规范化的菜品信息。
具体实施中,基于千万级初始化菜品信息构建菜品知识库,利用Bi-LSTM+CRF模型对所构建的菜品知识库中的菜品信息进行菜品名称的提取,得到规范化的菜品名称。例如,对菜品知识库中的“110无敌三杯鸡”进行预处理,得到规范化的菜品名称“三杯鸡”。
步骤202、利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
具体实施中,根据构建的菜品知识库中的菜品信息设定菜品标签,并进一步地构建基于所设定的菜品标签的分词模型word2vec,以便根据所构建的分词模型word2vec对规范化的菜品信息进行分词处理,得到规范化的菜品信息的多个词向量term,以及与多个词向量分别对应的菜品标签tag。
例如,对规范化的菜品信息“麻辣卤鸭掌”进行分词处理,得到多个词向量term为“麻辣”、“卤”、“鸭掌”,分别对应的菜品标签tag(即,词向量的语义类型)为口味、做法、食材名称。以及,对规范化的菜品信息“鱼香肉丝”进行分词处理,得到多个词向量term为“鱼香”、“肉”、“丝”,分别对应的菜品标签tag(即,词向量的语义类型)为做法、食材名称、食材形态。
此外,通过对得到的词向量进行聚合,挖掘相应的同义词和冲突词,以实现对所构建的分词模型的进一步优化。具体为,对得到的词向量进行聚合,根据预设的相似阈值得到多组近义词词向量(即,待确定同义词词向量),在近义词词向量中,识别出物理含义不同的冲突词词向量,并对识别出的冲突词词向量进行向量修正,得到修正后的冲突词词向量,从而构建相应的同义词词库和冲突词词库,以便优化分词模型输出的词向量,以及进一步提升后续规范化的菜品信息之间相似度计算的准确度。例如,鸭爪和鸡爪的词向量相似度在预设的相似阈值内,对鸭爪进行同义词挖掘,得到鸭手、鸭掌、鸡爪,并在冲突词鸡爪的词向量的每个维度上加常量n,n为鸭爪对应的冲突词词库序号。
步骤203、根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量。
根据实际应用场景的需要,可以为不同的菜品标签tag设置不同的权重值。例如,通过对少量菜品属性信息中的菜品标签tag进行权重值标记,并利用线性回归模型对相应的菜品信息进行相似性学习,从而确定不同菜品标签tag的权重值。或者,基于不同的业务需求,例如,针对菜品信息的菜品属性信息“做法”,计算规范化的菜品信息之间的相似度,则可以相应提高菜品标签tag为做法的权重值,此处不对菜品标签tag的权重值的确定方法进行具体限定。
具体实施中,根据规范化的菜品信息中的词向量term,以及对应的菜品标签tag的权重值,通过加权求和的方式计算出每个规范化的菜品信息的菜品向量,具体为,通过计算词向量term与对应的菜品标签tag的权重值乘积的累加和,得到每个规范化的菜品信息的菜品向量。
步骤204、根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
具体实施中,根据计算出的多个规范化的菜品信息的菜品向量,进一步计算菜品向量之间的欧式距离,从而确定菜品向量对应的不同的规范化的菜品信息之间的相似度,以便根据所确定的相似度判断不同的规范化的菜品信息是否属于同一菜品类别,以实现对规范化的菜品信息的聚合,以及将属于同一菜品类别的菜品属性信息的详情信息进行共享,从而进一步地优化对待识别菜品信息的菜品类别识别。
进一步地,为了说明步骤204具体的实施过程,作为一种可选方式,该过程具体可包括:
步骤2041、根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值。
步骤2042、根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值。
具体实施中,根据计算出的多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的欧式距离,并进一步获取在预设的欧氏距离范围内的上述欧式距离(即,第一相似度值)对应的两两菜品向量,从而确定与该两两菜品向量对应的规范化的菜品信息。
其中,在预设的欧氏距离范围内的欧式距离可以为多个,此处以一个为例,进一步地,根据所确定的两个规范化的菜品信息,获取两个规范化的菜品信息的多个菜品属性信息,根据实际应用场景的需要,针对一个或多个菜品属性信息,对两个规范化的菜品信息进行相似度计算,得到两个规范化的菜品信息之间的第二相似度值。
例如,两个规范化的菜品信息分别为菜品信息A和菜品信息B,将菜品信息A中的词向量term_A(i)分别与菜品信息B中的多个词向量term进行基于欧氏距离算法的相似度计算,并将计算得到的最小欧氏距离作为菜品信息A中的词向量term_A(i)的词向量相似距离distance(term_A(i),B)。进一步地,通过计算菜品信息A中的多个词向量的词向量相似距离distance(term_A(i),B)与词向量term_A(i)对应的菜品标签tag的权重值乘积的累加和,得到菜品信息A与菜品信息B之间的第二相似度值。
步骤2043、根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
具体实施中,根据计算得到的第一相似度值和第二相似度值,通过求和平均计算出规范化的菜品信息之间的相似度,以便根据预设的相似范围确定上述的两个规范化的菜品信息是否属于同一菜品类别。
步骤205、若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别。
根据实际应用场景的需要,预设的相似范围包括第一相似范围、第二相似范围、第三相似范围,针对某一规范化的菜品信息的一个或多个菜品属性信息,计算出其与菜品知识库中的其它规范化的菜品信息的相似度,并进行降序排列,得到相似度的降序排列结果,通过预设基于降序排列结果的百分比,确定语义近似值R。例如,若预设基于降序排列结果的百分比为80%,则在百分比为80%处的相似度为0.85,即语义近似值R为0.85。
相应地,预设第一相似范围为[0,R],预设语义近似值R的相似系数为a,进一步确定预设的第二相似范围为[R,a*R],以及预设的第三相似范围为[a*R,+∞),a>1,其中,R与a可以根据业务的实际需求进行调节,此处不对R与a的确定方法进行具体限定。
具体实施中,规范化的菜品信息之间的相似度与所确定的预设的相似范围进行比对的具体过程为:1)随机设定N个规范化的菜品信息为簇中心;2)基于一个或者多个菜品属性信息,将N+1个规范化的菜品信息与随机设定的N个簇中心进行相似度计算,得到一个或者多个基于菜品属性信息的规范化的菜品信息之间的相似度;3)对得到的一个或者多个基于菜品属性信息的规范化的菜品信息之间的相似度进行投票(例如,取平均值),确定规范化的菜品信息之间的相似度,并与所确定的预设的相似范围进行比对,从而确定规范化的菜品信息之间是否属于同一菜品类别。
进一步地,将计算得到的规范化的菜品信息之间的相似度与所确定的预设的相似范围进行比对,若规范化的菜品信息之间的相似度小于R,则规范化的菜品信息之间为同簇(即,同一菜品类别);若规范化的菜品信息之间的相似度在[R,a*R]内,则规范化的菜品信息之间为近似簇;若规范化的菜品信息之间的相似度大于a*R,则规范化的菜品信息之间为不相关簇。例如,规范化的菜品信息“黄焖鸡中加豆皮”与“豆皮黄焖鸡”,以及“猪肉炖粉条”与“粉条炖猪肉”的相似度(即,欧氏距离)在预设的第一相似范围内,“黄焖鸡中加豆皮”与“豆皮黄焖鸡”,以及“猪肉炖粉条”与“粉条炖猪肉”分别属于同一菜品类别,“黄焖鸡中加豆皮”与“豆皮黄焖鸡”,和“猪肉炖粉条”与“粉条炖猪肉”属于不同的菜品类别。
步骤206、根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
需要说明的是,根据所确定的属于同一菜品类别的规范化的菜品信息,确定属于不同的菜品类别的规范化的菜品信息,从而确定规范化的菜品信息的多个菜品类别,进一步地,为了保证菜品类别的准确度,对互为近似簇的规范化的菜品信息进行识别,互为近似簇的两个规范化的菜品信息包括新的菜品信息、某一菜品属性信息相同的菜品信息、非法菜品信息,对新的菜品信息、某一菜品属性信息相同的菜品信息进行标记并对菜品知识库进行更新,对非法菜品信息进行标记,并构建非法菜品知识库。
其中,某一菜品属性信息相同的菜品信息可用于相同菜品属性信息之间的共享,例如,“炸鸡排”和“番茄味鸡排”为菜品属性信息“食材名称”相同的相似菜品,可用于与菜品属性信息“食材名称”相对应的菜品图片信息的共享,即,将“炸鸡排”的菜品图片信息传递给没有菜品图片信息的“番茄味鸡排”,以便提升后续待识别菜品信息分类识别的准确度。
此外,与簇中心为不相关簇的规范化的菜品信息属于非法菜品信息,例如,雨伞、符号等,对非法菜品信息进行标记后对相应的非法菜品知识库进行更新,以便在确定待识别菜品信息为非法菜品信息后,通过在所构建的非法菜品知识库中进行比对,直接确定其为非法菜品信息,而不需要人工确认。
步骤207、获取待识别菜品信息的多个菜品属性信息。
步骤208、将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
具体实施中,对实时获取到的待识别菜品信息进行分词处理,根据实际应用场景的需要,获取待识别菜品信息的多个菜品属性信息,将获取到的多个菜品属性信息分别与所确定的多个菜品类别(即,每个簇中心所对应的规范化的菜品信息的菜品属性信息)进行相似度计算,确定待识别菜品信息的菜品类别为同簇(即,某一簇中心对应的菜品类别,也称为已有菜品),或者为相似簇(即,新的菜品、或者某一菜品属性信息相同的菜品信息、非法菜品),或者非法簇(即,非法菜品)。
步骤209、获取待识别菜品信息的菜品属性信息的详情信息。
步骤210、根据所述新的菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
具体实施中,获取菜品类别为相似簇(例如,与某一簇中心的菜品信息的某一菜品属性信息相同)的待识别菜品信息的菜品属性信息的详情信息,例如,待识别菜品信息为“鱼香肉丝”,“鱼香肉丝”与菜品知识库中的“鱼香茄子”互为相似簇,其菜品属性信息“做法”相同,获取“鱼香肉丝”的菜品属性信息“做法”的详情信息传递给“鱼香茄子”,以实现对与待识别菜品信息的菜品类别对应的菜品属性信息的详情信息的更新,根据实际应用场景的需要,也可以将“鱼香茄子”的菜品属性信息“做法”的详情信息传递给没有菜品属性信息“做法”的详情信息的“鱼香肉丝”,以实现对菜品属性信息的详情信息的补充。
通过应用本实施例提供的方法,即通过对菜品知识库中预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息,根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度,并对计算出的预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,以便在接收到用户输入的待识别菜品信息时,能够根据在前确定的多个菜品类别,对来自用户的待识别菜品信息(例如,菜品名称)进行分类识别,确定待识别菜品信息的菜品类别,有效提高菜品类别识别的准确度,以及进一步将与待识别菜品信息相近似的菜品信息推荐给用户,提升用户体验。
进一步地,作为图1和图2所示方法的具体实现,本申请实施例提供了一种菜品信息的识别装置,如图3所示,该装置包括:分词模块31、计算模块32、聚合模块33、识别模块34。
分词模块31,用于对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
计算模块32,用于根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
聚合模块33,用于对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
识别模块34,用于根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
在具体的应用场景中,如图4所示,本装置还可包括:详情模块35、更新模块36。
具体实施中,分词模块31具体包括:预处理单元311、输出单元312。
预处理单元311,用于对预设的菜品信息进行预处理,得到规范化的菜品信息;
输出单元312,用于利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
具体实施中,计算模块32具体包括:向量单元321、相似度单元322。
向量单元321,用于根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量;
相似度单元322,用于根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
具体实施中,相似度单元322,具体还包括:
根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值;以及,
根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值;以及,
根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
具体实施中,聚合模块33具体包括:判断单元331、分类单元332。
判断单元331,用于若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别;
分类单元332,用于根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
具体实施中,识别模块34具体包括:获取单元341、确定单元342。
获取单元341,用于获取待识别菜品信息的多个菜品属性信息;
确定单元342,用于将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
具体实施中,详情模块35,用于获取待识别菜品信息的菜品属性信息的详情信息。
具体实施中,更新模块36,用于根据所述新的菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
需要说明的是,本实施例提供的一种菜品信息的识别装置所涉及各功能模块、功能单元的其它相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
通过应用上述菜品信息的识别装置,能够通过对预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,从而根据在前确定的多个菜品类别,对来自用户的待识别菜品信息(例如,菜品名称)进行分类识别,确定待识别菜品信息的菜品类别,有效提高菜品类别识别的准确度,以及进一步将与待识别菜品信息相近似的菜品信息推荐给用户,提升用户体验。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的菜品信息的识别方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的菜品信息的识别方法。
基于上述如图1和图2所示的方法,以及图3和图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种终端设备,具体可以为个人计算机、平板电脑、智能手机、智能手表、POS设备或其他网络设备等,该终端设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的菜品信息的识别方法。
可选的,上述实体设备都还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种终端设备的实体设备结构并不构成对上述实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述两个实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前现有技术相比,本实施例可有效提升菜品信息的识别准确度,以及进一步将与待识别菜品信息相近似的菜品信息推荐给用户,提升用户体验。
本申请实施例提供了以下技术方案:
A1、一种菜品信息的识别方法,包括:
对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
A2、根据权利要求A1所述的方法,所述对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息,具体包括:
对预设的菜品信息进行预处理,得到规范化的菜品信息;
利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
A3、根据权利要求A2所述的方法,所述根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度,具体包括:
根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量;
根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
A4、根据权利要求A3所述的方法,所述根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到预设的菜品信息之间的相似度,具体还包括:
根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值;
根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值;
根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
A5、根据权利要求A3或A4所述的方法,所述对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,具体包括:
若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别;
根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
A6、根据权利要求A1所述的方法,所述根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别,具体包括:
获取待识别菜品信息的多个菜品属性信息;
将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
A7、根据权利要求A1所述的方法,根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别之后,具体还包括:
获取待识别菜品信息的菜品属性信息的详情信息;
根据所述菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
B8、一种菜品信息的识别装置,包括:
分词模块,用于对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
计算模块,用于根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
聚合模块,用于对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
识别模块,用于根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
B9、根据权利要求B8所述的装置,所述分词模块,具体包括:
预处理单元,用于对预设的菜品信息进行预处理,得到规范化的菜品信息;
输出单元,用于利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
B10、根据权利要求B9所述的装置,所述计算模块,具体包括:
向量单元,用于根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量;
相似度单元,用于根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
B11、根据权利要求B10所述的装置,所述相似度单元,具体还包括:
根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值;以及,
根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值;以及,
根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
B12、根据权利要求B10或B11所述的装置,所述聚合模块,具体包括:
判断单元,用于若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别;
分类单元,用于根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
B13、根据权利要求B8所述的装置,所述识别模块,具体包括:
获取单元,用于获取待识别菜品信息的多个菜品属性信息;
确定单元,用于将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
B14、根据权利要求B8所述的装置,具体还包括:
详情模块,用于获取待识别菜品信息的菜品属性信息的详情信息;
更新模块,用于根据所述菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
C15、一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求A1至A7中任一项所述的菜品信息的识别方法。
D16、一种设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求A1至A7中任一项所述的菜品信息的识别方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种菜品信息的识别方法,其特征在于,包括:
对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
2.根据权利要求1所述的方法,其特征在于,所述对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息,具体包括:
对预设的菜品信息进行预处理,得到规范化的菜品信息;
利用预设的分词模型对规范化的菜品信息进行分词处理,得到所述规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签。
3.根据权利要求2所述的方法,其特征在于,所述根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度,具体包括:
根据每个规范化的菜品信息的多个词向量,以及与所述多个词向量分别对应的菜品标签,计算出每个规范化的菜品信息的菜品向量;
根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到规范化的菜品信息之间的相似度。
4.根据权利要求3所述的方法,其特征在于,所述根据计算出的多个规范化的菜品信息的菜品向量进行相似度计算,得到预设的菜品信息之间的相似度,具体还包括:
根据所述多个规范化的菜品信息的菜品向量,计算出两两菜品向量之间的第一相似度值;
根据所述两两菜品向量对应的两个规范化的菜品信息的多个菜品属性信息,计算出所述两个规范化的菜品信息之间的第二相似度值;
根据计算出的第一相似度值和第二相似度值,确定规范化的菜品信息之间的相似度。
5.根据权利要求3或4所述的方法,其特征在于,所述对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别,具体包括:
若所述规范化的菜品信息之间的相似度在预设的第一相似范围内,则所述规范化的菜品信息属于同一菜品类别;
根据属于不同的菜品类别的规范化的菜品信息,确定所述规范化的菜品信息的多个菜品类别。
6.根据权利要求1所述的方法,其特征在于,所述根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别,具体包括:
获取待识别菜品信息的多个菜品属性信息;
将待识别菜品信息的多个菜品属性信息,分别与所确定的多个菜品类别对应的多个菜品属性信息进行相似度计算,确定待识别菜品信息的菜品类别。
7.根据权利要求1所述的方法,其特征在于,根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别之后,具体还包括:
获取待识别菜品信息的菜品属性信息的详情信息;
根据所述菜品属性信息的详情信息,对与所述待识别菜品信息的菜品类别对应的菜品属性信息的详情信息进行更新。
8.一种菜品信息的识别装置,其特征在于,包括:
分词模块,用于对预设的菜品信息进行分词处理,得到预设的菜品信息的多个菜品属性信息;
计算模块,用于根据得到的多个菜品属性信息,计算出预设的菜品信息之间的相似度;
聚合模块,用于对所述预设的菜品信息之间的相似度进行聚合,确定预设的菜品信息的多个菜品类别;
识别模块,用于根据所确定的多个菜品类别,对待识别菜品信息进行分类识别,确定待识别菜品信息的菜品类别。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的菜品信息的识别方法。
10.一种设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的菜品信息的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910356078.XA CN111858694A (zh) | 2019-04-29 | 2019-04-29 | 菜品信息的识别方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910356078.XA CN111858694A (zh) | 2019-04-29 | 2019-04-29 | 菜品信息的识别方法及其装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111858694A true CN111858694A (zh) | 2020-10-30 |
Family
ID=72965063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910356078.XA Pending CN111858694A (zh) | 2019-04-29 | 2019-04-29 | 菜品信息的识别方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111858694A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022137731A1 (ja) * | 2020-12-25 | 2022-06-30 | Necプラットフォームズ株式会社 | 情報処理装置、システム、方法及びプログラムを格納した非一時的なコンピュータ可読媒体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280124A (zh) * | 2017-12-11 | 2018-07-13 | 北京三快在线科技有限公司 | 产品分类方法及装置,排行榜生成方法及装置,电子设备 |
CN108596789A (zh) * | 2018-03-29 | 2018-09-28 | 客如云科技(成都)有限责任公司 | 一种菜品标准化的方法 |
-
2019
- 2019-04-29 CN CN201910356078.XA patent/CN111858694A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280124A (zh) * | 2017-12-11 | 2018-07-13 | 北京三快在线科技有限公司 | 产品分类方法及装置,排行榜生成方法及装置,电子设备 |
CN108596789A (zh) * | 2018-03-29 | 2018-09-28 | 客如云科技(成都)有限责任公司 | 一种菜品标准化的方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022137731A1 (ja) * | 2020-12-25 | 2022-06-30 | Necプラットフォームズ株式会社 | 情報処理装置、システム、方法及びプログラムを格納した非一時的なコンピュータ可読媒体 |
JP2022102430A (ja) * | 2020-12-25 | 2022-07-07 | Necプラットフォームズ株式会社 | 情報処理装置、システム、方法及びプログラム |
JP7103683B2 (ja) | 2020-12-25 | 2022-07-20 | Necプラットフォームズ株式会社 | 情報処理装置、システム、方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11941912B2 (en) | Image scoring and identification based on facial feature descriptors | |
CN109409994A (zh) | 模拟用户穿戴服装饰品的方法、装置和系统 | |
CN111737473B (zh) | 文本分类方法、装置及设备 | |
CN110851571B (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN112417284A (zh) | 推送展示信息的方法和装置 | |
CN113313539B (zh) | 一种基于大数据的数字化营销服务管理平台 | |
CN107851183A (zh) | 用于提供食谱的系统和方法 | |
CN114820123A (zh) | 团购商品推荐方法、装置、设备及存储介质 | |
CN114691990A (zh) | 查询选项的推荐方法、装置、服务器、存储介质及产品 | |
CN111858694A (zh) | 菜品信息的识别方法及其装置 | |
CN112691380B (zh) | 游戏资源素材审核方法及装置、存储介质、计算机设备 | |
CN110020123B (zh) | 一种推广信息投放方法、装置、介质及设备 | |
CN110020891B (zh) | 用户评价信息的处理方法及装置 | |
CN113934776B (zh) | 食材推送方法、装置、介质及设备 | |
CN111354013A (zh) | 目标检测方法及装置、设备和存储介质 | |
CN110766512A (zh) | 订单处理方法、装置、电子设备及存储介质 | |
CN115713384A (zh) | 推荐物品的方法、装置、存储介质及电子设备 | |
CN111104952A (zh) | 识别食物种类的方法、系统及装置、冰箱 | |
CN111415328B (zh) | 物品分析数据确定方法、装置、电子设备 | |
CN111193598B (zh) | 一种群聊会话推荐方法及装置 | |
CN110955830B (zh) | 信息处理方法、装置、电子设备及计算机可读存储介质 | |
CN109376298B (zh) | 数据处理方法、装置、终端设备及计算机存储介质 | |
CN113112335A (zh) | 店铺的商品信息处理方法、装置及计算机设备 | |
Lan et al. | Deep learning-based recognition of Chinese dishes in a waiterless restaurant | |
CN110738482A (zh) | 一种基于混合现实的区块链支付方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |