CN110110577A

CN110110577A - 识别菜名的方法及装置、存储介质、电子装置

Info

Publication number: CN110110577A
Application number: CN201910059330.0A
Authority: CN
Inventors: 吴洋; 刘泉; 杨宇; 陈晨; 魏世康; 田正中; 兰杰; 朱兴
Original assignee: Koubei Shanghai Information Technology Co Ltd
Current assignee: Koubei Shanghai Information Technology Co Ltd
Priority date: 2019-01-22
Filing date: 2019-01-22
Publication date: 2019-08-09
Anticipated expiration: 2039-01-22
Also published as: CN110110577B

Abstract

本发明提供了一种识别菜名的方法及装置、存储介质、电子装置，其中，该方法包括：接收光学字符识别OCR模块响应目标图片输出的文本信息；根据预定规则识别所述文本信息是否为菜名；在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；使用二分类模型基于所述特征信息识别所述文本信息中的菜名。通过本发明，解决了相关技术中拍照录菜的准确率低的技术问题。

Description

识别菜名的方法及装置、存储介质、电子装置

技术领域

本发明涉及计算机领域，具体而言，涉及一种识别菜名的方法及装置、存储介质、电子装置。

背景技术

相关技术中，互联网+时代，人们的生活变得越来越便捷和高效，预定、购票、出行、找房、订餐等可以通过手机轻松完成，互联网本地生活领域的发展，扩大了传统行业的服务半径，提高了传统行业的效能，节约了成本。吃喝住行，餐饮作为其中的重要环节，正在享受着互联网带来的福利，在传统餐饮店搬上手机app时，数据的数字化，标准化，是一个必经的过程，一个典型的场景就是录菜，即把商家的菜单录入app应用中。

相关技术中的录菜方式包括但不局限于手动录菜或者是拍照录菜，手动录菜即手动打字录菜，这种方式录菜效率低，而且对于一些年龄大一点的人来说，打字难度更大。在另一方面，拍照录菜是先识别出菜单图片上的文字，然后，菜名和价格等实体识别，排版分析等处理，最终得到菜名、价格以及他们的映射关系。现实中的文字菜单，往往包含菜名，价格，规格(大份、小份等)，描述、优惠、分组和一些与菜无关的文字信息，这给菜名提取带来了很大的干扰，进而影响着菜单的版式分析，菜名价格的匹配等。另外，菜单上的菜名，OCR识别之后，可能会发生局部错误，这也给菜名识别带来了困难，进而导致拍照录菜的识别率较低，如公开号为101770569A的相关技术，公开了一种基于手持设备的菜谱识别及注解方法和装置，其采用OCR识别菜谱图像，得到菜名及相关信息。

针对相关技术中存在的上述问题，目前尚未发现有效的解决方案。

发明内容

本发明实施例提供了一种识别菜名的方法及装置、存储介质、电子装置。

根据本发明的一个实施例，提供了一种识别菜名的方法，包括：接收光学字符识别(Optical Character Recognition，OCR)模块响应目标图片输出的文本信息；根据预定规则识别所述文本信息是否为菜名；在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；使用二分类模型基于所述特征信息识别所述文本信息中的菜名。

可选的，获取所述文本信息的特征信息包括：以所述文本信息为关键字在预设菜品库中检索匹配的多个候选菜品；分别计算所述文本信息与所述多个候选菜品的编辑距离；统计编辑距离落在一个或多个预定范围的记录条数，其中，所述匹配特征包括所述记录条数。

可选的，获取所述文本信息的特征信息包括：对所述文本信息进行切分处理，得到多个分词；统计所述多个分词中属于菜品词典单词的单词个数，统计所述单词个数与总分词的单词比值，以及判断所述文本信息的最后一个分词是否为菜名并得到判断结果，其中，所述匹配特征包括：所述单词个数，所述单词比值，以及所述判断结果。

可选的，获取所述文本信息的特征信息包括：确定与所述文本信息对应的原始字符串；计算所述原始字符串的字符串长度，所述原始字符串的语言模型计算概率，所述原始字符串的最大三元tri-gram语言模型计算概率，所述原始字符串的最小三元tri-gram语言模型计算概率，其中，所述属性特征包括：所述字符串长度，所述语言模型计算概率，所述最大三元tri-gram语言模型计算概率，所述最小三元tri-gram语言模型计算概率。

可选的，根据预定规则识别所述文本信息是否为菜名包括以下至少之一：通过白名单识别所述文本信息是否为菜名；通过关键字识别所述文本信息是否为菜名；通过字符串长度识别所述文本信息是否为菜名；通过字符类型识别所述文本信息是否为菜名。

可选的，通过白名单识别所述文本信息是否为菜名包括：解析所述文本信息，得到与所述文本信息对应的原始字符串；判断预设白名单列表是否包括所述原始字符串；在所述预设白名单列表包括所述原始字符串时，确定识别出所述文本信息，在所述预设白名单列表不包括所述原始字符串时，确定未识别出所述文本信息。

可选的，通过关键字识别所述文本信息是否为菜名包括：解析所述文本信息，得到与所述文本信息对应的原始字符串；判断所述原始字符串是否包括预设关键字集合的任一关键字；

在所述原始字符串包括所述预设关键字集合的任一关键字时，确定识别出所述文本信息，在所述原始字符串不包括所述预设关键字集合的任一关键字时，确定未识别出所述文本信息。

可选的，通过字符串长度识别所述文本信息是否为菜名包括：解析所述文本信息，得到与所述文本信息对应的原始字符串；判断所述原始字符串的长度是否大于预设长度；在所述原始字符串的长度小于或等于所述预设长度时，确定未识别出所述文本信息，在所述原始字符串的长度大于所述预设长度时，确定识别出所述文本信息不是菜名。

可选的，通过字符类型识别所述文本信息是否为菜名包括：解析所述文本信息，得到与所述文本信息对应的原始字符串；判断所述原始字符串中是否包括指定类型的字符；在所述原始字符串中包括所述指定类型的字符，确定识别出所述文本信息，在所述原始字符串中不包括所述指定类型的字符，确定未识别出所述文本信息。

可选的，使用二分类模型基于所述特征信息识别所述文本信息中的菜名包括：计算所述特征信息的特征值；将所述特征值输入所述二分类模型，决策出所述文本信息的识别结果，其中，所述识别结果用于指示所述文本信息是否为菜名。

根据本发明的另一个实施例，提供了一种识别菜名的装置，包括：接收模块，用于接收光学字符识别OCR模块响应目标图片输出的文本信息；第一识别模块，用于根据预定规则识别所述文本信息是否为菜名；获取模块，用于在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；第二识别模块，用于使用二分类模型基于所述特征信息识别所述文本信息。

可选的，所述获取模块包括：检索单元，用于以所述文本信息为关键字在预设菜品库中检索匹配的多个候选菜品；第一计算单元，用于分别计算所述文本信息与所述多个候选菜品的编辑距离；统计单元，用于统计编辑距离落在一个或多个预定范围的记录条数，其中，所述匹配特征包括所述记录条数。

可选的，所述获取模块包括：分词单元，用于对所述文本信息进行切分处理，得到多个分词；处理单元，用于统计所述多个分词中属于菜品词典单词的单词个数，统计所述单词个数与总分词的单词比值，以及判断所述文本信息的最后一个分词是否为菜名并得到判断结果，其中，所述匹配特征包括：所述单词个数，所述单词比值，以及所述判断结果。

可选的，所述获取模块包括：确定单元，用于确定与所述文本信息对应的原始字符串；第二计算单元，用于计算所述原始字符串的字符串长度，所述原始字符串的语言模型计算概率，所述原始字符串的最大三元tri-gram语言模型计算概率，所述原始字符串的最小三元tri-gram语言模型计算概率，其中，所述属性特征包括：所述字符串长度，所述语言模型计算概率，所述最大三元tri-gram语言模型计算概率，所述最小三元tri-gram语言模型计算概率。

可选的，所述第一识别模块包括以下至少之一：第一识别单元，用于通过白名单识别所述文本信息是否为菜名；第二识别单元，用于通过关键字识别所述文本信息是否为菜名；第三识别单元，用于通过字符串长度识别所述文本信息是否为菜名；第四识别单元，用于通过字符类型识别所述文本信息是否为菜名。

可选的，所述第二识别模块包括：所述第二识别模块包括：计算单元，用于计算所述特征信息的特征值；决策单元，用于将所述特征值输入所述二分类模型，决策出所述文本信息的识别结果，其中，所述识别结果用于指示所述文本信息是否为菜名。

根据本发明的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明，先采用预定规则识别OCR模块响应目标图片输出的文本信息，在未识别出时，采用机器学习模型二分类模型基于特征信息识别文本信息中的菜名，通过强判别规则模型和机器学习模型相结合，使得即使拍照识别的菜名产生了个别错字，依然能够识别出目标图片中的菜名，解决了相关技术中拍照录菜的准确率低的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种识别菜名的移动终端结构框图；

图2是根据本发明实施例的一种识别菜名的方法流程图；

图3是本发明实施例的菜名识别的特征体系示意图；

图4是本发明实施例识别菜名的整体流程图；

图5是根据本发明实施例的一种识别菜名的装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在移动终端上为例，图1是本发明实施例的一种识别菜名的移动终端结构框图。如图1所示，移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述移动终端还可以包括用于通信功能的传输设备 106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述移动终端的结构造成限定。例如，移动终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的一种识别菜名的方法对应的计算机程序，处理器102 通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种识别菜名的方法，图2是根据本发明实施例的一种识别菜名的方法流程图，如图2所示，该流程包括如下步骤：

步骤S202，接收OCR模块响应目标图片输出的文本信息；

电子设备的OCR模块检查实物(如菜单)上的字符，然后用字符识别方法将其翻译成计算机文字，目标图片可以是摄像头当前采集的图片或者是本地保存的图片。

步骤S204，根据预定规则识别文本信息是否为菜名；

本实施例的菜名指的是菜品名称，是一个文字实体，本实施例的识别对象也可以是有实体名称库的实体名，比如店铺名等。

步骤S206，在预定规则未识别出文本信息时，获取文本信息的特征信息，其中，特征信息包括：文本信息的属性特征，文本信息相对预设词库的匹配特征；

步骤S208，使用二分类模型基于特征信息识别文本信息中的菜名。

通过上述步骤，先采用预定规则识别OCR模块响应目标图片输出的文本信息，在未识别出时，采用机器学习模型二分类模型基于特征信息识别文本信息中的菜名，通过强判别规则模型和机器学习模型相结合，使得即使拍照识别的菜名产生了个别错字，依然能够识别出目标图片中的菜名，解决了相关技术中拍照录菜的准确率低的技术问题。

本实施例的预定规则是一种强规则判定模型，用于对肯定是菜名和肯定不是菜名的文本信息进行判决。根据预定规则识别文本信息是否为菜名可以但不限于为：通过白名单识别文本信息是否为菜名；通过关键字识别文本信息是否为菜名；通过字符串长度识别文本信息是否为菜名；通过字符类型识别文本信息是否为菜名。本实施例的上述多个预定规则可以单独使用，也可以组合使用，组合使用的策略包括：在至少一个预定规则识别出的情况下，就判定已经识别出该文本信息，在所有预定规则均识别出的情况下，判定已经识别出该文本信息。在预定规则未识别出文本信息时，文本信息具体是不是菜名，并不能确定，需要使用本实施例的后续算法(二分类模型)进一步确认和识别。

下面对各种预定规则的识别过程进行举例说明：

在一个实施方式中，通过白名单识别文本信息是否为菜名包括：

S11，解析文本信息，得到与文本信息对应的原始字符串；

S12，判断预设白名单列表是否包括原始字符串；

本实施例的字符串为中文的字组成的字符串，也可以是英文或其他形式的字符串，或者是包括数字、特殊字符的混合字符串。预设白名单列表由多个菜品名称组成，如：麻辣香锅，红烧猪蹄等。

S13，在预设白名单列表包括原始字符串时，确定识别出文本信息，在预设白名单列表不包括原始字符串时，确定未识别出文本信息。如原始字符串为“麻辣香锅”，则确定识别出文本信息，在识别出的情况下，同时确认并输出该文本信息，在另一个示例中，原始字符串为“麻花丸子”，经通过预设白名单列表比对，不包括该原始字符串，则认定未识别出文本信息，此时“麻花丸子”具体是不是一个菜名，并不能确定，需要使用本实施例的后续算法进一步确认和识别。

在一个实施方式中，通过关键字识别文本信息是否为菜名包括：

S21，解析文本信息，得到与文本信息对应的原始字符串；

S22，判断原始字符串是否包括预设关键字集合的任一关键字；

本实施例的预设关键字集合由多个关键字组成，如蔬菜类，酒水类等的关键字，关键字可以是一个菜名，也可以是菜名相关的组成部分，如：麻辣，香锅，清炒，香菜，丸子等。

S23，在原始字符串包括预设关键字集合的任一关键字时，确定识别出文本信息，在原始字符串不包括预设关键字集合的任一关键字时，确定未识别出文本信息。在另一个示例中，原始字符串为“麻花丸子”，经通过预设关键字集合比对，包括关键字丸子，则认定识别出文本信息，“麻花丸子”为菜名。

本实施例的关键字分为两种类型，一种是命中之后为菜名，例如上述示例中的“丸子”，一种是命中之后不是菜名的关键字，比如“酒水类”。

在一个实施方式中，通过字符串长度识别文本信息是否为菜名包括：

S31，解析文本信息，得到与文本信息对应的原始字符串；

S32，判断原始字符串的长度是否大于预设长度；

在一个示例中，预设长度为10个字符，当文本信息的字符串超过10个字符时，很有可能不是菜名，而是菜品介绍，地址等信息。

S33，在原始字符串的长度小于或等于预设长度时，确定未识别出文本信息，在原始字符串的长度大于预设长度时，确定识别出文本信息不是菜名。

在一个实施方式中，通过字符类型识别文本信息是否为菜名包括：

S41，解析文本信息，得到与文本信息对应的原始字符串；

S42，判断原始字符串中是否包括指定类型的字符；

本实施例的指定类型包括：地址(如街道，楼牌号等)，超过一定长度的数字(如座机或手机的长度)等。

S43，在原始字符串中包括指定类型的字符，确定识别出文本信息，在原始字符串中不包括指定类型的字符，确定未识别出文本信息。

在采用预定规则未识别出文本信息时，需要进一步获取文本信息的特征信息，使用二分类模型基于特征信息识别文本信息中的菜名。

可选的，获取文本信息的特征信息包括：以文本信息为关键字在预设菜品库中检索匹配的多个候选菜品；分别计算文本信息与多个候选菜品的编辑距离；统计编辑距离落在一个或多个预定范围的记录条数，其中，匹配特征包括记录条数。首先把预先通过合理的方式准备好的全量菜品库导入搜索引擎，然后将OCR结果文本块(文本信息)中的内容作为关键词，进行搜索，并设定最多返回n条记录(对应n个预定范围)，然后针对n条记录统计特征，例如：

(a)编辑距离为0的记录条数；

(b)编辑距离为1的记录条数；

(c)编辑距离为2的记录条数；

(d)编辑距离为3的记录条数；

(e)编辑距离为3以上的记录条数；

(f)编辑距离>2的记录条数与编辑距离<＝2的记录条数比值。

选取这些特征的原因是，OCR识别后的菜名，可能是正确菜名，也可能错了一两个字，那么搜索返回的n条结果应该是主要集中在与输入字符串编辑距离比较小的范围内，比如“黄焖鸡咪饭”与“有我更精彩”这两个文本块，显然前者的搜索结果应该是多且主要集中在编辑距离比较小的范围，而后者，返回结果应该比较少，或者主要集中在编辑距离比较大的范围。

可选的，获取文本信息的特征信息包括：对文本信息进行切分处理，得到多个分词；统计多个分词中属于菜品词典单词的单词个数，进而统计单词个数与总分词的单词比值，以及判断文本信息的最后一个分词是否为菜名并得到判断结果，其中，匹配特征包括：单词个数，单词比值，以及判断结果。

通过基于预先挖掘好的菜品带标签的词典，对OCR文本块切词，对切词结果(分词)统计特征。词典标签包括“菜品”，“做法”，“口味”，“外观”， “规格”等。特征包括：

(a)切词结果中包含菜品词典单词的个数；

(b)切词结果中菜品词典中单词的个数与所有单词个数的比值；

(c)最后一个词的标签是否为菜名。

可选的，获取文本信息的特征信息包括：确定与文本信息对应的原始字符串；计算原始字符串的字符串长度，原始字符串的语言模型计算概率，原始字符串的最大三元tri-gram语言模型计算概率，原始字符串的最小三元 tri-gram语言模型计算概率，其中，属性特征包括：字符串长度，语言模型计算概率，最大三元tri-gram语言模型计算概率，最小三元tri-gram语言模型计算概率。

文本信息字符串本身的属性特征。包括：(a)字符串长度；(b)字符串的语言模型计算概率；(c)字符串tri-gram的最大、最小语言模型计算概率。

本实施例使用的语言模型为估计单词序列的概率值的统计模型，n-gram 模型是指将文本里面的内容按照字节进行大小为n的滑动窗口操作，形成的长度是n的字节片段序列。Trigram是n-gram模型的三阶的语言模型，三元语言模型(Trigram languagemodel)是关于马尔科夫模型的一个应用，一个三元语言模型包括一个有限集合V，和一个参数q(w|u,v)。对于任何的三元u, v,w，其中w∈V∪{STOP},和u,v∈V∪{*}。q(w|u,v)的值可以理解为，在看到二元组(u,v)之后，看到单词w的概率是多少。

可选的，使用二分类模型基于特征信息识别文本信息中的菜名包括：

S51，计算所述特征信息的特征值；

该特征值与文本信息的属性特征和所述文本信息相对预设词库的匹配特征相关。

S52，将特征值输入二分类模型，决策出所述文本信息的识别结果，其中，所述识别结果用于指示所述文本信息是否为菜名；进一步的，在识别出该文本信息为菜名时，以菜名标识输出该文本信息。

本实施例的二分类模型是机器学习模型，可以是随机森林算法模型， GBDT(Gradient Boosting DecisionTree,梯度提升树)算法模型，逻辑回归算法模型等。图3是本发明实施例的菜名识别的特征体系示意图，菜名识别的特征体系包括上述获取到的文本信息的属性特征，文本信息相对预设词库的匹配特征。

本实施例在训练二分类模型时，给定一个训练集合D，提取的样本特征，这些特征的信息量也是模型的输入，对于二分类学习任务，输出标签通常为0 或者1，代表两个不同的结果，分类学习任务指的是学习一个输入到输出的映射f，其值的范围是标签空间，当C为2时，就是二分类问题，即结果为两个预定的分支。其中的映射f，可以理解为模型，形式有很多种，各自原理也不尽相同，常见的如随机森林模型，逻辑回归，GBDT，支持向量机等，机器学习的结果是得到一个训练好的输入输出映射f，在给定输入时，模型可以预测输出，本实施例二分类模型的输出为：是菜名，不是菜名。

图4是本发明实施例识别菜名的整体流程图，如图4所示，流程包括：

输入OCR模块识别的文本块，即多个字符，可能包括中文，数字，字母，标点符号等；

使用强规则判定模型识别，对肯定是菜名和肯定不是菜名的情况进行判决。比如，白名单，关键词命中(如蔬菜类，酒水类等)，字符串过长，包含电话号码，包含地址词，包含单位等；

机器学习模型识别，由于强规则只能覆盖比较小的一部分场景，不能识别复杂的文本信息，因此复杂的场景采用机器学习模型。将菜名实体识别作为一个二分类问题考虑，本实施例采用的二分类模型有很多，比如随机森林， GBDT(梯度提升树)，逻辑回归等。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种识别菜名的装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本发明实施例的一种识别菜名的装置的结构框图，可以应用在餐饮服务器或终端中，如图5所示，该装置包括：

接收模块50，用于接收光学字符识别OCR模块响应目标图片输出的文本信息；

第一识别模块52，用于根据预定规则识别所述文本信息是否为菜名；

获取模块54，用于在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；

第二识别模块56，用于使用二分类模型基于所述特征信息识别所述文本信息。

可选的，所述第二识别模块包括：计算单元，用于计算所述特征信息的特征值；决策单元，用于将所述特征值输入所述二分类模型，决策出所述文本信息的识别结果，其中，所述识别结果用于指示所述文本信息是否为菜名。

需要说明的是，客户端和服务器仅是方案在执行主体上的差异，上述获取网页数据终端中的各个示例和可选方案同样适应在客户端和服务器中，并产生相同的技术效果。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例的一个方面中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，接收光学字符识别OCR模块响应目标图片输出的文本信息；

S2，根据预定规则识别所述文本信息是否为菜名；

S3，在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；

S4，使用二分类模型基于所述特征信息识别所述文本信息中的菜名。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例的一个方面中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S2，根据预定规则识别所述文本信息是否为菜名；

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种识别菜名的方法，其特征在于，包括：

接收光学字符识别OCR模块响应目标图片输出的文本信息；

根据预定规则识别所述文本信息是否为菜名；

在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；

使用二分类模型基于所述特征信息识别所述文本信息中的菜名。

2.根据权利要求1所述的方法，其特征在于，获取所述文本信息的特征信息包括：

以所述文本信息为关键字在预设菜品库中检索匹配的多个候选菜品；

分别计算所述文本信息与所述多个候选菜品的编辑距离；

统计编辑距离落在一个或多个预定范围的记录条数，其中，所述匹配特征包括所述记录条数。

3.根据权利要求1所述的方法，其特征在于，获取所述文本信息的特征信息包括：

对所述文本信息进行切分处理，得到多个分词；

统计所述多个分词中属于菜品词典单词的单词个数，统计所述单词个数与总分词的单词比值，以及判断所述文本信息的最后一个分词是否为菜名并得到判断结果，其中，所述匹配特征包括：所述单词个数，所述单词比值，以及所述判断结果。

4.根据权利要求1所述的方法，其特征在于，获取所述文本信息的特征信息包括：

确定与所述文本信息对应的原始字符串；

计算所述原始字符串的字符串长度，所述原始字符串的语言模型计算概率，所述原始字符串的最大三元tri-gram语言模型计算概率，所述原始字符串的最小三元tri-gram语言模型计算概率，其中，所述属性特征包括：所述字符串长度，所述语言模型计算概率，所述最大三元tri-gram语言模型计算概率，所述最小三元tri-gram语言模型计算概率。

5.根据权利要求1所述的方法，其特征在于，根据预定规则识别所述文本信息是否为菜名包括以下至少之一：

通过白名单识别所述文本信息是否为菜名；

通过关键字识别所述文本信息是否为菜名；

通过字符串长度识别所述文本信息是否为菜名；

通过字符类型识别所述文本信息是否为菜名。

6.根据权利要求5所述的方法，其特征在于，通过白名单识别所述文本信息是否为菜名包括：

解析所述文本信息，得到与所述文本信息对应的原始字符串；

判断预设白名单列表是否包括所述原始字符串；

在所述预设白名单列表包括所述原始字符串时，确定识别出所述文本信息，在所述预设白名单列表不包括所述原始字符串时，确定未识别出所述文本信息。

7.根据权利要求5所述的方法，其特征在于，通过关键字识别所述文本信息是否为菜名包括：

判断所述原始字符串是否包括预设关键字集合的任一关键字；

8.一种识别菜名的装置，其特征在于，包括：

接收模块，用于接收光学字符识别OCR模块响应目标图片输出的文本信息；

第一识别模块，用于根据预定规则识别所述文本信息是否为菜名；

获取模块，用于在所述预定规则未识别出所述文本信息时，获取所述文本信息的特征信息，其中，所述特征信息包括：所述文本信息的属性特征，所述文本信息相对预设词库的匹配特征；

第二识别模块，用于使用二分类模型基于所述特征信息识别所述文本信息。

9.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行权利要求1至7任一项中所述的方法。

10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1至7任一项中所述的方法。