CN110110577B - 识别菜名的方法及装置、存储介质、电子装置 - Google Patents
识别菜名的方法及装置、存储介质、电子装置 Download PDFInfo
- Publication number
- CN110110577B CN110110577B CN201910059330.0A CN201910059330A CN110110577B CN 110110577 B CN110110577 B CN 110110577B CN 201910059330 A CN201910059330 A CN 201910059330A CN 110110577 B CN110110577 B CN 110110577B
- Authority
- CN
- China
- Prior art keywords
- text information
- dish
- information
- preset
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了一种识别菜名的方法及装置、存储介质、电子装置,其中,该方法包括:接收光学字符识别OCR模块响应目标图片输出的文本信息;根据预定规则识别所述文本信息是否为菜名;在所述预定规则未识别出所述文本信息时,获取所述文本信息的特征信息,其中,所述特征信息包括:所述文本信息的属性特征,所述文本信息相对预设词库的匹配特征;使用二分类模型基于所述特征信息识别所述文本信息中的菜名。通过本发明,解决了相关技术中拍照录菜的准确率低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种识别菜名的方法及装置、 存储介质、电子装置。
背景技术
相关技术中,互联网+时代,人们的生活变得越来越便捷和高效,预定、 购票、出行、找房、订餐等可以通过手机轻松完成,互联网本地生活领域的 发展,扩大了传统行业的服务半径,提高了传统行业的效能,节约了成本。 吃喝住行,餐饮作为其中的重要环节,正在享受着互联网带来的福利,在传 统餐饮店搬上手机app时,数据的数字化,标准化,是一个必经的过程,一 个典型的场景就是录菜,即把商家的菜单录入app应用中。
相关技术中的录菜方式包括但不局限于手动录菜或者是拍照录菜,手动 录菜即手动打字录菜,这种方式录菜效率低,而且对于一些年龄大一点的人 来说,打字难度更大。在另一方面,拍照录菜是先识别出菜单图片上的文字, 然后,菜名和价格等实体识别,排版分析等处理,最终得到菜名、价格以及 他们的映射关系。现实中的文字菜单,往往包含菜名,价格,规格(大份、 小份等),描述、优惠、分组和一些与菜无关的文字信息,这给菜名提取带来 了很大的干扰,进而影响着菜单的版式分析,菜名价格的匹配等。另外,菜 单上的菜名,OCR识别之后,可能会发生局部错误,这也给菜名识别带来了 困难,进而导致拍照录菜的识别率较低,如公开号为101770569A的相关技术, 公开了一种基于手持设备的菜谱识别及注解方法和装置,其采用OCR识别菜 谱图像,得到菜名及相关信息。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种识别菜名的方法及装置、存储介质、电子装置。
根据本发明的一个实施例,提供了一种识别菜名的方法,包括:接收光 学字符识别(Optical Character Recognition,OCR)模块响应目标图片输出的 文本信息;根据预定规则识别所述文本信息是否为菜名;在所述预定规则未 识别出所述文本信息时,获取所述文本信息的特征信息,其中,所述特征信 息包括:所述文本信息的属性特征,所述文本信息相对预设词库的匹配特征; 使用二分类模型基于所述特征信息识别所述文本信息中的菜名。
可选的,获取所述文本信息的特征信息包括:以所述文本信息为关键字 在预设菜品库中检索匹配的多个候选菜品;分别计算所述文本信息与所述多 个候选菜品的编辑距离;统计编辑距离落在一个或多个预定范围的记录条数, 其中,所述匹配特征包括所述记录条数。
可选的,获取所述文本信息的特征信息包括:对所述文本信息进行切分 处理,得到多个分词;统计所述多个分词中属于菜品词典单词的单词个数, 统计所述单词个数与总分词的单词比值,以及判断所述文本信息的最后一个 分词是否为菜名并得到判断结果,其中,所述匹配特征包括:所述单词个数, 所述单词比值,以及所述判断结果。
可选的,获取所述文本信息的特征信息包括:确定与所述文本信息对应 的原始字符串;计算所述原始字符串的字符串长度,所述原始字符串的语言 模型计算概率,所述原始字符串的最大三元tri-gram语言模型计算概率,所述 原始字符串的最小三元tri-gram语言模型计算概率,其中,所述属性特征包括: 所述字符串长度,所述语言模型计算概率,所述最大三元tri-gram语言模型计 算概率,所述最小三元tri-gram语言模型计算概率。
可选的,根据预定规则识别所述文本信息是否为菜名包括以下至少之一: 通过白名单识别所述文本信息是否为菜名;通过关键字识别所述文本信息是 否为菜名;通过字符串长度识别所述文本信息是否为菜名;通过字符类型识 别所述文本信息是否为菜名。
可选的,通过白名单识别所述文本信息是否为菜名包括:解析所述文本 信息,得到与所述文本信息对应的原始字符串;判断预设白名单列表是否包 括所述原始字符串;在所述预设白名单列表包括所述原始字符串时,确定识 别出所述文本信息,在所述预设白名单列表不包括所述原始字符串时,确定 未识别出所述文本信息。
可选的,通过关键字识别所述文本信息是否为菜名包括:解析所述文本 信息,得到与所述文本信息对应的原始字符串;判断所述原始字符串是否包 括预设关键字集合的任一关键字;
在所述原始字符串包括所述预设关键字集合的任一关键字时,确定识别 出所述文本信息,在所述原始字符串不包括所述预设关键字集合的任一关键 字时,确定未识别出所述文本信息。
可选的,通过字符串长度识别所述文本信息是否为菜名包括:解析所述 文本信息,得到与所述文本信息对应的原始字符串;判断所述原始字符串的 长度是否大于预设长度;在所述原始字符串的长度小于或等于所述预设长度 时,确定未识别出所述文本信息,在所述原始字符串的长度大于所述预设长 度时,确定识别出所述文本信息不是菜名。
可选的,通过字符类型识别所述文本信息是否为菜名包括:解析所述文 本信息,得到与所述文本信息对应的原始字符串;判断所述原始字符串中是 否包括指定类型的字符;在所述原始字符串中包括所述指定类型的字符,确 定识别出所述文本信息,在所述原始字符串中不包括所述指定类型的字符, 确定未识别出所述文本信息。
可选的,使用二分类模型基于所述特征信息识别所述文本信息中的菜名 包括:计算所述特征信息的特征值;将所述特征值输入所述二分类模型,决 策出所述文本信息的识别结果,其中,所述识别结果用于指示所述文本信息 是否为菜名。
根据本发明的另一个实施例,提供了一种识别菜名的装置,包括:接收 模块,用于接收光学字符识别OCR模块响应目标图片输出的文本信息;第一 识别模块,用于根据预定规则识别所述文本信息是否为菜名;获取模块,用 于在所述预定规则未识别出所述文本信息时,获取所述文本信息的特征信息, 其中,所述特征信息包括:所述文本信息的属性特征,所述文本信息相对预 设词库的匹配特征;第二识别模块,用于使用二分类模型基于所述特征信息 识别所述文本信息。
可选的,所述获取模块包括:检索单元,用于以所述文本信息为关键字 在预设菜品库中检索匹配的多个候选菜品;第一计算单元,用于分别计算所 述文本信息与所述多个候选菜品的编辑距离;统计单元,用于统计编辑距离 落在一个或多个预定范围的记录条数,其中,所述匹配特征包括所述记录条 数。
可选的,所述获取模块包括:分词单元,用于对所述文本信息进行切分 处理,得到多个分词;处理单元,用于统计所述多个分词中属于菜品词典单 词的单词个数,统计所述单词个数与总分词的单词比值,以及判断所述文本 信息的最后一个分词是否为菜名并得到判断结果,其中,所述匹配特征包括: 所述单词个数,所述单词比值,以及所述判断结果。
可选的,所述获取模块包括:确定单元,用于确定与所述文本信息对应 的原始字符串;第二计算单元,用于计算所述原始字符串的字符串长度,所 述原始字符串的语言模型计算概率,所述原始字符串的最大三元tri-gram语言 模型计算概率,所述原始字符串的最小三元tri-gram语言模型计算概率,其中, 所述属性特征包括:所述字符串长度,所述语言模型计算概率,所述最大三 元tri-gram语言模型计算概率,所述最小三元tri-gram语言模型计算概率。
可选的,所述第一识别模块包括以下至少之一:第一识别单元,用于通 过白名单识别所述文本信息是否为菜名;第二识别单元,用于通过关键字识 别所述文本信息是否为菜名;第三识别单元,用于通过字符串长度识别所述 文本信息是否为菜名;第四识别单元,用于通过字符类型识别所述文本信息 是否为菜名。
可选的,所述第二识别模块包括:所述第二识别模块包括:计算单元, 用于计算所述特征信息的特征值;决策单元,用于将所述特征值输入所述二 分类模型,决策出所述文本信息的识别结果,其中,所述识别结果用于指示 所述文本信息是否为菜名。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中 存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项 方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处 理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算 机程序以执行上述任一项方法实施例中的步骤。
通过本发明,先采用预定规则识别OCR模块响应目标图片输出的文本信 息,在未识别出时,采用机器学习模型二分类模型基于特征信息识别文本信 息中的菜名,通过强判别规则模型和机器学习模型相结合,使得即使拍照识 别的菜名产生了个别错字,依然能够识别出目标图片中的菜名,解决了相关 技术中拍照录菜的准确率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部 分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的 不当限定。在附图中:
图1是本发明实施例的一种识别菜名的移动终端结构框图;
图2是根据本发明实施例的一种识别菜名的方法流程图;
图3是本发明实施例的菜名识别的特征体系示意图;
图4是本发明实施例识别菜名的整体流程图;
图5是根据本发明实施例的一种识别菜名的装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在 不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第 一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后 次序。
实施例1
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端、服 务器或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明 实施例的一种识别菜名的移动终端结构框图。如图1所示,移动终端10可以 包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不 限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据 的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备 106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构 仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可 包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模 块,如本发明实施例中的一种识别菜名的方法对应的计算机程序,处理器102 通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数 据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括 非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性 固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远 程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网 络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实 例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装 置106包括一个网络适配器(Network Interface Controller,简称为NIC),其 可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中, 传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过 无线方式与互联网进行通讯。
在本实施例中提供了一种识别菜名的方法,图2是根据本发明实施例的 一种识别菜名的方法流程图,如图2所示,该流程包括如下步骤:
步骤S202,接收OCR模块响应目标图片输出的文本信息;
电子设备的OCR模块检查实物(如菜单)上的字符,然后用字符识别方 法将其翻译成计算机文字,目标图片可以是摄像头当前采集的图片或者是本 地保存的图片。
步骤S204,根据预定规则识别文本信息是否为菜名;
本实施例的菜名指的是菜品名称,是一个文字实体,本实施例的识别对 象也可以是有实体名称库的实体名,比如店铺名等。
步骤S206,在预定规则未识别出文本信息时,获取文本信息的特征信息, 其中,特征信息包括:文本信息的属性特征,文本信息相对预设词库的匹配 特征;
步骤S208,使用二分类模型基于特征信息识别文本信息中的菜名。
通过上述步骤,先采用预定规则识别OCR模块响应目标图片输出的文本 信息,在未识别出时,采用机器学习模型二分类模型基于特征信息识别文本 信息中的菜名,通过强判别规则模型和机器学习模型相结合,使得即使拍照 识别的菜名产生了个别错字,依然能够识别出目标图片中的菜名,解决了相 关技术中拍照录菜的准确率低的技术问题。
本实施例的预定规则是一种强规则判定模型,用于对肯定是菜名和肯定 不是菜名的文本信息进行判决。根据预定规则识别文本信息是否为菜名可以 但不限于为:通过白名单识别文本信息是否为菜名;通过关键字识别文本信 息是否为菜名;通过字符串长度识别文本信息是否为菜名;通过字符类型识 别文本信息是否为菜名。本实施例的上述多个预定规则可以单独使用,也可 以组合使用,组合使用的策略包括:在至少一个预定规则识别出的情况下, 就判定已经识别出该文本信息,在所有预定规则均识别出的情况下,判定已经识别出该文本信息。在预定规则未识别出文本信息时,文本信息具体是不 是菜名,并不能确定,需要使用本实施例的后续算法(二分类模型)进一步 确认和识别。
下面对各种预定规则的识别过程进行举例说明:
在一个实施方式中,通过白名单识别文本信息是否为菜名包括:
S11,解析文本信息,得到与文本信息对应的原始字符串;
S12,判断预设白名单列表是否包括原始字符串;
本实施例的字符串为中文的字组成的字符串,也可以是英文或其他形式 的字符串,或者是包括数字、特殊字符的混合字符串。预设白名单列表由多 个菜品名称组成,如:麻辣香锅,红烧猪蹄等。
S13,在预设白名单列表包括原始字符串时,确定识别出文本信息,在预 设白名单列表不包括原始字符串时,确定未识别出文本信息。如原始字符串 为“麻辣香锅”,则确定识别出文本信息,在识别出的情况下,同时确认并输 出该文本信息,在另一个示例中,原始字符串为“麻花丸子”,经通过预设白 名单列表比对,不包括该原始字符串,则认定未识别出文本信息,此时“麻 花丸子”具体是不是一个菜名,并不能确定,需要使用本实施例的后续算法 进一步确认和识别。
在一个实施方式中,通过关键字识别文本信息是否为菜名包括:
S21,解析文本信息,得到与文本信息对应的原始字符串;
S22,判断原始字符串是否包括预设关键字集合的任一关键字;
本实施例的预设关键字集合由多个关键字组成,如蔬菜类,酒水类等的 关键字,关键字可以是一个菜名,也可以是菜名相关的组成部分,如:麻辣, 香锅,清炒,香菜,丸子等。
S23,在原始字符串包括预设关键字集合的任一关键字时,确定识别出文 本信息,在原始字符串不包括预设关键字集合的任一关键字时,确定未识别 出文本信息。在另一个示例中,原始字符串为“麻花丸子”,经通过预设关键 字集合比对,包括关键字丸子,则认定识别出文本信息,“麻花丸子”为菜名。
本实施例的关键字分为两种类型,一种是命中之后为菜名,例如上述示 例中的“丸子”,一种是命中之后不是菜名的关键字,比如“酒水类”。
在一个实施方式中,通过字符串长度识别文本信息是否为菜名包括:
S31,解析文本信息,得到与文本信息对应的原始字符串;
S32,判断原始字符串的长度是否大于预设长度;
在一个示例中,预设长度为10个字符,当文本信息的字符串超过10个 字符时,很有可能不是菜名,而是菜品介绍,地址等信息。
S33,在原始字符串的长度小于或等于预设长度时,确定未识别出文本信 息,在原始字符串的长度大于预设长度时,确定识别出文本信息不是菜名。
在一个实施方式中,通过字符类型识别文本信息是否为菜名包括:
S41,解析文本信息,得到与文本信息对应的原始字符串;
S42,判断原始字符串中是否包括指定类型的字符;
本实施例的指定类型包括:地址(如街道,楼牌号等),超过一定长度的 数字(如座机或手机的长度)等。
S43,在原始字符串中包括指定类型的字符,确定识别出文本信息,在原 始字符串中不包括指定类型的字符,确定未识别出文本信息。
在采用预定规则未识别出文本信息时,需要进一步获取文本信息的特征 信息,使用二分类模型基于特征信息识别文本信息中的菜名。
可选的,获取文本信息的特征信息包括:以文本信息为关键字在预设菜 品库中检索匹配的多个候选菜品;分别计算文本信息与多个候选菜品的编辑 距离;统计编辑距离落在一个或多个预定范围的记录条数,其中,匹配特征 包括记录条数。首先把预先通过合理的方式准备好的全量菜品库导入搜索引 擎,然后将OCR结果文本块(文本信息)中的内容作为关键词,进行搜索, 并设定最多返回n条记录(对应n个预定范围),然后针对n条记录统计特征, 例如:
(a)编辑距离为0的记录条数;
(b)编辑距离为1的记录条数;
(c)编辑距离为2的记录条数;
(d)编辑距离为3的记录条数;
(e)编辑距离为3以上的记录条数;
(f)编辑距离>2的记录条数与编辑距离<=2的记录条数比值。
选取这些特征的原因是,OCR识别后的菜名,可能是正确菜名,也可能 错了一两个字,那么搜索返回的n条结果应该是主要集中在与输入字符串编 辑距离比较小的范围内,比如“黄焖鸡咪饭”与“有我更精彩”这两个文本块, 显然前者的搜索结果应该是多且主要集中在编辑距离比较小的范围,而后者, 返回结果应该比较少,或者主要集中在编辑距离比较大的范围。
可选的,获取文本信息的特征信息包括:对文本信息进行切分处理,得 到多个分词;统计多个分词中属于菜品词典单词的单词个数,进而统计单词 个数与总分词的单词比值,以及判断文本信息的最后一个分词是否为菜名并 得到判断结果,其中,匹配特征包括:单词个数,单词比值,以及判断结果。
通过基于预先挖掘好的菜品带标签的词典,对OCR文本块切词,对切词 结果(分词)统计特征。词典标签包括“菜品”,“做法”,“口味”,“外观”, “规格”等。特征包括:
(a)切词结果中包含菜品词典单词的个数;
(b)切词结果中菜品词典中单词的个数与所有单词个数的比值;
(c)最后一个词的标签是否为菜名。
可选的,获取文本信息的特征信息包括:确定与文本信息对应的原始字 符串;计算原始字符串的字符串长度,原始字符串的语言模型计算概率,原 始字符串的最大三元tri-gram语言模型计算概率,原始字符串的最小三元 tri-gram语言模型计算概率,其中,属性特征包括:字符串长度,语言模型计 算概率,最大三元tri-gram语言模型计算概率,最小三元tri-gram语言模型计 算概率。
文本信息字符串本身的属性特征。包括:(a)字符串长度;(b)字符串 的语言模型计算概率;(c)字符串tri-gram的最大、最小语言模型计算概率。
本实施例使用的语言模型为估计单词序列的概率值的统计模型,n-gram 模型是指将文本里面的内容按照字节进行大小为n的滑动窗口操作,形成的 长度是n的字节片段序列。Trigram是n-gram模型的三阶的语言模型,三元 语言模型(Trigram languagemodel)是关于马尔科夫模型的一个应用,一个三 元语言模型包括一个有限集合V,和一个参数q(w|u,v)。对于任何的三元u, v,w,其中w∈V∪{STOP},和u,v∈V∪{*}。q(w|u,v)的值可以 理解为,在看到二元组(u,v)之后,看到单词w的概率是多少。
可选的,使用二分类模型基于特征信息识别文本信息中的菜名包括:
S51,计算所述特征信息的特征值;
该特征值与文本信息的属性特征和所述文本信息相对预设词库的匹配特 征相关。
S52,将特征值输入二分类模型,决策出所述文本信息的识别结果,其中, 所述识别结果用于指示所述文本信息是否为菜名;进一步的,在识别出该文 本信息为菜名时,以菜名标识输出该文本信息。
本实施例的二分类模型是机器学习模型,可以是随机森林算法模型, GBDT(Gradient Boosting DecisionTree,梯度提升树)算法模型,逻辑回归算 法模型等。图3是本发明实施例的菜名识别的特征体系示意图,菜名识别的 特征体系包括上述获取到的文本信息的属性特征,文本信息相对预设词库的 匹配特征。
本实施例在训练二分类模型时,给定一个训练集合D,提取的样本特征, 这些特征的信息量也是模型的输入,对于二分类学习任务,输出标签通常为0 或者1,代表两个不同的结果,分类学习任务指的是学习一个输入到输出的映 射f,其值的范围是标签空间,当C为2时,就是二分类问题,即结果为两个 预定的分支。其中的映射f,可以理解为模型,形式有很多种,各自原理也不 尽相同,常见的如随机森林模型,逻辑回归,GBDT,支持向量机等,机器学 习的结果是得到一个训练好的输入输出映射f,在给定输入时,模型可以预测 输出,本实施例二分类模型的输出为:是菜名,不是菜名。
图4是本发明实施例识别菜名的整体流程图,如图4所示,流程包括:
输入OCR模块识别的文本块,即多个字符,可能包括中文,数字,字母, 标点符号等;
使用强规则判定模型识别,对肯定是菜名和肯定不是菜名的情况进行判 决。比如,白名单,关键词命中(如蔬菜类,酒水类等),字符串过长,包含 电话号码,包含地址词,包含单位等;
机器学习模型识别,由于强规则只能覆盖比较小的一部分场景,不能识 别复杂的文本信息,因此复杂的场景采用机器学习模型。将菜名实体识别作 为一个二分类问题考虑,本实施例采用的二分类模型有很多,比如随机森林, GBDT(梯度提升树),逻辑回归等。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据 上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也 可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本 发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的 形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁 碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机, 服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种识别菜名的装置,该装置用于实现上述实施 例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模 块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装 置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能 并被构想的。
图5是根据本发明实施例的一种识别菜名的装置的结构框图,可以应用 在餐饮服务器或终端中,如图5所示,该装置包括:
接收模块50,用于接收光学字符识别OCR模块响应目标图片输出的文本 信息;
第一识别模块52,用于根据预定规则识别所述文本信息是否为菜名;
获取模块54,用于在所述预定规则未识别出所述文本信息时,获取所述 文本信息的特征信息,其中,所述特征信息包括:所述文本信息的属性特征, 所述文本信息相对预设词库的匹配特征;
第二识别模块56,用于使用二分类模型基于所述特征信息识别所述文本 信息。
可选的,所述获取模块包括:检索单元,用于以所述文本信息为关键字 在预设菜品库中检索匹配的多个候选菜品;第一计算单元,用于分别计算所 述文本信息与所述多个候选菜品的编辑距离;统计单元,用于统计编辑距离 落在一个或多个预定范围的记录条数,其中,所述匹配特征包括所述记录条 数。
可选的,所述获取模块包括:分词单元,用于对所述文本信息进行切分 处理,得到多个分词;处理单元,用于统计所述多个分词中属于菜品词典单 词的单词个数,统计所述单词个数与总分词的单词比值,以及判断所述文本 信息的最后一个分词是否为菜名并得到判断结果,其中,所述匹配特征包括: 所述单词个数,所述单词比值,以及所述判断结果。
可选的,所述获取模块包括:确定单元,用于确定与所述文本信息对应 的原始字符串;第二计算单元,用于计算所述原始字符串的字符串长度,所 述原始字符串的语言模型计算概率,所述原始字符串的最大三元tri-gram语言 模型计算概率,所述原始字符串的最小三元tri-gram语言模型计算概率,其中, 所述属性特征包括:所述字符串长度,所述语言模型计算概率,所述最大三 元tri-gram语言模型计算概率,所述最小三元tri-gram语言模型计算概率。
可选的,所述第一识别模块包括以下至少之一:第一识别单元,用于通 过白名单识别所述文本信息是否为菜名;第二识别单元,用于通过关键字识 别所述文本信息是否为菜名;第三识别单元,用于通过字符串长度识别所述 文本信息是否为菜名;第四识别单元,用于通过字符类型识别所述文本信息 是否为菜名。
可选的,所述第二识别模块包括:计算单元,用于计算所述特征信息的 特征值;决策单元,用于将所述特征值输入所述二分类模型,决策出所述文 本信息的识别结果,其中,所述识别结果用于指示所述文本信息是否为菜名。
需要说明的是,客户端和服务器仅是方案在执行主体上的差异,上述获 取网页数据终端中的各个示例和可选方案同样适应在客户端和服务器中,并 产生相同的技术效果。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后 者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中; 或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程 序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步 骤。
可选地,在本实施例的一个方面中,上述存储介质可以被设置为存储用 于执行以下步骤的计算机程序:
S1,接收光学字符识别OCR模块响应目标图片输出的文本信息;
S2,根据预定规则识别所述文本信息是否为菜名;
S3,在所述预定规则未识别出所述文本信息时,获取所述文本信息的特 征信息,其中,所述特征信息包括:所述文本信息的属性特征,所述文本信 息相对预设词库的匹配特征;
S4,使用二分类模型基于所述特征信息识别所述文本信息中的菜名。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读 存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程 序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储 器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一 项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中, 该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例的一个方面中,上述处理器可以被设置为通过计算 机程序执行以下步骤:
S1,接收光学字符识别OCR模块响应目标图片输出的文本信息;
S2,根据预定规则识别所述文本信息是否为菜名;
S3,在所述预定规则未识别出所述文本信息时,获取所述文本信息的特 征信息,其中,所述特征信息包括:所述文本信息的属性特征,所述文本信 息相对预设词库的匹配特征;
S4,使用二分类模型基于所述特征信息识别所述文本信息中的菜名。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中 所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可 以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布 在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程 序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并 且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者 将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作 成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件 结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本 领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之 内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之 内。
Claims (15)
1.一种识别菜名的方法,其特征在于,包括:
接收光学字符识别OCR模块响应目标图片输出的文本信息;
根据预定规则识别所述文本信息是否为菜名;
在所述预定规则未识别出所述文本信息时,获取所述文本信息的特征信息,其中,所述特征信息包括:所述文本信息的属性特征,所述文本信息相对预设词库的匹配特征;
获取所述文本信息相对预设词库的匹配特征,包括:对所述文本信息进行切分处理,得到多个分词;统计所述多个分词中属于菜品词典单词的单词个数,统计所述单词个数与总分词的单词比值,以及判断所述文本信息的最后一个分词是否为菜名并得到判断结果,其中,所述匹配特征包括:所述单词个数,所述单词比值,以及所述判断结果;
计算所述文本信息的特征值,使用二分类模型基于所述特征信息的特征值识别所述文本信息中的菜名,所述特征值与所述文本信息的属性信息和所述文本信息相对预设词库的匹配特征相关联。
2.根据权利要求1所述的方法,其特征在于,获取所述文本信息的特征信息包括:
以所述文本信息为关键字在预设菜品库中检索匹配的多个候选菜品;
分别计算所述文本信息与所述多个候选菜品的编辑距离;
统计编辑距离落在一个或多个预定范围的记录条数,其中,所述匹配特征包括所述记录条数。
3.根据权利要求1所述的方法,其特征在于,获取所述文本信息的特征信息包括:
确定与所述文本信息对应的原始字符串;
计算所述原始字符串的字符串长度和所述原始字符串的语言模型计算概率,其中,所述属性特征包括所述字符串长度和所述语言模型计算概率,所述语言模型计算概率包括最大三元tri-gram语言模型计算概率和最小三元tri-gram语言模型计算概率。
4.根据权利要求1所述的方法,其特征在于,根据预定规则识别所述文本信息是否为菜名包括以下至少之一:
通过白名单识别所述文本信息是否为菜名;
通过关键字识别所述文本信息是否为菜名;
通过字符串长度识别所述文本信息是否为菜名;
通过字符类型识别所述文本信息是否为菜名。
5.根据权利要求4所述的方法,其特征在于,通过白名单识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断预设白名单列表是否包括所述原始字符串;
在所述预设白名单列表包括所述原始字符串时,确定识别出所述文本信息,在所述预设白名单列表不包括所述原始字符串时,确定未识别出所述文本信息。
6.根据权利要求4所述的方法,其特征在于,通过关键字识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断所述原始字符串是否包括预设关键字集合的任一关键字;
在所述原始字符串包括所述预设关键字集合的任一关键字时,确定识别出所述文本信息,在所述原始字符串不包括所述预设关键字集合的任一关键字时,确定未识别出所述文本信息。
7.根据权利要求4所述的方法,其特征在于,通过字符串长度识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断所述原始字符串的长度是否大于预设长度;
在所述原始字符串的长度小于或等于所述预设长度时,确定未识别出所述文本信息,在所述原始字符串的长度大于所述预设长度时,确定识别出所述文本信息不是菜名。
8.根据权利要求4所述的方法,其特征在于,通过字符类型识别所述文本信息是否为菜名包括:
解析所述文本信息,得到与所述文本信息对应的原始字符串;
判断所述原始字符串中是否包括指定类型的字符;
在所述原始字符串中包括所述指定类型的字符时,确定识别出所述文本信息,在所述原始字符串中不包括所述指定类型的字符时,确定未识别出所述文本信息。
9.根据权利要求1所述的方法,其特征在于,使用二分类模型基于所述特征信息识别所述文本信息中的菜名包括:
计算所述特征信息的特征值;
将所述特征值输入所述二分类模型,决策出所述文本信息的识别结果,其中,所述识别结果用于指示所述文本信息是否为菜名。
10.一种识别菜名的装置,其特征在于,包括:
接收模块,用于接收光学字符识别OCR模块响应目标图片输出的文本信息;
第一识别模块,用于根据预定规则识别所述文本信息是否为菜名;
获取模块,用于在所述预定规则未识别出所述文本信息时,获取所述文本信息的特征信息,其中,所述特征信息包括:所述文本信息的属性特征,所述文本信息相对预设词库的匹配特征;
第二识别模块,用于计算所述文本信息的特征值,使用二分类模型基于所述特征信息的特征值识别所述文本信息,所述特征值与所述文本信息的属性信息和所述文本信息相对预设词库的匹配特征相关联;
其中,所述获取模块包括:
分词单元,用于对所述文本信息进行切分处理,得到多个分词;
处理单元,用于统计所述多个分词中属于菜品词典单词的单词个数,统计所述单词个数与总分词的单词比值,以及判断所述文本信息的最后一个分词是否为菜名并得到判断结果,其中,所述匹配特征包括:所述单词个数,所述单词比值,以及所述判断结果。
11.根据权利要求10所述的装置,其特征在于,所述获取模块包括:
检索单元,用于以所述文本信息为关键字在预设菜品库中检索匹配的多个候选菜品;
第一计算单元,用于分别计算所述文本信息与所述多个候选菜品的编辑距离;
统计单元,用于统计编辑距离落在一个或多个预定范围的记录条数,其中,所述匹配特征包括所述记录条数。
12.根据权利要求10所述的装置,其特征在于,所述获取模块包括:
确定单元,用于确定与所述文本信息对应的原始字符串;
第二计算单元,用于计算所述原始字符串的字符串长度和所述原始字符串的语言模型计算概率,其中,所述属性特征包括所述字符串长度和所述语言模型计算概率,所述语言模型计算概率包括最大三元tri-gram语言模型计算概率和最小三元tri-gram语言模型计算概率。
13.根据权利要求10所述的装置,其特征在于,所述第一识别模块包括以下至少之一:
第一识别单元,用于通过白名单识别所述文本信息是否为菜名;
第二识别单元,用于通过关键字识别所述文本信息是否为菜名;
第三识别单元,用于通过字符串长度识别所述文本信息是否为菜名;
第四识别单元,用于通过字符类型识别所述文本信息是否为菜名。
14.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至9任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至9任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910059330.0A CN110110577B (zh) | 2019-01-22 | 2019-01-22 | 识别菜名的方法及装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910059330.0A CN110110577B (zh) | 2019-01-22 | 2019-01-22 | 识别菜名的方法及装置、存储介质、电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110110577A CN110110577A (zh) | 2019-08-09 |
CN110110577B true CN110110577B (zh) | 2020-11-10 |
Family
ID=67483675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910059330.0A Active CN110110577B (zh) | 2019-01-22 | 2019-01-22 | 识别菜名的方法及装置、存储介质、电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110577B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516125B (zh) * | 2019-08-28 | 2020-05-08 | 拉扎斯网络科技(上海)有限公司 | 识别异常字符串的方法、装置、设备及可读存储介质 |
CN110688845B (zh) * | 2019-10-10 | 2024-02-13 | 汉海信息技术(上海)有限公司 | 菜谱类内容的识别方法、装置、终端及可读存储介质 |
CN111192346B (zh) * | 2019-12-26 | 2024-02-13 | 科大讯飞股份有限公司 | 电子菜单生成方法、装置和设备 |
CN111444345A (zh) * | 2020-03-30 | 2020-07-24 | 拉扎斯网络科技(上海)有限公司 | 菜品名称分类方法及装置 |
CN111985486A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 图像信息的识别方法及装置、存储介质、计算机设备 |
CN112084979B (zh) * | 2020-09-14 | 2023-07-11 | 武汉轻工大学 | 食品成分识别方法、装置、设备及存储介质 |
CN112507215A (zh) * | 2020-12-01 | 2021-03-16 | 深圳市移卡科技有限公司 | 资源列表的形成方法 |
CN113362151B (zh) * | 2021-06-30 | 2023-07-11 | 平安银行股份有限公司 | 金融业务的数据处理方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256474A (zh) * | 2018-01-17 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 用于识别菜品的方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010067120A (ja) * | 2008-09-12 | 2010-03-25 | Seiko Epson Corp | メニュー端末、オーダリングシステムおよびメニュー端末の表示制御方法 |
CN101770569A (zh) * | 2008-12-31 | 2010-07-07 | 汉王科技股份有限公司 | 基于ocr的菜名识别方法 |
CN101464896B (zh) * | 2009-01-23 | 2010-08-11 | 安徽科大讯飞信息科技股份有限公司 | 语音模糊检索方法及装置 |
CN104199840B (zh) * | 2014-08-05 | 2018-03-06 | 杭州安恒信息技术有限公司 | 基于统计模型的智能地名识别技术 |
CN106383862B (zh) * | 2016-08-31 | 2019-12-31 | 杭州云片网络科技有限公司 | 一种违规短信检测方法及系统 |
CN107608959A (zh) * | 2017-09-08 | 2018-01-19 | 电子科技大学 | 一种英文社交媒体短文本地名识别方法 |
-
2019
- 2019-01-22 CN CN201910059330.0A patent/CN110110577B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256474A (zh) * | 2018-01-17 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 用于识别菜品的方法和装置 |
Non-Patent Citations (1)
Title |
---|
Mining the Blogosphere to Generate Cuisine Hotspot Maps[J]. Journal of Digital Information Management;Shih C C 等;《Journal of Digital Information Management》;20101231;第396-401页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110110577A (zh) | 2019-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110577B (zh) | 识别菜名的方法及装置、存储介质、电子装置 | |
CN109918485B (zh) | 语音识别菜品的方法及装置、存储介质、电子装置 | |
CN110502608B (zh) | 基于知识图谱的人机对话方法及人机对话装置 | |
CN110555372A (zh) | 数据录入方法、装置、设备及存储介质 | |
CN111738011A (zh) | 违规文本的识别方法及装置、存储介质、电子装置 | |
CN108038161A (zh) | 基于相册的信息推荐方法、装置及计算设备 | |
CN109145110B (zh) | 标签查询方法和装置 | |
CN111522901B (zh) | 文本中地址信息的处理方法及装置 | |
CN108734159B (zh) | 一种图像中敏感信息的检测方法及系统 | |
CN112732893B (zh) | 文本信息的提取方法和装置、存储介质和电子设备 | |
CN111680506A (zh) | 数据库表的外键映射方法、装置、电子设备和存储介质 | |
CN111563382A (zh) | 文本信息的获取方法、装置、存储介质及计算机设备 | |
CN111651674B (zh) | 双向搜索方法、装置及电子设备 | |
CN113268615A (zh) | 资源标签生成方法、装置、电子设备及存储介质 | |
CN111178349A (zh) | 一种图像识别方法、装置、设备及存储介质 | |
CN110532449A (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
CN110795942A (zh) | 基于语义识别的关键词确定方法、装置和存储介质 | |
CN111460888B (zh) | 基于机器学习的物品识别方法及装置 | |
CN109472025B (zh) | 菜品名称提取方法及装置 | |
CN107577667B (zh) | 一种实体词处理方法和装置 | |
CN110941713B (zh) | 基于主题模型的自优化金融资讯版块分类方法 | |
CN111782970A (zh) | 一种数据分析方法和装置 | |
CN110705258A (zh) | 文本实体识别方法及装置 | |
CN107609094B (zh) | 数据消歧方法、装置及计算机设备 | |
CN113627509B (zh) | 数据分类方法、装置、计算机设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |