CN101751566B - 一种基于手持设备的菜谱识别及注解方法和装置 - Google Patents

一种基于手持设备的菜谱识别及注解方法和装置 Download PDF

Info

Publication number
CN101751566B
CN101751566B CN200810239539.7A CN200810239539A CN101751566B CN 101751566 B CN101751566 B CN 101751566B CN 200810239539 A CN200810239539 A CN 200810239539A CN 101751566 B CN101751566 B CN 101751566B
Authority
CN
China
Prior art keywords
dish
name
identification
menu
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200810239539.7A
Other languages
English (en)
Other versions
CN101751566A (zh
Inventor
朱军民
王琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwang Technology Co Ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN200810239539.7A priority Critical patent/CN101751566B/zh
Publication of CN101751566A publication Critical patent/CN101751566A/zh
Application granted granted Critical
Publication of CN101751566B publication Critical patent/CN101751566B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种基于手持设备的菜谱识别及注解方法和装置,手持设备至少装设有图像获取装置以及OCR识别引擎,用于对图像获取装置拍摄的菜谱图像进行识别及注解,该方法至少包括以下步骤:a.定位菜谱图像中需要识别的菜名区域;b.通过OCR识别引擎识别需要识别的菜名,得到需要识别的菜名的文字编码流,需要识别的菜名位于需要识别的菜名区域内;c.根据文字编码流,获取与需要识别的菜名相关的信息。本发明通过手持设备的图像获取装置进行图像采集,而后OCR识别引擎进行菜谱字符的光学字符识别,最终输出跟需要识别的菜名相关的信息。

Description

一种基于手持设备的菜谱识别及注解方法和装置
技术领域
本发明涉及光学字符识别(Optical Character Recognition,以下简称:OCR)技术领域,尤其涉及一种基于手持设备的菜谱识别及注解方法和装置。
背景技术
具有拍摄功能的手持设备如拍照手机现在已经普及,但是基于手持设备摄像头的应用还是很贫乏,没有发挥出应有的作用。目前OCR技术已经非常成熟,但是其应用还是局限于扫描仪图像的识别,在手持设备上的实际应用还不是很多。结合手持设备摄像头、OCR和特定知识库的应用几乎没有。平是我们在用餐的时候,特别是一些外国朋友,如果他们能够通过他们的手持设备能够知道他们要点的菜一些信息如:翻译菜名、制作原料、制作方法、相关典故等,他们会了解更多,选择更好。
发明内容
本发明的目的是提供一种基于手持设备的菜谱识别及注解方法和装置,用以克服OCR技术并未应用到手持设备上来方便人们了解菜谱的缺陷,实现对菜谱的识别和注解,方便广大美食爱者了解和选择他们的佳肴。
为实现上述目的,本发明提供了一种基于手持设备的菜谱识别及注解方法,所述手持设备至少装设有图像获取装置以及OCR识别引擎,用于对所述图像获取装置拍摄的菜谱图像进行识别及注解,所述方法至少包括以下步骤:
a.定位所述菜谱图像中需要识别的菜名区域;
b.通过所述OCR识别引擎识别需要识别的菜名,得到所述需要识别的菜名的文字编码流,所述需要识别的菜名位于所述需要识别的菜名区域内;
c.根据所述文字编码流,获取与所述需要识别的菜名相关的信息。
优选地,在步骤a前还包括对所述菜谱图像进行清晰度判断的步骤:利用菜谱图像的平均边缘强度作为检测值,当平均边缘强度小于预先设定的阈值时,则图像模糊,手持设备通过装设的所述图像获取装置进行重新拍摄。
优选地,所述步骤a包括:用户指定需要识别的菜名的粗略位置,得到一个或者两个坐标点;以所述一个或者两个坐标点为初始点进行上下左右条件扩展,得到一个仅包含所述需要识别的菜名的外接矩形区域。
优选地,所述步骤c包括:通过所述文字编码流在菜谱数据库中检索与所述需要识别的菜名相关的信息;或者,通过所述文字编码流在互联网上检索与所述需要识别的菜名相关的信息。
优选地,所述步骤c后面还包括步骤d:在所述手持设备上显示与所述需要识别的菜名相关的信息。
为实现上述目的,本发明还提供了一种基于手持设备的菜谱识别及注解装置,包括至少装设有OCR识别引擎和图像获取装置的手持设备,以及模块a、b和c;其中模块:
a.定位所述图像获取装置拍摄的菜谱图像中需要识别的菜名区域;
b.通过所述OCR识别引擎识别需要识别的菜名,得到所述需要识别的菜名的文字编码流,所述需要识别的菜名位于所述需要识别的菜名区域内;
c.根据所述文字编码流,获取与所述需要识别的菜名相关的信息。
优选地,在模块a前还包括对菜谱图像进行清晰度判断的模块:利用菜谱图像的平均边缘强度作为检测值,当平均边缘强度小于预先设定的阈值时,则图像模糊,所述手持设备通过装设的图像获取装置进行重新拍摄。
本发明提出了一种OCR新的应用方向,先用图像获取装置进行图像采集,而后OCR引擎进行菜谱字符的光学字符识别,再加上菜谱知识库的菜谱识别及注解的应用方法,根据识别出的菜名,检索菜谱字典数据库或互联网,输出跟该菜相关的信息例如:翻译名字,制作材料,制作装置,烹制方法,相关典故等等。本发明能够很好的解决菜谱识别和注解的问题,方便广大美食爱者了解和选择他们的佳肴。
附图说明
图1为本发明的菜谱识别及注解方法的流程图;
图2至图5为本发明的一个实施例中对手机所拍摄的菜谱进行识别及注解的示意图。
具体实施方式
以下结合附图对本发明的方法进行详细说明。应该说明的是,本发明所说的手持设备至少设有图像获取装置、以及OCR识别引擎。在某些应用中,本发明所说的手持设备还应该装有可以无线上网的装置。以下以手机为例说明在手持设备上使用的本发明的菜谱识别及注解方法和装置,应该注意的是所谓手持设备可包括但不限于手机和PDA等。如图1所示,本发明的菜谱识别及注解方法包括的主要步骤:
步骤10,菜谱图像拍摄:通过手机摄像头拍摄得到待处理的菜谱图像;这里,手机的摄像头作为图像获取装置。
步骤20,图像清晰度判断:手机拍摄的菜谱图像,有时候由于手抖动,导致图像很虚,字符模糊,达不到OCR识别的要求。所以对拍摄的菜谱图像进行清晰判定,以确定是否进行下一步处理。在这里我们利用菜谱图像的平均边缘强度作为检测值,当平均边缘强度小于预先设定的阈值T时,我们认为菜谱图像模糊,需要利用作为图像获取装置的摄像头进行重新拍摄。这里的平均边缘强度是指由边缘算法如Sobel、Roberts算法等,作用于输入图像所得的边缘图像中所有边缘值的平均量。例如检测到的图像的平均边缘强度为30,预先设定的阈值为60,则认定输入的图像为模糊图像;若检测到的平均边缘强度为100,则认定输入的图像为清晰图像;如图2所示为本发明的一个实施例中手机所拍摄的菜谱图像。
步骤30,用户指定识别菜名区域:当拍摄的菜谱图像显示在手机交互界面上,用户通过交互操作,指定需要识别的菜名的粗略位置,通过这一步我们得到图像中的下一坐标信息。交互方式如:可以用笔点击菜名矩形内的任何一点,我们可以得到用户兴趣区域内的一个坐标点;也可以画一个包含菜名的矩形框,我们可以得到用户兴趣区域内的两个坐标点。如图2中位于“家常豆腐”字样上方的十字光标就是用户指定需要识别的菜名;也可以是如图3中矩形框,就是用户指定的需要识别的菜名区域。
步骤40,指定识别区域智能调整:用户交互的时候,不可能定位到需要处理菜名的精确位置,只是给出一个或者两个坐标点。我们通过这些坐标点,智能地定位到需要处理的菜名字符区域。以用户给定一个坐标点为例,先求边缘图像,而后进行膨胀,然后以该坐标为初始点进行上下左右条件扩展,也就是距离在一定范围内的边缘点为有效边缘点,进行扩展,否则不进行扩展,得到一个仅包含需要识别的菜名的外接矩形区域,即为需要识别的菜名区域内,如图4所示。
步骤50,调用光学字符识别OCR引擎:将定位到的菜名图像文字区域,送入OCR识别引擎进行处理,得到需要识别的菜名的文字编码流,需要识别的菜名位于需要识别的菜名区域内。
步骤60,检索菜名相关信息:在一个实施例中,本发明的手机装设有菜谱数据库,通过识别出来的字符文字编码流,可以检索菜谱数据库,找到与此菜相关的信息,也可以通过互联网查找相关的信息。由于OCR识别率不可能达到100%,所以在一个优选实施例中,可以采用支持模糊匹配的检索方法,以提高检索的命中率。
步骤70,显示相关信息:将检索得到的相关信息如:翻译菜名、相关典故、制作方法、制作装置、制作原料等,显示到手机的用户界面上,如图5所示的实施例中,这部分信息是显示在菜谱图像的下方,在其他实施例中也可显示在其他位置。
应用实例:用户拍摄菜谱图像,然后点选识别区域,识别区智能定位,OCR引擎识别菜名,在本机数据库进行模糊查找和匹配,将检索到的信息反馈给用户;OCR识别引擎识别菜名以后,如果本机无法检索或者用户想了解更多,可以启动网络功能,通过网络查找更多的信息反馈给用。
本发明实施例还提供了一种基于手持设备的菜谱识别及注解装置,该装置包括至少装设有OCR识别引擎的手持设备,以及模块a、b和c;其中模块:
a.定位图像获取装置拍摄的菜谱图像中需要识别的菜名区域;
b.通过OCR识别引擎识别需要识别的菜名,得到菜名的文字编码流,需要识别的菜名位于需要识别的菜名区域内;这里,模块b与OCR识别引擎通信连接,
c.根据文字编码流,获取与需要识别的菜名相关的信息。
进一步地,在模块a前还可以包括对菜谱图像进行清晰度判断的模块:利用菜谱图像的平均边缘强度作为检测值,当平均边缘强度小于预先设定的阈值T时,则图像模糊,此时,手持设备通过装设的图像获取装置进行重新拍摄。
进一步地,模块a可以包括:用户通过交互操作,指定需要识别的菜名的粗略位置,得到一个或者两个坐标点;以坐标为初始点进行上下左右条件扩展,得到一个仅包含需要识别的菜名的外接矩形区域。
进一步地,模块c可以包括:通过文字编码流在手持设备的菜谱数据库中检索与需要识别的菜名相关的信息;或者:通过文字编码流在互联网上检索与需要识别的菜名相关的信息。
具体地,与需要识别的菜名相关的信息可以包括菜的翻译菜名、相关典故、制作装置、制作原料。
进一步地,模块c后面还可以包括模块d:显示与需要识别的菜名相关的信息。
具体地,模块d可以包括在手持设备用户界面上显示与需要识别的菜名相关的信息。
具体地,手持设备可以包括手机或PDA。
本发明的上述实施例中,通过手持设备的图像获取装置进行图像采集,而后OCR识别引擎进行菜谱字符的光学字符识别,再加上菜谱知识库或者互联网的菜谱识别及注解的应用方法,根据识别出的菜名,检索菜谱字典数据库,输出跟该菜相关的信息例如:翻译名字,制作材料,制作装置,烹制方法,相关典故等等。本发明能够很好的解决菜谱识别和注解的问题,方便广大美食爱者了解和选择他们的佳肴。
应该注意的是上述实施例是示例而非限制本发明,本领域技术人员将能够设计很多替代实施例而不脱离附后的权利要求书的范围。

Claims (6)

1.一种基于手持设备的菜谱识别及注解方法,所述手持设备至少装设有图像获取装置以及OCR识别引擎,用于对所述图像获取装置拍摄的菜谱图像进行识别及注解,其特征是:所述方法至少包括以下步骤:
a.定位所述菜谱图像中需要识别的菜名区域,用户指定需要识别的菜名的粗略位置,得到一个或者两个坐标点;对所述一个或者两个坐标点求边缘图像,进行膨胀后,以所述一个或者两个坐标点为初始点进行上下左右条件扩展,以距离所述初始点在一定范围内的边缘点为有效边缘点,进行扩展,否则不进行扩展,得到一个仅包含所述需要识别的菜名的外接矩形区域;
b.通过所述OCR识别引擎识别需要识别的菜名,得到所述需要识别的菜名的文字编码流,所述需要识别的菜名位于所述需要识别的菜名区域内;
c.根据所述文字编码流,获取与所述需要识别的菜名相关的信息;通过所述文字编码流在菜谱数据库中检索与所述需要识别的菜名相关的信息;包括菜的翻译菜名、相关典故、制作方法和制作原料;
d.在所述菜谱图像的下方分别显示所述识别的菜名和所述与识别的菜名相关的信息。
2.如权利要求1所述的方法,其特征是:在步骤a前还包括对菜谱图像进行清晰度判断的步骤:利用菜谱图像的平均边缘强度作为检测值,当平均边缘强度小于预先设定的阈值时,则图像模糊,手持设备通过装设的所述图像获取装置进行重新拍摄。
3.如权利要求1所述的方法,其特征是:所述步骤c包括:通过所述文字编码流在互联网上检索与所述需要识别的菜名相关的信息。
4.如权利要求1所述的方法,其特征是:所述步骤c后面还包括步骤d:在所述手持设备上显示与所述需要识别的菜名相关的信息。
5.一种基于手持设备的菜谱识别及注解装置,其特征是包括至少装设有OCR识别引擎和图像获取装置的手持设备,以及模块a、b、c和d;其中模块:
a.定位所述图像获取装置拍摄的菜谱图像中需要识别的菜名区域,用户指定需要识别的菜名的粗略位置,得到一个或者两个坐标点;对所述一个或者两个坐标点求边缘图像,进行膨胀后,以所述一个或者两个坐标点为初始点进行上下左右条件扩展,以距离所述初始点在一定范围内的边缘点为有效边缘点,进行扩展,否则不进行扩展,得到一个仅包含所述需要识别的菜名的外接矩形区域;
b.通过所述OCR识别引擎识别需要识别的菜名,得到所述菜名的文字编码流,所述需要识别的菜名位于所述需要识别的菜名区域内;
c.根据所述文字编码流,获取与所述需要识别的菜名相关的信息;通过所述文字编码流在菜谱数据库中检索与所述需要识别的菜名相关的信息;包括菜的翻译菜名、相关典故、制作方法和制作原料;
d.在所述菜谱图像的下方分别显示所述识别的菜名和所述与识别的菜名相关的信息。
6.如权利要求5所述的装置,其特征是:在模块a前还包括对菜谱图像进行清晰度判断的模块:利用菜谱图像的平均边缘强度作为检测值,当平均边缘强度小于预先设定的阈值时,则图像模糊,所述手持设备通过装设的图像获取装置进行重新拍摄。
CN200810239539.7A 2008-12-12 2008-12-12 一种基于手持设备的菜谱识别及注解方法和装置 Active CN101751566B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810239539.7A CN101751566B (zh) 2008-12-12 2008-12-12 一种基于手持设备的菜谱识别及注解方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810239539.7A CN101751566B (zh) 2008-12-12 2008-12-12 一种基于手持设备的菜谱识别及注解方法和装置

Publications (2)

Publication Number Publication Date
CN101751566A CN101751566A (zh) 2010-06-23
CN101751566B true CN101751566B (zh) 2014-02-12

Family

ID=42478528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810239539.7A Active CN101751566B (zh) 2008-12-12 2008-12-12 一种基于手持设备的菜谱识别及注解方法和装置

Country Status (1)

Country Link
CN (1) CN101751566B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101860341B1 (ko) 2011-09-09 2018-05-24 엘지전자 주식회사 이동 단말기 및 이의 제어방법
CN102855480A (zh) * 2012-08-07 2013-01-02 北京百度网讯科技有限公司 一种图像文字识别方法和装置
CN102831200A (zh) * 2012-08-07 2012-12-19 北京百度网讯科技有限公司 一种基于图像文字识别的商品推送方法和装置
CN104182780B (zh) * 2014-08-21 2018-07-03 五八同城信息技术有限公司 一种自动生成就餐点评的方法及终端设备
WO2017120736A1 (zh) * 2016-01-11 2017-07-20 程强 餐饮信息采集方法及系统
CN105975553B (zh) * 2016-04-29 2020-01-03 广东小天才科技有限公司 拍照搜索的方法及装置
CN105897735A (zh) * 2016-05-13 2016-08-24 李玉婷 一种智能识别方法
CN107480145A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种基于互联网的多语菜单翻译方法
CN107862018B (zh) * 2017-10-30 2020-03-06 珠海格力电器股份有限公司 食材烹饪方法的推荐方法及装置
CN109871432A (zh) * 2019-02-19 2019-06-11 广东小天才科技有限公司 查字词的方法及装置、终端设备、计算机可读存储介质
CN110245356A (zh) * 2019-06-24 2019-09-17 付金龙 离线翻译机

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1047075A2 (en) * 1999-04-23 2000-10-25 Sony Corporation Information processing apparatus, information managing method and medium
CN1804858A (zh) * 2005-01-10 2006-07-19 赵国成 一种用于带摄像装置的移动终端上实现ocr功能的新型辅助定位技术
CN1885291A (zh) * 2005-06-20 2006-12-27 三星电子株式会社 用于向用户提供图像相关信息的方法和系统及其移动终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1047075A2 (en) * 1999-04-23 2000-10-25 Sony Corporation Information processing apparatus, information managing method and medium
CN1804858A (zh) * 2005-01-10 2006-07-19 赵国成 一种用于带摄像装置的移动终端上实现ocr功能的新型辅助定位技术
CN1885291A (zh) * 2005-06-20 2006-12-27 三星电子株式会社 用于向用户提供图像相关信息的方法和系统及其移动终端

Also Published As

Publication number Publication date
CN101751566A (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
CN101751566B (zh) 一种基于手持设备的菜谱识别及注解方法和装置
US10706887B2 (en) Apparatus and method for displaying times at which an object appears in frames of video
US9953216B2 (en) Systems and methods for performing actions in response to user gestures in captured images
US10438080B2 (en) Handwriting recognition method and apparatus
US9104915B2 (en) Methods and systems for content processing
CN110443330B (zh) 一种扫码方法、装置、移动终端以及存储介质
US20110261213A1 (en) Real time video process control using gestures
CN112689201B (zh) 弹幕信息识别方法、显示方法、服务器及电子设备
CN107818180A (zh) 视频关联方法、视频显示方法、装置及存储介质
CN108616448B (zh) 一种信息分享的路径推荐方法及移动终端
CN105868282A (zh) 聋哑人进行信息交流的方法、装置及智能终端
CN103197825A (zh) 图像处理装置、显示控制方法和程序
CN105808542B (zh) 信息处理方法以及信息处理装置
US20130188836A1 (en) Method and apparatus for providing hand detection
CN111259907B (zh) 内容识别方法、装置以及电子设备
CN107943842A (zh) 一种照片标签生成方法、移动终端
JP4668345B1 (ja) 情報処理装置、および情報処理装置の制御方法
CN111382598B (zh) 一种识别方法、装置和电子设备
CN111383298A (zh) 一种思维导图的转换方法及装置
CN111353422B (zh) 信息提取方法、装置及电子设备
CN109656658B (zh) 一种编辑对象处理方法、设备及计算机可读存储介质
CN102665122B (zh) 电视机遥控装置、电视机及实现快速定位的遥控方法
CN104881149B (zh) 基于视频流的输入方法及装置
CN118377405A (zh) 显示方法、智能终端及存储介质
CN112714333A (zh) 多媒体数据处理方法和电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant