CN108256523B - 基于移动终端的识别方法、装置及计算机可读存储介质 - Google Patents

基于移动终端的识别方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN108256523B
CN108256523B CN201810025502.8A CN201810025502A CN108256523B CN 108256523 B CN108256523 B CN 108256523B CN 201810025502 A CN201810025502 A CN 201810025502A CN 108256523 B CN108256523 B CN 108256523B
Authority
CN
China
Prior art keywords
image
characters
mobile terminal
preset
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810025502.8A
Other languages
English (en)
Other versions
CN108256523A (zh
Inventor
何思源
段小军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chuanying Information Technology Co Ltd
Original Assignee
Shanghai Spreadrise Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Spreadrise Technologies Co Ltd filed Critical Shanghai Spreadrise Technologies Co Ltd
Priority to CN201810025502.8A priority Critical patent/CN108256523B/zh
Publication of CN108256523A publication Critical patent/CN108256523A/zh
Application granted granted Critical
Publication of CN108256523B publication Critical patent/CN108256523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种基于移动终端的识别方法,包括以下步骤:在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字。本发明还公开了一种基于移动终端的识别装置及计算机可读存储介质。本发明实现了直接通过将摄像机镜头内的图像中图像块与预设图像进行对比,快速获取图像块对应的文字,从而提高了识别效率,并且该识别方式适用范围广。

Description

基于移动终端的识别方法、装置及计算机可读存储介质
技术领域
本发明涉及移动终端技术领域,尤其涉及一种基于移动终端的识别方法、装置及计算机可读存储介质。
背景技术
随着电子移动终端的普及,人们越来越习惯使用移动终端,移动终端app(Application应用程序)基本上都具有扫码功能,可以扫描二维码、条形码等,扫描二维码可以用来支付,扫描条形码可以显示商品内容、价格等。微信还能扫描封面,例如书本,就可以识别该书在网店内的相关信息,这种是利用了手机摄像头进行的即时识别处理,但该识别方式只能对二维码进行识别,不能对文字进行识别,或者,有些移动终端通过文字识别软件对图片上的文字进行识别,当该识别方式只能对图片进行处理从而识别文字,使得移动终端文字识别效率低、适用范围窄。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于移动终端的识别方法、装置及计算机可读存储介质,旨在解决移动终端文字识别效率低、适用范围窄的技术问题。
为实现上述目的,本发明提供一种基于移动终端的识别方法,所述方法包括以下步骤:
在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;
提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字。
优选地,所述提取所述图像中的文字对应的图像块的步骤包括:
获取所述图像中的文字的属性信息;
基于所述属性信息生成识别框;
基于所述识别框获取所述图像块。
优选地,所述将所述图像块与预设图像进行对比的步骤包括:
获取所述图像块的第一像素值;
将所述第一像素值与所述预设图像中的第二像素值进行对比,获取所述第一像素值与第二像素值的差值;
基于所述差值计算所述图像块与所述预设图像的相似度。
优选地,所述确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像的步骤包括:
确定所述常用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述常用文字图像中不存在与所述图像块相似度大于第一预设阈值的目标图像时,确定所述备用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像。
优选地,所述获取所述目标图像对应的文字的步骤之后,所述基于移动终端的识别方法还包括:
当所述文字为英文字母时,将识别到的所述英文字母组成单词。
优选地,所述获取所述目标图像对应的文字的步骤之后,所述基于移动终端的识别方法还包括:
当获取到两个或多个文字时,根据所述文字在语句中上下文的语义确定正确文字。
优选地,所述基于移动终端的识别方法还包括:
当识别的文字为不规则文字时,将所述不规则文字对应的图像块与预设图像进行对比,计算预设图像与所述图像块的相似度;
确定预设图像与所述图像块的相似度中最高相似度是否小于第二预设阈值;
当所述最高相似度小于第二预设阈值时,存储所述最高相似度对应图像的文字,并将所述最高相似度对应图像的文字添加特殊性标志。
此外,为实现上述目的,本发明还提供一种基于移动终端的识别装置,基于移动终端的识别装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于移动终端的识别程序,所述基于移动终端的识别程序被所述处理器执行时实现上述任一项基于移动终端的识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于移动终端的识别程序,所述基于移动终端的识别程序被处理器执行时实现上述任一项基于移动终端的识别方法的步骤。
本发明通过在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字。本发明还公开了一种基于移动终端的识别装置及计算机可读存储介质。本发明实现了直接通过将摄像机镜头内的图像中图像块与预设图像进行对比,快速获取图像块对应的文字,从而提高了识别效率,并且该识别方式适用范围广。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中基于移动终端的识别装置所属终端的结构示意图;
图2为本发明基于移动终端的识别方法第一实施例的流程示意图;
图3为本发明基于移动终端的识别方法第二实施例中提取所述图像中的文字对应的图像块步骤的细化流程示意图;
图4为本发明基于移动终端的识别方法第三实施例中将所述图像块与预设图像进行对比步骤的细化流程示意图;
图5为本发明基于移动终端的识别方法第四实施例中所述确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像步骤的的细化流程示意图;
图6为本发明基于移动终端的识别方法第五实施例的流程示意图;
图7为本发明基于移动终端的识别方法第六实施例的流程示意图;
图8为本发明基于移动终端的识别方法第七实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1是本发明实施例方案涉及的硬件运行环境中基于移动终端的识别装置所属终端的结构示意图;
本发明实施例终端可以是PC。如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作服务器、网络通信模块、用户接口模块以及基于移动终端的识别程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于移动终端的识别程序。
在本实施例中,基于移动终端的识别装置包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的基于移动终端的识别程序,其中,处理器1001调用存储器1005中存储的基于移动终端的识别程序时,执行以下操作:
在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;
提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字。
进一步地,处理器1001可以调用存储器1005中存储的基于移动终端的识别程序,还执行以下操作:
获取所述图像中的文字的属性信息;
基于所述属性信息生成识别框;
基于所述识别框获取所述图像块。
进一步地,处理器1001可以调用存储器1005中存储的基于移动终端的识别程序,还执行以下操作:
获取所述图像块的第一像素值;
将所述第一像素值与所述预设图像中的第二像素值进行对比,获取所述第一像素值与第二像素值的差值;
基于所述差值计算所述图像块与所述预设图像的相似度。
进一步地,处理器1001可以调用存储器1005中存储的基于移动终端的识别程序,还执行以下操作:
确定所述常用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述常用文字图像中不存在与所述图像块相似度大于第一预设阈值的目标图像时,确定所述备用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像。
进一步地,处理器1001可以调用存储器1005中存储的基于移动终端的识别程序,还执行以下操作:
当所述文字为英文字母时,将识别到的所述英文字母组成单词。
进一步地,处理器1001可以调用存储器1005中存储的基于移动终端的识别程序,还执行以下操作:
当获取到两个或多个文字时,根据所述文字在语句中上下文的语义确定正确文字。
进一步地,处理器1001可以调用存储器1005中存储的基于移动终端的识别程序,还执行以下操作:
当识别的文字为不规则文字时,将所述不规则文字对应的图像块与预设图像进行对比,计算预设图像与所述图像块的相似度;
确定预设图像与所述图像块的相似度中最高相似度是否小于第二预设阈值;
当所述最高相似度小于第二预设阈值时,存储所述最高相似度对应图像的文字,并将所述最高相似度对应图像的文字添加特殊性标志。
本发明进一步提供一种数据处理方法。参照图2,图2为本发明基于移动终端的识别方法第一实施例的流程示意图。
在本实施例中,该基于移动终端的识别方法包括以下步骤:
步骤S10,在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;
在本实施例中,文字包括汉字、外国文字、标点符号,用户可以通过点击按钮或者语音输入等操作触发文字识别指令,例如,用户在微信应用程序界面点击扫一扫功能,在扫码功能中可以选择文字识别选项,当选择文字识别选项时,移动终端打开摄像机对当前摄像头中的内容进行识别。一般来说,移动终端通过摄像头可以对二维码进行识别,获取二维码中对应的内容,进入相关页面,不能对文字进行识别,而本实施例能够获取当前摄像机镜头内的图像,及时识别扫描框内的文字。
进一步地,也可以在摄像头开启后在初始状态界面中选择文字识别,摄像头对镜头内的内容进行识别处理,例如,用户通过直接点击桌面摄像机图标或者手势滑动屏幕等操作打开摄像机,在摄像机开启后的初始界面选择文字识别选项,点击该选项按钮触发文字识别指令,获取摄像机镜头内的图像。
步骤S20,提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
在本实施例中,该预设图像是指移动终端存储的图像,包括文字对应的二值图像,在移动终端中存储着规范汉字表,包括多种字体,例如,楷体、行书、宋体等,当然,也可以存储着标点符号、英文等其它外语字典表及词典表,对于这些汉字、外国文字都有对应的二值图像,摄像头对镜头内的文字进行识别处理,提取图像中的文字对应的图像块,在提取图像中的文字的图像块时,将该图像块与二值图像进行对比,预设图像分为常用图像与备用图像,具体地,首先将图像块与常用图像进行对比,确定常用图像中是否存在与提取到的图像块相似度大于第一预设阈值的目标图像,若常用图像中不存在与提取到的图像块相似度大于第一预设阈值的目标图像时,再将该图像块与备用图像进行对比,该第一预设阈值由技术人员进行设置,例如,第一预设阈值为相似度百分之九十五,则获取与该图像块相似度大于百分之九十五的目标图像,该目标图像是指与该图像块相似度大于第一预设阈值的图像。
步骤S30,当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字。
在本实施例中,当在预设图像中找到与图像块相似度大于第一预设阈值的图像时,表明预设图像中存在目标图像,则获取该目标图像对应的文字,该文字包括一个或者多个,例如,两个文字很相似时,则会获取到两个目标图像,得到两个文字,这时,移动终端可以根据该文字在所属语句中的上下文语义进行判断,选择语义正确的文字。
进一步地,当获取到识别到的文字时,可以将该文字通过预先设置的保存路径保存为可编辑的文本文档,例如,保存至备忘录、记事本等应用程序,当然,也可以保存至微信、QQ等应用程序的收藏中。
本实施例提出的基于移动终端的识别方法,通过在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像,然后提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像,最后当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字;实现了直接通过将摄像机镜头内的图像中图像块与预设图像进行对比,快速获取图像块对应的文字,从而提高了识别效率,并且该识别方式适用范围广。
基于第一实施例,提出本发明基于移动终端的识别方法的第二实施例,参照图3,本实施例中,步骤S20包括:
步骤S21,获取所述图像中的文字的属性信息;
在本实施例中,该属性信息包括图像中的文字的高度、宽度,每个汉字、字母或者其它文字大小基本是一致的,在对图像中的文字进行识别时,可以对图像中的文字进行特征分析,获取到图像中的文字的高度、宽度。
步骤S22,基于所述属性信息生成识别框;
在本实施例中,每个汉字、字母或者其它文字的大小基本一致,在对图像中的文字进行识别时,根据文字的属性信息能够生成对应的识别框,该识别框大小根据文字的高度、宽度而定。
步骤S23,基于所述识别框获取所述图像块。
在本实施例中,在每个文字与文字之间有一定的间隔,该识别框不能与文字存在相连接的地方,包括不能与识别框外的文字连接、不能与识别框内的文字连接,当该识别框与外界没有连接时,则可以获取该识别框内文字的图像块。
本实施例提出的基于移动终端的识别方法,通过获取所述图像中的文字的属性信息,然后基于所述属性信息生成识别框,最后基于所述识别框获取所述图像块;实现了通过利用识别框来获取图像块,能够准确的获取图像的中文字对应的图像块,避免了错误识别。
基于第二实施例,提出本发明基于移动终端的识别方法的第三实施例,参照图4,本实施例中,步骤S20还包括:
步骤S24,获取所述图像块的第一像素值;
在本实施例中,第一像素值是指获取到的图像块的像素值,每个文字对应的像素值不一样,例如,“中”字与“国”字的像素值不一样,“大”字与“太”字的像素值不一样,字母“a”与字母“b”像素值不一样。
步骤S25,将所述第一像素值与所述预设图像中的第二像素值进行对比,获取所述第一像素值与第二像素值的差值;
在本实施例中,第二像素值是指预设图像中各个预存文字对应图像的像素值,图像块中对应文字与预设图像中对应文字虽然是同一文字,但在识别时像素值会存在一定差值,当该差值在预设范围之内时,则认为图像块中的文字与预设图像中对应的文字为同一文字,该预设范围由技术人员进行设置,例如,差值范围为-5%到+5%时,预设图像像素为100,则认为95~105范围内的像素值对应图像的文字为同一文字。
步骤S26,基于所述差值计算所述图像块与所述预设图像的相似度。
在本实施例中,根据图像块的像素值与预设图像中的像素值的差值能够计算出图像块与预设图像的相似度,例如,当获取到的图像块的像素值为100,预设图像的像素值为95,则相似度为百分之九十五,或者,获取到的图像块的像素值为95,预设图像的像素值为100,则相似度为百分之九十五。当该相似度在第一预设阈值范围时,则认为该图像块对应的文字与预设图像中的文字为同一文字。
本实施例提出的基于移动终端的识别方法,通过获取所述图像块的第一像素值,然后将所述第一像素值与所述预设图像中的第二像素值进行对比,获取所述第一像素值与第二像素值的差值,最后基于所述差值计算所述图像块与所述预设图像的相似度;实现了通过计算第一像素值与第二像素值确定图像块与预设图像的相似度,从而快速获取图像块对应的文字,提高了文字识别的速度及效率。
基于第三实施例,提出本发明基于移动终端的识别方法的第四实施例,参照图5,本实施例中,步骤S20还包括:
步骤S27,确定所述常用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
在本实施例中,预设图像包括常用文字图像与备用文字图像,常用文字图像为常用文字对应的图像,备用文字图像为不常用文字对应的图像,常用文字与不常用文字由技术人员进行定义分类,将常用文字与不常用文字存储至不同的预设容器,该预设容器包括移动终端中不同字典表及词典表,并且该常用文字与不常用文字都具有对应的预设图像,该预设图像包括二值图。
步骤S28,当所述常用文字图像中不存在与所述图像块相似度大于第一预设阈值的目标图像时,确定所述备用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像。
在本实施例中,先确定常用文字图像中是否存在图像块相似度大于第一预设阈值的目标图像,当常用文字图像中存在与图像块相似度大于第一预设阈值的目标图像,则获取该目标图像对应的文字,当常用文字图像中不存在图像块相似度大于第一预设阈值的目标图像时,则可以将该图像块与备用图像进行比较,确定备用图像中是否存在与图像块相似度大于第一预设阈值的目标图像,当备选图像中存在与该图像块相似度大于第一预设阈值的目标图像时,则获取该目标图像对应的文字。
本实施例提出的基于移动终端的识别方法,通过确定所述常用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像,然后当所述常用文字图像中不存在与所述图像块相似度大于第一预设阈值的目标图像时,确定所述备用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;实现了首先将图像块与常用文字图像进行对比,再与备用文字图像进行对比,快速寻找出目标图像对应的文字,加快了文字识别速度。
基于第四实施例,提出本发明基于移动终端的识别方法的第五实施例,参照图6,本实施例中,步骤S30步骤之后,还包括:
步骤S40,当所述文字为英文字母时,将识别到的所述英文字母组成单词。
在本实施例中,文字包括汉字、英文字母、标点符号等,当识别的文字为英文字母时,首先识别单个英文字母,再将识别出的单个英文字母组成单词,具体地,移动终端存储着英文字母表,通过获取英文字母对应的图像块,将图像块与英文字母表对应的图像进行比较,获取与图像块相似度大于第一预设阈值的目标图像对应的英文字母,再将获取到的英文字母组成单词。
进一步地,每个英文字母与英文字母间有一定的间隔,根据该间隔将获取到的英文字母的组成单词,每个单词与单词间也存在一定的间隔,然后将单词组成语句,存储至可编辑的文本中,例如,备忘录、日记本、记事本等。当然,也可以将组成的单词或者语句进行翻译操作,例如,在词典库中寻找该单词或者语句对应的中文翻译,然后将英文与中文翻译同时存储至可编辑文本。
本实施例提出的基于移动终端的识别方法,通过当所述文字为英文字母时,将识别到的所述英文字母组成单词;实现了能够对英文进行识别,增大了识别的适用范围,提高了用户体验。
基于第五实施例,提出本发明基于移动终端的识别方法的第六实施例,参照图7,本实施例中,步骤S30步骤之后,还包括:
步骤S50,当获取到两个或多个文字时,根据所述文字在语句中上下文的语义确定正确文字。
在本实施例中,有的文字书写很相似,例如,汉字“了”与数字“3”,汉字“大”与“太”,当识别的文字很相似时,可以分析该文字在该语句中的含义,若识别过程中,识别到与图像块相似度大于第一预设阈值的图像对应的汉字有“了”和“3”,则可以根据上下文的语义判断该文字为“了”还是“3”,比如,当该文字的下个文字为量词“个”,则可认为该文字为“3”。
本实施例提出的基于移动终端的识别方法,通过当获取到两个或多个文字时,根据所述文字在语句中上下文的语义确定正确文字;实现了根据上下文语义来选择正确文字,提高了识别的准确性。
基于第六实施例,提出本发明基于移动终端的识别方法的第七实施例,参照图8,本实施例中,所述基于移动终端的识别方法还包括:
步骤S60,当识别的文字为不规则文字时,将所述不规则文字对应的图像块与预设图像进行对比;
在本实施例中,该不规则文字包括识别到的文字不属于移动终端预存的字体,首先对不规则文字的特征进行分析,获取不规则文字的属性信息,该属性信息包括不规则文字的高度、宽度,然后根据不规则文字的属性信息生成识别框,提取识别框内的不规则文字对应的图像块,将该图像块与预设图像进行对比,计算该图像块与预设图像中各个图像的相似度。
步骤S70,确定预设图像与所述图像块的相似度中最高相似度是否小于第二预设阈值;
步骤S80,当所述最高相似度小于第二预设阈值时,存储所述最高相似度对应图像的文字,并将所述最高相似度对应图像的文字添加特殊性标志。
在本实施例中,将预设图像中与该图像块相似度最高的图像作为目标图像,获取该目标图像对应的文字,可以将目标图像对应的文字保存至可编辑文本,例如,备忘录、记事本等,用户可以在文字识别后,再可编辑文本中对识别的文字进行编辑。
进一步地,第一预设阈值是指技术人员设置图像块与预设图像相似度对应的最小阈值,当计算得到的最大相似度小于最小阈值时,获取该最大相似度对应的文字,可以将该文字保存至可编辑文本,并对该文字添加特殊性标志,例如,将该文字字体添加其它颜色,其它颜色包括与可编辑文本中识别到的规则文字不相同的颜色,还可以在该文字下面添加波浪线等特殊标志。
本实施例提出的基于移动终端的识别方法,通过当识别的文字为不规则文字时,将所述不规则文字对应的图像块与预设图像进行对比,然后确定预设图像与所述图像块的相似度中最高相似度是否小于第二预设阈值,最后当所述最高相似度小于第二预设阈值时,存储所述最高相似度对应图像的文字,并将所述最高相似度对应图像的文字添加特殊性标志;实现了对不规则文字进行识别,增大了识别的适用范围。
本发明还提供一种计算机可读存储介质,在本实施例中,计算机可读存储介质上存储有基于移动终端的识别程序,其中:
在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;
提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字。
进一步地,该基于移动终端的识别程序被所述处理器执行时,还实现如下步骤:
获取所述图像中的文字的属性信息;
基于所述属性信息生成识别框;
基于所述识别框获取所述图像块。
进一步地,该基于移动终端的识别程序被所述处理器执行时,还实现如下步骤:
获取所述图像块的第一像素值;
将所述第一像素值与所述预设图像中的第二像素值进行对比,获取所述第一像素值与第二像素值的差值;
基于所述差值计算所述图像块与所述预设图像的相似度。
进一步地,该基于移动终端的识别程序被所述处理器执行时,还实现如下步骤:
确定所述常用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述常用文字图像中不存在与所述图像块相似度大于第一预设阈值的目标图像时,确定所述备用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像。
进一步地,该基于移动终端的识别程序被所述处理器执行时,还实现如下步骤:
当所述文字为英文字母时,将识别到的所述英文字母组成单词。
进一步地,该基于移动终端的识别程序被所述处理器执行时,还实现如下步骤:
当获取到两个或多个文字时,根据所述文字在语句中上下文的语义确定正确文字。
进一步地,该基于移动终端的识别程序被所述处理器执行时,还实现如下步骤:
当识别的文字为不规则文字时,将所述不规则文字对应的图像块与预设图像进行对比,计算预设图像与所述图像块的相似度;
确定预设图像与所述图像块的相似度中最高相似度是否小于第二预设阈值;
当所述最高相似度小于第二预设阈值时,存储所述最高相似度对应图像的文字,并将所述最高相似度对应图像的文字添加特殊性标志。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种基于移动终端的识别方法,其特征在于,所述基于移动终端的识别方法包括以下步骤:
在接收到文字识别指令时,获取移动终端摄像机当前镜头内的图像;
提取所述图像中的文字对应的图像块,将所述图像块与预设图像进行对比,确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像,其中,所述预设图像包括常用图像与备用图像;
当所述预设图像中存在所述目标图像时,获取所述目标图像对应的文字,并存储所述文字;
其中,所述提取所述图像中的文字对应的图像块的步骤包括:
获取所述图像中的文字的属性信息;
基于所述属性信息生成识别框;
基于所述识别框获取所述图像块;
其中,所述基于移动终端的识别方法还包括:
当识别的文字为不规则文字时,将所述不规则文字对应的图像块与预设图像进行对比,计算预设图像与所述图像块的相似度;
确定预设图像与所述图像块的相似度中最高相似度是否小于第二预设阈值;
当所述最高相似度小于第二预设阈值时,存储所述最高相似度对应图像的文字,并将所述最高相似度对应图像的文字添加特殊性标志。
2.如权利要求1所述的基于移动终端的识别方法,其特征在于,所述将所述图像块与预设图像进行对比的步骤包括:
获取所述图像块的第一像素值;
将所述第一像素值与所述预设图像中的第二像素值进行对比,获取所述第一像素值与第二像素值的差值;
基于所述差值计算所述图像块与所述预设图像的相似度。
3.如权利要求2所述的基于移动终端的识别方法,所述预设图像包括常用文字图像及备用文字图像,其特征在于,所述确定所述预设图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像的步骤包括:
确定所述常用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像;
当所述常用文字图像中不存在与所述图像块相似度大于第一预设阈值的目标图像时,确定所述备用文字图像中是否存在与所述图像块相似度大于第一预设阈值的目标图像。
4.如权利要求3所述的基于移动终端的识别方法,其特征在于,所述获取所述目标图像对应的文字的步骤之后,所述基于移动终端的识别方法还包括:
当所述文字为英文字母时,将识别到的所述英文字母组成单词。
5.如权利要求4所述的基于移动终端的识别方法,其特征在于,所述获取所述目标图像对应的文字的步骤之后,所述基于移动终端的识别方法还包括:
当获取到两个或多个文字时,根据所述文字在语句中上下文的语义确定正确文字。
6.如权利要求5所述的基于移动终端的识别方法,其特征在于,所述图像中的文字的属性信息包括所述文字的高度、宽度。
7.一种基于移动终端的识别装置,其特征在于,所述基于移动终端的识别装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于移动终端的识别程序,所述基于移动终端的识别程序被所述处理器执行时实现如权利要求1至6中任一项所述的方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于移动终端的识别程序,所述基于移动终端的识别程序被处理器执行时实现如权利要求1至6中任一项所述的基于移动终端的识别方法步骤。
CN201810025502.8A 2018-01-11 2018-01-11 基于移动终端的识别方法、装置及计算机可读存储介质 Active CN108256523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810025502.8A CN108256523B (zh) 2018-01-11 2018-01-11 基于移动终端的识别方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810025502.8A CN108256523B (zh) 2018-01-11 2018-01-11 基于移动终端的识别方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108256523A CN108256523A (zh) 2018-07-06
CN108256523B true CN108256523B (zh) 2022-06-10

Family

ID=62726161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810025502.8A Active CN108256523B (zh) 2018-01-11 2018-01-11 基于移动终端的识别方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108256523B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020037576A1 (zh) * 2018-08-22 2020-02-27 深圳市欢太科技有限公司 一种速记方法及装置、终端、存储介质
CN110334702B (zh) * 2019-05-30 2023-04-18 深圳壹账通智能科技有限公司 基于配置平台的数据传输方法、装置和计算机设备
CN110427885A (zh) * 2019-07-31 2019-11-08 Tcl王牌电器(惠州)有限公司 铭牌的检测方法、装置及计算机可读存储介质
CN112784825B (zh) * 2019-11-01 2024-04-30 株式会社理光 图片中文字的识别方法、关键字检索方法、装置及设备
CN113221904A (zh) * 2021-05-13 2021-08-06 北京惠朗时代科技有限公司 一种语义关联文字识别方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023166A (zh) * 2014-04-24 2015-11-04 钱文辉 一种基于纸质凭证数据自动识别的返利方法
CN105975448A (zh) * 2016-05-04 2016-09-28 北京华熙动博网络科技有限公司 一种字体加载方法及装置
CN106295644A (zh) * 2016-08-11 2017-01-04 海信集团有限公司 符号识别方法及装置
CN106446898A (zh) * 2016-09-14 2017-02-22 宇龙计算机通信科技(深圳)有限公司 一种图像中文字信息的提取方法及装置
CN106503713A (zh) * 2016-11-16 2017-03-15 广西大学 一种基于粗外围特征文字识别方法
CN106709488A (zh) * 2016-12-20 2017-05-24 深圳市深信服电子科技有限公司 名片识别方法及装置
CN107220245A (zh) * 2016-03-21 2017-09-29 上海创歆信息技术有限公司 一种基于图像识别技术的古文字智能识别平台的实现方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810485A (zh) * 2014-01-22 2014-05-21 深圳市东信时代信息技术有限公司 识别装置、文字识别系统及方法
CN106203435A (zh) * 2016-07-13 2016-12-07 广州安望信息科技有限公司 图文识别方法及其装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023166A (zh) * 2014-04-24 2015-11-04 钱文辉 一种基于纸质凭证数据自动识别的返利方法
CN107220245A (zh) * 2016-03-21 2017-09-29 上海创歆信息技术有限公司 一种基于图像识别技术的古文字智能识别平台的实现方法及系统
CN105975448A (zh) * 2016-05-04 2016-09-28 北京华熙动博网络科技有限公司 一种字体加载方法及装置
CN106295644A (zh) * 2016-08-11 2017-01-04 海信集团有限公司 符号识别方法及装置
CN106446898A (zh) * 2016-09-14 2017-02-22 宇龙计算机通信科技(深圳)有限公司 一种图像中文字信息的提取方法及装置
CN106503713A (zh) * 2016-11-16 2017-03-15 广西大学 一种基于粗外围特征文字识别方法
CN106709488A (zh) * 2016-12-20 2017-05-24 深圳市深信服电子科技有限公司 名片识别方法及装置

Also Published As

Publication number Publication date
CN108256523A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
CN108256523B (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
USRE46139E1 (en) Language input interface on a device
EP2704061A2 (en) Apparatus and method for recognizing a character in terminal equipment
US9811171B2 (en) Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device
CN111381751A (zh) 一种文本处理方法及装置
US9824266B2 (en) Handwriting input apparatus and control method thereof
US10573046B2 (en) Information processing device, storage medium, and method of displaying result of translation in information processing device
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
CN111709414A (zh) Ar设备及其文字识别方法、装置和计算机可读存储介质
US20170147546A1 (en) Information processing apparatus, information processing method, and information processing program
CN107665046B (zh) 一种输入方法和装置、一种用于输入的装置
US10025772B2 (en) Information processing apparatus, information processing method, and program
JPWO2014147767A1 (ja) 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体
CN114937270A (zh) 古籍文字处理方法、装置及计算机可读存储介质
CN113626441A (zh) 基于扫描设备的文本管理方法、装置、设备以及存储介质
CN108536653B (zh) 一种输入方法、装置和用于输入的装置
US8386236B2 (en) Method for prompting by suggesting stroke order of chinese character, electronic device, and computer program product
US20230049621A1 (en) Electronic device and operation method of electronic device
US10127478B2 (en) Electronic apparatus and method
KR20160120700A (ko) 이미지 형태의 컨텐츠의 가독성 향상을 위한 시스템, 장치 및 방법
CN112764551A (zh) 词汇显示方法、装置和电子设备
EP3537341A1 (en) Character input device, character input method, and character input program
CN106919558B (zh) 用于移动设备的基于自然对话方式的翻译方法和翻译装置
CN113536169B (zh) 一种网页的文字排版方法、装置、设备和存储介质
US20170091316A1 (en) Electronic device and controlling method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221221

Address after: 201203 1st floor, building 1, Lane 36, Xuelin Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 201203

Patentee after: SHANGHAI TRANSSION INFORMATION TECHNOLOGY Ltd.

Address before: Room 922 / 926, block a, No. 1, Lane 399, shengxia Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 201203

Patentee before: SHANGHAI SPREADRISE COMMUNICATION TECHNOLOGY Ltd.

TR01 Transfer of patent right