CN108509957A - 文字识别方法、终端以及计算机可读介质 - Google Patents
文字识别方法、终端以及计算机可读介质 Download PDFInfo
- Publication number
- CN108509957A CN108509957A CN201810297915.1A CN201810297915A CN108509957A CN 108509957 A CN108509957 A CN 108509957A CN 201810297915 A CN201810297915 A CN 201810297915A CN 108509957 A CN108509957 A CN 108509957A
- Authority
- CN
- China
- Prior art keywords
- handwriting
- grapholect
- described image
- user
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开一种文字识别方法、终端以及计算机可读介质,所述文字识别方法包括:识别图像上的手写文字,并输出识别结果;接收对所述识别结果的评分;判断所述评分是否大于预设的分值;如果所述评分小于所述分值,则接收输入的标准文字,并根据所述标准文字对标准文字与手写文字对应关系表进行迭代,重新对所述图像上的所述手写文字进行识别。本发明的技术方案,通过在手写文字的识别流程中增加评分机制,当识别结果的评分较低时,根据用户输入的标准文字的标准特征与手写文字的手写特征的对应关系对标准文字与手写文字对应关系表进行迭代,进而有效提升对手写文字识别的准确率。
Description
技术领域
本发明涉及图像识别领域,特别涉及一种文字识别方法、终端以及计算机 可读介质。
背景技术
进入数字化时代后,人们每天面对着大量的数字信息输入,但在很多场合 下,实体文档(比如,纸质文档等)却非常实用和高效,例如会议记录大部分 还是依靠纸质的本子,纸质的广场、小区的告示,大部分人还是习惯纸质的文 档。然而,实体文档存在着携带不便等缺陷。
为了克服上述缺陷,现有一种具有文字识别功能的移动终端,然而,现有 的移动终端只能识别标准文字,而针对用户自己手写的文字,识别的准确率较 低,不能有效满足用户的需求。
发明内容
本发明的主要目的是提供一种文字识别方法、终端以及计算机可读介质, 旨在有效提升手写文字识别的准确率。
为实现上述目的,本发明提出的文字识别方法,包括如下步骤:
识别图像上的手写文字,并输出识别结果;
接收对所述识别结果的评分;
判断所述评分是否大于预设的分值;
如果所述评分小于所述分值,则接收输入的标准文字,并根据所述标准文 字对标准文字与手写文字对应关系表进行迭代,重新对所述图像上的所述手 写文字进行识别。
可选的,所述识别图像上的手写文字的步骤包括:
对所述图像上的所述手写文字的边缘进行检测;
对所述图像上的所述手写文字进行行列切割;
对所述图像上的所述手写文字的手写特征进行提取;
根据提取的所述手写特征,在标准文字与手写文字对应关系表内查找对 应的标准特征;
根据查找到的所述标准特征生成标准文字。
可选的,所述根据所述标准文字对标准文字与手写文字对应关系表进行 迭代的步骤包括:
提取所述标准文字的标准特征;
提取所述手写文字的手写特征;
根据所述标准特征与所述手写特征的对应关系,对所述标准文字与手写 文字对应关系表进行迭代。
可选的,在所述识别图像上的手写文字的步骤之前,还包括:
根据接收到的选择指令,在预览画面上选择对应的区域;
对所述对应的区域内的所述图像进行预处理。
可选的,所述对选择区域内的所述图像进行预处理的步骤包括:
识别所述图像的边框;
对所述图像进行扭曲矫正处理;
对所述图像进行效果增强处理。
可选的,在对选择区域内的所述图像进行预处理的步骤之后,还包括:
判断所述图像上是否存在所述手写文字;
如果所述图像上存在所述手写文字,则识别所述图像上的手写文字;
如果所述图像上不存在所述手写文字,则将所述图像保存为预设格式的 电子文档。
可选的,在所述接收用户对所述识别结果的评分的步骤之后,还包括:
判断用户对所述识别结果是否满意;
如果用户对所述识别结果满意,则将识别结果保存为预设格式的电子文 档;
如果用户对所述识别结果不满意,则接收用户对所述识别结果的评分。
可选的,所述判断用户对识别结果是否满意的步骤包括:
当接收到用户输入的按照一预设方向的滑动操作指令时,判定用户对所 述识别结果满意;
当接收到用户输入的按照另一预设方向的滑动操作指令时,判定用户对 所述识别不结果满意。
此外,为了实现上述目的,本发明还提出一种终端,包括存储器、处理器 及存储在所述存储器上并可在所述处理器上运行的文字识别程序,所述文字 识别程序被所述处理器执行时实现如下步骤:
识别图像上的手写文字,并输出识别结果;
接收对所述识别结果的评分;
判断所述评分是否大于预设的分值;
如果所述评分小于所述分值,则接收输入的标准文字,并根据所述标准文 字对标准文字与手写文字对应关系表进行迭代,重新对所述图像上的所述手 写文字进行识别。
此外,为了实现上述目的,本发明还提出一种计算机可读介质,所述计算 机可读介质上存储有文字识别程序,所述文职识别程序被执行时实现如下步 骤:
识别图像上的手写文字,并输出识别结果;
接收对所述识别结果的评分;
判断所述评分是否大于预设的分值;
如果所述评分小于所述分值,则接收输入的标准文字,并根据所述标准文 字对标准文字与手写文字对应关系表进行迭代,重新对所述图像上的所述手 写文字进行识别。
本发明的技术方案,通过在手写文字的识别流程中增加评分机制,当识别 结果的评分较低时,根据用户输入的标准文字的标准特征与手写文字的手写 特征的对应关系对标准文字与手写文字对应关系表进行迭代,进而有效提升 对手写文字识别的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描 述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不 付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为实现本发明各个实施例的一种移动终端的硬件结构示意图;
图2为本发明实施例提供的一种通信网络系统架构图;
图3为本发明文字识别方法一实施例的流程图;
图4为图3中识别图像上的手写文字的步骤的流程图;
图5为应用本发明文字识别方法的移动终端的一使用状态示意图;
图6为应用本发明文字识别方法的移动终端的另一使用状态示意图;
图7为应用本发明文字识别方法的移动终端的再一使用状态示意图;
图8为图3中根据所述标准文字对标准文字与手写文字对应关系表进行迭 代的步骤的流程图;
图9为本发明文字识别方法另一实施例的流程图;
图10为应用本发明文字识别方法的移动终端的又一使用状态示意图;
图11为图9中选择区域内的所述图像进行预处理的步骤的流程图;
图12为本发明文字识别方法再一实施例的流程图;
图13为本发明文字识别方法又一实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说 明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定 本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后 缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部 件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手 机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant, PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴 设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定 终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除 了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用 于固定类型的终端。
请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意 图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi 模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显 示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及 电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构 成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合 某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的, 将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基 站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦 合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与 网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不 限于GSM(Global System of Mobile communication,全球移动通讯系统)、 GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(Code Division Multiple Access 2000,码分多址2000)、WCDMA(Wideband CodeDivision Multiple Access,宽带码分多址)、TD-SCDMA(Time Division- SynchronousCode Division Multiple Access,时分同步码分多址)、FDD-LTE (Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进) 等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户 收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联 网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终 端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、 记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi 模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出 为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相 关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元 103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图 形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器 1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的 静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元 106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储 介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电 话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声 音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动 通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法 以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及 其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境 光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可 在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器 的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止 时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、 相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至 于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺 仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元 106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、 有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面 板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终 端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可 包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可 收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物 体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定 的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制 器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来 的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命 令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种 类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其 他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功 能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种 或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在 其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处 理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在 图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端 的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板 1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。 例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电 器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置 的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108 可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到 的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100 和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存 储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所 需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储 根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器 109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一 个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终 端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以 及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从 而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的, 处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理 操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以 理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的, 电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统 实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网 络系统进行描述。
请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信 网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE (User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core, 演进式分组核心网)203和运营商的IP业务204。
具体地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021 可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021 连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体) 2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033, SGW(Serving GateWay,服务网关)2034,PGW(PDN Gate Way,分组数 据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功 能实体)2036等。其中,MME2031是处理UE201和EPC203之间信令的控制节 点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置 寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可 以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载 资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示) 选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP 多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本发 明不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、 CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本发明方法各个实 施例。
如图3所示,图3为本发明文字识别方法一实施例的流程图。
在本实施例中,所述文字识别方法,包括如下步骤:
步骤S310、识别图像上的手写文字(手写文字包括汉字、数字、英文字 符,以及标点符号等),并输出识别结果。
如图4所示,所述识别图像上的手写文字的步骤包括:
步骤S311、对所述图像上的所述手写文字的边缘进行检测。
具体的,根据文字与纸质文档的色差等,识别出文字的边缘,以保证文字 的完整性。
步骤S312、对所述图像上的所述手写文字进行行列切割。
具体的,根据文字的基元关系、语法规则、字体练笔,以及转折情况将文 字进行行列切割,将文字划分成数个特征。
步骤S313、对所述图像上的所述手写文字的手写特征进行提取。
具体的,对每一个手写文字的手写特征进行提取。
步骤S314、根据提取的所述手写特征,在标准文字与手写文字对应关系 表内查找对应的标准特征。
具体的,所述标准文字与手写文字对应关系表内存储有标准文字的标准 特征与用户手写文字的手写特征的对应关系。将提取的用户手写文字的特征 与标准文字与手写文字对应关系表内存储的用户手写文字的特征进行比较, 查找到对应标准文字的标准特征。
步骤S315、根据查找到的所述标准特征生成标准文字。
具体的,将查找到的标准文字的特征组合成相应的文字。
如图5所示,所述输出识别结果的具体方式可以为:在移动终端的显示 界面以显示框的方式显示所述识别结果(也即,将识别出的文字显示于移动终 端的显示界面)。
步骤S320、接收用户对所述识别结果的评分。
具体的,如图6所示,可以在显示所述识别结果的同时显示输入框,并提 示用户对本次识别结果进行评分。
步骤S330、判断所述评分是否大于预设的分值。
具体的,预设的分值可以是用户自行设定的,也可以使用系统默认评分。 以百分制为例,系统默认评分为90分(也即,移动终端识别的文字和/或数字 的准确率为90%时,才默认合格)。在实际使用过程中,用户通过所述移动终 端对纸质文档上的文字和/或数字进行识别;识别完成后,将所述识别结果显 示于所述移动终端的显示界面,并提醒用户根据所述识别结果对本次识别进 行评分。用户根据识别的准确率(识别正确的个数/总个数)在所述输入框内 输入本次识别结果的评分(比如,70分),由于输入的评分70分小于预设的分值90分,所述移动终端则会执行步骤S350。而当用户输入的评分大于或等 于预设的分值时,则认为用户对本次识别结果较为满意,则执行步骤S340。
步骤S340、将所述识别结果保存为预设格式的电子文档。
具体的,将所述识别结果(也即,识别所述手写文字得到的所述标准文字) 保存为预设格式的电子文档,优选保存为可以进行编辑(比如,复制等)的文 档(比如,TXT文档、WORD文档等)。
步骤S350、接收用户输入的标准文字,并根据所述标准文字对标准文字 与手写文字对应关系表进行迭代。
具体的,当用户输入的评分小于预设的分值时,如图7所示,所述移动终 端弹出输入框,并提示用户输入标准文字;用户根据提示,将对应所述纸质文 档上的手写文字的标准文字输入到所述输入框内,并确认。当接收到用户输入 的确认指令后,所述移动终端根据所述标准文字对标准文字与手写文字对应 关系表进行迭代。
如图8所示,所述根据所述标准文字对标准文字与手写文字对应关系表 进行迭代的步骤包括:
步骤S351、提取所述标准文字的标准特征。
具体的,根据文字的基元关系、语法规则、字体练笔,以及转折情况将文 字进行行列切割,将标准文字划分成数个标准特征,然后对每一所述标准特征 进行提取。
步骤S352、提取所述手写文字的手写特征。
具体的,根据文字的基元关系、语法规则、字体练笔,以及转折情况将文 字进行行列切割,将标准文字划分成数个手写特征,然后对每一所述手写特征 进行提取。
步骤S353、根据所述标准特征与所述手写特征的对应关系,对所述标准 文字与手写文字对应关系表进行迭代。
具体的,将所述标准文字的每一所述标准特征与所述纸质文档上的手写 文字的每一所述手写特征进行一一对应,并生成对照表,将生成的对照表更新 至所述标准文字与手写文字对应关系表内,然后,返回执行步骤S310,以重 新对所述图像上的所述手写文字进行识别。
本实施例的技术方案,通过在手写文字的识别流程中增加评分机制,当识 别结果的评分较低时,根据用户输入的标准文字的标准特征与手写文字的手 写特征的对应关系对标准文字与手写文字对应关系表进行迭代,进而有效提 升对手写文字识别的准确率。
进一步的,如图9所示,图9为本发明文字识别方法另一实施例的流程 图。
在本实施例中,所述文字识别方法,包括如下步骤:
步骤S410、根据接收到的选择指令,在预览画面上选择对应的区域。
具体的,当用户需要将手写在纸质文档上的手写文字存储于移动终端时, 用户将所述纸质文档放置于桌面上,并通过所述移动终端的相机拍摄所述纸 质文档,但由于所述移动终端的摄像范围、焦距等的固定,导致在所述移动终 端的显示界面上显示的预览画面中不但包括所述纸质文档上的所述手写文字, 还会存在所述纸质文档的其他部分,甚至是桌面,而用户只需要所述纸质文档 上的所述手写文字,这时,用户可以通过在所述移动终端的显示界面上通过点 选、画框等方式给出选择指令(如图10所示),以使得预览画面对焦至选择的 区域(也即,所述纸质文档上的手写文字的位置),而对其他部分进行虚化处 理。
步骤S420、对所述对应的区域内的所述图像进行预处理。
具体的,如图11所示,对所述对应的区域内的所述图像进行预处理的步 骤包括:
步骤S421、识别所述图像的边框。
具体的,所述识别图像的边框是指,根据图像内的色差等区别,识别出图 像的最外边框,比如,识别出所述纸质文档的所述手写文字的最外边框,以有 效避免显示不全的状况发生。
步骤S422、对所述图像进行扭曲矫正处理。
具体的,所述对所述图像进行扭曲矫正处理是指,当所述选择区域内的图 像存在扭曲时,对图像进行矫正,以使得图像平直,保证显示效果,进而有提 升文字识别的准确率。
步骤S423、对所述图像进行效果增强处理。
具体的,所述对所述图像进行效果增强处理是指,当所述选择区域内的图 像存在曝光、白斑或者虚影等模糊缺陷时,对图像进行效果增强处理,比如, 加强对比度、白平衡,以及颜色加深等处理,进一步保证显示效果,提升文字 识别的准确率。
步骤S430、对预处理完成后的所述图像上的所述手写文字进行识别,并 输出识别结果。
步骤S440、接收用户对所述识别结果的评分。
步骤S450、判断所述评分是否大于预设的分值,当所述评分小于所述分 值时,执行步骤S470;当所述评分大于或等于所述分值时,执行步骤S460。
步骤S460、将所述识别结果保存为预设格式的电子文档。
步骤S470、接收用户输入的标准文字,并根据所述标准文字对标准文字 与手写文字对应关系表进行迭代,然后返回执行步骤S430。
具体的,本实施例中的步骤S430至步骤S470的具体实现方式与上述实 施例中的步骤S310至步骤S350相同,在此不再赘述。
本实施例的技术方案,用户可以通过在预览画面上选择相应的区域,使得 移动终端能有效的识别出用户想要的图像,并对图像进行预处理,以有效提升 获取到的图像的品质,进而有效提升对手写文字识别的准确率,同时,还通过 在手写文字的识别流程中增加评分机制,当识别结果的评分较低时,根据用户 输入的标准文字的标准特征与手写文字的手写特征的对应关系对标准文字与 手写文字对应关系表进行迭代,进一步有效提升对手写文字识别的准确率。
进一步的,如图12所示,图12为本发明文字识别方法再一实施例的流 程图。
在本实施例中,所述文字识别方法,包括如下步骤:
步骤S510、根据接收到的选择指令,在预览画面上选择对应的区域。
步骤S520、对所述对应的区域内的所述图像进行预处理。
具体的,所述步骤S510与步骤S520,与上述实施例中的步骤S410与步 骤S420的具体实现方式相同,在此不再赘述。
步骤S530、判断所述图像上是否存在所述手写文字。
具体的,可以通过对模糊识别的方式判断所述图像上是否存在所述手写 文字。如果所述图像上存在所述手写文字,则执行步骤S540;如果所述图像 上不存在所述手写文字,则执行步骤S570。
步骤S540、识别所述图像上的手写文字,并输出识别结果。
步骤S550、接收用户对所述识别结果的评分。
步骤S560、判断所述评分是否大于预设的分值,当所述评分小于所述分 值时,执行步骤S580;当所述评分大于或等于所述分值时,执行步骤S570。
步骤S570、将所述图像保存为预设格式的电子文档。
步骤S580、接收用户输入的标准文字,并根据所述标准文字对标准文字 与手写文字对应关系表进行迭代,然后返回执行步骤S540。
具体的,所述步骤S540至步骤S580,与上述实施例中的步骤S430至步 骤S470的具体实现方式相同,在此不再赘述。
本实施例的技术方案,通过识别图像中是否存在文字,来判断是否需要进 行文字识别,当不需要进行识别时,将图像存储为预设格式的电子文档,实现 纸质文档向电子文档的转换。
进一步的,如图13所示,图13为本发明文字识别方法又一实施例的流 程图。
在本实施例中,所述文字识别方法,包括如下步骤:
步骤S610、根据接收到的选择指令,在预览画面上选择对应的区域。
步骤S620、对所述对应的区域内的所述图像进行预处理。
步骤S630、判断所述图像上是否存在所述手写文字,如果所述图像上存 在所述手写文字,则执行步骤S640;如果所述图像上不存在所述手写文字, 则执行步骤S680。
步骤S640、识别所述图像上的手写文字,并输出识别结果;
步骤S650、接收用户对所述识别结果的评分。
步骤S660、判断所述评分是否大于预设的分值,当所述评分小于所述分 值时,执行步骤S680;当所述评分大于或等于所述分值时,执行步骤S670。
步骤S670、判断用户对所述识别结果是否满意,如果不满意,则返回执 行步骤S640,如果满意,则执行步骤S680。
所述判断用户对所述识别结果是否满意的步骤包括:当接收到用户输入 的按照一预设方向的滑动操作指令时,判定用户对所述识别结果满意。当接收 到用户输入的按照另一预设方向的滑动操作指令时,判定用户对所述识别不 结果满意。具体的,当所述手写文字识别完成后,将所述识别结果显示于所述 移动终端的显示界面,并在所述识别结果的下方显示用于输入评分的所述输 入框;当用户对所述识别结果进行评分之后,且所述评分大于或等于预设的所 述分值时,则在所述移动终端的显示界面显示“满意”与“不满意”的虚拟按 键,比如,“满意”虚拟按键显示在显示界面的左侧,而“不满意”虚拟按键 显示在显示界面的右侧。当用户对所述识别结果满意时,可以通过触发“满意” 虚拟按键,并将其朝向左方滑动。而当用户对所述识别结果不满意时,可以通 过触发“不满意”虚拟按键,并将其朝向右方滑动。
步骤S680、将所述图像保存为预设格式的电子文档。
步骤S690、接收用户输入的标准文字,并根据所述标准文字对标准文字 与手写文字对应关系表进行迭代,然后返回执行步骤S640。
本实施例的技术方案,通过虚拟按键的方式使得用户可以实现对识别结 果的选择与放弃,操作简单方便,可以有效提升用户的满意度。
本发明还提出一种终端,包括存储器、处理器及存储在所述存储器上并可 在所述处理器上运行的文字识别程序,所述文字识别程序被所述处理器执行 时实现上述文字识别方法的实施例中的所有步骤。由于所述终端可以执行上 述任意一实施例中的所有步骤,所以本移动终端至少具有上述方法实施例的 技术方案所带来的所有有益效果,在此不再一一赘述。
本发明还提出一种计算机可读介质,所述计算机可读介质上存储有文字 识别程序,所述文字识别程序被执行时可实现上述任意一实施例中的所有步 骤。由于所述计算机可读介质可以执行上述任意一实施例中的所有步骤,所以 本计算机可读介质至少具有上述方法实施例的技术方案所带来的所有有益效 果,在此不再一一赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在 涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置 不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这 种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语 句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或 者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技 术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现 出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘) 中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器, 或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上 述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的, 本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求 所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种文字识别方法,其特征在于,包括如下步骤:
识别图像上的手写文字,并输出识别结果;
接收对所述识别结果的评分;
判断所述评分是否大于预设的分值;
如果所述评分小于所述分值,则接收输入的标准文字,并根据所述标准文字对标准文字与手写文字对应关系表进行迭代,重新对所述图像上的所述手写文字进行识别。
2.如权利要求1所述的文字识别方法,其特征在于,所述识别图像上的手写文字的步骤包括:
对所述图像上的所述手写文字的边缘进行检测;
对所述图像上的所述手写文字进行行列切割;
对所述图像上的所述手写文字的手写特征进行提取;
根据提取的所述手写特征,在标准文字与手写文字对应关系表内查找对应的标准特征;
根据查找到的所述标准特征生成标准文字。
3.如权利要求1所述的文字识别方法,其特征在于,所述根据所述标准文字对标准文字与手写文字对应关系表进行迭代的步骤包括:
提取所述标准文字的标准特征;
提取所述手写文字的手写特征;
根据所述标准特征与所述手写特征的对应关系,对所述标准文字与手写文字对应关系表进行迭代。
4.如权利要求1所述的文字识别方法,其特征在于,在所述识别图像上的手写文字的步骤之前,还包括:
根据接收到的选择指令,在预览画面上选择对应的区域;
对所述对应的区域内的所述图像进行预处理。
5.如权利要求4所述的文字识别方法,其特征在于,所述对选择区域内的所述图像进行预处理的步骤包括:
识别所述图像的边框;
对所述图像进行扭曲矫正处理;
对所述图像进行效果增强处理。
6.如权利要求4所述的文字识别方法,其特征在于,在对选择区域内的所述图像进行预处理的步骤之后,还包括:
判断所述图像上是否存在所述手写文字;
如果所述图像上存在所述手写文字,则识别所述图像上的手写文字;
如果所述图像上不存在所述手写文字,则将所述图像保存为预设格式的电子文档。
7.如权利要求1所述的文字识别方法,其特征在于,在所述接收用户对所述识别结果的评分的步骤之后,还包括:
判断用户对所述识别结果是否满意;
如果用户对所述识别结果满意,则将识别结果保存为预设格式的电子文档;
如果用户对所述识别结果不满意,则接收用户对所述识别结果的评分。
8.如权利要求7所述的文字识别方法,其特征在于,所述判断用户对识别结果是否满意的步骤包括:
当接收到用户输入的按照一预设方向的滑动操作指令时,判定用户对所述识别结果满意;
当接收到用户输入的按照另一预设方向的滑动操作指令时,判定用户对所述识别不结果满意。
9.一种终端,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文字识别程序,所述文字识别程序被所述处理器执行时实现如权利要求1至8中任一项所述的文字识别方法的步骤。
10.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有文字识别程序,所述文字识别程序被执行时实现如权利要求1至8中任一项所述的文字识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810297915.1A CN108509957B (zh) | 2018-03-30 | 2018-03-30 | 文字识别方法、终端以及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810297915.1A CN108509957B (zh) | 2018-03-30 | 2018-03-30 | 文字识别方法、终端以及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108509957A true CN108509957A (zh) | 2018-09-07 |
CN108509957B CN108509957B (zh) | 2022-08-05 |
Family
ID=63380514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810297915.1A Active CN108509957B (zh) | 2018-03-30 | 2018-03-30 | 文字识别方法、终端以及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509957B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871910A (zh) * | 2019-03-12 | 2019-06-11 | 成都工业学院 | 一种手写字符识别方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060285749A1 (en) * | 2005-06-17 | 2006-12-21 | Microsoft Corporation | User-initiated reporting of handwriting recognition errors over the internet |
CN101276414A (zh) * | 2008-04-07 | 2008-10-01 | 宇龙计算机通信科技(深圳)有限公司 | 手写字体识别方法及装置 |
CN102065387A (zh) * | 2009-11-13 | 2011-05-18 | 华为技术有限公司 | 一种短信的识别方法和设备 |
CN102915731A (zh) * | 2012-10-10 | 2013-02-06 | 百度在线网络技术(北京)有限公司 | 一种个性化的语音识别的方法及装置 |
CN103279262A (zh) * | 2013-04-25 | 2013-09-04 | 深圳市中兴移动通信有限公司 | 从图片中提取内容的方法和装置 |
CN105096952A (zh) * | 2015-09-01 | 2015-11-25 | 联想(北京)有限公司 | 一种语音识别的辅助处理方法和服务器 |
CN105184329A (zh) * | 2015-08-27 | 2015-12-23 | 鲁东大学 | 一种基于云平台的脱机手写识别方法 |
CN107545391A (zh) * | 2017-09-07 | 2018-01-05 | 安徽共生物流科技有限公司 | 一种基于图像识别的物流单据智能分析与自动存储方法 |
CN107678650A (zh) * | 2017-09-29 | 2018-02-09 | 努比亚技术有限公司 | 一种图片识别方法、移动终端及计算机可读存储介质 |
-
2018
- 2018-03-30 CN CN201810297915.1A patent/CN108509957B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060285749A1 (en) * | 2005-06-17 | 2006-12-21 | Microsoft Corporation | User-initiated reporting of handwriting recognition errors over the internet |
CN101276414A (zh) * | 2008-04-07 | 2008-10-01 | 宇龙计算机通信科技(深圳)有限公司 | 手写字体识别方法及装置 |
CN102065387A (zh) * | 2009-11-13 | 2011-05-18 | 华为技术有限公司 | 一种短信的识别方法和设备 |
CN102915731A (zh) * | 2012-10-10 | 2013-02-06 | 百度在线网络技术(北京)有限公司 | 一种个性化的语音识别的方法及装置 |
CN103279262A (zh) * | 2013-04-25 | 2013-09-04 | 深圳市中兴移动通信有限公司 | 从图片中提取内容的方法和装置 |
CN105184329A (zh) * | 2015-08-27 | 2015-12-23 | 鲁东大学 | 一种基于云平台的脱机手写识别方法 |
CN105096952A (zh) * | 2015-09-01 | 2015-11-25 | 联想(北京)有限公司 | 一种语音识别的辅助处理方法和服务器 |
CN107545391A (zh) * | 2017-09-07 | 2018-01-05 | 安徽共生物流科技有限公司 | 一种基于图像识别的物流单据智能分析与自动存储方法 |
CN107678650A (zh) * | 2017-09-29 | 2018-02-09 | 努比亚技术有限公司 | 一种图片识别方法、移动终端及计算机可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871910A (zh) * | 2019-03-12 | 2019-06-11 | 成都工业学院 | 一种手写字符识别方法及装置 |
CN109871910B (zh) * | 2019-03-12 | 2021-06-22 | 成都工业学院 | 一种手写字符识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108509957B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108093123A (zh) | 一种消息通知处理方法、终端及计算机可读存储介质 | |
CN104516893B (zh) | 信息存储方法、装置和通讯终端 | |
CN109063583A (zh) | 一种基于点读操作的学习方法及电子设备 | |
CN107748645A (zh) | 点读方法、移动终端及计算机可读存储介质 | |
CN108289244A (zh) | 视频字幕处理方法、移动终端及计算机可读存储介质 | |
CN107358227A (zh) | 一种标记识别方法、移动终端以及计算机可读存储介质 | |
CN108234295A (zh) | 群功能控件的显示控制方法、终端及计算机可读存储介质 | |
CN110321474A (zh) | 基于搜索词的推荐方法、装置、终端设备及存储介质 | |
CN107277250A (zh) | 显示被关注聊天信息的方法、终端和计算机可读存储介质 | |
CN110033769A (zh) | 一种录入语音处理方法、终端及计算机可读存储介质 | |
CN108551520A (zh) | 一种语音搜索响应方法、设备及计算机可读存储介质 | |
CN108536638A (zh) | 智能书签的设置方法、移动终端、系统及可读存储介质 | |
CN108521500A (zh) | 一种语音场景控制方法、设备及计算机可读存储介质 | |
CN110045830A (zh) | 应用操作方法、装置及计算机可读存储介质 | |
CN109495638A (zh) | 一种信息显示方法及终端 | |
CN107613109B (zh) | 移动终端的输入方法、移动终端和计算机存储介质 | |
CN110213444A (zh) | 移动终端消息的显示方法、装置、移动终端及存储介质 | |
CN109255032A (zh) | 公众号分类方法、装置和计算机可读存储介质 | |
CN109976641A (zh) | 基于截屏图片的操作方法、终端和计算机可读存储介质 | |
CN109714483A (zh) | 锁屏界面消息处理方法、装置、移动终端及存储介质 | |
CN108650415A (zh) | 终端信息显示方法、移动终端及计算机可读存储介质 | |
CN107704569A (zh) | 一种语音查询方法、终端及计算机可读存储介质 | |
CN108509957A (zh) | 文字识别方法、终端以及计算机可读介质 | |
CN107329584A (zh) | 一种文字输入处理方法、移动终端以及计算机可读存储介质 | |
CN109710209A (zh) | 一种分屏比对方法、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220714 Address after: 518100 workshop 301, building D, No. 2, Longshan 8th Road, Luotian community, Yanluo street, Bao'an District, Shenzhen, Guangdong Province Applicant after: SHENZHEN YANGRI ELECTRONIC Co.,Ltd. Address before: 518000 6-8 / F, 10-11 / F, 6 / F, 6-10 / F, C zone, Han's innovation building, No. 9018, Beihuan Avenue, high tech Zone, Nanshan District, Shenzhen City, Guangdong Province Applicant before: NUBIA TECHNOLOGY Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |