CN111079502A - 一种识别书写内容的方法及电子设备 - Google Patents
一种识别书写内容的方法及电子设备 Download PDFInfo
- Publication number
- CN111079502A CN111079502A CN201910682764.6A CN201910682764A CN111079502A CN 111079502 A CN111079502 A CN 111079502A CN 201910682764 A CN201910682764 A CN 201910682764A CN 111079502 A CN111079502 A CN 111079502A
- Authority
- CN
- China
- Prior art keywords
- content
- writing
- target
- written
- electronic equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 210000001508 eye Anatomy 0.000 claims description 17
- 230000003993 interaction Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 12
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 10
- 230000009286 beneficial effect Effects 0.000 description 6
- 235000012054 meals Nutrition 0.000 description 6
- 210000005252 bulbus oculi Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000008187 granular material Substances 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000007639 printing Methods 0.000 description 4
- 210000003128 head Anatomy 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例涉及教育技术领域,公开了一种识别书写内容的方法及电子设备,该方法包括:当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从坐标信息中确定若干个目标坐标;当检测到听写结束指令时,拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域;当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,并从删除了印刷体文字的有效书写区域中识别出书写内容。实施本发明实施例,能够提高书写内容的识别准确率,从而提高听写检测效率。
Description
技术领域
本发明涉及教育技术领域,尤其涉及一种识别书写内容的方法及电子设备。
背景技术
在进行复习时,用户往往选择听写来检测自身的学习成果。目前,市面上推出了许多具有听写功能的电子设备(如家教机),这类电子设备可以拍摄用户根据听写内容进行书写的书写页面,并从中识别出用户的书写内容。然而,在实际中发现,由于书写页面中可能存在与本次听写无关的干扰内容,比如书写页面的印刷体文字,这些干扰内容的存在使得电子设备无法针对性地对本次听写相关的书写内容进行识别,降低了书写内容的识别准确率。
发明内容
本发明实施例公开了一种识别书写内容的方法及电子设备,能够提高书写内容的识别准确率。
本发明实施例第一方面公开一种识别书写内容的方法,包括:
当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从所述坐标信息中确定若干个目标坐标;
当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述若干个目标坐标确定所述目标图像中的有效书写区域;
当检测到所述有效书写区域中包含印刷体文字时,将所述印刷体文字从所述有效书写区域中删除,并从删除了所述印刷体文字的有效书写区域中识别出书写内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从所述坐标信息中确定若干个目标坐标,包括:
当电子设备处于听写模式时,以书写页面中心位置为原点,以与所述电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与所述电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系;
采集用户在所述书写页面写入的书写内容在所述目标坐标系上的坐标信息;
从所述坐标信息中确定出所述书写内容左上角的书写字词的第一坐标、所述书写内容右上角的书写字词的第二坐标、所述书写内容左下角的书写字词的第三坐标和所述书写内容右下角的书写字词的第四坐标;
以及,所述当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述若干个目标坐标确定所述目标图像中的有效书写区域,包括:
当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述第一坐标、所述第二坐标、所述第三坐标和所述第四坐标确定所述目标图像中的有效书写区域。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
以印刷体文字库中的文字为基准,对所述有效书写区域中的文字进行检测,以获得所述有效书写区域中的文字的置信度;
将置信度高于预设阈值的文字确定为印刷体文字。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,所述方法还包括:
获取所述用户的眼睛对应的视线落点;
判断所述视线落点是否在所述电子设备的屏幕上;
若是,通过所述屏幕输出所述书写内容对应的报读内容和所述书写内容。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,所述方法还包括:
对所述书写内容进行检测,以获得所述书写内容中的错误内容;
针对所述错误内容对应的标准答案进行报读;
当接收到所述用户输入的求助指令时,获取所述电子设备保存的联系人列表中与所述用户互动频率最高的目标联系人;
将所述错误内容对应的标准答案发送给所述目标联系人的目标电子设备;
接收所述目标电子设备发送的目标提示信息,并将所述目标提示信息输出给用户;
其中,所述目标提示信息为所述目标联系人根据所述错误内容对应的标准答案输入至所述目标电子设备,并由所述目标电子设备发送给所述电子设备的、与所述错误内容相匹配的释义。
本发明实施例第二方面公开一种电子设备,包括:
采集单元,用于当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从所述坐标信息中确定若干个目标坐标;
区域确定单元,用于当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述若干个目标坐标确定所述目标图像中的有效书写区域;
识别单元,用于当检测到所述有效书写区域中包含印刷体文字时,将所述印刷体文字从所述有效书写区域中删除,并从删除所述印刷体文字的有效书写区域中识别出书写内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述采集单元包括:
构建子单元,用于当电子设备处于听写模式时,以书写页面中心位置为原点,以与所述电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与所述电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系;
采集子单元,用于采集用户在所述书写页面写入的书写内容在所述目标坐标系上的坐标信息;
确定子单元,用于从所述坐标信息中确定出所述书写内容左上角的书写字词的第一坐标、所述书写内容右上角的书写字词的第二坐标、所述书写内容左下角的书写字词的第三坐标和所述书写内容右下角的书写字词的第四坐标;
以及,所述区域确定单元,具体用于当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述第一坐标、所述第二坐标、所述第三坐标和所述第四坐标确定所述目标图像中的有效书写区域。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第一检测单元,用于以印刷体文字库中的文字为基准,对所述有效书写区域中的文字进行检测,以获得所述有效书写区域中的文字的置信度;
印刷体确定单元,用于将置信度高于预设阈值的文字确定为印刷体文字。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第一获取单元,用于在所述识别单元从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,获取所述用户的眼睛对应的视线落点;
判断单元,用于判断所述视线落点是否在所述电子设备的屏幕上;
输出单元,用于当所述判断单元判断出所述视线落点在所述电子设备的屏幕上时,通过所述屏幕输出所述书写内容对应的报读内容和所述书写内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第二检测单元,用于在所述识别单元从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,对所述书写内容进行检测,以获得所述书写内容中的错误内容;
报读单元,用于针对所述错误内容对应的标准答案进行报读
第二获取单元,用于当接收到所述用户输入的求助指令时,获取所述电子设备保存的联系人列表中与所述用户互动频率最高的目标联系人;
发送单元,用于将所述错误内容对应的标准答案发送给所述目标联系人的目标电子设备;
接收单元,用于接收所述目标电子设备发送的目标提示信息,并将所述目标提示信息输出给用户;
其中,所述目标提示信息为所述目标联系人根据所述错误内容对应的标准答案输入至所述目标电子设备,并由所述目标电子设备发送给所述电子设备的、与所述错误内容相匹配的释义。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种识别书写内容的方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种识别书写内容的方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从该坐标信息中确定若干个目标坐标,当检测到听写结束指令时,拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,并从删除印刷体文字的有效书写区域中识别出书写内容。可见,实施本发明实施例,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种识别书写内容的方法的流程示意图;
图2是本发明实施例公开的另一种识别书写内容的方法的流程示意图;
图3是本发明实施例公开的又一种识别书写内容的方法的流程示意图;
图4是本发明实施例公开的一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图;
图6是本发明实施例公开的又一种电子设备的结构示意图;
图7是本发明实施例公开的再一种电子设备的结构示意图;
图8是本发明实施例公开的一种电子设备听写过程的示例图;
图9是本发明实施例公开的一种有效书写区域的示例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本发明中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本发明中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明实施例公开了一种识别书写内容的方法及电子设备,能够提高书写内容的识别准确率。本发明实施例公开的识别书写内容的方法适用于家教机、学习机、学习平板或学习电脑等各类电子设备,本发明实施例不做限定。各类电子设备的操作系统可包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、Black Berry(黑莓)操作系统、Windows Phone8操作系统等等,本发明实施例不做限定。以下结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种识别书写内容的方法的流程示意图。如图1所示,该方法可以包括以下步骤。
101、当电子设备处于听写模式时,电子设备采集用户在书写页面上写入的书写内容的坐标信息,并从坐标信息中确定若干个目标坐标。
本发明实施例中,电子设备可以为家教机、学习机、学习平板或学习电脑等各类设备,本发明实施例不作限定。其中,电子设备可以支持包括但不限于以下网络技术:全球移动通信系统(Global System for Mobile Communications,GSM)、通用分组无线业务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA),宽带码分多址(W-CDMA)、CDMA2000、IMT单载波(IMT Single Carrier)、增强型数据速率GSM演进(Enhanced Data Rates for GSM Evolution,EDGE)、长期演进技术(Long-Term Evolution,LTE)、高级长期演进技术、时分长期演进技术(Time-Division LTE,TD-LTE)、高性能无线电局域网(High Performance Radio Local Area Network,HiperLAN)、高性能无线电广域网(HiperWAN)、本地多点派发业务(Local Multipoint DistributionService,LMDS)、全微波存取全球互通(WiMAX)、紫蜂协议(ZigBee)、蓝牙、正交频分复用技术(OFDM)、大容量空分多路存取(HC-SDMA)、通用移动电信系统(UMTS)、通用移动电信系统时分双工(UMTS-TDD)、演进式高速分组接入(HSPA+)、时分同步码分多址(TD-SCDMA)、演进数据最优化(EV-DO)、数字增强无绳通信(DECT)及其他。
本发明实施例中,可选的,电子设备可以设置有拍摄模组,相应地电子设备可以通过其设置的拍摄模组采集用户在书写页面上写入的书写内容的坐标信息。
本发明实施例中,可选的,书写页面下面可以设置有传感器(如压力传感器、电容传感器等),相应地电子设备可以通过传感器采集用户在书写页面上写入的书写内容的坐标信息。
请一并参阅图8,图8是本发明实施例公开的一种电子设备听写过程的示例图。如图8所示,图中设备主体10设置有拍摄模组20,电子设备可以控制拍摄模组进行拍摄,在拍摄模组20正前方还可以设置有反光装置30(例如,反光镜、棱镜或凸透镜等),反光装置30用于改变拍摄模组20的光路,进而使得拍摄模组20可以拍摄到指定区域40。通过使设备主体10的拍摄模组20拍摄到指定区域40上放置的书写页面在反光装置30中的成像,而不用手动改变设备主体10的放置方式,能够简化拍摄过程,提高拍摄效率。其中,指定区域40上放置的书写页面具体可以为书本、练习册、绘本、试卷等,本发明实施例不做具体限定。在本发明实施例中,当电子设备处于听写模式时,用户在书写页面上写入书写内容之后,电子设备可以采集书写内容的坐标信息。
作为一种可选的实施方式,步骤101当电子设备处于听写模式时,电子设备采集用户在书写页面上写入的书写内容的坐标信息,并从坐标信息中确定若干个目标坐标的方式可以为:
当电子设备处于听写模式时,以书写页面中心位置为原点,以与电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系;
采集用户在书写页面写入的书写内容在目标坐标系上的坐标信息;
从坐标信息中确定出书写内容左上角的书写字词的第一坐标、书写内容右上角的书写字词的第二坐标、书写内容左下角的书写字词的第三坐标和书写内容右下角的书写字词的第四坐标;
以及,步骤102当检测到听写结束指令时,电子设备拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域的方式可以为:
当检测到听写结束指令时,拍摄书写页面以获得目标图像,并根据第一坐标、第二坐标、第三坐标和第四坐标确定目标图像中的有效书写区域。
请一并参阅图9,图9是本发明实施例公开的一种有效书写区域的示例图。如图9所示,其中,“床前明月光,疑是地上霜。举头望明月,低头思故乡”为用户在书写页面上写入的书写内容,“小学一年级”为书写页面上的印刷体文字,虚线方框为有效书写区域。在本发明实施例中,电子设备以书写页面中心位置为原点,以与电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系,接着采集用户在书写页面写入的书写内容在目标坐标系上的坐标信息,此时,书写内容左上角的书写字词的第一坐标为“床”字对应的坐标、书写内容右上角的书写字词的第二坐标为“光”字对应的坐标、书写内容左下角的书写字词的第三坐标为“低”字对应的坐标、书写内容右下角的书写字词的第四坐标为“乡”字对应的坐标。当检测到听写结束指令时,电子设备拍摄书写页面以获得目标图像,此时电子设备可以根据“床”字对应的坐标、“光”字对应的坐标、“低”字对应的坐标和“乡”字对应的坐标确定出有效书写区域,如图9的虚线方框所示。
实施该可选的实施方式,提供了一种目标坐标的确定方法,能够提高目标坐标的确定效率;此外,提供了一种有效书写区域的确定方法,能够提高有效书写区域的确定效率。
102、当检测到听写结束指令时,电子设备拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域。
本发明实施例中,可选的,电子设备可以设置有拍摄模组,相应地电子设备可以通过其设置的拍摄模组拍摄书写页面以获得目标图像。
本发明实施例中,电子设备可以根据步骤101确定的若干个目标坐标进一步确定出目标图像中的有效书写区域。
作为一种可选的实施方式,步骤101-步骤102有效书写区域的确定还可以通过以下步骤实现:
获取电子设备保存的历史听写记录中的多个历史有效书写区域信息;其中,历史有效书写区域信息至少包括历史有效书写区域的位置和历史有效书写区域的大小;
根据上述多个历史有效书写区域信息确定有效书写区域。
实施该可选的实施方式,根据历史听写记录中的历史有效书写区域的位置和大小确定出有效书写区域,能够以用户的听写习惯为基准,提高有效书写区域的准确度。
进一步地,作为一种可选的实施方式,根据多个历史有效书写区域信息确定有效书写区域的方式可以为:根据多个历史有效书写区域信息,在书写页面上虚拟出多个历史有效书写区域,取多个历史有效书写区域的并集以获得有效书写区域。
实施该可选的实施方式,根据多个历史有效书写区域的并集确定有效书写区域,能够保证有效书写区域的完整性。
103、当检测到有效书写区域中包含印刷体文字时,电子设备将印刷体文字从有效书写区域中删除,并从删除了印刷体文字的有效书写区域中识别出书写内容。
本发明实施例中,电子设备可以利用光学字符识别(Optical CharacterRecognition,OCR)技术从删除了印刷体文字的有效书写区域中识别出书写内容。具体地,电子设备可以检测删除了印刷体文字的有效书写区域中的字符,通过检测暗、亮的模式确定其形状,然后利用OCR技术将形状翻译成计算机可读的文字信息。
作为一种可选的实施方式,电子设备还可以执行以下步骤:
以印刷体文字库中的文字为基准,对有效书写区域中的文字进行检测,以获得有效书写区域中的文字的置信度;
将置信度高于预设阈值的文字确定为印刷体文字。
本发明实施例中,印刷体文字库为印刷时用的字体对应的文字数据库或类似印刷时用的字体对应的文字数据库,本发明实施例不作限定。
本发明实施例中,置信度为一个概率样本对某个总体参数的区间估计,展现的是这个概率样本的真实值有一定概率落在测量结果的周围的程度,即被测量的概率样本的测量值的可信程度。
本发明实施例中,预设阈值可以为测试人员经根据大量的实验结果而设定的阈值,本发明实施例不作限定。
实施该可选的实施方式,提供了一种印刷体文字的识别方法,以印刷体文字库中的文字为基准,检测有效书写区域中的文字的置信度,并将置信度高于预设阈值的文字确定为印刷体文字,能够提高印刷体文字的识别准确度。
可见,实施图1所描述的方法,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;另外,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种识别书写内容的方法的流程示意图。如图2所示,该方法可以包括以下步骤。
201、当电子设备处于听写模式时,电子设备采集用户在书写页面上写入的书写内容的坐标信息,并从坐标信息中确定若干个目标坐标。
202、当检测到听写结束指令时,电子设备拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域。
203、当检测到有效书写区域中包含印刷体文字时,电子设备将印刷体文字从有效书写区域中删除,并从删除了印刷体文字的有效书写区域中识别出书写内容。
204、电子设备获取用户的眼睛对应的视线落点。
本发明实施例中,电子设备可以利用眼球追踪(Eye tracking)技术追踪用户的眼球,然后根据用户的眼球注视方向即可获得用户的眼睛对应的视线落点。
本发明实施例中,电子设备根据报读内容进行报读,用户根据该报读内容在书写页面上写入书写内容,当听写结束时,有时候用户想要将报读内容和书写内容进行对比,以便分析自己的不足,此时,用户可以注视电子设备的屏幕,电子设备可以获取用户的眼睛对应的视线落点,若该视线落点在屏幕上,电子设备通过屏幕输出书写内容对应的报读内容和书写内容。
205、电子设备判断视线落点是否在电子设备的屏幕上;如果是,执行步骤206;反之,结束本流程。
本发明实施例中,电子设备根据步骤204获取的用户的眼睛对应的视线落点,进一步判断该视线落点是否在电子设备的屏幕上,如果是,表明用户正在注视电子设备的屏幕,电子设备执行步骤206通过屏幕输出书写内容对应的报读内容和书写内容。
206、电子设备通过屏幕输出书写内容对应的报读内容和书写内容。
本发明实施例中,电子设备根据报读内容进行报读,用户根据该报读内容在书写页面上写入书写内容,因此,当用户的眼睛对应的视线落点在电子设备的屏幕上时,表明用户需要观看报读内容和书写内容,电子设备可以通过屏幕输出书写内容对应的报读内容和书写内容供用户进行观看。
本发明实施例中,报读内容和书写内容在屏幕上的输出位置可以为上下并列输出,也可以为左右并列输出,还可以为先后顺序输出,本发明实施例对报读内容和书写内容在屏幕上的输出位置不作限定。
本发明实施例中,实施步骤204-步骤206,通过获取用户的眼睛对应的视线落点,若电子设备判断出该视线落点在屏幕上,电子设备通过屏幕输出书写内容对应的报读内容和书写内容,能够提高用户的使用体验。
作为一种可选的实施方式,在步骤206电子设备通过屏幕输出书写内容对应的报读内容和书写内容之后,还可以执行以下步骤:
对比报读内容和书写内容以获得错误书写子内容;
将错误书写子内容对应的报读内容中的标准子答案进行标注;
当检测到用户点击标准子答案所在屏幕上的位置时,放大该标准子答案,以使屏幕上只显示该标准子答案;
开始计时并在计时时长达到预设时长时,控制屏幕熄屏以进入待机状态,同时输出引导信息引导用户在书写页面上书写标准子答案。
本发明实施例中,在电子设备通过屏幕输出书写内容对应的报读内容和书写内容之后,可以对比报读内容和书写内容获得错误书写子内容,并将与错误书写子内容对应的报读内容中的标准子答案进行标注(如标黄色),以突出显示给用户,接着当检测到用户点击标准子答案所在屏幕上的位置时,放大该标准子答案,以使屏幕上只显示该标准子答案,用户可以在预设时长(比如3秒)内记住该标准子答案,当计时时长达到预设时长时,然后电子设备控制屏幕熄屏以进入待机状态,同时输出引导信息引导用户在书写页面上书写标准子答案。
实施该可选的实施方式,通过突出显示书写内容中错误书写子内容对应的报读内容中的标准子答案,并在当用户点击该标准子答案时控制屏幕只显示该标准子答案,设置预设时长给用户记住该标准子答案,然后熄屏并引导用户在书写页面上书写该标准子答案,有利于用户进一步巩固学习。
可见,实施图2所描述的方法,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;另外,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。此外,实施图2所描述的方法,通过获取用户的眼睛对应的视线落点,若判断出该视线落点在屏幕上,则通过屏幕输出书写内容对应的报读内容和书写内容,能够提高用户的使用体验。
实施例三
请参阅图3,图3是本发明实施例公开的又一种识别书写内容的方法的流程示意图。如图3所示,该方法可以包括以下步骤。
301、当电子设备处于听写模式时,电子设备采集用户在书写页面上写入的书写内容的坐标信息,并从坐标信息中确定若干个目标坐标。
302、当检测到听写结束指令时,电子设备拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域。
303、当检测到有效书写区域中包含印刷体文字时,电子设备将印刷体文字从有效书写区域中删除,并从删除了印刷体文字的有效书写区域中识别出书写内容。
304、电子设备对书写内容进行检测,以获得书写内容中的错误内容。
本发明实施例中,电子设备可以根据报读内容对书写内容进行检测,与报读内容相比,书写内容中与报读内容不同的文字即为书写内容中的错误内容。举例来说,报读内容为“床前明月光,疑是地上霜。举头望明月,低头思故乡”,书写内容为“床前明月光,疑是地上霜。谁知盘中餐,粒粒皆辛苦”,此时错误内容为“谁知盘中餐,粒粒皆辛苦”。
本发明实施例中,当电子设备获的书写内容中的错误内容之后,可以针对错误内容对应的标准答案进行报读,如果用户仍然不理解,可以向他人进行求助,此时用户对电子设备输入求助指令,当电子设备接收到用户输入的求助指令时,可以获取电子设备保存的联系人列表中与用户互动频率最高的目标联系人,并将错误内容对应的标准答案发送给目标联系人的目标电子设备,接着目标联系人可以根据错误内容对应的标准答案,结合自己的想法编辑目标提示信息,然后通过目标电子设备转发给用户的电子设备,最后电子设备将该目标提示信息输出给用户,以便用户进一步巩固学习。
305、电子设备针对错误内容对应的标准答案进行报读。
本发明实施例中,书写内容中与报读内容不同的文字即为书写内容中的错误内容,而错误内容对应的报读内容即为错误内容对应的标准答案,举例来说,报读内容为“床前明月光,疑是地上霜。举头望明月,低头思故乡”,书写内容为“床前明月光,疑是地上霜。谁知盘中餐,粒粒皆辛苦”,此时错误内容为“谁知盘中餐,粒粒皆辛苦”,而错误内容对应的标准答案为“举头望明月,低头思故乡”。
306、当接收到用户输入的求助指令时,电子设备获取电子设备保存的联系人列表中与用户互动频率最高的目标联系人。
本发明实施例中,求助指令可以为语音指令,也可以为文字指令,本发明实施例不作限定。
本发明实施例中,互动频率可以为与用户通过电子设备进行交互(比如聊天、做题等)的次数,本发明实施例不作限定。电子设备将联系人列表中与用户互动频率最高的联系人作为目标联系人,有利于用户通过请教实现进一步交友。
307、电子设备将错误内容对应的标准答案发送给目标联系人的目标电子设备。
308、电子设备接收目标电子设备发送的目标提示信息,并将该目标提示信息输出给用户。
本发明实施例中,目标提示信息为目标联系人根据错误内容对应的标准答案输入至目标电子设备,并由目标电子设备发送给电子设备的、与错误内容相匹配的释义。
举例来说,报读内容为“床前明月光,疑是地上霜。举头望明月,低头思故乡”,书写内容为“床前明月光,疑是地上霜。谁知盘中餐,粒粒皆辛苦”,此时错误内容为“谁知盘中餐,粒粒皆辛苦”,而错误内容对应的标准答案为“举头望明月,低头思故乡”。此时电子设备将“举头望明月,低头思故乡”发送给目标联系人的目标电子设备,目标联系人根据“举头望明月,低头思故乡”这句古诗,结合自己的想法编辑目标提示信息,如“我禁不住抬起头来,看那天窗外空中的一轮明月,不由得低头沉思,想起远方的家乡”,然后通过目标电子设备转发给用户的电子设备,最后电子设备将该目标提示信息输出给用户,以便用户进一步巩固学习。
本发明实施例中,实施步骤304-步骤308,当再次报读用户仍不理解时,可以根据用户输入的求助指令向与用户互动频率最高的目标联系人进行请教,一方面,有利于用户进一步巩固学习,另一方面,有利于用户通过请教实现进一步交友。
可见,实施图3所描述的方法,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;另外,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。此外,实施图3所描述的方法,当再次报读用户仍不理解时,可以根据用户输入的求助指令向与用户互动频率最高的目标联系人进行请教,一方面,有利于用户进一步巩固学习,另一方面,有利于用户通过请教实现进一步交友。
实施例四
请参阅图4,图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示,该电子设备可以包括:
采集单元401,用于当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从坐标信息中确定若干个目标坐标。
本发明实施例中,可选的,电子设备可以设置有拍摄模组,相应地采集单元401可以通过其设置的拍摄模组采集用户在书写页面上写入的书写内容的坐标信息。
本发明实施例中,可选的,书写页面下面可以设置有传感器(如压力传感器、电容传感器等),相应地采集单元401可以通过传感器采集用户在书写页面上写入的书写内容的坐标信息。
区域确定单元402,用于当检测到听写结束指令时,拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域。
本发明实施例中,可选的,电子设备可以设置有拍摄模组,相应地区域确定单元402可以通过其设置的拍摄模组拍摄书写页面以获得目标图像。
本发明实施例中,电子设备可以根据步骤101确定的若干个目标坐标进一步确定出目标图像中的有效书写区域。
作为一种可选的实施方式,电子设备还可以包括未图示的区域信息获取单元,其中:
区域信息获取单元,用于获取电子设备保存的历史听写记录中的多个历史有效书写区域信息;其中,历史有效书写区域信息至少包括历史有效书写区域的位置和历史有效书写区域的大小;
区域确定单元402,还用于根据上述多个历史有效书写区域信息确定有效书写区域。
实施该可选的实施方式,根据历史听写记录中的历史有效书写区域的位置和大小确定出有效书写区域,能够以用户的听写习惯为基准,提高有效书写区域的准确度。
进一步地,作为一种可选的实施方式,区域确定单元402用于根据多个历史有效书写区域信息确定有效书写区域的方式具体可以为:根据多个历史有效书写区域信息,在书写页面上虚拟出多个历史有效书写区域,取多个历史有效书写区域的并集以获得有效书写区域。
实施该可选的实施方式,根据多个历史有效书写区域的并集确定有效书写区域,能够保证有效书写区域的完整性。
识别单元403,用于当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,并从删除了印刷体文字的有效书写区域中识别出书写内容。
作为一种可选的实施方式,采集单元401可以包括以下未图示的子单元:
构建子单元,用于当电子设备处于听写模式时,以书写页面中心位置为原点,以与电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系;
采集子单元,用于采集用户在书写页面写入的书写内容在目标坐标系上的坐标信息;
确定子单元,用于从坐标信息中确定出书写内容左上角的书写字词的第一坐标、书写内容右上角的书写字词的第二坐标、书写内容左下角的书写字词的第三坐标和书写内容右下角的书写字词的第四坐标;
以及,区域确定单元402用于拍摄书写页面以获得目标图像,并根据若干个目标坐标确定目标图像中的有效书写区域的方式具体可以为:当检测到听写结束指令时,拍摄书写页面以获得目标图像,并根据第一坐标、第二坐标、第三坐标和第四坐标确定目标图像中的有效书写区域。
实施该可选的实施方式,提供了一种目标坐标的确定方法,能够提高目标坐标的确定效率;此外,提供了一种有效书写区域的确定方法,能够提高有效书写区域的确定效率。
作为一种可选的实施方式,电子设备还可以包括以下未图示的单元:
第一检测单元,用于以印刷体文字库中的文字为基准,对有效书写区域中的文字进行检测,以获得有效书写区域中的文字的置信度;
印刷体确定单元,用于将置信度高于预设阈值的文字确定为印刷体文字。
本发明实施例中,印刷体文字库为印刷时用的字体对应的文字数据库或类似印刷时用的字体对应的文字数据库,本发明实施例不作限定。
本发明实施例中,置信度为一个概率样本对某个总体参数的区间估计,展现的是这个概率样本的真实值有一定概率落在测量结果的周围的程度,即被测量的概率样本的测量值的可信程度。
本发明实施例中,预设阈值可以为测试人员经根据大量的实验结果而设定的阈值,本发明实施例不作限定。
实施该可选的实施方式,提供了一种印刷体文字的识别方法,以印刷体文字库中的文字为基准,检测有效书写区域中的文字的置信度,并将置信度高于预设阈值的文字确定为印刷体文字,能够提高印刷体文字的识别准确度。
可见,实施图4所描述的电子设备,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;另外,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。其中,图5所示的电子设备是由图4所示的电子设备进一步优化得到的。与图4所示的电子设备相比较,图5所示的电子设备还可以包括:
第一获取单元404,用于在识别单元403从删除了印刷体文字的有效书写区域中识别出书写内容之后,获取用户的眼睛对应的视线落点。
本发明实施例中,第一获取单元404可以利用眼球追踪(Eye tracking)技术追踪用户的眼球,然后根据用户的眼球注视方向即可获得用户的眼睛对应的视线落点。
判断单元405,用于判断视线落点是否在电子设备的屏幕上。
输出单元406,用于当判断单元405判断出视线落点在电子设备的屏幕上时,通过屏幕输出书写内容对应的报读内容和书写内容。
本发明实施例中,报读内容和书写内容在屏幕上的输出位置可以为上下并列输出,也可以为左右并列输出,还可以为先后顺序输出,本发明实施例对报读内容和书写内容在屏幕上的输出位置不作限定。
作为一种可选的实施方式,在输出单元406通过屏幕输出书写内容对应的报读内容和书写内容之后,还可以执行以下步骤:
对比报读内容和书写内容以获得错误书写子内容;
将错误书写子内容对应的报读内容中的标准子答案进行标注;
当检测到用户点击标准子答案所在屏幕上的位置时,放大该标准子答案,以使屏幕上只显示该标准子答案;
开始计时并在计时时长达到预设时长时,控制屏幕熄屏以进入待机状态,同时输出引导信息引导用户在书写页面上书写标准子答案。
本发明实施例中,在输出单元406通过屏幕输出书写内容对应的报读内容和书写内容之后,可以对比报读内容和书写内容获得错误书写子内容,并将与错误书写子内容对应的报读内容中的标准子答案进行标注(如标黄色),以突出显示给用户,接着当检测到用户点击标准子答案所在屏幕上的位置时,放大该标准子答案,以使屏幕上只显示该标准子答案,用户可以在预设时长(比如3秒)内记住该标准子答案,当计时时长达到预设时长时,控制屏幕熄屏以进入待机状态,同时输出引导信息引导用户在书写页面上书写标准子答案。
实施该可选的实施方式,通过突出显示书写内容中错误书写子内容对应的报读内容中的标准子答案,并在当用户点击该标准子答案时控制屏幕只显示该标准子答案,设置预设时长给用户记住该标准子答案,然后熄屏并引导用户在书写页面上书写该标准子答案,有利于用户进一步巩固学习。
可见,实施图5所描述的电子设备,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;另外,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。此外,实施图5所描述的电子设备,通过获取用户的眼睛对应的视线落点,若判断出该视线落点在屏幕上,则通过屏幕输出书写内容对应的报读内容和书写内容,能够提高用户的使用体验。
实施例六
请参阅图6,图6是本发明实施例公开的又一种电子设备的结构示意图。其中,图6所示的电子设备是由图4所示的电子设备进一步优化得到的。与图4所示的电子设备相比较,图6所示的电子设备还可以包括:
第二检测单元407,用于在识别单元403从删除了印刷体文字的有效书写区域中识别出书写内容之后,对书写内容进行检测,以获得书写内容中的错误内容。
报读单元408,用于针对错误内容对应的标准答案进行报读。
第二获取单元409,用于当接收到用户输入的求助指令时,获取电子设备保存的联系人列表中与用户互动频率最高的目标联系人。
本发明实施例中,求助指令可以为语音指令,也可以为文字指令,本发明实施例不作限定。
本发明实施例中,互动频率可以为与用户通过电子设备进行交互(比如聊天、做题等)的次数,本发明实施例不作限定。第二获取单元409将联系人列表中与用户互动频率最高的联系人作为目标联系人,有利于用户通过请教实现进一步交友。
发送单元410,用于将错误内容对应的标准答案发送给目标联系人的目标电子设备。
接收单元411,用于接收目标电子设备发送的目标提示信息,并将该目标提示信息输出给用户。
本发明实施例中,目标提示信息为目标联系人根据错误内容对应的标准答案输入至目标电子设备,并由目标电子设备发送给电子设备的、与错误内容相匹配的释义。
可见,实施图6所描述的电子设备,通过书写内容的坐标信息从拍摄书写页面得到的目标图像中确定出有效书写区域,能够缩小识别范围,针对书写内容所在区域进行识别,提高识别效率;另外,当检测到有效书写区域中包含印刷体文字时,将印刷体文字从有效书写区域中删除,能够排除书写页面的印刷体文字的影响,即进行书写内容的识别时不会检测到与本次听写无关的印刷体文字,能够提高书写内容的识别准确率,从而提高听写检测效率。此外,实施图6所描述的电子设备,当再次报读用户仍不理解时,可以根据用户输入的求助指令向与用户互动频率最高的目标联系人进行请教,一方面,有利于用户进一步巩固学习,另一方面,有利于用户通过请教实现进一步交友。
实施例七
请参阅图7,图7是本发明实施例公开的再一种电子设备的结构示意图。如图7所示,该电子设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行图1~图3任意一种识别书写内容的方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图3任意一种识别书写内容的方法。
本发明实施例公开一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行图1~图3任意一种识别书写内容的方法。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
在本发明的各种实施例中,应理解,“A和/或B”的含义指的是A和B各自单独存在或者A和B同时存在的情况均包括在内。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种识别书写内容的方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种识别书写内容的方法,其特征在于,包括:
当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从所述坐标信息中确定若干个目标坐标;
当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述若干个目标坐标确定所述目标图像中的有效书写区域;
当检测到所述有效书写区域中包含印刷体文字时,将所述印刷体文字从所述有效书写区域中删除,并从删除了所述印刷体文字的有效书写区域中识别出书写内容。
2.根据权利要求1所述的方法,其特征在于,所述当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从所述坐标信息中确定若干个目标坐标,包括:
当电子设备处于听写模式时,以书写页面中心位置为原点,以与所述电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与所述电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系;
采集用户在所述书写页面写入的书写内容在所述目标坐标系上的坐标信息;
从所述坐标信息中确定出所述书写内容左上角的书写字词的第一坐标、所述书写内容右上角的书写字词的第二坐标、所述书写内容左下角的书写字词的第三坐标和所述书写内容右下角的书写字词的第四坐标;
以及,所述当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述若干个目标坐标确定所述目标图像中的有效书写区域,包括:
当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述第一坐标、所述第二坐标、所述第三坐标和所述第四坐标确定所述目标图像中的有效书写区域。
3.根据权利2所述的方法,其特征在于,所述方法还包括:
以印刷体文字库中的文字为基准,对所述有效书写区域中的文字进行检测,以获得所述有效书写区域中的文字的置信度;
将置信度高于预设阈值的文字确定为印刷体文字。
4.根据权利要求1至3任一项所述的方法,其特征在于,在所述从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,所述方法还包括:
获取所述用户的眼睛对应的视线落点;
判断所述视线落点是否在所述电子设备的屏幕上;
若是,通过所述屏幕输出所述书写内容对应的报读内容和所述书写内容。
5.根据权利要求1至3任一项所述的方法,其特征在于,在所述从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,所述方法还包括:
对所述书写内容进行检测,以获得所述书写内容中的错误内容;
针对所述错误内容对应的标准答案进行报读;
当接收到所述用户输入的求助指令时,获取所述电子设备保存的联系人列表中与所述用户互动频率最高的目标联系人;
将所述错误内容对应的标准答案发送给所述目标联系人的目标电子设备;
接收所述目标电子设备发送的目标提示信息,并将所述目标提示信息输出给用户;
其中,所述目标提示信息为所述目标联系人根据所述错误内容对应的标准答案输入至所述目标电子设备,并由所述目标电子设备发送给所述电子设备的、与所述错误内容相匹配的释义。
6.一种电子设备,其特征在于,包括:
采集单元,用于当电子设备处于听写模式时,采集用户在书写页面上写入的书写内容的坐标信息,并从所述坐标信息中确定若干个目标坐标;
区域确定单元,用于当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述若干个目标坐标确定所述目标图像中的有效书写区域;
识别单元,用于当检测到所述有效书写区域中包含印刷体文字时,将所述印刷体文字从所述有效书写区域中删除,并从删除所述印刷体文字的有效书写区域中识别出书写内容。
7.根据权利要求6所述的电子设备,其特征在于,所述采集单元包括:
构建子单元,用于当电子设备处于听写模式时,以书写页面中心位置为原点,以与所述电子设备接触桌面的底部边缘垂直的方向为纵轴方向,以与所述电子设备接触桌面的底部边缘平行的方向为横轴方向,建立目标坐标系;
采集子单元,用于采集用户在所述书写页面写入的书写内容在所述目标坐标系上的坐标信息;
确定子单元,用于从所述坐标信息中确定出所述书写内容左上角的书写字词的第一坐标、所述书写内容右上角的书写字词的第二坐标、所述书写内容左下角的书写字词的第三坐标和所述书写内容右下角的书写字词的第四坐标;
以及,所述区域确定单元,具体用于当检测到听写结束指令时,拍摄所述书写页面以获得目标图像,并根据所述第一坐标、所述第二坐标、所述第三坐标和所述第四坐标确定所述目标图像中的有效书写区域。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第一检测单元,用于以印刷体文字库中的文字为基准,对所述有效书写区域中的文字进行检测,以获得所述有效书写区域中的文字的置信度;
印刷体确定单元,用于将置信度高于预设阈值的文字确定为印刷体文字。
9.根据权利要求6至8任一项所述的电子设备,其特征在于,所述电子设备还包括:
第一获取单元,用于在所述识别单元从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,获取所述用户的眼睛对应的视线落点;
判断单元,用于判断所述视线落点是否在所述电子设备的屏幕上;
输出单元,用于当所述判断单元判断出所述视线落点在所述电子设备的屏幕上时,通过所述屏幕输出所述书写内容对应的报读内容和所述书写内容。
10.根据权利要求6至8任一项所述的电子设备,其特征在于,所述电子设备还包括:
第二检测单元,用于在所述识别单元从删除了所述印刷体文字的有效书写区域中识别出书写内容之后,对所述书写内容进行检测,以获得所述书写内容中的错误内容;
报读单元,用于针对所述错误内容对应的标准答案进行报读
第二获取单元,用于当接收到所述用户输入的求助指令时,获取所述电子设备保存的联系人列表中与所述用户互动频率最高的目标联系人;
发送单元,用于将所述错误内容对应的标准答案发送给所述目标联系人的目标电子设备;
接收单元,用于接收所述目标电子设备发送的目标提示信息,并将所述目标提示信息输出给用户;
其中,所述目标提示信息为所述目标联系人根据所述错误内容对应的标准答案输入至所述目标电子设备,并由所述目标电子设备发送给所述电子设备的、与所述错误内容相匹配的释义。
11.一种电子设备,其特征在于,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1-5任一项所述的一种识别书写内容的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1-5任一项所述的一种识别书写内容的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910682764.6A CN111079502A (zh) | 2019-07-26 | 2019-07-26 | 一种识别书写内容的方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910682764.6A CN111079502A (zh) | 2019-07-26 | 2019-07-26 | 一种识别书写内容的方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111079502A true CN111079502A (zh) | 2020-04-28 |
Family
ID=70310111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910682764.6A Pending CN111079502A (zh) | 2019-07-26 | 2019-07-26 | 一种识别书写内容的方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079502A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008140325A (ja) * | 2006-12-05 | 2008-06-19 | Fuji Xerox Co Ltd | 筆記情報処理装置、情報生成装置、及びプログラム |
CN106354752A (zh) * | 2016-08-16 | 2017-01-25 | 广东小天才科技有限公司 | 一种文字查找方法及装置、电子设备 |
CN107533647A (zh) * | 2015-04-24 | 2018-01-02 | 富士通株式会社 | 输入控制程序、输入控制装置、输入控制方法、字符修正程序、字符修正装置以及字符修正方法 |
CN109558511A (zh) * | 2018-12-12 | 2019-04-02 | 广东小天才科技有限公司 | 一种听写报读方法及装置 |
CN109598272A (zh) * | 2019-01-11 | 2019-04-09 | 北京字节跳动网络技术有限公司 | 字符行图像的识别方法、装置、设备及介质 |
CN109634552A (zh) * | 2018-12-17 | 2019-04-16 | 广东小天才科技有限公司 | 一种应用于听写的报读控制方法及终端设备 |
CN110020692A (zh) * | 2019-04-13 | 2019-07-16 | 南京红松信息技术有限公司 | 一种基于印刷体模板的手写体分离与定位方法 |
-
2019
- 2019-07-26 CN CN201910682764.6A patent/CN111079502A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008140325A (ja) * | 2006-12-05 | 2008-06-19 | Fuji Xerox Co Ltd | 筆記情報処理装置、情報生成装置、及びプログラム |
CN107533647A (zh) * | 2015-04-24 | 2018-01-02 | 富士通株式会社 | 输入控制程序、输入控制装置、输入控制方法、字符修正程序、字符修正装置以及字符修正方法 |
CN106354752A (zh) * | 2016-08-16 | 2017-01-25 | 广东小天才科技有限公司 | 一种文字查找方法及装置、电子设备 |
CN109558511A (zh) * | 2018-12-12 | 2019-04-02 | 广东小天才科技有限公司 | 一种听写报读方法及装置 |
CN109634552A (zh) * | 2018-12-17 | 2019-04-16 | 广东小天才科技有限公司 | 一种应用于听写的报读控制方法及终端设备 |
CN109598272A (zh) * | 2019-01-11 | 2019-04-09 | 北京字节跳动网络技术有限公司 | 字符行图像的识别方法、装置、设备及介质 |
CN110020692A (zh) * | 2019-04-13 | 2019-07-16 | 南京红松信息技术有限公司 | 一种基于印刷体模板的手写体分离与定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108762507B (zh) | 图像跟踪方法及装置 | |
CN109766412B (zh) | 一种基于图像识别的学习内容获取方法及电子设备 | |
CN107451127B (zh) | 一种基于图像的单词翻译方法及系统、移动设备 | |
CN109783613B (zh) | 一种搜题方法及系统 | |
CN111078179B (zh) | 一种听写报读进度的控制方法及电子设备 | |
CN111077992B (zh) | 一种点读方法、电子设备及存储介质 | |
CN111723606A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN111026901A (zh) | 一种学习内容的搜索方法及学习设备 | |
CN110858291A (zh) | 字符切分方法及装置 | |
US9641740B2 (en) | Apparatus and method for auto-focusing in device having camera | |
CN111142656B (zh) | 一种内容定位方法、电子设备及存储介质 | |
CN112163513A (zh) | 信息选取方法、系统、装置、电子设备及存储介质 | |
CN111724638B (zh) | 一种ar交互学习方法及电子设备 | |
CN111079502A (zh) | 一种识别书写内容的方法及电子设备 | |
CN111079769B (zh) | 一种书写内容的识别方法及电子设备 | |
CN110795918B (zh) | 确定阅读位置的方法、装置及设备 | |
CN111079504A (zh) | 一种文字识别方法及电子设备 | |
CN111078982A (zh) | 一种电子页面的检索方法、电子设备及存储介质 | |
CN111553356B (zh) | 字符识别方法及装置、学习设备、计算机可读存储介质 | |
CN111553365B (zh) | 一种题目选取的方法、装置、电子设备及存储介质 | |
CN111081104B (zh) | 一种基于课堂表现的听写内容选择方法及学习设备 | |
CN109783679B (zh) | 一种学习辅助方法及学习设备 | |
CN111027556B (zh) | 一种基于图像预处理的搜题方法及学习设备 | |
CN111028558A (zh) | 一种听写检测方法及电子设备 | |
CN111027794B (zh) | 一种听写作业的批改方法及学习设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |