CN111079736B - 一种听写内容识别方法及电子设备 - Google Patents

一种听写内容识别方法及电子设备 Download PDF

Info

Publication number
CN111079736B
CN111079736B CN201910400727.1A CN201910400727A CN111079736B CN 111079736 B CN111079736 B CN 111079736B CN 201910400727 A CN201910400727 A CN 201910400727A CN 111079736 B CN111079736 B CN 111079736B
Authority
CN
China
Prior art keywords
dictation
content
error
image
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910400727.1A
Other languages
English (en)
Other versions
CN111079736A (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910400727.1A priority Critical patent/CN111079736B/zh
Publication of CN111079736A publication Critical patent/CN111079736A/zh
Application granted granted Critical
Publication of CN111079736B publication Critical patent/CN111079736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)

Abstract

本发明实施例涉及教育技术领域,公开了一种听写内容识别方法及电子设备,该方法包括:控制拍摄模组拍摄听写图像,并识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符,以及,识别听写图像中用于指示书写方向的标识字符,从而根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。可见,通过听写图像上的标识字符可识别得到听写图像的书写方向,并根据书写方向对听写图像上的独立字符进行组合得到准确的目标听写内容,可提高电子设备在识别不同书写方向的听写内容时的准确率,从而提高听写批改的准确率。

Description

一种听写内容识别方法及电子设备
技术领域
本发明涉及教育技术领域,具体涉及一种听写内容识别方法及电子设备。
背景技术
当前,以家教机为代表的电子设备已广泛具备听写批改功能,可识别听写本上的听写内容并对听写内容进行批改。在实际使用中发现,部分用于儿童听写的听写本为了提高听写时的趣味性,设置在其上的听写区域是不规则的,从而听写内容的书写方向也不一致,而现有的电子设备只能按照常规听写本从左到右的书写方向识别听写内容,这使得电子设备在识别不同书写方向的听写内容时准确率较低,并造成听写批改错误。
发明内容
针对上述缺陷,本发明实施例公开了一种听写内容识别方法及电子设备,可提高识别听写内容的准确率,从而提高听写批改的准确率。
本发明实施例第一方面公开了一种听写内容识别方法,包括:
控制拍摄模组拍摄听写图像;
识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符;其中,所述独立字符为独立的汉字、汉语拼音或者英文字母;
识别所述听写图像中用于指示书写方向的标识字符;
根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容。
作为一种可选的实施方式,在本发明实施例的第一方面中,在所述控制拍摄模组拍摄听写图像之后,以及在所述识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之前,所述方法还包括:
根据字体结构区分所述听写图像中的印刷体字符与初始听写内容;
滤除所述听写图像中的印刷体字符及用于指示听写区域的线条组合;
对滤除后的所述听写图像进行图像增强处理,以提高对所述听写图像中的所述初始听写内容的识别率。
作为一种可选的实施方式,在本发明实施例的第一方面中,在所述识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之后,所述方法还包括:
检测所述听写图像中是否存在用于指示书写方向的标识字符;
如果是,执行所述的识别所述听写图像中用于指示书写方向的标识字符;
如果否,识别所述若干独立字符在所述听写图像上形成的字符轮廓;
根据所述字符轮廓分析得到用户书写所述若干独立字符的起始位置与结束位置;
根据所述起始位置与结束位置组合所述独立字符,得到所述目标听写内容。
作为一种可选的实施方式,在本发明实施例的第一方面中,在所述根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容之后,所述方法还包括:
对比所述目标听写内容与所述目标听写内容对应的标准答案以获得错误内容;
将所述错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种所述错误类型对应一组所述错误内容组;
分析所述错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,所述错误书写习惯用于指示用户在书写所述目标错误内容组中的错误内容时所产生的错误。
输出所述用户的错误书写习惯以及所述错误书写习惯对应的正确书写方式,以帮助所述用户正确地进行书写。
作为一种可选的实施方式,在本发明实施例的第一方面中,所述方法还
包括:
在检测到所述用户输入进行听写的指令时,查找所述用户选定的标准答案中是否存在所述错误书写习惯匹配的易错听写内容;
若存在,在听写所述易错听写内容时向所述用户输出提示信息,所述提示信息用于提示所述易错听写内容的正确书写方式。
本发明实施例第二方面公开一种电子设备,包括:
控制单元,用于控制拍摄模组拍摄听写图像;
字符切分单元,用于识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符;其中,所述独立字符为独立的汉字、汉语拼音或者英文字母;
标识识别单元,用于识别所述听写图像中用于指示书写方向的标识字符;
字符组合单元,用于根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容。
作为一种可选的实施方式,在本发明实施例的第二方面中,所述电子设备还包括:
内容区分单元,用于在所述控制单元控制拍摄模组拍摄听写图像之后,以及在所述字符切分单元识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之前,根据字体结构区分所述听写图像中的印刷体字符与初始听写内容;
滤除单元,用于滤除所述听写图像中的印刷体字符及用于指示听写区域的线条组合;
图像增强单元,用于对滤除后的所述听写图像进行图像增强处理,以提高对所述听写图像中的所述初始听写内容的识别率。
作为一种可选的实施方式,在本发明实施例的第二方面中,所述电子设备还包括:
标识检测单元,用于在所述字符切分单元识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之后,检测所述听写图像中是否存在用于指示书写方向的标识字符,如果存在,则触发所述标识识别单元执行所述的识别所述听写图像中用于指示书写方向的标识字符;
轮廓识别单元,用于在所述听写图像中不存在用于指示书写方向的标识字符时,识别所述若干独立字符在所述听写图像上形成的字符轮廓;
位置确定单元,用于根据所述字符轮廓分析得到用户书写所述若干独立字符的起始位置与结束位置;
所述字符组合单元,还用于根据所述起始位置与结束位置组合所述独立字符,得到所述目标听写内容。
作为一种可选的实施方式,在本发明实施例的第二方面中,所述电子设备还包括:
听写批改单元,用于在所述字符组合单元根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容之后,对比所述目标听写内容与所述目标听写内容对应的标准答案以获得错误内容;
类型划分单元,用于将所述错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种所述错误类型对应一组所述错误内容组;
错误分析单元,用于分析所述错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,所述错误书写习惯用于指示用户在书写所述目标错误内容组中的错误内容时所产生的错误。
第一输出单元,用于输出所述用户的错误书写习惯以及所述错误书写习惯对应的正确书写方式,以帮助所述用户正确地进行书写。
作为一种可选的实施方式,在本发明实施例的第二方面中,所述电子设备还包括:
查找单元,用于在检测到所述用户输入进行听写的指令时,查找所述用户选定的标准答案中是否存在所述错误书写习惯匹配的易错听写内容;
第二输出单元,用于在所述用户选定的标准答案中存在所述错误书写习惯匹配的易错听写内容时,在听写所述易错听写内容时向所述用户输出提示信息,所述提示信息用于提示所述易错听写内容的正确书写方式。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种听写内容识别方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种听写内容识别方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,通过控制拍摄模组拍摄听写图像,并识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符,以及,识别听写图像中用于指示书写方向的标识字符,从而根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。可见,通过听写图像上的标识字符可识别得到听写图像的书写方向,并根据书写方向对听写图像上的独立字符进行组合得到准确的目标听写内容,可提高电子设备在识别不同书写方向的听写内容时的准确率,从而提高听写批改的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种听写内容识别方法的流程示意图;
图2为本发明实施例提供的另一种听写内容识别方法的流程示意图;
图3为本发明实施例提供的一种电子设备的结构示意图;
图4是本发明实施例提供的另一种电子设备的结构示意图;
图5是本发明实施例提供的又一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种听写内容识别方法及电子设备,可以提高识别听写内容的准确率,从而提高听写批改的准确率。以下从电子设备角度出发,结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种听写内容识别方法的流程示意图。其中,图1所描述听写内容识别方法适用于家教机、智能手机、平板电脑及个人电脑等电子设备。本发明实施例以电子设备为例描述听写内容识别方法,不应构成对该方法的限定。如图1所示,该听写内容识别方法可以包括以下步骤。
101、控制拍摄模组拍摄听写图像。
本发明实施例中,用户将书写有听写内容的听写本放置在电子设备的拍摄模组的拍摄区域中,电子设备在检测到用户输入指示进行听写内容识别的指令时,控制其上的拍摄模组对听写本进行拍摄从而得到听写图像。
102、识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符。
本发明实施例中,独立字符为独立的汉字、汉语拼音或者英文字母,用户在听写过程中所书写的若干个独立字符构成了听写图像中的初始听写内容,且相邻的独立字符之间存在互相组合并构成词语或者句子的可能,因此,在尚未确定独立字符的组合方式之前,电子设备将先行识别出听写图像中的若干独立字符。
作为一种可选的实施方式,识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符,可以通过以下方式实现:电子设备可采用光学字符识别等方法识别得到听写图像中的初始听写内容,初始听写内容为无规律的字符数据,如识别得到初始听写内容(壹贰弎肆),电子设备进一步对初始听写内容中完整的独立字符进行切分,得到独立字符(壹、贰、弎、肆)并记录每一独立字符在听写图像中的位置信息,从而将初始听写内容解构为最基础的独立字符。
103、识别听写图像中用于指示书写方向的标识字符。
本发明实施例中,听写图像中存在指示书写方向的标识字符,标识字符既用于在听写过程中引导用户书写听写内容,也为电子设备识别听写内容提供了参考依据。
作为一种可选的实施方式,识别听写图像中用于指示书写方向的标识字符,可以通过以下方式实现:听写图像中用于指示书写方向的标识字符可以是指题干包含的短语,例如对于听写图像中的题干“请按照从上到下的顺序书写听写答案。”,电子设备识别其上的印刷体字符中存在匹配与预设方向字符的“上”和“下”,且“上”和“下”进一步构成了短语“从上到下”,则电子设备确定该听写图像的标识字符为“从上到下”,可见,通过检测题干,可便捷准确地识别听写图像中的标识字符。
作为另一种可选的实施方式,部分标准格式听写本是通过线条组合来指示听写区域的,若电子设备检测到匹配于特定格式听写本的线条组合,则可根据线条组合对应的标准格式听写本所限定的书写方式,来确定听写图像的书写方向。
104、根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。
本发明实施例中,在识别得到若干独立字符及独立字符对应的位置,以及听写内容的书写方向之后,即可对独立字符进行组合排序,得到正确书写顺序的目标听写内容。
作为一种可选的实施方式,根据标识字符所指示的书写方向组合独立字符,得到目标听写内容,可以通过以下方式实现:对于在步骤102中识别得到的独立字符(壹、贰、弎、肆),已知上述四个独立字符在听写图像中的位置依次为从上往下书写,且步骤103中确定了该听写图像的标识字符为“从上到下”,则电子设备根据从上到下的书写方向对上述独立字符进行组合,得到目标听写内容(壹贰弎肆)。可见,根据听写图像上的标识字符来识别书写方向,可避免因识别顺序错误造成听写内容错乱,从而可准确地识别听写图像上的听写内容。
可见,本发明实施例中,通过控制拍摄模组拍摄听写图像,并识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符,以及,识别听写图像中用于指示书写方向的标识字符,从而根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。可见,通过听写图像上的标识字符可识别得到听写图像的书写方向,并根据书写方向对听写图像上的独立字符进行组合得到准确的目标听写内容,可提高电子设备在识别不同书写方向的听写内容时的准确率,从而提高听写批改的准确率。
实施例二
请参阅图2,图2为本发明另一实施例提供的听写内容识别方法的流程示意图。如图2所示,该听写内容识别方法可以包括以下步骤。
201、控制拍摄模组拍摄听写图像。
202、识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符。
本发明实施例中,考虑听写图像上可能存在部分笔划过细的字符,或者在拍摄听写图像时由于光照角度等问题,使得听写图像的成像效果不佳,因此,有必要在识别听写内容之前对听写图像进行图像增强。
作为一种可选的实施方式,在控制拍摄模组拍摄听写图像之后,以及在识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符之前,根据字体结构区分听写图像中的印刷体字符与初始听写内容;滤除听写图像中的印刷体字符及用于指示听写区域的线条组合;对滤除后的听写图像进行图像增强处理,以提高对听写图像中的初始听写内容的识别率。具体地,电子设备可根据印刷体字符的字体结构将印刷体字符与手写的初始听写内容进行区分,此外,还可识别出听写图像上印刷的用于指示听写区域的线条组合,比如用于书写汉字的田字格,电子设备在识别并区分出听写图像上的印刷体字符、初始听写内容及线条组合之后,将对其上的印刷体字符及线条组合进行滤除,从而听写图像上只保留有用户手写的初始听写内容;在对听写图像进行滤除处理后,再对听写图像进行图像增强处理,增加书写过细的笔划的宽度,去除书写不同笔划时因连笔而产生的额外笔划,调节听写图像的亮度及对比度,从而使得初始听写图像上听写内容的字体轮廓清晰。可见,在对听写图像进行滤除处理与图像增强之后,听写内容识别过程的数据处理量得到减少,且图像质量的增强使得听写内容的识别更为准确。
203、识别听写图像中用于指示书写方向的标识字符。
本发明实施例中,用户书写听写内容的听写本可能是不包括标识字符的空白纸张,这将使得电子设备无法根据听写图像中的标识字符识别其书写方向,因此,电子设备在无法识别得到标识字符时,应有识别书写方向的备用方案。
作为一种可选的实施方式,在识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符之后,检测听写图像中是否存在用于指示书写方向的标识字符;如果是,执行步骤203以识别听写图像中用于指示书写方向的标识字符;如果否,识别若干独立字符在听写图像上形成的字符轮廓;根据字符轮廓分析得到用户书写若干独立字符的起始位置与结束位置;根据起始位置与结束位置组合独立字符,得到目标听写内容。具体地,若电子设备在听写图像中检测是否存在标识字符,若存在,则执行步骤203;若不存在,则识别若干独立字符在听写图像上所形成的字符轮廓,假设独立字符在听写图像上形成的字符轮廓为矩形轮廓,且该矩形轮廓的左上角及右下角存在内陷,则认定该矩形轮廓左上角的内陷为段首的缩进格式,该位置为用户书写时的起始位置,以及认定该矩形轮廓右下角的内陷为段末的空余位置,该位置为用户书写时的结束位置,从而根据起始位置与结束位置确定用户的书写方向,并对独立字符进行组合得到目标听写内容。可见,在听写图像缺失标识字符的情况下,通过识别字符轮廓亦可实现对独立字符进行组合。
204、根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。
205、对目标听写内容进行听写批改,并向用户输出听写批改结果。
本发明实施例中,在识别得到听写图像上的目标听写内容之后,还将对目标听写内容进行批改。
作为一种可选的实施方式,在根据标识字符所指示的书写方向组合独立字符,得到目标听写内容之后,对比目标听写内容与目标听写内容对应的标准答案以获得错误内容;将错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种错误类型对应一组错误内容组;分析错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,错误书写习惯用于指示用户在书写目标错误内容组中的错误内容时所产生的错误;输出用户的错误书写习惯以及错误书写习惯对应的正确书写方式,以帮助用户正确地进行书写。具体地,电子设备在识别得到目标听写内容之后,对比目标听写内容与目标听写内容对应的标准答案从而得到不匹配的错误内容;错误内容可分为多种错误类型,如书写错误或者同音判读错误等,可根据目标听写内容的字体结构对其错误类型进行划分,例如检测到目标听写内容中的“治”与标准答案中对应的“冶”不匹配,且“治”与“冶”在字体结构的角度上为形近字,可确定用户在听写“冶”时所书写的“治”为书写错误;通过识别并记录用户的错误内容,可得到对应于用户的若干组错误内容组,其中每一错误内容组对应一种错误类型;可选取错误类型为书写错误类型的目标错误内容组进行分析,得到用户在书写时高频产生的错误以获知用户的错误书写习惯,错误书写习惯可以是指书写长笔划时倾斜角度过大、书写合体字时部件结合不紧密或者书写不同笔划时存在连笔等书写习惯;在完成对目标听写内容的听写批改以及分析出用户的错误书写习惯之后,电子设备除了输出用户本次听写的听写结果,还将输出用户的错误书写习惯以及针对错误书写习惯的正确书写方式,从而用户可据此改正在书写时的错误书写习惯,规范书写方式。
作为另一种可选的实施方式,随着用户多次使用电子设备进行听写,电子设备将持续记录并更新用户在听写时产生的错误内容,例如只记录预设时间范围内所产生的错误内容,从而向用户输出的错误书写习惯将更为贴近用户的学习进度与现阶段的书写习惯;此外,还可统计每一错误类型的错误内容占目标听写内容的数量比率,从而将数量比率较高的错误类型对应的错误内容设为用户的高频错误内容,除了向用户输出高频错误内容的错误书写习惯以及针对错误书写习惯的正确书写方式,还将检索针对于该高频错误内容的练习题供用户练习,以帮助用户更好地进行学习。
作为又一种可选的实施方式,在检测到用户输入进行听写的指令时,查找用户选定的标准答案中是否存在错误书写习惯匹配的易错听写内容;若存在,在听写易错听写内容时向用户输出提示信息,提示信息用于提示易错听写内容的正确书写方式。具体地,在用户选定了标准答案进行听写时,电子设备还将检测标准答案中是否存在匹配于用户错误书写习惯的易错听写内容,假设用户的错误书写习惯为书写长笔划时倾斜角度过大,且标准答案中存在由长笔划构成的汉字“十”,则在对“十”进行听写时,电子设备还将向用户输出提示信息,以提示用户在书写长笔划时需要将长笔划书写规整,从而在听写过程中实时纠正用户的错误书写习惯,使用户对正确书写方式获得更为深刻的印象。
可见,本发明实施例中,通过对听写图像进行图像增强,增加了对听写内容的识别准确率;此外,在完成听写批改之后,电子设备还将针对听写结果帮助用户进行学习,学习效果良好。
实施例三
请参阅图3,图3为本发明实施例公开的一种电子设备的结构示意图。如图3所示,该电子设备可以包括:
控制单元301,用于控制拍摄模组拍摄听写图像;
字符切分单元302,用于识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符;其中,独立字符为独立的汉字、汉语拼音或者英文字母;
标识识别单元303,用于识别听写图像中用于指示书写方向的标识字符;
字符组合单元304,用于根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。
本发明实施例中,在控制单元301控制拍摄模组拍摄得到听写图像后,字符切分单元302根据听写图像切分得到若干独立字符,同时标识识别单元303识别听写图像中的标识字符,最终有字符组合单元304根据标识字符及独立字符组合得到目标听写内容。
作为一种可选的实施方式,字符切分单元302识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符,可以通过以下方式实现:字符切分单元302可采用光学字符识别等方法识别得到听写图像中的初始听写内容,初始听写内容为无规律的字符数据,如识别得到初始听写内容(壹贰弎肆),字符切分单元302进一步对初始听写内容中完整的独立字符进行切分,得到独立字符(壹、贰、弎、肆)并记录每一独立字符在听写图像中的位置信息,从而将初始听写内容解构为最基础的独立字符。
作为一种可选的实施方式,标识识别单元303识别听写图像中用于指示书写方向的标识字符,可以通过以下方式实现:听写图像中用于指示书写方向的标识字符可以是指题干包含的短语,例如对于听写图像中的题干“请按照从上到下的顺序书写听写答案。”,标识识别单元303识别其上的印刷体字符中存在匹配与预设方向字符的“上”和“下”,且“上”和“下”进一步构成了短语“从上到下”,则标识识别单元303确定该听写图像的标识字符为“从上到下”,可见,通过检测题干,可便捷准确地识别听写图像中的标识字符。
作为另一种可选的实施方式,部分标准格式听写本是通过线条组合来指示听写区域的,若标识识别单元303检测到匹配于特定格式听写本的线条组合,则可根据线条组合对应的标准格式听写本所限定的书写方式,来确定听写图像的书写方向。
作为一种可选的实施方式,字符组合单元304根据标识字符所指示的书写方向组合独立字符,得到目标听写内容,可以通过以下方式实现:对于字符切分单元302识别得到的独立字符(壹、贰、弎、肆),已知上述四个独立字符在听写图像中的位置依次为从上往下书写,且标识识别单元303确定了该听写图像的标识字符为“从上到下”,则字符组合单元304根据从上到下的书写方向对上述独立字符进行组合,得到目标听写内容(壹贰弎肆)。可见,根据听写图像上的标识字符来识别书写方向,可避免因识别顺序错误造成听写内容错乱,从而可准确地识别听写图像上的听写内容。
可见,本发明实施例中,通过控制单元301控制拍摄模组拍摄听写图像,并由字符切分单元302识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符,以及,标识识别单元303识别听写图像中用于指示书写方向的标识字符,从而字符组合单元304根据标识字符所指示的书写方向组合独立字符,得到目标听写内容。可见,字符切分单元302通过听写图像上的标识字符可识别得到听写图像的书写方向,从而字符组合单元304根据书写方向对听写图像上的独立字符进行组合得到准确的目标听写内容,可提高在识别不同书写方向的听写内容时的准确率,从而提高听写批改的准确率。
实施例四
请参阅图4,图4为本发明另一实施例提供的一种电子设备的结构示意图;图4所示的电子设备是在图3所示的电子设备的基础上进行优化得到的,图4所示的电子设备还可以包括:
内容区分单元305,用于在控制单元301控制拍摄模组拍摄听写图像之后,以及在字符切分单元302识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符之前,根据字体结构区分听写图像中的印刷体字符与初始听写内容;
滤除单元306,用于滤除听写图像中的印刷体字符及用于指示听写区域的线条组合;
图像增强单元307,用于对滤除后的听写图像进行图像增强处理,以提高对听写图像中的初始听写内容的识别率;
标识检测单元308,用于在字符切分单元302识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符之后,检测听写图像中是否存在用于指示书写方向的标识字符,如果存在,则触发标识识别单元执行的识别听写图像中用于指示书写方向的标识字符;
轮廓识别单元309,用于在听写图像中不存在用于指示书写方向的标识字符时,识别若干独立字符在听写图像上形成的字符轮廓;
位置确定单元310,用于根据字符轮廓分析得到用户书写若干独立字符的起始位置与结束位置;
其中,字符组合单元304,还用于根据起始位置与结束位置组合独立字符,得到目标听写内容;
听写批改单元311,用于在字符组合单元304根据标识字符所指示的书写方向组合独立字符,得到目标听写内容之后,对比目标听写内容与目标听写内容对应的标准答案以获得错误内容;
类型划分单元312,用于将错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种错误类型对应一组错误内容组;
错误分析单元313,用于分析错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,错误书写习惯用于指示用户在书写目标错误内容组中的错误内容时所产生的错误;
第一输出单元314,用于输出用户的错误书写习惯以及错误书写习惯对应的正确书写方式,以帮助用户正确地进行书写;
查找单元315,用于在检测到用户输入进行听写的指令时,查找用户选定的标准答案中是否存在错误书写习惯匹配的易错听写内容;
第二输出单元316,用于在用户选定的标准答案中存在错误书写习惯匹配的易错听写内容时,在所述易错听写内容时向用户输出提示信息,提示信息用于提示易错听写内容的正确书写方式。
本发明实施例中,听写图像将由图像增强单元307进行图像增强;此外,标识检测单元308还将检测听写图像中是否存在标识字符,并根据检测结果触发不同的功能单元;听写批改单元311将对目标听写内容仅听写批改,第一输出单元315与第二输出单元316向用户输出提示信息,帮助用户学习。
作为一种可选的实施方式,在控制单元301控制拍摄模组拍摄听写图像之后,以及在字符切分单元302识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符之前,内容区分单元305根据字体结构区分听写图像中的印刷体字符与初始听写内容;滤除单元306滤除听写图像中的印刷体字符及用于指示听写区域的线条组合;图像增强单元307对滤除后的听写图像进行图像增强处理,以提高对听写图像中的初始听写内容的识别率。具体地,内容区分单元305可根据印刷体字符的字体结构将印刷体字符与手写的初始听写内容进行区分,此外,内容区分单元305可识别出听写图像上印刷的用于指示听写区域的线条组合,比如用于书写汉字的田字格,在内容区分单元305识别并区分出听写图像上的印刷体字符、初始听写内容及线条组合之后,滤除单元306将对其上的印刷体字符及线条组合进行滤除,从而听写图像上只保留有用户手写的初始听写内容;在滤除单元306对听写图像进行滤除处理后,图像增强单元307再对听写图像进行图像增强处理,增加书写过细的笔划的宽度,去除书写不同笔划时因连笔而产生的额外笔划,调节听写图像的亮度及对比度,从而使得初始听写图像上听写内容的字体轮廓清晰。可见,在对听写图像进行滤除处理与图像增强之后,听写内容识别过程的数据处理量得到减少,且图像质量的增强使得听写内容的识别更为准确。
作为一种可选的实施方式,在字符切分单元302识别听写图像中的初始听写内容,将初始听写内容切分为若干独立字符之后,标识检测单元308检测听写图像中是否存在用于指示书写方向的标识字符;如果是,触发标识识别单元303以识别听写图像中用于指示书写方向的标识字符;如果否,轮廓识别单元309识别若干独立字符在听写图像上形成的字符轮廓;位置确定单元310根据字符轮廓分析得到用户书写若干独立字符的起始位置与结束位置;字符组合单元304根据起始位置与结束位置组合独立字符,得到目标听写内容。具体地,电子设备在听写图像中检测是否存在标识字符,若存在,则触发标识识别单元303;若不存在,则轮廓识别单元309识别若干独立字符在听写图像上所形成的字符轮廓,假设独立字符在听写图像上形成的字符轮廓为矩形轮廓,且该矩形轮廓的左上角及右下角存在内陷,则认定该矩形轮廓左上角的内陷为段首的缩进格式,该位置为用户书写时的起始位置,以及认定该矩形轮廓右下角的内陷为段末的空余位置,该位置为用户书写时的结束位置,从而根据起始位置与结束位置确定用户的书写方向,并对独立字符进行组合得到目标听写内容。可见,在听写图像缺失标识字符的情况下,通过识别字符轮廓亦可实现对独立字符进行组合。
作为一种可选的实施方式,在字符组合单元304根据标识字符所指示的书写方向组合独立字符,得到目标听写内容之后,听写批改单元311对比目标听写内容与目标听写内容对应的标准答案以获得错误内容;类型划分单元312将错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种错误类型对应一组错误内容组;错误分析单元313分析错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,错误书写习惯用于指示用户在书写目标错误内容组中的错误内容时所产生的错误;第一输出单元314输出用户的错误书写习惯以及错误书写习惯对应的正确书写方式,以帮助用户正确地进行书写。具体地,在字符组合单元304识别得到目标听写内容之后,听写批改单元311对比目标听写内容与目标听写内容对应的标准答案从而得到不匹配的错误内容;错误内容可分为多种错误类型,如书写错误或者同音判读错误等,类型划分单元312可根据目标听写内容的字体结构对其错误类型进行划分,例如检测到目标听写内容中的“治”与标准答案中对应的“冶”不匹配,且“治”与“冶”在字体结构的角度上为形近字,可确定用户在听写“冶”时所书写的“治”为书写错误;通过识别并记录用户的错误内容,可得到对应于用户的若干组错误内容组,其中每一错误内容组对应一种错误类型;错误分析单元313选取错误类型为书写错误类型的目标错误内容组进行分析,得到用户在书写时高频产生的错误以获知用户的错误书写习惯,错误书写习惯可以是指书写长笔划时倾斜角度过大、书写合体字时部件结合不紧密或者书写不同笔划时存在连笔等书写习惯;在完成对目标听写内容的听写批改以及分析出用户的错误书写习惯之后,第一输出单元314除了输出用户本次听写的听写结果,还将输出用户的错误书写习惯以及针对错误书写习惯的正确书写方式,从而用户可据此改正在书写时的错误书写习惯,规范书写方式。
作为另一种可选的实施方式,随着用户多次进行听写,类型划分单元312将持续记录并更新用户在听写时产生的错误内容,例如只记录预设时间范围内所产生的错误内容,从而第一输出单元314向用户输出的错误书写习惯将更为贴近用户的学习进度与现阶段的书写习惯;此外,还可统计每一错误类型的错误内容占目标听写内容的数量比率,从而将数量比率较高的错误类型对应的错误内容设为用户的高频错误内容,除了向用户输出高频错误内容的错误书写习惯以及针对错误书写习惯的正确书写方式,还将检索针对于该高频错误内容的练习题供用户练习,以帮助用户更好地进行学习。
作为又一种可选的实施方式,在检测到用户输入进行听写的指令时,查找单元315查找用户选定的标准答案中是否存在错误书写习惯匹配的易错听写内容;若存在,第二输出单元316在听写易错听写内容时向用户输出提示信息,提示信息用于提示易错听写内容的正确书写方式。具体地,在用户选定了标准答案进行听写时,查找单元315还将检测标准答案中是否存在匹配于用户错误书写习惯的易错听写内容,假设用户的错误书写习惯为书写长笔划时倾斜角度过大,且标准答案中存在由长笔划构成的汉字“十”,则在对“十”进行听写时,第二输出单元316还将向用户输出提示信息,以提示用户在书写长笔划时需要将长笔划书写规整,从而在听写过程中实时纠正用户的错误书写习惯,使用户对正确书写方式获得更为深刻的印象。
可见,本发明实施例中,通过图像增强单元307对听写图像进行图像增强,增加了对听写内容的识别准确率;此外,在完成听写批改之后,错误分析单元313还将分析听写结果,并由第一输出单元314和第二输出单元316帮助用户进行学习,学习效果良好。
实施例五
请参阅图5,图5是本发明另一实施例公开的另一种电子设备的结构示意图。如图5所示,该可电子设备可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
其中,处理器402调用存储器401中存储的可执行程序代码,执行图1和图2任意一种听写内容识别方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1和图2任意一种听写内容识别方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(RandomAccess Memory,RAM)、可编程只读存储器(Programmable Read-onlyMemory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种听写内容识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种听写内容识别方法,其特征在于,包括:
控制拍摄模组拍摄听写图像;
识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符;其中,所述独立字符为独立的汉字、汉语拼音或者英文字母;
检测所述听写图像中是否存在用于指示书写方向的标识字符;
如果是,识别所述听写图像中用于指示书写方向的标识字符;根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容;
如果否,识别所述若干独立字符在所述听写图像上形成的字符轮廓;根据所述字符轮廓分析得到用户书写所述若干独立字符的起始位置与结束位置;根据所述起始位置与结束位置组合所述独立字符,得到所述目标听写内容。
2.根据权利要求1所述的方法,其特征在于,在所述控制拍摄模组拍摄听写图像之后,以及在所述识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之前,所述方法还包括:
根据字体结构区分所述听写图像中的印刷体字符与初始听写内容;
滤除所述听写图像中的印刷体字符及用于指示听写区域的线条组合;
对滤除后的所述听写图像进行图像增强处理,以提高对所述听写图像中的所述初始听写内容的识别率。
3.根据权利要求1或2所述的方法,其特征在于,在所述根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容之后,所述方法还包括:
对比所述目标听写内容与所述目标听写内容对应的标准答案以获得错误内容;
将所述错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种所述错误类型对应一组所述错误内容组;
分析所述错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,所述错误书写习惯用于指示用户在书写所述目标错误内容组中的错误内容时所产生的错误;
输出所述用户的错误书写习惯以及所述错误书写习惯对应的正确书写方式,以帮助所述用户正确地进行书写。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在检测到所述用户输入进行听写的指令时,查找所述用户选定的标准答案中是否存在所述错误书写习惯匹配的易错听写内容;
若存在,在听写所述易错听写内容时向所述用户输出提示信息,所述提示信息用于提示所述易错听写内容的正确书写方式。
5.一种电子设备,其特征在于,包括:
控制单元,用于控制拍摄模组拍摄听写图像;
字符切分单元,用于识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符;其中,所述独立字符为独立的汉字、汉语拼音或者英文字母;
标识识别单元,用于识别所述听写图像中用于指示书写方向的标识字符;
字符组合单元,用于根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容;
所述电子设备还包括:
标识检测单元,用于在所述字符切分单元识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之后,检测所述听写图像中是否存在用于指示书写方向的标识字符,如果存在,则触发所述标识识别单元执行所述的识别所述听写图像中用于指示书写方向的标识字符;
轮廓识别单元,用于在所述听写图像中不存在用于指示书写方向的标识字符时,识别所述若干独立字符在所述听写图像上形成的字符轮廓;
位置确定单元,用于根据所述字符轮廓分析得到用户书写所述若干独立字符的起始位置与结束位置;
所述字符组合单元,还用于根据所述起始位置与结束位置组合所述独立字符,得到所述目标听写内容。
6.根据权利要求5所述的电子设备,其特征在于,所述电子设备还包括:
内容区分单元,用于在所述控制单元控制拍摄模组拍摄听写图像之后,以及在所述字符切分单元识别所述听写图像中的初始听写内容,将所述初始听写内容切分为若干独立字符之前,根据字体结构区分所述听写图像中的印刷体字符与初始听写内容;
滤除单元,用于滤除所述听写图像中的印刷体字符及用于指示听写区域的线条组合;
图像增强单元,用于对滤除后的所述听写图像进行图像增强处理,以提高对所述听写图像中的所述初始听写内容的识别率。
7.根据权利要求5或6所述的电子设备,其特征在于,所述电子设备还包括:
听写批改单元,用于在所述字符组合单元根据所述标识字符所指示的书写方向组合所述独立字符,得到目标听写内容之后,对比所述目标听写内容与所述目标听写内容对应的标准答案以获得错误内容;
类型划分单元,用于将所述错误内容按照不同的错误类型进行划分,得到若干组错误内容组,其中,一种所述错误类型对应一组所述错误内容组;
错误分析单元,用于分析所述错误类型为书写错误类型的目标错误内容组,得到用户的错误书写习惯,所述错误书写习惯用于指示用户在书写所述目标错误内容组中的错误内容时所产生的错误;
第一输出单元,用于输出所述用户的错误书写习惯以及所述错误书写习惯对应的正确书写方式,以帮助所述用户正确地进行书写。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
查找单元,用于在检测到所述用户输入进行听写的指令时,查找所述用户选定的标准答案中是否存在所述错误书写习惯匹配的易错听写内容;
第二输出单元,用于在所述用户选定的标准答案中存在所述错误书写习惯匹配的易错听写内容时,在听写所述易错听写内容时向所述用户输出提示信息,所述提示信息用于提示所述易错听写内容的正确书写方式。
CN201910400727.1A 2019-05-15 2019-05-15 一种听写内容识别方法及电子设备 Active CN111079736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910400727.1A CN111079736B (zh) 2019-05-15 2019-05-15 一种听写内容识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910400727.1A CN111079736B (zh) 2019-05-15 2019-05-15 一种听写内容识别方法及电子设备

Publications (2)

Publication Number Publication Date
CN111079736A CN111079736A (zh) 2020-04-28
CN111079736B true CN111079736B (zh) 2023-06-30

Family

ID=70310279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910400727.1A Active CN111079736B (zh) 2019-05-15 2019-05-15 一种听写内容识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN111079736B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681467B (zh) * 2020-06-01 2022-09-23 广东小天才科技有限公司 一种词汇学习方法及电子设备、存储介质
CN113436474A (zh) * 2021-06-22 2021-09-24 读书郎教育科技有限公司 一种课堂听写检查的装置及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903491A (zh) * 2014-02-14 2014-07-02 广东小天才科技有限公司 一种实现书写检查的方法及装置
CN109300347B (zh) * 2018-12-12 2021-01-26 广东小天才科技有限公司 一种基于图像识别的听写辅助方法及家教设备
CN109670504B (zh) * 2018-12-28 2021-04-16 杭州大拿科技股份有限公司 一种手写答案识别批改方法及装置
CN109598272B (zh) * 2019-01-11 2021-08-06 北京字节跳动网络技术有限公司 字符行图像的识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111079736A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN108595410B (zh) 手写作文的自动批改方法及装置
CN111353501A (zh) 一种基于深度学习的书本点读方法及系统
CN109635772A (zh) 一种听写内容的批改方法及电子设备
RU2641225C2 (ru) Способ выявления необходимости обучения эталона при верификации распознанного текста
CN110555403A (zh) 一种手写字评价方法与系统
CN107451127B (zh) 一种基于图像的单词翻译方法及系统、移动设备
JPH07200732A (ja) ワードオブジェクト抽出方法及びラスタ化イメージ内のノイズ除去方法
CN111079736B (zh) 一种听写内容识别方法及电子设备
KR20210017090A (ko) 필기 입력을 텍스트로 변환하는 방법 및 전자 장치
CN115984859B (zh) 一种图像文字识别的方法、装置及存储介质
CN111079641A (zh) 作答内容识别方法、相关设备及可读存储介质
CN111680177A (zh) 数据搜索方法及电子设备、计算机可读存储介质
CN111081103B (zh) 一种听写答案获取方法、家教设备及存储介质
US6567548B2 (en) Handwriting recognition system and method using compound characters for improved recognition accuracy
CN110795918B (zh) 确定阅读位置的方法、装置及设备
Osman Segmentation algorithm for Arabic handwritten text based on contour analysis
CN111079504A (zh) 一种文字识别方法及电子设备
US9152876B1 (en) Methods and systems for efficient handwritten character segmentation
CN111160347A (zh) 一种基于相似字符识别的文本识别方法及电子设备
CN111027556B (zh) 一种基于图像预处理的搜题方法及学习设备
CN111079725B (zh) 一种用于区分英文和拼音的方法及电子设备
CN111079769B (zh) 一种书写内容的识别方法及电子设备
JPH06215184A (ja) 抽出領域のラベリング装置
CN111079414A (zh) 一种听写检测方法、电子设备及存储介质
JP2903779B2 (ja) 文字列認識方法及びその装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant