CN113095167A - 一种图像采集方法、装置和设备 - Google Patents
一种图像采集方法、装置和设备 Download PDFInfo
- Publication number
- CN113095167A CN113095167A CN202110321412.5A CN202110321412A CN113095167A CN 113095167 A CN113095167 A CN 113095167A CN 202110321412 A CN202110321412 A CN 202110321412A CN 113095167 A CN113095167 A CN 113095167A
- Authority
- CN
- China
- Prior art keywords
- image
- point sequence
- input
- character
- input box
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例公开了一种图像采集方法、装置和设备,包括:提示待输入的文字集合并显示输入框集合,文字集合包括的文字的数量和输入框集合包括的输入框的数量相同,文字集合包括第一文字,输入框集合包括第一文字对应的第一输入框;响应于用户在第一输入框中通过手写输入第一文字,获得采集结果,该采集结果包括第一点序列和第一图像。可见,该方法使得能够准确的将每个待输入的文字书写在对应输入框里,依据输入框精确的获得每个手写文字对应的手写文字图像,确保了手写文字图像数据库中样本的准确性。
Description
技术领域
本申请涉及图像技术领域,特别是涉及一种图像采集方法、装置和设备。
背景技术
手写文字识别,需要借助手写文字图像数据库完成,换言之,手写文字识别之前,需要采集大量的手写文字图像,作为样本存储在手写文字图像数据中,供手写文字识别时使用。目前,通常是通过书写人员在图像采集装置上手动输入的方式,采集每个手写文字图像。如果使用该方式采集大量的手写文字图像,对所采集的手写文字图像进行标注比较困难,而且需要耗费大量的人力物力资源,效率较低。
基于此,亟待提供一种图像采集方法,能够简单、高效的采集大量的手写文字图像,为准确的手写文字识别作好准备。
发明内容
本申请实施例提供了一种图像采集方法、装置和设备,能够简单、快速的采集到大量的手写文字图像,为手写文字识别提供充足的数据基础,从而使得对手写文字进行精确的识别成为可能。
第一方面,本申请实施例提供了一种图像采集方法,该方法例如可以包括:
提示待输入的文字集合并显示输入框集合,所述文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,所述文字集合包括第一文字,所述输入框集合包括所述第一文字对应的第一输入框;
响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,所述采集结果包括第一点序列和第一图像。
在一种可能的实现方式中,该方法还可以包括:
对所述第一点序列中的点进行抖动处理,获得第二点序列和第二图像,所述采集结果还包括所述第二点序列和所述第二图像。
作为一个示例,所述对所述第一点序列中的点进行抖动处理,获得第二点序列,包括:
对所述第一点序列中的至少一个点在至少一个维度上进行加随机数的处理,获得所述第二点序列。
作为另一个示例,所述对所述第一点序列中的点进行抖动处理,获得第二点序列,包括:
根据所述第一点序列中的至少一个点和抖动函数,获得所述第二点序列。
作为一个示例,所述获得第二图像,包括:
对所述第二点序列进行渲染,获得所述第二点序列对应的轨迹图像,记作所述第二图像。
可选地,所述采集结果还包括所述第一输入框的位置。
可选地,所述待输入的文字集合为文本内容数据库中的文本。
在一种可能的实现方式中,如果待输入的文字集合还包括第二文字,所述输入框集合包括所述第二文字对应的第二输入框,该方法还可以包括:
响应于所述用户在所述第二输入框中通过手写输入所述第二文字,获得第三点序列和第三图像,所述采集结果还包括所述第三点序列、所述第三图像、第四点序列和第四图像,所述第四点序列为由所述第一文字和所述第二文字组成的词语或单词对应的点序列集合,所述第四图像为所述词语或单词对应的图像。
作为一个示例,该方法还可以包括:
对所述第四点序列中的点进行抖动处理,获得第五点序列和第五图像,所述采集结果还包括所述第五点序列和所述第五图像。
第二方面,本申请实施例还提供了一种图像采集装置,该装置可以包括:提示单元、显示单元和第一获得单元。其中:
提示单元,用于提示待输入的文字集合,所述文字集合包括第一文字;
显示单元,用于显示输入框集合,其中,所述文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,所述输入框集合包括所述第一文字对应的第一输入框;
第一获得单元,用于响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,所述采集结果包括第一点序列和第一图像。
在一种可能的实现方式中,该装置还可以包括:第一抖动单元和第二获得单元。其中:
该第一抖动单元,用于对所述第一点序列中的点进行抖动处理;
第二获得单元,用于获得第二点序列和第二图像,所述采集结果还包括所述第二点序列和所述第二图像。
作为一个示例,该第一抖动单元,具体用于:
对所述第一点序列中的至少一个点在至少一个维度上进行加随机数的处理,获得所述第二点序列。
作为另一个示例,该第一抖动单元,具体用于:
根据所述第一点序列中的至少一个点和抖动函数,获得所述第二点序列。
作为一个示例,该第二获得单元,具体用于:
对所述第二点序列进行渲染,获得所述第二点序列对应的轨迹图像,记作所述第二图像。
可选地,所述采集结果还包括所述第一输入框的位置。
可选地,所述待输入的文字集合为文本内容数据库中的文本。
在一种可能的实现方式中,如果待输入的文字集合还包括第二文字,所述输入框集合包括所述第二文字对应的第二输入框,该装置还可以包括:第三获得单元。
该第三获得单元,用于响应于所述用户在所述第二输入框中通过手写输入所述第二文字,获得第三点序列和第三图像,所述采集结果还包括所述第三点序列、所述第三图像、第四点序列和第四图像,所述第四点序列为由所述第一文字和所述第二文字组成的词语或单词对应的点序列集合,所述第四图像为所述词语或单词对应的图像。
作为一个示例,该装置还可以包括:第二抖动单元。
该第二抖动单元,用于对所述第四点序列中的点进行抖动处理,获得第五点序列和第五图像,所述采集结果还包括所述第五点序列和所述第五图像。
第三方面,本申请实施例还提供了一种电子设备,所述电子设备包括:处理器和存储器;其中:
所述存储器,用于存储指令或计算机程序;
所述处理器,用于执行所述存储器中的所述指令或计算机程序,以使得所述电子设备执行上述第一方面提供的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述第一方面提供的方法。
由此可见,本申请实施例具有如下有益效果:
本申请实施例提供了一种图像采集方法,在采集书写文字图像时,图像采集装置能够提示待输入的文字集合并显示输入框集合,其中,文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,所述文字集合包括第一文字,所述输入框集合包括所述第一文字对应的第一输入框;那么,响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,该采集结果可以包括但不限于与第一文字对应的第一点序列和第一图像。可见,该方法在用户进行手写输入之前,为用户提示待输入的文字集合并显示与待输入的手写文字数量相同的输入框,用户能够准确的将每个待输入的文字书写在对应输入框里,即使出现用户书写连笔字、书写潦草等情况,由于待输入的文字集合包括的文字数量、输入框集合包括的输入框数量以及用户通过手写输入的文字的数量一致,依然可以依据输入框轻松的对包括了整个手写输入的图像进行裁剪,从而精确的获得每个手写文字对应的手写文字图像,确保了手写文字图像数据库中样本的准确性。
此外,本申请实施例中,图像采集装置还能够通过对用户手写输入的文字对应的点序列的抖动处理,获得若干个该文字的不同手写形态对应的点序列和手写文字图像,不仅丰富了手写文字图像数据库中的样本,而且提高了采集手写文字图像的效率,使得短时间获得大量且手写形态丰富的手写文字图像成为可能,为手写文字识别提供充足的数据基础。
附图说明
图1a为一种手写文字图像的采集过程示意图;
图1b为图1a所示的采集过程对应的手写文字图像数据库的示意图;
图2为本申请实施例提供的一种图像采集方法的流程示意图;
图3a为本申请实施例中一种打开图像采集装置的显示界面示意图;
图3b为本申请实施例中一种图像采集过程中显示界面示意图;
图3c为本申请实施例中另一种图像采集过程中显示界面示意图;
图3d为本申请实施例中再一种图像采集过程中显示界面示意图;
图4为本申请实施例中另一种打开图像采集装置的显示界面示意图;
图5a为本申请实施例中一种手写文字图像数据库的显示界面示意图;
图5b为本申请实施例中另一种手写文字图像数据库的显示界面示意图;
图6为本申请实施例提供的一种图像采集装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,并非对本申请的限定。另外,还需要说明的是,为便于描述,附图中仅示出了与本申请相关的部分,并非全部结构。
智能终端上提供的输入方式中的手写输入,虽然给用户提供了便利,但是,由于手写文字通常不够规整且形态多变,不同的用户手写同一个文字存在差异,即使同一个用户在不同时刻手写同一个文字都可能存在差异,所以,智能终端往往无法精确的识别出用户的手写文字,从而用户通过在智能终端上进行手写文字输入的方式提出的需求,无法智能的被智能终端“了解”和“满足”。
可以理解的是,无论是光学字符识别(英文:Optical Character Recognition,简称:OCR)技术还是其他的文字识别算法,想要准确完成手写文字识别,都需要借助样本丰富的手写文字图像数据库。目前,手写文字图像数据中的每个手写文字图像,基本都是通过书写人员在图像采集装置上手动输入的方式获得的,例如,书写人员可以在图像采集装置的输入单元上通过手指或感应笔手写输入“文字”,如图1a所示,那么,图像采集装置可以先将手写“文字”拆分后获得图像1和图像2,再为图像1标记“文”且为图像2标记“字”;或者,也可以先将手写“文字”标记“文字”,再拆分获得图像1和图像2,其中,图像1对应标记“文”图像2对应标记“字”,如此,获得“文”对应的手写文字图像1和“字”对应的手写文字图像2,如图1b所示。可见,该图像采集方式由于书写人员的书写习惯比较固定,且书写速度较慢,所以,无法高效的采集到手写形态丰富的手写文字图像。
基于此,本申请实施例提供了一种图像采集方法,假设要采集关于手写文字图像,那么,图像采集装置能够提示待输入的文字集合并显示输入框集合,其中,文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,文字集合包括第一文字,输入框集合包括第一文字对应的第一输入框;那么,响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,该采集结果可以包括但不限于与第一文字对应的第一点序列和第一图像。可见,该方法在用户进行手写输入之前,为用户提示待输入的文字集合并显示与待输入的手写文字数量相同的输入框,用户能够准确的将每个待输入的文字书写在对应输入框里,即使出现用户书写连笔字、书写潦草等情况,由于待输入的文字集合包括的文字数量、输入框集合包括的输入框数量以及用户通过手写输入的文字的数量一致,依然可以依据输入框轻松的对包括了整个手写输入的图像进行裁剪,从而精确的获得每个手写文字对应的手写文字图像,确保了手写文字图像数据库中样本的准确性。
需要说明的是,实现本申请实施例的主体可以为具有本申请实施例提供的图像采集功能的客户端或服务器,其中客户端可以承载于终端,该终端可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接相互交互的任何用户设备,包括但不限于:现有的、正在研发的或将来研发的智能可穿戴设备、智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。
为便于理解本申请实施例提供的图像采集方法的具体实现,下面将结合附图进行说明。
需要说明的是,下文的实施例中以执行主体为客户端(或者称为图像采集装置)为例进行说明。
参见图2,该图为本申请实施例提供的一种图像采集方法流程示意图,如果用户需要为手写文字图像数据库录入样本,则,可以执行本申请实施例提供的该方法。如图2所示,该方法可以包括下述S101~S102:
S101,提示待输入的文字集合并显示输入框集合,其中,文字集合包括的文字的数量和输入框集合包括的输入框的数量相同,所述文字集合包括第一文字,所述输入框集合包括第一文字对应的第一输入框。
其中,第一文字可以指图像采集装置上提示用户待采集的文字,例如,可以在图像采集装置上通过输出单元告知用户需要手写输入的文字。一种情况下,输出单元可以是图像采集装置连接的显示单元(如图像采集装置连接的显示屏),那么,图像采集装置可以通过在显示单元上显示该第一文字对应的文本信息,提示用户待采集的文字为第一文字。另一种情况下,输出单元也可以是图像采集装置连接的语音播报单元(如图像采集装置连接的麦克风),那么,图像采集装置可以通过语音播报单元播放该第一文字对应的语音信息,提示用户待采集的文字为第一文字。
需要说明的是,本申请实施例中的文字,可以包括中文字符、英文字符、数字等。
需要说明的是,图像采集装置中显示的待输入的文本集合对应的输入框,可以根据待输入的文字集合中文字类型的不同,显示不同的形态,如,文本集合中包括汉字,则,该输入框包括田字格或米字格,又如,文本集合中包括英文,则,该输入框包括长方形输入框或四线格。
其中,待输入的文字集合,可以是文本内容数据库中预先存储的内容,或者,也可以是用户在进行图像采集之前在图像采集装置上输入的待采集的手写文字。
如果图像采集装置包括文本内容数据库,那么,用户在图像采集之前,根据图像采集装置的提示,可以将文本内容数据中随机选择的文本作为待输入的文字集合;或者,也可以打开文本内容数据库,自行选择文本作为待输入的文字集合;又或者,还可以选择自定义待输入的文字集合,即,在显示的第二输入框中输入至少一个文字,作为待输入的文字集合。其中,第二输入框为自定义待输入文本的输入框,用户可以通过键盘等方式输入内容作为待输入的文字集合。
例如,在打开图像采集装置之后,界面如图3a所示,可以包括三个选择按钮:随机选择、自行选择和自定义。如图3b所示,当用户在图3a所示的界面上选择“随机选择”按钮后,界面进行跳转,跳转后的界面可以包括:书写内容提示区域、书写区域、清除按钮和提交按钮。如图3c所示,当用户在图3a所示的界面上选择“自行选择”按钮后,界面先跳转到显示文本内容数据库中文本的界面,例如可以包括“Hello”、“Word”和“我爱你”;此时,当用户继续选择其中的任意一个文本后,跳转到包括书写内容提示区域、书写区域、清除按钮和提交按钮的界面,其中,书写内容提示区域显示“Hello”,并且,书写区域显示5个长方形输入框。如图3d所示,当用户在图3a所示的界面上选择“自定义”按钮后,界面先跳转到显示第三输入框;此时,当用户在第三输入框中输入自己想要手写的文本,例如,输入“Hello”,那么,界面继续跳转到包括书写内容提示区域、书写区域、清除按钮和提交按钮的界面,其中,书写内容提示区域显示“Hello”,并且,书写区域显示5个长方形输入框。需要说明的是,清除按钮用于在用户手写输入发生错误时对输入的错误内容对应的输入框进行清空,以保证图像采集的准确;提交按钮用于在用户完成待输入的文字集合的手写输入时进行确认和提交,告知图像采集装置完成用户已经完成了该次手写输入。
如果图像采集装置不包括文本内容数据库,那么,用户在图像采集之前,可以自定义待输入的文字集合,即,在显示的第三输入框中输入至少一个文字,作为待输入的文字集合。
例如,如图4,在打开图像采集装置之后,界面提示自定义待输入的文字集合并显示第三输入框;此时,当用户在第三输入框中输入自己想要手写的文本,例如,输入“Hello”,那么,界面继续跳转到包括书写内容提示区域、书写区域、清除按钮和提交按钮的界面,其中,书写内容提示区域显示“Hello”,并且,书写区域显示5个长方形输入框。
以待输入的文字集合为“Hello”为例,S101中的第一文字可以为“H”、“e”、“l”、“l”和“o”中的任意一个。如果第一文字为“H”,那么,第一输入框为五个长方形输入框中从左数第一个长方形输入框;如果第一文字为“o”,那么,第一输入框为五个长方形输入框中从左数第五个长方形输入框。
需要说明的是,为了使得从输入框获取到的手写文字图像和待输入的文字对应,每个输入框的位置可以被记录。其中,输入框集合中的每个输入框的位置,可以通过输入框的四个顶点的坐标表示,如第一输入框可以表示为:{(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)};或者,也可以通过输入框的中心点、长和宽表示,如第一输入框可以表示为:{中心点=(x0,y0)、长=10毫米,宽=15毫米};又或者,还可以通过输入框的中心点、长、宽和旋转角度表示,如第一输入框可以表示为:{中心点=(x0,y0)、长=10毫米,宽=15毫米,旋转角度=30度}。
可见,由于在图像采集操作之前,为用户显示与待输入的手写文字数量相同的输入框,用户能够准确的将每个待输入的文字书写在对应输入框里,这样,即使出现用户书写连笔字、书写潦草等情况,由于待输入的文字集合包括的文字数量、输入框集合包括的输入框数量以及用户通过手写输入的文字的数量一致,依然可以依据输入框轻松的对包括了整个手写输入的图像进行裁剪,从而精确的获得每个手写文字对应的手写文字图像,确保了手写文字图像数据库中样本的准确性。
S102,响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,该采集结果可以包括但不限于与第一文字对应的第一点序列和第一图像。
具体实现时,用户可以在输入完成待输入的文字集合,或者,在输入操作结束超过第一预设时长(如3秒)时,又或者,在用户点击提交按钮对输入进行确认后,可以触发图像采集装置获得第一点序列和第一图像。
其中,第一点序列可以是在用户从开始手写输入第一文字到结束手写输入第一文字期间,每隔第二预设时长(如0.1秒)获取当前手指或者感应笔在图像采集装置所连接的输入单元上的坐标点,记录成的点序列[(x1,y1),(x2,y2),(x3,y3),.....]。或者,第一点序列也可以是在用户从开始手写输入第一文字到结束手写输入第一文字期间,当手指或感应笔的移动超过预设个数个像素且移动方向发生转变时,获取当前手指或者感应笔在图像采集装置所连接的输入单元上的坐标点,记录成的点序列。
第一图像,可以是图像采集装置对所述第一点序列进行渲染,获得所述第一点序列对应的轨迹图像,记作所述第一图像。其中,对第一点序列的渲染,例如可以是:按照第一点序列被记录的先后顺序,使用宽度为预设值的线条将第一点序列中的点依次连接,得到该第一点序列对应的轨迹图像。第一图像为一张手写文字图像。
如此,通过以已知的第一文字为目标,提示用户手写输入该第一文字,不仅使得丰富手写文字图像数据库更加具有针对性,而且避免了先采集图像再进行对应文字的标记,导致图像采集过程繁琐,浪费时间的问题。
在一些可能的实现方式中,为了提高手写文字图像的采集效率,可以对用户实际手写产生的点序列进行抖动,即,在S102之后,该方法还可以包括:
S103,对第一点序列中的点进行抖动处理,获得第二点序列和第二图像,采集结果还包括第二点序列和第二图像。
对第一点序列进行抖动处理,可以理解为对第一点序列中的部分点或全部点进行移动位置,但移动位置后点在输入框的位置发生变化,但在点序列中的排序不变,那么,移动位置后的所有点被获取到第二点序列中。
作为一个示例,S103例如可以包括:图像采集装置对第一点序列中的至少一个点在至少一个维度上进行加随机数的处理,获得第二点序列。
一种情况下,图像采集装置可以对第一点序列中的至少一个点的x值加随机数,获得第二点序列;或者,也可以对第一点序列中的至少一个点的y值加随机数,获得第二点序列。例如,第一点序列包括三个点:A(x1,y1)、B(x2,y2)和C(x3,y3),经过S103的抖动处理之后得到第二点序列可以包括:A’(x1+a,y1)、B(x2,y2)和C(x3,y3);或者,经过S102的抖动处理之后得到第二点序列可以包括:A’(x1+a,y1)、B’(x2+b,y2)和C’(x3+c,y3);又或者,经过S103的抖动处理之后得到第二点序列可以包括:A(x1,y1)、B”(x2,y2+d)和C”(x3,y3+e);再或者,经过S103的抖动处理之后得到第二点序列可以包括:A”’(x1,y1+f)、B”’(x2,y2+g)和C”’(x3,y3+h)。其中,上述a~h可以是预设范围内的随机数,可以相同也可以不同。
另一种情况下,图像采集装置可以对第一点序列中的至少一个点的x值和y值都加随机数,获得第二点序列,其中,x值所加的随机数和y值所加的随机数可以相同也可以不同。仍然以第一点序列包括三个点:A(x1,y1)、B(x2,y2)和C(x3,y3)为例,经过S103的抖动处理之后得到第二点序列可以包括:D(x1+a,y1+b)、B(x2,y2)和C(x3,y3);或者,经过S103的抖动处理之后得到第二点序列可以包括:E(x1+c,y1)、F(x2,y2+d)和C(x3,y3);又或者,经过S103的抖动处理之后得到第二点序列可以包括:G(x1+e,y1+f)、H(x2+g,y2+h)和I(x3+i,y3+j)。其中,上述a~j可以是预设范围内的随机数,可以相同也可以不同。
作为另一个示例,S103例如可以包括:根据第一点序列中的至少一个点和抖动函数,获得第二点序列。其中,抖动函数可以是任意的能够使得一个点发生预设范围的位置移动得到另一个点的函数,抖动函数的输入和输入均为点。需要说明的是,第一点序列中各个点所使用的抖动函数可以相同,也可以不同。例如,假设抖动函数为f(x,y),第一点序列包括三个点:A(x1,y1)、B(x2,y2)和C(x3,y3),经过S103的抖动处理之后得到第二点序列可以包括:M(x4,y4)、B(x2,y2)和C(x3,y3),其中,(x4,y4)=f(x1,y1);或者,经过S103的抖动处理之后得到第二点序列可以包括:M(x4,y4)、L(x5,y5)和N(x6,y6),其中,(x4,y4)=f(x1,y1),(x5,y5)=f(x2,y2)、(x6,y6)=f(x3,y3)。又例如,第一点序列所包括三个点:A、B和C,经过S103的抖动处理之后得到第二点序列可以包括:M(x4,y4)、L’(x7,y7)和N’(x8,y8),其中,(x4,y4)=f(x1,y1),(x7,y7)=g(x2,y2)、(x8,y8)=h(x3,y3)。
需要说明的是,对于用户一次手写所获得的第一点序列,图像采集装置可以通过S103的抖动处理,得到若干不同的点序列和手写文字图像。为了方便描述,本申请实施例以抖动处理得到的若干不同的点序列和手写文字图像中的第二点序列和第二图像为例进行描述。
其中,第二图像,可以是图像采集装置对所述第二点序列进行渲染,获得所述第二点序列对应的轨迹图像,记作所述第二图像。其中,对第二点序列的渲染,例如可以是:按照第二点序列被记录的先后顺序,使用宽度为预设值的线条将第二点序列中的点依次连接,得到该第二点序列对应的轨迹图像。第二图像为一张手写文字图像。
如此,通过对用户一次手写输入所获得的点序列的抖动处理,即可无数的手写文字图像,使得图像采集过程方便快捷,同时也丰富了手写文字图像数据库中的样本。
当对用户一次手写输入所获得的点序列进行至少一次抖动处理之后,即可获得采集结果,该采集结果不仅可以包括:第一文字、第一点序列和第一图像,还可以包括对第一点序列进行至少一次抖动处理后所获得的点序列和手写文字图像,例如,该采集结果还可以包括:第一文字、第二点序列和第二图像。其中,第一文字、第一点序列和第一图像可以作为采集结果中的一条记录,第一文字、第二点序列和第二图像可以作为采集结果中的另一条记录。
在一种实现方式中,由于一次手写文字图像的采集过程,需要用户手写输入的文字集合包括但不限于第一文字,那么,为了准确的记录各个输入框中的手写文字,还可以在采集结果中记录各个输入框的位置。例如,采集结果中还可以包括第一文字对应的第一输入框的位置。
在一种实现方式中,一次手写文字图像的采集过程中,如果待输入的文字集合包括多个文字,那么,完成文字集合的一次手写输入后,不仅可以得到各个文字对应的手写文字图像,还可以得到多个文字中的至少两个文字的组合对应的手写文字图像,从而进一步丰富手写文字图像数据库中的样本。
以文字集合包括第一文字和第二文字,输入框集合包括第一输入框以及第二文字对应的第二输入框为例,可选地,该方法还可以包括:
S104,响应于用户在第二输入框中通过手写输入第二文字,获得第三点序列和第三图像,该采集结果包括第三点序列、第三图像、第四点序列和第四图像,其中,第四点序列为由第一文字和第二文字组成的词语或单词对应的点序列集合,第四图像为所述词语或单词对应的图像。
如果第一文字和第二文字是中文字符,那么,该采集结果中可以包括第一文字和第二文字组成的词语对应的点序列集合和图像。
如果第一文字和第二文字是英文字符,那么,第三采集结果中可以包括第一文字和第二文字组成的单词对应的点序列集合和图像。
此外,在S104之后,该方法还可以包括:
S105,对第三点序列中的点进行抖动处理,获得第六点序列和第六图像,所述采集结果还包括所述第六点序列和所述第六图像。
S106,对第四点序列中的点进行抖动处理,获得第五点序列和第五图像,所述采集结果还包括所述第五点序列和所述第五图像。
其中,S105的具体实现以及达到的效果,可以参见上述S103的相关描述。
除了对单个文字进行抖动处理,为了进一步丰富所采集的手写文字图像,还可以通过S106对多个文字组成的词语或单词对应的点序列进行抖动处理。
举例来说,假设待输入的文字集合为“Word”,那么,通过本申请实施例提供的方法,用户在书写区域的4个输入框中分别手写输入“W”、“o”、“r”和“d”,图像采集装置对真实手写输入的“Word”经过4次抖动处理可以得到至少5组样本:关于“W”、“o”、“r”、“d”和“Word”,每组样本中至少可以包括5条记录,分别为一次真实手写输入和4次抖动处理所得的点序列和对应的轨迹图像。图像采集装置本次书写“Word”后,为手写文字图像数据库的界面上,如图5a所示,可以显示所有手写文字图像;或者,如图5b所示,界面上也可以显示“W”、“o”、“r”、“d”和“Word”五个标签,点击每个标签,可以得到该标签对应的多个点轨迹以及手写文字图像,例如,点击标签“o”,界面中可以显示:o的点序列1<->手写文字图像1、o的点序列2<->手写文字图像2、o的点序列3<->手写文字图像3、o的点序列4<->手写文字图像4、以及o的点序列5<->手写文字图像5。
可以理解的是,如果用户手动书写4~8位纯数字,每个用户每分钟大概可以书写20个数字(即20个手写文字图像),但是,该用户同样的进行一分钟的数字书写,通过本申请实施例中提供的分发对书写的数字进行4次抖动处理,相当于该用户每分钟可以产生约80个手写文字图像,极大提高了手写文字图像的采集效率。而且通过抖动得到更加丰富的手写文字形态对应的手写文字图像,丰富了手写文字图像数据库的样本。
可见,通过本申请实施例提供的图像采集方法,提出先确定待输入的文字集合,并为用户提供与文字集合所包括的文字数量相同的输入框,用户即可在每个输入框中输入对应的待输入文字,即使用户输入文字存在连笔等书写不规范的情况,图像采集装置依然能够准确的获得每个文字对应的手写文字图像。
此外,本申请实施例中,对用户手写输入的文字对应的点序列的抖动处理,能够获得其他若干个该文字的手写形态对应的点序列和手写文字图像,不仅丰富了手写文字图像数据库中的样本,而且提高了采集手写文字图像的效率,使得短时间获得大量且手写形态丰富的手写文字图像成为可能,为手写文字识别提供充足的数据基础。
相应的,本申请实施例还提供了一种图像采集装置600,如图6所示。该装置600可以包括:提示单元601、显示单元602和第一获得单元603。其中:
提示单元601,用于提示待输入的文字集合,所述文字集合包括第一文字;
显示单元602,用于显示输入框集合,其中,所述文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,所述输入框集合包括所述第一文字对应的第一输入框;
第一获得单元603,用于响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,所述采集结果包括第一点序列和第一图像。
在一种可能的实现方式中,该装置600还可以包括:第一抖动单元和第二获得单元。其中:
该第一抖动单元,用于对所述第一点序列中的点进行抖动处理;
第二获得单元,用于获得第二点序列和第二图像,所述采集结果还包括所述第二点序列和所述第二图像。
作为一个示例,该第一抖动单元,具体用于:
对所述第一点序列中的至少一个点在至少一个维度上进行加随机数的处理,获得所述第二点序列。
作为另一个示例,该第一抖动单元,具体用于:
根据所述第一点序列中的至少一个点和抖动函数,获得所述第二点序列。
作为一个示例,该第二获得单元,具体用于:
对所述第二点序列进行渲染,获得所述第二点序列对应的轨迹图像,记作所述第二图像。
可选地,所述采集结果还包括所述第一输入框的位置。
可选地,所述待输入的文字集合为文本内容数据库中的文本。
在一种可能的实现方式中,如果待输入的文字集合还包括第二文字,所述输入框集合包括所述第二文字对应的第二输入框,该装置600还可以包括:第三获得单元。
该第三获得单元,用于响应于所述用户在所述第二输入框中通过手写输入所述第二文字,获得第三点序列和第三图像,所述采集结果还包括所述第三点序列、所述第三图像、第四点序列和第四图像,所述第四点序列为由所述第一文字和所述第二文字组成的词语或单词对应的点序列集合,所述第四图像为所述词语或单词对应的图像。
作为一个示例,该装置600还可以包括:第二抖动单元。
该第二抖动单元,用于对所述第四点序列中的点进行抖动处理,获得第五点序列和第五图像,所述采集结果还包括所述第五点序列和所述第五图像。
需要说明的是,该装置600与上述图2所示的方法对应,该装置600的实现方式以及达到的效果,可以参见上述图2所示的实施例的相关描述。
此外,本申请实施例还提供了一种电子设备700,如图7所示。该电子设备700包括:处理器701和存储器702;其中:
所述存储器702,用于存储指令或计算机程序;
所述处理器701,用于执行所述存储器702中的所述指令或计算机程序,以使得所述电子设备执行上述图2所示的实施例提供的方法。
此外,本申请实施例还提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述图2所示的实施例提供的方法。
本申请实施例中提到的“第一点序列”、“第一图像”等名称中的“第一”只是用来做名字标识,并不代表顺序上的第一。该规则同样适用于“第二”等。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,ROM)/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例和设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请的优选实施方式,并非用于限定本申请的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (12)
1.一种图像采集方法,其特征在于,包括:
提示待输入的文字集合并显示输入框集合,所述文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,所述文字集合包括第一文字,所述输入框集合包括所述第一文字对应的第一输入框;
响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,所述采集结果包括第一点序列和第一图像。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述第一点序列中的点进行抖动处理,获得第二点序列和第二图像,所述采集结果还包括所述第二点序列和所述第二图像。
3.根据权利要求1所述的方法,其特征在于,所述采集结果还包括所述第一输入框的位置。
4.根据权利要求1所述的方法,其特征在于,所述待输入的文字集合为文本内容数据库中的文本。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述待输入的文字集合还包括第二文字,所述输入框集合包括所述第二文字对应的第二输入框,所述方法还包括:
响应于所述用户在所述第二输入框中通过手写输入所述第二文字,获得第三点序列和第三图像,所述采集结果还包括所述第三点序列、所述第三图像、第四点序列和第四图像,所述第四点序列为由所述第一文字和所述第二文字组成的词语或单词对应的点序列集合,所述第四图像为所述词语或单词对应的图像。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
对所述第四点序列中的点进行抖动处理,获得第五点序列和第五图像,所述采集结果还包括所述第五点序列和所述第五图像。
7.根据权利要求2所述的方法,其特征在于,所述对所述第一点序列中的点进行抖动处理,获得第二点序列,包括:
对所述第一点序列中的至少一个点在至少一个维度上进行加随机数的处理,获得所述第二点序列。
8.根据权利要求2所述的方法,其特征在于,所述对所述第一点序列中的点进行抖动处理,获得第二点序列,包括:
根据所述第一点序列中的至少一个点和抖动函数,获得所述第二点序列。
9.根据权利要求2所述的方法,其特征在于,所述获得第二图像,包括:
对所述第二点序列进行渲染,获得所述第二点序列对应的轨迹图像,记作所述第二图像。
10.一种图像采集装置,其特征在于,所述装置包括:
提示单元,用于提示待输入的文字集合,所述文字集合包括第一文字;
显示单元,用于显示输入框集合,其中,所述文字集合包括的文字的数量和所述输入框集合包括的输入框的数量相同,所述输入框集合包括所述第一文字对应的第一输入框;
获得单元,用于响应于用户在所述第一输入框中通过手写输入所述第一文字,获得采集结果,所述采集结果包括第一点序列和第一图像。
11.一种电子设备,其特征在于,所述电子设备包括:处理器和存储器;
所述存储器,用于存储指令或计算机程序;
所述处理器,用于执行所述存储器中的所述指令或计算机程序,以使得所述电子设备执行权利要求1至9任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,包括指令,当其在计算机上运行时,使得计算机执行以上权利要求1至9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110321412.5A CN113095167A (zh) | 2021-03-25 | 2021-03-25 | 一种图像采集方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110321412.5A CN113095167A (zh) | 2021-03-25 | 2021-03-25 | 一种图像采集方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113095167A true CN113095167A (zh) | 2021-07-09 |
Family
ID=76669983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110321412.5A Pending CN113095167A (zh) | 2021-03-25 | 2021-03-25 | 一种图像采集方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095167A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488543A (zh) * | 2014-09-16 | 2016-04-13 | 科大讯飞股份有限公司 | 一种获得识别模型的方法及装置 |
CN106056055A (zh) * | 2016-05-24 | 2016-10-26 | 西北民族大学 | 基于部件组合的梵音藏文联机手写样本生成方法 |
CN108664975A (zh) * | 2018-04-24 | 2018-10-16 | 新疆大学 | 一种维吾尔文手写字母识别方法、系统及电子设备 |
CN109492657A (zh) * | 2018-09-18 | 2019-03-19 | 平安科技(深圳)有限公司 | 手写样本数字化方法、装置、计算机设备及存储介质 |
CN109522975A (zh) * | 2018-09-18 | 2019-03-26 | 平安科技(深圳)有限公司 | 手写样本生成方法、装置、计算机设备及存储介质 |
CN111612871A (zh) * | 2020-04-09 | 2020-09-01 | 北京旷视科技有限公司 | 手写样本生成方法、装置、计算机设备和存储介质 |
-
2021
- 2021-03-25 CN CN202110321412.5A patent/CN113095167A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488543A (zh) * | 2014-09-16 | 2016-04-13 | 科大讯飞股份有限公司 | 一种获得识别模型的方法及装置 |
CN106056055A (zh) * | 2016-05-24 | 2016-10-26 | 西北民族大学 | 基于部件组合的梵音藏文联机手写样本生成方法 |
CN108664975A (zh) * | 2018-04-24 | 2018-10-16 | 新疆大学 | 一种维吾尔文手写字母识别方法、系统及电子设备 |
CN109492657A (zh) * | 2018-09-18 | 2019-03-19 | 平安科技(深圳)有限公司 | 手写样本数字化方法、装置、计算机设备及存储介质 |
CN109522975A (zh) * | 2018-09-18 | 2019-03-26 | 平安科技(深圳)有限公司 | 手写样本生成方法、装置、计算机设备及存储介质 |
CN111612871A (zh) * | 2020-04-09 | 2020-09-01 | 北京旷视科技有限公司 | 手写样本生成方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101617598B1 (ko) | 식별자들의 목록을 내비게이션하기 위한 장치, 방법 및 그래픽 사용자 인터페이스 | |
CN104461318B (zh) | 基于增强现实技术的点读方法及系统 | |
RU2345425C2 (ru) | Организация многооконного режима, система, управляющая этим режимом, содержащая компьютерное устройство | |
JP3829366B2 (ja) | 入力装置、および入力方法 | |
JP2013502861A (ja) | 連絡先情報入力方法及びシステム | |
JP5437340B2 (ja) | ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム | |
US9934422B1 (en) | Digitized handwriting sample ingestion systems and methods | |
JP2015158900A (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
US20220415206A1 (en) | Defining an interactive session that analyzes user input provided by a participant | |
TW201237764A (en) | Method, apparatus, and computer program product for overlapped handwriting | |
US20180129877A1 (en) | Digitized handwriting sample ingestion systems and methods | |
CN111524398B (zh) | 交互式绘本的处理方法、装置及系统 | |
CN114610198B (zh) | 基于虚拟资源的交互方法、装置、设备和存储介质 | |
CN108885530A (zh) | 用墨水命令来操作可视用户界面控件 | |
JP2015148947A (ja) | 情報処理システム、情報処理方法、及びプログラム | |
CN110019862B (zh) | 一种课件推荐方法、装置、设备及存储介质 | |
CN113095167A (zh) | 一种图像采集方法、装置和设备 | |
JP2014078168A (ja) | 文字認識装置及びプログラム | |
CN106371644B (zh) | 一种在屏幕上多人同时书写的方法和装置 | |
JP6828586B2 (ja) | 表示プログラム、表示装置及び表示方法 | |
JP2017211441A (ja) | 手本データ生成プログラム及び手本データ生成装置 | |
CN110188292A (zh) | 一种目的地信息的展示方法及装置 | |
CN111860083A (zh) | 一种人物关系补全方法及装置 | |
JP2002278874A (ja) | 電子伝言板システムおよび伝言板プログラム | |
JP2015141479A (ja) | 情報共有システムおよび情報共有方法、ならびに、情報処理装置および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |