CN115376132A

CN115376132A - 扫描笔的数据处理方法及装置、存储介质、扫描笔

Info

Publication number: CN115376132A
Application number: CN202210802413.6A
Authority: CN
Inventors: 王标
Original assignee: Shenzhen Innios Technology Co ltd
Current assignee: Shenzhen Innios Technology Co ltd
Priority date: 2022-07-07
Filing date: 2022-07-07
Publication date: 2022-11-22

Abstract

本申请公开了一种扫描笔的数据处理方法及装置、存储介质、扫描笔，该方法包括：获取扫描笔扫描得到的多个有次序的帧图像，并分别对每个所述帧图像进行边缘识别，得到边缘帧图像；以所述边缘帧图像的横坐标为行、纵坐标为列，确定每个所述边缘帧图像的二维数组，对所述二维数组中每一列上的元素进行累加，得到每个所述边缘帧图像的一维数组；对于任一边缘帧图像与所述任一边缘帧图像对应的前一边缘帧图像，依据所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组，确定所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量；依据所述目标偏移量，拼接所述任一边缘帧图像对应的第一帧图像与所述前一边缘帧图像对应的第二帧图像。

Description

扫描笔的数据处理方法及装置、存储介质、扫描笔

技术领域

本申请涉及图像识别技术领域，尤其是涉及到一种扫描笔的数据处理方法及装置、存储介质、扫描笔。

背景技术

近年来，教育行业兴起了智能词典笔，学生们只要用词典笔对文字扫一扫，便能快捷的得到该文字的发音、释义以及翻译等信息，不用在去翻查字典，极大的提高了学习效率。其基本原理是利用高速摄像头以100帧每秒左右的速度采集词典笔划过表面的图像，经过图像预处理、拼接后获得文本行图像，送入OCR模块识别获得图像文本的内容，然后进行相关信息查询展示。图像拼接是扫描词典笔的关键技术之一，传统图像拼接方法如块匹配、特征点匹配等算法复杂度高，运算量巨大，使用在词典笔这种高速图像拼接场景中需要很高的硬件配置才能保证实时性。

发明内容

有鉴于此，本申请提供了一种扫描笔的数据处理方法及装置、存储介质、扫描笔，有助于简化图像拼接计算量，提升扫描笔的图像拼接效率。

根据本申请的一个方面，提供了一种扫描笔的数据处理方法，所述方法包括：

获取扫描笔扫描得到的多个有次序的帧图像，并分别对每个所述帧图像进行边缘识别，得到边缘帧图像；

以所述边缘帧图像的横坐标为行、纵坐标为列，确定每个所述边缘帧图像的二维数组，对所述二维数组中每一列上的元素进行累加，得到每个所述边缘帧图像的一维数组；

对于任一边缘帧图像与所述任一边缘帧图像对应的前一边缘帧图像，依据所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组，确定所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量；

依据所述目标偏移量，拼接所述任一边缘帧图像对应的第一帧图像与所述前一边缘帧图像对应的第二帧图像。

可选地，所述依据所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组，确定所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量，具体包括：

假设所述任一边缘帧图像相对于所述前一边缘帧图像的多个偏移量，并针对每个所述偏移量，计算所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组对应的每个水平位置的元素差绝对值之和；

将所述元素差绝对值之和最小的偏移量，确定为所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量。

可选地，偏移量的取值范围为[0，W/2]，其中，W为任一帧图像的横坐标像素点个数。

可选地，所述依据所述目标偏移量，拼接所述任一边缘帧图像对应的第一帧图像与所述前一边缘帧图像对应的第二帧图像，具体包括：

依据所述目标偏移量，确定所述前一边缘帧图像对应的第一帧图像的拼接位置，并将所述任一边缘帧图像对应的第二帧图像拼接在所述第一帧图像的拼接位置处。

可选地，所述获取扫描笔扫描得到的多个帧图像，具体包括：

响应于扫描笔的开始扫描信号，清空所述扫描笔的帧图像存储空间；

获取扫描笔实时扫描得到的实时帧图像，并依据扫描顺序排列所述实时帧图像，得到多个有次序的帧图像；

所述方法还包括：

判断所述扫描笔是否结束扫描；

当所述扫描并结束扫描时，获取全部帧图像对应的拼接图像。

可选地，所述获取全部帧图像对应的拼接图像之后，所述方法还包括：

对所述拼接图像进行图像识别，确定所述扫描笔对应的扫描字符；

显示和/或声音输出所述扫描字符。

可选地，所述分别对每个所述帧图像进行边缘识别，得到边缘帧图像，具体包括：

对所述帧图像进行降噪处理，得到降噪帧图像；

通过Sobel算子，对所述降噪帧图像进行边缘检测，获得所述边缘帧图像。

根据本申请的另一方面，提供了一种扫描笔的数据处理装置，所述装置包括：

图像获取模块，用于获取扫描笔扫描得到的多个有次序的帧图像，并分别对每个所述帧图像进行边缘识别，得到边缘帧图像；

图像处理模块，用于以所述边缘帧图像的横坐标为行、纵坐标为列，确定每个所述边缘帧图像的二维数组，对所述二维数组中每一列上的元素进行累加，得到每个所述边缘帧图像的一维数组；

偏移识别模块，用于对于任一边缘帧图像与所述任一边缘帧图像对应的前一边缘帧图像，依据所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组，确定所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量；

拼接模块，用于依据所述目标偏移量，拼接所述任一边缘帧图像对应的第一帧图像与所述前一边缘帧图像对应的第二帧图像。

可选地，所述偏移识别模块，具体用于：

可选地，所述拼接模块，具体用于：

可选地，所述图像获取模块，具体用于：

所述装置还包括：

判断模块，用于判断所述扫描笔是否结束扫描；

所述拼接模块，还用于当所述扫描并结束扫描时，获取全部帧图像对应的拼接图像。

可选地，所述拼接模块，还用于：所述获取全部帧图像对应的拼接图像之后，所述装置还包括：图像识别模块，用于对所述拼接图像进行图像识别，确定所述扫描笔对应的扫描字符；显示和/或声音输出所述扫描字符。

可选地，所述图像获取模块，还用于：

对所述帧图像进行降噪处理，得到降噪帧图像；

依据本申请又一个方面，提供了一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述扫描笔的数据处理方法。

依据本申请再一个方面，提供了一种扫描笔，包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述扫描笔的数据处理方法。

借由上述技术方案，本申请提供的一种扫描笔的数据处理方法及装置、存储介质、扫描笔，对扫描笔扫描得到的帧图像进行边缘识别后，将得到的边缘帧图像的二维数组转换为一位数组，通过比对连续两张边缘帧图像的一维数组，确定对应的连续两张帧图像的目标偏移量，利用目标偏移量完成连续两张帧图像的拼接，并以此类推完成全部帧图像的拼接。本申请通过对图像预处理将二维数组匹配简化成一维数组匹配，极大的减少了图像拼接的运算量，提升了图像拼接速度，进一步有助于提升扫描笔的字符识别速度。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1示出了本申请实施例提供的一种扫描笔的数据处理方法的流程示意图；

图2示出了本申请实施例提供的一种原始的帧图像的示意图；

图3示出了本申请实施例提供的一种降噪处理后的帧图像的示意图；

图4示出了本申请实施例提供的一种边缘帧图像的示意图；

图5示出了本申请实施例提供的一种边缘帧图像一维数组特征的示意图；

图6示出了本申请实施例提供的一种不同水平位置的匹配误差的示意图；

图7示出了本申请实施例提供的一种拼接图像的示意图；

图8示出了本申请实施例提供的一种扫描笔的数据处理装置的结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

在本实施例中提供了一种扫描笔的数据处理方法，如图1所示，该方法包括：

步骤101，获取扫描笔扫描得到的多个有次序的帧图像，并分别对每个所述帧图像进行边缘识别，得到边缘帧图像。

本申请实施例中，用户手持扫描笔对待识别的字符进行扫描，通过扫描笔的摄像头逐帧进行图像采集，获得多个有次序的帧图像，并通过扫描笔的处理芯片分别对每张帧图像进行边缘识别，得到多张边缘帧图像。

可选地，步骤101中“获取扫描笔扫描得到的多个帧图像”，具体包括：

步骤101-1，响应于扫描笔的开始扫描信号，清空所述扫描笔的帧图像存储空间；

步骤101-2，获取扫描笔实时扫描得到的实时帧图像，并依据扫描顺序排列所述实时帧图像，得到多个有次序的帧图像。

在该实施例中，用户启动扫描笔时，扫描笔响应于开始扫描信号，初始化扫描笔的帧图像存储空间D，将存储空间进行清空，将扫描笔扫描得到的实时帧图像按扫描次序存储在帧图像存储空间中，存储空间中保存的帧图像记为D(x，y)；x∈(0，nW)，y∈(0，H)，W、H分别为原始输入图像的宽和高，n为帧图像的数量，初始化拷贝拼接水平位置P为0。

可选地，步骤101中“分别对每个所述帧图像进行边缘识别，得到边缘帧图像”具体包括：

步骤101-3，对所述帧图像进行降噪处理，得到降噪帧图像；通过Sobel算子，对所述降噪帧图像进行边缘检测，获得所述边缘帧图像。

在该实施例中，针对每张帧图像，以t时刻对应的帧图像为例，获取t时刻的原始输入图像St(x，y)；x∈(0，W)，y∈(0，H)，如图2所示。先对S_t进行5x5或7x7均值滤波后得到平滑去噪图像Bt(x，y)；x∈(0，W)，y∈(0，H)，如图3所示。再对B_t用Sobel算子进行水平垂直边缘求取，获得边缘图像

Gt(x，y)；x∈(0，W)，y∈(0，H)，如图4所示。

步骤102，以所述边缘帧图像的横坐标为行、纵坐标为列，确定每个所述边缘帧图像的二维数组，对所述二维数组中每一列上的元素进行累加，得到每个所述边缘帧图像的一维数组。

在该实施例中，将边缘帧图像从二维数组转换为一维数组，后续通过对一维数据进行数据处理，实现对边缘帧图像的图像拼接，充分利用扫描词典笔的场景特点，即文字扫描场景相对单一、相邻时刻采集的图像以水平位移为主，通过对图像预处理将二维匹配简化成一维匹配，极大的减少了图像拼接的运算量。具体地，可以对G_t按公式(1)按列累加，将图像从二维降至一维，得到长度为W的一维特征F_t，如图5所示。

步骤103，对于任一边缘帧图像与所述任一边缘帧图像对应的前一边缘帧图像，依据所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组，确定所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量。

本申请实施例通过比较连续两张边缘帧图像的一位数组，确定后一张边缘帧图像相对于前一张边缘帧图像的目标偏移量。针对任一边缘帧图像及其对应的前一边缘帧图像，可以识别前一边缘帧图像的一位数组与任一边缘帧图像的一维数组匹配的部分，例如边缘帧图像为20×1的一维数组，前一边缘帧图像的一位数组中从第6列～第20列，与任一边缘帧图像的一位数组第1列～第15列对应相同，那么可以确定任一边缘帧图像相对于前一边缘帧图像移动了5列对应的距离。

可选地，步骤103具体包括：

步骤103-1，假设所述任一边缘帧图像相对于所述前一边缘帧图像的多个偏移量，并针对每个所述偏移量，计算所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组对应的每个水平位置的元素差绝对值之和，偏移量的取值范围为[0，W/2]，其中，W为任一帧图像的横坐标像素点个数；

步骤103-2，将所述元素差绝对值之和最小的偏移量，确定为所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量。

在该实施例中，还可以通过预先假设多个偏移量的方式，获取其中最接近实际偏移情况的偏移量作为目标偏移量。具体地，对F_t和上一时刻的F_t-1，即任一边缘帧图像及对应的前一边缘帧图像，按公式(2)求取对应水平位置x的匹配误差E(x)，如图6所示，E(x)最小值的位置就是图像S_t相对于图像S_t-1的水平方向的目标偏移量x_t。

另外，需要说明的是，如果是第一帧的边缘帧图像，那么无需进行步骤103的计算，从第二帧的边缘帧图像开始进行上述计算。

步骤104，依据所述目标偏移量，拼接所述任一边缘帧图像对应的第一帧图像与所述前一边缘帧图像对应的第二帧图像。

在该实施例中，根据目标偏移量，逐帧将对帧图像进行拼接，直到完成全部帧图像的拼接，得到完整的拼接图像，如图7所示，为一个完整拼接图像的示意图。

通过应用本实施例的技术方案，充分利用扫描笔的扫描场景单一、扫描方式固定的特点，对扫描笔扫描得到的帧图像进行边缘识别后，将得到的边缘帧图像的二维数组转换为一位数组，通过比对连续两张边缘帧图像的一维数组，确定对应的连续两张帧图像的目标偏移量，利用目标偏移量完成连续两张帧图像的拼接，并以此类推完成全部帧图像的拼接。本申请通过对图像预处理将二维数组匹配简化成一维数组匹配，极大的减少了图像拼接的运算量，提升了图像拼接速度，进一步有助于提升扫描笔的字符识别速度。

在本申请实施例中，可选地，步骤104具体包括：依据所述目标偏移量，确定所述前一边缘帧图像对应的第一帧图像的拼接位置，并将所述任一边缘帧图像对应的第二帧图像拼接在所述第一帧图像的拼接位置处。

在上述实施例中，根据目标偏移量x_t，更新拼接水平位置P为P+x_t，拷贝原始图像S_t到拼接图像的P至P+W列，完成第t帧的拼接。其中，第一帧的帧图像直接作为拼接图像，从第二帧的帧图像开始，确定目标偏移量，并依据目标偏移量将第二帧图像拼接在该拼接图像的对应位置处。

在本申请实施例中，可选地，所述方法还包括：判断所述扫描笔是否结束扫描；当所述扫描并结束扫描时，获取全部帧图像对应的拼接图像。

在该实施例中，扫描笔进行图像扫描实时获得帧图像的过程中，基于上述的图像拼接方法实时的对帧图像进行拼接，在扫描结束时，将一次扫描过程获得的全部帧图像拼接为一张完整的拼接图像。

在本申请实施例中，可选地，步骤104之后还包括：对所述拼接图像进行图像识别，确定所述扫描笔对应的扫描字符；显示和/或声音输出所述扫描字符。

在该实施例中，完成一次扫描并获得拼接图像后，还可以通过图像识别技术，对拼接图像进行识别，识别出扫描笔的扫描字符，并将识别出的扫描字符显示在扫描笔的显示器、或扫描笔连接的显示器上，还可以对扫描字符进行声音播放。

通过应用本实施例的技术方案，充分利用扫描词典笔的场景特点，即文字扫描场景相对单一、相邻时刻采集的图像以水平位移为主，且不超过输入图像宽度的一半等特点，通过对图像预处理将二维数组匹配简化成一维数组匹配，极大的减少了图像拼接的运算量，在一般移动理器上就能实时处理100帧每秒以上的图像拼接任务。

进一步的，作为图1方法的具体实现，本申请实施例提供了一种扫描笔的数据处理装置，如图8所示，该装置包括：

可选地，所述偏移识别模块，具体用于：

可选地，所述拼接模块，具体用于：

可选地，所述图像获取模块，具体用于：

所述装置还包括：

判断模块，用于判断所述扫描笔是否结束扫描；

可选地，所述图像获取模块，还用于：

对所述帧图像进行降噪处理，得到降噪帧图像；

需要说明的是，本申请实施例提供的一种扫描笔的数据处理装置所涉及各功能单元的其他相应描述，可以参考图1方法中的对应描述，在此不再赘述。

基于上述如图1所示方法，相应的，本申请实施例还提供了一种存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述如图1所示的扫描笔的数据处理方法。

基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施场景所述的方法。

基于上述如图1所示方法，相应的，本申请实施例还提供了一种扫描笔，其上存储有计算机程序，该计算机程序被处理器执行时实现上述如图1所示的扫描笔的数据处理方法。

基于上述如图1所示的方法，以及图8所示的虚拟装置实施例，为了实现上述目的，本申请实施例还提供了一种计算机设备，具体可以为个人计算机、服务器、网络设备等，该计算机设备包括存储介质和处理器；存储介质，用于存储计算机程序；处理器，用于执行计算机程序以实现上述如图1所示的扫描笔的数据处理方法。

可选地，该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency，RF)电路，传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等，可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。

本领域技术人员可以理解，本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定，可以包括更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序，支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信，以及与该实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现，也可以通过硬件实现对扫描笔扫描得到的帧图像进行边缘识别后，将得到的边缘帧图像的二维数组转换为一位数组，通过比对连续两张边缘帧图像的一维数组，确定对应的连续两张帧图像的目标偏移量，利用目标偏移量完成连续两张帧图像的拼接，并以此类推完成全部帧图像的拼接。本申请通过对图像预处理将二维数组匹配简化成一维数组匹配，极大的减少了图像拼接的运算量，提升了图像拼接速度，进一步有助于提升扫描笔的字符识别速度。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述，不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景，但是，本申请并非局限于此，任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims

1.一种扫描笔的数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述依据所述任一边缘帧图像的一维数组与所述前一边缘帧图像的一维数组，确定所述任一边缘帧图像相对于所述前一边缘帧图像的目标偏移量，具体包括：

3.根据权利要求2所述的方法，其特征在于，偏移量的取值范围为[0，W/2]，其中，W为任一帧图像的横坐标像素点个数。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述依据所述目标偏移量，拼接所述任一边缘帧图像对应的第一帧图像与所述前一边缘帧图像对应的第二帧图像，具体包括：

5.根据权利要求4所述的方法，其特征在于，所述获取扫描笔扫描得到的多个帧图像，具体包括：

所述方法还包括：

判断所述扫描笔是否结束扫描；

6.根据权利要求5所述的方法，其特征在于，所述获取全部帧图像对应的拼接图像之后，所述方法还包括：

显示和/或声音输出所述扫描字符。

7.根据权利要求1所述的方法，其特征在于，所述分别对每个所述帧图像进行边缘识别，得到边缘帧图像，具体包括：

对所述帧图像进行降噪处理，得到降噪帧图像；

8.一种扫描笔的数据处理装置，其特征在于，所述装置包括：

9.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述扫描笔的数据处理方法。

10.一种扫描笔，包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述扫描笔的数据处理方法。