CN111950463B

CN111950463B - 扫描方法、装置、扫描笔和存储介质

Info

Publication number: CN111950463B
Application number: CN202010813068.7A
Authority: CN
Inventors: 汤琦璇; 王晓斐; 王忍宝
Original assignee: Anhui Toycloud Technology Co Ltd
Current assignee: Anhui Toycloud Technology Co Ltd
Priority date: 2020-08-13
Filing date: 2020-08-13
Publication date: 2023-03-10
Anticipated expiration: 2040-08-13
Also published as: CN111950463A

Abstract

本发明实施例提供一种扫描方法和装置，其中方法包括：基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；对拼接图像进行图像分类，若图像分类结果为文本类图像，则对拼接图像进行文本识别，得到文本识别结果。本发明实施例提供的扫描方法和装置，能够支持对追加扫描场景，和/或对应不同持笔手和不同扫描方向的各类扫描场景的多场景检测，从而采用相应场景对应的图像拼接方式进行拼接，无需用户预先设置对应不同场景的扫描模式，优化了用户体验，且解决了现有扫描笔仅支持单一扫描方向的瓶颈；并且避免了不必要的OCR处理，减少了文本识别的运算量，节约系统资源。

Description

扫描方法、装置、扫描笔和存储介质

技术领域

本发明涉及电子设备技术领域，尤其涉及一种扫描方法、装置、扫描笔和存储介质。

背景技术

扫描笔是一种手持式的电子设备，具备体积小、便于携带，且能够自动采集图像并自动识别图像等优点。使用扫描笔时，用户需要预先手动设置扫描笔使用场景对应的扫描模式，然后握持扫描笔在书本教材等纸质媒介上滑动，扫描笔会对滑动过程中采集的扫描图像序列进行拼接和识别。

然而，上述手动设置扫描模式的方案要求用户每次更换扫描模式之前，手动更换扫描模式设置，操作繁琐，影响用户体验。另外，目前扫描笔在采集得到非文本类图像后，仍会通过光学字符识别(Optical Character Recognition，OCR)模块进行文本识别，导致识别失败或识别结果为乱码，浪费系统资源且影响用户体验。

发明内容

本发明实施例提供一种扫描方法、装置、扫描笔和存储介质，用以解决现有技术中需要用户手动更换扫描模式设置，操作繁琐，且无差别进行文本识别导致浪费系统资源的缺陷。

本发明实施例提供一种扫描方法，包括：

基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；

对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果。

根据本发明一个实施例的扫描方法，所述基于追加扫描请求检测状态，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，具体包括：

若所述追加扫描请求检测状态为是，则基于预设拼接规则，或基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到当前拼接图像，并将上次拼接所得的上一拼接图像和所述当前拼接图像进行拼接，得到所述拼接图像；

否则，基于预设拼接规则，或基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到所述拼接图像。

根据本发明一个实施例的扫描方法，所述基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，具体包括：

基于所述持笔手，确定图像拼接时的图像旋转角度；

基于所述持笔手和所述扫描方向，确定图像拼接方向；

基于所述图像拼接方向和所述图像旋转角度，对所述扫描图像序列进行旋转拼接。

根据本发明一个实施例的扫描方法，所述基于所述图像拼接方向和所述图像旋转角度，对所述扫描图像序列进行旋转拼接，具体包括：

基于所述图像拼接方向和所述图像旋转角度，对所述扫描图像序列中每一扫描图像的有效区域进行旋转拼接；

其中，任一扫描图像的有效区域是基于所述持笔手确定的。

根据本发明一个实施例的扫描方法，所述追加扫描请求检测状态是在上次扫描结束后，检测用户是否通过实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求得到的；

所述扫描笔的持笔手与扫描方向是基于所述扫描笔内设传感器获取的角速度方向和/或加速度方向确定得到的。

根据本发明一个实施例的扫描方法，所述基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，之前还包括：

确定所述扫描笔的当前扫描速度对应的拍摄帧率；

基于所述拍摄帧率进行图像采集。

根据本发明一个实施例的扫描方法，所述对所述拼接图像进行图像分类，具体包括：

将所述拼接图像输入至图像分类模型，得到所述图像分类模型输出的图像分类结果；

其中，所述图像分类模型是基于样本图像及其样本图像分类结果训练得到的。

本发明实施例还提供一种扫描装置，包括：

图像拼接单元，用于基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；

图像分类识别单元，用于对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果。

本发明实施例还提供一种扫描笔，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述扫描方法的步骤。

本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述扫描方法的步骤。

本发明实施例提供的扫描方法、装置、扫描笔和存储介质，基于追加扫描请求检测状态，和/或扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，能够支持对追加扫描场景，和/或对应不同持笔手和不同扫描方向的各类扫描场景的多场景检测，从而采用相应场景对应的图像拼接方式进行拼接，无需用户预先设置对应不同场景的扫描模式，优化了用户体验，且解决了现有扫描笔仅支持单一扫描方向的瓶颈；然后对拼接图像进行图像分类，仅当图像分类结果为文本类图像时，才对拼接图像进行文本识别，得到文本识别结果，避免了不必要的OCR处理，减少了文本识别的运算量，节约系统资源。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的扫描方法的流程示意图；

图2为本发明实施例提供的追加扫描场景下的图像拼接示意图；

图3为本发明实施例提供的图像拼接方法的流程示意图；

图4为本发明实施例提供的对应不同持笔手与扫描方向的图像拼接示意图；

图5为本发明实施例提供的图像采集方法的流程示意图；

图6为本发明又一实施例提供的扫描方法的流程示意图；

图7为本发明实施例提供的扫描装置的结构示意图；

图8为本发明实施例提供的扫描笔的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

由于用户使用扫描笔时的场景有多样，例如左手持笔场景、右手持笔场景和追加扫描场景等，因此在使用扫描笔之前，用户需要预先手动设置对应不同扫描场景的扫描模式，然后握持扫描笔在书本教材等纸质媒介上滑动扫描。然而，上述手动设置扫描模式的方案要求用户每次更换扫描模式之前，手动更换扫描模式设置，操作繁琐，影响用户体验。

另外，若用户通过扫描笔扫描非文本内容，扫描笔仍会在采集得到对应的非文本类图像后，通过光学字符识别模块对其进行文本识别，导致识别失败或识别结果为乱码，既浪费系统资源且影响用户体验。

对此，本发明实施例提供了一种扫描方法。图1为本发明实施例提供的扫描方法的流程示意图，如图1所示，该方法的执行主体可以是扫描笔，具体可以是扫描笔内部的处理单元，该方法包括：

步骤110，基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像。

具体地，在用户使用扫描笔的过程中，扫描笔会获取追加扫描请求检测状态。其中，追加扫描请求检测状态为是或否，分别表明是否检测到追加扫描请求，从而指示扫描笔的当前使用场景是否为追加扫描场景。若当前使用场景为追加扫描场景，则需要将用户多次扫描的内容整合到一起，否则只需将扫描笔这一次扫描得到的扫描图像序列进行拼接即可。此处，扫描笔笔头处设置触发按键每次被按下直至被释放视为一次扫描。因此，可以基于追加扫描请求检测状态的不同，采用不同的拼接策略对扫描笔采集的扫描图像序列进行拼接，得到拼接图像。

另外，不同用户的使用习惯不同，例如部分用户的惯用手为左手，而部分用户的惯用手为右手，且用户习惯的扫描方向也可能存在区别，因此用户使用扫描笔的场景还可能为左手持笔由左向右扫描、右手持笔由左向右扫描、左手持笔由右向左扫描或右手持笔由右向左扫描。不同持笔手和不同扫描方向对应的图像拼接方式存在差异，因此扫描笔还可以感知扫描笔当前的持笔手与扫描方向，从而根据该持笔手和扫描方向对应的图像拼接方式，对扫描图像序列进行拼接，得到拼接图像。此外，由于追加扫描场景还可能与左手持笔由左向右扫描、右手持笔由左向右扫描、左手持笔由右向左扫描或右手持笔由右向左扫描等场景同时出现，因此可以结合追加扫描请求检测状态，和扫描笔的持笔手与扫描方向，选择该复合场景下对应的图像拼接方式，进而实现图像拼接。

步骤120，对拼接图像进行图像分类，若图像分类结果为文本类图像，则对拼接图像进行文本识别，得到文本识别结果。

具体地，用户在使用扫描笔的过程中可能存在不规范操作行为或者误操作行为，例如用户在桌面等非纸质媒介的平面上滑动扫描笔，或在非阅读状态下误触扫描笔的触发按键，导致扫描笔对非文本内容进行图像采集。此时，若仍对扫描笔采集的扫描图像序列拼接得到的图像进行文本识别，将是一次无效的识别。为了避免无效的识别过程带来的资源浪费，本发明实施例在进行文本识别前，先对拼接图像进行图像分类，得到图像分类结果，以判断拼接图像是否为文本类图像。其中，图像分类结果用于表征拼接图像是否为文本类图像，文本类图像是指包含文字内容的图像。

若图像分类结果显示拼接图像为文本类图像，则可以对拼接图像进行文本识别，得到文本识别结果并予以显示。其中，文本识别结果包括该拼接图像中包含的文本内容。否则，表明拼接图像中不存在文字内容，此时无需对拼接图像进行文本识别，以避免不必要的OCR处理，从而减少文本识别的运算量，节约系统资源，也有助于提高扫描笔对其他文本类图像的识别效率。另外，若图像分类结果为非文本类图像，还可以提示用户当前扫描内容为非文本内容，以引导用户正确使用扫描笔。此处，提示方式可以是语音提示、屏幕显示提示和笔身振动提示中的至少一种。

本发明实施例提供的方法，基于追加扫描请求检测状态，和/或扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，能够支持对追加扫描场景，和/或对应不同持笔手和不同扫描方向的各类扫描场景的多场景检测，从而采用相应场景对应的图像拼接方式进行拼接，无需用户预先设置对应不同场景的扫描模式，优化了用户体验，且解决了现有扫描笔仅支持单一扫描方向的瓶颈；然后对拼接图像进行图像分类，仅当图像分类结果为文本类图像时，才对拼接图像进行文本识别，得到文本识别结果，避免了不必要的OCR处理，减少了文本识别的运算量，节约系统资源。

基于上述实施例，步骤110中，基于追加扫描请求检测状态，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，具体包括：

若追加扫描请求检测状态为是，则基于预设拼接规则，或基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到当前拼接图像，并将上次拼接所得的上一拼接图像和当前拼接图像进行拼接，得到拼接图像；

否则，基于预设拼接规则，或基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像。

具体地，若追加扫描请求检测状态为是，表明当前的使用场景为追加扫描场景，此时需要对扫描笔此次扫描采集的扫描图像序列进行拼接，得到当前拼接图像，再将上次拼接所得的上一拼接图像和当前拼接图像再次进行拼接，得到拼接图像。其中，上一拼接图像是扫描笔在上次扫描完毕后拼接得到的拼接图像。对上一拼接图像和当前拼接图像再次进行拼接的方式，具体可以是对上一拼接图像和当前拼接图像进行相似区域检测。若上一拼接图像与当前拼接图像之间存在相似区域，则基于该相似区域，对上一拼接图像与当前拼接图像进行拼接；否则，直接将当前拼接图像拼接于上一拼接图像的一侧即可。

图2为本发明实施例提供的追加扫描场景下的图像拼接示意图，其中以右手持笔由左向右扫描为例，如图2左半部分所示，上一拼接图像stitch1与当前拼接图像stitch2存在相似区域，即图中虚线框区域，因此，将stitch1与stitch2进行拼接时，将stitch2中相似区域以外的部分拼接到stitch1的右侧，得到拼接图像；如图2右半部分所示，上一拼接图像stitch1与当前拼接图像stitch2之间不存在相似区域，此时直接将stitch2拼接于stitch1的右侧即可。

若追加扫描请求检测状态为否，表明当前的使用场景为常规的单行扫描场景，此时只需要对扫描笔此次扫描采集的扫描图像序列进行拼接即可。

可见，无论追加扫描请求检测状态为是或否，均需要对扫描笔此次扫描采集的扫描图像序列进行拼接。此处，若用户已通过扫描笔预先设定了持笔手和扫描方向，则可以基于该预先设定的持笔手和扫描方向所对应的预设拼接规则，对扫描笔此次扫描采集的扫描图像序列进行拼接；若用户并未进行预先设定，则需要基于感知得到的持笔手和扫描方向，选择对应该持笔手和扫描方向的图像拼接方式，对扫描笔此次扫描采集的扫描图像序列进行拼接。

基于上述任一实施例，图3为本发明实施例提供的图像拼接方法的流程示意图，如图3所示，基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，具体包括：

步骤111，基于持笔手，确定图像拼接时的图像旋转角度。

具体地，用户在切换持笔手时，会同步翻转扫描笔，使屏幕朝向用户方向，以方便用户查看识别结果。因此，当用户使用不同手握持扫描笔时，扫描笔采集的图像是相反的。图4为本发明实施例提供的对应不同持笔手与扫描方向的图像拼接示意图，如图4所示，当用户使用右手握持扫描笔进行扫描时，扫描笔采集的图像中的文字与纸质文本上的文字是一致的，而当用户使用左手握持扫描笔进行扫描时，与纸质文本上的文字相比，扫描笔采集的图像中的文字则是旋转了180度的状态，此时需要对其进行旋转，才能与纸质文本上的文字保持一致。因此，对于不同持笔手，需要确定图像拼接时的图像旋转角度。具体可以是当持笔手为右手时，将图像旋转角度设为0，当持笔手为左手时，将图像旋转角度设为180度。

步骤112，基于持笔手和扫描方向，确定图像拼接方向。

具体地，对于不同的持笔手和扫描方向，采集得到的图像也有差异，对应的图像拼接方向也不同。其中，图像拼接方向是指针对扫描图像序列中每一扫描图像的拼接顺序。例如，当图像拼接方向为由左至右时，即按正序依次拼接扫描图像序列中的相邻图像，当图像拼接方向为由右至左时，即按倒序依次拼接扫描图像序列中的相邻图像。如图4所示，当用户右手持笔由左至右扫描时，如图中虚线箭头所示，图像拼接方向为由左至右，即从采集得到的首个图像开始，依次往后进行拼接，拼接时会将下一帧图像拼接到当前帧图像的右侧；当用户左手持笔由左至右扫描时，如图中虚线箭头所示，图像拼接方向为由右至左，即从采集得到的最末图像开始，依次往前进行拼接，拼接时会将下一帧图像拼接到当前帧图像的右侧；当用户右手持笔由右至左扫描时，如图中虚线箭头所示，图像拼接方向为由右至左，即从采集得到的最末图像开始，依次往前进行拼接，拼接时会将下一帧图像拼接到当前帧图像的右侧；当用户左手持笔由右至左扫描时，如图中虚线箭头所示，图像拼接方向为由左至右，即从采集得到的首个图像开始，依次往后进行拼接，拼接时会将下一帧图像拼接到当前帧图像的右侧。

需要说明的是，本发明实施例不对步骤111和步骤112的执行顺序作具体限定，步骤111可以在步骤112之前或者之后执行，也可以与步骤112同步执行。

步骤113，基于图像拼接方向和图像旋转角度，对扫描图像序列进行旋转拼接。

具体地，可以首先基于图像拼接方向，对扫描图像序列进行拼接，然后基于图像旋转角度对拼接后的图像进行旋转，完成此次扫描的图像拼接过程。或者，首先基于图像旋转角度，对扫描图像序列汇总的每个图像进行旋转，随即基于图像拼接方向对旋转后的所有图像进行拼接，完成此次扫描的图像拼接过程。需要说明的是，对于持笔手为左手的情况，先旋转后拼接的方式中确定得到的图像拼接方向与先拼接后旋转的方式中确定得到的图像拼接方向相反。例如，在先旋转后拼接的方式中，当用户左手持笔由左至右扫描时，图像拼接方向为由左至右；当用户左手持笔由右至左扫描时，图像拼接方向为由右至左。

本发明实施例提供的方法，基于持笔手确定图像旋转角度，基于持笔手和扫描方向确定图像拼接方向，从而基于图像拼接方向和图像旋转角度，对扫描图像序列进行旋转拼接，实现了针对不同持笔手和不同扫描方向的自适应图像拼接。

基于上述任一实施例，步骤113具体包括：

基于图像拼接方向和图像旋转角度，对扫描图像序列中每一扫描图像的有效区域进行旋转拼接；

其中，任一扫描图像的有效区域是基于持笔手确定的。

具体地，由于扫描笔笔头硬件结构的影响，采集的扫描图像中会有部分笔头硬件成像于该图像中，这部分硬件区域属于干扰区域，其并不参与图像拼接。因此，在进行图像拼接时，可以获取扫描图像中除笔头硬件区域以外的区域，作为有效区域，从而减少硬件区域对拼接效果的不利影响，同时减少数据量、加快运算速度。由于每支扫描笔生产完毕后，其结构固定，因而在图像采集时，其硬件部分在扫描图像中的区域也是固定的。因此，可以在扫描笔出厂时将有效区域位置参数，写入配置文件中，以供在扫描笔启动初始化时对其进行读取。此处，可以将有效区域设置为矩形，并将有效区域位置参数表示为(x，y，width，height)，其中x和y代表有效区域的任一边界点或中心点的横纵坐标，width和height分别为有效区域的宽和高。另外，在生产过程中可能存在一定的安装误差，导致不同扫描笔的有效区域位置参数存在差异，因此在出厂时可以对每支扫描笔进行有效区域校验，获取每支扫描笔的有效区域位置参数。

对于任一支扫描笔，若持笔手不同，则其有效区域的位置也会存在差异。例如，若持笔手为右手，则有效区域位于扫描图像的右侧，硬件区域则位于扫描图像的左侧；若持笔手为左手，则有效区域位于扫描图像的左侧，硬件区域则位于扫描图像的右侧。因此，从配置文件中获取得到该扫描笔的有效区域位置参数后，需要再根据扫描笔的持笔手，确定扫描图像序列中每一扫描图像的有效区域。得到扫描图像序列中每一扫描图像的有效区域后，按照图像拼接方向，对每一扫描图像进行图像拼接，再根据图像旋转角度，对拼接后的图像进行旋转，完成此次扫描的图像拼接过程。

本发明实施例提供的方法，基于持笔手确定任一扫描图像的有效区域，再基于图像拼接方向和图像旋转角度，对扫描图像序列中每一扫描图像的有效区域进行旋转拼接，减少了硬件区域对拼接效果的不利影响，同时减少了数据量、加快了运算速度。

现有扫描笔在追加扫描场景中，需要用户在扫描笔设置界面中选择追加扫描模式开关状态，用户若需要进行追加扫描，则可以将该状态开关开启再进行扫描。在追加扫描模式开关开启的状态下，采用定时器计时的方式，判断当前扫描开始时间与上次扫描结束时间的间隔是否满足小于预设时间的条件，若满足则认为当前处于追加扫描场景，需要将当前扫描结果与上次扫描结果合并。然而，在实际使用时，可能存在虽然当前扫描开始时间与上次扫描结束时间间隔较短，但两次扫描并无关联，且用户也无追加扫描需求的情况，在这种情况下，除非用户切换追加扫描模式开关状态，否则扫描笔仍会进行结果的追加。因此用户需要频繁地手动切换追加扫描模式开关状态，否则会出现错误。

对此，基于上述任一实施例，追加扫描请求检测状态是在上次扫描结束后，检测用户是否通过实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求得到的；

扫描笔的持笔手与扫描方向是基于扫描笔内设传感器获取的角速度方向和/或加速度方向确定得到的。

具体地，扫描笔会检测用户在上次扫描结束后，是否以实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求。若检测到追加扫描请求，则将追加扫描请求检测状态置为是，在进行图像拼接时，会将上次拼接所得的上一拼接图像和当前拼接图像进行二次拼接；若直至用户开始当前扫描均没有检测到追加扫描请求，则将追加扫描请求检测状态置为否，后续图像拼接时只需对扫描笔当前采集的扫描图像序列进行拼接即可，无需频繁切换追加扫描模式开关状态。可选地，可以在每次扫描结束后，在该次扫描的识别结果展示页面上显示UI按键，以供用户选择是否进行追加扫描。若用户点击该按键，即可触发追加扫描请求。

另外，可以基于扫描笔内设的传感器获取扫描笔运动的角速度方向和/或加速度方向，确定扫描笔的持笔手和扫描方向，以免去用户预先设定持笔手和扫描方向的手动操作。具体而言，在开始扫描前，用户将预先抬起的扫描笔的笔头按压在待扫描的纸面的过程中，持笔手不同，扫描笔的旋转方向是相反的，例如左手持笔时扫描笔的旋转方向为顺时针方向，右手持笔时扫描笔的旋转方向为逆时针方向。另外，在扫描结束后，用户抬起扫描笔的笔头的过程中，持笔手不同，扫描笔的旋转方向也是相反的。因此，可以利用角速度传感设备，例如陀螺仪，获取扫描笔在开始扫描前或扫描结束后的角速度方向，再根据上述规律，确定扫描笔的持笔手。

此外，针对于从左向右的扫描方向，在用户使用左手握持扫描笔的情况下，扫描笔向左倾斜，扫描笔由静止状态转入扫描过程的起始加速度方向从笔尾指向笔头；在用户使用右手握持扫描笔的情况下，扫描笔向右倾斜，扫描笔的起始加速度方向从笔头指向笔尾。针对于反方向的扫描方向，用户使用左手握持或使用右手握持扫描笔时，对应的扫描笔加速度方向分别为从笔头指向笔尾，和从笔尾指向笔头。因此，可以预先设置持笔手或根据角速度方向确定得到持笔手，通过加速度传感设备获取起始加速度方向，再根据上述规律，确定对应的扫描方向；或，预先设置扫描方向，通过加速度传感设备获取扫描笔的起始加速度方向，再根据上述规律，确定对应的持笔手。

本发明实施例提供的方法，通过在上次扫描结束后，检测用户是否通过实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求得到追加扫描请求检测状态，无需频繁切换追加扫描模式开关状态，简化了追加扫描场景下的操作；基于扫描笔内设传感器获取的角速度方向和/或加速度方向确定扫描笔的持笔手与扫描方向，实现持笔手与扫描方向的自动感知，即使切换持笔手或扫描方向，也无需用户手动更换设置，优化了用户体验。

目前的扫描笔在使用过程中，通常以固定帧率进行图像采集。然而，当用户以较快速度移动扫描笔时，摄像头的拍摄帧率与用户的扫描速度不匹配，导致摄像头采集到的图像中出现明显残影，图像中的文字笔画不清晰，降低了图像识别的准确率。另外，为了提高图像拼接的实时性，通常会进行预测跳帧处理，加快拼接处理速度。然而，在快速扫描场景下，相邻两帧的相似度较低，若再进行跳帧，则无法找到相似区域进行拼接。

对此，基于上述任一实施例，图5为本发明实施例提供的图像采集方法的流程示意图，如图5所示，步骤110之前还包括：

步骤101，确定扫描笔的当前扫描速度对应的拍摄帧率；

步骤102，基于拍摄帧率进行图像采集。

具体地，在用户使用扫描笔进行扫描时，可以通过扫描笔内设的速度传感器获取扫描笔的当前扫描速度。此处，当前扫描速度是指用户当前移动扫描笔的速度。基于获取的当前扫描速度，确定当前扫描速度对应的拍摄帧率。其中，扫描速度与拍摄帧率之间的对应关系可以是预先设置好的，从而可以根据预先设置的扫描速度与拍摄帧率之间的对应关系，获取当前扫描速度对应的拍摄帧率。此处，当前扫描速度对应的拍摄帧率能够与当前扫描速度相匹配，使得基于该拍摄帧率进行图像采集时，得到的扫描图像足够清晰，能够被光学字符识别模块有效识别。然后，改变扫描笔摄像头的帧率设置，以当前扫描速度对应的拍摄帧率进行图像采集。如此一来，在快速扫描场景下，摄像头的拍摄帧率也能随着扫描速度的提高而提高。在高帧率模式下采集的图像帧序列，其相邻两帧的相似度足以满足图像拼接算法，且图像质量足够清晰，可以避免因扫描速度过快导致的图像质量下降，进而提高OCR识别率，减少识别丢字丢词的情况，从而满足快速扫描场景的识别需求。

本发明实施例提供的方法，通过确定扫描笔的当前扫描速度对应的拍摄帧率，从而基于该拍摄帧率进行图像采集，可以在快速扫描场景自动提高拍摄帧率，提高OCR识别率，减少识别丢字丢词的情况，从而满足快速扫描场景的识别需求。

基于上述任一实施例，步骤120中，对所述拼接图像进行图像分类，具体包括：

将拼接图像输入至图像分类模型，得到图像分类模型输出的图像分类结果；

其中，图像分类模型是基于样本图像及其样本图像分类结果训练得到的。

具体地，图像分类模型用于判断拼接图像中是否存在文字内容，从而确定拼接图像对应的图像分类结果。若图像分类模型在拼接图像中提取到文字对应的特征，则可以确定该拼接图像为文本类图像，否则可以认为该拼接图像为非文本类图像。

在将拼接图像输入至图像分类模型之前，还可以预先训练得到图像分类模型，具体可以通过如下方式训练得到图像分类模型：首先，收集大量样本图像，并标注样本图像对应的样本图像分类结果。随即，基于样本图像及其对应的样本图像分类结果训练初始模型，从而得到图像分类模型。

基于上述任一实施例，图6为本发明又一实施例提供的扫描方法的流程示意图，如图6所示，该方法包括：

步骤610，当扫描笔笔头的触发按键被按下，会发送PEN_DOWN信号，表明扫描笔开始扫描。

步骤620，图像采集模块基于扫描笔的当前速度对应的拍摄帧率进行图像采集，并将采集的扫描图像送入图像数据缓存，直至扫描笔抬起，发送PEN_UP信号；同时，图像拼接模块从图像数据缓存中读取扫描图像，基于追加扫描请求检测状态，和/或扫描笔的持笔手与扫描方向，对读取的扫描图像进行拼接。其中，每一次拼接时，从配置文件中读取当前扫描图像对应的拼接参数。此处，拼接参数可以为(image，mode，roi，status)，其中image为当前扫描图像，mode为扫描方向模式编码，可以唯一标识持笔手与扫描方向的不同组合，roi为有效区域位置参数，status为当前扫描图像的状态，例如此次扫描的首个扫描图像、中间扫描图像或最末扫描图像。然后，图像拼接模块基于有效区域位置参数，计算当前扫描图像与上一扫描图像的最大相似区域，然后基于该最大相似区域，以及基于持笔手和扫描方向确定的图像拼接方向和图像旋转角度，进行图像拼接。图像拼接模块每处理完一个扫描图像后，会从图像数据缓存中清除该扫描图像，直至图像数据缓存为空，即完成此次扫描的拼接过程，而无需等待缓存多个扫描图像后再拼接，保证了图像拼接的实时性。若追加扫描请求检测状态为是，还需将此次扫描拼接后的图像和上次扫描拼接后的图像进行二次拼接。

步骤630，将拼接后得到的拼接图像传入图像分类模块进行图像分类，若图像分类结果为文本类图像，再将拼接图像传入OCR模块进行文本识别，得到此次扫描的识别结果。

下面对本发明实施例提供的扫描装置进行描述，下文描述的扫描装置与上文描述的扫描方法可相互对应参照。

基于上述任一实施例，图7为本发明实施例提供的扫描装置的结构示意图，如图7所示，该装置包括图像拼接单元710和图像分类识别单元720。

其中，图像拼接单元710用于基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；

图像分类识别单元720用于对拼接图像进行图像分类，若图像分类结果为文本类图像，则对拼接图像进行文本识别，得到文本识别结果。

本发明实施例提供的装置，基于追加扫描请求检测状态，和/或扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，能够支持对追加扫描场景，和/或对应不同持笔手和不同扫描方向的各类扫描场景的多场景检测，从而采用相应场景对应的图像拼接方式进行拼接，无需用户预先设置对应不同场景的扫描模式，优化了用户体验，且解决了现有扫描笔仅支持单一扫描方向的瓶颈；然后对拼接图像进行图像分类，仅当图像分类结果为文本类图像时，才对拼接图像进行文本识别，得到文本识别结果，避免了不必要的OCR处理，减少了文本识别的运算量，节约系统资源。

基于上述任一实施例，图像拼接单元710，具体用于：

基于上述任一实施例，图像拼接单元710具体包括：

旋转角度确定单元，用于基于持笔手，确定图像拼接时的图像旋转角度；

拼接方向确定单元，基于持笔手和扫描方向，确定图像拼接方向；

旋转拼接单元，用于基于图像拼接方向和图像旋转角度，对扫描图像序列进行旋转拼接。

本发明实施例提供的装置，基于持笔手确定图像旋转角度，基于持笔手和扫描方向确定图像拼接方向，从而基于图像拼接方向和图像旋转角度，对扫描图像序列进行旋转拼接，实现了针对不同持笔手和不同扫描方向的自适应图像拼接。

基于上述任一实施例，旋转拼接单元具体用于：

其中，任一扫描图像的有效区域是基于持笔手确定的。

本发明实施例提供的装置，基于持笔手确定任一扫描图像的有效区域，再基于图像拼接方向和图像旋转角度，对扫描图像序列中每一扫描图像的有效区域进行旋转拼接，减少了硬件区域对拼接效果的不利影响，同时减少了数据量、加快了运算速度。

基于上述任一实施例，追加扫描请求检测状态是在上次扫描结束后，检测用户是否通过实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求得到的；

扫描笔的持笔手与扫描方向是基于扫描笔内设传感器获取的加速度方向和/或角速度方向确定得到的。

本发明实施例提供的装置，通过在上次扫描结束后，检测用户是否通过实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求得到追加扫描请求检测状态，无需频繁切换追加扫描模式开关状态，简化了追加扫描场景下的操作；基于扫描笔内设传感器获取的角速度方向和/或加速度方向确定扫描笔的持笔手与扫描方向，实现持笔手与扫描方向的自动感知，即使切换持笔手或扫描方向，也无需用户手动更换设置，优化了用户体验。

基于上述任一实施例，该装置还包括图像采集单元，具体用于：

确定扫描笔的当前扫描速度对应的拍摄帧率；

基于拍摄帧率进行图像采集。

本发明实施例提供的装置，通过确定扫描笔的当前扫描速度对应的拍摄帧率，从而基于该拍摄帧率进行图像采集，可以在快速扫描场景自动提高拍摄帧率，提高OCR识别率，减少识别丢字丢词的情况，从而满足快速扫描场景的识别需求。

基于上述任一实施例，图像分类识别单元720具体用于：

图8示例了一种扫描笔的实体结构示意图，如图8所示，该扫描笔可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行扫描方法，该方法包括：基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果。

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的扫描方法，该方法包括：基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果。

又一方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的扫描方法，该方法包括：基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种扫描方法，其特征在于，包括：

基于追加扫描请求检测状态，或，基于所述追加扫描请求检测状态和扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；

对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果；

所述追加扫描请求检测状态是在上次扫描结束后，检测用户是否通过实体按键、触控按键和语音命令中的至少一种方式触发追加扫描请求得到的，所述追加扫描请求检测状态为是或否，分别表明是否检测到追加扫描请求，从而指示扫描笔的当前使用场景是否为追加扫描场景，所述追加扫描场景需要将用户多次扫描的内容整合到一起。

2.根据权利要求1所述的扫描方法，其特征在于，所述基于追加扫描请求检测状态，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，具体包括：

3.根据权利要求2所述的扫描方法，其特征在于，所述基于扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，具体包括：

基于所述持笔手，确定图像拼接时的图像旋转角度；

基于所述持笔手和所述扫描方向，确定图像拼接方向；

4.根据权利要求3所述的扫描方法，其特征在于，所述基于所述图像拼接方向和所述图像旋转角度，对所述扫描图像序列进行旋转拼接，具体包括：

其中，任一扫描图像的有效区域是基于所述持笔手确定的。

5.根据权利要求1或2所述的扫描方法，其特征在于，

6.根据权利要求1所述的扫描方法，其特征在于，所述基于追加扫描请求检测状态，和/或，扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像，之前还包括：

确定所述扫描笔的当前扫描速度对应的拍摄帧率；

基于所述拍摄帧率进行图像采集。

7.根据权利要求1所述的扫描方法，其特征在于，所述对所述拼接图像进行图像分类，具体包括：

8.一种扫描装置，其特征在于，包括：

图像拼接单元，用于基于追加扫描请求检测状态，或，基于所述追加扫描请求检测状态和扫描笔的持笔手与扫描方向，对扫描笔采集的扫描图像序列进行拼接，得到拼接图像；

图像分类识别单元，用于对所述拼接图像进行图像分类，若图像分类结果为文本类图像，则对所述拼接图像进行文本识别，得到文本识别结果；

9.一种扫描笔，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述扫描方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至7任一项所述扫描方法的步骤。