WO2022222047A1

WO2022222047A1 - 文档扫描方法及装置、存储介质及电子设备

Info

Publication number: WO2022222047A1
Application number: PCT/CN2021/088525
Authority: WO
Inventors: 顾磊
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-04-20
Filing date: 2021-04-20
Publication date: 2022-10-27

Abstract

一种文档扫描方法及装置、计算机可读存储介质及电子设备，方法包括：获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段(S310)；在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量(S320)；在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像(S330)；根据所述辅助图像和所述初始图像确定目标图形(S340)；根据所述目标图形完成对所述文档的扫描(S350)。本技术方案提高文档扫描的精度。

Description

文档扫描方法及装置、存储介质及电子设备

技术领域

本公开涉及文档扫描技术领域，具体而言，涉及一种文档扫描方法及装置、计算机可读存储介质及电子设备。

背景技术

基于照片的文档图片扫描技术可以集成在手机等移动端，具有携带方便使用方便的特点。当因为遮挡等原因出现目标四边形的边无法完整扫描的情况时，可以对四边形进行补全。

相关技术中对四边形的补全方案对于拍摄不完整的情况无法进行较好的补全，导致扫描的文档不准确。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种文档扫描方法、文档扫描装置、计算机可读介质和电子设备，进而至少在一定程度上提高文档扫描的精度。

根据本公开的第一方面，提供一种文档扫描方法，包括：

获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段；

在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量；

在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像；

根据所述辅助图像和所述初始图像确定目标图形；

根据所述目标图形完成对所述文档的扫描。

根据本公开的第二方面，提供一种文档扫描装置，包括：

线段检测模块，用于获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段；

图形检测模块，用于在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量；

图像获取模块，用于在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像；

图形确定模块，用于根据所述辅助图像和所述初始图像确定目标图形

文档扫描模块，用于根据所述目标图形完成对所述文档的扫描。

根据本公开的第三方面，提供一种计算机可读介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述的方法。

根据本公开的第四方面，提供一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行时，使得一个或多个处理器实现上述的方法。

本公开的一种实施例所提供的文档扫描方法，获取第一摄像头采集的初始图像，并对初始图像进行线段检测得到初始图像的第一有效线段；在根据第一有效线段无法得到目标图形时，确定第一有效线段的数量；在第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像；根据辅助图像和初始图像确定目标图形；根据目标图形完成对文档的扫描。相较于现有技术，在检测到的第一有效线段不足以构成目标图形时，利用第二摄像头采集到的辅助图像进行辅助以获得对应的目标图形来完成对文档的扫描，利用辅助图像提升了对文档扫描的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本公开实施例的一种示例性系统架构的示意图；

图2示出了可以应用本公开实施例的一种电子设备的示意图；

图3示意性示出本公开示例性实施例中一种文档扫描方法的流程图；

图4示意性示出本公开示例性实施例中一种四边形检测的流程图；

图5示意性示出本公开示例性实施例中与初始图像所对应图形编辑界面的示意图；

图6示意性示出本公开示例性实施例中无法完成扫描时的界面展示示意图；

图7示意性示出本公开示例性实施例中辅助图像的示意图；

图8示意性示出本公开示例性实施例中获取第二有效线段的流程图；

图9示意性示出本公开示例性实施例中第一有效线段无法构成目标图形时初始图像的示意图；

图10示意性示出本公开示例性实施例中辅助图像与初始图形对齐后的示意图；

图11示意性示出本公开示例性实施例中初始线段的示意图；

图12示意性示出本公开示例性实施例中去除辅助图像中与初始图形重叠部分线段的示意图；

图13示意性示出本公开示例性实施例中第一有效线段构成目标图形时的第一有效线段的示意图；

图14示意性示出本公开示例性实施例中第二有效线段能够构成目标图形时第二有效线段的示意图；

图15示意性示出本公开示例性实施例中与辅助图像所对应图形编辑界面的示意图；

图16示意性示出本公开示例性实施例中第二有效线段不能够构成目标图形时第二有效线段的示意图；

图17示意性示出本公开示例性实施例中辅助线段的示意图；

图18示意性示出本公开示例性实施例中辅助线段和第二有效线段构成目标图形的示意图；

图19示意性示出本公开示例性实施例中在辅助图像外侧设置一背景图像后的图形编辑界面的示意图；

图20示意性示出本公开示例性实施例中文档扫描方法的整体流程图；

图21示意性示出本公开示例性实施例中文档扫描装置的组成示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图1示出了可以应用本公开实施例的一种文档扫描方法及装置的示例性应用环境的系统架构的示意图。

如图1所示，系统架构100可以包括终端设备101、102、103中的一个或多个，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是各种具有图像采集以及图像处理功能的电子设备，包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

本公开实施例所提供的文档扫描方法一般由终端设备101、102、103中执行，相应地，文档扫描装置一般设置于终端设备101、102、103中。但本领域技术人员容易理解的是，本公开实施例所提供的文档扫描方法也可以由服务器105执行，相应的，文档扫描装置也可以设置于服务器105中，本示例性实施例中对此不做特殊限定。举例而言，在一种示例性实施例中，可以是用户通过终端设备101、102、103包括的用于采集初始图像和辅助图像，然后将初始图像和辅助图像上传至服务器105，服务器通过本公开实施例所提供的文档扫描方法完成对文档的扫描，将扫描结果给终端设备101、102、103等。

本公开的示例性实施方式提供一种用于实现文档扫描方法的电子设备，其可以是图1中的终端设备101、102、103或服务器105。该电子设备至少包括处理器和存储器，存储器用于存储处理器的可执行指令，处理器配置为经由执行可执行指令来执行文档扫描方法。

下面以图2中的移动终端200为例，对电子设备的构造进行示例性说明。本领域技术人员应当理解，除了特别用于移动目的的部件之外，图2中的构造也能够应用于固定类型的设备。在另一些实施方式中，移动终端200可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。各部件间的接口连接关系只是示意性示出，并不构成对移动终端200的结构限定。在另一些实施方式中，移动终端200也可以采用与图2不同的接口连接方式，或多种接口连接方式的组合。

如图2所示，移动终端200具体可以包括：处理器210、内部存储器221、外部存储器接口222、通用串行总线(Universal Serial Bus，USB)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(subscriber identification module，SIM)卡接口295等。其中传感器模块 280可以包括深度传感器2801、压力传感器2802、陀螺仪传感器2803等。

处理器210可以包括一个或多个处理单元，例如：处理器210可以包括应用处理器(Application Processor，AP)、调制解调处理器、图形处理器(Graphics Processing Unit，GPU)、图像信号处理器(Image Signal Processor，ISP)、控制器、视频编解码器、数字信号处理器(Digital Signal Processor，DSP)、基带处理器和/或神经网络处理器(Neural-Network Processing Unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

NPU为神经网络(Neural-Network，NN)计算处理器，通过借鉴生物神经网络结构，例如借鉴人脑神经元之间传递模式，对输入信息快速处理，还可以不断的自学习。通过NPU可以实现移动终端200的智能认知等应用，例如：图像识别，人脸识别，语音识别，文本理解等。

处理器210中设置有存储器。存储器可以存储用于实现六个模块化功能的指令：检测指令、连接指令、信息管理指令、分析指令、数据传输指令和通知指令，并由处理器210来控制执行。

充电管理模块240用于从充电器接收充电输入。电源管理模块241用于连接电池242、充电管理模块240与处理器210。电源管理模块241接收电池242和/或充电管理模块240的输入，为处理器210、内部存储器221、显示屏290、摄像模组291和无线通信模块260等供电。

移动终端200的无线通信功能可以通过天线1、天线2、移动通信模块250、无线通信模块260、调制解调处理器以及基带处理器等实现。其中，天线1和天线2用于发射和接收电磁波信号；移动通信模块250可以提供应用在移动终端200上的包括2G/3G/4G/5G等无线通信的解决方案；调制解调处理器可以包括调制器和解调器；无线通信模块260可以提供应用在移动终端200上的包括无线局域网(Wireless Local Area Networks，WLAN)(如无线保真(Wireless Fidelity，Wi-Fi)网络)、蓝牙(Bluetooth，BT)等无线通信的解决方案。在一些实施例中，移动终端200的天线1和移动通信模块250耦合，天线2和无线通信模块260耦合，使得移动终端200可以通过无线通信技术与网络以及其他设备通信。

移动终端200通过GPU、显示屏290及应用处理器等实现显示功能。GPU为图像处理的微处理器，连接显示屏290和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器210可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。

移动终端200可以通过ISP、摄像模组291、视频编解码器、GPU、显示屏290及应用处理器等实现拍摄功能。其中，ISP用于处理摄像模组291反馈的数据；摄像模组291用于捕获静态图像或视频；数字信号处理器用于处理数字信号，除了可以处理数字图像信号，还可以处理其他数字信号；视频编解码器用于对数字视频压缩或解压缩，移动终端200还可以支持一种或多种视频编解码器。

外部存储器接口222可以用于连接外部存储卡，例如Micro SD卡，实现扩展移动终端200的存储能力。外部存储卡通过外部存储器接口222与处理器210通信，实现数据存储功能。例如将音乐，视频等文件保存在外部存储卡中。

内部存储器221可以用于存储计算机可执行程序代码，可执行程序代码包括指令。内部存储器221可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用程序(比如声音播放功能，图像播放功能等)等。存储数据区可存储移动终端200使用过程中所创建的数据(比如音频数据，电话本等)等。此外，内部存储器221可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件，闪存器件，通用闪存存储器(Universal Flash Storage，UFS)等。处理器210通过运行存储在内部存储器221的指令和/或存储在设置于处理器中的存储器的指令，执行移动终端200的各种功能应用以及数据处理。

移动终端200可以通过音频模块270、扬声器271、受话器272、麦克风273、耳机接口274及应用处理器等实现音频功能。例如音乐播放、录音等。

深度传感器2801用于获取景物的深度信息。在一些实施例中，深度传感器可以设置于摄像模组291。

压力传感器2802用于感受压力信号，可以将压力信号转换成电信号。在一些实施例中，压力传感器2802可以设置于显示屏290。压力传感器2802的种类很多，如电阻式压力传感器，电感式压力传感器，电容式压力传感器等。

陀螺仪传感器2803可以用于确定移动终端200的运动姿态。在一些实施方式中，可以通过陀螺仪传感器2803确定移动终端200围绕三个轴(即，x，y和z轴)的角速度。陀螺仪传感器2803可以用于拍摄防抖、导航、体感游戏场景等。

此外，还可以根据实际需要在传感器模块280中设置其他功能的传感器，例如气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器、骨传导传感器等。

移动终端200中还可包括其它提供辅助功能的设备。例如，按键294包括开机键，音量键等，用户可以通过按键输入，产生与移动终端200的用户设置以及功能控制有关的键信号输入。再如，指示器292、马达293、SIM卡接口295等。

在相关技术中，当因为遮挡等原因出现目标四边形的边无法完整扫描的情况时，市面上的一些应用可以对四边形进行补全，然而该补全是基于图像的边框或者是四边形的三条边等信息，并非实际拍摄的图像。在拍摄完成后用户还可以进行四边形框的调整，然而调整时所参照的是原输入图像，对于拍摄不完整的情况无法进行较好的补全。现在已经有许多移动端在主摄以外集成了超广角镜头相机，可以通过该相机拓展增强了现有的摄像功能。若在对文档进行先扫描时直接采用超广角镜头超广角预览与用户常用的习惯不相符，对于大部分情况下，主摄视角的拍摄更为方便自然。相比主摄会丢失更多的图像细节，尤其对于文档扫描影响最终的扫描效果，可能造成文字模糊或图像不清晰。很可能会将许多无关的信息纳入视野范围，从而对目标四边形的检测造成一定的干扰。

下面对本公开示例性实施方式的文档扫描方法和文档扫描装置进行具体说明。

基于上述缺点，参照图3所示，本公开首先提供一种文档扫描方法，该方法可以包括以下步骤：

步骤S310，获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段；

步骤S320，在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量；

步骤S330，在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像；

步骤S340，根据所述辅助图像和所述初始图像确定目标图形；

步骤S350，根据所述目标图形完成对所述文档的扫描。

相较于现有技术，在检测到的第一有效线段不足以构成目标图形时，利用第二摄像头采集到的辅助图像进行辅助以获得对应的目标图形来完成对文档的扫描，利用辅助图像提升了对文档扫描的准确性。

下面对上述各步骤进行详细说明。

在步骤S310中，获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段。

在本公开的一种示例实施方式中，服务器可以获取由第一摄像头采集的初始图像，第一摄像头可以是设置在移动终端上的主摄像头，在采集到上述初始图像之后，可以对上述初始图像进行线段检测得到初始图像的第一有效线段。

具体而言，可以采用直线段检测算法(LSD，Line Segment Detector)来实现对上述初始图像进行线段检测，还可以采用其他先算检测算法来对上述初始图像进行线段检测，在本示例实施方式中不做具体限定。

在本公开的一种实施例中，在对上述初始图像进行线段检测时，可以首先对上述初始图像及西宁线段检测得到参考线段，然后，对参考线段进行噪声线段去除，重叠线段融合等操作得到上述第一有效线段，其中噪声线段可以是线段总长度与初始图像最长边的比值小于等于预设比值的线段，其中，预设比值可以0.2,，也可以是0.1、0.3等，还可以根据用户需求进行自定义，在本示例实施方式中不做具体限定。

在步骤S320中，在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量。

在本公开的一种是示例实施方式中，服务器可以首先判断上述第一有效线段是否能够构成目标图形，上述目标图形可以是目标四边形，在上述第一有效线段无法构成上述目标图形时，确定上述第一有效线段的数量。其中，上述能够构成目标图形为上述第一有效线段的延长线连接后能够够长上述目标图形。

在本示例实施方式中，参照图4所示，以目标图形为目标四边形为例对第一有效线段是否能够构成目标图形进行说明，首先可以执行步骤S410，判断上述多个第一有效线段能否构成四边形，如无法构成四边形，则执行步骤S430，判定上述第一有效线段无法构成上述目标四边形，若能够构成四边形，则执行步骤S420，判断得到的四边形是否满足预设规则，若上述四边形满足上述预设规则，判定上述第一有效线段能够构成目标四边形。若上述四边形不能满足预设规则，则判定上述第一有效线段无法构成目标四边形，即无法构成目标图形。

其中，上述预设规则可以包括对立边的角度小于30，相邻边的角度大于60度、四边形面积大于图像尺寸的六分之一；也可以根据扫描文档的不同及进行适应性修改，好可以根据用户的需求进行自定义，在本示例实施方式中不做具体限定。

在本示例实施方式中，在上述第一有效线段能够构成多个目标四边形时，可以执行步骤S440和步骤S450，分别计算多个目标四边形的可信度，并根据可信度对多个目标四边形进行排序，若只需要输出一个目标四边形，则将可信度最大的目标四边形输出，若需要输出多个目标四边形，则执行步骤S460，将按照可信度从大到小的顺序进行输出需要数量的目标四边形。

在本示例实施方式中，参照图5所示，在判定上述第一有效线段能够构成目标图形510时，则可以直接根据得到的目标图形510完成对文档的扫描，还可以生成与初始图像所对应图形编辑界面，以使得用户能够在图形编辑界面对目标图形进行调整。

在判定上述第一有效线段无法构成目标图形时，可以确定上述第一有效线段的数量，可以执行步骤S330。

在步骤S330中，在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像。

在本示例实施方式中，在上述第一有效线段无法构成目标图形时，可以判段上述第一有效线段的数量是否满足第一预设条件，其中第一预设条件与目标图形相关，例如，若上述目标图形为目标四边形，则第一预设条件可以为第一有效线段的数量大于等于2，若上述目标图形为目标五边形，则第一预设条件可以为第一有效线段的数量大于等于3；第一预设条件还可以根据用户的需求进行自定义，在本示例实施方式中不做具体限定。

在本示例实施方式中，参照图6所示，若上述第一有效线段的数量不满足上述第一预设条件，则生成扫描失败信号并展示。

在本共公开的一种示例实施方式中，在上述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像，其中第二摄像头可以是拍摄范围大于第一摄像头的超广角镜头，用于采集包含初始图像的辅助图像。

在步骤S340中，根据所述辅助图像和所述初始图像确定目标图形。

在本公开的一种示例实施方式中，参照图7所示，在根据辅助图像和初始图像确定目标图形时，可以首先将辅助图像与初始图像进行线段信息融合得到第二有效线段，若根据第二有效线段无法得到目标图形，则确定第二有效线段的数量；在第二有效线段的数量满足第一预设条件时，添加辅助线段；根据第二有效线段和辅助线段确定目标图形。

具体而言，参照图8所示，在将辅助图像与初始图像进行线段信息融合得到第二有效线段时，参照图9、图10所示，可以首先执行步骤S810，将辅助图像和初始图像进行对齐之后再对上述辅助图像进行线段检测。参照图11所示，可以执行步骤S820，对上述辅助图像进行线段检测，得到初始线段，然后可以参照图12所示，执行步骤S830，删除辅助图像与初始图像重叠部分的初始线段得到辅助图像的线段检测结果；参照图13和图14所示，执行步骤S840，将辅助图像的线段检测结果与第一有效线段进行融合得到第二有效线段。

在本公开的一种是示例实施方式中，服务器可以首先判断上述第二有效线段是否能够构成目标图形，上述目标图形可以是目标四边形，在上述第二有效线段无法构成上述目标图形时，确定上述第二有效线段的数量。

在本示例实施方式中，参照图4所示，以目标图形为目标四边形为例对第二有效线段是否能够构成目标图形进行说明，首先可以判断上述多个第一有效线段能否构成四边形，则判定上述第二有效线段无法构成上述目标图形，若能够构成四边形，则判断得到的四边形是否满足预设规则，若上述四边形满足上述预设规则，则判定上述第二有效线段能够构成目标四边形。若上述四边形不能满足预设规则，则判定上述第二有效线段无法构成目标四边形，即无法构成目标图形。

在本示例实施方式中，在上述第二有效线段能够构成多个目标图形时，可以分别计算多个目标图形的可信度，并根据可信度对多个目标图形进行排序，若只需要输出一个目标图形，则将可信度最大的目标图形输出，若需要输出多个目标图形，则将按照可信度从大到小的顺序进行输出需要数量的目标图形。

在本示例实施方式中，参照图15所示，在判定上述第二有效线段能够构成目标图形时，则可以直接根据得到的目标图形完成对文档的扫描，还可以生成与辅助图像所对应图形编辑界面，以使得用户能够在图形编辑界面对目标图形进行调整。并对上述辅助图像中初始图像的部分进行差异化显示，举例而言，对上述辅助图像进行暗化显示，但辅助图像中的初始图像的部分的显示亮度较高，在本示例实施方式中不对上述差异化显示做具体限定。

在本示例实施方式中，参照在用户对上述目标图像调整完成后，对图像进行裁剪得到选定大小的目标图形。例如，将目标图形与初始图像重叠部分的图像进行裁剪并输出，作为扫描结果。在本示例实施方式中不对裁剪方式做具体限定。

在本示例实施方式中，在上述第二有效线段无法构成目标图形时，可以判段上述第二有效线段的数量是否满足第一预设条件，其中第一预设条件与目标图形相关，例如，若上述目标图形为目标四边形，则第一预设条件可以为第二有效线段的数量大于等于2，若上述目标图形为目标五边形，则第一预设条件可以为第二有效线段的数量大于等于3；第一预设条件还可以根据用户的需求进行自定义，在本示例实施方式中不做具体限定。在所述第二有效线段的数量不满足不第一预设条件时，生成扫描失败信号并展示。

在上述第二有效线段的数量满足第一预设条件时，参照图16、图17和图18所示，添加辅助线段，根据第二有效线段和上述辅助线段1701来确定目标图形，其中上述辅助线段1701可以是上述辅助图像的边界，也可以根据用户需求进行自定义，在本示例实施方式中不做具体限定。

在本示例实施方式中，在做出辅助线段之后，可以判断上述辅助线段和上述第二有效线段是否能够构成目标图形，若无法构成目标图像则生成扫描失败信号并展示。

在本示例实施方式中，参照图19所示，若可以生成上述目标图形，则生成辅助图像对应的图形编辑界面，其中辅助图像包含初始图像1901，并在辅助图像外侧设置一背景图像1902，以使得用户能够在图形编辑界面对目标图形进行调整。

在步骤S350中，根据所述目标图形完成对所述文档的扫描。

在本示例实施方式中，在根据所述目标图形完成对所述文档的扫描，时可以首先获取所述目标图形的各顶点的坐标；根据各顶点的坐标提取文档图片；对所述文档图片进行校正并输出。

在本示例实施方式中，参照图20所示，以上述目标图像为目标四边形对上述文档扫描方法进行整体说明。

在本示例实施方式中，可以首先执行步骤S2010，获取初始图像，然后执行步骤S2020，对初始图像进行线段检测得到第一有效线段，执行步骤S2030，判断第一有效线段是否能够得到目标四边形，若能够，则执行步骤S2091，输出目标四边形，若不能能够则执行步骤S2040，第一有效线段数量是否小于2，若是，则执行步骤S2092，生成扫描失败信号并展示，若否，则执行步骤S2050，获取辅助图像，并将辅助图像与初始图像进行线段信息融合得到第二有效线段；然后执行步骤S2060，判断第二有效线段对否能够得到目标四边形，若是，则执行步骤S2091，输出目标四边形，若否，则执行步骤S2070，判断第二有效线段的数量是否小于2，若是，则执行步骤S2092，生成扫描失败信号并展示，若否，则执行步骤S2080，添加辅助线段，然后执行步骤S2090，判断第二有效线段和辅助线段是否能够得到目标四边形，若是，则执行步骤S2091，输出目标四边形，若是，则执行步骤S2092，生成扫描失败信号并展示。

上述各步骤的具体细节上述已经进行了详细展示，此处不再赘述。

综上所述，本示例性实施方式中，相较于现有技术，在检测到的第一有效线段不足以构成目标图形时，利用第二摄像头采集到的辅助图像进行辅助以获得对应的目标图形来完成对文档的扫描，利用辅助图像提升了对文档扫描的准确性。

需要注意的是，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

进一步的，参考图21所示，本示例的实施方式中还提供一种文档扫描装置2100，包括线段检测模块2110、图形检测模块2120、图像获取模块2130、图形确定模块 2140以及文档扫描模块2150。其中：

线段检测模块2110可以用于获取第一摄像头采集的初始图像，并对初始图像进行线段检测得到初始图像的第一有效线段，上述线段检测模块2110还可以被具体配置为用于对初始图像进行线段检测得到参考线段；对参考线段进行噪音线段去除，重叠线段融合得到第一有效线段。

图形检测模块2120可以用于在根据第一有效线段无法得到目标图形时，确定第一有效线段的数量；图形检测模块2120还可以在根据第一有效线段能够得到目标图形时，将目标图形发送至文档扫描模块2150，使得文档扫描模块2150根据目标图形完成对文档的扫描。

在本示例实施方式中，文档扫描装置2100还可以包括编辑模块，编辑模块可一用于在根据第一有效线段能够得到目标图形时，生成与初始图像所对应图形编辑界面，以使得用户能够在图形编辑界面对目标图形进行调整。或在根据第二有效线段能够得到目标图形时，生成与初始图像所对应图形编辑界面，并将对辅助图像中初始图像的部分进行差异化显示，以使得用户能够在图形编辑界面对目标图形进行调整。或在根据第二有效线段和辅助线段确定目标图形时，生成辅助图像对应的图形编辑界面，并在辅助图像外侧设置一背景图像，以使得用户能够在图形编辑界面对目标图形进行调整。

图像获取模块2130可以用于在第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像。图像获取模块2130还可以用于在第一有效线段的数量不满足不第一预设条件时，生成扫描失败信号并展示。或者在第二有效线段的数量不满足不第一预设条件时，生成扫描失败信号并展示。

图形确定模块2140可以用于根据辅助图像和初始图像确定目标图形，其中图形确定模块2140可以被具体配置为将辅助图像与初始图像进行线段信息融合得到第二有效线段；若根据第二有效线段无法得到目标图形，则确定第二有效线段的数量；在第二有效线段的数量满足第一预设条件时，添加辅助线段；根据第二有效线段和辅助线段确定目标图形。

其中将辅助图像与初始图像进行线段信息融合得到第二有效线段可以包括：对辅助图像进行线段检测，得到初始线段；删除辅助图像与初始图像重叠部分的初始线段得到辅助图像的线段检测结果；将辅助图像的线段检测结果与第一有效线段进行融合得到第二有效线段。

其中，若第一有效线段无法构成四边形，或构成的四边形不满足预设规则，则判定根据第一有效线段无法得到目标图形；若第二有效线段无法构成四边形，或构成的四边形不满足预设规则，则判定根据第二有效线段无法得到目标图形。

其中，根据辅助图像和初始图像确定目标图形还包括：将辅助图像与初始图像进行线段信息融合得到第二有效线段；若根据第二有效线段能够得到目标图形，则根据目标图形完成对文档的扫描。

上述图形确定模块2140还可以用于确定各目标图形的可信度；根据各目标图形的可信度对目标图形进行排序；利用可信度大于预设值的目标图形完成对文档的扫描。

文档扫描模块2150可以用于根据目标图形完成对文档的扫描。具体可以被配置为用于获取目标图形的各顶点的坐标；根据各顶点的坐标提取文档图片；对文档图片进行校正并输出。

上述装置中各模块的具体细节在方法部分实施方式中已经详细说明，未披露的细节内容可以参见方法部分的实施方式内容，因而不再赘述。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

本公开的示例性实施方式还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在终端设备上运行时，程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。

需要说明的是，本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

此外，可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims

一种文档扫描方法，其特征在于，包括：

获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段；

在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量；

在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像；

根据所述辅助图像和所述初始图像确定目标图形；

根据所述目标图形完成对所述文档的扫描。
根据权利要求1所述的方法，其特征在于，对所述初始图像进行线段检测得到所述初始图像的第一有效线段，包括：

对所述初始图像进行线段检测得到参考线段；

对所述参考线段进行噪音线段去除，重叠线段融合得到所述第一有效线段。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

若根据所述第一有效线段能够得到目标图形，则根据所述目标图形完成对所述文档的扫描。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

在根据所述第一有效线段能够得到目标图形时，生成与所述初始图像所对应图形编辑界面，以使得用户能够在所述图形编辑界面对所述目标图形进行调整。
根据权利要求1所述的方法，其特征在于，所述根据所述辅助图像和所述初始图像确定目标图形包括：

将所述辅助图像与所述初始图像进行线段信息融合得到第二有效线段；

若根据所述第二有效线段无法得到所述目标图形，则确定所述第二有效线段的数量；

在所述第二有效线段的数量满足第一预设条件时，添加辅助线段；

根据所述第二有效线段和所述辅助线段确定所述目标图形。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

在根据所述第二有效线段和所述辅助线段确定所述目标图形时，生成辅助图像对应的图形编辑界面，并在所述辅助图像外侧设置一背景图像，以使得用户能够在所述图形编辑界面对所述目标图形进行调整。
根据权利要求5所述的方法，其特征在于，将所述辅助图像与所述初始图像进行线段信息融合得到第二有效线段，包括：

对所述辅助图像进行线段检测，得到初始线段；

删除所述辅助图像与所述初始图像重叠部分的初始线段得到辅助图像的线段检测结果；

将所述辅助图像的线段检测结果与所述第一有效线段进行融合得到所述第二有效线段。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

在所述第二有效线段的数量不满足不第一预设条件时，生成扫描失败信号并展示。
根据权利要求8所述的方法，其特征在于，所述目标图形包括目标四边形，所述方法还包括：

若所述第二有效线段无法构成四边形，或构成的四边形不满足预设规则，则判定根据所述第二有效线段无法得到目标图形。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

在所述辅助线段和所述第二有效线段无法构成目标图形时，生成扫描失败信号并展示。
根据权利要求10所述的方法，其特征在于，所述目标图形包括目标四边形，所述方法还包括：

若所述第二有效线段和所述辅助线段无法构成四边形，或构成的四边形不满足预设规则，则判定根据所述第二有效线段和所述辅助线段无法得到目标图形。
根据权利要求1所述的方法，其特征在于，所述根据所述辅助图像和所述初始图像确定目标图形还包括：

将所述辅助图像与所述初始图像进行线段信息融合得到第二有效线段；

若根据所述第二有效线段能够得到所述目标图形，则根据所述目标图形完成对所述文档的扫描。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

在根据所述第二有效线段能够得到所述目标图形时，生成与所述初始图像所对应图形编辑界面，并将对所述辅助图像中初始图像的部分进行差异化显示，以使得用户能够在所述图形编辑界面对所述目标图形进行调整。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述第一有效线段的数量不满足不第一预设条件时，生成扫描失败信号并展示。
根据权利要求1所述的方法，其特征在于，所述目标图形的数量为多个，所述方法还包括：

确定各所述目标图形的可信度；

根据各所述目标图形的可信度对所述目标图形进行排序；

利用可信度大于预设值的所述目标图形完成对所述文档的扫描。
根据权利要求1所述的方法，其特征在于，所述根据所述目标图形完成对所述文档的扫描，包括：

获取所述目标图形的各顶点的坐标；

根据各顶点的坐标提取文档图片；

对所述文档图片进行校正并输出。
根据权利要求1所述的方法，其特征在于，所述目标图形包括目标四边形，所述方法还包括：

若所述第一有效线段无法构成四边形，或构成的四边形不满足预设规则，则判定根据所述第一有效线段无法得到目标图形。
一种文档扫描装置，其特征在于，包括：

线段检测模块，用于获取第一摄像头采集的初始图像，并对所述初始图像进行线段检测得到所述初始图像的第一有效线段；

图形检测模块，用于在根据所述第一有效线段无法得到目标图形时，确定所述第一有效线段的数量；

图像获取模块，用于在所述第一有效线段的数量满足第一预设条件时，获取第二摄像头采集的辅助图像；

图形确定模块，用于根据所述辅助图像和所述初始图像确定目标图形

文档扫描模块，用于根据所述目标图形完成对所述文档的扫描。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至17中任一项所述的文档扫描方法。
一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至17中任一项所述的文档扫描方法。