CN111695555B

CN111695555B - 一种基于题号的精准框题方法、装置、设备和介质

Info

Publication number: CN111695555B
Application number: CN202010534221.2A
Authority: CN
Inventors: 江顺尧; 许多; 邓小兵
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2023-05-23
Anticipated expiration: 2040-06-12
Also published as: CN111695555A

Abstract

本发明实施例涉及图像处理技术领域，公开了一种基于题号的精准框题方法、装置、设备和介质。该方法包括：获取目标图像；对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓；根据所述题号的级别和顺序设置每个内部轮廓对应的标签值；识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓；根据所述标签值和备选轮廓确定精选轮廓。实施本发明实施例，精确分析出题目层级，判别大小题进行输出，对各种排版和格式都具有较好的兼容性，同时还能根据业务需要，灵活调整输出的范围，具有很好的适用性。

Description

一种基于题号的精准框题方法、装置、设备和介质

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于题号的精准框题方法、装置、电子设备和存储介质。

背景技术

当前很多电子教辅设备，都通过与用户交互的方法，识别用户意图。在具体的文本教辅资料场景大中，例如用户点击试卷练习册纸面上的题目，在设备屏幕上返回用户所指题目区域，在这种场景下，常规题目的返回方法较为直接，仅仅是根据点击点和题目分割区域的位置关系确定点击点对应的题目分割区域，并将点击点对应的题目分割区域内的题目返回到设备屏幕中显示。当存在用户所指题目存在大小层级关系时，会产生意图的混乱，现在常规方法无法判断大小题，更无法按照用户意图返回正确的题目区域。

发明内容

针对所述缺陷，本发明实施例公开了一种基于题号的精准框题方法、装置、设备和介质，其可以根据用户意图，灵活调整输出范围。

本发明实施例第一方面公开一种基于题号的精准框题方法，所述方法包括：

获取目标图像；

对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓；

根据所述题号的级别和顺序设置每个内部轮廓对应的标签值；

识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓；

根据所述标签值和备选轮廓确定精选轮廓。

作为一种可选的实施方式，在本发明实施例第一方面中，对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓，包括：

将所述目标图像输入基于深度学习的实例分割模型，获取每个题号对应的文本轮廓，记为内部轮廓。

将所述目标图像并行输入基于深度学习的题目识别网络模型、文本行检测网络模型以及题号检测网络模型确定题目轮廓、文本行轮廓和题号框；

创建一张空白掩码图，所述空白掩码图与目标图像的尺寸相同；

将所述题目轮廓添加至所述掩码图中；

根据题号框和文本行轮廓确定题号行的上边界，并将所述上边界添加至所述掩码图中；

延长所述上边界的左右端点，以使所述上边界与题目轮廓相连接，所述上边界将题目轮廓分割成多个题目区域，每个题目区域构成每个题号对应的内部轮廓。

作为一种可选的实施方式，在本发明实施例第一方面中，根据所述题号的级别和顺序设置每个内部轮廓对应的标签值，包括：

通过题号分类模型获取每个题号的级别，所述级别包括一级题目、二级题目和三级题目；

按照题号的顺序以及题号的级别从上到下、从左到右为所述题号设置标签值。

作为一种可选的实施方式，在本发明实施例第一方面中，识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓，包括：

将目标图像输入预先训练的基于深度学习的神经网络识别模型识别点击点，并确定点击点对应的定位坐标点；

获取所述定位坐标点和内部轮廓的位置关系，在所述定位坐标点落入其中一个内部轮廓内时，所述其中一个内部轮廓作为备选轮廓，在所述定位坐标点不落入任意内部轮廓时，则选取距离所述定位坐标点最近的内部轮廓作为备选轮廓。

作为一种可选的实施方式，在本发明实施例第一方面中，根据所述标签值和备选轮廓确定精选轮廓，包括：

根据标签值确定备选轮廓对应的题号级别；

在所述备选轮廓对应的题号级别为三级题目时，识别所述备选轮廓对应文本的题目类型，在所述题目类型为选择题、填空题或判断题时，所述备选轮廓为最终的精选轮廓；在所述题目类型不是选择题、填空题或判断题时，则确定所述三级题目所在的二级题目，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓；

在所述备选轮廓对应的题号为二级题目时，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓；

在所述备选轮廓对应的题号为一级题目时，将所述一级题目及其关联的所有二级题目和三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓。

本发明实施例第二方面公开一种基于题号的精准框题装置，所述装置包括：

获取单元，用于获取目标图像；

识别单元，用于对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓；

设置单元，用于根据所述题号的级别和顺序设置每个内部轮廓对应的标签值；

粗选单元，用于识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓；

精选单元，用于根据所述标签值和备选轮廓确定精选轮廓。

作为一种可选的实施方式，在本发明实施例第二方面中，所述识别单元，包括：

输入子单元，用于将所述目标图像并行输入基于深度学习的题目识别网络模型、文本行检测网络模型以及题号检测网络模型确定题目轮廓、文本行轮廓和题号框；

创建子单元，用于创建一张空白掩码图，所述空白掩码图与目标图像的尺寸相同；

第一添加子单元，用于将所述题目轮廓添加至所述掩码图中；

第二添加子单元，用于根据题号框和文本行轮廓确定题号行的上边界，并将所述上边界添加至所述掩码图中；

延长子单元，用于延长所述上边界的左右端点，以使所述上边界与题目轮廓相连接，所述上边界将题目轮廓分割成多个题目区域，每个题目区域构成每个题号对应的内部轮廓。

作为一种可选的实施方式，在本发明实施例第二方面中，所述设置单元，包括：

题号级别获取子单元，用于通过题号分类模型获取每个题号的级别，所述级别包括一级题目、二级题目和三级题目；

标签值设置子单元，用于按照题号的顺序以及题号的级别从上到下、从左到右为所述题号设置标签值。

作为一种可选的实施方式，在本发明实施例第二方面中，所述粗选单元，包括：

点击点识别子单元，用于将目标图像输入预先训练的基于深度学习的神经网络识别模型识别点击点，并确定点击点对应的定位坐标点；

备选轮廓确定子单元，用于获取所述定位坐标点和内部轮廓的位置关系，在所述定位坐标点落入其中一个内部轮廓内时，所述其中一个内部轮廓作为备选轮廓，在所述定位坐标点不落入任意内部轮廓时，则选取距离所述定位坐标点最近的内部轮廓作为备选轮廓。

作为一种可选的实施方式，在本发明实施例第二方面中，所述精选单元，包括：

题号级别确定子单元，用于根据标签值确定备选轮廓对应的题号级别；

第一判断子单元，用于在所述备选轮廓对应的题号级别为三级题目时，识别所述备选轮廓对应文本的题目类型，在所述题目类型为选择题、填空题或判断题时，所述备选轮廓为最终的精选轮廓；在所述题目类型不是选择题、填空题或判断题时，则确定所述三级题目所在的二级题目，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓；

第二判断子单元，用于在所述备选轮廓对应的题号为二级题目时，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓；

第三判断子单元，用于在所述备选轮廓对应的题号为一级题目时，将所述一级题目及其关联的所有二级题目和三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓。

本发明实施例第三方面公开一种电子设备，包括：存储有可执行程序代码的存储器；与所述存储器耦合的处理器；所述处理器调用所述存储器中存储的所述可执行程序代码，用于执行本发明实施例第一方面公开的一种基于题号的精准框题方法的部分或全部步骤。

本发明实施例第四方面公开一种计算机可读存储介质，其存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面公开的一种基于题号的精准框题方法的部分或全部步骤。

本发明实施例第五方面公开一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行本发明实施例第一方面公开的一种基于题号的精准框题方法的部分或全部步骤。

本发明实施例第六方面公开一种应用发布平台，所述应用发布平台用于发布计算机程序产品，其中，当所述计算机程序产品在计算机上运行时，使得所述计算机执行本发明实施例第一方面公开的一种基于题号的精准框题方法的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，获取目标图像；对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓；根据所述题号的级别和顺序设置每个内部轮廓对应的标签值；识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓；根据所述标签值和备选轮廓确定精选轮廓。可见，实施本发明实施例，可以在试卷、练习册等文本教辅资料场景下，精确分析出题目层级，判别大小题进行输出，对各种排版和格式都具有较好的兼容性，同时还能根据业务需要，灵活调整输出的范围，具有很好的适用性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种基于题号的精准框题方法的流程示意图；

图2为本发明实施例公开的获取内部轮廓方法的流程示意图；

图3为本发明实施例公开的一个目标图像的示意图；

图4为本发明实施例公开的题目轮廓的示意图；

图5为本发明实施例公开的内部轮廓的示意图；

图6为本发明实施例公开的精选轮廓的示意图；

图7为本发明实施例公开的一种基于题号的精准框题装置的结构示意图；

图8为本发明实施例公开的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象，而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，示例性地，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开了一种基于题号的精准框题方法、装置、电子设备和存储介质，可以在试卷、练习册等文本教辅资料场景下，精确分析出题目层级，判别大小题进行输出，对各种排版和格式都具有较好的兼容性，同时还能根据业务需要，灵活调整输出的范围，具有很好的适用性，以下结合附图进行详细描述。

实施例一

请参阅图1，图1是本发明实施例公开的一种基于题号的精准框题方法的流程示意图。如图1所示，该基于题号的精准框题方法包括以下步骤：

110、获取目标图像。

目标图像为用户输入图像，该目标图像中至少存在一道题目。示例性地，用户在使用操作体点击试卷、练习册等文档，触发一定的拍照指令，使得图像采集装置对文档进行拍照得到的图像作为目标图像，或者基于操作体在文档中的位置以及一定规则选取拍照得到的图像中部分图像作为目标图像。

操作体可以是手指、触控笔、铅笔、尺子以及小棍等，拍照指令可以是用户语音发出，也可以是通过按键或其他方式输入的指令，图像采集装置可以是集成于智能设备中的摄像头，或者分立的摄像头或摄像机等，图像采集装置与智能设备具有一定的通讯能力，当智能设备接收拍照指令后，触发图像采集装置对文档进行拍照。获取部分图像的规则根据需要设定，例如，以操作体对应的点击点位置为基础，往上选取8行，往下选取5行，形成目标图像，这里不对其做具体限定。

最后得到的目标图像包括至少一道题，并且目标图像中存在点击点。

120、对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓。

识别每个题号对应的内部轮廓的方式有多种，示例性地，可以通过基于监督学习的实例分割模型对目标图像进行识别，得到每个题号对应的轮廓，作为每个题号的内部轮廓，该内部轮廓覆盖相应的题号以及题号对应的文本内容，实例分割模型可以采用Mask R-CNN算法实现，通过对Mask R-CNN实例分割模型进行训练，得到每个题号的文本边框，即内部轮廓，这种方式得到的内部轮廓之间可能存在一定的间隔。

还可以通过文本行检测方式得到题号对应的内部轮廓，具体地：请参照图2所示，其包括以下步骤：

121、将所述目标图像输入基于深度学习的题目识别网络模型、文本行检测网络模型以及题号检测网络模型确定题目轮廓、文本行轮廓和题号框。

题目识别网络模型是指整个目标图像中的题目轮廓，将目标图像作为一个整体，通过人工标注题目轮廓的样本对题目识别网络模型进行训练，从而在目标图像输入训练后的题目识别网络模型后，得到题目轮廓。题目识别网络模型可以是深度卷积神经网络、卷积神经网络、以及全卷积神经网络等。

文本行检测网络模型主要对目标图像中的各个文本行进行检测，得到文本行轮廓。获取目标图像的文本行轮廓的方式可以有多种，在本发明实施例中，采用基于深度学习的文本行检测网络模型实现，文本行检测网络模型可以采用YOLO、CTPN、PseNet等任意的深度学习网络。示例性地，采用PseNet文本行检测网络模型，使得检测结果对光照、颜色、纹理、模糊等情况具有很强的鲁棒性。

识别目标图像的题号框的方法可以有多种，示例性地，通过创建并训练的YOLO题号检测网络模型对题号信息进行识别。YOLO(You Only Look Once:Unified,Real-TimeObject Detection)，是Joseph Redmon和Ali Farhadi等人于2015年提出的基于单个神经网络的目标检测算法，其包括卷积层、目标检测层和NMS筛选层。对YOLO题号检测网络模型训练的样本可以是包含题号的文本图片，样本标签为标注于文本图片中的各个题号框。目标图像输入训练后的YOLO题号检测网络模型可以得到目标图像的各个题号框，这里称之为初始题号框。当然，还可以通过其他深度学习的目标检测方法对题号框进行识别，例如R-CNN、SSD、retinanet、AttentionNet以及FCOS等。

为了防止将文本行内的数字被识别成题号框，在本发明实施例中，可以通过文本行轮廓对题号框进行过滤，当题号框与某一个文本行轮廓交集面积与题号框整体面积的比例大于预设阈值，例如80％时，则删除这个题号框。面积计算可以通过像素点数实现。

122、创建一张空白掩码图，所述空白掩码图与目标图像的尺寸相同。

创建的空白掩码图的尺寸与目标图像的尺寸相同，以便于将得到的各个轮廓添加到该空白掩码中，空白掩码图中各个像素点的初始值均为0，即为一张全黑图像。

123、将所述题目轮廓添加至所述掩码图中。

题目识别网络模型得到的题目轮廓信息为构成题目轮廓像素点的集合，将这些像素点对应于掩码图上位置设置为1，题目轮廓就会被添加到掩码图中。图3示出了一种目标图像的示意图，图4为根据图3图像识别得到的题目轮廓21添加到掩码图上的示意图。

124、根据题号框和文本行轮廓确定题号行的上边界，并将所述上边界添加至所述掩码图中。

根据题号框和文本行轮廓确定目标文本行轮廓，目标文本行轮廓为与题号框存在交集的文本行轮廓，如果题号框与多个文本行轮廓存在交集，则选取交集最大的文本行轮廓作为目标文本行轮廓。选取目标文本行轮廓仪的上边界作为题号行的上边界，以与题目轮廓相类似的方式将题号行的上边界添加到掩码图中。

125、延长所述上边界的左右端点，以使所述上边界与题目轮廓相连接，所述上边界将题目轮廓分割成多个题目区域，每个题目区域构成每个题号对应的内部轮廓。

因为题目轮廓与上边界的识别方式不同，因此，存在极大可能是上边界的两端不与题目轮廓相交，这种情况下，延长上边界的左右端点，将延长线上通过的像素点的像素值均置为1。延长方式可以是水平方向延长，例如，以左右端点的纵坐标为基础，获取从左右端点到达相应题目轮廓对应的纵坐标相同的终点，将左右端点和终点之间相同纵坐标的像素点值均置为1。当然，也会存在上边界的左右端点延伸到题目轮廓外的可能性，这种情况，可以将超出题目轮廓外的像素点的值均置为0。

由此可以看出，上边界将题目轮廓分割成多个题目区域，每个题目区域对应一个题号，将这些题目区域成为内部轮廓，最后将内部轮廓和题号建立关联，根据题号框与内部轮廓的交集关系确定题号归属的内部轮廓，当题号框和多个内部轮廓存在交集时，选取交集最大的内部轮廓作为题号框对应的内部轮廓。从而最终得到每个题号与内部轮廓一一对应的掩码图。

图3所示目标图像的示意图，可以得到图5所示的内部轮廓示意图。其中，图3中题号1对应内部轮廓22、题号(1)对应内部轮廓23、题号(2)对应内部轮廓24、题号(3)对应内部轮廓25。

130、根据所述题号的级别和顺序设置每个内部轮廓对应的标签值。

设置标签值的目的在于一方面可以通过标签值直接获取内部轮廓对应题号的级别，另一方面用于通过标签值获取相关联题号，例如，每一题号的父题号或子题号等。

试卷、练习册等教辅材料中，题号的级别一般分为3级(形如一、二、三的题目形式为一级题目；形如1.2.3.为二级题目；形如(1)(2)(3)为三级题目)，一级题目是最大的题目。

对题号级别的识别可以通过题号分类模型确定，题号分类模型可以是聚类算法，也可以是通过深度学习的神经网络通过训练得到。通过识别得到的题号级别，可能存在只有二级题目或三级题目的可能性，也存在只有二级题目和三级题目的可能性，或者存在只有一级题目和三级题目的可能性。

不同标签值对应不同的题号、题号级别以及题号级别的层级关系。示例性地，可以通过设置六位十进制数字对题号的标签值进行设定，其中，前两位对应一级题目，中间两位对应二级题目，最后两位对应三级题目，当然，每个题号级别也可以通过一位或三位或更多位数字构建，每个题号级别在标签值中的顺序也可以任意变换。

示例性地，最左上的题号(称为第一个题号)设置标签值，如果第一个题号为一级题目时，则第一个题号的标签值为010000；如果第一个题号为二级题目时，则第一个题号的标签值为010100，如果第一个题号为三级题目时，则第一个题号的标签值为010101。由此可以看出，一级题目的标签值后四位均为0。

然后，按照题号的顺序从上到下，如果存在多版式排版的目标图像时，还包括从左到右，遍历所有的题号，根据题号级别设置标签值。

对于在后出现的一级题目，确定该在后的一级题目相邻的在上的题目标签，在相邻的在上的题目标签的基础上增加10000，得到在后出现的一级题目的初始标签值，然后将该初始标签值的后四位均置为0，得到该在后出现的一级题目最终的标签值；同样的方式，对于在后出现的二级题目，确定该在后的二级题目相邻的在上的题目标签，在相邻的在上的题目标签的基础上增加100，得到在后出现的二级题目的初始标签值，然后将该初始标签值的后二位均置为0，得到该在后出现的二级题目最终的标签值，对于在后出现的三级题目，确定该在后的三级题目相邻的在上的题目标签，在相邻的在上的题目标签的基础上增加1，得到在后出现的三级题目的标签值。表1给出了一个目标图像的题号得到的标签值的对应关系表。

表1题号和标签值的对应关系表

题号	题号级别	标签值
			3.	二级题目	010100
(1)	三级题目	010101
			(2)	三级题目	010102
4.	二级题目	010200
			(1)	三级题目	010201
三、	一级题目	020000
			1.	二级题目	020100
(1)	三级题目	020101
			(2)	三级题目	020102

由表1可以看出，标签值前两位相同的题目在同一个大题(一级题目)下，标签值前四位相同的题目在同一个二级题目下，通过标签值可以确定题目的层级关系和归属。

基于上述设置规则，图3所示目标图像中题号对应的标签值如图5所示。

140、识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓。

目标图像中操作体的点击点识别方法可以通过基于颜色特征的神经网络实现，即通过颜色识别，确定点击点以及点击点对应的定位坐标点。当然，如果操作体颜色与文档颜色过于接近，也可以通过形状识别等方式获取点击点和定位坐标点。

将定位坐标点也填充到掩码图中，即将定位坐标点的像素点也置为1。图3的目标图像中点击点可以得到图5所示的定位坐标点26。

确定了定位坐标点，可以得到备选轮廓，备选轮廓为定位坐标点对应的内部轮廓。具体地，如果定位坐标点落入某一个内部轮廓内部，则该内部轮廓就是备选轮廓，如果定位坐标点不落入任何一个内部轮廓中，则选取距离该定位坐标点最近的内部轮廓作为备选轮廓。

备选轮廓可以认为是被选中的粗轮廓，之后只需要根据预设规则调整即可得到精框区域，即精选轮廓。图5中，定位坐标点26对应的备选轮廓为内部轮廓24。

150、根据所述标签值和备选轮廓确定精选轮廓。

首先，先根据标签值确定备选轮廓对应的题号级别；备选轮廓对应的标签值可以得到题号的级别，具体地，如果备选轮廓的标签值后四位均为0，则备选轮廓为一级题目，如备选轮廓的标签值前四位均不为0，且后两位均为0，则备选轮廓为二级题目，如果备选轮廓六位标签值中后两位均不为0，则备选轮廓为三级题目。

在所述备选轮廓对应的题号级别为三级题目时，识别所述备选轮廓对应文本的题目类型。识别题目类型的方法可以是通过语义特征的深度学习方式，即将备选轮廓内的题目内容送入深度学习网络，获取其题目类型，深度学习网络优选采用具有平移同变性的胶囊网络实现，保证识别的准确性。另外，还可以通过该备选轮廓的父题号的文本特征识别题目类型。文本特征主要是描述形如“填一填、选一选、判一判”等的文本，这些特征可以由人为统计整理。

在所述备选轮廓对应的题号级别为三级题目且所述题目类型为选择题、填空题或判断题时，备选轮廓可以单独分割不会影响做题、搜题或收录等，因此，可以直接将所述备选轮廓为最终的精选轮廓。

在所述备选轮廓对应的题号级别为三级题目且所述题目类型不是选择题、填空题或判断题时，则选轮廓单独分割极大可能影响做题、搜题或收录等，这种情况下，需要确定所述三级题目所在的二级题目，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓。即将确定备选轮廓对于标签值的前4位的值，将前4位均相同的标签值对应的内部轮廓(包括二级题目和二级题目关联的所有三级题目)共同构成框选轮廓，然后在通过凸包算法得到这些框选轮廓的凸包轮廓，最后得到的凸包轮廓即精选轮廓。

如果所述备选轮廓对应的题号为二级题目时，与所述备选轮廓对应的题号级别为三级题目且所述题目类型不是选择题、填空题或判断题时类似，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓。

如果所述备选轮廓对应的题号为一级题目时，将所述一级题目及其关联的所有二级题目和三级题目的内部轮廓(将前两位相同的标签值对应的内部轮廓)共同构建框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓。

得到的精选轮廓与目标图像相结合，即可得到框选题目，对该框选题目的图片从目标图像中分割出来，一方面可以用于智能设备的显示，另一方面可以用于搜题或题目收录等。

图3所示的目标图像，得到的精选轮廓和框选题目内容如图6所示。

实施本发明实施例，可以在试卷、练习册等文本教辅资料场景下，精确分析出题目层级，判别大小题进行输出，对各种排版和格式都具有较好的兼容性，同时还能根据业务需要，灵活调整输出的范围，具有很好的适用性。

实施例二

请参阅图7，图7是本发明实施例公开的一种基于题号的精准框题装置的结构示意图。如图7所示，该基于题号的精准框题装置可以包括：

获取单元310，用于获取目标图像；

识别单元320，用于对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓；

设置单元330，用于根据所述题号的级别和顺序设置每个内部轮廓对应的标签值；

粗选单元340，用于识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓；

精选单元350，用于根据所述标签值和备选轮廓确定精选轮廓。

作为一种可选的实施方式，所述识别单元320，可以包括：

作为一种可选的实施方式，所述识别单元320，也可以包括：

输入子单元321，用于将所述目标图像并行输入基于深度学习的题目识别网络模型、文本行检测网络模型以及题号检测网络模型确定题目轮廓、文本行轮廓和题号框；

创建子单元322，用于创建一张空白掩码图，所述空白掩码图与目标图像的尺寸相同；

第一添加子单元323，用于将所述题目轮廓添加至所述掩码图中；

第二添加子单元324，用于根据题号框和文本行轮廓确定题号行的上边界，并将所述上边界添加至所述掩码图中；

延长子单元325，用于延长所述上边界的左右端点，以使所述上边界与题目轮廓相连接，所述上边界将题目轮廓分割成多个题目区域，每个题目区域构成每个题号对应的内部轮廓。

作为一种可选的实施方式，所述设置单元330，可以包括：

题号级别获取子单元331，用于通过题号分类模型获取每个题号的级别，所述级别包括一级题目、二级题目和三级题目；

标签值设置子单元332，用于按照题号的顺序以及题号的级别从上到下、从左到右为所述题号设置标签值。

作为一种可选的实施方式，所述粗选单元340，可以包括：

点击点识别子单元341，用于将目标图像输入预先训练的基于深度学习的神经网络识别模型识别点击点，并确定点击点对应的定位坐标点；

备选轮廓确定子单元342，用于获取所述定位坐标点和内部轮廓的位置关系，在所述定位坐标点落入其中一个内部轮廓内时，所述其中一个内部轮廓作为备选轮廓，在所述定位坐标点不落入任意内部轮廓时，则选取距离所述定位坐标点最近的内部轮廓作为备选轮廓。

作为一种可选的实施方式，所述精选单元350，可以包括：

题号级别确定子单元351，用于根据标签值确定备选轮廓对应的题号级别；

第一判断子单元352，用于在所述备选轮廓对应的题号级别为三级题目时，识别所述备选轮廓对应文本的题目类型，在所述题目类型为选择题、填空题或判断题时，所述备选轮廓为最终的精选轮廓；在所述题目类型不是选择题、填空题或判断题时，则确定所述三级题目所在的二级题目，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓；

第二判断子单元353，用于在所述备选轮廓对应的题号为二级题目时，将二级题目及其关联的所有三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓；

第三判断子单元354，用于在所述备选轮廓对应的题号为一级题目时，将所述一级题目及其关联的所有二级题目和三级题目的内部轮廓作为框选轮廓，利用凸包算法求取所述框选轮廓对应的最终的精选轮廓。

图7所示的基于题号的精准框题装置，可以在试卷、练习册等文本教辅资料场景下，精确分析出题目层级，判别大小题进行输出，对各种排版和格式都具有较好的兼容性，同时还能根据业务需要，灵活调整输出的范围，具有很好的适用性。

实施例三

请参阅图8，图8是本发明实施例公开的一种电子设备的结构示意图。如图8所示，该电子设备可以包括：

存储有可执行程序代码的存储器410；

与存储器410耦合的处理器420；

其中，处理器420调用存储器410中存储的可执行程序代码，执行实施例一中基于题号的精准框题方法中的部分或全部步骤。

本发明实施例公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序使得计算机执行实施例一中基于题号的精准框题方法中的部分或全部步骤。

本发明实施例还公开一种计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行实施例一中基于题号的精准框题方法中的部分或全部步骤。

本发明实施例还公开一种应用发布平台，其中，应用发布平台用于发布计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行实施例一中基于题号的精准框题方法中的部分或全部步骤。

在本发明的各种实施例中，应理解，所述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物单元，即可位于一个地方，或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。

在本发明所提供的实施例中，应理解，“与A对应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种基于题号的精准框题方法、装置、电子设备和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于题号的精准框题方法，其特征在于，包括：

获取目标图像；

根据所述标签值和备选轮廓确定精选轮廓；

根据所述题号的级别和顺序设置每个内部轮廓对应的标签值，包括：

按照题号的顺序以及题号的级别从上到下、从左到右为所述题号设置标签值；

根据所述标签值和备选轮廓确定精选轮廓，包括：

根据标签值确定备选轮廓对应的题号级别；

2.根据权利要求1所述的精准框题方法，其特征在于，对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓，包括：

3.根据权利要求1所述的精准框题方法，其特征在于，对所述目标图像进行识别，得到目标图像中每一个题号对应的内部轮廓，包括：

将所述题目轮廓添加至所述掩码图中；

4.根据权利要求1所述的精准框题方法，其特征在于，识别定位坐标点并确定备选轮廓，所述备选轮廓为定位坐标点对应的内部轮廓，包括：

5.一种基于题号的精准框题装置，其特征在于，所述装置包括：

获取单元，用于获取目标图像；

精选单元，用于根据所述标签值和备选轮廓确定精选轮廓；

所述设置单元，包括：

标签值设置子单元，用于按照题号的顺序以及题号的级别从上到下、从左到右为所述题号设置标签值；

所述精选单元，包括：

6.根据权利要求5所述的精准框题装置，其特征在于，所述识别单元，包括：

7.根据权利要求5所述的精准框题装置，其特征在于，所述识别单元，包括：

8.根据权利要求5所述的精准框题装置，其特征在于，所述粗选单元，包括：

9.一种电子设备，其特征在于，包括：存储有可执行程序代码的存储器；与所述存储器耦合的处理器；所述处理器调用所述存储器中存储的所述可执行程序代码，用于执行权利要求1至4任一项所述的一种基于题号的精准框题方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，其中，所述计算机程序使得计算机执行权利要求1至4任一项所述的一种基于题号的精准框题方法。