CN109002822B

CN109002822B - 一种兴趣区域确定方法、装置、设备及存储介质

Info

Publication number: CN109002822B
Application number: CN201810819322.7A
Authority: CN
Inventors: 钱云; 王晓斐; 高群; 王忍宝
Original assignee: Anhui Toycloud Technology Co Ltd
Current assignee: Anhui Toycloud Technology Co Ltd
Priority date: 2018-07-24
Filing date: 2018-07-24
Publication date: 2021-03-30
Anticipated expiration: 2038-07-24
Also published as: CN109002822A

Abstract

本申请提供了一种兴趣区域确定方法、装置、设备及存储介质，方法包括：当指示对象在目标读本的目标页面处于稳定状态时，获取至少包括指示对象的第一目标图像；通过第一目标图像确定指示对象的形态参数；基于指示对象的形态参数调节目标页面的网格划分粒度；基于调节后的网格划分粒度确定指示对象所指定的兴趣区域。本申请提供的兴趣区域确定方法、装置、设备及存储介质，能够基于指示对象的形态实现网格粒度的自动调节，这使得基于调节后的网格能够准确定位出指示对象所指定的兴趣区域，进而使得后续能够基于定位出的兴趣区域匹配到用户希望的兴趣资源，用户体验较好。

Description

一种兴趣区域确定方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种兴趣区域确定方法、装置、设备及存储介质。

背景技术

人工智能的兴起不仅提升了人们的工作效率，而且给人们的生活带来了乐趣。图像识别技术的应用使得用户阅读读本如绘本不再变得单一无趣，读本中有诸多预先制作好的兴趣区域，当用户利用指示对象如手指或笔点到兴趣区域时，首先需要确定指示对象所指定的兴趣区域，然后为指示对象所指定的兴趣区域匹配对应的兴趣资源并输出，以和用户互动。

现有技术中，确定指示对象所指定的兴趣区域的方式为：以指示对象的指定部位为中心寻找周围的兴趣区域的轮廓，然而，以指示对象的指定部位为中心寻找的轮廓通常较大，这会导致轮廓内可能存在多个兴趣区域，进而导致无法匹配到兴趣资源或匹配不到用户所希望的兴趣资源。

发明内容

有鉴于此，本申请提供了一种兴趣区域确定方法、装置、设备及存储介质，用以解决现有技术中基于指示对象定位出的兴趣区域不精确，导致无法匹配到兴趣资源或匹配不到用户所希望的兴趣资源，进而导致用户体验较差的问题，其技术方案如下：

一种兴趣区域确定方法，包括：

当指示对象在目标读本的目标页面处于稳定状态时，获取至少包括所述指示对象的第一目标图像；

通过所述第一目标图像确定所述指示对象的形态参数；

基于所述指示对象的形态参数，调节所述目标页面的网格划分粒度；

基于调节后的网格划分粒度，确定所述指示对象所指定的兴趣区域。

其中，所述基于调节后的网格划分粒度，确定所述指示对象所指定的兴趣区域，包括：

基于调节后的网格粒度，确定所述指示对象的指定部位所处的网格，作为目标网格；

确定所述目标网格所属的兴趣区域，作为所述指示对象所指定的兴趣区域。

其中，所述通过所述第一目标图像确定所述指示对象的形态参数，包括：

从所述第一目标图像中确定所述指示对象的轮廓；

通过所述指示对象的轮廓确定所述指示对象的形态参数，所述指示对象的形态参数至少能够表征所述指示对象的尺寸大小。

所述兴趣区域确定方法还包括：

在预设时间段内，获取所述第一目标图像后的多幅第二目标图像，所述第二目标图像中至少包括所述指示对象；

通过多幅所述第二目标图像确定所述指示对象的运动幅度；

所述基于所述指示对象的形态参数，调节所述目标页面的网格划分粒度，包括：

基于所述指示对象的形态参数和所述指示对象的运动幅度，调节所述目标页面的网格划分粒度。

其中，所述通过多幅所述第二目标图像确定所述指示对象的运动幅度，包括：

分别确定各幅所述第二目标图像中所述指示对象的指定部位的位置坐标，获得与各幅所述第二目标图像对应的位置坐标；

通过与各幅所述第二目标图像对应的位置坐标，确定所述指示对象的运动幅度。

所述兴趣区域确定方法还包括：

获取至少包括所述目标页面的图像作为目标页面图像；

从所述目标页面图像中确定所述目标页面的轮廓；

基于所述目标页面的轮廓建立目标坐标系；

所述分别确定各幅所述第二目标图像中所述指示对象的指定部位的位置坐标，包括：对于每幅所述第二目标图像执行：

从所述第二目标图像中确定所述指示对象的轮廓；

基于所述指示对象的轮廓确定所述指示对象的指定部位；

确定所述指示对象的指定部位在所述目标坐标系中的位置坐标，得到与所述第二目标图像对应的位置坐标。

其中，所述通过与各幅所述第二目标图像对应的位置坐标，确定所述指示对象的运动幅度，包括：

将与各幅所述第二目标图像对应的位置坐标中的最大横坐标与最小横坐标求差，求得的差值作为第一差值；

将与各幅所述第二目标图像对应的位置坐标中的最大纵坐标与最小纵坐标求差，求得的差值作为第二差值；

将所述第一差值与所述第二差值求和，求和得到的值作为所述指示对象的运动幅度。

其中，所述基于所述指示对象的形态参数和所述指示对象的运动幅度，调节所述目标页面的网格划分粒度，包括：

基于所述指示对象的形态参数和所述指示对象的运动幅度，确定网格划分粒度调节因子；

基于预先设定的网格划分粒度和所述网格划分粒度调节因子，确定目标网格划分粒度；

调节所述目标页面的当前网格划分粒度为所述目标网格划分粒度。

所述兴趣区域确定方法还包括：

当检测出翻页稳定时，按预设的时间间隔获取多幅第三目标图像，多幅所述第三目标图像中包括至少一幅第一类图像和多幅第二类图像，所述第一类图像为只包括所述目标页面的图像，所述第二类图像为包括所述目标页面和其它对象的图像；

基于一幅所述第一类图像分别从各幅所述第二类图像中提取动态区域；

若所述动态区域为包含所述指示对象的区域，则确定所述动态区域的运动轨迹；

基于所述动态区域的运动轨迹确定所述动态区域是否处于稳定状态，当所述动态区域处于稳定状态时，确定所述指示对象处于稳定状态。

所述兴趣区域确定方法还包括：

确定与所述指示对象所指定的兴趣区域对应的兴趣资源并输出。

一种兴趣区域确定装置，包括：第一图像获取模块、形态参数确定模块、网格划分粒度调节模块和兴趣区域确定模块；

所述第一图像获取模块，用于当指示对象在目标读本的目标页面处于稳定状态时，获取至少包括所述指示对象的第一目标图像；

所述形态参数确定模块，用于通过所述第一目标图像确定所述指示对象的形态参数；

所述网格划分粒度调节模块，用于基于所述指示对象的形态参数，调节所述目标页面的网格划分粒度；

所述兴趣区域确定模块，用于基于调节后的网格划分粒度，确定所述指示对象所指定的兴趣区域。

其中，所述兴趣区域确定模块，具体用于基于调节后的网格粒度，确定所述指示对象的指定部位所处的网格，作为目标网格，确定所述目标网格所属的兴趣区域，作为所述指示对象所指定的兴趣区域。

其中，所述形态参数确定模块，具体用于从所述第一目标图像中确定所述指示对象的轮廓，通过所述指示对象的轮廓确定所述指示对象的形态参数，所述指示对象的形态参数至少能够表征所述指示对象的尺寸大小。

所述兴趣区域确定装置还包括：第二图像获取模块和运动幅度确定模块；

所述第二图像获取模块，用于在预设时间段内，获取所述第一目标图像后的多幅第二目标图像，所述第二目标图像中至少包括所述指示对象；

所述运动幅度确定模块，用于通过多幅所述第二目标图像确定所述指示对象的运动幅度；

所述网格划分粒度调节模块，具体用于基于所述指示对象的形态参数和所述指示对象的运动幅度，调节所述目标页面的网格划分粒度。

其中，所述运动幅度确定模块包括：位置坐标确定子模块和运动幅度确定子模块；

所述位置坐标确定子模块，用于分别确定各幅所述第二目标图像中所述指示对象的指定部位的位置坐标，获得与各幅所述第二目标图像对应的位置坐标；

所述运动幅度确定子模块，用于通过与各幅所述第二目标图像对应的位置坐标，确定所述指示对象的运动幅度。

所述兴趣区域确定装置还包括：第三图像获取模块、动态区域提取模块、运动轨迹确定模块和稳定状态确定模块；

所述第三图像获取模块，用于当检测出翻页稳定时，按预设的时间间隔获取多幅第三目标图像，多幅所述第三目标图像中包括至少一幅第一类图像和多幅第二类图像，所述第一类图像为只包括所述目标页面的图像，所述第二类图像为包括所述目标页面和其它对象的图像；

所述动态区域提取模块，用于基于一幅所述第一类图像分别从各幅所述第二类图像中提取动态区域；

所述运动轨迹确定模块，用于当所述动态区域为包含所述指示对象的区域时，确定所述动态区域的运动轨迹；

所述稳定状态确定模块，用于基于所述动态区域的运动轨迹确定所述动态区域是否处于稳定状态，当所述动态区域处于稳定状态时，确定所述指示对象处于稳定状态。

一种兴趣区域确定设备，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，所述程序具体用于：

通过所述第一目标图像确定所述指示对象的形态参数；

一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现所述兴趣区域确定方法的各个步骤。

经由上述的技术方案可知，本申请提供的兴趣区域确定方法、装置、设备及存储介质，在指示对象在目标读本的目标页面处于稳定状态时，首先获取至少包括指示对象的第一目标图像，然后通过第一目标图像确定指示对象的形态参数，接着基于指示对象的形态参数调节目标页面的网格划分粒度，最后基于调节后的网格划分粒度确定指示对象所指定的兴趣区域。由于不同指示对象的形态可能不同，不同时刻同一指示对象的形态也可能不同，因此，指示对象的定位精度也不同，为了使得指示对象具有较高的定位精度，本申请提供的兴趣区域确定方法、装置、设备及存储介质，将目标页面划分成网格，当有指示对象在目标页面指定兴趣区域时，基于指示对象的形态参数自动调节目标页面的网格划分粒度，即调节划分的网格的大小，然后基于调节后的网格确定指示对象所指定的兴趣区域，即本申请能够基于指示对象的形态实现网格粒度的自动调节，这使得基于调节后的网格能够准确定位出指示对象所指定的兴趣区域，进而使得后续能够基于定位出的兴趣区域匹配到用户希望的兴趣资源，用户体验较好。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的兴趣区域确定方法的流程示意图；

图2为本申请实施例提供的不同形态的指示对象对应的网格划分粒度的示意图；

图3为本申请实施例提供的兴趣区域确定方法中，基于指示对象的形态参数和指示对象的运动幅度调节目标页面的网格划分粒度的流程示意图；

图4为本申请实施例提供的兴趣区域确定方法中，确定指示对象是否处于稳定状态的实现方式的流程示意图；

图5为本申请实施例提供的兴趣区域确定方法中，确定与指示对象所指定的兴趣区域对应的兴趣资源的实现过程的流程示意图；

图6为本申请实施例提供的兴趣区域确定装置的结构示意图；

图7为本申请实施例提供的兴趣区域确定设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了准确地确定出指示对象所指定的兴趣区域，本申请提供了一种兴趣区域确定方法，请参阅图1，示出了该兴趣区域确定方法的流程示意图，该方法可以包括：

步骤S101：当指示对象在目标读本的目标页面处于稳定状态时，获取至少包括指示对象的第一目标图像。

其中，目标读本可以但不限为纸质读本(如绘本)、电子读本等，指示对象可以但不限定为用户的手指、笔、其它笔状物等。

可以理解的是，指示对象在目标页面上指定兴趣区域时，有个移动过程，比如用户用手指指定兴趣区域时，首先会移动至兴趣区域然后停下来，即指示对象处于稳定状态表明用户认为其通过指示对象指到了期望的位置。为了避免造成不必要运算量，本实施例在指示对象处于稳定状态时，才会去确定兴趣区域。

步骤S102：通过第一目标图像确定指示对象的形态参数。

在一种可能的实现方式中，通过第一目标图像确定指示对象的形态参数的过程可以包括：从第一目标图像中确定指示对象的轮廓；通过指示对象的轮廓确定指示对象的形态参数。

其中，指示对象的形态参数至少能够表征指示对象的尺寸大小。示例性的，指示对象为用户的手指，则指示对象的形态参数可以为用户的手指的长度、宽度等。

步骤S103：基于指示对象的形态参数，调节目标页面的网格划分粒度。

需要说明的是，本实施例预先将目标读本的页面按预设的网格划分粒度划分为多个网格，假设预设的网格划分粒度为(m，n)，即，将目标页面划分为m*n个网格。

可以理解的是，不同指示对象的形态不同，不同时刻同一指示对象的形态也可能不同，若要基于指示对象准确定位出兴趣区域，则需要使不同形态的指示对象对应不同的网格划分粒度，如图2所示，基于此，本实施例在确定出指示对象的形态参数，基于该形态参数调节目标页面的网格划分粒度。

步骤S104：基于调节后的网格划分粒度，确定指示对象所指定的兴趣区域。

基于调节后的网格划分粒度，确定指示对象所指定的兴趣区域的过程可以包括：基于调节后的网格粒度，确定指示对象的指定部位所处的网格，作为目标网格；确定目标网格所属的兴趣区域，作为指示对象所指定的兴趣区域。

需要说明的是，本申请实施例提供的方法还可以包括：获取至少包括目标页面的图像作为目标页面图像，从目标页面图像中确定目标页面的轮廓；基于目标页面的轮廓建立目标坐标系，包括坐标轴原点和坐标轴尺度。则，确定指示对象的指定部位所处的网格的过程可以包括：基于上述确定出的指示对象的轮廓确定指示对象的指定部位，确定指示对象的指定部位在目标坐标系中的位置坐标，基于指示对象的指定部位的位置坐标确定指示对象的指定部位所处的网格。

需要说明是，目标页面被划分为多个网格后，目标页面中的每个兴趣区域均对应有一网格集合，当确定出指示对象的指定部位所处的网格后，便可确定该网格所在的网格集合所对应的兴趣区域，该兴趣区域即为指示对象所指定的兴趣区域。在一种可能的实现方式中，每个网格集合中的对象可以为对应网格的编号，在确定出指示对象的指定部位所处的网格的编号后，可确定该编号所在的网格集合，进而将该网格集合对应的兴趣区域确定为指示对象指定的兴趣区域。

由于不同指示对象的形态可能不同，不同时刻同一指示对象的形态也可能不同，因此，指示对象的定位精度也不同，为了使得指示对象具有较高的定位精度，本申请实施例提供的兴趣区域确定方法将目标页面划分成网格，当有指示对象在目标读本的目标页面指定兴趣区域时，基于指示对象的形态参数自动调节目标页面的网格划分粒度，即调节划分的网格的大小，然后基于调节后的网格确定指示对象所指定的兴趣区域，即本申请能够基于指示对象的形态实现网格粒度的自动调节，这使得基于调节后的网格能够准确定位出指示对象所指定的兴趣区域，进而使得后续能够基于定位出的兴趣区域匹配到用户希望的兴趣资源，用户体验较好。

为了提高指示对象的定位精度，上述实施例提供的兴趣区域确定方法还可以包括：在预设时间段内，获取第一目标图像后的多幅第二目标图像，第二目标图像中至少包括指示对象，多幅第二目标图像可按预设的时间间隔获取；通过多幅第二目标图像确定指示对象的运动幅度。则基于指示对象的形态参数，调节目标页面的网格划分粒度，包括：基于指示对象的形态参数和指示对象的运动幅度，调节目标页面的网格划分粒度。

其中，通过多幅第二目标图像确定指示对象的运动幅度的过程可以包括：分别确定各幅第二目标图像中指示对象的指定部位的位置坐标，获得与各幅第二目标图像对应的位置坐标；通过与各幅第二目标图像对应的位置坐标，确定指示对象的运动幅度。

进一步地，通过与各幅第二目标图像对应的位置坐标，确定指示对象的运动幅度的过程可以包括：对于每幅第二目标图像执行：从第二目标图像中确定指示对象的轮廓；基于指示对象的轮廓确定指示对象的指定部位；确定指示对象的指定部位在目标坐标系中的位置坐标，得到与第二目标图像对应的位置坐标。通过上述过程便可获得与各幅第二目标图像对应的位置坐标。

在获得与各幅第二目标图像对应的位置坐标后，便可基于这些位置坐标确定指示对象的运动幅度，具体确定过程可以包括：将与各幅第二目标图像对应的位置坐标中的最大横坐标与最小横坐标求差，求得的差值作为第一差值；将与各幅第二目标图像对应的位置坐标中的最大纵坐标与最小纵坐标求差，求得的差值作为第二差值；将第一差值与第二差值求和，求和得到的值作为指示对象的运动幅度。

示例性的，第二目标图像为8幅，通过8幅第二目标图像确定的指示对象的指定部位的位置坐标分别为(15,12)、(11、8)、(7,9)、(18、10)、(12,2)、(19,8)、(14,10)和(8,16)，8个位置坐标中的最大横坐标为19，最小横坐标为7，则最大横坐标与最小横坐标的差值为12，8个位置坐标中的最大纵坐标为16，最小纵坐标为2，则最大纵坐标与最小纵坐标的差值为14，那么，指示对象的运动幅度为12+14＝26。

在确定出指示对象的形态参数和指示对象的运动幅度后，便可基于指示对象的形态参数和指示对象的运动幅度，调节目标页面的网格划分粒度，请参阅图3，示出了具体调节过程的流程示意图，可以包括：

步骤S301：基于指示对象的形态参数和指示对象的运动幅度，确定网格划分粒度调节因子。

在一种可能的实现方式中，可分别为指示对象的形态参数和指示对象的运动幅度赋予权重值，进而，基于形态参数、为形态参数赋予的权重值、指示对象的运动幅度和为指示对象的运动幅度赋予的权重值确定网格划分粒度调节因子。

示例性地，指示对象的形态参数包括指示对象的宽度W和指示对象的长度D，指示对象的运动幅度为A，为指示对象的宽度W赋予权重ω₁、为指示对象的长度D赋予权重ω₂，为指示对象的运动幅度A赋予权重ω₃，则网格划分粒度调节因子k可通过下式确定：

k＝W*ω₁+1/D*ω₂+A*ω₃(1)

通过上式(1)可知，网格划分粒度调节因子k的值取决于指示对象的宽度W、指示对象的长度D和指示对象的运动幅度A，k的值越大，网格数越多，网格越小。

需要说明的是，指示对象的宽度W越大，要求网格越大，指示对象的长度D越大，要求网格越小。以指示对象为手指为例，W越大，表明手指越宽，为了实现手指的精准定位，要求网格越大；D越大，表明手指越长，而手指越长，其指向性越好，要求网格越小。

另外，需要说明的是，在用户用手指指定兴趣区域时，由于不同用户的习惯不同，有的用户习惯使用一根手指指定兴趣区域，有的用户习惯使用多根手指指定兴趣区域，当用户用一根手指指定兴趣区域时，上述手指的宽度为该一根手指的宽度，当用户用多根手指指定兴趣区域时，上述手指的宽度为该多根手指的宽度。

步骤S302：基于预先设定的网格划分粒度和网格划分粒度调节因子，确定目标网格划分粒度。

示例性地，预先设定的网格划分粒度即初始网格划分粒度为(m,n)(初始网格划分粒度可基于目标页面所占视场比重设定)，网格划分粒度调节因子为k，则目标网格划分粒度可通过下式确定：

其中，(m',n')即为目标网格划分粒度，[]表示取整。

步骤S303：调节目标页面的当前网格划分粒度为目标网格划分粒度。

需要说明的是，上述实施例提供的兴趣区域确定方法的执行前提为指示对象在目标读本的目标页面处于稳定状态，基于此，在本申请的另一实施例中，兴趣区域确定方法还可以包括：确定指示对象是否处于稳定状态。

请参阅图4，示出了确定指示对象是否处于稳定状态的一种可能的实现方式的流程示意图，可以包括：

步骤S401：当检测出目标读本的翻页稳定时，按预设的时间间隔获取多幅第三目标图像。

其中，多幅第三目标图像中包括至少一幅第一类图像和多幅第二类图像，第一类图像为只包括目标页面的图像，第二类图像为包括目标页面和其它对象的图像。

在一种可能的实现方式中，在目标读本的翻页稳定时，可连续获取多幅第一类图像，连续获取多幅第一类图像的目的一方面是验证目标读本的翻页是否真的已经稳定，若通过连续获取的多幅第一类图像确定目标读本的翻页确实已经稳定，则可从多幅第一类图像中获取一图像作为背景图像。

其中，目标读本的翻页稳定指的是不再对目标读本进行翻页，比如，用户在阅读读本时，会进行翻页，当翻到自己想看的页面时，用户会停下来，不再翻页，此时，目标读本的翻页稳定。需要说明的是，本实施例可采用现有技术中的翻页稳定检测方法检测目标读本是否翻页稳定。

需要说明的是，上述第三目标图像是在检测到目标读本的翻页稳定时获取的，本申请并不限定于此，在一种可能的实现方式中，可在检测到用户的语音指令，并且该语音指令为第一目标语音指令时，获取第三目标图像，检测到用户的第一目标语音指令即认为目标读本的翻页稳定。

步骤S402：基于一幅第一类图像分别从各幅第二类图像中提取动态区域。

具体地，在获得背景图像后，将背景图像进行灰度化处理，获得灰度背景图像，依次对各幅第二类图像进行如下处理：对第二类图像同样进行灰度化处理，将灰度化处理后得到的图像与灰度背景图像求亮度差，将亮度差大于设定阈值的区域确定为动态区域。

步骤S403：若动态区域为包含指示对象的区域，则确定动态区域的运动轨迹。

假设指定对象为用户的手指，手指可以为一个也可以为多个，则在获得动态区域时，可对动态区域进行肤色分割，从动态区域中分割出皮肤区域，具体地，可对动态区域进行颜色空间转换，由RGB空间转换至YcbCr空间，然后对空间转换后的图像进行预处理以突出边缘轮廓，最后计算肤色相似值以获取封闭边缘轮廓，从而得到皮肤区域。若分割出的皮肤区域的面积大于设定阈值，则确定动态区域为包含指示对象的区域。

步骤S404：基于动态区域的运动轨迹确定动态区域是否处于稳定状态，当动态区域处于稳定状态时，确定指示对象处于稳定状态。

由于动态区域为包含指示对象的区域，因此，动态区域的运动轨迹即为指示对象的运动轨迹，当动态区域运动到某一位置不动或者仅在预设的范围内小幅度运动时，可确定动态区域处于稳定状态时，即指示对象处于稳定状态。

在一种可能的实现方式中，在确定出动态区域为包含指示对象的区域时，可从动态区域中提取指示对象的轮廓，基于指示对象的轮廓确定指示对象的指定部位，确定指示对象的指定部位在目标坐标系中的位置坐标，基于指示对象的指定部位的位置坐标确定指示对象的指定部位的运动轨迹作为上述动态区域的运动轨迹，当指示对象的指定部位的位置坐标在预设时间段内一直处于设定范围区域时，可确定指示对象处于稳定状态。需要说明的是，若指示对象为用户的多个手指，则可将其中一个手指的指尖坐标确定为指示对象的指定部位的位置坐标，也可将多个手指的指尖坐标的均值作为指示对象的指定部位的位置坐标。

本实施例中的步骤S401～S404意在通过指示对象的运动情况确定指示对象是否处于稳定状态，本申请不限定于此，在另一种可能的实现方式中，可检测用户的语音指令，当检测到语音指令为第二目标语音指令时，可认为指示对象处于稳定状态。

另外，需要说明的是，在本实施例中，步骤S401中获取的多幅第三目标图像包括第一类图像和第二类图像，本申请并不限定于此，在另一种可能的实现方式中，多图第三目标图像可以为一类图像，比如可以均为包括指示对象和目标页面的图像，通过多图第三目标图像确定指示对象是否处于稳定状态，比如，指示对象为用户的手指，在获得多幅包括用户手指和目标页面的图像后，可对获取的图像进行预处理(如空间转换、边缘轮廓增强等)，然后对预处理后的图像进行肤色分割，分割出皮肤区域，进而从皮肤区域提取手指的轮廓，基于手指的轮廓确定指尖，并确定指尖在目标坐标系中的坐标，基于通过各幅第三目标图像确定的指尖坐标确定手指的运动轨迹，进而基于手指的运动轨迹确定手指是否处于稳定状态。

在本申请的另一实施例中，兴趣区域确定方法还可以包括：确定与指示对象所指定的兴趣区域对应的兴趣资源并输出。

请参阅图5，示出了确定与指示对象所指定的兴趣区域对应的兴趣资源的实现过程的流程示意图，可以包括：

步骤S501:获取目标读本的封面图像，基于封面图像确定目标读本的读本号作为目标读本号，并基于目标读本号从兴趣资源库中确定目标读本对应的兴趣资源集合，作为目标兴趣资源集合。

其中，基于封面图像确定目标读本的读本号作为目标读本号的过程可以包括：确定封面图像的特征描述，作为目标封面特征描述；从兴趣资源库中确定与目标封面特征描述相似度最高的封面特征描述作为目标读本号。在一种可能的实现方式中，确定封面图像的特征描述的过程可以包括：确定封面图像的特征向量，将该特征向量生成BOW描述，获得目标封面BOW描述。相应地，目标读本号为兴趣资源库中与目标封面BOW描述相似度最高的封面BOW描述。

则基于目标读本号从兴趣资源库中确定目标读本对应的兴趣资源集合，作为目标兴趣资源集合的过程可以包括：将兴趣资源库中与目标读本号对应的兴趣资源集合确定为目标读本对应的兴趣资源集合，作为目标兴趣资源集合。

其中，兴趣资源库中包括各个读本的封面特征描述，以及与各个封面特征描述对应的兴趣资源集合，每个封面特征描述对应的兴趣资源集合中包括对应的读本中各个页面的页面特征描述以及各个页面特征描述对应的兴趣资源子集。

步骤S502:获取目标页面的页面图像，基于页面图像确定目标页面的页面号作为目标页面号，并基于目标页面号从目标兴趣资源集合中确定与目标页面对应的兴趣资源集合，作为目标兴趣资源子集。

其中，基于页面图像确定目标页面的页面号作为目标页面号的过程可以包括：确定页面图像的特征描述，作为目标页面特征描述；从目标兴趣资源集合中确定与目标页面特征描述相似度最高的页面特征描述作为目标页面号。确定封面图像的特征描述的过程可以包括：确定页面图像的特征向量，将该特征向量生成BOW描述，获得目标页面BOW描述。相应地，目标页面号为目标兴趣资源集合中与目标页面BOW描述相似度最高的页面BOW描述。

则基于目标页面号从目标兴趣资源集合中确定与目标页面对应的兴趣资源集合，作为目标兴趣资源子集的过程可以包括：将与目标页面号对应的兴趣资源子集确定为与目标页面对应的兴趣资源集合，作为目标兴趣资源子集。

步骤S503:从目标兴趣资源子集中确定与指示对象所指定的兴趣区域对应的兴趣资源。

在确定出与指示对象所指定的兴趣区域对应的兴趣资源后，输出该兴趣资源，输出兴趣资源的方式可以但不限定播放兴趣资源，播放兴趣资源可以为播放音频、视频等。

本申请实施例提供的兴趣区域确定方法将目标页面划分成网格，当有指示对象在目标页面指定兴趣区域时，能够基于指示对象的形态参数和指示对象的运动幅度自动调节目标页面的网格划分粒度，即调节划分的网格的大小，然后基于调节后的网格确定指示对象所指定的兴趣区域，进而确定与指示对象所指定的兴趣区域对应的兴趣资源并输出，由此可见，本申请实施例能够基于指示对象的形态和指示对象的运动幅度实现网格粒度的自动调节，这使得基于调节后的网格能够准确定位出指示对象所指定的兴趣区域，进而使得能够基于定位出的兴趣区域匹配到用户希望的兴趣资源，用户体验较好。

与上述兴趣区域确定方法相对应，本申请实施例还提供了一种兴趣区域确定装置，请参阅图6，示出了该装置的结构示意图，可以包括：第一图像获取模块601、形态参数确定模块602、网格划分粒度调节模块603和兴趣区域确定模块604。

第一图像获取模块601，用于当指示对象在目标读本的目标页面处于稳定状态时，获取至少包括指示对象的第一目标图像。

形态参数确定模块602，用于通过第一目标图像确定指示对象的形态参数。

网格划分粒度调节模块603，用于基于指示对象的形态参数，调节目标页面的网格划分粒度。

兴趣区域确定模块604，用于基于调节后的网格划分粒度，确定指示对象所指定的兴趣区域。

由于不同指示对象的形态可能不同，不同时刻同一指示对象的形态也可能不同，因此，指示对象的定位精度也不同，为了使得指示对象具有较高的定位精度，本申请实施例提供的兴趣区域确定装置将目标页面划分成网格，当有指示对象在目标页面指定兴趣区域时，基于指示对象的形态参数自动调节目标页面的网格划分粒度，即调节划分的网格的大小，然后基于调节后的网格确定指示对象所指定的兴趣区域，即本申请实施例提供的兴趣区域确定装置能够基于指示对象的形态实现网格粒度的自动调节，这使得基于调节后的网格能够准确定位出指示对象所指定的兴趣区域，进而使得后续能够基于定位出的兴趣区域匹配到用户希望的兴趣资源，用户体验较好。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置中，兴趣区域确定模块604，具体用于基于调节后的网格粒度，确定指示对象的指定部位所处的网格，作为目标网格，确定目标网格所属的兴趣区域，作为指示对象所指定的兴趣区域。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置中，形态参数确定模块602，具体用于从第一目标图像中确定指示对象的轮廓，通过指示对象的轮廓确定指示对象的形态参数，指示对象的形态参数至少能够表征所述指示对象的尺寸大小。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置还可以包括：第二图像获取模块和运动幅度确定模块。

第二图像获取模块，用于在预设时间段内，获取所述第一目标图像后的多幅第二目标图像，所述第二目标图像中至少包括所述指示对象。

运动幅度确定模块，用于通过多幅所述第二目标图像确定所述指示对象的运动幅度。

网格划分粒度调节模块，具体用于基于所述指示对象的形态参数和所述指示对象的运动幅度，调节所述目标页面的网格划分粒度。

在一种可能的实现方式中，运动幅度确定模块包括：位置坐标确定子模块和运动幅度确定子模块。

位置坐标确定子模块，用于分别确定各幅所述第二目标图像中所述指示对象的指定部位的位置坐标，获得与各幅所述第二目标图像对应的位置坐标。

运动幅度确定子模块，用于通过与各幅所述第二目标图像对应的位置坐标，确定所述指示对象的运动幅度。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置还可以包括：页面图像获取模块、页面轮廓确定模块和坐标系建立模块。

页面图像获取模块，用于获取至少包括所述目标页面的图像作为目标页面图像。

页面轮廓确定模块，用于从所述目标页面图像中确定所述目标页面的轮廓。

坐标系建立模块，用于基于所述目标页面的轮廓建立目标坐标系。

位置坐标确定子模块，具体用于对于每幅所述第二目标图像执行：从所述第二目标图像中确定所述指示对象的轮廓；基于所述指示对象的轮廓确定所述指示对象的指定部位；确定指示对象的指定部位在目标坐标系中的位置坐标，得到与所述第二目标图像对应的位置坐标。

在一种可能的实现方式中，运动幅度确定子模块，具体用于将与各幅所述第二目标图像对应的位置坐标中的最大横坐标与最小横坐标求差，求得的差值作为第一差值；将与各幅所述第二目标图像对应的位置坐标中的最大纵坐标与最小纵坐标求差，求得的差值作为第二差值；将所述第一差值与所述第二差值求和，求和得到的值作为所述指示对象的运动幅度。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置中的网格划分粒度调节模块包括：调节因子确定子模块、网格划分粒度确定子模块和网格划分粒度调节子模块。

调节因子确定子模块，用于基于所述指示对象的形态参数和所述指示对象的运动幅度，确定网格划分粒度调节因子。

网格划分粒度确定子模块，用于基于预先设定的网格划分粒度和所述网格划分粒度调节因子，确定目标网格划分粒度。

网格划分粒度调节子模块，用于调节所述目标页面的当前网格划分粒度为所述目标网格划分粒度。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置还可以包括：第三图像获取模块、动态区域提取模块、运动轨迹确定模块和稳定状态确定模块。

第三图像获取模块，用于当检测出所述目标读本的翻页稳定时，按预设的时间间隔获取多幅第三目标图像，多幅所述第三目标图像中包括至少一幅第一类图像和多幅第二类图像，所述第一类图像为只包括所述目标页面的图像，所述第二类图像为包括所述目标页面和其它对象的图像。

动态区域提取模块，用于基于一幅所述第一类图像分别从各幅所述第二类图像中提取动态区域。

运动轨迹确定模块，用于当所述动态区域为包含所述指示对象的区域时，确定所述动态区域的运动轨迹。

稳定状态确定模块，用于基于所述动态区域的运动轨迹确定所述动态区域是否处于稳定状态，当所述动态区域处于稳定状态时，确定所述指示对象处于稳定状态。

在一种可能的实现方式中，上述实施例提供的兴趣区域确定装置还可以包括：兴趣资源确定模块和兴趣资源输出模块；

兴趣资源确定模块，用于确定与所述指示对象所指定的兴趣区域对应的兴趣资源。

兴趣资源输出模块，用于输出与所述指示对象所指定的兴趣区域对应的兴趣资源。

本申请还提供了一种兴趣区域确定设备，请参阅图7，示出了该兴趣区域确定设备的结构示意图，该设备包括：存储器701和处理器702；

所述存储器701，用于存储程序；

所述处理器702，用于执行所述程序，所述程序具体用于：

通过所述第一目标图像确定所述指示对象的形态参数；

兴趣区域确定设备还可以包括：总线、通信接口703、输入设备704和输出设备705。

处理器702、存储器701、通信接口703、输入设备704和输出设备705通过总线相互连接。其中：

总线可包括一通路，在计算机系统各个部件之间传送信息。

处理器702可以是通用处理器，例如通用中央处理器(CPU)、微处理器等，也可以是特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

处理器702可包括主处理器，还可包括基带芯片、调制解调器等。

存储器701中保存有执行本发明技术方案的程序，还可以保存有操作系统和其他关键业务。具体地，程序可以包括程序代码，程序代码包括计算机操作指令。更具体的，存储器701可以包括只读存储器(read-only memory，ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory，RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。

输入设备704可包括接收用户输入的数据和信息的装置，例如摄像头、光笔、触摸屏等。

输出设备705可包括允许输出信息给用户的装置，例如显示屏、扬声器等。

通信接口703可包括使用任何收发器一类的装置，以便与其他设备或通信网络通信，如以太网，无线接入网(RAN)，无线局域网(WLAN)等。

处理器702执行存储器701中所存放的程序，以及调用其他设备，可用于实现本发明实施例所提供的兴趣区域确定方法的各个步骤。

本申请还提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现上述任一项所述的兴趣区域确定方法的各个步骤。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种兴趣区域确定方法，其特征在于，包括：

通过所述第一目标图像确定所述指示对象的形态参数，其中，所述指示对象的形态参数至少包括所述指示对象宽度和/或长度；

基于所述指示对象的形态参数，调节所述目标页面的网格划分粒度，其中，所述指示对象的宽度越大，则划分的网格越大，所述指示对象的长度越大，则划分的网格越小；

2.根据权利要求1所述的兴趣区域确定方法，其特征在于，所述基于调节后的网格划分粒度，确定所述指示对象所指定的兴趣区域，包括：

3.根据权利要求1或2所述的兴趣区域确定方法，其特征在于，所述通过所述第一目标图像确定所述指示对象的形态参数，包括：

从所述第一目标图像中确定所述指示对象的轮廓；

4.根据权利要求1或2所述的兴趣区域确定方法，其特征在于，所述方法还包括：

通过多幅所述第二目标图像确定所述指示对象的运动幅度；

5.根据权利要求4所述的兴趣区域确定方法，其特征在于，所述通过多幅所述第二目标图像确定所述指示对象的运动幅度，包括：

6.根据权利要求5所述的兴趣区域确定方法，其特征在于，还包括：

获取至少包括所述目标页面的图像作为目标页面图像；

从所述目标页面图像中确定所述目标页面的轮廓；

基于所述目标页面的轮廓建立目标坐标系；

从所述第二目标图像中确定所述指示对象的轮廓；

基于所述指示对象的轮廓确定所述指示对象的指定部位；

7.根据权利要求5所述的兴趣区域确定方法，其特征在于，所述通过与各幅所述第二目标图像对应的位置坐标，确定所述指示对象的运动幅度，包括：

8.根据权利要求4所述的兴趣区域确定方法，其特征在于，所述基于所述指示对象的形态参数和所述指示对象的运动幅度，调节所述目标页面的网格划分粒度，包括：

根据所述指示对象的形态参数对应的权重，以及所述指示对象的运动幅度对应的权重，对所述指示对象的形态参数和所述指示对象的运动幅度加权求和，加权求和后的值作为网格划分粒度调节因子；

9.根据权利要求1或2所述的兴趣区域确定方法，其特征在于，还包括：

10.根据权利要求1所述的兴趣区域确定方法，其特征在于，还包括：

11.一种兴趣区域确定装置，其特征在于，包括：第一图像获取模块、形态参数确定模块、网格划分粒度调节模块和兴趣区域确定模块；

所述形态参数确定模块，用于通过所述第一目标图像确定所述指示对象的形态参数，其中，所述指示对象的形态参数至少包括所述指示对象宽度和/或长度；

所述网格划分粒度调节模块，用于基于所述指示对象的形态参数，调节所述目标页面的网格划分粒度，其中，所述指示对象的宽度越大，则划分的网格越大，所述指示对象的长度越大，则划分的网格越小；

12.一种兴趣区域确定设备，其特征在于，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，所述程序具体用于：

13.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1至10中任一项所述的兴趣区域确定方法的各个步骤。