CN113361696B

CN113361696B - 一种页面阅读识别方法和装置

Info

Publication number: CN113361696B
Application number: CN202110752118.XA
Authority: CN
Inventors: 钟世杰
Original assignee: Agricultural Bank of China
Current assignee: Agricultural Bank of China
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2024-02-27
Anticipated expiration: 2041-06-30
Also published as: CN113361696A

Abstract

本申请提供一种页面阅读识别方法和装置，应用于终端设备，该方法包括：获取用户在阅读页面内容时产生的交互数据；根据交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，阅读识别模型为基于卷积神经网络构建的深度学习模型；根据交互矩阵和阅读识别模型，得到用于表示用于是否有效阅读的识别结果。这样，可以提高判断各种阅读习惯和阅读能力不同的用户是否进行有效阅读的准确性，适用性高，易推广。

Description

一种页面阅读识别方法和装置

技术领域

本申请涉及信息处理技术领域，尤其涉及一种页面阅读识别方法和装置。

背景技术

随着终端技术的发展，用户可以在终端设备上安装应用程序，并可以根据应用程序中的操作引导，进行有效阅读。例如，有的应用程序为用户提供奖励机制，通过各种奖励措施鼓励用户进行有效阅读。

现有技术中，终端设备通过操作系统获取到用户在屏幕中驻留时间的方式判别用户是否进行了有效阅读。

然而，上述方式在判别用户是否进行有效阅读时的准确率较低。

发明内容

本申请提供一种页面阅读识别方法和装置，可以识别不同用户的触控操作，可以提高判断各种阅读习惯和阅读能力不同的用户是否进行有效阅读的准确性，适用性高，易推广。

第一方面，本申请提供一种页面阅读识别方法，应用于终端设备，所述方法包括：获取用户在阅读页面内容时产生的交互数据；根据所述交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，所述阅读识别模型为基于卷积神经网络构建的深度学习模型；根据所述交互矩阵和所述阅读识别模型，得到用于表示用于是否有效阅读的识别结果。

一种可能的实现方式中，获取用户在结束阅读后触发的跳转信息，所述跳转信息用于请求确认所述用户完成指定任务，和/或，用于请求跳转至下一页面；若所述识别结果为有效阅读，则确定所述用户完成指定任务，和/或，跳转至下一页面；若所述识别结果为非有效阅读，则确定所述用户未完成指定任务，和/或，禁止跳转至下一页面。

一种可能的实现方式中，若所述识别结果为非有效阅读，则向所述用户提供反驳界面，所述反驳界面用于供用户发起反驳；获取用户在所述反驳界面输入的反驳信息，并对所述反驳信息进行校验；若校验通过，则将所述交互数据对应的标签更新为有效阅读标签，以基于所述交互数据和更新后的标签对所述阅读识别模型进行增量训练。

一种可能的实现方式中，获取用户在阅读页面内容时产生的交互数据，包括：初始化用于供用户阅读的页面，并创建用于存储所述交互数据的第一结构体以及用于缓存数据的第二结构体；检测所述用户在所述页面上的交互数据，并将交互数据缓存于所述第二结构体；在检测到所述用户在结束阅读后触发的跳转信息后，生成对应的时间序列字符串；将所述时间序列字符串作为键，将所述第二结构体缓存的交互数据作为键值，共同存储于所述第一结构体。

一种可能的实现方式中，检测所述用户在所述页面上的交互数据，包括：采集所述用户在所述页面上的下述至少一项数据：垂直滑动的初始横坐标；垂直滑动的初始纵坐标；垂直滑动的初速度；垂直滑动的末速度；水平滑动的初始横坐标；水平滑动的初始纵坐标；水平滑动的初速度；水平滑动的末速度；交互起始时间；交互结束时间。

一种可能的实现方式中，根据所述交互数据，构建满足阅读识别模型输入要求的交互矩阵，包括：确定所述页面的显示长度和显示宽度；根据所述显示长度、显示宽度以及采集到的至少一项数据，构建四通道的二维交互矩阵；将所述四通道的二维交互矩阵的第三通道和第四通道相比，转化为三通道的二维交互矩阵；将所述三通道的二维交互矩阵进行矩阵缩放处理，得到满足阅读识别模型输入要求的交互矩阵。

一种可能的实现方式中，根据所述显示长度、显示宽度以及采集到的至少一项数据，构建四通道的二维交互矩阵，包括：计算所述二维交互矩阵中的用于表征垂直滑动坐标的第一元素对应的四通道的值分别为：垂直滑动的初始横坐标、垂直滑动的初始纵坐标、垂直滑动的初始横坐标与屏幕宽度的比值、垂直滑动的初始纵坐标与屏幕长度的比值；

计算所述二维交互矩阵中的用于表征水平滑动坐标的第二元素对应的四通道的值分别为：水平滑动的初始横坐标、水平滑动的初始纵坐标、水平滑动的初始横坐标与屏幕宽度的比值、水平滑动的初始纵坐标与屏幕长度的比值；

计算所述二维交互矩阵中的用于表征垂直滑动速度的第三元素对应的四通道的值分别为：垂直滑动的初始纵坐标、垂直滑动的初速度、垂直滑动的初始纵坐标与屏幕宽度的比值、垂直滑动的初速度与屏幕长度的比值；

计算所述二维交互矩阵中的用于表征水平滑动速度的第四元素对应的四通道的值分别为：水平滑动的初速度、水平滑动的末速度、水平滑动的初速度与屏幕宽度的比值、水平滑动的末速度与屏幕长度的比值；

计算所述二维交互矩阵中的用于表征起止时间坐标的第五元素对应的四通道的值分别为：交互起始时间、交互结束时间、交互起始时间与屏幕宽度的比值、交互结束时间与屏幕长度的比值；

计算所述二维交互矩阵中的用于表征指定内容坐标的第六元素对应的四通道的值分别为：交互数据的横坐标，交互数据的纵坐标、指定内容与交互数据的横坐标经过计算得到第一关联关系、指定内容与交互数据的纵坐标经过计算得到第二关联关系。

一种可能的实现方式中，获取服务器发送的所述阅读识别模型，所述阅读识别模型为所述服务器基于训练数据集对初始卷积神经网络模型进行训练后得到的。

第二方面，本申请提供一种页面阅读识别方法，应用于服务器，所述方法包括：获取训练数据集，所述训练数据集包括用户在阅读页面内容时产生的交互数据以及对应的标签，所述标签用于表示所述用户在所述页面的阅读行为是否为有效阅读；根据所述训练数据集，对阅读识别模型进行训练；其中，所述阅读识别模型为基于卷积神经网络构建的深度学习模型；将训练完成的阅读识别模型发送给终端设备，以使终端设备根据所述阅读识别模型对所述终端设备的用户的阅读行为进行识别。

第三方面，本申请实施例提供一种页面阅读识别装置，获取模块，用于获取用户在阅读页面内容时产生的交互数据；构建模块，用于根据所述交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，所述阅读识别模型为基于卷积神经网络构建的深度学习模型；识别模块，用于根据所述交互矩阵和所述阅读识别模型，得到用于表示用于是否有效阅读的识别结果。

第四方面，本申请实施例提供一种电子设备，包括：至少一个存储器和至少一个处理器，所述存储器，用于存储指令；所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器执行如第一方面任一项所述的页面阅读识别方法。

第五方面，本申请实施例提供一种电子设备，包括：至少一个存储器和至少一个处理器，所述存储器，用于存储指令；所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器执行如第二方面任一项所述的页面阅读识别方法。

第六方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如第一方面或第二方面任一可能设计的技术方案。

第七方面，本申请实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如第一方面或第二方面任一可能设计的技术方案。

综上所述，本申请实施例提供的一种页面阅读识别方法和装置，可以识别不同用户的个性化行为特征，并且收集能够反映用户的个性化行为特征的数据，进一步的，可以判别各种阅读习惯和阅读能力不同的用户是否进行有效阅读，提高判别用户是否进行有效阅读时的准确率，因此，该方法可以用于获取投放广告的阅读量及效益、用户对签订在线协议时内容的知悉情况、用户兴趣偏好的推荐依据等有效信息。

附图说明

图1为本申请实施例提供的场景示意图；

图2为本申请实施例提供的一种页面阅读识别方法的流程示意图；

图3为本申请实施例提供的ResNet50的流程示意图；

图4为本申请实施例提供的解决用户发起反驳的流程示意图；

图5为本申请实施例提供的获取用户在阅读页面内容时产生交互数据的流程示意图；

图6为本申请实施例提供的构建满足阅读识别模型输入要求的交互矩阵的流程示意图；

图7为本申请实施例提供的构建四通道的二维交互矩阵的流程示意图；

图8为本申请实施例提供的一种具体的页面阅读识别的流程图；

图9为本申请实施例提供的一种页面阅读识别装置的结构示意图；

图10为本申请实施例提供的一种电子设备的结构示意图；

图11为本申请实施例提供的另一种电子设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

本文中的术语“多个”是指两个或两个以上。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系；在公式中，字符“/”，表示前后关联对象是一种“相除”的关系。

可以理解的是，在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分，并不用来限制本申请的实施例的范围。

可以理解的是，在本申请的实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请的实施例的实施过程构成任何限定。

本申请实施例提供的一种页面阅读识别方法和装置，可以应用在具备显示功能的电子设备中。电子设备可以用于判别用户是否进行有效阅读等。示例性的，图1为本申请实施例提供的场景示意图。如图1所示，用户可以通过在手机101界面进行滑动，完成对手机界面内信息的阅读。

其中，电子设备可以包括：大屏(或称为智慧屏)、手机、平板电脑、智能手表、智能手环、智能耳机、智能眼镜或其他具备显示屏幕的终端设备等，本申请实施例对此不予限定。

一种可能的实现方式中，在用户进行信息阅读时，终端设备可以收集用户与屏幕交互数据判别用户是否进行了有效阅读，该屏幕交互数据可以有用户在屏幕中进行的手势数据，以及屏幕及其特定内容的区域位置数据等，基于上述交互数据，终端设备判断用户是否进行有效阅读。

其中，手势数据可以包括：手指在终端设备页面视图操作时的触点的坐标、滑动的初末速度、滑动的距离以及离开滑动的触点坐标等，屏幕及其特定内容的区域位置数据可以包括终端设备页面视图的长度和宽度、横纵向的像素密度等。

示例性的，终端设备通过合理的计算，将用户在终端设备中页面视图的驻留时间或者触控操作次数的阈值作为检测依据，即终端设备指定或计算出一个合理的驻留时间或触控屏幕次数作为阈值，当驻留时间大于该阈值或触控操作次数多于该阈值时，则认为用户进行了有效阅读。

或者，终端设备通过将用户浏览的页面视图转化为可滚动的页面视图，将用户通过触控操作抵达的区域阈值作为检测依据，当终端设备的页面视图抵达某个特殊位置(如页面视图最底部)时，则认为用户进行了有效阅读。

但是，该方法忽略了用户的个性化的行为特征，例如：终端设备在使用驻留时间大于阈值的方式判定用户是否有效阅读时，该方式不可以同时适用于阅读速度较快和较慢的用户，终端设备在使用触控操作次数大于阈值的方式判定用户是否有效阅读时，该方式不可以适用阅读时习惯触控屏幕和不触控屏幕的用户，终端设备在使用底部触发的方式判定用户是否有效阅读时，该方式不可以适用喜好先粗略滚动进行全局观察而后进行阅读的用户等。

一种可能的实现方式中，在用户进行信息阅读时，终端设备可以获取用户眼动数据判别用户是否进行了有效阅读，该眼动数据可以包括用户在阅读过程中，眼睛在终端设备页面视图中的视觉焦点的数据，以及用户眼睛移动轨迹的数据等。

但是，该方法无法解决用户差异产生的个性化特征进行模式识别的问题，而且在终端设备获取用户眼动数据时，需要大量的硬件设备、电量的支持，成本高昂、不易推广。

因此，本申请实施例提供了一种页面阅读识别方法，可以应用于终端设备，该方法可以获取用户在阅读页面内容时产生的交互数据，该交互数据可以包括用户的触控操作数据，可以根据交互数据，构建满足阅读识别模型输入要求的交互矩阵，进一步的，将该交互矩阵输入阅读识别模型中，得到用户是否有效阅读的结果。本申请实施例提供的方法可以提高判别各种阅读习惯和阅读能力不同的用户是否进行有效阅读的准确性，且该方法适用性高，有易推广。

下面将结合附图对本申请实施例提供的一种页面阅读识别方法做详细说明。图2为本申请实施例提供的一种页面阅读识别方法的流程示意图，如图2所示，本申请实施例的方法包括：

S201、获取用户在阅读页面内容时产生的交互数据。

本申请实施例中，页面内容可以指的是终端设备或终端设备安装的应用程序中的显示界面的多媒体内容，该多媒体内容可以包括:文本，声音，图片和视频等内容，交互数据可以指的用户在终端设备页面视图中的触控操作产生的交互数据，可以包括用户在终端设备页面视图中手指操作时的触点的坐标、滑动的初末速度、滑动的距离、离开滑动的触点坐标等交互数据，以及用户手指操作时的滑动速度速度、手指遮挡等多种用户个性化特征的交互数据。

示例性的，终端设备可以阅读用户在终端设备或终端设备安装的应用程序中的显示界面的文本内容，进一步的，用户可以在该显示界面进行触控操作，相应的，终端设备可以接收用户的触控操作，并获取用户在阅读该显示页面内容时由用户触控操作产生的交互数据。

S202、根据交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，阅读识别模型为基于卷积神经网络构建的深度学习模型。

本申请实施例中，卷积神经网络(convolutional neural networks，CNN)可以指的是一类包含卷积计算且具有深度结构的前馈神经网络(feedforward feuralfetworks)，是一种应用广泛的深度学习(deep learning)的算法，该卷积神经网络具有表征学习(representation learning)能力，可以用于按其阶层结构对输入信息进行平移不变分类，并进一步对输入信息进行迭代计算，其中，残差网络(ResNet)服务于CNN。

例如，如表1所示，该表1为迭代层数不同的卷积神经网络：

表1

其中，表1示出了5种深度的ResNet，分别是18层，34层，50层，101层和152层，在表1的最左侧可以看出，卷积神经网络被分成5部分，分别是：向量卷积层1(conv1)，向量卷积层2_x(conv2_x)，向量卷积层3_x(conv3_x)，向量卷积层4_x(conv4_x)，向量卷积层5_x(conv5_x)。

以ResNet50(即50-层)的卷积神经网络为例，具体计算过程如图3所示，图3为本申请实施例提供的ResNet50的流程示意图，图3示仅出了阶段1和阶段2的计算过程，而阶段3和阶段4的计算过程与阶段1和阶段2类似，在此不重复赘述。例如，输入一个224x224x3的图片，经过7x7的卷积核，进行步长为2的卷积，得到图像大小为112x112，通道数为64的结果。将该结果经过3x3的最大池化层进行步长为2的池化，得到图像大小为56x56，通道数64的结果，将上述结果记为结果0。进一步的，对结果0进行1x1步长为1的卷积，得到通道数为64的结果，再将该结果进行3x3步长为1的卷积，得到通道数为64的结果，针对该结果再经过1x1的卷积核步长为1的卷积，得到通道数为256的结果，将该结果记为结果1_1，进一步的，把得到的结果1_1与之前得到的结果0进行融合。

由于结果0的通道数为64，所以需要对该结果0进行升维，经过1x1升维到256通道，然后将升维后的结果0与结果1_1进行融合，得到的结果记作结果1_2，然后对结果1_2经过1x1的卷积，把通道数为256的特征层进行降维到64通道，然后使用3x3卷积核和1x1卷积核，得到56x56图像大小，通道数为256的结果，将该结果记为结果1_3，然后把之前得到的结果1_2与结果1_3进行融合，同理，阶段1的第三部分进行上述同样的操作，得到融合后的结果，该结果为图像大小为56x56，通道数为256。进一步的，融合后的结果记为结果1_4。

之后的结果进入阶段2，将该结果进行1x1卷积操作，进一步的，以步长为2，进行图像大小的缩小，缩小为28x28，维度也由256通道降到128通道，再对得到的结果进行3x3步长为1的卷积操作，再进行1x1的卷积操作，得到结果2_1，这时把结果1_4和结果2_1进行融合，但是由于两者的大小和维度不同，所以需要对结果1_4进行升维(即利用1x1卷积核进行升维)和下采样，升维到512通道，下采样到28x28，把得到的升维和下采样的结果与结果2_1进行融合，得到的结果记作阶段2_2。然后把阶段2_2进行3x3的卷积操作，得到的结果进行1x1的卷积操作，得到的结果为结果2_3，与之前得到的结果2_2进行融合，由于两者在大小和维度上保持一致，所以直接进行融合，类似的，按照以上步骤完成阶段2。

接下来的阶段3，阶段4均是利用相同的步骤进行计算，最后阶段4输出的结果大小为7x7，通道数为2048。

进一步的，对该结果进行7x7的全局平均池化，得到1x1x2048的一个向量特征，然后该向量特征与1000个神经元做全连接输出1000个值，进一步的，将输出的1000个值进行交叉熵函数(即softmax)计算，输出最后的结果。

本申请实施例中，深度学习模型可以指的是基于一个深度学习算法的体系结构，可用于迭代训练数据。

示例性的，可以根据用户在阅读终端设备中显示页面内容时由用户触控操作产生的交互数据，构建满足基于卷积神经网络算法的深度学习模型输入要求的交互矩阵，该基于卷积神经网络算法的深度学习模型可以称为阅读识别模型。

S203、根据交互矩阵和阅读识别模型，得到用于表示用于是否有效阅读的识别结果。

示例性的，可以将满足阅读识别模型输入要求的交互矩阵输入该阅读识别模型中，该阅读识别模型利用该交互数据进行迭代训练，输出是否有效阅读的识别结果，该识别结果可以包括“是”和“否”，其中，“是”表示用户进行有效阅读，“否”表示用户没有进行有效阅读。

综上所述，本申请实施例提供了一种页面阅读识别方法，可以识别不同用户的个性化行为特征，并且收集能够反映用户的个性化行为特征的数据，进一步的，可以判别各种阅读习惯和阅读能力不同的用户是否进行有效阅读，提高判别用户是否进行有效阅读时的准确率，因此，该方法可以用于获取投放广告的阅读量及效益、用户对签订在线协议时内容的知悉情况、用户兴趣偏好的推荐依据等有效信息。

在图2对应的实施例的基础上，本申请实施例还可以有下述可选地实现方式。

一种可能的实现方式中，获取用户在结束阅读后触发的跳转信息，该跳转信息用于请求确认用户完成指定任务，和/或，用于请求跳转至下一页面；若识别结果为有效阅读，则确定用户完成指定任务，和/或，跳转至下一页面；若识别结果为非有效阅读，则确定用户未完成指定任务，和/或，禁止跳转至下一页面。

示例性的，用户在终端设备的显示页面中完成阅读后，终端设备可以获取用户在结束阅读后触发的跳转信息，例如，在终端设备的某个应用程序中，该应用程序发布的任务为：用户在该应用程序的显示界面内阅读1分钟，就可以获取0.1元的奖励，进一步的，用户在该显示页面中阅读满1分钟，则终端设备的显示界面可以弹出一个消息提示框，提示用户已完成任务并获得0.1元的奖励，则该用户进行的阅读为有效阅读。

或者，在用户打开终端设备的某个应用程序后，该应用程序的阅读设置为阅读满30秒，即可跳转到下一页继续进行阅读，则用户在该应用程序的显示页面阅读满30秒后，该应用程序识别该用户的阅读结果为有效阅读，则该应用程序的显示页面自动跳转到下一页，用于用户继续进行阅读。

可选的，如果用户在该显示页面中阅读满1分钟，但是没有弹出相应的消息提示框，则该终端设备识别该用户的阅读为非有效阅读，可以理解的是，如果用户在该显示页面中阅读没有满1分钟，则该终端设备可以识别该用户的阅读为非有效阅读。

因此，终端设备可以通过获取用户在结束阅读后有无触发跳转信息，提示用户是否完成阅读的指定内容。

一种可能的实现方式中，用户通过触控操作完成终端设备显示界面的阅读任务，但是终端设备判别该用户的阅读为非有效阅读，则用户可以对此结果进行反驳，相应的，终端设备可以接收到用户的反驳请求，并进一步进行相应的处理，该处理的过程如图4所示，图4为本申请实施例提供的解决用户发起反驳的流程示意图，可以包括：

S401、若识别结果为非有效阅读，则向用户提供反驳界面，反驳界面用于供用户发起反驳。

本申请实施例中，反驳界面可以指的是终端设备提供的用于供用户发起反驳请求的可操作显示界面。例如，该反驳界面可以终端设备某个应用程序提供的消息提示框，该提示框中可以包括“是”和“否”两个操作按钮，该提示框中还可以显示“是否提出反驳请求”消息以提示用户是否提出反驳请求，用户可以选择“是”操作按钮提出反驳请求，也可以选择“否”不提出反驳请求。

示例性的，如果终端设备的某个应用程序中发布的一个任务为：用户在该应用程序的显示界面内阅读1分钟，就可以获得0.1元的奖励，进一步的，用户在该显示页面中阅读满1分钟，然而该终端设备识别该用户的阅读为非有效阅读，则该终端设备可以向用户提供一个反驳界面，用户通过触控操作完成该反驳界面内的相关的反驳操作，向终端设备发起反驳请求。

S402、获取用户在反驳界面输入的反驳信息，并对反驳信息进行校验。

本申请实施例中，反驳信息可以指的一系列相关的可以验证用户是否进行有效阅读的信息。例如，该反驳信息可以包括：用户进行多长时间的阅读，用户是否进行触控操作、用户触控操作的次数有多少、用户在终端设备的显示界面滑动速度是否过快以及用户是否遮挡该显示界面等信息。

示例性的，终端设备向用户提供反驳界面之后，该界面还可以包括一些相关的用户进行有效阅读时的操作问题信息，用户可以通过触控操作对该问题信息做出回复，该回复的信息可以是反驳信息，例如，该反驳信息可以有进行1分钟的阅读，进行触控操作且次数为2次，在终端设备的显示界面滑动速度慢，没有遮挡显示界面等，终端设备可以对该反驳信息进行校验，验证反驳信息是否有效。

或者，终端设备可以向用户显示询问页面内容的信息，由用户输入相应的回复作为反驳信息，终端设备可以验证用户输入的信息与页面内容是否一致。例如，页面内容为风险告知信息，包含可能存在的风险，若根据用户在所述页面上的交互数据认定用户的阅读行为属于非有效阅读，则可以向用户提问可能存在的风险包括哪些，在用户回答正确后，即可认为反驳有效，反之则认为反驳无效。

S403、若校验通过，则将交互数据对应的标签更新为有效阅读标签，以基于交互数据和更新后的标签对阅读识别模型进行增量训练。

本申请实施例中，有效阅读标签可以指的是用户进行有效阅读的结果，该结果可以表示为“是”，该结果也可以有其他表述方式，本申请实施例对此不作具体限定。

示例性的，如果终端设备验证反驳信息有效，即校验通过，则终端设备将交互数据对应的标签更新为“是”，进一步的，将S201中收集的交互数据和更新后的标签输入阅读识别模型中，该阅读识别模型对输入的上述数据进行增量训练。

需要说明的是，本申请实施例可以通过使用独热编码，将交互数据对应的标签转化为是否有效阅读的标签，其中，独热编码也可以称为一位有效编码，采用位状态寄存器来对状态进行编码，通过利用0和1表示一些参数，使用N位状态寄存器来对N个状态进行编码。因此，本申请实施例可以允许用户对当前存在本地的阅读识别模型的预测结果进行反驳，从而可以修正本地的阅读识别模型，可以使阅读识别模型持续自优化，可以适应不同用户的阅读行为习惯。

一种可能的实现方式中，S201的具体流程如图5所示，图5为本申请实施例提供的获取用户在阅读页面内容时产生交互数据的流程示意图，可以包括：

S501、初始化用于供用户阅读的页面，并创建用于存储交互数据的第一结构体以及用于缓存数据的第二结构体。

本申请实施例中，初始化可以指的是初始化具有引导性跳转操作的监听事件，用于监听用户手势的触控操作并收集用户触控操作的数据，其中，引导性跳转操作可以指的是指导用户使用终端设备过程中有效跳转界面的操作或终端设备中应用程序预设的指引操作。

可以理解的是。终端设备可以通过初始化终端设备的手势事件监听组件及其事件回调接口，使监听器处于手势监听状态，用于监听用户的触控操作。

本申请实施例中，第一结构体可以指的是存储交互数据的有序的结构体，该结构体的键为时间序列字符串，键值是数据类型为浮点值的一维向量，该浮点值与位置索引相对应，具体如表2所示。

表2

其中，已经与屏幕接触并可能开始垂直移动的坐标x01，可以记为垂直滑动的初始横坐标，已经与屏幕接触并可能开始垂直移动的坐标y01，可以记为垂直滑动的初始纵坐标，手指触摸屏幕并且在开始接触屏幕时的垂直移动速度a01，可以记为垂直滑动的初速度，手指离开屏幕并且在停止接触屏幕时的垂直移动速度b01，可以记为垂直滑动的末速度，已经与屏幕接触并可能开始水平移动的坐标x11，可以记为水平滑动的初始横坐标，已经与屏幕接触并可能开始水平移动的坐标y11，可以记为水平滑动的初始纵坐标，手指触摸屏幕并且在开始接触屏幕时的水平移动速度a11，可以记为水平滑动的初速度，手指离开屏幕并且在停止接触屏幕时的水平移动速度b11，可以记为水平滑动的末速度，开始记录本次交互数据的时间戳c1，可以记为交互起始时间，结束记录本次交互数据的时间戳c2，可以记为交互结束时间。

本申请实施例中，第二结构体可以指的用于缓存当前未完成交互动作的交互数据的结构体，该结构体的键和键值与第一结构体类似，在此不重复赘述。

示例性的，终端化设备进入需要进行数据采集的显示页面，该显示页面初始化，进一步的，终端设备创建一个用于存储交互数据的有序的第一结构体和一个用于缓存交互数据的有序的第二结构体。

S502、检测用户在页面上的交互数据，并将交互数据缓存于第二结构体。

示例性的，终端设备可以检测用户在显示页面的触控操作，当用户在显示页面中与终端设备进行交互时，如果进入手势事件监听的回调后，可以将该触控操作产生的交互数据缓存于第二结构体中。

S503、在检测到用户在结束阅读后触发的跳转信息后，生成对应的时间序列字符串。

本申请实施例中，时间序列字符串可以指的是某一触控操作在不同时间上产生的数据，按照时间的先后顺序排列而成的序列字符串，可以用于记录不同时间段对应的交互数据的信息。时间序列字符串可以是某一特定的时间点对应的字符串，也可以是某一时间段对应的字符串。

示例性的，终端设备在检测到用户在10:05结束阅读后，进一步的，触发跳转信息，该跳转信息可以是用户完成有效阅读离开当前的视图页面，也可以是用户完成有效阅读但是没有跳转进入相应的视图页面，相应的，终端设备生成10:05这个时刻对应的序列字符串。

可选的，终端设备也可以在检测到用户在10:00-10:05这个时间段完成阅读，进一步的，终端设备检测到用户在结束阅读后触发的跳转信息，相应的，终端设备生成10:00-10:05这个时间段对应的序列字符串。

可以理解的是，可以通过检查第二结构体的数据中的跳转信息，判断是否结束交互动作。

S504、将时间序列字符串作为键，将第二结构体缓存的交互数据作为键值，共同存储于第一结构体。

示例性的，终端设备可以将某一时刻的时间序列字符串作为键，将该某一时刻存储于第二结构体中的一维向量值的拷贝值作为键值，共同存储于创建的第一结构体中。

需要说明的是，如果用户在结束阅读后无法触发的跳转信息，则终端设备可以取出第一结构体中对应的时间序列字符串，第一结构体中的交互数据可以存储在本地数据库中。

因此，本申请实施例通过创建第二结构体缓存交互数据，创建第一结构体存储交互数据，这样，在提取交互数据时可以从第一结构体中获取，不需要将所有的数据重新遍历一遍，避免资源浪费。

一种可能的实现方式中，检测用户在页面上的交互数据，包括：采集用户在页面上的下述至少一项数据：垂直滑动的初始横坐标；垂直滑动的初始纵坐标；垂直滑动的初速度；垂直滑动的末速度；水平滑动的初始横坐标；水平滑动的初始纵坐标；水平滑动的初速度；水平滑动的末速度；交互起始时间；交互结束时间。这样，通过采集上述的交互数据，可以有效的反映用户的个性化行为特征。

其中，垂直滑动可以指的是用户触控操作滑动时在垂直方向的一个竖直分量，或者在用户触控操作滑动时的方向与垂直方向的夹角小于阈值，则将该触控操作滑动划分为垂直滑动，水平滑动可以指的是用户触控操作滑动时在水平方向的一个水平分量，或者在用户触控操作滑动时的方向与水平方向的夹角小于阈值，则将该触控操作滑动划分为水平滑动，交互可以指的是用户与终端设备之间的触控操作。

一种可能的实现方式中，根据交互数据，构建满足阅读识别模型输入要求的交互矩阵的流程，如图6所示，图6为本申请实施例提供的构建满足阅读识别模型输入要求的交互矩阵的流程示意图，可以包括：

S601、确定页面的显示长度和显示宽度。

示例性的，在终端设备构建满足阅读识别模型输入要求的交互矩阵时，获取该终端设备显示页面的显示长度w和显示宽度d。

S602、根据显示长度、显示宽度以及采集到的至少一项数据，构建四通道的二维交互矩阵。

本申请实施例中，四通道的二维交互矩阵可以如表3所示：

表3

垂直滑动坐标	垂直滑动速度	/
			水平滑动坐标	水平滑动坐标	/
起止时间坐标	/	指定内容坐标

其中，垂直滑动坐标可以作为该四通道的二维交互矩阵的第一元素，水平滑动坐标可以作为该四通道的二维交互矩阵的第二元素，垂直滑动速度可以作为该四通道的二维交互矩阵的第三元素，水平滑动坐标可以作为该四通道的二维交互矩阵的第四元素，起止时间坐标可以作为该四通道的二维交互矩阵的第五元素，指定内容坐标可以作为该四通道的二维交互矩阵的第六元素。

具体的，将采集到的至少一项数据定义为Di，Di[位置索引]表示：第i次遍历时，取该数据对应位置索引的浮点值，该浮点值如表2所示，定义A为交互数据矩阵，其中，A[i，j]表示第i行、第j列的数据。然后计算该第一元素，该第二元素，该第三元素，该第四元素，该第五元素，该第六元素的值分别如下所示：

计算二维交互矩阵中的用于表征垂直滑动坐标的第一元素对应的四通道的值分别为：垂直滑动的初始横坐标、垂直滑动的初始纵坐标、垂直滑动的初始横坐标与屏幕宽度的比值、垂直滑动的初始纵坐标与屏幕长度的比值。上述可以用矩阵的形式表示为A[i，j]＝(Di[0]，Di[1]，Di[0]/w，Di[1]/d)。

计算二维交互矩阵中的用于表征水平滑动坐标的第二元素对应的四通道的值分别为：水平滑动的初始横坐标、水平滑动的初始纵坐标、水平滑动的初始横坐标与屏幕宽度的比值、水平滑动的初始纵坐标与屏幕长度的比值。上述可以用矩阵的形式表示为A[i，2j]＝(Di[2]，Di[3]，Di[2]/w，Di[3]/d)。

计算二维交互矩阵中的用于表征垂直滑动速度的第三元素对应的四通道的值分别为：垂直滑动的初始纵坐标、垂直滑动的初速度、垂直滑动的初始纵坐标与屏幕宽度的比值、垂直滑动的初速度与屏幕长度的比值。上述可以用矩阵的形式表示为A[2i，j]＝(Di[4]，Di[5]，Di[4]/w，Di[5]/d)。

计算二维交互矩阵中的用于表征水平滑动速度的第四元素对应的四通道的值分别为：水平滑动的初速度、水平滑动的末速度、水平滑动的初速度与屏幕宽度的比值、水平滑动的末速度与屏幕长度的比值。上述可以用矩阵的形式表示为A[2i，2j]＝(Di[6]，Di[7]，Di[6]/w，Di[7]/d)。

计算二维交互矩阵中的用于表征起止时间的第五元素对应的四通道的值分别为：交互起始时间、交互结束时间、交互起始时间与屏幕宽度的比值、交互结束时间与屏幕长度的比值。上述可以用矩阵的形式表示为A[3i，j]＝(Di[8]，Di[9]，Di[8]/w，Di[9]/d)。

计算二维交互矩阵中的用于表征指定内容坐标的第六元素对应的四通道的值分别为：交互数据的横坐标，交互数据的纵坐标、指定内容与交互数据的横坐标经过计算得到第一关联关系、指定内容与交互数据的纵坐标经过计算得到第二关联关系。其中，指定内容可以指的是终端设备的显示界面中检测目标的抽象图区域，该检测目标用于判别用户通过触控操作是否在该显示界面内进行有效阅读。

本申请实施例中，用户触控操作产生的交互数据和页面元素(即指定内容)经过计算可以产生关联关系，而该关联关系是阅读识别模型的输入数据之一，该指定内容可以指定页面中的全部或部分元素的位置。

示例性的，可以根据用户触控操作产生的交互数据的位置坐标和指定内容的位置坐标，经过计算产生关联关系，进一步确定用户有没有作业到指定位置。

可选的，可以通过使用独热图缩放的方式，判断交互数据的横纵坐标与指定内容是否相匹配或者相近，进一步判断交互数据的横坐标与指定内容的第一关联关系，交互数据的纵坐标与指定内容的第二关联关系，确定用户有没有作业到指定位置。

可选的，也可以通过使用三目运算符的方式，判断交互数据的横纵坐标与指定内容是否相匹配或者相近，进一步判断交互数据的横坐标与指定内容的第一关联关系，交互数据的纵坐标与指定内容的第二关联关系，确定用户有没有作业到指定位置。

需要说明的是，可以通过其他算法判断用户触控操作产生的交互数据的位置和指定内容的位置有无关联关系，本申请实施例对此不作具体限定。因此，可以通过上述方法构建满足阅读识别模型输入条件的四通道的二维交互矩阵，其中，在构建第六元素对应的四通道的值时，通过指定内容与交互数据建立关联关系，进一步判别用户通过该触控操作是否进行有效阅读，提高收集触控数据的有效性。

示例性的，终端设备根据终端设备显示页面的显示长度、显示宽度以及采集到的至少一项数据，可以构建如表3所示的四通道的二维交互矩阵。

S603、将四通道的二维交互矩阵的第三通道和第四通道相比，转化为三通道的二维交互矩阵。

示例性的，以四通道的二维交互矩阵的第一元素A[i，j]为例，终端设备可以将A[i，j]＝(Di[0]，Di[1]，Di[0]/w，Di[1]/d)的第三通道和第四通道进入比值，转化为三通道的二维交互矩阵(Di[0]，Di[1]，Di[u])。

S604、将三通道的二维交互矩阵进行矩阵缩放处理，得到满足阅读识别模型输入要求的交互矩阵。

示例性的，可以将三通道的二维交互矩阵缩放为56×56的输入矩阵，该输入矩阵为满足阅读识别模型输入要求的交互矩阵。

可以理解的是，若将交互数据矩阵缩放为其他尺寸的数据矩阵，并相应将阅读识别模型的输入层改为相同的尺寸，也可以完成S604，本申请实施例对缩放输入矩阵的大小不作具体限定。

需要说明的是，交互数据可以是从本地数据库中取出的与当前模型训练序号不一致对应的第一结构体中的数据，且该交互数据为第一结构体中键的序列字符串最大的键值，其中，模型训练序号可以指的是第几次进行的阅读识别模型训练的序号，用于区分不同模型训练，可以避免使用与当前模型训练序号相同的数据进行训练。

因此，本申请实施例可以利用上述方法将交互矩阵转换为满足阅读识别模型输入的矩阵，这样，本申请实施例就可以使用阅读识别模型对交互数据进行迭代训练。

一种可能的实现方式中，获取服务器发送的阅读识别模型，阅读识别模型为服务器基于训练数据集对初始卷积神经网络模型进行训练后得到的。这样，阅读识别模型可以满足大众的行为习惯，达到普遍适用的效果。

可选的，本申请实施例提供的一种页面阅读识别方法，可以应用于服务器，如图7所示，图7为本申请实施例提供的构建四通道的二维交互矩阵的流程示意图，具体方法包括：

S701、获取训练数据集，训练数据集包括用户在阅读页面内容时产生的交互数据以及对应的标签，标签用于表示用户在页面的阅读行为是否为有效阅读。

本申请实施例中，获取数据采集设备(比如终端设备)发送的训练数据集，训练数据集包括多条训练数据；其中，训练数据包括数据采集设备采集到的交互数据以及对应的标签。

S702、根据训练数据集，对阅读识别模型进行训练；其中，阅读识别模型为基于卷积神经网络构建的深度学习模型。

示例性的，服务器可以根据从终端设备发送的训练数据集对基于卷积神经网络构建的深度学习模型进行迭代训练，得到可以判别用户是否有效阅读的阅读识别模型，其中，该阅读识别模型为基于卷积神经网络构建的深度学习模型。

S703、将训练完成的阅读识别模型发送给终端设备，以使终端设备根据阅读识别模型对终端设备的用户的阅读行为进行识别。

示例性的，在服务器将阅读识别模型训练完成之后，将该阅读识别模型分发给用户所需的终端设备，进一步的，终端设备可以利用该阅读识别模型对用户的阅读行为进行判别，判别该用户是否进行有效阅读。

因此，本申请实施例的与训练模型可以在应用程序分发之前进行，可以保证服务方预先通过大众习惯进行训练的模型网络能够在应用程序分发至用户之前达到普遍适用效果。

结合上述实施例，图8为本申请实施例提供的一种具体的页面阅读识别的流程图。如图8所示，本申请实施例的执行方法步骤包括：

S801、获取用户在终端设备中通过触控操作产生的交互数据。

S802、判断该交互数据是否是程序分发前的，若是则执行S803，若否则执行S806。

其中，程序分发可以指的是将应用程序从应用程序下载平台下载下来，其中，该应用程序可以是不断分发到相对应的应用程序下载的平台上，用于用户使用时下载。

S803、判断该交互数据是否为有效数据，若是有效数据，则执行S804，若不是有效数据，则将该交互数据舍去。

本申请实施中，有效数据指的是符合输入阅读识别模型所需的用户触控操作的数据，判断该交互数据是否为有效数据可以用于检查数据的正确有效性，避免错误的数据输入。

示例性的，判断是否为有效数据可以根据实际需要来设计，例如，可以通过数据的格式判断。若数据的格式满足输入阅读识别模型所需的用户触控操作的条件，则可以判定该数据为有效数据，进一步的，若判断为有效数据，则可以进行是否有效阅读的识别，若不为有效数据，则直接舍弃该数据。

S804、基于有效交互数据构建满足阅读识别模型输入要求的交互数据矩阵，并将该交互数据矩阵存入本地数据库1中，执行S805。

本申请实施例中，本地数据库1可以指的是存储于服务器的数据库，该本地数据库1可以用于存储数据采集设备发送的多条交互数据，也可以存储基于有效数据构建满足阅读识别模型输入要求的交互矩阵以及阅读标签。

示例性的，服务器可以获取存储数据采集设备发送的多条交互数据中的有效交互数据，进一步的，该服务器可以基于该有效交互数据构建满足阅读识别模型输入要求的交互矩阵，并将该满足阅读识别模型输入要求的交互矩阵存入服务器的本地数据库中。

S805、将该交互数据矩阵进行迭代训练，进一步的，根据定义的卷积神经网络层设计，生成初始网络模型(即初始的阅读识别模型)，该网络模型经过训练之后，可以生成预训练的网络模型(即更新后的阅读识别模型)。

需要说明的是，预训练网络模型是分发给终端设备的初始网络模型，该初始网络模型是判别用户是否有效阅读时第一次使用的网络模型，该预训练网络模型可以通过识别用户的有效交互数据进行增量训练，生成符合用户阅读习惯的网络模型。

S806、判断交互数据是否是引导类型的数据，若是，则执行S807，若否，则将该用户的触控操作产生的数据构建交互数据矩阵输入网络模型中，检测该用户是否进行有效阅读，进一步的，可以执行S810。

本申请实施例中，引导类型可以指的是用户按照终端设备或终端设备应用程序中的引导完成操作的类型，例如，在用户打开终端设备的一个应用程序时，该应用程序的显示页面显示有“阅读满10秒后进行下一步”的指引操作，则用户可以在该显示页面阅读满10秒后进行到下一页的显示界面，上述场景可以理解为有引导类型的操作场景。

引导类型的数据可以是指终端设备收集的用户按照终端设备或终端设备应用程序的指引完成触控操作产生的数据。例如，引导类型的数据可以为用户在某个应用程序的显示界面按照引导阅读满30秒，在该30秒的时间段内的触控操作产生的数据。

需要说明的是，网络模型可以包括预训练网络模型和更新后的网络模型，若第一次输入交互数据矩阵判断用户是否有效阅读时，则将该交互数据矩阵输入的是预训练网络模型，之后输入交互数据矩阵判断用户是否有效阅读使用的模型为更新后的网络模型。

S807、判断该交互数据是否为有效数据，若是有效数据，则执行S808，若不是有效数据，则将该交互数据舍去。

S808、基于有效交互数据构建满足阅读识别模型输入要求的交互数据矩阵，并将该交互矩阵存入本地数据库2中，执行S809。

本申请实施例中，本地数据库2可以指的是驻留于终端设备的数据库，该本地数据库2可以用于存储终端设备采集多条交互数据，也可以存储基于有效数据构建满足阅读识别模型输入要求的交互矩阵以及阅读标签。

可以理解的是，本地数据库2与本地数据库1的功能类似，但存储的位置和存储的数据不同。

S809、将该交互数据矩阵输入的网络模型中判别用户是否进行有效阅读，输出判别结果，结束执行流程。

S810、用户提出反驳，终端设备判别该反驳有效，则将该交互数据对应的标签更新为有效阅读标签，并将交互数据和更新后的标签存储于本地数据库2中，执行S811。

S811、将交互数据和更新后的标签输入网络模型中进行增量训练，生成更新后的网络模型(即阅读识别模型)。

需要说明的是，上述方法流程S806-S811是可更新的循环执行步骤，其中，网络模型可以根据用户的行为特征数据进行更新迭代，进一步的，将更新后的网络模型用于终端设备的使用。

因此，本申请实施例可以兼容各种阅读习惯和阅读能力不同的用户的个性化行为特征，允许用户对当前存在本地的模型网络预测结果进行反驳，从而可以修正本申请中的模型网络，达到持续自优化的效果，使用率高，易推广。

在前述实施例中，对本申请实施例提供的一种页面阅读识别方法进行了介绍，而为了实现上述本申请实施例提供的方法中的各功能，作为执行主体的电子设备可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。

例如，图9为本申请实施例提供的一种页面阅读识别装置的结构示意图，如图9所示，该装置900包括：获取模块901，构建模块902和识别模块903；其中，获取模块901，用于获取用户在阅读页面内容时产生的交互数据；构建模块902，用于根据交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，阅读识别模型为基于卷积神经网络构建的深度学习模型；识别模块903，用于根据交互矩阵和阅读识别模型，得到用于表示用于是否有效阅读的识别结果。

一种可能的实现方式中，获取模块901具体用于，获取用户在结束阅读后触发的跳转信息，跳转信息用于请求确认用户完成指定任务，和/或，用于请求跳转至下一页面；若识别结果为有效阅读，则确定用户完成指定任务，和/或，跳转至下一页面；若识别结果为非有效阅读，则确定用户未完成指定任务，和/或，禁止跳转至下一页面。

一种可能的实现方式中，识别模块903具体用于，若识别结果为非有效阅读，则向用户提供反驳界面，反驳界面用于供用户发起反驳；获取模块901具体还用于，获取用户在反驳界面输入的反驳信息，并对反驳信息进行校验；构建模块902具体用于，若校验通过，则将交互数据对应的标签更新为有效阅读标签，以基于交互数据和更新后的标签对阅读识别模型进行增量训练。

一种可能的实现方式中，构建模块902具体还用于，初始化用于供用户阅读的页面，并创建用于存储所述交互数据的第一结构体以及用于缓存数据的第二结构体；检测用户在页面上的交互数据，并将交互数据缓存于第二结构体；在检测到用户在结束阅读后触发的跳转信息后，生成对应的时间序列字符串；将时间序列字符串作为键，将第二结构体缓存的交互数据作为键值，共同存储于第一结构体。

一种可能的实现方式中，获取模块901具体还用于，采集用户在页面上的下述至少一项数据：垂直滑动的初始横坐标；垂直滑动的初始纵坐标；垂直滑动的初速度；垂直滑动的末速度；水平滑动的初始横坐标；水平滑动的初始纵坐标；水平滑动的初速度；水平滑动的末速度；交互起始时间；交互结束时间。

一种可能的实现方式中，构建模块902具体还用于，确定页面的显示长度和显示宽度；根据显示长度、显示宽度以及采集到的至少一项数据，构建四通道的二维交互矩阵；将四通道的二维交互矩阵的第三通道和第四通道相比，转化为三通道的二维交互矩阵；将三通道的二维交互矩阵进行矩阵缩放处理，得到满足阅读识别模型输入要求的交互矩阵。

一种可能的实现方式中，构建模块902具体还用于，计算二维交互矩阵中的用于表征垂直滑动坐标的第一元素对应的四通道的值分别为：垂直滑动的初始横坐标、垂直滑动的初始纵坐标、垂直滑动的初始横坐标与屏幕宽度的比值、垂直滑动的初始纵坐标与屏幕长度的比值；

计算二维交互矩阵中的用于表征水平滑动坐标的第二元素对应的四通道的值分别为：水平滑动的初始横坐标、水平滑动的初始纵坐标、水平滑动的初始横坐标与屏幕宽度的比值、水平滑动的初始纵坐标与屏幕长度的比值；

计算二维交互矩阵中的用于表征垂直滑动速度的第三元素对应的四通道的值分别为：垂直滑动的初始纵坐标、垂直滑动的初速度、垂直滑动的初始纵坐标与屏幕宽度的比值、垂直滑动的初速度与屏幕长度的比值；

计算二维交互矩阵中的用于表征水平滑动速度的第四元素对应的四通道的值分别为：水平滑动的初速度、水平滑动的末速度、水平滑动的初速度与屏幕宽度的比值、水平滑动的末速度与屏幕长度的比值；

计算二维交互矩阵中的用于表征起止时间的第五元素对应的四通道的值分别为：交互起始时间、交互结束时间、交互起始时间与屏幕宽度的比值、交互结束时间与屏幕长度的比值；

计算二维交互矩阵中的用于表征指定内容坐标的第六元素对应的四通道的值分别为：交互数据的横坐标，交互数据的纵坐标、指定内容与交互数据的横坐标经过计算得到第一关联关系、指定内容与交互数据的纵坐标经过计算得到第二关联关系。

一种可能的实现方式中，获取模块901具体还用于，获取服务器发送的阅读识别模型，阅读识别模型为服务器基于训练数据集对初始卷积神经网络模型进行训练后得到的。

可选的，一种页面阅读识别装置，包括：获取模块，用于获取训练数据集，训练数据集包括用户在阅读页面内容时产生的交互数据以及对应的标签，标签用于表示用户在所述页面的阅读行为是否为有效阅读；训练模块，用于根据训练数据集，对阅读识别模型进行训练；其中，阅读识别模型为基于卷积神经网络构建的深度学习模型；通信模块，用于将训练完成的阅读识别模型发送给终端设备，以使终端设备根据阅读识别模型对终端设备的用户的阅读行为进行识别。

例如，图10为本申请实施例提供的一种电子设备的结构示意图，如图10所示，该电子设备包括：存储器1001、处理器1002和接口电路1003；该装置还可以包括显示单元1004，其中，存储器1001、处理器1002、接口电路1003和显示单元1004可以通信，示例性的，存储器1001、处理器1002、接口电路1003和显示单元1004可以通过通信总线通信，从而实现本申请实施例提供的一种页面阅读识别方法。

本申请实施例还提供一种电子设备的结构示意图，如图11所示，图11为本申请实施例提供的另一种电子设备的结构示意图，该电子设备可以包括：至少一个处理器1101和存储器1102；该存储器1102存储计算机执行指令；该至少一个处理器1101执行该存储器1102存储的计算机执行指令，使得该至少一个处理器1101执行上述任一实施例所述的方法。

其中，存储器1102和处理器1101可以通过总线1103连接。

本申请实施例提供的页面阅读识别装置的具体实现原理和效果可以参见上述实施例对应的相关描述和效果，此处不做过多赘述。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序执行指令，计算机执行指令被处理器执行时用于实现计算机程序使得服务器执行如本申请前述实施例中任一的页面阅读识别方法。

本申请实施例还提供一种运行指令的芯片，该芯片用于执行如本申请前述任一实施例中由电子设备所执行的页面阅读识别方法。

本申请实施例还提供一种计算机程序产品，该程序产品包括计算机程序，该计算机程序存储在存储介质中，至少一个处理器可以从该存储介质读取该计算机程序，该至少一个处理器执行该计算机程序时可实现如本申请前述任一实施例中由电子设备所执行的页面阅读识别方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器执行本申请各个实施例所述方法的部分步骤。

应理解，上述处理器可以是中央处理单元(central processing unit，CPU)，还可以是其它通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速随机存取存储器(random access memory，RAM)，也可能还包括非不稳定的存储器(non-volatile memory，NVM)，例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

总线可以是工业标准体系结构(industry standard architecture，ISA)总线、外部设备互连(peripheral component interconnect，PCI)总线或扩展工业标准体系结构(extended industry standard architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(application specific integrated circuits，ASIC)中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

以上，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种页面阅读识别方法，其特征在于，应用于终端设备，所述方法包括：

获取用户在阅读页面内容时产生的交互数据；

根据所述交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，所述阅读识别模型为基于卷积神经网络构建的深度学习模型；

根据所述交互矩阵和所述阅读识别模型，得到用于表示用于是否有效阅读的识别结果；

获取用户在阅读页面内容时产生的交互数据，包括：

初始化用于供用户阅读的页面，并创建用于存储所述交互数据的第一结构体以及用于缓存数据的第二结构体；

检测所述用户在所述页面上的交互数据，并将交互数据缓存于所述第二结构体；

在检测到所述用户在结束阅读后触发的跳转信息后，生成对应的时间序列字符串；

将所述时间序列字符串作为键，将所述第二结构体缓存的交互数据作为键值，共同存储于所述第一结构体；

检测所述用户在所述页面上的交互数据，包括：

采集所述用户在所述页面上的下述至少一项数据：垂直滑动的初始横坐标；垂直滑动的初始纵坐标；垂直滑动的初速度；垂直滑动的末速度；水平滑动的初始横坐标；水平滑动的初始纵坐标；水平滑动的初速度；水平滑动的末速度；交互起始时间；交互结束时间；

根据所述交互数据，构建满足阅读识别模型输入要求的交互矩阵，包括：

确定所述页面的显示长度和显示宽度；

根据所述显示长度、显示宽度以及采集到的至少一项数据，构建四通道的二维交互矩阵；

将所述四通道的二维交互矩阵的第三通道和第四通道相比，转化为三通道的二维交互矩阵；

将所述三通道的二维交互矩阵进行矩阵缩放处理，得到满足阅读识别模型输入要求的交互矩阵。

2.根据权利要求1所述的方法，其特征在于，还包括：

获取用户在结束阅读后触发的跳转信息，所述跳转信息用于请求确认所述用户完成指定任务，和/或，用于请求跳转至下一页面；

若所述识别结果为有效阅读，则确定所述用户完成指定任务，和/或，跳转至下一页面；

若所述识别结果为非有效阅读，则确定所述用户未完成指定任务，和/或，禁止跳转至下一页面。

3.根据权利要求2所述的方法，其特征在于，还包括：

若所述识别结果为非有效阅读，则向所述用户提供反驳界面，所述反驳界面用于供用户发起反驳；

获取用户在所述反驳界面输入的反驳信息，并对所述反驳信息进行校验；

若校验通过，则将所述交互数据对应的标签更新为有效阅读标签，以基于所述交互数据和更新后的标签对所述阅读识别模型进行增量训练。

4.根据权利要求1所述的方法，其特征在于，根据所述显示长度、显示宽度以及采集到的至少一项数据，构建四通道的二维交互矩阵，包括：

计算所述二维交互矩阵中的用于表征垂直滑动坐标的第一元素对应的四通道的值分别为：垂直滑动的初始横坐标、垂直滑动的初始纵坐标、垂直滑动的初始横坐标与屏幕宽度的比值、垂直滑动的初始纵坐标与屏幕长度的比值；

计算所述二维交互矩阵中的用于表征起止时间的第五元素对应的四通道的值分别为：交互起始时间、交互结束时间、交互起始时间与屏幕宽度的比值、交互结束时间与屏幕长度的比值；

5.根据权利要求1-3任一项所述的方法，其特征在于，还包括：

获取服务器发送的所述阅读识别模型，所述阅读识别模型为所述服务器基于训练数据集对初始卷积神经网络模型进行训练后得到的。

6.一种页面阅读识别方法，其特征在于，应用于服务器，所述方法包括：

获取训练数据集，所述训练数据集包括用户在阅读页面内容时产生的第一交互数据以及对应的标签，所述标签用于表示所述用户在所述页面的阅读行为是否为有效阅读；

根据所述训练数据集，对阅读识别模型进行训练；其中，所述阅读识别模型为基于卷积神经网络构建的深度学习模型；

将训练完成的阅读识别模型发送给终端设备，以使终端设备根据所述阅读识别模型对所述终端设备的用户的阅读行为进行识别；

所述终端设备根据所述阅读识别模型对所述终端设备的用户的阅读行为进行识别，包括：

终端设备获取用户在阅读页面内容时产生的第二交互数据，根据所述第二交互数据，构建满足阅读识别模型输入要求的交互矩阵；根据所述交互矩阵和所述阅读识别模型，得到用于表示用于是否有效阅读的识别结果；

获取用户在阅读页面内容时产生的第二交互数据，包括：

初始化用于供用户阅读的页面，并创建用于存储所述第二交互数据的第一结构体以及用于缓存数据的第二结构体；

检测所述用户在所述页面上的第二交互数据，并将第二交互数据缓存于所述第二结构体；

将所述时间序列字符串作为键，将所述第二结构体缓存的第二交互数据作为键值，共同存储于所述第一结构体；

检测所述用户在所述页面上的第二交互数据，包括：

根据所述第二交互数据，构建满足阅读识别模型输入要求的交互矩阵，包括：

确定所述页面的显示长度和显示宽度；

7.一种页面阅读识别装置，其特征在于，包括：

获取模块，用于获取用户在阅读页面内容时产生的交互数据；

构建模块，用于根据所述交互数据，构建满足阅读识别模型输入要求的交互矩阵；其中，所述阅读识别模型为基于卷积神经网络构建的深度学习模型；

识别模块，用于根据所述交互矩阵和所述阅读识别模型，得到用于表示用于是否有效阅读的识别结果；

所述获取模块，具体用于：

所述获取模块用于检测所述用户在所述页面上的交互数据时，具体用于：

所述构建模块，具体用于：

确定所述页面的显示长度和显示宽度；

8.一种电子设备，其特征在于，包括：至少一个存储器和至少一个处理器，所述存储器，用于存储指令；

所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器执行如权利要求1-5中任一项所述的页面阅读识别方法。

9.一种电子设备，其特征在于，包括：至少一个存储器和至少一个处理器，所述存储器，用于存储指令；

所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器执行如权利要求6中所述的页面阅读识别方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-5任一项所述的页面阅读识别方法，或者，实现如权利要求6中所述的页面阅读识别方法。

11.一种计算机程序产品，其特征在于，包括计算机程序，该计算机程序被处理器执行时实现权利要求1-5中任一项所述的页面阅读识别方法，或者，实现如权利要求6中所述的页面阅读识别方法。