CN117198537B

CN117198537B - 任务完成数据分析方法、装置、电子设备和存储介质

Info

Publication number: CN117198537B
Application number: CN202311465100.7A
Authority: CN
Inventors: 傅云凤; 吴珊珊; 郭芷含; 熊晓夙; 杨子鹏
Original assignee: Beijing Wujiang Naozhi Technology Co ltd
Current assignee: Beijing Wujiang Naozhi Technology Co ltd
Priority date: 2023-11-07
Filing date: 2023-11-07
Publication date: 2024-03-26
Anticipated expiration: 2043-11-07
Also published as: CN117198537A

Abstract

本公开提供一种任务完成数据分析方法、装置、电子设备和存储介质，获取目标任务完成数据；对所述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组；根据预设规则，对所述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组；将所述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到所述目标用户患有神经发育障碍的概率。这样，通过标准化减少了年龄和性别对于参数分析的干扰，同时通过预测模型得到了用户患有神经发育障碍的概率，这样即使没有专业的医师，用户也可以得到有参考价值的神经发育障碍评估结果。

Description

任务完成数据分析方法、装置、电子设备和存储介质

技术领域

本公开的实施例涉及数据处理技术领域，具体涉及任务完成数据分析方法、装置、电子设备和存储介质。

背景技术

ADHD（Attention Deficit Hyperactivity Disorder，注意缺陷与多动障碍）是一种神经发育障碍，患者主要是在注意力持续、注意力集中以及任务持续性（完成任务的能力）方面出现问题。受影响的儿童也可能表现为过于活跃和冲动。患有 ADHD 的学龄前儿童可能存在交流问题，似乎有社会交往障碍。儿童达到上学年龄时，可能看起来注意力不集中。

现在，由于ADHD注意力评估要求医师具有较高的医疗知识，并且具有充足的治疗经验，由于此类的医师较少，评估大多依赖人工进行数据分析。

发明内容

本公开的实施例提出了任务完成数据分析方法、装置、电子设备和存储介质。

第一方面，本公开的实施例提供了一种任务完成数据分析方法，该方法包括：

获取目标任务完成数据，上述目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据；

对上述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组；

根据预设规则，对上述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，上述预设规则包括依据上述目标用户的性别和年龄设定的至少一条规则；

将上述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到上述目标用户患有神经发育障碍的概率。

在一些可选的实施方式中，在获取目标任务完成数据之前，上述方法还包括：

提供目标视觉刺激任务和目标听觉刺激任务，以及在提供上述目标视觉刺激任务的过程中获取上述目标用户完成上述目标视觉刺激任务的视觉子任务完成数据，在提供上述目标听觉刺激任务的过程中获取上述目标用户完成上述目标听觉刺激任务的听觉子任务完成数据；

基于上述视觉子任务完成数据和上述听觉子任务完成数据，得到目标任务完成数据。

在一些可选的实施方式中，上述提供目标视觉刺激任务，包括：

提供低频视觉刺激任务和高频视觉刺激任务，其中，上述低频视觉刺激任务和上述高频视觉刺激任务包括：至少两次随机呈现正向刺激或反向刺激，以便上述目标用户针对上述正向刺激执行响应操作，且针对上述反向刺激抑制执行响应操作，其中，在上述高频视觉刺激任务中呈现正向刺激的次数大于呈现反向刺激的次数，在上述低频视觉刺激任务中呈现正向刺激的次数小于呈现反向刺激的次数。

在一些可选的实施方式中，上述提供高频视觉刺激任务，包括：

获取包括第一数量个刺激出现信息序列的高频刺激出现信息序列集合，上述刺激出现信息包括刺激间隙时间和用于表征正向刺激或反向刺激的刺激类型，其中，每个刺激出现信息序列包括第二数量个刺激出现信息；

从上述高频刺激出现信息序列集合中随机选取任一高频刺激出现信息序列，作为当前高频刺激出现信息序列；

针对当前高频刺激出现信息序列执行高频刺激任务提供操作，直到针对上述高频刺激出现信息序列集合每个高频刺激出现信息序列均执行过高频刺激任务操作，上述高频刺激任务提供操作，包括：对于上述当前高频刺激出现信息序列中的每个高频刺激出现信息，按照相应高频刺激出现信息在上述当前高频刺激出现信息序列中的顺序，等待该高频刺激出现信息中的刺激间隙时间后，呈现该高频刺激出现信息中的刺激类型对应的刺激。

在一些可选的实施方式中，上述至少一个特征包括以下至少一项：正确率、误报率、连对时间均值、连对时间标准差、辨别力、平均反应时、正确率的一阶自相关系数、对连续出现的正向刺激的正确率和对连续出现的正向刺激的平均反应时。

在一些可选的实施方式中，上述根据预设规则，对上述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，包括：

根据上述目标用户的性别和年龄，在至少两组参考任务完成数据特征标准化信息组中确定上述目标用户对应的参考任务完成数据特征标准化信息组，参考任务完成数据特征标准化信息组包括至少一个任务完成数据特征的特征值均值和标准差；

按照所确定的参考任务完成数据特征标准化信息组中各个任务完成数据特征的特征值均值和标准差，对上述目标任务完成数据特征组中相应特征进行标准化处理，得到标准化目标任务完成数据特征组。

在一些可选的实施方式中，上述至少两组参考任务完成数据特征标准化信息组是通过如下标准化信息采集步骤得到的：

获取样本数据集，上述样本数据集包括多个训练用户完成上述目标视觉刺激任务和上述目标听觉刺激任务过程的任务完成样本数据；

对上述样本数据集中各任务完成样本数据进行特征提取，得到训练样本集，其中，训练样本为包括至少一个特征对应特征值的任务完成数据特征组；

根据各个训练用户的性别和年龄，对各训练样本进行分组；

针对每个分组，对该分组内的训练样本进行统计分析，得到该分组对应各任务完成数据特征的平均值和标准差。

在一些可选的实施方式中，上述神经发育障碍概率预测模型通过以下训练步骤预先训练得到：

获取样本数据集，上述样本数据集包括多个训练用户完成上述目标视觉刺激任务和上述目标听觉刺激任务过程的任务完成样本数据，上述多个训练用户包括至少一个患有神经发育障碍的患者用户和至少一个未患有神经发育障碍的普通用户；

根据预设规则，对各上述训练样本进行标准化处理，得到标准化训练样本集；

对上述标准化训练样本集进行上采样和/或下采样，得到均衡训练样本集，其中，上述均衡训练样本集中对应用户为患者用户的训练样本数量除以对应用户为普通用户的训练样本数量的比值在预设样本均衡比值范围内；

基于上述均衡训练样本集以及相应均衡训练样本对应的标注用户类型，对初始神经发育障碍概率预测模型进行训练，得到训练后的神经发育障碍概率预测模型。

在一些可选的实施方式中，在上述根据预设规则，对各上述训练样本进行标准化处理，得到标准化训练样本集之前，上述训练步骤还包括：

对于每个普通用户，响应于该普通用户对应的训练样本中存在满足预设训练样本过滤条件的训练样本，删除上述训练样本集中该普通用户对应的训练样本。

在一些可选的实施方式中，上述对上述标准化训练样本集进行上采样和/或下采样，得到均衡训练样本集，包括：

基于预设上采样算法，基于上述标准化训练样本集中对应用户为患者用户的标准化训练样本进行上采样，得到患者用户标准化训练样本集；

基于预设下采样算法，基于上述标准化训练样本集中对应用户为普通用户的标准化训练样本进行下采样，得到普通用户标准化训练样本集；

合并上述患者用户标准化训练样本集和上述普通用户标准化训练样本集，得到上述均衡训练样本集。

在一些可选的实施方式中，上述训练步骤还包括：

基于上述训练样本集和上述训练后的神经发育障碍概率预测模型，利用预设重要性排序算法，确定各上述任务完成数据特征的重要性排序。

第二方面，本公开的实施例提供了一种任务完成数据分析装置，该装置包括：

获取模块，用于获取目标任务完成数据，上述目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据；

特征提取模块，用于对上述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组；

标准化模块，用于根据预设规则，对上述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，上述预设规则包括依据上述目标用户的性别和年龄设定的至少一条规则；

预测模块，用于将上述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到上述目标用户患有神经发育障碍的概率。

第三方面，本公开的实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当上述一个或多个程序被上述一个或多个处理器执行时，使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面，本公开的实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。

本公开的实施例提供的任务完成数据分析方法、装置、电子设备和存储介质，通过首先获取目标任务完成数据，目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据；然后，对上述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组；接着，根据预设规则，对上述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组；最后，将上述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到上述目标用户患有神经发育障碍的概率。可实现包括但不限于以下技术效果：

第一，通过在任务中包括视觉刺激和听觉刺激两种任务，可丰富任务的刺激类型，即通过丰富数据采集类型，达到最终提高神经发育障碍概率预测准确率的效果。

第二，通过对特征数据按照年龄和性别进行标准化，减少了年龄和性别对于特征分析的干扰。

第三，通过利用预先训练的预测模型，给出用户患有神经发育障碍的概率，这样即使没有专业的医师，用户也可以得到有参考价值的神经发育障碍评估结果。并且，该预测结果不依赖于具体的医师的个人经验，可以给出相对标准统一的结果。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显。附图仅用于示出具体实施方式的目的，而并不认为是对本公开的限制。在附图中：

图1是本公开的一个实施例可以应用于其中的示例性系统架构图；

图2是根据本公开的任务完成数据分析方法的一个实施例的流程图；

图3是根据本公开的正向刺激的一个实施例的示意图；

图4是根据本公开的反向刺激的一个实施例的示意图；

图5是根据本公开的任务完成数据分析装置的一个实施例的结构示意图；

图6是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出了可以应用本公开的任务完成数据分析方法、装置、电子设备和存储介质的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如数据分析类应用、语音识别类应用、短视频社交类应用、音视频会议类应用、视频直播类应用、文档编辑类应用、输入法类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器（Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3）、MP4（Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4）播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的终端设备中。其可以实现成多个软件或软件模块（例如用来提供数据分析服务），也可以实现成单个软件或软件模块。在此不做具体限定。

在一些情况下，本公开所提供的任务完成数据分析方法可以由终端设备101、102、103执行，相应地，任务完成数据分析装置可以设置于终端设备101、102、103中。这时，系统架构100也可以不包括服务器105。

在一些情况下，本公开所提供的任务完成数据分析方法可以由终端设备101、102、103和服务器105共同执行，例如，“获取目标任务完成数据”的步骤可以由终端设备101、102、103执行，“对上述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组”等步骤可以由服务器105执行。本公开对此不做限定。相应地，任务完成数据分析装置也可以分别设置于终端设备101、102、103和服务器105中。

在一些情况下，本公开所提供的任务完成数据分析方法可以由服务器105执行，相应地，任务完成数据分析装置也可以设置于服务器105中，这时，系统架构100也可以不包括终端设备101、102、103。

需要说明的是，服务器105可以是硬件，也可以是软件。当服务器105为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器105为软件时，可以实现成多个软件或软件模块（例如用来提供分布式服务），也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本公开的任务完成数据分析方法的一个实施例的流程200，该任务完成数据分析方法包括以下步骤：

步骤201，获取目标任务完成数据。

目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据。目标用户为需要判断其患有神经发育障碍的概率的用户。任务完成数据可以包括用户针对刺激任务中的刺激做出反应的各种相关数据，例如以数据埋点方式记录用户操作的相关数据，意在将整个目标任务完成过程以数字化的形式复刻出来，主要是目标任务完成日志数据，按照预设的埋点框架进行各目标任务完成埋点，对用户的每次操作和每一次目标任务的状态更新操作都进行记录。

其中，目标视觉刺激任务可以是在任何具有显示功能的设备上展示正向刺激（需要用户响应）或反向刺激（需要用户抑制响应），例如图3所示的正向刺激的一个实施例的示意图，图4所示的反向刺激的一个实施例的示意图。即在屏幕的正中心的白色方框中，黑色的小方块可能出现在白色方框的上方或下方一定的时间。

出现在上方时，意味着正向刺激出现，需要用户在黑色小方块在上方出现的一定时间内，进行点击、滑动、按键等任何一种操作，否则算漏报。出现在下方时，意味着反向刺激，需要在黑色小方块在下方出现的一定时间内，用户抑制点击、滑动、按键等任何一种操作的欲望，否则算虚报。需要说明的是，目标视觉刺激任务中的正向刺激和反向刺激的种类可以依据实际需求自行设定，在此不做具体限制。

另外，目标听觉刺激任务可以是在任何具有声音播放功能的设备上展示正向刺激（需要用户响应）或反向刺激（需要用户抑制响应），例如在间隔一段时间，会发出一个声音（持续一定时间后消失），但是声音分为高音（例如C调低音So，G，392Hz）和低音（例如C调低音Do，C，262Hz）两种。在高音出现的一定时间内，意味着正向刺激出现，需要用户进行点击、滑动、按键等任何一种操作，否则算漏报。在低音出现的一定时间内，意味着反向刺激出现，需要用户抑制点击、滑动、按键等任何一种操作的欲望，否则算虚报。需要说明的是，目标听觉刺激任务中的正向刺激和反向刺激的种类可以依据实际需求自行设定，在此不做具体限制。

基于以上介绍可知，在获取目标任务完成数据之前，上述方法还包括以下步骤：

步骤2001：提供目标视觉刺激任务和目标听觉刺激任务，以及在提供上述目标视觉刺激任务的过程中获取上述目标用户完成上述目标视觉刺激任务的视觉子任务完成数据，在提供上述目标听觉刺激任务的过程中获取上述目标用户完成上述目标听觉刺激任务的听觉子任务完成数据。

步骤2002：基于上述视觉子任务完成数据和上述听觉子任务完成数据，得到目标任务完成数据。

作为一种可能的实施方式，上述步骤2001可以包括以下子步骤：

子步骤A：提供低频视觉刺激任务和高频视觉刺激任务。

其中，低频视觉刺激任务和上述高频视觉刺激任务包括：至少两次随机呈现正向刺激或反向刺激，以便上述目标用户针对上述正向刺激执行响应操作，且针对上述反向刺激抑制执行响应操作。

高频视觉刺激任务中呈现正向刺激的次数大于呈现反向刺激的次数；低频视觉刺激任务中呈现正向刺激的次数小于呈现反向刺激的次数。可以将一个视觉刺激任务分成两个阶段，一个阶段作为低频视觉刺激任务，另一阶段作为高频视觉刺激任务，二者的排列顺序不做具体限定。

作为优选，可以先执行低频视觉刺激任务，以此来主要判断目标用户的反应速度，观察其有没有走神；然后再执行高频视觉刺激任务，以此主要判断目标用户的虚报率，观察其抑制冲动的能力。例如，在视觉刺激任务的第一预设时长内，黑色正方形出现在下方的次数大于上方（例如出现在下方的概率为上方的3.5倍，即需要更低频点击）；在视觉刺激任务的第二预设时长内，黑色正方形出现在下方的次数小于上方（例如出现在上方的概率为下方的3.5倍，即需要更高频点击）。

与此类似，针对听觉刺激任务也可以相应提供低频听觉刺激任务和高频听觉刺激任务，在此不做赘述。

作为一种可能的实施方式，上述子步骤A可以包括以下子步骤：

子步骤A1：获取包括第一数量个刺激出现信息序列的高频刺激出现信息序列集合。

刺激出现信息可以包括刺激间隙时间和刺激类型。其中，刺激间隙时间可以在预设的固定值中抽取，也可以在预设时间范围中随机生成。刺激类型用于表征出现的是正向刺激，还是反向刺激。每个刺激出现信息序列包括第二数量个刺激出现信息。

例如，高频刺激出现信息序列集合中任意两个刺激出现信息序列为[96ms正向刺激,120ms正向刺激,144ms反向刺激,120ms反向刺激,144ms正向刺激,96ms正向刺激,144ms正向刺激,96ms正向刺激,120ms正向刺激,120ms反向刺激,144ms正向刺激]；[120ms正向刺激,144ms正向刺激,96ms正向刺激,144ms正向刺激,96ms正向刺激,120ms反向刺激,96ms反向刺激,120ms正向刺激,144ms正向刺激,144ms反向刺激,96ms正向刺激]，以此类推，可以形成此形式的第一数量个高频刺激出现信息序列集合。每个序列中的刺激出现信息的个数为第二数量，如上例第二数量为11。

子步骤A2：从上述高频刺激出现信息序列集合中随机选取任一高频刺激出现信息序列，作为当前高频刺激出现信息序列。

例如，从上述举例的高频刺激出现信息序列集合中随机选取一个高频刺激出现信息序列，作为当前高频刺激出现信息序列，即[120ms正向刺激,144ms正向刺激,96ms正向刺激,144ms正向刺激,96ms正向刺激,120ms反向刺激,96ms反向刺激,120ms正向刺激,144ms正向刺激,144ms反向刺激,96ms正向刺激]。

子步骤A3：针对当前高频刺激出现信息序列执行高频刺激任务提供操作，直到针对上述高频刺激出现信息序列集合每个高频刺激出现信息序列均执行过高频刺激任务操作。

其中，高频刺激任务提供操作，包括：对于上述当前高频刺激出现信息序列中的每个高频刺激出现信息，按照相应高频刺激出现信息在上述当前高频刺激出现信息序列中的顺序，等待该高频刺激出现信息中的刺激间隙时间后，呈现该高频刺激出现信息中的刺激类型对应的刺激。

例如，针对子步骤20112选中的当前高频刺激出现信息序列，先等待120ms呈现一个正向刺激，再等待144ms呈现一个正向刺激，再等待96ms呈现一个正向刺激，再等待144ms呈现一个正向刺激，再等待96ms呈现一个正向刺激，再等待120ms呈现一个反向刺激，再等待96ms呈现一个反向刺激，再等待120ms呈现一个正向刺激，再等待144ms呈现一个正向刺激，再等待144ms呈现一个反向刺激，最后等待96ms呈现一个正向刺激。然后需要重新选择当前高频刺激出现信息序列，执行以上操作，直至高频刺激出现信息序列集合中所有高频刺激出现信息序列都作为当前高频刺激出现信息序列执行过以上操作。

以上子步骤A1至子步骤A3，也可以被适应性地应用于提供低频视觉刺激任务、提供高频听觉刺激任务、提供低频听觉刺激任务等各种刺激任务的生成，在此不做赘述。

采用上述子步骤A1至子步骤A3的可选实施方式，可以实现：

在预设的序列中进行刺激任务的指示生成，可以达成伪随机的效果，防止目标用户根据既往操作对刺激的出现产生预测，提高任务的有效性和准确性。

步骤202，对上述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组。

针对以上目标任务完成数据，可以进行特征提取，得到用于表征目标任务完成数据的至少一个特征的取值。其中，上述至少一个特征可以包括以下至少一项：正确率、误报率、连对时间均值、连对时间标准差、辨别力、平均反应时、正确率的一阶自相关系数、对连续出现的正向刺激的正确率和对连续出现的正向刺激的平均反应时。其中，正确率、误报率、连对时间均值和连对时间标准差可以按照如下公式进行计算得到：

；

其中，t1为第一次连续针对刺激（包括正向刺激和反向刺激）做出正确反应的时长，t2为第二次连续针对刺激（包括正向刺激和反向刺激）做出正确反应的时长，tn为第n次连续针对刺激（包括正向刺激和反向刺激）做出正确反应的时长，n为一共发生连对的次数。连对时间均值可以用来反应目标用户的专注时间。例如，目标用户做错了1次反应后，连续做对3次反应，又做错了1次反应，则连续做对3次反应的时间就为一次连续针对刺激（包括正向刺激和反向刺激）做出正确反应的时间。

辨别力和平均反应时可以按照如下公式进行计算得到：

；

其中，正确率（z-score）为按照标准正态分布计算后的标准化正确率，误报率（z-score）为按照正态分布计算后的标准化误报率。

；

其中，a1为第一次正向刺激出现到用户做出反应之间的时间，a2为第二次正向刺激出现到用户做出反应之间的时间，ai为第i次正向刺激出现到用户做出反应之间的时间，i为用户针对正向刺激做出反应的次数。

正确率的一阶自相关系数可以体现用户是否具备正确率一直高、或正确率一直低的特点，即整个过程前后之间是否具有某种规律。可以将整个操作数据按照相同的时间分为几个部分（例如每10分钟的操作数据作为一个部分），分别计算其正确率，然后利用一阶自相关函数的计算公式，计算以上几个部分正确率的一阶自相关函数。

；

其中，b1为第一个连续出现的正向刺激出现到用户针对该正向刺激做出反应之间的时长，b2为第二个连续出现的正向刺激出现到用户针对该正向刺激做出反应之间的时长，bm为第m个连续出现的正向刺激出现到用户针对该正向刺激做出反应之间的时长，m为。需要说明的是，连续出现的正向刺激指的是该刺激的前一个刺激也是正向刺激的正向刺激。

作为一种可能的实施方式，可以根据刺激出现的时间、频率对目标任务完成数据进行划分，分为多个部分进行正确率、误报率、连对时间均值、连对时间标准差、辨别力、平均反应时的计算。

步骤203，根据预设规则，对上述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组。

由于不同年龄和性别在特征上的表现有群体上的差距存在，能达到的程度不同，因此不能在不同年龄段、不同性别上进行直接的比较。需要按照性别、年龄划分不同的常模，针对不同性别、年龄的常模样本进行特征的标准化处理，然后再进行后续步骤。例如，针对6-12岁每个年龄，分别对男性和女性建立一个常模，一共14个常模。其中，预设规则包括预设的、依据上述目标用户的性别和年龄设定的至少一条规则。

作为一种可能的实施方式，上述步骤203可以包括以下子步骤：

子步骤2031：根据上述目标用户的性别和年龄，在至少两组参考任务完成数据特征标准化信息组中确定上述目标用户对应的参考任务完成数据特征标准化信息组。

根据目标用户的性别和年龄，在多个标准化信息组中找到目标用户的性别和年龄对应的标准化信息组。以此为准进行标准化，可以降低年龄和性别导致的差异性。其中，由于特征包括至少一个，所以参考任务完成数据特征标准化信息组，包括至少一个任务完成数据特征的特征值均值和标准差。

作为一种可能的实施方式，至少两组参考任务完成数据特征标准化信息组是通过如下标准化信息采集步骤得到的：

步骤B1：获取样本数据集。

样本数据集包括多个训练用户完成上述目标视觉刺激任务和上述目标听觉刺激任务过程的任务完成样本数据。训练用户是为标准化提供数据基础的用户，包括普通用户和确诊患有神经发育障碍的用户。

步骤B2：对上述样本数据集中各任务完成样本数据进行特征提取，得到训练样本集。

对任务完成样本数据进行特征提取的过程与步骤202类似，在此不做赘述。其中，训练样本为包括至少一个特征对应特征值的任务完成数据特征组。

步骤B3：根据各个训练用户的性别和年龄，对各训练样本进行分组。

根据训练用户的性别和年龄，将训练样本划分至不同的分组中，每个分组中包括若干个训练样本。例如，分组包括7岁女孩、7岁男孩、8岁女孩、8岁男孩、9岁女孩、9岁男孩；则将对应年龄和性别的训练用户的训练样本放到对应的分组中。

步骤B4：针对每个分组，对该分组内的训练样本进行统计分析，得到该分组对应各任务完成数据特征的平均值和标准差。

因为训练样本是任务完成数据特征组，包括多个特征的取值，则需要对每个分组中的每个特征对应的取值进行统计分析，得到每个特征对应的平均值和标准差，作为后续该分组对应的目标用户进行标准化的参数。例如，7岁女孩的分组中包括训练样本1：正确率80%、连对时间均值30ms；训练样本2：正确率84%、连对时间均值24ms；则7岁女孩分组的平均值和标准差包括正确率的平均值82%、连对时间均值的平均值27ms、正确率的标准差2、连对时间均值的标准差3。每个分组中的特征都以此类推。

子步骤2032：按照所确定的参考任务完成数据特征标准化信息组中各个任务完成数据特征的特征值均值和标准差，对上述目标任务完成数据特征组中相应特征进行标准化处理，得到标准化目标任务完成数据特征组。

具体的标准化过程可以利用Z-score标准化法（标准差标准化法）的方法，也可以利用其他标准化方法，在此不作限定。

步骤204，将上述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到上述目标用户患有神经发育障碍的概率。

如果想要增加模型的可解释性，神经发育障碍概率预测模型可以选择树模型；如果想要增加模型的泛化能力，神经发育障碍概率预测模型可以选择集成模型-随机森林(Random Forest，RF)；也可以选择其他可以输出概率的神经网络模型，在此不做限定。

具体的，上述神经发育障碍概率预测模型通过以下训练步骤预先训练得到：

步骤C1：获取样本数据集。

样本数据集与步骤B1包括的任务完成样本数据相同，样本数据集包括多个训练用户完成上述目标视觉刺激任务和上述目标听觉刺激任务过程的任务完成样本数据。训练用户是为标准化提供数据基础的用户，包括至少一个患有神经发育障碍的患者用户和至少一个未患有神经发育障碍的普通用户。

步骤C2：对上述样本数据集中各任务完成样本数据进行特征提取，得到训练样本集。

步骤C3：根据预设规则，对各上述训练样本进行标准化处理，得到标准化训练样本集。

对上述训练样本进行标准化处理的过程与步骤203类似，只是将目标任务完成数据特征组换为训练样本，具体过程在此不做赘述。

步骤C4：对上述标准化训练样本集进行上采样和/或下采样，得到均衡训练样本集。

由于标准化训练样本集中，患有神经发育障碍的患者用户数量远远小于未患有神经发育障碍的普通用户，所以会存在样本不均衡的问题，需要进行平衡处理。经过上采样增加少数样本，通过下采样减少多数样本，最终使得均衡训练样本集中对应用户为患者用户的训练样本数量除以对应用户为普通用户的训练样本数量的比值在预设样本均衡比值范围内。作为一种可能的实施方式，上采样和/或下采样的结果是患者用户的训练样本数量除以对应用户为普通用户的训练样本数量的比值为1:1。

上述步骤C4包括以下子步骤：

子步骤C41：基于预设上采样算法，基于上述标准化训练样本集中对应用户为患者用户的标准化训练样本进行上采样，得到患者用户标准化训练样本集。

作为一种可能的实施方式，可以采用BorderlineSMOTE算法对标准化训练样本集中的训练样本进行划分，将标准化训练样本集中的训练样本分为3类，分别为Safe、Danger和Noise。上采样的时候仅对 Danger的训练样本进行上采样。在样本的m邻域内包含多数类样本的数目大于等于（阈值m - 1）/ 2 且小于阈值m - 1，就是Danger样本。作为优选，本实施例可以对上述BorderlineSMOTE算法进行优化，将Danger样本定义为：在样本的m邻域内包含多数类样本的数目大于等于0且小于阈值m - 1。这样使得上采样的边界拓宽，条件变得宽松，上采样的样本数量更多。

子步骤C42：基于预设下采样算法，基于上述标准化训练样本集中对应用户为普通用户的标准化训练样本进行下采样，得到普通用户标准化训练样本集。

基于子步骤C41的分类，对采用与SMOTE算法相同的k近邻插值的方法生成N个新样本。遍历danger样本，增加边界样本和safe样本的数量，基于该样本邻域内的正样本进行K近邻插值，直到总共生成N个新样本为止。

子步骤C43：合并上述患者用户标准化训练样本集和上述普通用户标准化训练样本集，得到上述均衡训练样本集。

步骤C5：基于均衡训练样本集以及相应均衡训练样本对应的标注用户类型，对初始神经发育障碍概率预测模型进行训练，得到训练后的神经发育障碍概率预测模型。

具体的，可以将均衡训练样本集输入初始神经发育障碍概率预测模型，得到其输出的神经发育障碍概率预测结果；依据此结果和均衡训练样本对应的标注用户类型，计算初始神经发育障碍概率预测模型的损失函数；在基于损失函数，对初始神经发育障碍概率预测模型的参数进行调整，提高其预测能力。

作为一种可能的实施方式，由于收集的训练样本是从学校或其他公共场所采集的，没有严格的标注其是否患有神经发育障碍，也可能混杂很多没有认真作答的用户的样本数据。因此，可以依据作答情况，制定预设规则，对普通用户对应的训练样本进行过滤，提升模型预测的准确性。即在一些可选的实施方式中，在上述根据预设规则，对各上述训练样本进行标准化处理，得到标准化训练样本集之前，上述训练步骤还包括：

步骤C6：对于每个普通用户，响应于该普通用户对应的训练样本中存在满足预设训练样本过滤条件的训练样本，删除上述训练样本集中该训练用户对应的训练样本。

作为示例，可以将每个样本数据中用户完成上述目标视觉刺激任务和上述目标听觉刺激任务过程的任务完成样本数据分为多段，判断每个分段的正确率、虚报率、目标反应时等参数。如果正确率一直很低，或虚报率一直很高，或正确率、目标反应时的取值与均值相差很大，都可以将其样本进行删除。具体的预设规则可以依据需求限定，在此不做限制。

作为一种可能的实施方式，在以上步骤之后，上述训练步骤还可以包括：

作为一种可能的实施方式，可以选择受多重共线性干扰小的算法(PermutationImportance) ，基于上述训练样本集和上述训练后的神经发育障碍概率预测模型，确定任务完成数据特征的重要性排序。

如此，可以提高神经发育障碍概率预测模型的可解释性，进而协助后续采集用户行为过程数据和表现结果数据，提取数据特征，剔除相关性非常高的特征（例如相关性值高于0.7），挖掘影响神经发育障碍的关键指标，可以排除特征多重共线性问题的干扰。

本公开的上述实施例提供的任务完成数据分析方法，通过标准化减少了年龄和性别对于参数分析的干扰，同时通过预测模型得到了用户患有神经发育障碍的概率，这样即使没有专业的医师，用户也可以得到有参考价值的神经发育障碍评估结果。进行不均衡样本处理可以减少患病样本过少造成的样本不均衡；提供刺激任务时，从预设序列中选取，形成伪随机，降低用户对刺激出现的预测；最后，提取数据特征可以排除多重共线性问题的干扰。

进一步参考图5，作为对上述各图所示方法的实现，本公开提供了一种任务完成数据分析装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的任务完成数据分析装置500包括：获取模块501、特征提取模块502、标准化模块503和预测模块504。其中：

获取模块501，用于获取目标任务完成数据，上述目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据；

特征提取模块502，用于对上述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组；

标准化模块503，用于根据预设规则，对上述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，上述预设规则包括依据上述目标用户的性别和年龄设定的至少一条规则；

预测模块504，用于将上述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到上述目标用户患有神经发育障碍的概率。

在本实施例中，任务完成数据分析装置500的获取模块501、特征提取模块502、标准化模块503和预测模块504的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202、步骤203和步骤204的相关说明，在此不再赘述。

在一些可选的实施方式中，上述任务完成数据分析装置500还可以包括：

任务提供模块5001，用于提供目标视觉刺激任务和目标听觉刺激任务，以及在提供上述目标视觉刺激任务的过程中获取上述目标用户完成上述目标视觉刺激任务的视觉子任务完成数据，在提供上述目标听觉刺激任务的过程中获取上述目标用户完成上述目标听觉刺激任务的听觉子任务完成数据；

任务预测模块5002，用于基于上述视觉子任务完成数据和上述听觉子任务完成数据，得到目标任务完成数据。

在一些可选的实施方式中，上述任务提供模块5001，可以包括：

高低频区分单元，用于提供低频视觉刺激任务和高频视觉刺激任务，其中，上述低频视觉刺激任务和上述高频视觉刺激任务包括：至少两次随机呈现正向刺激或反向刺激，以便上述目标用户针对上述正向刺激执行响应操作，且针对上述反向刺激抑制执行响应操作，其中，在上述高频视觉刺激任务中呈现正向刺激的次数大于呈现反向刺激的次数，在上述低频视觉刺激任务中呈现正向刺激的次数小于呈现反向刺激的次数。

在一些可选的实施方式中，上述高低频区分单元，可以包括：

序列获取组件，用于获取包括第一数量个刺激出现信息序列的高频刺激出现信息序列集合，上述刺激出现信息包括刺激间隙时间和用于表征正向刺激或反向刺激的刺激类型，其中，每个刺激出现信息序列包括第二数量个刺激出现信息；

序列抽取组件，用于从上述高频刺激出现信息序列集合中随机选取任一高频刺激出现信息序列，作为当前高频刺激出现信息序列；

刺激提供组件，用于针对当前高频刺激出现信息序列执行高频刺激任务提供操作，直到针对上述高频刺激出现信息序列集合每个高频刺激出现信息序列均执行过高频刺激任务操作，上述高频刺激任务提供操作，包括：对于上述当前高频刺激出现信息序列中的每个高频刺激出现信息，按照相应高频刺激出现信息在上述当前高频刺激出现信息序列中的顺序，等待该高频刺激出现信息中的刺激间隙时间后，呈现该高频刺激出现信息中的刺激类型对应的刺激。

在一些可选的实施方式中，上述特征可以包括以下至少一项：正确率、误报率、连对时间均值、连对时间标准差、辨别力、平均反应时、正确率的一阶自相关系数、对连续出现的正向刺激的正确率和对连续出现的正向刺激的平均反应时。

在一些可选的实施方式中，上述标准化模块503，可以包括：

分组求值单元，用于根据上述目标用户的性别和年龄，在至少两组参考任务完成数据特征标准化信息组中确定上述目标用户对应的参考任务完成数据特征标准化信息组，参考任务完成数据特征标准化信息组包括至少一个任务完成数据特征的特征值均值和标准差；

分组标准化单元，用于按照所确定的参考任务完成数据特征标准化信息组中各个任务完成数据特征的特征值均值和标准差，对上述目标任务完成数据特征组中相应特征进行标准化处理，得到标准化目标任务完成数据特征组。

在一些可选的实施方式中，上述至少两组参考任务完成数据特征标准化信息组可以是通过如下标准化信息采集步骤得到的：

根据各个训练用户的性别和年龄，对各训练样本进行分组；

在一些可选的实施方式中，上述神经发育障碍概率预测模型可以通过以下训练步骤预先训练得到：

基于均衡训练样本集以及相应均衡训练样本对应的标注用户类型，对初始神经发育障碍概率预测模型进行训练，得到训练后的神经发育障碍概率预测模型。

在一些可选的实施方式中，在上述根据预设规则，对各上述训练样本进行标准化处理，得到标准化训练样本集之前，上述训练步骤还可以包括：

对于每个普通用户，响应于该普通用户对应的训练样本中存在满足预设训练样本过滤条件的训练样本，删除上述训练样本集中该训练用户对应的训练样本。

在一些可选的实施方式中，上述对上述标准化训练样本集进行上采样和/或下采样，得到均衡训练样本集，可以包括：

在一些可选的实施方式中，上述训练步骤还包括：

需要说明的是，本公开的实施例提供的任务完成数据分析装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的说明，在此不再赘述。

下面参考图6，其示出了适于用来实现本公开的电子设备的计算机系统600的结构示意图。图6示出的计算机系统600仅仅是一个示例，不应对本公开的实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600可以包括处理装置（例如中央处理器、图形处理器等）601，其可以根据存储在只读存储器（ROM）602中的程序或者从存储装置608加载到随机访问存储器（RAM）603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有计算机系统600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出（I/O）接口605也连接至总线604。

通常，以下装置可以连接至I/O接口605：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置606；包括例如液晶显示器（LCD）、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置608；以及通信装置609。通信装置609可以允许计算机系统600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备的计算机系统600，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置608被安装，或者从ROM 602被安装。在该计算机程序被处理装置601执行时，执行本公开的实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF（射频）等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备实现如图2所示的实施例及其可选实施方式示出的任务完成数据分析方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开的实施例中所涉及的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取模块还可以被描述为“获取目标任务完成数据的模块”。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的（但不限于）具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种任务完成数据分析方法，其特征在于，包括：

提供目标视觉刺激任务和目标听觉刺激任务，以及在提供所述目标视觉刺激任务的过程中获取目标用户完成所述目标视觉刺激任务的视觉子任务完成数据，在提供所述目标听觉刺激任务的过程中获取所述目标用户完成所述目标听觉刺激任务的听觉子任务完成数据；

基于所述视觉子任务完成数据和所述听觉子任务完成数据，得到目标任务完成数据；

获取目标任务完成数据，所述目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据；

对所述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组，所述至少一个特征包括以下至少一项：正确率、误报率、连对时间均值、连对时间标准差、辨别力、平均反应时、正确率的一阶自相关系数、对连续出现的正向刺激的正确率和对连续出现的正向刺激的平均反应时；

根据预设规则，对所述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，所述预设规则包括依据所述目标用户的性别和年龄设定的至少一条规则；

将所述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到所述目标用户患有神经发育障碍的概率；

其中，所述提供目标视觉刺激任务，包括：

提供低频视觉刺激任务和高频视觉刺激任务，其中，所述低频视觉刺激任务和所述高频视觉刺激任务包括：至少两次随机呈现正向刺激或反向刺激，以便所述目标用户针对所述正向刺激执行响应操作，且针对所述反向刺激抑制执行响应操作，其中，在所述高频视觉刺激任务中呈现正向刺激的次数大于呈现反向刺激的次数，在所述低频视觉刺激任务中呈现正向刺激的次数小于呈现反向刺激的次数；以及

提供所述高频视觉刺激任务，包括：

获取包括第一数量个刺激出现信息序列的高频刺激出现信息序列集合，所述刺激出现信息包括刺激间隙时间和用于表征正向刺激或反向刺激的刺激类型，其中，每个刺激出现信息序列包括第二数量个刺激出现信息；

从所述高频刺激出现信息序列集合中随机选取任一高频刺激出现信息序列，作为当前高频刺激出现信息序列；

针对当前高频刺激出现信息序列执行高频刺激任务提供操作，直到针对所述高频刺激出现信息序列集合每个高频刺激出现信息序列均执行过高频刺激任务操作，所述高频刺激任务提供操作，包括：对于所述当前高频刺激出现信息序列中的每个高频刺激出现信息，按照相应高频刺激出现信息在所述当前高频刺激出现信息序列中的顺序，等待该高频刺激出现信息中的刺激间隙时间后，呈现该高频刺激出现信息中的刺激类型对应的刺激；以及

所述神经发育障碍概率预测模型通过以下训练步骤预先训练得到：

获取样本数据集，所述样本数据集包括多个训练用户至少一次完成所述目标视觉刺激任务和所述目标听觉刺激任务过程的任务完成数据，所述多个训练用户包括至少一个患有神经发育障碍的患者用户和至少一个未患有神经发育障碍的普通用户；

对所述样本数据集中各任务完成样本数据进行特征提取，得到训练样本集，其中，训练样本为包括至少一个特征对应特征值的任务完成数据特征组；

根据所述预设规则，对各所述训练样本进行标准化处理，得到标准化训练样本集；

对所述标准化训练样本集进行上采样和/或下采样，得到均衡训练样本集，其中，所述均衡训练样本集中对应用户为患者用户的训练样本数量除以对应用户为普通用户的训练样本数量的比值在预设样本均衡比值范围内；

基于所述均衡训练样本集以及相应均衡训练样本对应的标注用户类型，对初始神经发育障碍概率预测模型进行训练，得到训练后的神经发育障碍概率预测模型；

基于所述训练样本集和所述训练后的神经发育障碍概率预测模型，利用PermutationImportance算法，确定各所述任务完成数据特征的重要性排序；以及

所述对所述标准化训练样本集进行上采样和/或下采样，得到均衡训练样本集，包括：

采用改进后的Borderline SMOTE算法对所述标准化训练样本集中对应用户为患者用户的标准化训练样本进行上采样，得到患者用户标准化训练样本集，其中，所述改进后的Borderline SMOTE算法中的Danger样本为m邻域内包含多数类样本的数目大于等于0且小于阈值m - 1的标准化训练样本；

基于预设下采样算法，基于所述标准化训练样本集中对应用户为普通用户的标准化训练样本进行下采样，得到普通用户标准化训练样本集；

合并所述患者用户标准化训练样本集和所述普通用户标准化训练样本集，得到所述均衡训练样本集。

2.根据权利要求1所述的方法，其特征在于，所述根据预设规则，对所述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，包括：

根据所述目标用户的性别和年龄，在至少两组参考任务完成数据特征标准化信息组中确定所述目标用户对应的参考任务完成数据特征标准化信息组，参考任务完成数据特征标准化信息组包括至少一个任务完成数据特征的特征值均值和标准差；

按照所确定的参考任务完成数据特征标准化信息组中各个任务完成数据特征的特征值均值和标准差，对所述目标任务完成数据特征组中相应特征进行标准化处理，得到标准化目标任务完成数据特征组。

3.根据权利要求2所述的方法，其特征在于，所述至少两组参考任务完成数据特征标准化信息组是通过如下标准化信息采集步骤得到的：

获取样本数据集，所述样本数据集包括多个训练用户完成所述目标视觉刺激任务和所述目标听觉刺激任务过程的任务完成样本数据；

根据各个训练用户的性别和年龄，对各训练样本进行分组；

4.根据权利要求1所述的方法，其特征在于，在所述根据预设规则，对各所述训练样本进行标准化处理，得到标准化训练样本集之前，所述训练步骤还包括：

对于每个普通用户，响应于该普通用户对应的训练样本中存在满足预设训练样本过滤条件的训练样本，删除所述训练样本集中该普通用户对应的训练样本。

5.一种任务完成数据分析装置，其特征在于，包括：

任务提供模块，用于提供目标视觉刺激任务和目标听觉刺激任务，以及在提供所述目标视觉刺激任务的过程中获取目标用户完成所述目标视觉刺激任务的视觉子任务完成数据，在提供所述目标听觉刺激任务的过程中获取所述目标用户完成所述目标听觉刺激任务的听觉子任务完成数据；

任务预测模块，用于基于所述视觉子任务完成数据和所述听觉子任务完成数据，得到目标任务完成数据；

获取模块，用于获取目标任务完成数据，所述目标任务完成数据包括目标用户完成目标视觉刺激任务和目标听觉刺激任务过程的任务完成数据；

特征提取模块，用于对所述目标任务完成数据进行特征提取，得到包括至少一个特征对应特征值的目标任务完成数据特征组，所述至少一个特征包括以下至少一项：正确率、误报率、连对时间均值、连对时间标准差、辨别力、平均反应时、正确率的一阶自相关系数、对连续出现的正向刺激的正确率和对连续出现的正向刺激的平均反应时；

标准化模块，用于根据预设规则，对所述目标任务完成数据特征组进行标准化处理，得到标准化目标任务完成数据特征组，所述预设规则包括依据所述目标用户的性别和年龄设定的至少一条规则；

预测模块，用于将所述标准化目标任务完成数据特征组输入预先训练好的神经发育障碍概率预测模型，得到所述目标用户患有神经发育障碍的概率；

其中，所述任务提供模块，包括：

高低频区分单元，用于提供低频视觉刺激任务和高频视觉刺激任务，其中，所述低频视觉刺激任务和所述高频视觉刺激任务包括：至少两次随机呈现正向刺激或反向刺激，以便所述目标用户针对所述正向刺激执行响应操作，且针对所述反向刺激抑制执行响应操作，其中，在所述高频视觉刺激任务中呈现正向刺激的次数大于呈现反向刺激的次数，在所述低频视觉刺激任务中呈现正向刺激的次数小于呈现反向刺激的次数；以及

所述高低频区分单元，包括：

序列获取组件，用于获取包括第一数量个刺激出现信息序列的高频刺激出现信息序列集合，所述刺激出现信息包括刺激间隙时间和用于表征正向刺激或反向刺激的刺激类型，其中，每个刺激出现信息序列包括第二数量个刺激出现信息；

序列抽取组件，用于从所述高频刺激出现信息序列集合中随机选取任一高频刺激出现信息序列，作为当前高频刺激出现信息序列；

刺激提供组件，用于针对当前高频刺激出现信息序列执行高频刺激任务提供操作，直到针对所述高频刺激出现信息序列集合每个高频刺激出现信息序列均执行过高频刺激任务操作，所述高频刺激任务提供操作，包括：对于所述当前高频刺激出现信息序列中的每个高频刺激出现信息，按照相应高频刺激出现信息在所述当前高频刺激出现信息序列中的顺序，等待该高频刺激出现信息中的刺激间隙时间后，呈现该高频刺激出现信息中的刺激类型对应的刺激；以及

6.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。

7.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，其中，所述计算机程序被一个或多个处理器执行时实现如权利要求1-4中任一所述的方法。