CN104200227B

CN104200227B - 一种用于人类认知模式识别的特征归一化方法及系统

Info

Publication number: CN104200227B
Application number: CN201410441415.2A
Authority: CN
Inventors: 栗觅; 吕胜富; 周宇; 钟宁
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2014-05-17
Filing date: 2014-09-01
Publication date: 2016-05-11
Anticipated expiration: 2034-09-01
Also published as: WO2015176417A1; CN104008393A; US20170220905A1; CN104200227A

Abstract

本发明提供了一种用于人类认知模式识别的特征归一化方法及系统，该方法通过将特征数据按用户分组以形成特征矩阵，基于预定的归一化函数对特征矩阵进行分组参数估计以得到每个分组对应的分组参数，能够基于分组参数对特征矩阵的每个分组分别构建归一化函数，并利用构建的归一化函数对特征矩阵进行分组归一化处理。本方法采用多个归一化函数对认知模式特征数据进行归一化处理，既保留了现有特征整体归一化方法的优点，又减少了特征数据内部分布尺度过大的问题，从而提高了分类正确率，并具有很强的鲁棒性。

Description

一种用于人类认知模式识别的特征归一化方法及系统

技术领域

本发明属于人类认知模式识别技术领域，特别涉及一种用于人类认知模式识别的特征归一化方法及系统。

背景技术

认知模式识别是指计算机通过分析人的外在行为特征达到对其内部心理模式的理解，特别是在人机交互中对于人的目的、意图进行识别和判断。使用模式识别技术对于人的不同认知模式的识别是近几年发展起来的研究热点，基于磁共振、脑波和眼动的认知模式识别方法研究的比较多。认知模式识别的流程包括以下步骤：特征提取、特征归一化、分类器训练和模式判别。

在认知模式识别处理中，特征提取及其归一化处理方法均对认知模式识别效果有着重要的影响。特征归一化的目的是将各种不同的特征转换到一个共同的值域范围，可以避免分类器训练时出现大数量级特征所占权重过大的问题，归一化处理后使得原本数量级较小但是差异性较大的特征能够在判别函数中起到相应的作用。

现有技术的特征归一化方法中，特征内部数据分布多样性问题导致不同认知模式下的特征数据互相重叠，可区分性大大降低，将会严重影响识别效果。而且该问题并不能通过特征整体归一化方法来解决，由于用户间特征数据分布存在个体差异，对特征进行特征整体归一化后仅仅解决了特征间的分布多样性问题，特征数据内部的差异仍然保留了下来，在训练分类器时就会产生影响，导致识别率不能有效地提高。

目前，适用于认知模式识别的特征提取技术已经日趋成熟，但是通用的特征归一化方法并不能满足认知模式识别的需求，因此亟需要一种能够用于认知模式识别的特征归一化方法。

发明内容

为了解决现有特征整体归一化方法导致识别准确率低的技术问题，本发明提供了一种分类准确率高、鲁棒性强的用于人类认知模式识别的特征归一化方法及系统。

根据本发明的一个方面，提供了一种用于人类认知模式识别的特征归一化方法，包括如下步骤：步骤S1，将特征数据按用户分组以形成特征矩阵；步骤S2，基于预定的归一化函数对特征矩阵进行分组参数估计，得到每个分组对应的分组参数；步骤S3，基于分组参数对特征矩阵的每个分组分别构建归一化函数；步骤S4，利用构建的归一化函数对特征矩阵进行分组归一化处理。

优选的，所述步骤S1包括：步骤S11，获取每个用户执行每个任务时的特征数据；步骤S12，将每个用户对应的特征数据构成特征矩阵的一行以构建特征矩阵。

优选的，所述步骤S2包括：步骤S21，设置归一化函数；步骤S22，基于特征矩阵每个分组的特征数据进行参数估计，以得到该分组对应的归一化函数的参数。

所述步骤S4中，把归一化前的每个分组的特征数据代入到该分组对应的归一化函数中，以得到该分组归一化后的特征数据。

其中，所述特征数据是每个用户执行多个任务类别的多个任务时的认知模式特征数据，所述任务类别至少包括观看图片和文本阅读。

其中，所述认知模式至少包括瞳孔直径、眼跳距离、注视时间、和注视次数中的一项或多项。

其中，所述归一化函数至少包括：Min-Max归一化函数、Z-score归一化函数、Median归一化函数或tanh归一化函数。

根据本发明的另一方面，提供了一种用于人类认知模式识别的特征归一化系统，所述系统包括特征矩阵形成单元1、分组参数估计单元2、函数构建单元3、数据处理单元4，所述特征矩阵形成单元1用于将特征数据按用户分组以形成特征矩阵；所述分组参数估计单元2连接到特征矩阵形成单元1，其基于预定的归一化函数对特征矩阵进行分组参数估计，得到每个分组对应的分组参数；所述函数构建单元3连接到分组参数估计单元2，其基于分组参数对特征矩阵的每个分组分别构建归一化函数；所述数据处理单元4连接到特征矩阵形成单元1和函数构建单元3，其利用构建的归一化函数对特征矩阵进行分组归一化处理。

优选的，所述特征矩阵形成单元1进一步包括：特征数据获取单元11，用于获取每个用户执行多种任务类型的多个任务时的特征数据并发送给特征矩阵构建单元12；和特征矩阵构建单元12，连接到特征数据获取单元11，其根据特征数据获取单元11获取的特征数据，将每个用户对应的特征数据构成特征矩阵T的一行以构建特征矩阵。

优选的，所述分组参数估计单元2进一步包括：函数设置单元21，用于设置归一化函数；和函数参数计算单元22，连接到函数设置单元21和前述特征矩阵形成单元1，其根据所述归一化函数的参数要求，基于特征矩阵中每个分组的特征数据计算得到该分组对应的归一化函数的参数。

如上所述，本发明提供了一种基于特征数据分组的特征归一化方法和系统，采用多个归一化函数对认知模式特征数据按用户分组以形成特征矩阵，对特征矩阵的每个分组分别构建归一化函数以进行分组归一化处理，既保留了原有特征整体归一化方法的优点，同时减少了特征数据内部分布尺度过大的问题，从而提高了分类正确率；同时，本发明提出的特征归一化方法具有很强的鲁棒性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为现有技术提供的整体特征归一化方法流程图；

图2显示了本发明的用于人类认知模式识别的特征归一化方法的流程图；

图3显示了本发明的特征归一化方法中形成特征矩阵的流程示意图；

图4显示了本发明的特征归一化方法中分组参数估计的流程示意图；

图5显示了本发明的用于人类认知模式识别的特征归一化系统的结构示意图；

图6显示了本发明优选实施例中特征矩阵形成单元的结构示意图；

图7显示了本发明优选实施例中分组参数估计单元的结构示意图；

图8显示了现有技术的特征整体归一化方法应用于瞳孔直径的正态拟合分布图；

图9显示了本发明的特征归一化方法应用于瞳孔直径的正态拟合分布图；

图10显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对瞳孔直径特征进行认知模式识别的识别率对比图；

图11显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对眼跳距离特征进行认知模式识别的识别率对比图；

图12显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对注视时间特征进行认知模式识别的识别率对比图；

图13显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对注视次数特征进行认知模式识别的识别率对比图；

图14显示了本发明的特征归一化方法与现有技术方法对组合特征识别率的对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1显示了现有技术中常用的特征归一化方法的示意图。

特征归一化的目的是将各种不同的特征转换到一个共同的值域范围，从而避免分类器训练时出现大数量级特征所占权重过大的问题，归一化处理后使得原本数量级较小但是差异性较大的特征能够在判别函数中起到相应的作用。除此之外，对每种特征归一化处理后，数据范围的变化使得分类算法可以较好的收敛，获得更好的识别效果。

如图1所示，现有技术的特征归一化方法包括下述步骤：

步骤S1’，选择需要使用的归一化函数；步骤S2’，对特征的所有特征数据进行归一化函数的参数估计；步骤S3’，对特征的所有特征数据使用相同参数的归一化函数进行整体转换。在这种归一化方法中，相同特征的数据采用相同参数的归一化函数进行整体变换，因此通常称为特征整体归一化方法。

这种特征整体归一化方法能够解决各个特征之间存在的分布多样性问题，研究表明，对于基于多种生物特征的用户识别系统，以及基于不同搜索引擎产生的文档相关度的文档检索系统，使用该方法均能有效提高识别性能。

但是，在实际操作中，使用认知模式识别的特征提取技术获取的特征通常具有以下特点：首先，各个特征的分布存在多样性，不同特征分布的位置和尺度具有差异；其次，为了得到人类认知的共性差异特征，需要同时提取多名用户的特征数据，比如基于视觉行为的认知模式识别，需要通过多名用户眼动特征中存在的共性差异来区分不同的认知模式。通常来说，不同用户的视觉行为特征是存在差异的，比如每名用户固有的瞳孔直径大小并不一致。因此，对于认知模式识别所提取的特征，即使是同一种特征，其内部的分布也是具有多样性的，即相同特征用户间的特征分布存在着个体差异。

对于这种相同特征用户间的特征分布存在个体差异的现象，现有技术的特征整体归一化方法在认知模式识别过程中的使用效果并不理想。具体来说，在使用该方法后，虽然统一了不同特征的值域范围，在一定程度上提高了认知模式的识别效果，但是并未解决每种特征内部存在分布多样性的问题。

图2显示了本发明的用于人类认知模式识别的特征归一化方法的流程图。

本发明的用于人类认知模式识别的特征归一化方法，主要用于对使用者执行视觉类任务时提取的大量视觉信息进行数据处理，使得经过数据处理的特征数据能够在后期的分类器训练和模式判别中被有效使用。

在本发明的实施例中，例如通过使用TobiiT120眼动装置(采样频率120Hz)采集30名用户进行20个A类任务(观看图片)和20个B类任务(文本阅读)认知时的视觉特征信息，然后提取这些用户的瞳孔直径、眼跳距离、注视时间和注视次数等体现视觉特征信息的特征数据。特征数据提取完成后通过特征归一化方法进行数据处理。

本发明的特征归一化方法包括四个阶段：特征数据分组、归一化函数选择和分组参数估计、分组归一化函数构建、特征分组归一化处理。在下面的优选实施例中，以瞳孔直径的特征数据为例描述特征分组归一化方法，同样的方法也适用于眼跳距离、注视时间和注视次数等其他特征数据，因此不再重复。

如图2所示，作为本发明优选实施例的用于人类认知模式识别的特征归一化方法包括如下步骤：

步骤S1，将特征数据按用户分组以形成特征矩阵。

将多个用户分别执行多个任务种类的多个任务的认知模式特征数据按用户数进行分组，每个用户分别执行多个任务种类的多个任务而获取的认知模式特征数据形成为一组，每个用户对应的一组特征数据构成特征矩阵T的一行，多个用户对应特征矩阵T的多个行，进而形成特征矩阵。这里，特征数据是指某个认知模式对应的特征数据，包括瞳孔直径、眼跳距离、注视时间及注视次数等视觉特征参数。

例如，将瞳孔直径特征T按用户分组，每一行为一组，30用户对应30个行，根据用户的数量最终得到30个分组。

步骤S2，基于预定的归一化函数对特征矩阵进行分组参数估计，得到每个分组对应的分组参数。

本步骤中，任选一个归一化函数，根据归一化函数的参数要求，对某个特征参数的特征矩阵的每个分组分别进行参数估计，得到每个分组对应的分组参数。

可见，本发明中，对每个用户使用的归一化函数的参数彼此独立，从而能够有效解决用户间的相同特征分布存在个体差异的现象。与此对应，现有技术中是将所有的特征数据使用相同参数的归一化函数进行整体转换，各个用户的相同特征的数据采用相同参数的归一化函数进行整体变换，因此不能解决上述缺陷。

步骤S3，基于分组参数对特征矩阵的每个分组分别构建归一化函数。

根据步骤S2中得到的分组参数，对多个用户组的特征数据分别构建归一化函数，即每个用户组(对应于特征矩阵的每一行)基于其对应的归一化函数的参数构建独立的归一化函数。

步骤S4，利用构建的归一化函数对特征矩阵进行分组归一化处理。

根据步骤S3中构建的多个归一化函数，对特征矩阵中的每个用户组的特征数据分别进行归一化处理，每个用户组的归一化处理使用该组对应的分组归一化函数进行。

如上所述，本发明的特征归一化方法采用多个归一化函数对认知模式特征数据进行归一化处理，既保留了现有技术的特征整体归一化方法的优点，同时减少了特征数据内部分布尺度过大的问题，从而提高了分类正确率；同时，本发明提出的特征归一化方法具有很强的鲁棒性。

图3显示了本发明的特征归一化方法中形成特征矩阵的流程示意图。

在本发明的示例性实施例中，将所述用户数设为m个，所述任务数分为A类、B类，所述A类任务的个数为n₁个，所述B类任务的任务数为n₂个，所述认知模式特征数据表示为特征T，例如包括瞳孔直径、眼跳距离、注视时间和注视次数。如图3所示，所述形成特征矩阵的步骤S1包括：

步骤S11，获取每个用户执行每个任务时的特征数据。

分别获取每个用户在执行每个任务时的特征数据，其中，特征数据TA_ij,i＝1,2,...,m；j＝1,2,...,n₁表示第i个用户执行A类任务的每个任务获取的特征数据，特征数据TB_ij,i＝1,2,...，m；j＝1,2,...,n₂表示第i个用户执行B类任务的每个任务获取的特征数据。

步骤S12，将每个用户对应的特征数据构成特征矩阵的一行以构建特征矩阵。

将特征数据按用户数分组，每个用户对应的数据构成特征矩阵的一行，m个用户对应m行，即分成m个特征数据组，特征矩阵的第i个分组为：

\begin{matrix} X_{i} = (\begin{matrix} {XA}_{i 1} & {XA}_{i 2} & . . . & {XA}_{{in}_{1}} & {XB}_{i 1} & {XB}_{i 2} & . . . & {XB}_{{in}_{2}} \end{matrix}) \\ i = 1,2, . . ., m \end{matrix} - - - (1)

这里，每个用户执行的不同类型的任务在矩阵列的方向上顺序排列。例如上述分组中，XA_ij表示用户i执行A类任务产生的特征数据，XB_ik表示用户i执行B类任务产生的特征数据。

上述特征数据可以是瞳孔直径、眼跳距离、注视时间及注视次数等，可以依次对这些特征数据分别进行分组。

然后，将各个用户组合并形成特征矩阵，从而构建出特征数据的特征矩阵

X = {({XA}_{ij}, {XB}_{ij})}_{m * (n_{1} + n_{2})},

具体如下：

X = [\begin{matrix} {XA}_{11} & {XA}_{12} & . . . & {XA}_{{1 n}_{1}} & {XB}_{11} & {XB}_{12} & . . . & {XB}_{{1 n}_{2}} \\ {XA}_{21} & {XA}_{22} & . . . & {XA}_{{2 n}_{1}} & {XB}_{21} & {XB}_{22} & . . . & {XB}_{{2 n}_{2}} \\ . . . . . . & . . . . . . \\ {XA}_{i 1} & {XA}_{i 2} & . . . & {XA}_{{in}_{1}} & {XB}_{i 1} & {XB}_{i 2} & . . . & {XB}_{{in}_{2}} \\ . . . . . . & . . . . . . \\ {XA}_{m 1} & {XA}_{m 2} & . . . & {XA}_{{mn}_{1}} & {XB}_{m 1} & {XB}_{m 2} & . . . & {XB}_{m n_{2}} \end{matrix}] - - - (2)

图4显示了本发明的特征归一化方法中分组参数估计的流程示意图。

如图4所示，本发明优选实施例的分组参数估计的步骤S2包括：

步骤S21，设置归一化函数。

预先选择一种归一化函数f(x)，该选定的归一化函数具有若干个函数执行参数，例如参数1，参数2，……，参数k共k个函数参数。本实施例以Z-score函数作为特征的归一化函数，也可以采用其他类型的归一化函数，例如包括Min-Max，Z-score，Median，tanh等函数。

步骤S22，基于特征矩阵每个分组的特征数据进行参数估计，以得到该分组对应的归一化函数的参数。

根据步骤S21所选归一化函数的参数要求，基于特征矩阵的每个分组(每行)中的特征数据分别进行参数估计，以得到该分组对应的归一化函数f(x)的参数。上述特征矩阵X中，共得到m个分组的参数，其中第i个分组X_i对应的归一化函数的k个参数为参数i₁，参数i₂，…，参数i_k，i＝1,2,...,m，这些参数都是基于第i个分组X_i的所有特征数据计算得到。

相应的，在所述步骤S3中，根据所述m组分组参数对m个用户组的认知模式特征数据分别构建归一化函数，所述特征X的m个分组中第i个分组X_i的归一化函数的参数使用对应的第i个分组的参数，即参数i₁，参数i₂，…，参数i_k，第个分组的归一化函数为f_i(x)由上述k个参数共同确定，其中i＝1,2,...,m。

相应的，所述步骤S4中，把归一化前的第i个分组的特征数据X_i代入第i个分组的归一化函数f_i(x)中，得到第i个分组归一化后的特征数据X′_i，具体采用如下公式：

\begin{matrix} X_{i}^{'} = X_{i} &RightArrow; f_{i} (x) \\ = ({XA}_{i 1}^{'} {XA}_{i 2}^{'} . . . {XA}_{{in}_{1}}^{'} {XB}_{i 1}^{'} {XB}_{i 2}^{'} . . . {XB}_{{in}_{2}}^{'}) \end{matrix}

XA'_ij＝XA_ij→f_i(x)

i＝1,2,...,m,j＝1,2,...,n₁

XB'_ij＝XB_ij→f_i(x)

i＝1,2,...,m,j＝1,2,...,n₂(3)

XA_ij是分组归一化前的特征X的A类特征数据，XB_ij是分组归一化前的特征X的B类特征数据；XA′_ij是分组归一化后的特征X的A类特征数据，XB′_ij是分组归一化后的特征X的B类特征数据。

下面，以瞳孔直径为例介绍本发明的一个具体实施例，该实施例同样适用于眼跳距离、注视时间和注视次数等其他特征数据的归一化处理。

在该实施例中，通过使用TobiiT120眼动装置(采样频率120Hz)采集了30名用户进行20个A类任务(观看图片)和20个B类任务(文本阅读)认知时的视觉信息，然后提取了瞳孔直径、眼跳距离、注视时间和注视次数四种特征。特征提取完成后将进入特征分组归一化流程，下面以瞳孔直径特征为例具体介绍本发明的特征分组归一化方法。

(1)瞳孔直径特征的特征数据分组

(1-1)计算30名用户在执行20个A类认知任务时每个任务的瞳孔直径数据TA_ij(i＝1,2,...,30,j＝1,2,...,20)；

(1-2)计算30名用户在执行20个B类认知任务时的每个任务的瞳孔直径数据TB_ij(i＝1,2,...,30,j＝1,2,...,20)；

(1-3)构造瞳孔直径特征的特征矩阵T，T＝(TA_ij,TB_ij)_30*40,如下：

T = [\begin{matrix} {TA}_{11} & {TA}_{12} & . . . & {TA}_{120} & {TB}_{11} & {TB}_{12} & . . . & {TB}_{120} \\ {TA}_{21} & {TA}_{22} & . . . & {TA}_{220} & {TB}_{21} & {TB}_{22} & . . . & {TB}_{220} \\ . . . . . . & . . . . . . \\ {TA}_{i 1} & {TA}_{i 2} & . . . & {TA}_{i 20} & {TB}_{i 1} & {TB}_{i 2} & . . . & {TB}_{i 20} \\ {TA}_{301} & {TA}_{302} & . . . & {TA}_{3020} & {TB}_{301} & {TB}_{302} & . . . & {TB}_{3020} \end{matrix}] - - - (4)

将瞳孔直径特征T按用户分组，每一行为一组，30用户对应30个行，根据用户的数量最终得到30个分组。

按上述方法依次对眼跳距离、注视时间及注视次数三种特征数据分别进行分组。

(2)分组参数估计

(2-1)任选一个归一化函数，本实施例以Z-score函数作为特征的归一化函数，Z-score函数含有两个参数，分别是均值Mean(X_i)和标准差std(X_i)，公式如下：

x′_ij＝(x_ij-Mean(X_i))/std(X_i)

x_ij∈(TA_ij,TB_ij)

x′_ij∈(TA′_ij,TB′_ij)

i＝1,2,...,30,j＝1,2,...，20(5)

其中，x′_ij为特征数据分组归一化后第i个分组X′_i的第j个归一化值，x_ij为特征数据归一化前的第i个分组X_i的第个值，参数Mean(X_i)为特征数据第i个分组X_i(包括该组所有的TA,TB数据)的均值，参数std(X_i)为特征数据第i个分组X_i(包括该组所有的TA,TB数据)的标准差。

(2-2)根据步骤(1)分组结果，以及步骤(2-1)的归一化函数的参数要求，对瞳孔直径特征T的每个分组分别进行参数估计，得到30个分组的统计参数，见下表：

(3)分组归一化函数构建

本例以Z-score函数作为特征的归一化函数，对瞳孔直径特征T的每个分组分别构建分组归一化函数，特征T的30个分组中第i(i＝1,2,...,30)个分组的归一化函数的参数使用对应的第i个分组的统计参数，不同的分组构建了不同的归一化函数，瞳孔直径特征T的30个分组共构建30个分组归一化函数，例如，式(4)中分组1的分组归一化函数为：

x′_1j＝(x_1j-3.585)/0.272

x_1j∈(TA_1j,TB_1j)

x′_1j∈(TA′_1j,TB′_1j)

j＝1,2,...,20(6)

x′_1j是第1分组归一化后的瞳孔直径特征的特征数据，x_1j是第1分组归一化前的瞳孔直径特征的特征数据，3.585是分组1的均值参数值，0.272是分组1的标准差参数值，TA_1j,TB_1j分别是瞳孔直径特征分组归一化前的A类和B类特征数据，TA′_1j,TB′_1j分别是瞳孔直径特征分组归一化后的A类和B类特征数据。

(4)分组归一化处理

使用步骤(3)构建的瞳孔直径特征分组归一化函数，对瞳孔直径特征的特征数据进行分组归一化处理，瞳孔直径特征T的30个分组中第i(i＝1,2,...,30)个分组的归一化处理使用对应的第i个分组的分组归一化函数进行归一化。依次完成所有30个特征数据分组的归一化处理，即可得到归一化后的瞳孔直径特征矩阵T'，如式(7)。然后按上述方法依次对眼跳距离、注视时间及注视次数三种特征进行归一化处理。

T^{'} = [\begin{matrix} {TA}_{11}^{'} & {TA}_{12}^{'} & . . . & {TA}_{120}^{'} & {TB}_{11}^{'} & {TB}_{12}^{'} & . . . & {TB}_{120}^{'} \\ {TA}_{21}^{'} & {TA}_{22}^{'} & . . . & {TA}_{220}^{'} & {TB}_{21}^{'} & {TB}_{22}^{'} & . . . & {TB}_{220}^{'} \\ . . . . . . & . . . . . . \\ {TA}_{i 1}^{'} & {TA}_{i 2}^{'} & . . . & {TA}_{i 20}^{'} & {TB}_{i 1}^{'} & {TB}_{i 2}^{'} & . . . & {TB}_{i 20}^{'} \\ . . . . . . & . . . . . . \\ {TA}_{301}^{'} & {TA}_{302}^{'} & . . . & {TA}_{3020}^{'} & {TB}_{301}^{'} & {TB}_{302}^{'} & . . . & {TB}_{3020}^{'} \end{matrix}] - - - (7)

图5显示了本发明的用于人类认知模式识别的特征归一化系统的结构示意图。

如图5所示，本发明的用于人类认知模式识别的特征归一化系统包括特征矩阵形成单元1、分组参数估计单元2、函数构建单元3、数据处理单元4。

特征矩阵形成单元1用于将特征数据按用户分组以形成特征矩阵。特征矩阵形成单元1的输入信号为特征数据，输出信号为特征矩阵。将多个用户分别执行多个任务种类的多个任务的认知模式特征数据按用户数进行分组，每个用户分别执行多个任务种类的多个任务而获取的认知模式特征数据形成为一组，每个用户对应的一组特征数据构成特征矩阵T的一行，多个用户对应特征矩阵T的多个行，进而形成特征矩阵。

分组参数估计单元2连接到特征矩阵形成单元1，其基于预定的归一化函数对特征矩阵进行分组参数估计，得到每个分组对应的分组参数。分组参数估计单元2接收特征矩阵形成单元1输出的特征矩阵，根据预先输入的归一化函数的参数要求，特征矩阵的每个分组分别进行参数估计，得到每个分组对应的分组参数(即归一化函数的所有参数)。分组参数估计单元2输出特征矩阵中每个分组对应的分组参数。

函数构建单元3连接到分组参数估计单元2，其基于分组参数对特征矩阵的每个分组分别构建归一化函数。函数构建单元3接收分组参数估计单元2输出的特征矩阵中每个分组对应的分组参数，基于这些参数对每个分组分别构建对应的归一化函数并输出。

数据处理单元4连接到特征矩阵形成单元1和函数构建单元3，其利用构建的归一化函数对特征矩阵进行分组归一化处理。数据处理单元4接收函数构建单元3输出的多个归一化函数和特征矩阵形成单元1输出的特征矩阵，对特征矩阵中的每个用户组的特征数据利用该用户组对应的归一化函数分别进行归一化处理，并输出归一化后的特征矩阵。

如上所述，本发明的特征归一化系统采用多个归一化函数对认知模式特征数据进行归一化处理，既保留了原有的特征整体归一化方法的优点，同时减少了特征数据内部分布尺度过大的问题，从而提高了分类正确率；同时，本发明提出的特征归一化方法具有很强的鲁棒性。

图6显示了本发明优选实施例中特征矩阵形成单元的结构示意图。

如图6所示，在本发明的优选实施例中，特征矩阵形成单元1包括特征数据获取单元11和特征矩阵构建单元12。

特征数据获取单元11用于获取每个用户执行多种任务类型的多个任务时的特征数据，并发送给特征矩阵构建单元12。

特征矩阵构建单元12连接到特征数据获取单元11，其根据特征数据获取单元11获取的特征数据，将每个用户对应的特征数据构成特征矩阵T的一行以构建特征矩阵。

图7显示了本发明优选实施例中分组参数估计单元的结构示意图。

如图7所示，在本发明的优选实施例中，分组参数估计单元2包括函数设置单元21和函数参数计算单元22。

函数设置单元21用于设置归一化函数f(x)，通常由使用者预先输入或设置归一化函数的类型。

函数参数计算单元22连接到函数设置单元21和前述特征矩阵形成单元1中的特征矩阵构建单元12，其根据函数设置单元21中设置的归一化函数的参数要求，基于特征矩阵中每个分组的特征数据计算得到该分组对应的归一化函数的参数。

图8-图9显示了本发明的特征归一化方法与现有技术的方法的正态拟合分布比较。其中，图8显示了现有技术的特征整体归一化方法的正态拟合分布图，图9显示了本发明的特征归一化方法的正态拟合分布图，特征数据均来源于本发明的上述具体实施例中的瞳孔直径数据。

从图中对比可知，使用原有的特征整体归一化方法时的A类和B类数据的两类数据的均值差是0.92，使用本发明提出的特征归一化方法时，A类和B类数据的均值差增大到1.63，后者是前者的1.77倍。两类数据的均值差越大，两类数据的分布距离越远，两类数据的重叠度越小，识别效果越好。

另外，从类内标准差来看，使用原有的特征整体归一化方法时A类数据的标准差是0.96，使用本发明方法时，A类数据的标准差降低到0.55，是使用原有的特征整体归一化方法时的0.57倍，使用本发明的B类数据的标准差是使用原有的特征整体归一化方法时的0.69倍。无论A类数据还是B类数据，使用本发明方法时，其类内标准差都减少了，标准差减少说明类内数据分布范围变小，同样可以减少两类数据间的重叠程度。总之，使用本发明方法，不但两类数据的特征分布间的距离变大，且每类数据分布的范围尺度减小，换句话说，特征内的分布多样性问题通过使用本发明的归一化方法得以解决，因此降低了数据的重叠程度。

图10-图13显示了本发明的特征归一化方法与现有技术的整体归一化方法的进行认知模式识别的识别率对比图。其中，图10，图11，图12，图13分别显示了针对瞳孔直径，眼跳距离，注视时间，注视次数分别采用本发明的特征归一化方法和现有技术的整体归一化方法进行认知模式识别的识别率对比图。

本实施例使用四种不同的归一化函数(Min-Max，Z-score，Median，tanh)对于四种不同特征：瞳孔直径，眼跳距离，注视时间，注视次数使用原有的特征整体归一化方法和本发明提出的特征归一化方法分别进行归一化后，使用支持向量机基于单个特征的模式分类的识别正确率，从图中对比结果来看，无论哪一个特征，无论使用哪种归一化函数，本发明提出的方法的识别正确率都高于现有技术的特征整体归一化方法。

图14是本发明优选实施例提供的基于不同的归一化函数(Min-Max，Z-score，Median，tanh)使用本发明提出的方法和使用现有技术的特征整体归一化方法分别对于各个特征数据进行归一化处理后，把这些特征进行组合(瞳孔直径+眼跳距离+注视时间+注视次数)后的模式分类的识别正确率，结果可以看出，无论使用哪种归一化函数，使用本发明方法的组合特征识别正确率都高于现有技术的特征整体归一化的组合特征识别正确率。本实施提供的基于单个特征的分类识别正确率数据和组合特征识别正确率数据说明,本发明提出的特征归一化方法既解决了特征内部数据分布多样性问题，也解决了特征之间数据分布多样性问题，保留了现有技术的特征整体归一化方法的优点。本发明提出的特征归一化方法与现有技术的特征整体归一化方法相比，具有很强的鲁棒性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

如上所述，本发明公开了一种用于人类认知模式识别的特征归一化方法，采用多个归一化函数对认知模式特征数据进行归一化处理，既保留了现有技术的特征整体归一化方法的优点，同时又减少了特征数据内部分布尺度过大的问题，从而提高了分类正确率；同时，本发明提出的特征归一化方法还具有很强的鲁棒性。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种用于人类认知模式识别的特征归一化方法，其特征在于，包括如下步骤：

步骤S1，将特征数据按用户分组以形成特征矩阵；

步骤S2，基于预定的归一化函数对特征矩阵进行分组参数估计，得到每个分组对应的分组参数；

步骤S3，基于分组参数对特征矩阵的每个分组分别构建归一化函数；

步骤S4，利用构建的归一化函数对特征矩阵进行分组归一化处理；

其中，所述特征数据是每个用户执行多个任务类别的多个任务时的认知模式特征数据,所述认知模式至少包括瞳孔直径、眼跳距离、注视时间和注视次数中的一项或多项。

2.如权利要求1所述的方法，其特征在于，所述步骤S1包括：

步骤S11，获取每个用户执行每个任务时的特征数据；

3.如权利要求1所述的方法，其特征在于，所述步骤S2包括：

步骤S21，设置归一化函数；

4.如权利要求1所述的方法，其特征在于，所述步骤S4中，把归一化前的每个分组的特征数据代入到该分组对应的归一化函数中，以得到该分组归一化后的特征数据。

5.如权利要求1所述的方法，其特征在于，所述任务类别至少包括观看图片和文本阅读。

6.如权利要求1至4任意一项所述的方法，其特征在于，所述归一化函数至少包括：Min-Max归一化函数、Z-score归一化函数、Median归一化函数或tanh归一化函数。

7.一种用于人类认知模式识别的特征归一化系统，所述系统包括特征矩阵形成单元(1)、分组参数估计单元(2)、函数构建单元(3)、数据处理单元(4)，其特征在于：

所述特征矩阵形成单元(1)用于将特征数据按用户分组以形成特征矩阵；

所述分组参数估计单元(2)连接到特征矩阵形成单元(1)，其基于预定的归一化函数对特征矩阵进行分组参数估计，得到每个分组对应的分组参数；

所述函数构建单元(3)连接到分组参数估计单元(2)，其基于分组参数对特征矩阵的每个分组分别构建归一化函数；以及

所述数据处理单元(4)连接到特征矩阵形成单元(1)和函数构建单元(3)，其利用构建的归一化函数对特征矩阵进行分组归一化处理；

其中，所述特征数据是每个用户执行多个任务类别的多个任务时的认知模式特征数据，所述认知模式至少包括瞳孔直径、眼跳距离、注视时间和注视次数中的一项或多项。

8.如权利要求7所述的系统，其特征在于，所述特征矩阵形成单元(1)进一步包括：

特征数据获取单元(11)，用于获取每个用户执行多个任务类别的多个任务时的特征数据并发送给特征矩阵构建单元(12)；和

特征矩阵构建单元(12)，连接到特征数据获取单元(11)，其根据特征数据获取单元(11)获取的特征数据，将每个用户对应的特征数据构成特征矩阵T的一行以构建特征矩阵。

9.如权利要求7所述的系统，其特征在于，所述分组参数估计单元(2)进一步包括：

函数设置单元(21)，用于设置归一化函数；和

函数参数计算单元(22)，连接到函数设置单元(21)和前述特征矩阵形成单元(1)，其根据所述归一化函数的参数要求，基于特征矩阵中每个分组的特征数据计算得到该分组对应的归一化函数的参数。