CN112836747A - 眼动数据的离群处理方法及装置、计算机设备、存储介质 - Google Patents

眼动数据的离群处理方法及装置、计算机设备、存储介质 Download PDF

Info

Publication number
CN112836747A
CN112836747A CN202110145910.9A CN202110145910A CN112836747A CN 112836747 A CN112836747 A CN 112836747A CN 202110145910 A CN202110145910 A CN 202110145910A CN 112836747 A CN112836747 A CN 112836747A
Authority
CN
China
Prior art keywords
outlier
eye movement
movement data
data
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110145910.9A
Other languages
English (en)
Inventor
梁佩鹏
秦林婵
张恒瑞
王军凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Normal University
Original Assignee
Capital Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Normal University filed Critical Capital Normal University
Priority to CN202110145910.9A priority Critical patent/CN112836747A/zh
Publication of CN112836747A publication Critical patent/CN112836747A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种眼动数据的离群处理方法及装置、计算机设备、存储介质。该眼动数据的离群处理方法包括:获取眼动数据集,该眼动数据集包括多个属于同一类型的眼动数据;对眼动数据集进行聚类,得到眼动数据集对应的非离群数据集和可疑离群数据集,该可疑离群数据集包括可疑离群数据;基于离群点检测算法和可疑离群数据集,确定眼动数据集中的离群眼动数据和非离群眼动数据;剔除眼动数据集中的离群眼动数据。本发明提高了眼动数据的离群处理过程的适用性和确定离群数据结果的准确性。

Description

眼动数据的离群处理方法及装置、计算机设备、存储介质
技术领域
本发明实施例涉及数据挖掘技术,尤其涉及一种眼动数据的离群处理方法及装置、计算机设备、存储介质。
背景技术
眼动数据的质量是影响眼动数据分析的关键因素之一。在实验过程中,被试操作不当、设备或环境中的随机噪声或者其他数据采集和处理过程中的偏差均会导致获取到的眼动数据集中出现一些偏离大部分正常数据的离群数据,该离群数据会影响眼动数据的分析结果,因此确定并剔除眼动数据集中的离群数据至关重要。
相关技术中,计算机确定出眼动数据集中的眼动数据的平均值和标准差,之后根据用户设置的标准差系数n,将处于[平均值-nσ,平均值+nσ]之外的眼动数据确定为离群数据。
但是该确定离群数据的方式仅适用于数据按照某种概率分布的数据集。因此当眼动数据集中的数据的分布规律未知或者没有按照某种概率分布时,通过相关技术确定眼动数据集中的离群数据的结果误差较大,从而影响眼动数据的分析结果。
发明内容
本发明提供一种眼动数据的离群处理方法及装置、计算机设备、存储介质,以实现提高眼动数据的离群处理过程的适用性和确定离群数据结果的准确性。
第一方面,本发明实施例提供了一种眼动数据的离群处理方法,包括:
获取眼动数据集,所述眼动数据集包括多个属于同一类型的眼动数据;
对所述眼动数据集进行聚类,得到所述眼动数据集对应的非离群数据集和可疑离群数据集,所述可疑离群数据集包括可疑离群数据;
基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据;
剔除所述眼动数据集中的离群眼动数据。
可选地,所述眼动数据集包括多个被试集,每个所述被试集包括多个眼动数据;
所述对所述眼动数据集进行聚类,得到所述眼动数据集对应的非离群数据集和可疑离群数据集,包括:
对每个所述被试集分别进行聚类,得到每个所述被试集分别对应的非离群数据集和可疑离群数据集;
所述基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据,包括:
对于每个所述被试集,基于所述离群点检测算法和当前被试集对应的可疑离群数据集,确定所述当前被试集中的离群眼动数据和非离群眼动数据。
可选地,所述眼动数据集包括多个被试集,每个所述被试集包括多个眼动数据;
所述对所述眼动数据集进行聚类,包括:
确定每个所述被试集的眼动数据均值,得到眼动数据均值集;
对所述眼动数据均值集进行聚类,所述可疑离群数据为所述眼动数据均值集中的眼动数据均值;
所述基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据,包括:
利用所述离群点检测算法,确定所述可疑离群数据集中的离群均值和非离群均值;
将所述离群均值对应的被试集中的眼动数据确定为所述离群眼动数据。
可选地,在确定每个所述被试集的眼动数据均值,得到眼动数据均值集之前,还包括:
对每个所述被试集分别进行聚类,得到每个所述被试集分别对应的初始非离群数据集和初始可疑离群数据集;
对于每个所述被试集,基于所述离群点检测算法和当前被试集对应的初始可疑离群数据集,确定所述当前被试集中的初始离群眼动数据;
剔除每个所述被试集中的初始离群眼动数据,得到更新后的被试集;
所述确定每个所述被试集的眼动数据均值,包括:
确定每个所述更新后的被试集的眼动数据均值。
可选地,所述离群点检测算法包括:基于密度的离群点检测算法、基于距离的离群点检测算法、基于聚类的离群点检测算法以及基于相似孤立系数的离群点检测算法OMAAOF中的至少一个。
可选地,所述离群点检测算法包括OMAAOF,所述非离群数据集包括多个簇,所述基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据,包括:
确定每个所述簇的平均属性值;
基于每个所述簇的平均属性值,计算每个所述簇的簇相似半径;
确定所述可疑离群数据集中的任一可疑离群数据到各个所述簇的相似权重距离;
计算所述多个簇的簇相似半径之和,与所述任一可疑离群数据到各个所述簇的相似权重距离之和的比值;
在基于所述比值和相似连通性确定所述任一可疑离群数据不具备相似连通性质时,将所述任一可疑离群数据对应的离群眼动数据确定为所述离群眼动数据。
可选地,在基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据之后,还包括:
根据目标数据范围对所述眼动数据集中的离群眼动数据进行筛选,将处于所述目标数据范围之内的离群眼动数据变更为所述非离群眼动数据。
第二方面,本发明实施例提供了一种眼动数据的离群处理装置,包括:
获取模块,用于获取眼动数据集,所述眼动数据集包括多个属于同一类型的眼动数据;
第一聚类模块,用于对所述眼动数据集进行聚类,得到所述眼动数据集对应的非离群数据集和可疑离群数据集,所述可疑离群数据集包括可疑离群数据;
第一确定模块,用于基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据;
剔除模块,用于剔除所述眼动数据集中的离群眼动数据。
可选地,所述眼动数据集包括多个被试集,每个所述被试集包括多个眼动数据;
所述第一聚类模块,用于:
对每个所述被试集分别进行聚类,得到每个所述被试集分别对应的非离群数据集和可疑离群数据集;
所述第一确定模块,用于:
对于每个所述被试集,基于所述离群点检测算法和当前被试集对应的可疑离群数据集,确定所述当前被试集中的离群眼动数据和非离群眼动数据。
可选地,所述眼动数据集包括多个被试集,每个所述被试集包括多个眼动数据;
所述第一聚类模块,用于:
确定每个所述被试集的眼动数据均值,得到眼动数据均值集;
对所述眼动数据均值集进行聚类,所述可疑离群数据为所述眼动数据均值集中的眼动数据均值;
所述第一确定模块,用于:
利用所述离群点检测算法,确定所述可疑离群数据集中的离群均值和非离群均值;
将所述离群均值对应的被试集中的眼动数据确定为所述离群眼动数据。
可选地,所述眼动数据的离群处理装置还包括:
第二聚类模块,用于对每个所述被试集分别进行聚类,得到每个所述被试集分别对应的初始非离群数据集和初始可疑离群数据集;
第二确定模块,用于对于每个所述被试集,基于所述离群点检测算法和当前被试集对应的初始可疑离群数据集,确定所述当前被试集中的初始离群眼动数据;
第二剔除模块,用于剔除每个所述被试集中的初始离群眼动数据,得到更新后的被试集;
所述第一聚类模块302,用于:
确定每个所述更新后的被试集的眼动数据均值。
可选地,所述离群点检测算法包括:基于密度的离群点检测算法、基于距离的离群点检测算法、基于聚类的离群点检测算法以及基于相似孤立系数的离群点检测算法OMAAOF中的至少一个。
可选地,所述离群点检测算法包括OMAAOF,所述非离群数据集包括多个簇,所述第一确定模块,用于:
确定每个所述簇的平均属性值;
基于每个所述簇的平均属性值,计算每个所述簇的簇相似半径;
确定所述可疑离群数据集中的任一可疑离群数据到各个所述簇的相似权重距离;
计算所述多个簇的簇相似半径之和,与所述任一可疑离群数据到各个所述簇的相似权重距离之和的比值;
在基于所述比值和相似连通性确定所述任一可疑离群数据不具备相似连通性质时,将所述任一可疑离群数据对应的离群眼动数据确定为所述离群眼动数据。
可选地,所述眼动数据的离群处理装置还包括:
筛选模块,用于根据目标数据范围对所述眼动数据集中的离群眼动数据进行筛选,将处于所述目标数据范围之内的离群眼动数据变更为所述非离群眼动数据。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面任一所述的眼动数据的离群处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一所述的眼动数据的离群处理方法。
本发明通过对获取到的眼动数据集进行聚类得到可疑离群数据集,之后基于离群点检测算法和该可疑离群数据集,确定眼动数据集中的离群眼动数据并剔除该离群眼动数据,由于该聚类过程和离群点检测算法适用于各种分布情况的数据,因此解决了相关技术中确定眼动数据集中的离群数据的结果误差较大的问题,实现了提高确定离群数据结果的准确性。
附图说明
图1是本发明实施例提供的一种眼动数据的离群处理方法的流程图;
图2是本发明实施例提供的另一种眼动数据的离群处理方法的流程图;
图3是本发明实施例提供的一种眼动数据的离群处理装置的框图;
图4是本发明实施例提供的另一种眼动数据的离群处理装置的框图;
图5是本发明实施例提供的再一种眼动数据的离群处理装置的框图;
图6是本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
眼动数据的质量是影响眼动数据分析的关键因素之一。在实验过程中,被试操作不当、设备或环境中的随机噪声或者其他数据采集和处理过程中的偏差均会导致获取到的眼动数据集中出现一些偏离大部分正常数据的离群数据。离群数据与大部分正常数据的差异较大,其可能产生于完全不同的机制。而眼动数据集中的离群数据会影响眼动数据的分析结果,因此确定并剔除眼动数据集中的离群数据至关重要。
相关技术中检测眼动数据集中的离群数据的过程包括:计算机确定眼动数据集中的眼动数据的平均值和标准差,之后根据用户设置的标准差系数n,将处于[平均值-nσ,平均值+nσ]之外的眼动数据确定为离群数据。
但是该确定离群数据的方式仅适用于数据按照某种概率分布的数据集。因此当眼动数据集中的数据的分布规律未知或者没有按照某种概率分布时,通过相关技术确定眼动数据集中的离群数据的结果误差较大,从而影响眼动数据的分析结果。此外,该标准差系数n由用户主观设置,导致确定离群数据的结果缺乏客观性。
请参考图1,图1为本发明实施例提供的一种眼动数据的离群处理方法的流程图,该方法可以由眼动数据的离群处理装置执行,其中该装置可由软件和/或硬件实现,一般可集成在计算机设备中,该方法可以适用于剔除眼动数据集中的离群眼动数据的应用场景。该方法可以包括:
步骤110、获取眼动数据集,该眼动数据集包括多个属于同一类型的眼动数据。
可选地,该眼动数据可以为注视时间、注视次数、眼跳时间、眼跳次数、眼跳距离或者回视次数等所有眼动相关定量数据。
步骤120、对眼动数据集进行聚类,得到眼动数据集对应的非离群数据集和可疑离群数据集,该可疑离群数据集包括可疑离群数据。
可选地,可以利用聚类算法对眼动数据集进行聚类。示例地,该聚类算法可以包括基于密度的聚类算法、基于划分的聚类算法、基于层次的聚类算法、基于网络的聚类算法和基于模型的聚类算法中的至少一种,本发明实施例对此不做限定。
步骤130、基于离群点检测算法和可疑离群数据集,确定眼动数据集中的离群眼动数据和非离群眼动数据。
步骤140、剔除眼动数据集中的离群眼动数据。
眼动数据集中的离群眼动数据对于眼动数据的分析是无效的,进一步还可能影响眼动数据分析结果,剔除眼动数据集中的离群眼动数据,能够提高眼动数据集的的数据质量。
综上所述,本发明实施例提供的眼动数据的离群处理方法,计算机设备能够对获取到的眼动数据集进行聚类得到可疑离群数据集,之后基于离群点检测算法和该可疑离群数据集,确定眼动数据集中的离群眼动数据并剔除该离群眼动数据。该聚类过程和离群点检测算法适用于各种分布情况的数据,因此提高了确定离群数据结果的准确性。
在上述技术方案的基础上,本发明实施例提供了另一种眼动数据的离群处理方法,请参考图2,图2为本发明实施例提供的另一种眼动数据的离群处理方法的流程图,该方法可以由眼动数据的离群处理装置来执行,该方法可以包括:
步骤210、获取眼动数据集,该眼动数据集包括多个属于同一类型的眼动数据。
眼动数据集可以存储在眼动数据的离群处理装置中,例如存储在眼动数据的离群处理装置的本地磁盘,眼动数据的离群处理装置从本地磁盘读取该眼动数据集,并将该眼动数据集存入后台数据库中。
步骤220、对眼动数据集进行聚类,得到眼动数据集对应的非离群数据集和可疑离群数据集,该可疑离群数据集包括可疑离群数据。
该眼动数据集可以包括多个被试集,每个被试集对应一个被试,每个被试集包括多个眼动数据。在本发明实施例中,眼动数据的离群处理装置可以对每个被试集分别进行聚类,再分别确定每个被试集中的离群眼动数据;或者对各个被试集的均值集进行聚类,再确定各个被试集中的离群被试集;或者先分别确定并剔除每个被试集中的初始离群眼动数据,再确定剔除初始离群眼动数据后的各个被试集中的离群被试集。
在第一种实现方式中,眼动数据的离群处理装置对每个被试集分别进行聚类,再分别确定每个被试集中的离群眼动数据。此时在该步骤220中,眼动数据的离群处理装置需要对每个被试集分别进行聚类,得到每个被试集分别对应的非离群数据集和可疑离群数据集,此时非离群数据集和可疑离群数据集中都包括被试集中的眼动数据,眼动数据的离群处理装置可以保存该非离群数据集中的眼动数据。
可选地,可以利用基于密度的聚类算法(Density-Based Spatial Clustering ofApplications with Noise,DBSCAN)对每个被试集进行聚类。示例地,对于每个被试集,眼动数据的离群处理装置可以计算出邻域半径(Epsilon,Eps)。之后以任一眼动数据分别为圆心,以Eps为半径做圆,并将该圆内的眼动数据的数量确定为该任一眼动数据的密度。之后再确定密度阈值(Minor Points,MinPts),若该任一眼动数据的圆内数据数量小于MinPts,则称该任一眼动数据为低密度数据;若该任一眼动数据的圆内数据数量大于或等于MinPts,则称该任一眼动数据为高密度数据。当一个眼动数据位于另一个高密度数据的圆内时,将该眼动数据与该高密度数据连接起来,从而得到多个簇,该多个簇组成非离群数据集;而不在任何高密度数据的圆内的低密度数据组成可疑离群数据集。
在第二种实现方式中,眼动数据的离群处理装置对各个被试集的均值集进行聚类,再确定各个被试集中的离群被试集。此时在该步骤220中,眼动数据的离群处理装置需要确定每个被试集的眼动数据均值,得到眼动数据均值集。之后对该眼动数据均值集进行聚类,此时可疑离群数据集和非离群数据集都包括眼动数据均值集中的眼动数据均值,眼动数据的离群处理装置可以保存眼动数据均值处于非离群数据集的被试集中的眼动数据。
示例地,假设该眼动数据集包括A1~A7这7个被试集,A1~A7这7个被试集分别对应的眼动数据均值为
Figure BDA0002930270410000111
得到眼动数据均值集为
Figure BDA0002930270410000112
Figure BDA0002930270410000113
眼动数据的离群处理装置对该眼动数据均值集进行聚类后,得到可疑离群数据集为
Figure BDA0002930270410000121
非离群数据集为
Figure BDA0002930270410000122
Figure BDA0002930270410000123
眼动数据的离群处理装置可以保存
Figure BDA0002930270410000124
对应的被试集A1中的眼动数据、
Figure BDA0002930270410000125
对应的被试集A2中的眼动数据、
Figure BDA0002930270410000126
对应的被试集A4中的眼动数据、
Figure BDA0002930270410000127
对应的被试集A6中的眼动数据以及
Figure BDA0002930270410000128
对应的被试集A7中的眼动数据。
可选地,可以利用基于密度的聚类算法对眼动数据均值集进行聚类,该聚类过程可以参考前述第一种实现方式中的对每个被试集进行聚类的过程,本发明实施例在此不做赘述。
在第三种实现方式中,眼动数据的离群处理装置先分别确定并剔除每个被试集中的初始离群眼动数据,再确定剔除初始离群数据后的各个被试集中的离群被试集。此时在该步骤220中,眼动数据的离群处理装置需要先对每个被试集分别进行聚类,得到每个被试集分别对应的初始非离群数据集和初始可疑离群数据集。该初始非离群数据集和初始可疑离群数据集都包括被试集中的眼动数据。对于每个被试集,眼动数据的离群处理装置再基于离群点检测算法和当前被试集对应的初始可疑离群数据集,确定当前被试集中的初始离群眼动数据,并剔除每个被试集中的初始离群眼动数据,得到更新后的被试集。
之后,眼动数据的离群处理装置确定每个更新后的被试集的眼动数据均值,得到眼动数据均值集。之后对该眼动数据均值集进行聚类,此时可疑离群数据为眼动数据均值集中的眼动数据均值,非离群数据集包括眼动数据均值,眼动数据的离群处理装置可以保存眼动数据均值处于非离群数据集的眼动数据。该过程可以参考前述第二种实现方式,本发明实施例在此不做赘述。可选地,可以利用基于密度的聚类算法对每个被试集以及眼动数据均值集进行聚类,该聚类过程可以参考前述第一种实现方式中的对每个被试集进行聚类的过程,本发明实施例在此不做赘述。
在对每个被试集分别进行聚类之后,每个被试集中的初始非离群数据集包括多个簇。可选地,眼动数据的离群处理装置可以利用基于相似孤立系数的离群点检测算法(Outlier Mining Algorithm based on Approximate Outlier Factor,OMAAOF)和当前被试集对应的初始可疑离群数据集,确定当前被试集中的初始离群眼动数据。示例地,眼动数据的离群处理装置可以先确定每个簇的平均属性值,之后基于每个簇的平均属性值,计算每个簇的簇相似半径,再确定初始可疑离群数据集中的任一初始可疑离群数据到各个簇的相似权重距离。之后计算多个簇的簇相似半径之和,与该任一初始可疑离群数据到各个簇的相似权重距离之和的比值。之后眼动数据的离群处理装置基于该比值和相似连通性,将初始可疑离群数据集中具备相似连通性质的初始可疑离群数据变更为初始非离群数据,最后将当前的初始可疑离群数据集中的初始可疑离群数据确定为初始离群眼动数据,并剔除每个被试集中的初始离群眼动数据,从而得到更新后的被试集。
其中,当任一初始可疑离群数据的中心距离小于或等于各个簇之间的平均中心距离时,该任一初始可疑离群数据与初始非离群数据集中的数据的相似度较高,此时可以认为该任一初始可疑离群数据具备相似连通性质;当任一初始可疑离群数据的中心距离大于各个簇之间的平均中心距离时,该任一初始可疑离群数据与初始非离群数据集中的数据的相似度较低,此时可以认为该任一初始可疑离群数据不具备相似连通性质。
可选地,在将初始可疑离群数据集中具备相似连通性质的初始可疑离群数据变更为初始非离群数据之后,眼动数据的离群处理装置可以根据用户设置的初始数据范围对当前的初始可疑离群数据集进行筛选,将处于初始数据范围之内的初始可疑离群数据变更为初始非离群数据,再确定当前的初始可疑离群数据集中的初始可疑离群数据为初始离群眼动数据。
又一可选地,在根据用户设置的初始数据范围对当前的初始可疑离群数据集进行筛选之前,眼动数据的离群处理装置可以先计算当前的初始可疑离群数据集中的每个初始可疑离群数据的相似离群系数(Approximate Outlier Factor,AOF)值,并将各个初始可疑离群数据按照其AOF值的大小排序。用户可以基于AOF值的排序结果设置初始数据范围。
在经过聚类得到眼动数据集对应的非离群数据集和可疑离群数据集之后,眼动数据的离群处理装置可以执行后续步骤,以确定眼动数据集中的离群眼动数据。
步骤230、基于离群点检测算法和可疑离群数据集,确定眼动数据集中的离群眼动数据和非离群眼动数据。
可选地,该离群点检测算法可以包括OMAAOF算法,经过聚类后的非离群数据集包括多个簇,眼动数据的离群处理装置可以先确定每个簇的平均属性值;之后基于每个簇的平均属性值,计算每个簇的簇相似半径;再确定可疑离群数据集中的任一可疑离群数据到各个簇的相似权重距离。之后计算多个簇的簇相似半径之和,与该任一可疑离群数据到各个簇的相似权重距离之和的比值。眼动数据的离群处理装置在基于该比值和相似连通性确定任一可疑离群数据不具备相似连通性质时,将该任一可疑离群数据对应的离群眼动数据确定为离群眼动数据。
可选地,在确定离群眼动数据之后,眼动数据的离群处理装置可以先计算当前确定的各个离群眼动数据的AOF值,并将各个离群眼动数据按照其AOF值的大小排序。
示例地,对应前述步骤220的第一种实现方式,可疑离群数据集包括眼动数据。对于每个被试集,眼动数据的离群处理装置可以基于离群点检测算法和当前被试集对应的可疑离群数据集,确定当前被试集中的非离群眼动数据,以及当前被试集的可疑离群数据集中的离群眼动数据,此时任一可疑离群数据对应的离群眼动数据即为该任一可疑离群数据。该确定当前被试集中的离群眼动数据的过程可以参考前述基于OMAAOF算法确定离群眼动数据的过程,本发明实施例在此不做赘述。
对应前述步骤220的第二种或第三种实现方式,可疑离群数据集包括眼动数据均值。眼动数据的离群处理装置可以利用离群点检测算法,确定可疑离群数据集中的离群均值和非离群均值。再将眼动数据均值处于离群均值的被试集中的眼动数据确定为离群眼动数据,此时任一可疑离群数据对应的眼动数据即为该任一可疑离群数据对应的被试集中的眼动数据。该确定可疑离群数据集中的离群均值的过程可以参考前述基于OMAAOF算法确定离群眼动数据的过程,本发明实施例在此不做赘述。
步骤240、根据目标数据范围对眼动数据集中的离群眼动数据进行筛选,将处于目标数据范围之内的离群眼动数据变更为非离群眼动数据。
该目标数据范围可以由用户设置,这样能够使确定离群眼动数据的结果满足用户的需求,提高了该眼动数据的离群处理过程的灵活性。
需要说明的是,若在前述步骤230中得到了各个离群眼动数据的AOF值的排序结果,则用户可以基于该排序结果设置初始数据范围。
步骤250、剔除眼动数据集中的离群眼动数据。
步骤260、保存眼动数据集中的非离群眼动数据。
眼动数据的离群处理装置可以将保存的眼动数据集中的非离群眼动数据输出。
在本发明实施例中,该离群点检测算法还可以包括:基于密度的离群点检测算法、基于距离的离群点检测算法、基于聚类的离群点检测算法以及OMAAOF中的至少一个。基于密度的离群点检测算法先确定数据集中的任一数据的密度以及与该任一数据相邻的数据的密度,在确定该任一数据的密度远低于它相邻的数据的密度时,确定该任一数据为离群数据。基于距离的离群点检测算法先确定数据集中的任一数据在预先设置的半径内的邻域,在该任一数据的邻域内的数据数量少于目标数量时,确定该任一数据为离群数据。基于距离的离群点检测算法能够灵活的制定距离函数,从而有效的确定离群数据。基于聚类的离群点检测算法通过将各个数据在空间中按照相似度划分类型来确定离群数据。
综上所述,本发明实施例提供的眼动数据的离群处理方法,计算机设备能够对获取到的眼动数据集进行聚类得到可疑离群数据集,再基于离群点检测算法和该可疑离群数据集,确定并剔除眼动数据集中的离群眼动数据。该聚类过程和离群点检测算法适用于各种分布情况的数据,提高了该眼动数据的离群处理过程的适用性以及确定离群数据结果的准确性。且该确定离群数据的过程不受用户主观影响,提高了确定离群点的结果的客观标准性。此外,计算机设备能够通过聚类和离群点检测算法自动确定并剔除离群眼动数据,提高了眼动数据的离群处理过程的灵活性和效率。
另外,在基于离群点检测算法确定离群眼动数据之后,还可以根据用户设置的目标数据范围,对确定的离群眼动数据进行进一步筛选,使得确定的离群眼动数据的结果满足用户的需求,提高了该眼动数据的离群处理过程的灵活性。
可选地,上述实施例中是以执行眼动数据的离群处理方法的为眼动数据的离群处理装置为例进行说明的。在一种示例中,该眼动数据的离群处理方法中的不同步骤可以由不同的模块来执行。该不同的模块可以位于一个装置中,也可以位于不同的装置中。本发明实施例对执行眼动数据的离群处理方法的装置不做限定。可选地,眼动数据的离群处理装置可以集成在计算机设备或者服务器中等,本发明实施例对此不做限定。
请参考图3,图3为本发明实施例提供的一种眼动数据的离群处理装置的框图,该眼动数据的离群处理装置30包括:
获取模块301,用于获取眼动数据集,该眼动数据集包括多个属于同一类型的眼动数据。
第一聚类模块302,用于对眼动数据集进行聚类,得到眼动数据集对应的非离群数据集和可疑离群数据集,可疑离群数据集包括可疑离群数据。
第一确定模块303,用于基于离群点检测算法和可疑离群数据集,确定眼动数据集中的离群眼动数据和非离群眼动数据。
第一剔除模块304,用于剔除眼动数据集中的离群眼动数据。
综上所述,本发明实施例提供的眼动数据的离群处理装置,通过第一聚类模块对获取模块获取到的眼动数据集进行聚类得到可疑离群数据集,之后通过第一确定模块基于离群点检测算法和该可疑离群数据集,确定眼动数据集中的离群眼动数据并通过第一剔除模块剔除该离群眼动数据。该聚类过程和离群点检测算法适用于各种分布情况的数据,因此提高了确定离群数据结果的准确性。
可选地,该眼动数据集包括多个被试集,每个被试集包括多个眼动数据;
该第一聚类模块302,用于:
对每个被试集分别进行聚类,得到每个被试集分别对应的非离群数据集和可疑离群数据集。
该第一确定模块303,用于:
对于每个被试集,基于离群点检测算法和当前被试集对应的可疑离群数据集,确定当前被试集中的离群眼动数据和非离群眼动数据。
可选地,该眼动数据集包括多个被试集,每个被试集包括多个眼动数据;
该第一聚类模块302,用于:
确定每个被试集的眼动数据均值,得到眼动数据均值集;
对眼动数据均值集进行聚类,可疑离群数据为眼动数据均值集中的眼动数据均值;
该第一确定模块303,用于:
利用离群点检测算法,确定可疑离群数据集中的离群均值和非离群均值;
将离群均值对应的被试集中的眼动数据确定为离群眼动数据。
可选地,请参考图4,图4为本发明实施例提供的另一种眼动数据的离群处理装置的框图,在图3的基础上,该眼动数据的离群处理装置30还包括:
第二聚类模块305,用于对每个被试集分别进行聚类,得到每个被试集分别对应的初始非离群数据集和初始可疑离群数据集;
第二确定模块306,用于对于每个被试集,基于离群点检测算法和当前被试集对应的初始可疑离群数据集,确定当前被试集中的初始离群眼动数据;
第二剔除模块307,用于剔除每个被试集中的初始离群眼动数据,得到更新后的被试集;
该第一聚类模块302,用于:
确定每个更新后的被试集的眼动数据均值。
可选地,该离群点检测算法包括:基于密度的离群点检测算法、基于距离的离群点检测算法、基于聚类的离群点检测算法以及OMAAOF中的至少一个。
可选地,该离群点检测算法包括OMAAOF,非离群数据集包括多个簇,该第一确定模块303,用于:
确定每个簇的平均属性值;
基于每个簇的平均属性值,计算每个簇的簇相似半径;
确定可疑离群数据集中的任一可疑离群数据到各个簇的相似权重距离;
计算多个簇的簇相似半径之和,与任一可疑离群数据到各个簇的相似权重距离之和的比值;
在基于比值和相似连通性确定任一可疑离群数据不具备相似连通性质时,将任一可疑离群数据对应的离群眼动数据确定为离群眼动数据。
可选地,请参考图5,图5为本发明实施例提供的再一种眼动数据的离群处理装置的框图,在图3的基础上,该眼动数据的离群处理装置30还包括:
筛选模块308,用于根据目标数据范围对眼动数据集中的离群眼动数据进行筛选,将处于目标数据范围之内的离群眼动数据变更为非离群眼动数据。
综上所述,本发明实施例提供的眼动数据的离群处理装置,通过第一聚类模块对获取模块获取到的眼动数据集进行聚类得到可疑离群数据集,再通过第一确定模块基于离群点检测算法和该可疑离群数据集,确定眼动数据集中的离群眼动数据并通过第一剔除模块剔除眼动数据集中的离群眼动数据。该聚类过程和离群点检测算法适用于各种分布情况的数据,提高了该眼动数据的离群处理过程的适用性以及确定离群数据结果的准确性。且该确定离群数据的过程不受用户主观影响,提高了确定离群点的结果的客观标准性。此外,眼动数据的离群处理装置能够通过聚类和离群点检测算法自动确定并剔除离群眼动数据,提高了眼动数据的离群处理过程的灵活性和效率。
另外,在基于离群点检测算法确定离群眼动数据之后,该眼动数据的离群处理装置还可以通过筛选模块根据用户设置的目标数据范围,对确定的离群眼动数据进行进一步筛选,使得确定的离群眼动数据的结果满足用户的需求,提高了该眼动数据的离群处理过程的灵活性。
本发明实施例所提供的眼动数据的离群处理装置可执行本发明任意实施例所提供的眼动数据的离群处理方法,具备执行方法相应的功能模块和有益效果。
图6为本发明实施例提供的一种计算机设备的结构示意图,如图6所示,该计算机设备包括处理器60、存储器61、输入装置62和输出装置63;计算机设备中处理器60的数量可以是一个或多个,图6中以一个处理器60为例;计算机设备中的处理器60、存储器61、输入装置62和输出装置63可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的眼动数据的离群处理方法对应的程序指令/模块(例如,眼动数据的离群处理装置中的获取模块301、第一聚类模块302、第一确定模块303以及剔除模块304)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及眼动数据的离群处理,即实现上述的眼动数据的离群处理方法。
存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器61可进一步包括相对于处理器60远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置62可用于接收输入的数字或字符信息(例如眼动数据),以及产生与计算机设备的用户设置以及功能控制有关的键信号输入(例如目标数据范围)。输出装置63可包括显示屏等显示设备。
本发明实施例还提供一种包含计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的任一眼动数据的离群处理方法。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
在本发明中,“至少一个”指一个或多个,“多个”指两个或两个以上,除非另有明确的限定。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种眼动数据的离群处理方法,其特征在于,包括:
获取眼动数据集,所述眼动数据集包括多个属于同一类型的眼动数据;
对所述眼动数据集进行聚类,得到所述眼动数据集对应的非离群数据集和可疑离群数据集,所述可疑离群数据集包括可疑离群数据;
基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据;
剔除所述眼动数据集中的离群眼动数据。
2.根据权利要求1所述的眼动数据的离群处理方法,其特征在于,所述眼动数据集包括多个被试集,每个所述被试集包括多个眼动数据;
所述对所述眼动数据集进行聚类,得到所述眼动数据集对应的非离群数据集和可疑离群数据集,包括:
对每个所述被试集分别进行聚类,得到每个所述被试集分别对应的非离群数据集和可疑离群数据集;
所述基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据,包括:
对于每个所述被试集,基于所述离群点检测算法和当前被试集对应的可疑离群数据集,确定所述当前被试集中的离群眼动数据和非离群眼动数据。
3.根据权利要求1所述的眼动数据的离群处理方法,其特征在于,所述眼动数据集包括多个被试集,每个所述被试集包括多个眼动数据;
所述对所述眼动数据集进行聚类,包括:
确定每个所述被试集的眼动数据均值,得到眼动数据均值集;
对所述眼动数据均值集进行聚类,所述可疑离群数据为所述眼动数据均值集中的眼动数据均值;
所述基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据,包括:
利用所述离群点检测算法,确定所述可疑离群数据集中的离群均值和非离群均值;
将所述离群均值对应的被试集中的眼动数据确定为所述离群眼动数据。
4.根据权利要求3所述的眼动数据的离群处理方法,其特征在于,在确定每个所述被试集的眼动数据均值,得到眼动数据均值集之前,还包括:
对每个所述被试集分别进行聚类,得到每个所述被试集分别对应的初始非离群数据集和初始可疑离群数据集;
对于每个所述被试集,基于所述离群点检测算法和当前被试集对应的初始可疑离群数据集,确定所述当前被试集中的初始离群眼动数据;
剔除每个所述被试集中的初始离群眼动数据,得到更新后的被试集;
所述确定每个所述被试集的眼动数据均值,包括:
确定每个所述更新后的被试集的眼动数据均值。
5.根据权利要求1至4任一所述的眼动数据的离群处理方法,其特征在于,
所述离群点检测算法包括:基于密度的离群点检测算法、基于距离的离群点检测算法、基于聚类的离群点检测算法以及基于相似孤立系数的离群点检测算法OMAAOF中的至少一个。
6.根据权利要求5所述的方法,其特征在于,所述离群点检测算法包括OMAAOF,所述非离群数据集包括多个簇,所述基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据,包括:
确定每个所述簇的平均属性值;
基于每个所述簇的平均属性值,计算每个所述簇的簇相似半径;
确定所述可疑离群数据集中的任一可疑离群数据到各个所述簇的相似权重距离;
计算所述多个簇的簇相似半径之和,与所述任一可疑离群数据到各个所述簇的相似权重距离之和的比值;
在基于所述比值和相似连通性确定所述任一可疑离群数据不具备相似连通性质时,将所述任一可疑离群数据对应的离群眼动数据确定为所述离群眼动数据。
7.根据权利要求1至4任一所述的眼动数据的离群处理方法,其特征在于,在基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据之后,还包括:
根据目标数据范围对所述眼动数据集中的离群眼动数据进行筛选,将处于所述目标数据范围之内的离群眼动数据变更为所述非离群眼动数据。
8.一种眼动数据的离群处理装置,其特征在于,包括:
获取模块,用于获取眼动数据集,所述眼动数据集包括多个属于同一类型的眼动数据;
第一聚类模块,用于对所述眼动数据集进行聚类,得到所述眼动数据集对应的非离群数据集和可疑离群数据集,所述可疑离群数据集包括可疑离群数据;
第一确定模块,用于基于离群点检测算法和所述可疑离群数据集,确定所述眼动数据集中的离群眼动数据和非离群眼动数据;
剔除模块,用于剔除所述眼动数据集中的离群眼动数据。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的眼动数据的离群处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的眼动数据的离群处理方法。
CN202110145910.9A 2021-02-02 2021-02-02 眼动数据的离群处理方法及装置、计算机设备、存储介质 Pending CN112836747A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110145910.9A CN112836747A (zh) 2021-02-02 2021-02-02 眼动数据的离群处理方法及装置、计算机设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110145910.9A CN112836747A (zh) 2021-02-02 2021-02-02 眼动数据的离群处理方法及装置、计算机设备、存储介质

Publications (1)

Publication Number Publication Date
CN112836747A true CN112836747A (zh) 2021-05-25

Family

ID=75931669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110145910.9A Pending CN112836747A (zh) 2021-02-02 2021-02-02 眼动数据的离群处理方法及装置、计算机设备、存储介质

Country Status (1)

Country Link
CN (1) CN112836747A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116959086A (zh) * 2023-09-18 2023-10-27 南昌虚拟现实研究院股份有限公司 一种视线估计方法、系统、设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2184005A1 (en) * 2008-10-22 2010-05-12 SensoMotoric Instruments Gesellschaft für innovative Sensorik mbH Method and apparatus for image processing for computer-aided eye surgery
CN103903276A (zh) * 2014-04-23 2014-07-02 吉林大学 基于密度聚类法和形态学聚类法的驾驶员注视点聚类方法
CN105512206A (zh) * 2015-11-27 2016-04-20 河海大学 一种基于聚类的离群点检测方法
JP2017176302A (ja) * 2016-03-29 2017-10-05 ヤンマー株式会社 眼球運動計測装置、眼球運動計測方法および眼球運動計測プログラム
CN107256332A (zh) * 2017-05-24 2017-10-17 上海交通大学 基于眼动数据的脑电实验评估系统及方法
CN107644032A (zh) * 2016-07-21 2018-01-30 中兴通讯股份有限公司 离群点检测方法和装置
CN107871537A (zh) * 2017-11-22 2018-04-03 山东师范大学 一种基于多模态特征的抑郁倾向测评装置、系统
CN109255342A (zh) * 2018-11-20 2019-01-22 武汉大学 一种基于眼动轨迹数据两步聚类的图像感兴趣区域提取方法和系统
CN109700472A (zh) * 2019-02-21 2019-05-03 北京七鑫易维信息技术有限公司 一种疲劳检测方法、装置、设备和存储介质
CN109753991A (zh) * 2018-12-06 2019-05-14 中科恒运股份有限公司 异常数据检测方法及装置
WO2019237492A1 (zh) * 2018-06-13 2019-12-19 山东科技大学 一种基于半监督学习的异常用电用户检测方法
CN110879976A (zh) * 2019-12-20 2020-03-13 陕西百乘网络科技有限公司 自适应智能眼动数据处理系统及其使用方法
CN111317448A (zh) * 2020-03-03 2020-06-23 南京鼓楼医院 一种分析视觉空间认知的方法及系统
JP2020140423A (ja) * 2019-02-28 2020-09-03 Kddi株式会社 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2184005A1 (en) * 2008-10-22 2010-05-12 SensoMotoric Instruments Gesellschaft für innovative Sensorik mbH Method and apparatus for image processing for computer-aided eye surgery
CN103903276A (zh) * 2014-04-23 2014-07-02 吉林大学 基于密度聚类法和形态学聚类法的驾驶员注视点聚类方法
CN105512206A (zh) * 2015-11-27 2016-04-20 河海大学 一种基于聚类的离群点检测方法
JP2017176302A (ja) * 2016-03-29 2017-10-05 ヤンマー株式会社 眼球運動計測装置、眼球運動計測方法および眼球運動計測プログラム
CN107644032A (zh) * 2016-07-21 2018-01-30 中兴通讯股份有限公司 离群点检测方法和装置
CN107256332A (zh) * 2017-05-24 2017-10-17 上海交通大学 基于眼动数据的脑电实验评估系统及方法
CN107871537A (zh) * 2017-11-22 2018-04-03 山东师范大学 一种基于多模态特征的抑郁倾向测评装置、系统
WO2019237492A1 (zh) * 2018-06-13 2019-12-19 山东科技大学 一种基于半监督学习的异常用电用户检测方法
CN109255342A (zh) * 2018-11-20 2019-01-22 武汉大学 一种基于眼动轨迹数据两步聚类的图像感兴趣区域提取方法和系统
CN109753991A (zh) * 2018-12-06 2019-05-14 中科恒运股份有限公司 异常数据检测方法及装置
CN109700472A (zh) * 2019-02-21 2019-05-03 北京七鑫易维信息技术有限公司 一种疲劳检测方法、装置、设备和存储介质
JP2020140423A (ja) * 2019-02-28 2020-09-03 Kddi株式会社 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
CN110879976A (zh) * 2019-12-20 2020-03-13 陕西百乘网络科技有限公司 自适应智能眼动数据处理系统及其使用方法
CN111317448A (zh) * 2020-03-03 2020-06-23 南京鼓楼医院 一种分析视觉空间认知的方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZHIFANG LIAO ET AL.: "An outlier mining algorithm based on approximate outlier factor", INTERNATIONAL JOURNAL OF AUTONOMOUS AND ADAPTIVE COMMUNICATIONS SYSTEMS, pages 1 - 4 *
倪巍伟;陆介平;陈耿;孙志挥;: "基于k均值分区的数据流离群点检测算法", 计算机研究与发展, no. 09 *
杨茂林;卢炎生;: "基于剪枝的海量数据离群点挖掘", 计算机科学, no. 10 *
肖雪;薛善良;: "基于改进的OPTICS聚类和LOPW的离群数据检测算法", 计算机工程与科学, no. 05 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116959086A (zh) * 2023-09-18 2023-10-27 南昌虚拟现实研究院股份有限公司 一种视线估计方法、系统、设备及存储介质
CN116959086B (zh) * 2023-09-18 2023-12-15 南昌虚拟现实研究院股份有限公司 一种视线估计方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112329836A (zh) 基于深度学习的文本分类方法、装置、服务器及存储介质
CN108304371B (zh) 热点内容挖掘的方法、装置、计算机设备及存储介质
CN108090216B (zh) 一种标签预测方法、装置及存储介质
CN109189876B (zh) 一种数据处理方法及装置
KR101850993B1 (ko) 클러스터 기반 키워드 산출 방법 및 장치
WO2020056968A1 (zh) 数据降噪方法、装置、计算机设备和存储介质
CN110245714B (zh) 图像识别方法、装置及电子设备
Gialampoukidis et al. A hybrid framework for news clustering based on the DBSCAN-Martingale and LDA
WO2023065744A1 (zh) 一种人脸识别方法、装置、设备以及存储介质
CN110909817B (zh) 分布式聚类方法及系统、处理器、电子设备及存储介质
CN114780606B (zh) 一种大数据挖掘方法及系统
CN115600194A (zh) 一种基于XGBoost和LGBM的入侵检测方法、存储介质及设备
CN110348516B (zh) 数据处理方法、装置、存储介质及电子设备
CN110334104B (zh) 一种榜单更新方法、装置、电子设备及存储介质
CN111400448A (zh) 对象的关联关系分析方法及装置
CN112836747A (zh) 眼动数据的离群处理方法及装置、计算机设备、存储介质
CN116664335B (zh) 基于智能监控的半导体生产系统运行分析方法及系统
TWI714321B (zh) 資料庫更新方法和裝置、電子設備、電腦儲存介質
CN110399464B (zh) 一种相似新闻判别方法、系统及电子设备
CN114692778B (zh) 用于智能巡检的多模态样本集生成方法、训练方法及装置
CN111107079A (zh) 一种上传文件检测方法及装置
CN112073360B (zh) 超文本传输数据的检测方法、装置、终端设备及介质
CN115358308A (zh) 一种大数据实例约简方法、装置、电子设备及存储介质
CN111428767B (zh) 数据处理方法及装置、处理器、电子设备及存储介质
CN111737371B (zh) 可动态预测的数据流量检测分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination