CN112200269B - 一种相似度分析方法及系统 - Google Patents

一种相似度分析方法及系统 Download PDF

Info

Publication number
CN112200269B
CN112200269B CN202011283456.5A CN202011283456A CN112200269B CN 112200269 B CN112200269 B CN 112200269B CN 202011283456 A CN202011283456 A CN 202011283456A CN 112200269 B CN112200269 B CN 112200269B
Authority
CN
China
Prior art keywords
information
tested
coordinate value
pieces
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011283456.5A
Other languages
English (en)
Other versions
CN112200269A (zh
Inventor
赵起超
杨苒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kingfar International Inc
Original Assignee
Kingfar International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingfar International Inc filed Critical Kingfar International Inc
Priority to CN202011283456.5A priority Critical patent/CN112200269B/zh
Publication of CN112200269A publication Critical patent/CN112200269A/zh
Application granted granted Critical
Publication of CN112200269B publication Critical patent/CN112200269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/19Sensors therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Ophthalmology & Optometry (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种相似度分析方法及系统,方法包括获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;在全部被试信息中随机选取两个被试信息;在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信息的坐标值信息,当这两个关注点信息的坐标值信息落在同一个规定区域内时,则判定这两个关注点信息的关系为相似;以及计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息。本申请通过数据化的分析方式对多个被试的实验数据进行分析,有助于提高相似度分析的精确程度。

Description

一种相似度分析方法及系统
技术领域
本申请涉及人工智能数据分析的技术领域,尤其是涉及一种相似度分析方法及系统。
背景技术
录制不同被试访问相同的刺激材料的实验,计算每个被试之间访问刺激材料的相似度,可以根据相似度的反馈来对相应的刺激进行调整,达到优化的目的,但是,交互分析中的可视化图形不能精确反应两个被试数据的相似度。
发明内容
本申请提供一种相似度分析方法及系统,通过数据化的分析方式,有助于提高相似度分析的精确程度。
本申请的上述目的是通过以下技术方案得以实现的:
第一方面,本申请提供了一种相似度分析方法,包括:
获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;
在全部被试信息中随机选取两个被试信息;
在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信息的坐标值信息,当这两个关注点信息的坐标值信息落在同一个规定区域内时,则判定这两个关注点信息的关系为相似;以及
计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息;
其中,每个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
通过采用上述技术方案,通过对被试信息中关注点信息的坐标值信息进行比对,可以对其关系进行精确判定,这种方式采用了一个统一的标准进行判定,避免了人工判定中评判标准不一致的问题,有助于提高相似度分析的精确程度。
在第一方面的一种可能的实现方式中,当两个相关的关注点信息的坐标值信息中有且仅有一个落在规定区域内时,引入扩充区域进行判定,当未落入规定区域内的关注点信息的坐标值信息落入扩充区域内时,则判定这两个关注点信息的关系为相似。
通过采用上述技术方案,扩大了相似关系的判定范围,使之更加符合实际场景的需求。
在第一方面的一种可能的实现方式中,当两个相关的关注点信息的坐标值信息均未落在规定区域内时,则计算这两个关注点信息之间的最小直线距离信息,当最小直线距离信息小于等于判定阈值信息时,则判定这两个关注点信息的关系为相似。
通过采用上述技术方案,扩大了相似关系的判定范围,使之更加符合实际场景的需求。
在第一方面的一种可能的实现方式中,在获取被试信息中的关注点信息的坐标值信息时,同时获取坐标值信息在时间序列上的时间长度信息,以及
存在关注点信息的关系被判定为相似时,计算两个被选取的被试信息的相似时间总长度信息。
通过采用上述技术方案,可以通过相似时间总长度信息来对两个被试信息的相似程度进行判定,能够从时间维度了解两个被试信息的相似程度。
在第一方面的一种可能的实现方式中,还包括:
获取两个被选取的被试信息的测试时间长度信息;
获取两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,坐标值信息在时间序列上的相似时间长度信息;以及
计算被选取的两个被试信息的时间相似度信息;
其中,时间相似度信息=(两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,在时间序列上的相似时间长度信息)*2/(被选取的两个信息的测试时间长度信息之和)。
通过采用上述技术方案,可以通过时间相似度信息来对两个被试信息的相似程度进行判定,能够对两个被试信息的相似程度进行更加全面的反馈。
在第一方面的一种可能的实现方式中,还包括:
获取全部的任意两个被试信息的时间相似度信息;以及
挑选出时间相似度信息最大的两个被试信息或者时间相似度信息位于挑选区间内的多对被试信息;
其中,每对被试信息中被试信息的数量为两个。
通过采用上述技术方案,可以通过时间相似度信息对被试信息进行筛选,将满足要求的被试信息挑选出来,用于后续的分析需求。
第二方面,本申请提供了一种相似度分析装置,包括:
第一获取单元,用于获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;
第二获取单元,用于在全部被试信息中随机选取两个被试信息;
第一判定单元,用于在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信息的坐标值信息,当这两个关注点信息的坐标值信息落在同一个规定区域内时,则判定这两个关注点信息的关系为相似;以及
第一计算单元,用于计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息;
其中,每个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
第三方面,本申请提供了一种相似度分析系统,所述系统包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如第一方面及第一方面任意可能的实现方式中所述的相似度分析方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质包括:
程序,当所述程序被处理器运行时,如第一方面及第一方面任意可能的实现方式中所述的相似度分析方法被执行。
第五方面,本申请提供了一种芯片,所述芯片包括处理器与数据接口,处理器通过数据接口读取存储器上存储的指令,以执行如第一方面及第一方面任意可能的实现方式中所述的相似度分析方法。
第六方面,本申请提供了一种计算机程序产品,包括程序指令,当所述程序指令被计算设备运行时,如第一方面及第一方面任意可能的实现方式中所述的相似度分析方法被执行。
第七方面,本申请提供了一种芯片系统,该芯片系统包括处理器,用于实现上述各方面中所涉及的功能,例如,生成,接收,发送,或处理上述方法中所涉及的数据和/或信息。
该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
在一种可能的设计中,该芯片系统还包括存储器,该存储器,用于保存必要的程序指令和数据。该处理器和该存储器可以解耦,分别设置在不同的设备上,通过有线或者无线的方式连接,或者处理器和该存储器也可以耦合在同一个设备上。
附图说明
图1是本申请实施例提供的针对于同一刺激,一个被试在实验过程中的视线移动路径示意图。
图2是本申请实施例提供的针对于同一刺激,另一个被试在实验过程中的视线移动路径示意图。
图3是本申请实施例提供的针对于同一刺激,不同被试的视线移动路径的相似度比较示意图。
图4是本申请实施例提供的一种引入扩充区域作为关系判定补充的示意图。
图5是本申请实施例提供的一种引入直线距离作为关系判定补充的示意图。
图6是本申请实施例提供的一种时间长度信息在时间序列上的分布示意图。
具体实施方式
以下结合附图,对本申请中的技术方案作进一步详细说明。
首先简单介绍相似度分析的实验过程,实验过程中,向不同的被试展示相同的刺激,并记录被试的视线移动轨迹,通过判断不同被试的视线移动轨迹的相似程度,来对刺激进行调整。
举例说明,网页设计样式的排版布局,每个重点部分绘制兴趣区,通过多个被试实验,通过被试实验数据计算出每个被试和其他被试之间的访问相似度,从而可以调整网页的样式排版布局,相似度越高越能体现刺激每个部分对被试的影响程度,从而可以通过被试之间的相似度反应刺激的设计排版布局的合理性和对被试的吸引力。
应理解,对于一个刺激而言,可能是基于制作或者设计的主观确定的,至于刺激是不是符合大众或者说绝大多数人的要求,需要通过实验来进行确定,参与实验的被试(也就是测试者)的数量越多,最终得到的结果也就更加准确。
一般而言,实验的结果有两种,一种是绝大多数被试的实验结果与设定结果是吻合的或者在能够接受的范围内,那么这个刺激可以被认为是符合要求的,另一种是实验结果与设定结果并不相同,但是通过对被试的实验数据的分析,可以对刺激进行调整,使实验结果与设定结果是吻合的或者在能够接受的范围内。
本申请实施例提供的相似度分析方法,通过数据化的分析方式,可以对多个被试的实验数据进行分析,从而得到需要的结果,这种分析方式是基于同一个标准,因此结果的一致性更好,有效解决了人工分析中标准不一致的问题,尤其是在进行大批量试验数据的分析时,其优势会更加明显。
请参阅图1、图2和图3,为本申请实施例公开的一种相似度分析方法,包括以下步骤:
S101,获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;
S102,在全部被试信息中随机选取两个被试信息;
S103,在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信息的坐标值信息,当这两个关注点信息的坐标值信息落在同一个规定区域内时,则判定这两个关注点信息的关系为相似;以及
S104,计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息;
其中,每个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
具体的说,在步骤S101中,会获取到多个被试信息的实验数据信息,这些实验数据信息包括关注点信息的坐标值信息,这些关注点信息的坐标值信息以被试信息为基础进行分类,也就是说,每个被试信息均对应多个与其相关联的关注点信息的坐标值信息。
应理解,在实验过程中,被试的眼睛是处于移动状态的,会按照自己的想法或者思考来观察刺激,那么对于关注点信息的坐标值信息,在时间序列上也应当是按照出现的先后顺序进行排列的。
因此,对于属于同一个被试信息的关注点信息的坐标值信息,在时间序列上,也应当是按照生成的先后顺序排列的,这样对于不同的被试信息,才能够进行比较,用以判断其移动轨迹的相似度。
对于关注点信息的坐标值信息的生成,可以采用以下几种形式:
第一种,被试穿戴眼动仪后观察刺激,眼动仪通过对眼睛动作的判断来获取其在刺激上的坐标值;
第二种,被试使用观察刺激,并使用鼠标点击刺激上的观察区域,通过鼠标的点击位置来获取其在刺激上的坐标值;
第三种,被试使用观察刺激,并使用触摸的方式点击刺激上的观察区域,通过触摸位置来获取其在刺激上的坐标值。
在步骤S102中,会在全部被试信息中随机选取两个被试信息,然后通过其所属的关注点信息的坐标值信息来判断二者的相似程度,另外需说明,每个被试信息均需要与其他的被试信息进行相似度判定,也就是说,每一个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
对这些被试信息进行充分的相似度判定后,才能够通过对结果的分析来了解实验结果与设定结果的吻合程度,因为样本容量越大,得到的结果的准确程度也就越高。
在步骤S103中,会在时间序列上顺序对两个被选取的被试信息中的相关的关注点信息的坐标值信息进行比对,具体的方式是确定这两个相关的分别属于不同被试信息的坐标值信息是否位于同一规定区域内。
举例说明,第一个被选取的被试信息中有三个关注点信息的坐标值信息,这三个坐标值信息是按照生成的先后顺序排列的;第二个被选取的被试信息中同样有三个关注点信息的坐标值信息,这三个坐标值信息也是按照生成的先后顺序排列的。
那么属于第一个被试信息中的第一个关注点信息的坐标值信息就应当与属于第二个被试信息中的第一个关注点信息的坐标值信息进行比对,当这两个坐标值信息落在同一个规定区域内时,其关系被判定为相似,反之则为不相似。
应理解,在一个理想的实验过程中,每个被试信息的关注点信息的坐标值信息应当是一致的,或者是在一个小的范围内波动的,并且这个波动的范围在规定区域的允许范围之内,但是由于被试的多样性会导致被试信息的差异性,因此会出现实验结果与设定结果出现偏差的情况,通过对对应的关注点信息的坐标值信息进行比对的方式,就能够对刺激进行调整,使大多数或者在接受范围内的属于不同的关注点信息的坐标值信息的关系被判定为相似。
接着在步骤S104中,会执行两个分析过程,第一个是计算两个被选取的被试信息的相似度数值信息,第二个是计算每一个被试信息的平均相似度数值信息。
对于相似度数值信息,应当这样理解,两个被试信息中的关注点信息的坐标值信息的数量为十个,这十个当中,其关系被判定为相似的数量为七个,那么这两个被试信息的相似度数值信息的数值就是七。
对于第一个分析过程的举例说明,被试信息的数量是四个,那么对于第一个分析过程,就需要分别计算以下内容:
第一个被试信息与第二个被试信息的相似度数值信息;
第一个被试信息与第三个被试信息的相似度数值信息;
第一个被试信息与第四个被试信息的相似度数值信息;
第二个被试信息与第三个被试信息的相似度数值信息;
第二个被试信息与第四个被试信息的相似度数值信息;
第三个被试信息与第四个被试信息的相似度数值信息;
通过上述的计算,可以得到六个相似度数值信息,如果这六个相似度数值信息分别是1、3、2、4、8、2,那么很明显,相似度数值信息为8的这两个被试信息的相似程度是最高的,并且相似度数值信息为2的数量是最多的,通过对这些相似度数值信息对应的被试信息中的关注点信息的坐标值信息进行分析,就可以对刺激进行调整,使理论结果更加趋近于实验结果。
对于第二个分析过程的举例说明,被试信息的数量是四个,结果如下:
第一个被试信息与其他被试信息的相似度数值信息的数值分别为3、5、7,那么其平均相似度数值信息的数值就是(3+5+7)/3=5;
第二个被试信息与其他被试信息的相似度数值信息的数值分别为3、9、14,那么其平均相似度数值信息的数值就是(3+9+14)/3=8.66;
第三个被试信息与其他被试信息的相似度数值信息的数值分别为5、9、0,那么其平均相似度数值信息的数值就是(5+9+0)/3=4.66;
第四个被试信息与其他被试信息的相似度数值信息的数值分别为7、14、0,那么其平均相似度数值信息的数值就是(7+14+0)/3=7;
可以很明显的看到,第二个被试信息和第四个被试信息与其他被试信息的相似度是更高的,那么就可以将这两个被试信息挑选出来进行分析,对刺激进行调整,使理论结果更加趋近于实验结果。
应理解的是,对于上述两种分析过程,既可以择一使用,也可以同时使用。
整体而言,本申请实施例提供的相似度分析方法,通过数据化的分析方式,对多个被试在观看刺激过程中产生的实验数据进行分析,能够基于同一个评判标准生成实验结果,这种方式有效避免了人工分析中的主观性影响,有助于提高分析结果的精确程度。
在不同的被试观察刺激的过程中,理论上讲,其视线在刺激上的坐标应当是在一个范围内波动的,但是考虑到不同被试间的不一致性和实验误差等影响因素,可能会出现被试实际上是在观察刺激上的一个确定区域,但是实验数据并不支持的情况,因此作为申请提供的相似度分析方法的一种具体实施方式,引入了额外的判定方式。
具体而言,请参阅图4,当两个相关的关注点信息的坐标值信息中有且仅有一个落在规定区域内时,引入扩充区域进行判定,当未落入规定区域内的关注点信息的坐标值信息落入扩充区域内时,则判定这两个关注点信息的关系为相似。
扩充区域就是对前文中提到的情况的容错措施,使用扩充区域作为对相似关系判定的补充,能够将部分实际上关系为相似的两个关注点信息的关系在判定过程中判定为相似。
从另外一个角度理解,扩充区域的引入,更加符合实际使用场景的要求,因为在获取被试对刺激的实验数据时,存在多样的影响因素,这些影响因素的影响程度有大有小,有些影响程度仅对实验数据有影响但是对最终的结果没有影响,扩充区域能够将这些对实验数据有影响但是对最终的结果没有影响的影响因素去除掉,使实验结果的精确程度更高。
作为申请提供的相似度分析方法的一种具体实施方式,请参阅图5,对于两个相关的关注点信息的坐标值信息的关系判定,还提供了一种另外的判定方式,就是使用最小直线距离作为额外的参考。
具体而言,当两个相关的关注点信息的坐标值信息均未落在规定区域内时,则计算这两个关注点信息之间的最小直线距离信息,当最小直线距离信息小于等于判定阈值信息时,则判定这两个关注点信息的关系为相似。
引入了最小直线距离作为参考后,就会出现以下这种情况,两个被试信息中的其中一对相关的关注点信息的坐标值信息同时落在了一个区域中,但是这个区域并不是步骤S103中提到的规定区域,这就意味着如果S103中的规定区域能够向这个区域移动,那么大概率的,会使设定结果与实验结果的吻合度迅速增加。
从另一个角度理解,设定结果是一个理想化的产物,而实验结果是基于样本统计的产物,通过引入最小直线距离,可以对设定结果进行快速修正,使其能够向实验结果快速的靠拢。
上述内容中,对于相似度的分析是基于有多少个关系被判定为相似的坐标值信息,但是如果从时间的角度考虑,则也会衍生来更多的分析结果,具体的说,请参阅图6,在本申请提供的相似度分析方法的一种具体实施方式中,执行以下步骤:
S201,在获取被试信息中的关注点信息的坐标值信息时,同时获取坐标值信息在时间序列上的时间长度信息,以及
S202,存在关注点信息的关系被判定为相似时,计算两个被选取的被试信息的相似时间总长度信息。
在步骤S201中,在获取被试信息中的关注点信息的坐标值信息时,同时获取坐标值信息在时间序列上的时间长度信息,也就是对于被试而言除了获取其视线的移动路径之外,还要获取其在移动路径上的每个关注点上的停留时间,这个停留时间也就是在时间序列上的时间长度。
举例说明,两个被试的视线的移动路径相似,但是在每个关注点上的停留时间不一致,这说明不同的被试对关注点的关注程度是不一致的,那么随着被试数量的增加,可以根据被试在不同的关注点上的停留时间进行分析,得到更多的结果,例如找到停留时间最长的关注点等。
在步骤S202中,当两个关注点信息的关系被判定为相似时,计算两个被选取的被试信息的相似时间总长度信息。
举例说明,两个被试信息中的关注点信息的数量为9个,其中的关系被判定为相似的关注点信息的对数为6对,那么就需要分别计算这6对关注点信息在时间序列上的相似时间长度,例如其中一个被试在该关注点上的停留时间为3秒,另一个被试在该关注点上的停留时间为5秒,那么这对关注点信息的相似时间长度就是3秒,按照这种方式会得到6个相似时间长度,其累加值就是相似时间总长度信息的数值。
整体而言,增加了相似时间总长度信息作为参考后,能够对两个被试的实验数据的相似度进行进一步的了解,除了在视线移动路径上的吻合外,如果在时间上也能够吻合,无疑,其吻合度是更高的。
作为本申请提供的相似度分析方法的一种具体实施方式,对于从时间上的相似度比较,还提供了另外一种方式,包括以下步骤:
S301,获取两个被选取的被试信息的测试时间长度信息;
S302,获取两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,坐标值信息在时间序列上的相似时间长度信息;以及
S303,计算被选取的两个被试信息的时间相似度信息;
其中,时间相似度信息=(两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,在时间序列上的相似时间长度信息)*2/(被选取的两个信息的测试时间长度信息之和)。
具体而言,在步骤S301中,会获取两个被选取的被试信息的测试时间长度信息,例如第一个被试的测试时间长度为80秒,第二个被试的测试时间长度为90秒。
应理解,对于同一个刺激而言,不同的被试在观察的过程中,其大概时间可以进行控制,但是无法实现完全一致,因此对于不同的测试时间,在允许范围内都是可以接受的。
在步骤S302中,获取两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,坐标值信息在时间序列上的相似时间长度信息,举例说明,两个被试信息中的关注点信息的数量为9个,其中的关系被判定为相似的关注点信息的对数为6对,那么就需要分别计算这6对关注点信息在时间序列上的相似时间长度,例如其中一个被试在该关注点上的停留时间为3秒,另一个被试在该关注点上的停留时间为5秒,那么这对关注点信息的相似时间长度就是3秒。
需要说明的是,相似时间长度信息与关系判定是直接关联的,被判定为相似的关注点信息的数量为三个,那么相似时间长度信息的数量也就是三个。
最后执行步骤S304,在步骤中,会计算被选取的两个被试信息的时间相似度信息,通过时间相似度信息,就可以对两个被试的实验数据的相似度进行进一步的了解。
时间相似度信息的计算公式如下:时间相似度信息=(两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,在时间序列上的相似时间长度信息)*2/(被选取的两个信息的测试时间长度信息之和)。
举例说明:
第一个被试信息中关注点信息的数量为9个,第二个被试信息中关注点信息的数量为9个;
第一个被试信息的实验时间为90秒,第二个被试信息的实验时间为95秒;
对于这两个被试信息,关系被判定为相似的关注点信息的对数为5对;
这5对关注点信息的相似时间长度信息分别为3秒,4秒,7秒,1秒和2秒;
那么时间相似度信息=(3+4+7+1+2)*2/(90+95)=0.18378。
整体而言,步骤S301至步骤S303中的内容,关注的是两个被试在实验时间上的吻合度,吻合度越高,说明在时间这个参考上,其视线的移动路径的温和程度也是比较高的。
例如,两个被试在实现移动路径上的相似度比较高,在时间的相似度也比较高,那么可以认为这两个被试的实验数据的相似度是比较高的。
再例如,两个被试在实现移动路径上的相似度比较高,但是在时间的相似度也比较低,那么可能存在被试对关注点的关注程度不同的情况,针对这种不同的情况,可以用于对刺激进行针对性的调整。
再例如,两个被试在实现移动路径上的相似度比较低,但是在时间的相似度也比较高,那么可能存在被试对某一个或者某几个关注点的关注程度较高的情况,针对这些关注程度较高的关注点,可以用于对刺激进行针对性的调整。
进一步地,增加了以下步骤:
S401,获取全部的任意两个被试信息的时间相似度信息;以及
S402,挑选出时间相似度信息最大的两个被试信息或者时间相似度信息位于挑选区间内的多对被试信息;
其中,每对被试信息中被试信息的数量为两个。
具体而言,针对于多个被试信息,在步骤S401中,会获取全部的任意两个被试信息的时间相似度信息,然后对于这些被试信息的时间相似度信息,进行比较,挑选出时间相似度信息最大的两个被试信息或者时间相似度信息位于挑选区间内的多对被试信息,也就是步骤S402中的内容。
实质上,步骤S401和步骤S402中的内容是一种自动化的挑选方式,能够将满足要求的被试信息挑选出来,用于后续的分析等工作。
本申请实施例还公开了一种相似度分析装置,包括:
第一获取单元,用于获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;
第二获取单元,用于在全部被试信息中随机选取两个被试信息;
第一判定单元,用于在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信息的坐标值信息,当这两个关注点信息的坐标值信息落在同一个规定区域内时,则判定这两个关注点信息的关系为相似;以及
第一计算单元,用于计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息;
其中,每个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
在一个例子中,以上任一装置中的单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个专用集成电路(application specificintegratedcircuit,ASIC),或,一个或多个数字信号处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA),或这些集成电路形式中至少两种的组合。
再如,当装置中的单元可以通过处理元件调度程序的形式实现时,该处理元件可以是通用处理器,例如中央处理器(central processing unit,CPU)或其它可以调用程序的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
在本申请中可能出现的对各种消息/信息/设备/网元/系统/装置/动作/操作/流程/概念等各类客体进行了赋名,可以理解的是,这些具体的名称并不构成对相关客体的限定,所赋名称可随着场景,语境或者使用习惯等因素而变更,对本申请中技术术语的技术含义的理解,应主要从其在技术方案中所体现/执行的功能和技术效果来确定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
还应理解,在本申请的各个实施例中,第一、第二等只是为了表示多个对象是不同的。例如第一时间窗和第二时间窗只是为了表示出不同的时间窗。而不应该对时间窗的本身产生任何影响,上述的第一、第二等不应该对本申请的实施例造成任何限制。
还应理解,在本申请的各个实施例中,如果没有特殊说明以及逻辑冲突,不同的实施例之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例中的技术特征根据其内在的逻辑关系可以组合形成新的实施例。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例还提供了一种相似度分析系统,所述系统包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如上述内容中所述的相似度分析方法。
本申请实施例还提供了一种芯片,所述芯片包括处理器与数据接口,处理器通过数据接口读取存储器上存储的指令,以执行如上述内容中所述的相似度分析方法。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括指令,当该指令被执行时,以使得该分析系统执行对应于上述方法的分析系统的操作。
本申请实施例还提供了一种芯片系统,该芯片系统包括处理器,用于实现上述内容中所涉及的功能,例如,生成,接收,发送,或处理上述方法中所涉及的数据和/或信息。
该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
上述任一处提到的处理器,可以是一个CPU,微处理器,ASIC,或一个或多个用于控制上述的反馈信息传输的方法的程序执行的集成电路。
在一种可能的设计中,该芯片系统还包括存储器,该存储器,用于保存必要的程序指令和数据。该处理器和该存储器可以解耦,分别设置在不同的设备上,通过有线或者无线的方式连接,以支持该芯片系统实现上述实施例中的各种功能。或者,该处理器和该存储器也可以耦合在同一个设备上。
可选地,该计算机指令被存储在存储器中。
可选地,该存储器为该芯片内的存储单元,如寄存器、缓存等,该存储器还可以是该终端内的位于该芯片外部的存储单元,如ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM等。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
非易失性存储器可以是ROM、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。
易失性存储器可以是RAM,其用作外部高速缓存。RAM有多种不同的类型,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器。
本具体实施方式的实施例均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

Claims (8)

1.一种相似度分析方法,其特征在于,包括:
获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;
在全部被试信息中随机选取两个被试信息;
在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信息的坐标值信息, 当两个相关的关注点信息的坐标值信息中有且仅有一个落在规定区域内时,引入扩充区域进行判定,当未落入规定区域内的关注点信息的坐标值信息落入扩充区域内时,则判定这两个关注点信息的关系为相似;
当两个相关的关注点信息的坐标值信息均未落在规定区域内时,则计算这两个关注点信息之间的最小直线距离信息,当最小直线距离信息小于等于判定阈值信息时,则判定这两个关注点信息的关系为相似;以及
计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息;
其中,每个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
2.根据权利要求 1 所述的一种相似度分析方法,其特征在于,在获取被试信息中的关注点信息的坐标值信息时,同时获取坐标值信息在时间序列上的时间长度信息,以及
存在关注点信息的关系被判定为相似时,计算两个被选取的被试信息的相似时间总长度信息。
3.根据权利要求 1 所述的一种相似度分析方法,其特征在于,还包括: 获取两个被选取的被试信息的测试时间长度信息;
获取两个被试信息中的关注点信息的坐标值信息的关系被判定为相似时,坐标值信息在时间序列上的相似时间长度信息;以及
计算被选取的两个被试信息的时间相似度信息;
其中,时间相似度信息=(两个被试信息中的关注点信息的坐标值信息的关系被判定为相似 时,在时间序列上的相似时间长度信息)*2/(被选取的两个信息的测试时间长度信息之和)。
4.根据权利要求 3 所述的一种相似度分析方法,其特征在于,还包括: 获取全部的任意两个被试信息的时间相似度信息;以及
挑选出时间相似度信息最大的两个被试信息或者时间相似度信息位于挑选区间内的多对被试信息;
其中,每对被试信息中被试信息的数量为两个。
5.一种相似度分析装置,其特征在于,包括:
第一获取单元,用于获取多个被试信息中的关注点信息的坐标值信息,在时间序列上,关注点信息的坐标值信息按照生成的先后顺序排列;
第二获取单元,用于在全部被试信息中随机选取两个被试信息;
第一判定单元,用于在时间序列上,顺序对比这两个被选取的被试信息中的相关的关注点信 息的坐标值信息,当两个相关的关注点信息的坐标值信息中有且仅有一个落在规定区域内时, 引入扩充区域进行判定,当未落入规定区域内的关注点信息的坐标值信息落入扩充区域内时, 则判定这两个关注点信息的关系为相似;当两个相关的关注点信息的坐标值信息均未落在规 定区域内时,则计算这两个关注点信息之间的最小直线距离信息,当最小直线距离信息小于 等于判定阈值信息时,则判定这两个关注点信息的关系为相似;以及
第一计算单元,用于计算两个被选取的被试信息的相似度数值信息和/或计算每一个被试信息的平均相似度数值信息;
其中,每个被试信息中的关注点信息的坐标值信息均需与其他的被试信息中相关的关注点信息的坐标值信息进行关系判定。
6.一种相似度分析系统,其特征在于,所述系统包括: 一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如权利要求 1 至4中任意一项所述的相似度分析方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括:
程序,当所述程序被处理器运行时,如权利要求 1 至 4中任意一项所述的相似度分析方法被执行。
8.一种芯片,其特征在于,所述芯片包括处理器与数据接口,处理器通过数据接口读取存储器上存储的指令,以执行如权利要求 1 至4 中任一项所述的相似度分析方法。
CN202011283456.5A 2020-11-17 2020-11-17 一种相似度分析方法及系统 Active CN112200269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011283456.5A CN112200269B (zh) 2020-11-17 2020-11-17 一种相似度分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011283456.5A CN112200269B (zh) 2020-11-17 2020-11-17 一种相似度分析方法及系统

Publications (2)

Publication Number Publication Date
CN112200269A CN112200269A (zh) 2021-01-08
CN112200269B true CN112200269B (zh) 2021-09-17

Family

ID=74033896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011283456.5A Active CN112200269B (zh) 2020-11-17 2020-11-17 一种相似度分析方法及系统

Country Status (1)

Country Link
CN (1) CN112200269B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115686199B (zh) * 2022-10-11 2023-05-23 北京津发科技股份有限公司 一种群体眼动轨迹生成方法、装置、计算设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960624A (zh) * 2018-07-03 2018-12-07 深圳市和讯华谷信息技术有限公司 基于用户到访信息的网格相似度判定方法、装置和系统
CN109376205A (zh) * 2018-09-07 2019-02-22 顺丰科技有限公司 挖掘地址兴趣点关系的方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7199972B2 (ja) * 2019-01-11 2023-01-06 キヤノン株式会社 情報処理装置、情報処理方法、プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960624A (zh) * 2018-07-03 2018-12-07 深圳市和讯华谷信息技术有限公司 基于用户到访信息的网格相似度判定方法、装置和系统
CN109376205A (zh) * 2018-09-07 2019-02-22 顺丰科技有限公司 挖掘地址兴趣点关系的方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112200269A (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
Falotico et al. Fleiss’ kappa statistic without paradoxes
Genest et al. Utility functions predict variance and skewness risk preferences in monkeys
US20200356462A1 (en) Systems and methods for determining performance metrics of remote relational databases
CN114041796B (zh) 一种基于脑电波信号的专注力评估方法、装置及存储介质
Moran et al. Old processes, new perspectives: Familiarity is correlated with (not independent of) recollection and is more (not equally) variable for targets than for lures
CN112200269B (zh) 一种相似度分析方法及系统
Maruvka et al. Model for macroevolutionary dynamics
CN110688168A (zh) 提高应用程序启动速度方法、装置、设备及存储介质
CN111354463B (zh) 人体健康测量方法、装置、计算机设备及存储介质
CN111783830A (zh) 基于oct的视网膜分类方法、装置、计算机设备及存储介质
CN109299859A (zh) 数据的评测方法、装置、设备及存储介质
CN107633473B (zh) 基于虚拟现实的服务测评指标信度效度保证方法
Gu et al. Bayesian ROC curve estimation under binormality using a rank likelihood
CN110032781B (zh) 编辑时序约束方法、装置、计算机设备及存储介质
CN114879851B (zh) 一种基于虚拟现实的数据采集方法及系统
CN111147441A (zh) 网络购票的舞弊行为自动检测方法、设备及可读存储介质
CN115067944B (zh) 一种眼动状态评估方法、装置、终端设备及存储介质
CN110390999B (zh) 一种临床数据的值域计算方法、装置、可读介质及电子设备
CN112035361B (zh) 医疗诊断模型的测试方法、装置、计算机设备和存储介质
CN112488528A (zh) 数据集的处理方法、装置、设备和存储介质
Hu et al. Decision criteria in signal detection model are not based on the objective likelihood ratio.
CN112989183B (zh) 一种基于生命周期的产品信息推荐方法、装置及相关设备
Skotarczak et al. Entropy as a measure of dependency for categorized data
CN110693509A (zh) 一种案件相关性确定方法、装置、计算机设备和存储介质
CN112101121B (zh) 人脸敏感识别方法及装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant