CN117851464B - 一种用于心理评估的用户行为模式辅助分析方法 - Google Patents

一种用于心理评估的用户行为模式辅助分析方法 Download PDF

Info

Publication number
CN117851464B
CN117851464B CN202410256688.3A CN202410256688A CN117851464B CN 117851464 B CN117851464 B CN 117851464B CN 202410256688 A CN202410256688 A CN 202410256688A CN 117851464 B CN117851464 B CN 117851464B
Authority
CN
China
Prior art keywords
scale
target user
cluster
score
scales
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410256688.3A
Other languages
English (en)
Other versions
CN117851464A (zh
Inventor
杨卫东
王华昌
张春花
罗清军
马啸
张涵
王勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Howhaty Industrial And Commercial Co ltd
Original Assignee
Jinan Howhaty Industrial And Commercial Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Howhaty Industrial And Commercial Co ltd filed Critical Jinan Howhaty Industrial And Commercial Co ltd
Priority to CN202410256688.3A priority Critical patent/CN117851464B/zh
Publication of CN117851464A publication Critical patent/CN117851464A/zh
Application granted granted Critical
Publication of CN117851464B publication Critical patent/CN117851464B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,尤其涉及一种用于心理评估的用户行为模式辅助分析方法,该方法对用户‑量表测评分数矩阵进行聚类,得到至少一个聚类簇;确定目标用户所属的聚类簇,在目标用户所属的聚类簇中获取目标用户的预设数量个最近邻数据点;针对任一量表,根据目标用户与每个最近邻数据点之间的量表差异,获取量表的预测分数;根据所有量表的预测分数获取目标用户的推荐量表,利用推荐量表的分数值更新初始量表分数矩阵,并重新执行每个量表的预测分数的获取步骤,直至获取的推荐量表的数量满足预设的数量阈值,通过簇类可变化的迭代过程进行量表推荐的优化,从而获取到准确的量表推荐。

Description

一种用于心理评估的用户行为模式辅助分析方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用于心理评估的用户行为模式辅助分析方法。
背景技术
在心理评估的过程中,为了保证对目标用户的行为模式进行准确分析,需要对目标用户进行多方面的心理测评量表的测评,从而获取到准确的测评分析结果。由于心理测评量表的种类众多,且包括了不同的心理学领域,例如智力和认知能力量表、性格测试量表、情绪和心理健康量表、行为评估量表、自尊量表与生活满意度量表等等,在通过线上的心理咨询系统进行心理评估的过程中,心理咨询师无法针对于目标用户的实际行为与直观观测状态进行心理测评量表的选择,因此,需要通过基于基础量表测评结果的量表推荐过程,对多元心理评估过程中针对于用户未知的实际行为模式进行辅助分析。
现有技术中,在对目标用户进行心理评估时的量表推荐过程中,对已知的用户测评数据进行整理,获取每个用户针对于不同的心理测评量表所对应的分数矩阵,并将每一个分数矩阵作为一个多维空间中的数据点,以对若干个用户对应的数据点进行聚类过程,得到多个聚类簇,其目的是将已知的用户测量数据进行类别划分,进而针对于目标用户,分别获取目标用户的基础量表测评结果与多维空间中的每个聚类簇的簇类中心点之间的余弦相似度,进而确定目标用户所属的聚类簇,并在获取到目标用户所属的聚类簇之后,根据聚类簇的量表排名进行量表推荐。
但是,在实际心理评估过程中,目标用户在进行基础量表的测评之后,其测评结果所包含的维度较低,而量表推荐过程是一个扩展用户测评数据维度的过程,在完成一个量表的推荐且目标用户完成该量表的测评之后,其在多维空间中的簇类划分结果是会发生变化的,那么在簇类划分-量表推荐这一个迭代过程中,就需要通过待推荐量表在不同簇类中的差异性进行最优量表的确定,也就是在维度扩展过程中所推荐的量表应该是更可能造成聚类簇之间变化的量表,这样才能在连续的量表推荐过程中保证目标用户的聚类簇尽可能少的出现变化,从而保证后续量表推荐的准确性。
因此,如何在对目标用户的量表推荐过程中获取最优量表,以保证对目标用户进行迭代量表推荐的准确性成为亟需解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种用于心理评估的用户行为模式辅助分析方法,以解决如何在对目标用户的量表推荐过程中获取最优量表,以保证对目标用户进行迭代量表推荐的准确性的问题。
本发明实施例中提供了一种用于心理评估的用户行为模式辅助分析方法,该用户行为模式辅助分析方法包括以下步骤:
根据心理测评历史数据构建用户-量表测评分数矩阵,在构建的多维数据空间中对所述用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇;
获取目标用户的初始量表分数矩阵,根据所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,确定所述目标用户所属的聚类簇,在所述目标用户所属的聚类簇中获取所述目标用户的预设数量个最近邻数据点;
针对任一量表,根据所述目标用户所属的聚类簇与其他聚类簇之间的所述量表的分数值差异,获取所述量表的推荐优化因子,根据所述目标用户与每个所述最近邻数据点之间的所述量表的差异、所述目标用户所属的聚类簇中的所述量表以及所述量表的推荐优化因子,获取所述量表的预测分数;
根据所有量表的预测分数获取所述目标用户的推荐量表,利用所述推荐量表的分数值更新所述初始量表分数矩阵,并重新执行每个所述量表的预测分数的获取步骤,直至获取的所述推荐量表的数量满足预设的数量阈值。
进一步的,所述根据所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,确定所述目标用户所属的聚类簇,包括:
利用余弦相似度的计算公式分别获取所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,将最大相似度对应的聚类簇作为所述目标用户所属的聚类簇。
进一步的,所述在所述目标用户所属的聚类簇中获取所述目标用户的预设数量个最近邻数据点,包括:
利用余弦相似度的计算公式分别获取所述目标用户的初始量表分数矩阵与所述目标用户所属的聚类簇中的每个数据点之间的相似度,将所有的相似度按照从大到小排序,将排序后的前N个相似度对应的数据点作为所述目标用户的预设数量个最近邻数据点。
进一步的,所述根据所述目标用户所属的聚类簇与其他聚类簇之间的所述量表的分数值差异,获取所述量表的推荐优化因子,包括:
获取所述目标用户所属的聚类簇中所有数据点的所述量表之间的第一分数值均值,分别获取每个其他聚类簇中所有数据点的所述量表之间的第二分数值均值;
获取所述第一分数值均值与每个所述第二分数值均值之间的差值绝对值,得到差值绝对值的方差,对所述差值绝对值的方差进行归一化处理,得到对应的归一化值;
对每个所述差值绝对值进行归一化处理,得到对应的归一化结果,获取最大的归一化结果,将所述归一化值与所述最大的归一化结果之间的乘积作为所述量表的推荐优化因子。
进一步的,所述根据所述目标用户与每个所述最近邻数据点之间的所述量表的差异、所述目标用户所属的聚类簇中的所述量表以及所述量表的推荐优化因子,获取所述量表的预测分数,包括:
获取所有最近邻数据点之间的所述量表的分数值均值,针对任一最近邻数据点,获取所述最近邻数据点的所述量表的分数值与所述分数值均值之间的第一差值绝对值,将所述最近邻数据点与所述目标用户的初始量表分数矩阵之间的相似度作为所述最近邻数据点的权重;
根据每个所述最近邻数据点的权重,对所有最近邻数据点对应的第一差值绝对值进行加权求和,得到对应的加权求和结果;
获取所述目标用户所属的聚类簇中所有数据点的所述量表之间的目标分数值均值,获取所述加权求和结果与所述目标分数值均值之间的相加结果,将所述量表的推荐优化因子和所述相加结果之间的乘积作为所述量表的预测分数。
进一步的,所述根据所有量表的预测分数获取所述目标用户的推荐量表,包括:
对比所有量表的预测分数,获取最大的预测分数对应的量表作为所述目标用户的推荐量表。
进一步的,所述在构建的多维数据空间中对所述用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇,包括:
根据量表的种类数量构建对应的多维数据空间,一种量表对应一个维度,在所述多维数据空间中每个所述用户-量表测评分数矩阵对应一个数据点,利用K-means聚类算法对所述多维数据空间中的所有数据点进行聚类,得到至少一个聚类簇。
本发明实施例与现有技术相比存在的有益效果是:
本发明根据心理测评历史数据构建用户-量表测评分数矩阵,在构建的多维数据空间中对所述用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇;获取目标用户的初始量表分数矩阵,根据所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,确定所述目标用户所属的聚类簇,在所述目标用户所属的聚类簇中获取所述目标用户的预设数量个最近邻数据点;针对任一量表,根据所述目标用户所属的聚类簇与其他聚类簇之间的所述量表的分数值差异,获取所述量表的推荐优化因子,根据所述目标用户与每个所述最近邻数据点之间的所述量表的差异、所述目标用户所属的聚类簇中的所述量表以及所述量表的推荐优化因子,获取所述量表的预测分数;根据所有量表的预测分数获取所述目标用户的推荐量表,利用所述推荐量表的分数值更新所述初始量表分数矩阵,并重新执行每个所述量表的预测分数的获取步骤,直至获取的所述推荐量表的数量满足预设的数量阈值。其中,通过目标用户在多维数据空间中的近邻聚类簇之间的量表差异性进行推荐量表的优化,相较于通过单个聚类簇中的量表排序进行推荐,能够在量表推荐过程中保证所推荐量表结果可以增大目标用户与各个聚类簇之间相似度的差异,从而保证随着量表的测评过程目标用户的类别划分更加准确,从而提高了后续根据推荐量表对目标用户进行心理评估的全面性与准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种用于心理评估的用户行为模式辅助分析方法的方法流程图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
需要说明的是,本公开的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与本公开的一些方面相一致的装置和方法的例子。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明锁针对的具体场景为:在线上心理评估过程中,针对于每一个用户进行用于心理评估的心理测评量表的推荐。
参见图1,是本发明实施例一提供的一种用于心理评估的用户行为模式辅助分析方法的方法流程图,如图1所示,该用户行为模式辅助分析方法可以包括:
步骤S101,根据心理测评历史数据构建用户-量表测评分数矩阵,在构建的多维数据空间中对用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇。
在本发明实施例中,基于Python读取并清洗保存在数据库中的心理测评历史记录,一条历史记录对应一名用户的一项心理测评量表的测评分数,进而针对任一用户,将所述用户的多条历史记录整理为用户-量表测评分数矩阵,其中,在整理为用户-量表测评分数矩阵之前,对用户信息进行脱敏处理,也即将用户的个人信息映射为ID编号。
举例说明:以第i个用户的用户-量表测评分数矩阵为例,对应用户-量表测评分数矩阵为,其中,/>表示第i个用户的ID编号,/>表示第i个用户的第1个量表的测评分数,/>表示第i个用户的第2个量表的测评分数,/>表示第i个用户的第3个量表的测评分数,/>表示第i个用户的第j个量表的测评分数。
在得到每个用户的用户-量表测评分数矩阵之后,根据量表的种类数量构建对应的多维数据空间,一种量表对应一个维度,在所述多维数据空间中每个所述用户-量表测评分数矩阵对应一个数据点,利用K-means聚类算法对所述多维数据空间中的所有数据点进行聚类,得到至少一个聚类簇。值得说明的是,K-means聚类算法属于现有技术,此处不再赘述。
优选的,本发明实施例中令K-means聚类算法中的K值为20。
步骤S102,获取目标用户的初始量表分数矩阵,根据目标用户的初始量表分数矩阵与每个聚类簇的簇类中心点之间的相似度,确定目标用户所属的聚类簇,在目标用户所属的聚类簇中获取目标用户的预设数量个最近邻数据点。
在现有的量表推荐过程中,在获取到目标用户(所述的目标用户即为待测评用户,也就是本发明实施例中进行量表推荐所对应的用户)的初始量表测评结果之后,对目标用户的初始量表测评结果在多维数据空间中进行其所属聚类簇的判断,之后通过所属聚类簇中的各个量表对于目标用户的预测分数进行量表排序,从而进行量表推荐。
但是在量表推荐过程中,用户在每一个量表的测评结束后会因为新量表带来的测评结果导致的其在多维数据空间中所属的聚类簇发生变化,所以通过单次的聚类簇划分结果对目标用户进行量表推荐,会存在着量表推荐不准确的情况。故针对于这一情况,需要通过目标用户所属聚类簇的连续迭代进行目标用户所属聚类簇的判断,从而保证量表的推荐越来越准确。
又考虑到在每一次完成聚类簇划分之后,为了保证所推荐的量表既可以在预测结果方面更适合目标用户,又可以通过该新增量表更加确定目标用户的所属聚类簇,即需要在目标用户的聚类簇迭代过程中,通过目标用户在多维数据空间中的近邻聚类簇之间的量表差异性进行量表推荐的优化,从而在聚类簇迭代过程中增加目标用户由低维度数据点到高维度数据点的聚类簇确定性,以此保证量表推荐的准确性。
因此,本发明实施例中,在对心理测评历史数据进行用户的聚类簇划分之后,针对当前测评的目标用户,在该目标用户完成基础的心理测评量表之后,即可获取到目标用户的初始量表分数矩阵,且初始量表分数矩阵会随着目标用户的后续测评进行维度扩展。
在得到目标用户的初始量表分数矩阵之后,即可根据目标用户的初始量表分数矩阵与每个聚类簇的簇类中心点之间的相似度,确定目标用户所属的聚类簇,则具体过程为:利用余弦相似度的计算公式分别获取所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,将最大相似度对应的聚类簇作为所述目标用户所属的聚类簇。
在一实施方式中,目标用户的初始量表分数矩阵与第c个聚类簇的簇类中心点之间的相似度的计算表达式为:
其中,表示目标用户的初始量表分数矩阵/>与第c个聚类簇的簇类中心点之间的相似度,/>表示第c个聚类簇的簇类中心点所对应的用户-量表测评分数矩阵,S表示第S个量表,Q表示目标用户与第c个聚类簇的簇类中心点所对应的用户之间测评过的量表交集,/>表示目标用户的第S个量表对应的测评分数值。
需要说明的是,上述公式属于余弦相似度的计算公式,属于现有技术,此处不再赘述。
同理,利用上述公式能够获取目标用户的初始量表分数矩阵与每个聚类簇的簇类中心点之间的相似度,进而将相似度最大所对应的聚类簇作为目标用户所属的聚类簇。
进一步的,在确定了目标用户所属的聚类簇之后,即可根据所属聚类簇进行目标用户的最近邻用户的判断,所述最近邻用户判断的目的是在多维数据空间中每一个聚类簇中都包括了一个范围内的用户数据点,目标用户在确定属于聚类簇之后,还需要进一步通过所属聚类中的近邻数据点进行后续量表推荐的判断,因此,本发明实施例中,在目标用户所属的聚类簇中获取目标用户的预设数量个最近邻数据点。
优选的,在目标用户所属的聚类簇中获取目标用户的预设数量个最近邻数据点,包括:
利用余弦相似度的计算公式分别获取所述目标用户的初始量表分数矩阵与所述目标用户所属的聚类簇中的每个数据点之间的相似度,将所有的相似度按照从大到小排序,将排序后的前N个相似度对应的数据点作为所述目标用户的预设数量个最近邻数据点。
在一实施方式中,参照上述目标用户的初始量表分数矩阵与第c个聚类簇的簇类中心点之间的相似度的计算表达式,分别获取目标用户的初始量表分数矩阵与目标用户所属的聚类簇中的每个数据点对应的用户-量表测评分数矩阵之间的相似度,然后对所有相似度进行从大到小排序,将排序后的前10个相似度对应的数据点作为目标用户的最近邻数据点,也即确定了目标用户在所属聚类簇中的最近邻用户。
步骤S103,针对任一量表,根据目标用户所属的聚类簇与其他聚类簇之间的量表的分数值差异,获取量表的推荐优化因子,根据目标用户与每个最近邻数据点之间的量表的差异、目标用户所属的聚类簇中的量表以及量表的推荐优化因子,获取量表的预测分数。
在确定了目标用户所属的聚类簇和最近邻数据点之后,针对任一量表,根据该量表在目标用户所属的聚类簇和其他聚类簇之间的分数值差异,获取该量表的推荐优化因子,则推荐优化因子的获取方法,包括:
获取所述目标用户所属的聚类簇中所有数据点的所述量表之间的第一分数值均值,分别获取每个其他聚类簇中所有数据点的所述量表之间的第二分数值均值;
获取所述第一分数值均值与每个所述第二分数值均值之间的差值绝对值,得到差值绝对值的方差,对所述差值绝对值的方差进行归一化处理,得到对应的归一化值;
对每个所述差值绝对值进行归一化处理,得到对应的归一化结果,获取最大的归一化结果,将所述归一化值与所述最大的归一化结果之间的乘积作为所述量表的推荐优化因子。
在一实施方式中,以第S个量表为例,第S个量表的推荐优化因子的计算表达式为:
其中,表示第S个量表的推荐优化因子,/>表示最大值函数,/>表示归一化函数,/>表示目标用户所属的聚类簇中所有数据点的第S个量表之间的分数值均值,也即是第一分数值均值,/>表示除目标用户所属的聚类簇之外的第c个聚类簇中所有数据点的第S个量表之间的分数值均值,也即是第二分数值均值,/>表示方差函数。
需要说明的是,获取推荐优化因子的目的是对根据聚类簇之间的量表得分差异进行每一个量表的量表推荐优化,因此,首先通过目标用户所属聚类簇中第S个量表的分数值均值与其他聚类簇中的该量表的分数值均值差异进行评估,通过对每一个其他聚类簇的分数值均值差异进行线性归一化/>,并从中选择分数值均值差异最大的聚类簇对应的归一化结果/>作为第一评估标准;并在此基础上,针对于量表的推荐优化过程,其目的不仅是确定与目标用户所属聚类簇差异最大的量表(更可能造成簇类划分的变化),还需要确定在所有量表中每个量表在每个聚类簇中的分数值波动最高的量表,也就是对于第S个量表,目标用户所属聚类簇的分数值与其他聚类簇的分数值之间差异的方差越高,则说明第S个量表更需要优先进行推荐,从而在下次迭代中更准确地进行目标用户的聚类簇更新。
在确定了第S个量表的推荐优化因子之后,即可在第S个量表的预测分数过程中,通过第S个量表的推荐优化因子对第S个量表的预测分数进行优化,从而保证在基于量表预测分数排序的量表推荐过程中,可以在获取到测评结果之后进一步确定目标用户的所属聚类簇(加强目标用户的聚类簇划分的确定性),这样在后续的量表推荐过程中即可以更加准确地进行量表推荐。因此,针对第S个量表,根据目标用户与每个最近邻数据点之间的量表的差异、目标用户所属的聚类簇中的量表以及量表的推荐优化因子,获取量表的预测分数,则预测分数的获取方法,包括:
获取所有最近邻数据点之间的所述量表的分数值均值,针对任一最近邻数据点,获取所述最近邻数据点的所述量表的分数值与所述分数值均值之间的第一差值绝对值,将所述最近邻数据点与所述目标用户的初始量表分数矩阵之间的相似度作为所述最近邻数据点的权重;
根据每个所述最近邻数据点的权重,对所有最近邻数据点对应的第一差值绝对值进行加权求和,得到对应的加权求和结果;
获取所述目标用户所属的聚类簇中所有数据点的所述量表之间的目标分数值均值,获取所述加权求和结果与所述目标分数值均值之间的相加结果,将所述量表的推荐优化因子和所述相加结果之间的乘积作为所述量表的预测分数。
在一实施方式中,第S个量表的预测分数的计算表达式:
其中,表示目标用户的第S个量表的预测分数,/>表示第S个量表的推荐优化因子,/>表示目标用户所属的聚类簇中所有数据点的第S个量表之间的分数值均值,/>表示第j个最近邻数据点对应的用户-量表测评分数矩阵与所述目标用户的初始量表分数矩阵之间的相似度,/>表示第j个最近邻数据点对应的用户-量表测评分数矩阵中的第S个量表的分数值,/>表示所有最近邻数据点对应的用户-量表测评分数矩阵中的第S个量表的分数值均值。
需要说明的是,针对于目标用户对于第S个量表的预测分数,通过目标用户在所属聚类簇中的10个最近邻数据点(也即是最近邻用户)对应的第S个量表的分数值作为评估基础,之后通过每一个最近邻用户与目标用户的相似度,对每个最近邻用户的第S个量表的分数值与所有最近邻用户的第S个量表的分数值均值之间的分数值差异进行加权,并进行累加,并将累加结果加到均值评估上,最后通过第S个量表的推荐优化因子进行预测分数的调整。
至此,能够得到目标用户对于第S个量表的预测分数,进而根据第S个量表的预测分数的获取方法,分别获取目标用户对于每个量表的预测分数,预测分数越大,对应量表被推荐给目标用户的概率越大。
步骤S104,根据所有量表的预测分数获取目标用户的推荐量表,利用推荐量表的分数值更新初始量表分数矩阵,并重新执行每个量表的预测分数的获取步骤,直至获取的推荐量表的数量满足预设的数量阈值。
由步骤S103可知,预测分数越大,对应量表被推荐给目标用户的概率越大,因此,对比所有量表的预测分数,获取最大的预测分数对应的量表作为目标用户的推荐量表。在得到用户的推荐量表之后,将推荐量表实时推荐给目标用户,在目标用户完成该推荐量表的测评之后,得到该推荐量表的分数值,此时,将该推荐量表的分数值添加到目标用户的初始量表分数矩阵中,即可增加目标用户的初始量表分数矩阵的维度,进而完成了对目标用户的初始量表分数矩阵的更新。
在目标用户的初始量表分数矩阵更新之后,即可重新执行步骤S102-S104,迭代获取目标用户的推荐量表,在对目标用户进行量表推荐从而完成心理评估的过程中,需要对用户进行推荐量表的数量限制,本发明实施例中通过对用户在开始心理评估是设定的量表数量作为预设的数量阈值,当目标用户通过迭代过程获取的推荐量表的数量等于预设的数量阈值之后,即可停止量表推荐,从而完成完整的量表推荐过程,进而可根据推荐量表完成目标用户的心理评估。
综上所述,本发明实施例根据心理测评历史数据构建用户-量表测评分数矩阵,在构建的多维数据空间中对所述用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇;获取目标用户的初始量表分数矩阵,根据所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,确定所述目标用户所属的聚类簇,在所述目标用户所属的聚类簇中获取所述目标用户的预设数量个最近邻数据点;针对任一量表,根据所述目标用户所属的聚类簇与其他聚类簇之间的所述量表的分数值差异,获取所述量表的推荐优化因子,根据所述目标用户与每个所述最近邻数据点之间的所述量表差异、所述目标用户所属的聚类簇中的所述量表以及所述量表的推荐优化因子,获取所述量表的预测分数;根据所有量表的预测分数获取所述目标用户的推荐量表,利用所述推荐量表的分数值更新所述初始量表分数矩阵,并重新执行每个所述量表的预测分数的获取步骤,直至获取的所述推荐量表的数量满足预设的数量阈值。其中,通过目标用户在多维数据空间中的近邻聚类簇之间的量表差异性进行推荐量表的优化,相较于通过单个聚类簇中的量表排序进行推荐,能够在量表推荐过程中保证所推荐量表结果可以增大目标用户与各个聚类簇之间相似度的差异,从而保证随着量表的测评过程目标用户的类别划分更加准确,从而提高了后续根据推荐量表对目标用户进行心理评估的全面性与准确性。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (5)

1.一种用于心理评估的用户行为模式辅助分析方法,其特征在于,所述一种用于心理评估的用户行为模式辅助分析方法包括:
根据心理测评历史数据构建用户-量表测评分数矩阵,在构建的多维数据空间中对所述用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇;
获取目标用户的初始量表分数矩阵,根据所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,确定所述目标用户所属的聚类簇,在所述目标用户所属的聚类簇中获取所述目标用户的预设数量个最近邻数据点;
针对任一量表,根据所述目标用户所属的聚类簇与其他聚类簇之间的所述量表的分数值差异,获取所述量表的推荐优化因子,根据所述目标用户与每个所述最近邻数据点之间的所述量表的差异、所述目标用户所属的聚类簇中的所述量表以及所述量表的推荐优化因子,获取所述量表的预测分数;
根据所有量表的预测分数获取所述目标用户的推荐量表,利用所述推荐量表的分数值更新所述初始量表分数矩阵,并重新执行每个所述量表的预测分数的获取步骤,直至获取的所述推荐量表的数量满足预设的数量阈值;
所述根据所述目标用户所属的聚类簇与其他聚类簇之间的所述量表的分数值差异,获取所述量表的推荐优化因子,包括:
获取所述目标用户所属的聚类簇中所有数据点的所述量表之间的第一分数值均值,分别获取每个其他聚类簇中所有数据点的所述量表之间的第二分数值均值;
获取所述第一分数值均值与每个所述第二分数值均值之间的差值绝对值,得到差值绝对值的方差,对所述差值绝对值的方差进行归一化处理,得到对应的归一化值;
对每个所述差值绝对值进行归一化处理,得到对应的归一化结果,获取最大的归一化结果,将所述归一化值与所述最大的归一化结果之间的乘积作为所述量表的推荐优化因子;
所述根据所述目标用户与每个所述最近邻数据点之间的所述量表的差异、所述目标用户所属的聚类簇中的所述量表以及所述量表的推荐优化因子,获取所述量表的预测分数,包括:
获取所有最近邻数据点之间的所述量表的分数值均值,针对任一最近邻数据点,获取所述最近邻数据点的所述量表的分数值与所述分数值均值之间的第一差值绝对值,将所述最近邻数据点与所述目标用户的初始量表分数矩阵之间的相似度作为所述最近邻数据点的权重;
根据每个所述最近邻数据点的权重,对所有最近邻数据点对应的第一差值绝对值进行加权求和,得到对应的加权求和结果;
获取所述目标用户所属的聚类簇中所有数据点的所述量表之间的目标分数值均值,获取所述加权求和结果与所述目标分数值均值之间的相加结果,将所述量表的推荐优化因子和所述相加结果之间的乘积作为所述量表的预测分数。
2.根据权利要求1所述的一种用于心理评估的用户行为模式辅助分析方法,其特征在于,所述根据所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,确定所述目标用户所属的聚类簇,包括:
利用余弦相似度的计算公式分别获取所述目标用户的初始量表分数矩阵与每个所述聚类簇的簇类中心点之间的相似度,将最大相似度对应的聚类簇作为所述目标用户所属的聚类簇。
3.根据权利要求1所述的一种用于心理评估的用户行为模式辅助分析方法,其特征在于,所述在所述目标用户所属的聚类簇中获取所述目标用户的预设数量个最近邻数据点,包括:
利用余弦相似度的计算公式分别获取所述目标用户的初始量表分数矩阵与所述目标用户所属的聚类簇中的每个数据点之间的相似度,将所有的相似度按照从大到小排序,将排序后的前N个相似度对应的数据点作为所述目标用户的预设数量个最近邻数据点。
4.根据权利要求1所述的一种用于心理评估的用户行为模式辅助分析方法,其特征在于,所述根据所有量表的预测分数获取所述目标用户的推荐量表,包括:
对比所有量表的预测分数,获取最大的预测分数对应的量表作为所述目标用户的推荐量表。
5.根据权利要求1所述的一种用于心理评估的用户行为模式辅助分析方法,其特征在于,所述在构建的多维数据空间中对所述用户-量表测评分数矩阵进行聚类,得到至少一个聚类簇,包括:
根据量表的种类数量构建对应的多维数据空间,一种量表对应一个维度,在所述多维数据空间中每个所述用户-量表测评分数矩阵对应一个数据点,利用K-means聚类算法对所述多维数据空间中的所有数据点进行聚类,得到至少一个聚类簇。
CN202410256688.3A 2024-03-07 2024-03-07 一种用于心理评估的用户行为模式辅助分析方法 Active CN117851464B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410256688.3A CN117851464B (zh) 2024-03-07 2024-03-07 一种用于心理评估的用户行为模式辅助分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410256688.3A CN117851464B (zh) 2024-03-07 2024-03-07 一种用于心理评估的用户行为模式辅助分析方法

Publications (2)

Publication Number Publication Date
CN117851464A CN117851464A (zh) 2024-04-09
CN117851464B true CN117851464B (zh) 2024-05-14

Family

ID=90538489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410256688.3A Active CN117851464B (zh) 2024-03-07 2024-03-07 一种用于心理评估的用户行为模式辅助分析方法

Country Status (1)

Country Link
CN (1) CN117851464B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506480A (zh) * 2017-09-13 2017-12-22 浙江工业大学 一种基于评论挖掘与密度聚类的双层图结构推荐方法
WO2019161592A1 (zh) * 2018-02-26 2019-08-29 大连理工大学 一种利用聚类自动提取结构模态参数的方法
WO2020073534A1 (zh) * 2018-10-12 2020-04-16 平安科技(深圳)有限公司 基于重聚类的推送方法、装置、计算机设备及存储介质
WO2020155756A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于聚类和sse的异常点比例优化方法及装置
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN113807612A (zh) * 2021-10-13 2021-12-17 四川久远银海软件股份有限公司 一种基于心理量表数据的预测方法和装置
CN115994271A (zh) * 2023-01-12 2023-04-21 武汉大学 心理测评量表的推荐方法
CN117035948A (zh) * 2023-10-10 2023-11-10 山东唐和智能科技有限公司 基于大数据的任务智能处理方法及系统
CN117352114A (zh) * 2023-10-16 2024-01-05 北京心企领航科技有限公司 一种基于聚类算法的心理测评量表的推荐方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506480A (zh) * 2017-09-13 2017-12-22 浙江工业大学 一种基于评论挖掘与密度聚类的双层图结构推荐方法
WO2019161592A1 (zh) * 2018-02-26 2019-08-29 大连理工大学 一种利用聚类自动提取结构模态参数的方法
WO2020073534A1 (zh) * 2018-10-12 2020-04-16 平安科技(深圳)有限公司 基于重聚类的推送方法、装置、计算机设备及存储介质
WO2020155756A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于聚类和sse的异常点比例优化方法及装置
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN113807612A (zh) * 2021-10-13 2021-12-17 四川久远银海软件股份有限公司 一种基于心理量表数据的预测方法和装置
CN115994271A (zh) * 2023-01-12 2023-04-21 武汉大学 心理测评量表的推荐方法
CN117035948A (zh) * 2023-10-10 2023-11-10 山东唐和智能科技有限公司 基于大数据的任务智能处理方法及系统
CN117352114A (zh) * 2023-10-16 2024-01-05 北京心企领航科技有限公司 一种基于聚类算法的心理测评量表的推荐方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Behavioral modeling for mental health using machine learning algorithms";Srividya, M.等;《Journal of medical systems》;20181231;第42卷;全文 *
一种融合聚类与用户兴趣偏好的协同过滤推荐算法;何明;孙望;肖润;刘伟世;;计算机科学;20171115(第S2期);全文 *
基于项目评分与类型评分聚类的推荐算法;段元波;高茂庭;;计算机工程;20180615(第06期);全文 *

Also Published As

Publication number Publication date
CN117851464A (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
An et al. Rule quality measures for rule induction systems: Description and evaluation
CN110852755B (zh) 针对交易场景的用户身份识别方法和装置
CN110674993A (zh) 一种用户负荷短期预测方法和装置
CN111553127A (zh) 一种多标记的文本类数据特征选择方法及装置
CN115828140A (zh) 邻域互信息与随机森林相融合故障检测方法、系统及应用
CN115994271A (zh) 心理测评量表的推荐方法
CN111309577B (zh) 一种面向Spark的批处理应用执行时间预测模型构建方法
CN112989621A (zh) 一种模型性能评价方法、装置、设备及存储介质
CN117391258B (zh) 一种负碳排放的预测方法、装置、设备及存储介质
CN110956331A (zh) 数字工厂运营状态预测方法、系统、装置
CN117851464B (zh) 一种用于心理评估的用户行为模式辅助分析方法
Puspadini et al. Feature SELECTION on K-nearest neighbor algorithm using similarity measure
CN116245259B (zh) 基于深度特征选择的光伏发电预测方法、装置和电子设备
Tamvakis et al. Optimized classification predictions with a new index combining machine learning algorithms
An et al. Rule quality measures improve the accuracy of rule induction: an experimental approach
CN117076691A (zh) 一种面向智慧社区的商品资源知识图谱算法模型
JP2021192155A (ja) 異常検知支援プログラム、異常検知支援方法および異常検知支援システム
CN108305174B (zh) 资源处理方法、装置、存储介质和计算机设备
CN113177608B (zh) 一种针对不完整数据的近邻模型特征选择方法及装置
CN110265151B (zh) 一种基于ehr中异构时态数据的学习方法
Shujaaddeen et al. A New Machine Learning Model for Detecting levels of Tax Evasion Based on Hybrid Neural Network
Hodapp Unsupervised learning for computational phenotyping
CN112347162A (zh) 一种基于在线学习的多元时序数据规则挖掘方法
CN112562854A (zh) 一种高龄人员精准医疗关怀服务推荐方法及系统
Sitepu et al. Analysis of Fuzzy C-Means and Analytical Hierarchy Process (AHP) Models Using Xie-Beni Index

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant