CN114860922B

CN114860922B - 心理测评量表的分类模型获取方法、筛查方法及系统

Info

Publication number: CN114860922B
Application number: CN202210321720.2A
Authority: CN
Inventors: 王菲; 张锡哲; 魏鑫茹
Original assignee: Nanjing Brain Hospital
Current assignee: Nanjing Brain Hospital
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2023-04-18
Anticipated expiration: 2042-03-25
Also published as: CN114860922A

Abstract

本发明涉及心理测评量表的分类模型获取方法、筛查方法及系统，心理测评量表的分类模型获取方法包括：S1：获取心理测评量表数据库，心理测评量表数据库中包含预训练心理测评量表的响应时间及无标签心理测评量表的响应时间。S2：利用预训练心理测评量表的响应时间以及分类标签构建并训练初始神经网络分类器。S3：对无标签心理测评量表的响应时间进行降维得到低维特征，采用聚类方法将低维特征聚为两类，并为每类低维特征对应的无标签心理测评量表标记上聚类标签。S4：将无标签心理测评量表的响应时间以及聚类标签对初始神经网络分类器进行训练得到分类模型。分类模型对新的无标签心理测评量表分类并判断是否为有效的心理测评量表。

Description

心理测评量表的分类模型获取方法、筛查方法及系统

技术领域

本发明涉及领域，尤其涉及心理测评量表的分类模型获取方法、筛查方法及系统。

背景技术

心理测评量表是心理/精神疾病患者必完成的一项心理测试工作。根据载体的不同，心理测评量表可分为纸质的问答式心理测评量表及网络式心理测评量表。纸质的问答式心理测评量表即为传统的心理测评量表方式，通过精神科医生以问答的方式完成测评。随着信息技术的飞速发展及互联网的普及，网络式心理测评量表因成本低、操作方便、实效性强等优势，逐渐取代传统的纸质心理测评。

然而两种心理量表测评方式皆存在严重的数据质量把控问题，一部分患者因短时情绪因素，或者为节省时间和精力等自身因素，会对心理测评中的部分问题进行不经思考的随意性作答，这就导致了低质量心理测评数据的产生，低质量的心理测评数据的存在会严重影响整体样本的数据分析，最终严重影响数据分析结果的准确性，尤其是在医学研究领域中，被调查者的心理评估量表的数据质量不仅会影响医生对该调查者的病情把控，同时也会影响基于此评估量表进行数据分析结果的准确性。因此，识别异常作答的低质量心理样本数据，从而提高心理量表样本的整体质量是非常必要的。

在心理量表测评中，被调查者对量表中每个问题的答题时间反映了被调查者思考问题的过程。这种答题响应时间可以用来评估被调查者回答心理测评量表的质量。例如，过长的反应时可能与对答案的不确定相关，而过短的反应时则提示被试对快速完成心理测评的意愿强于认真完成测评的意愿。对于心理测评而言，这些异常答题模式均对所收集数据的质量有影响。因此，有效的利用被调查者回答问题的响应时间可以用来筛选无效的量表。

发明内容

(一)要解决的技术问题

本发明提供了心理测评量表的分类模型获取方法、筛查方法及系统，旨在解决现有心理量表测评过程中存在少量无效心理测评量表，从而提高量表测评结果整体质量的问题。

(二)技术方案

为了解决上述问题，本发明提供了一种心理测评量表分类模型获取方法，所述心理测评量表的分类模型获取方法包括以下步骤：

S1：获取心理测评量表数据库，所述心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间，所述预训练心理测评量表为已知分类标签的心理测评量表，所述无标签心理测评量表为无标签的心理测评量表，所述响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间，所述分类标签用于表示所述心理测评量表是否为有效心理测评量表；

S2：利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练，所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间；

S3：对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征，采用聚类方法将所述低维特征聚为两类，并为每类所述低维特征对应的无标签心理测评量表标记上聚类标签，所述聚类标签用于表示对应心理测评量表是否为有效心理测评量表；

S4：将所述无标签心理测评量表的响应时间作为所述初始神经网络分类器的输入，并对所述初始神经网络分类器进行训练，利用所述聚类标签对所述初始神经网络分类器的训练进行监督得到分类模型，所述分类模型用于对心理测评量表进行筛选。

优选地，所述初始神经网络分类器包括：输入层、隐藏层以及输出层；

其中，输入层和隐藏层均使用Relu作为激活函数，输出层使用sigmoid作为激活函数。

优选地，选取准确率作为所述初始神经网络分类器的优化指标，以交叉熵函数作为所述初始神经网络分类器的损失函数；

所述初始神经网络分类器的损失函数为：

其中，L_y表示所述初始神经网络分类器在预测所述具有分类标签的心理测评量表的类型时的损失函数；y_i为第i个心理测评量表的分类标签，p_i表示第i个心理测评量表预测为正常心理测评量表的概率，n表示所述心理测评量表数据库中具有分类标签的心理测评量表的数量。

优选地，所述心理测评量表的分类模型获取方法还包括：

S5：对所述分类模型进行再次训练；

S5-1：将所述完成上一次训练的分类模型的第一层网络提取的特征作为低维聚类特征；

S5-2：采用聚类方法将所述低维聚类特征聚为两类，并更新每类所述低维聚类特征对应的无标签心理测评量表上的聚类标签；

S5-3：采用无标签心理测评量表的响应时间以及更新后的聚类标签对分类模型进行监督训练并调整所述分类模型的参数；

S5-4：重复S5-1～S5-3，直到本次分类模型第一层网络提取的低维聚类特征与上一次分类模型第一层网络提取的低维聚类特征之间的差异小于预设值。

优选地，所述利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练具体为：

将心理测评量表数据库中预训练心理测评量表的响应时间平均分为K个子样本，并分别记作子样本(1)、子样本(2)、...、子样本(i)...子样本(K)；

对初始神经网络分类器进行K次迭代训练，其中第i次迭代训练的情况是将子样本(i)作为初始神经网络分类器的测试集，其余的K-1个子样本作为初始神经网络分类器的训练集。

优选地，所述对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征具体为：

采用基于深度学习的自编码器对心理测评量表数据库中所有心理测评量表的响应时间进行降维得到低维特征；

所述采用聚类方法将所述低维特征聚为两类具体为：

采用Kmean聚类方法对所述低维特征进行聚类，并设置K＝2。

优选地，本发明还提供了一种心理测评量表的筛查方法，所述心理测评量表的筛查方法包括：

获取待筛选的心理测评量表的响应时间；

将当前获取到的所述响应时间输入到分类模型中，根据所述分类模型的输出确定待筛选的心理测评量表是否为无效心理测评量表，所述分类模型为上述的分类模型。

优选地，本发明还提供了一种心理测评量表的分类模型获取系统，心理测评量表的分类模型获取系统包括：

数据库访问模块，用于获取心理测评量表数据库，所述心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间，所述预训练心理测评量表为已知分类标签的心理测评量表，所述无标签心理测评量表为无标签的心理测评量表，所述响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间，所述分类标签用于表示所述心理测评量表是否为有效心理测评量表；

初始训练模块，利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练，所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间；

降维与聚类模块，对心理测评量表数据库中无标签的心理测评量表的响应时间进行降维得到低维特征，采用聚类方法将所述低维特征聚为两类，并为每类所述低维特征对应的无标签心理测评量表标记上聚类标签，所述聚类标签用于表示对应心理测评量表是否为有效心理测评量表；

二次训练模块，用于将所述无标签心理测评量表的响应时间作为所述初始神经网络分类器的输入，并对所述初始神经网络分类器进行训练，利用所述聚类标签对所述初始神经网络分类器的训练进行监督得到分类模型，所述分类模型用于对心理测评量表进行筛选。

(三)有益效果

本发明利用被试回答心理测评量表问题的响应时间，作为被试心理测评量表质量的特征，通过训练神经网络分类器，能够有效的区分认真回答的心理测评量表和不认真回答的心理测评量表，从而提高量表测评问卷的准确性。

附图说明

图1为本发明心理测评量表的分类模型获取方法的流程图；

图2为本发明步骤S5的流程图。

具体实施方式

为了更好的解释本发明，以便于理解，下面结合附图，通过具体实施方式，对本发明作详细描述。

需要说明，本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“连接”、“固定”等应做广义理解，例如，“固定”可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

如图1所示，本发明提供了一种心理测评量表的分类模型获取方法，心理测评量表的分类模型获取方法包括以下步骤：

S1：获取心理测评量表数据库，心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间，预训练心理测评量表为已知分类标签的心理测评量表，无标签心理测评量表为无标签的心理测评量表，响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间，分类标签用于表示心理测评量表是否为有效心理测评量表；

其中，利用分类标签的值的不同来分别代表有效心理测评量表和无效心理测评量表(例如用标签值为1的心理测评量表为有效心理测评量表，标签值为-1的心理测评量表为无效心理测评量表)，在心理测评量表数据库中，已知分类标签的预训练心理测评量表是代表已经被人为确认过是否为有效的心理测评量表，在心理测评量表数据库中，预训练心理测评量表的数量远远小于无标签心理测评量表的数量。

S2：利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练，初始神经网络分类器的输入值为预训练心理测评量表的响应时间。

对初始神经网络分类器的训练过程可以为：向初始神经网络分类器输入响应时间，根据初始神经网络分类器的输出值与对应心理测评量表的标签进行比较，然后调整初始神经网络分类器的参数，重复多次直到满足要求。

S3：对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征，采用聚类方法将低维特征聚为两类，并为每类低维特征对应的无标签心理测评量表标记上聚类标签，聚类标签用于表示对应心理测评量表是否为有效心理测评量表；

S4：将无标签心理测评量表的响应时间作为初始神经网络分类器的输入，并对初始神经网络分类器进行训练，利用聚类标签对初始神经网络分类器的训练进行监督得到分类模型，分类模型用于对心理测评量表进行筛选。

本发明先用小样本的数据(即心理测评量表数据库中预训练心理测评量表的响应时间)来训练初始神经网络分类器，然后对大样本的数据(即心理测评量表数据库中无标签心理测评量表的响应时间)进行降维和聚类，然后为大量的无标签心理测评量表标记上聚类标签，最后用具有聚类标签的心理测评量表的响应时间来对神经网络分类模型进行训练得到分类模型，整个分类模型的获取过程，并不需要人工为大批量的心理测评量表标记上分类标签，最大限度地避免了小样本训练分类模型的模式局限性，确保了分类模型对心理测评量表的筛选的准确性。

在优选的实施方案中，初始神经网络分类器包括：输入层、隐藏层以及输出层，每一层均添加了L1正则化方法防止过拟合的产生。其中，输入层和隐藏层均使用Relu作为激活函数，输出层使用sigmoid作为激活函数。

选取准确率作为初始神经网络分类器的优化指标，以交叉熵函数作为初始神经网络分类器的损失函数；

初始神经网络分类器的损失函数为：

其中，L_y表示初始神经网络分类器在预测具有分类标签的心理测评量表的类型时的损失函数；y_i为第i个心理测评量表的分类标签，p_i表示第i个心理测评量表预测为正常心理测评量表的概率，n表示心理测评量表数据库中具有分类标签的心理测评量表的数量。

在另外的实施方案中，如图2所示，心理测评量表的分类模型获取方法还包括：

S5：对分类模型进行再次训练；

S5-1：将完成上一次训练的分类模型的第一层网络提取的特征作为低维聚类特征；

S5-2：采用聚类方法将低维聚类特征聚为两类，并更新每类低维聚类特征对应的无标签心理测评量表上的聚类标签；

S5-3：采用无标签心理测评量表的响应时间以及更新后的聚类标签对分类模型进行监督训练并调整分类模型的参数；

在本实施方案中，仅进行一次分类训练可能导致结果的不稳定，因此，我们提取上一次训练好的分类模型第一层的网络特征进行聚类，并依然采用聚类结果对分类模型进行再一次监督训练，反复执行特征提取及聚类过程，直至分类效果稳定，此时得到理论上最佳的分类模型。用聚类的结果指导分类模型的训练过程，然后采用这种反复迭代的过程完成模型的训练，能够使分类模型的准确率得到进一步的提升。另外分类模型的性能还可以采用五折交叉验证的方法来评估，通过混淆矩阵、ROC曲线以及分类准确率来衡量分类模型的性能。

进一步地，利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练具体为：

采用K折交叉验证的方法来完成初始神经分类模型的训练，使得初始神经分类模型能够避免为了追求高准确率而在训练集上产生过拟合，从而使得模型在样本外的数据上预测准确率高。

最后，对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征具体为：

采用聚类方法将低维特征聚为两类具体为：

采用Kmean聚类方法对低维特征进行聚类，并设置K＝2。

本发明还提供了一种心理测评量表的筛查方法，心理测评量表的筛查方法包括：

获取待筛选的心理测评量表的响应时间；

将当前获取到的相应时间数据输入到分类模型中，根据分类模型的输出确定待筛选的心理测评量表是否为无效心理测评量表，分类模型为如上述的分类模型。

本发明还提供了一种心理测评量表的分类模型获取系统，心理测评量表的分类模型获取系统包括：

数据库访问模块，用于获取心理测评量表数据库，心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间，预训练心理测评量表为已知分类标签的心理测评量表，无标签心理测评量表为无标签的心理测评量表，响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间，分类标签用于表示心理测评量表是否为有效心理测评量表；

初始训练模块，用于利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练，初始神经网络分类器的输入值为预训练心理测评量表的响应时间；

降维与聚类模块，对心理测评量表数据库中无标签的心理测评量表的响应时间进行降维得到低维特征，采用聚类方法将低维特征聚为两类，并为每类低维特征对应的无标签心理测评量表标记上聚类标签，聚类标签用于表示对应心理测评量表是否为有效心理测评量表；

二次训练模块，用于将无标签心理测评量表的响应时间作为初始神经网络分类器的输入，并对初始神经网络分类器进行训练，利用聚类标签对初始神经网络分类器的训练进行监督得到分类模型，分类模型用于对心理测评量表进行筛选。

本发明还提供了一种心理测评量表的分类模型获取设备，包括：

至少一个数据库；

以及与至少一个数据库通信连接的存储器；

其中，存储器存储有可被至少一个数据库执行的指令，指令被至少一个数据库执行，以使至少一个数据库能够执行如上述的心理测评量表的分类模型获取方法。

需要理解的是，以上对本发明的具体实施例进行的描述只是为了说明本发明的技术路线和特点，其目的在于让本领域内的技术人员能够了解本发明的内容并据以实施，但本发明并不限于上述特定实施方式。凡是在本发明权利要求的范围内做出的各种变化或修饰，都应涵盖在本发明的保护范围内。

Claims

1.一种心理测评量表分类模型获取方法，其特征在于，所述心理测评量表的分类模型获取方法包括以下步骤：

S2：利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练，所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间；

S4：将所述无标签心理测评量表的响应时间作为经步骤S2训练后的所述初始神经网络分类器的输入，并对经步骤S2训练后的所述初始神经网络分类器进行再次训练，利用所述聚类标签对经步骤S2训练后的所述初始神经网络分类器的再次训练进行监督得到分类模型，所述分类模型用于对心理测评量表进行筛选；

S5：对所述分类模型进行再次训练；

2.如权利要求1所述的心理测评量表的分类模型获取方法，其特征在于，所述初始神经网络分类器包括：输入层、隐藏层以及输出层；

3.如权利要求2所述的心理测评量表的分类模型获取方法，其特征在于，选取准确率作为所述初始神经网络分类器的优化指标，以交叉熵函数作为所述初始神经网络分类器的损失函数；

所述初始神经网络分类器的损失函数为：

其中，L_y表示所述初始神经网络分类器在预测具有分类标签的心理测评量表的类型时的损失函数；y_i为第i个心理测评量表的分类标签，p_i表示第i个心理测评量表预测为正常心理测评量表的概率，n表示所述心理测评量表数据库中具有分类标签的心理测评量表的数量。

4.如权利要求1-3中任意一项所述的心理测评量表的分类模型获取方法，其特征在于，所述利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练，具体为：

5.如权利要求1-3中任意一项所述的心理测评量表的分类模型获取方法，其特征在于，所述对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征具体为：

所述采用聚类方法将所述低维特征聚为两类具体为：

采用Kmean聚类方法对所述低维特征进行聚类，并设置K＝2。

6.一种心理测评量表的筛查方法，其特征在于，所述心理测评量表的筛查方法包括：

获取待筛选的心理测评量表的响应时间；

将当前获取到的所述响应时间输入到分类模型中，根据所述分类模型的输出确定待筛选的心理测评量表是否为无效心理测评量表，所述分类模型为如权利要求1-5中任意一项所述的分类模型。

7.一种心理测评量表的分类模型获取系统，其特征在于，心理测评量表的分类模型获取系统包括：

初始训练模块，用于利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练，所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间；

二次训练模块，用于将所述无标签心理测评量表的响应时间作为经初始模块训练后的所述初始神经网络分类器的输入，并对经初始模块训练后的所述初始神经网络分类器进行再次训练，利用所述聚类标签对经初始模块训练后的所述初始神经网络分类器的再次训练进行监督得到分类模型，所述分类模型用于对心理测评量表进行筛选；

分类模型再次训练模块，用于对所述分类模型进行再次训练；