CN114860922B - 心理测评量表的分类模型获取方法、筛查方法及系统 - Google Patents

心理测评量表的分类模型获取方法、筛查方法及系统 Download PDF

Info

Publication number
CN114860922B
CN114860922B CN202210321720.2A CN202210321720A CN114860922B CN 114860922 B CN114860922 B CN 114860922B CN 202210321720 A CN202210321720 A CN 202210321720A CN 114860922 B CN114860922 B CN 114860922B
Authority
CN
China
Prior art keywords
psychological assessment
assessment scale
clustering
classification model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210321720.2A
Other languages
English (en)
Other versions
CN114860922A (zh
Inventor
王菲
张锡哲
魏鑫茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Brain Hospital
Original Assignee
Nanjing Brain Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Brain Hospital filed Critical Nanjing Brain Hospital
Priority to CN202210321720.2A priority Critical patent/CN114860922B/zh
Publication of CN114860922A publication Critical patent/CN114860922A/zh
Application granted granted Critical
Publication of CN114860922B publication Critical patent/CN114860922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及心理测评量表的分类模型获取方法、筛查方法及系统,心理测评量表的分类模型获取方法包括:S1:获取心理测评量表数据库,心理测评量表数据库中包含预训练心理测评量表的响应时间及无标签心理测评量表的响应时间。S2:利用预训练心理测评量表的响应时间以及分类标签构建并训练初始神经网络分类器。S3:对无标签心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将低维特征聚为两类,并为每类低维特征对应的无标签心理测评量表标记上聚类标签。S4:将无标签心理测评量表的响应时间以及聚类标签对初始神经网络分类器进行训练得到分类模型。分类模型对新的无标签心理测评量表分类并判断是否为有效的心理测评量表。

Description

心理测评量表的分类模型获取方法、筛查方法及系统
技术领域
本发明涉及领域,尤其涉及心理测评量表的分类模型获取方法、筛查方法及系统。
背景技术
心理测评量表是心理/精神疾病患者必完成的一项心理测试工作。根据载体的不同,心理测评量表可分为纸质的问答式心理测评量表及网络式心理测评量表。纸质的问答式心理测评量表即为传统的心理测评量表方式,通过精神科医生以问答的方式完成测评。随着信息技术的飞速发展及互联网的普及,网络式心理测评量表因成本低、操作方便、实效性强等优势,逐渐取代传统的纸质心理测评。
然而两种心理量表测评方式皆存在严重的数据质量把控问题,一部分患者因短时情绪因素,或者为节省时间和精力等自身因素,会对心理测评中的部分问题进行不经思考的随意性作答,这就导致了低质量心理测评数据的产生,低质量的心理测评数据的存在会严重影响整体样本的数据分析,最终严重影响数据分析结果的准确性,尤其是在医学研究领域中,被调查者的心理评估量表的数据质量不仅会影响医生对该调查者的病情把控,同时也会影响基于此评估量表进行数据分析结果的准确性。因此,识别异常作答的低质量心理样本数据,从而提高心理量表样本的整体质量是非常必要的。
在心理量表测评中,被调查者对量表中每个问题的答题时间反映了被调查者思考问题的过程。这种答题响应时间可以用来评估被调查者回答心理测评量表的质量。例如,过长的反应时可能与对答案的不确定相关,而过短的反应时则提示被试对快速完成心理测评的意愿强于认真完成测评的意愿。对于心理测评而言,这些异常答题模式均对所收集数据的质量有影响。因此,有效的利用被调查者回答问题的响应时间可以用来筛选无效的量表。
发明内容
(一)要解决的技术问题
本发明提供了心理测评量表的分类模型获取方法、筛查方法及系统,旨在解决现有心理量表测评过程中存在少量无效心理测评量表,从而提高量表测评结果整体质量的问题。
(二)技术方案
为了解决上述问题,本发明提供了一种心理测评量表分类模型获取方法,所述心理测评量表的分类模型获取方法包括以下步骤:
S1:获取心理测评量表数据库,所述心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间,所述预训练心理测评量表为已知分类标签的心理测评量表,所述无标签心理测评量表为无标签的心理测评量表,所述响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间,所述分类标签用于表示所述心理测评量表是否为有效心理测评量表;
S2:利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练,所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间;
S3:对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将所述低维特征聚为两类,并为每类所述低维特征对应的无标签心理测评量表标记上聚类标签,所述聚类标签用于表示对应心理测评量表是否为有效心理测评量表;
S4:将所述无标签心理测评量表的响应时间作为所述初始神经网络分类器的输入,并对所述初始神经网络分类器进行训练,利用所述聚类标签对所述初始神经网络分类器的训练进行监督得到分类模型,所述分类模型用于对心理测评量表进行筛选。
优选地,所述初始神经网络分类器包括:输入层、隐藏层以及输出层;
其中,输入层和隐藏层均使用Relu作为激活函数,输出层使用sigmoid作为激活函数。
优选地,选取准确率作为所述初始神经网络分类器的优化指标,以交叉熵函数作为所述初始神经网络分类器的损失函数;
所述初始神经网络分类器的损失函数为:
Figure BDA0003566261400000031
其中,Ly表示所述初始神经网络分类器在预测所述具有分类标签的心理测评量表的类型时的损失函数;yi为第i个心理测评量表的分类标签,pi表示第i个心理测评量表预测为正常心理测评量表的概率,n表示所述心理测评量表数据库中具有分类标签的心理测评量表的数量。
优选地,所述心理测评量表的分类模型获取方法还包括:
S5:对所述分类模型进行再次训练;
S5-1:将所述完成上一次训练的分类模型的第一层网络提取的特征作为低维聚类特征;
S5-2:采用聚类方法将所述低维聚类特征聚为两类,并更新每类所述低维聚类特征对应的无标签心理测评量表上的聚类标签;
S5-3:采用无标签心理测评量表的响应时间以及更新后的聚类标签对分类模型进行监督训练并调整所述分类模型的参数;
S5-4:重复S5-1~S5-3,直到本次分类模型第一层网络提取的低维聚类特征与上一次分类模型第一层网络提取的低维聚类特征之间的差异小于预设值。
优选地,所述利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练具体为:
将心理测评量表数据库中预训练心理测评量表的响应时间平均分为K个子样本,并分别记作子样本(1)、子样本(2)、...、子样本(i)...子样本(K);
对初始神经网络分类器进行K次迭代训练,其中第i次迭代训练的情况是将子样本(i)作为初始神经网络分类器的测试集,其余的K-1个子样本作为初始神经网络分类器的训练集。
优选地,所述对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征具体为:
采用基于深度学习的自编码器对心理测评量表数据库中所有心理测评量表的响应时间进行降维得到低维特征;
所述采用聚类方法将所述低维特征聚为两类具体为:
采用Kmean聚类方法对所述低维特征进行聚类,并设置K=2。
优选地,本发明还提供了一种心理测评量表的筛查方法,所述心理测评量表的筛查方法包括:
获取待筛选的心理测评量表的响应时间;
将当前获取到的所述响应时间输入到分类模型中,根据所述分类模型的输出确定待筛选的心理测评量表是否为无效心理测评量表,所述分类模型为上述的分类模型。
优选地,本发明还提供了一种心理测评量表的分类模型获取系统,心理测评量表的分类模型获取系统包括:
数据库访问模块,用于获取心理测评量表数据库,所述心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间,所述预训练心理测评量表为已知分类标签的心理测评量表,所述无标签心理测评量表为无标签的心理测评量表,所述响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间,所述分类标签用于表示所述心理测评量表是否为有效心理测评量表;
初始训练模块,利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练,所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间;
降维与聚类模块,对心理测评量表数据库中无标签的心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将所述低维特征聚为两类,并为每类所述低维特征对应的无标签心理测评量表标记上聚类标签,所述聚类标签用于表示对应心理测评量表是否为有效心理测评量表;
二次训练模块,用于将所述无标签心理测评量表的响应时间作为所述初始神经网络分类器的输入,并对所述初始神经网络分类器进行训练,利用所述聚类标签对所述初始神经网络分类器的训练进行监督得到分类模型,所述分类模型用于对心理测评量表进行筛选。
(三)有益效果
本发明利用被试回答心理测评量表问题的响应时间,作为被试心理测评量表质量的特征,通过训练神经网络分类器,能够有效的区分认真回答的心理测评量表和不认真回答的心理测评量表,从而提高量表测评问卷的准确性。
附图说明
图1为本发明心理测评量表的分类模型获取方法的流程图;
图2为本发明步骤S5的流程图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
如图1所示,本发明提供了一种心理测评量表的分类模型获取方法,心理测评量表的分类模型获取方法包括以下步骤:
S1:获取心理测评量表数据库,心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间,预训练心理测评量表为已知分类标签的心理测评量表,无标签心理测评量表为无标签的心理测评量表,响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间,分类标签用于表示心理测评量表是否为有效心理测评量表;
其中,利用分类标签的值的不同来分别代表有效心理测评量表和无效心理测评量表(例如用标签值为1的心理测评量表为有效心理测评量表,标签值为-1的心理测评量表为无效心理测评量表),在心理测评量表数据库中,已知分类标签的预训练心理测评量表是代表已经被人为确认过是否为有效的心理测评量表,在心理测评量表数据库中,预训练心理测评量表的数量远远小于无标签心理测评量表的数量。
S2:利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练,初始神经网络分类器的输入值为预训练心理测评量表的响应时间。
对初始神经网络分类器的训练过程可以为:向初始神经网络分类器输入响应时间,根据初始神经网络分类器的输出值与对应心理测评量表的标签进行比较,然后调整初始神经网络分类器的参数,重复多次直到满足要求。
S3:对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将低维特征聚为两类,并为每类低维特征对应的无标签心理测评量表标记上聚类标签,聚类标签用于表示对应心理测评量表是否为有效心理测评量表;
S4:将无标签心理测评量表的响应时间作为初始神经网络分类器的输入,并对初始神经网络分类器进行训练,利用聚类标签对初始神经网络分类器的训练进行监督得到分类模型,分类模型用于对心理测评量表进行筛选。
本发明先用小样本的数据(即心理测评量表数据库中预训练心理测评量表的响应时间)来训练初始神经网络分类器,然后对大样本的数据(即心理测评量表数据库中无标签心理测评量表的响应时间)进行降维和聚类,然后为大量的无标签心理测评量表标记上聚类标签,最后用具有聚类标签的心理测评量表的响应时间来对神经网络分类模型进行训练得到分类模型,整个分类模型的获取过程,并不需要人工为大批量的心理测评量表标记上分类标签,最大限度地避免了小样本训练分类模型的模式局限性,确保了分类模型对心理测评量表的筛选的准确性。
在优选的实施方案中,初始神经网络分类器包括:输入层、隐藏层以及输出层,每一层均添加了L1正则化方法防止过拟合的产生。其中,输入层和隐藏层均使用Relu作为激活函数,输出层使用sigmoid作为激活函数。
选取准确率作为初始神经网络分类器的优化指标,以交叉熵函数作为初始神经网络分类器的损失函数;
初始神经网络分类器的损失函数为:
Figure BDA0003566261400000081
其中,Ly表示初始神经网络分类器在预测具有分类标签的心理测评量表的类型时的损失函数;yi为第i个心理测评量表的分类标签,pi表示第i个心理测评量表预测为正常心理测评量表的概率,n表示心理测评量表数据库中具有分类标签的心理测评量表的数量。
在另外的实施方案中,如图2所示,心理测评量表的分类模型获取方法还包括:
S5:对分类模型进行再次训练;
S5-1:将完成上一次训练的分类模型的第一层网络提取的特征作为低维聚类特征;
S5-2:采用聚类方法将低维聚类特征聚为两类,并更新每类低维聚类特征对应的无标签心理测评量表上的聚类标签;
S5-3:采用无标签心理测评量表的响应时间以及更新后的聚类标签对分类模型进行监督训练并调整分类模型的参数;
S5-4:重复S5-1~S5-3,直到本次分类模型第一层网络提取的低维聚类特征与上一次分类模型第一层网络提取的低维聚类特征之间的差异小于预设值。
在本实施方案中,仅进行一次分类训练可能导致结果的不稳定,因此,我们提取上一次训练好的分类模型第一层的网络特征进行聚类,并依然采用聚类结果对分类模型进行再一次监督训练,反复执行特征提取及聚类过程,直至分类效果稳定,此时得到理论上最佳的分类模型。用聚类的结果指导分类模型的训练过程,然后采用这种反复迭代的过程完成模型的训练,能够使分类模型的准确率得到进一步的提升。另外分类模型的性能还可以采用五折交叉验证的方法来评估,通过混淆矩阵、ROC曲线以及分类准确率来衡量分类模型的性能。
进一步地,利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练具体为:
将心理测评量表数据库中预训练心理测评量表的响应时间平均分为K个子样本,并分别记作子样本(1)、子样本(2)、...、子样本(i)...子样本(K);
对初始神经网络分类器进行K次迭代训练,其中第i次迭代训练的情况是将子样本(i)作为初始神经网络分类器的测试集,其余的K-1个子样本作为初始神经网络分类器的训练集。
采用K折交叉验证的方法来完成初始神经分类模型的训练,使得初始神经分类模型能够避免为了追求高准确率而在训练集上产生过拟合,从而使得模型在样本外的数据上预测准确率高。
最后,对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征具体为:
采用基于深度学习的自编码器对心理测评量表数据库中所有心理测评量表的响应时间进行降维得到低维特征;
采用聚类方法将低维特征聚为两类具体为:
采用Kmean聚类方法对低维特征进行聚类,并设置K=2。
本发明还提供了一种心理测评量表的筛查方法,心理测评量表的筛查方法包括:
获取待筛选的心理测评量表的响应时间;
将当前获取到的相应时间数据输入到分类模型中,根据分类模型的输出确定待筛选的心理测评量表是否为无效心理测评量表,分类模型为如上述的分类模型。
本发明还提供了一种心理测评量表的分类模型获取系统,心理测评量表的分类模型获取系统包括:
数据库访问模块,用于获取心理测评量表数据库,心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间,预训练心理测评量表为已知分类标签的心理测评量表,无标签心理测评量表为无标签的心理测评量表,响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间,分类标签用于表示心理测评量表是否为有效心理测评量表;
初始训练模块,用于利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练,初始神经网络分类器的输入值为预训练心理测评量表的响应时间;
降维与聚类模块,对心理测评量表数据库中无标签的心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将低维特征聚为两类,并为每类低维特征对应的无标签心理测评量表标记上聚类标签,聚类标签用于表示对应心理测评量表是否为有效心理测评量表;
二次训练模块,用于将无标签心理测评量表的响应时间作为初始神经网络分类器的输入,并对初始神经网络分类器进行训练,利用聚类标签对初始神经网络分类器的训练进行监督得到分类模型,分类模型用于对心理测评量表进行筛选。
本发明还提供了一种心理测评量表的分类模型获取设备,包括:
至少一个数据库;
以及与至少一个数据库通信连接的存储器;
其中,存储器存储有可被至少一个数据库执行的指令,指令被至少一个数据库执行,以使至少一个数据库能够执行如上述的心理测评量表的分类模型获取方法。
需要理解的是,以上对本发明的具体实施例进行的描述只是为了说明本发明的技术路线和特点,其目的在于让本领域内的技术人员能够了解本发明的内容并据以实施,但本发明并不限于上述特定实施方式。凡是在本发明权利要求的范围内做出的各种变化或修饰,都应涵盖在本发明的保护范围内。

Claims (7)

1.一种心理测评量表分类模型获取方法,其特征在于,所述心理测评量表的分类模型获取方法包括以下步骤:
S1:获取心理测评量表数据库,所述心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间,所述预训练心理测评量表为已知分类标签的心理测评量表,所述无标签心理测评量表为无标签的心理测评量表,所述响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间,所述分类标签用于表示所述心理测评量表是否为有效心理测评量表;
S2:利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练,所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间;
S3:对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将所述低维特征聚为两类,并为每类所述低维特征对应的无标签心理测评量表标记上聚类标签,所述聚类标签用于表示对应心理测评量表是否为有效心理测评量表;
S4:将所述无标签心理测评量表的响应时间作为经步骤S2训练后的所述初始神经网络分类器的输入,并对经步骤S2训练后的所述初始神经网络分类器进行再次训练,利用所述聚类标签对经步骤S2训练后的所述初始神经网络分类器的再次训练进行监督得到分类模型,所述分类模型用于对心理测评量表进行筛选;
S5:对所述分类模型进行再次训练;
S5-1:将所述完成上一次训练的分类模型的第一层网络提取的特征作为低维聚类特征;
S5-2:采用聚类方法将所述低维聚类特征聚为两类,并更新每类所述低维聚类特征对应的无标签心理测评量表上的聚类标签;
S5-3:采用无标签心理测评量表的响应时间以及更新后的聚类标签对分类模型进行监督训练并调整所述分类模型的参数;
S5-4:重复S5-1~S5-3,直到本次分类模型第一层网络提取的低维聚类特征与上一次分类模型第一层网络提取的低维聚类特征之间的差异小于预设值。
2.如权利要求1所述的心理测评量表的分类模型获取方法,其特征在于,所述初始神经网络分类器包括:输入层、隐藏层以及输出层;
其中,输入层和隐藏层均使用Relu作为激活函数,输出层使用sigmoid作为激活函数。
3.如权利要求2所述的心理测评量表的分类模型获取方法,其特征在于,选取准确率作为所述初始神经网络分类器的优化指标,以交叉熵函数作为所述初始神经网络分类器的损失函数;
所述初始神经网络分类器的损失函数为:
其中,Ly表示所述初始神经网络分类器在预测具有分类标签的心理测评量表的类型时的损失函数;yi为第i个心理测评量表的分类标签,pi表示第i个心理测评量表预测为正常心理测评量表的概率,n表示所述心理测评量表数据库中具有分类标签的心理测评量表的数量。
4.如权利要求1-3中任意一项所述的心理测评量表的分类模型获取方法,其特征在于,所述利用预训练心理测评量表的响应时间以及分类标签对所述初始神经网络分类器进行构建并训练,具体为:
将心理测评量表数据库中预训练心理测评量表的响应时间平均分为K个子样本,并分别记作子样本(1)、子样本(2)、...、子样本(i)...子样本(K);
对初始神经网络分类器进行K次迭代训练,其中第i次迭代训练的情况是将子样本(i)作为初始神经网络分类器的测试集,其余的K-1个子样本作为初始神经网络分类器的训练集。
5.如权利要求1-3中任意一项所述的心理测评量表的分类模型获取方法,其特征在于,所述对心理测评量表数据库中无标签心理测评量表的响应时间进行降维得到低维特征具体为:
采用基于深度学习的自编码器对心理测评量表数据库中所有心理测评量表的响应时间进行降维得到低维特征;
所述采用聚类方法将所述低维特征聚为两类具体为:
采用Kmean聚类方法对所述低维特征进行聚类,并设置K=2。
6.一种心理测评量表的筛查方法,其特征在于,所述心理测评量表的筛查方法包括:
获取待筛选的心理测评量表的响应时间;
将当前获取到的所述响应时间输入到分类模型中,根据所述分类模型的输出确定待筛选的心理测评量表是否为无效心理测评量表,所述分类模型为如权利要求1-5中任意一项所述的分类模型。
7.一种心理测评量表的分类模型获取系统,其特征在于,心理测评量表的分类模型获取系统包括:
数据库访问模块,用于获取心理测评量表数据库,所述心理测评量表数据库中包含预训练心理测评量表的响应时间以及无标签心理测评量表的响应时间,所述预训练心理测评量表为已知分类标签的心理测评量表,所述无标签心理测评量表为无标签的心理测评量表,所述响应时间为答题者在完成心理测评量表中的各个题目对应的答题时间,所述分类标签用于表示所述心理测评量表是否为有效心理测评量表;
初始训练模块,用于利用预训练心理测评量表的响应时间以及分类标签对初始神经网络分类器进行构建并训练,所述初始神经网络分类器的输入值为预训练心理测评量表的响应时间;
降维与聚类模块,对心理测评量表数据库中无标签的心理测评量表的响应时间进行降维得到低维特征,采用聚类方法将所述低维特征聚为两类,并为每类所述低维特征对应的无标签心理测评量表标记上聚类标签,所述聚类标签用于表示对应心理测评量表是否为有效心理测评量表;
二次训练模块,用于将所述无标签心理测评量表的响应时间作为经初始模块训练后的所述初始神经网络分类器的输入,并对经初始模块训练后的所述初始神经网络分类器进行再次训练,利用所述聚类标签对经初始模块训练后的所述初始神经网络分类器的再次训练进行监督得到分类模型,所述分类模型用于对心理测评量表进行筛选;
分类模型再次训练模块,用于对所述分类模型进行再次训练;
S5-1:将所述完成上一次训练的分类模型的第一层网络提取的特征作为低维聚类特征;
S5-2:采用聚类方法将所述低维聚类特征聚为两类,并更新每类所述低维聚类特征对应的无标签心理测评量表上的聚类标签;
S5-3:采用无标签心理测评量表的响应时间以及更新后的聚类标签对分类模型进行监督训练并调整所述分类模型的参数;
S5-4:重复S5-1~S5-3,直到本次分类模型第一层网络提取的低维聚类特征与上一次分类模型第一层网络提取的低维聚类特征之间的差异小于预设值。
CN202210321720.2A 2022-03-25 2022-03-25 心理测评量表的分类模型获取方法、筛查方法及系统 Active CN114860922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210321720.2A CN114860922B (zh) 2022-03-25 2022-03-25 心理测评量表的分类模型获取方法、筛查方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210321720.2A CN114860922B (zh) 2022-03-25 2022-03-25 心理测评量表的分类模型获取方法、筛查方法及系统

Publications (2)

Publication Number Publication Date
CN114860922A CN114860922A (zh) 2022-08-05
CN114860922B true CN114860922B (zh) 2023-04-18

Family

ID=82628974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210321720.2A Active CN114860922B (zh) 2022-03-25 2022-03-25 心理测评量表的分类模型获取方法、筛查方法及系统

Country Status (1)

Country Link
CN (1) CN114860922B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117352114B (zh) * 2023-10-16 2024-04-09 北京心企领航科技有限公司 一种基于聚类算法的心理测评量表的推荐方法及系统
CN117497172A (zh) * 2023-11-01 2024-02-02 中国科学院心理研究所 一种心理障碍预测方法、装置、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259979A (zh) * 2020-02-10 2020-06-09 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN111444342A (zh) * 2020-03-24 2020-07-24 湖南董因信息技术有限公司 一种基于多重弱监督集成的短文本分类方法
AU2021104790A4 (en) * 2021-07-05 2021-10-07 Mohammad Shabbir Alam A method for predicting and early warning of mental disorders using neural networks
CN113569243A (zh) * 2021-08-03 2021-10-29 上海海事大学 基于自监督变分lstm的深层半监督学习网络入侵检测方法
CN114023449A (zh) * 2021-11-05 2022-02-08 中山大学 基于深度自编码器的糖尿病风险预警方法与系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6722845B2 (ja) * 2017-10-03 2020-07-15 株式会社国際電気通信基礎技術研究所 判別装置、うつ症状の判別方法、うつ症状のレベルの判定方法、うつ病患者の層別化方法、うつ症状の治療効果の判定方法及び脳活動訓練装置
KR102240930B1 (ko) * 2019-01-18 2021-04-15 (주)지영커뮤니티 미술심리검사 장치
CN110263697A (zh) * 2019-06-17 2019-09-20 哈尔滨工业大学(深圳) 基于无监督学习的行人重识别方法、装置及介质
US11487963B2 (en) * 2019-09-16 2022-11-01 International Business Machines Corporation Automatically determining whether an activation cluster contains poisonous data
CN111222584A (zh) * 2020-01-15 2020-06-02 北京辉腾格勒石墨烯科技有限公司 基于大数据和深度神经网络的锂电池实时评估方法
CN111429983A (zh) * 2020-04-24 2020-07-17 北京六糖城科技有限公司 一种心理学量表辅助研究系统
CN111899823A (zh) * 2020-06-11 2020-11-06 上海梅斯医药科技有限公司 一种量表信息处理方法、系统、终端设备和存储介质
CN113177435B (zh) * 2021-03-31 2024-08-27 新东方教育科技集团有限公司 试卷分析方法、装置、存储介质及电子设备
CN113242207B (zh) * 2021-04-02 2022-06-17 河海大学 一种迭代聚类的网络流量异常检测方法
CN113010659A (zh) * 2021-04-08 2021-06-22 腾讯科技(深圳)有限公司 一种问卷样本处理方法及装置
CN113918714A (zh) * 2021-09-29 2022-01-11 北京百度网讯科技有限公司 一种分类模型训练方法、聚类方法及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259979A (zh) * 2020-02-10 2020-06-09 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN111444342A (zh) * 2020-03-24 2020-07-24 湖南董因信息技术有限公司 一种基于多重弱监督集成的短文本分类方法
AU2021104790A4 (en) * 2021-07-05 2021-10-07 Mohammad Shabbir Alam A method for predicting and early warning of mental disorders using neural networks
CN113569243A (zh) * 2021-08-03 2021-10-29 上海海事大学 基于自监督变分lstm的深层半监督学习网络入侵检测方法
CN114023449A (zh) * 2021-11-05 2022-02-08 中山大学 基于深度自编码器的糖尿病风险预警方法与系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Luca Piras 等.Evaluating the Prediction Bias Induced by Label Imbalance in Multi-label Classification.ACM.2021,第3368–3372页. *
刘娜 ; 毛晓菊 ; 吴敏 ; .集群分类映射的文本多标签模糊关联降维聚类.计算机工程与设计.2017,(06),第1657-1663页. *
李春阳 ; 王先培 ; 田猛 ; 冯晓栋 ; .AMI环境下异常用电检测研究.计算机仿真.2018,(08),第66-70页. *

Also Published As

Publication number Publication date
CN114860922A (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN114860922B (zh) 心理测评量表的分类模型获取方法、筛查方法及系统
US10430690B1 (en) Machine learning predictive labeling system
US10521734B2 (en) Machine learning predictive labeling system
Palaniappan et al. VEP optimal channel selection using genetic algorithm for neural network classification of alcoholics
CN112037179B (zh) 一种脑疾病诊断模型的生成方法、系统及设备
CN112687374B (zh) 一种基于文本和图像信息联合计算的心理危机预警方法
CN111477329B (zh) 一种基于图文结合评估心理状态的方法
CN113722474A (zh) 文本分类方法、装置、设备及存储介质
CN111460101A (zh) 知识点类型的识别方法、装置及处理器
CN111242131B (zh) 一种智能阅卷中图像识别的方法、存储介质及装置
CN114972222A (zh) 细胞信息统计方法、装置、设备及计算机可读存储介质
CN114926299A (zh) 一种基于大数据分析的预测车辆事故风险预测方法
CN113261975B (zh) 一种基于深度学习的心电分类方法
Zhang et al. A robust spike sorting method based on the joint optimization of linear discrimination analysis and density peaks
US20210358317A1 (en) System and method to generate sets of similar assessment papers
Modirshanechi et al. Surprise: a unified theory and experimental predictions
CN114037571A (zh) 试题扩充方法及相关装置、电子设备和存储介质
Boughattas et al. Autism Spectrum Disorder (ASD) Detection Using Machine Learning Algorithms
Akila et al. Parkinson classification neural network with mass algorithm for processing speech signals
CN110633368A (zh) 早期结直肠癌非结构化数据的深度学习分类方法
CN116028861A (zh) 一种基于注意力机制的MOOCs辍学预测模型构建方法
CN114022698A (zh) 一种基于二叉树结构的多标签行为识别方法及装置
Lavelle-Hill et al. Machine Learning Meets Traditional Statistical Methods in Psychology: Challenges and Future Directions
Tlaie et al. Does the brain care about averages? A simple test
CN109190658A (zh) 视频觉醒度分类方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant