CN110391013B - 一种基于语义向量构建神经网络预测心理健康的系统和装置 - Google Patents

一种基于语义向量构建神经网络预测心理健康的系统和装置 Download PDF

Info

Publication number
CN110391013B
CN110391013B CN201910645823.2A CN201910645823A CN110391013B CN 110391013 B CN110391013 B CN 110391013B CN 201910645823 A CN201910645823 A CN 201910645823A CN 110391013 B CN110391013 B CN 110391013B
Authority
CN
China
Prior art keywords
neural network
semantic
psychological
text data
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910645823.2A
Other languages
English (en)
Other versions
CN110391013A (zh
Inventor
王冲冲
任永亮
杨菲
张佳
李嘉懿
贺同路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Intelligent Workshop Technology Co ltd
Original Assignee
Beijing Intelligent Workshop Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Intelligent Workshop Technology Co ltd filed Critical Beijing Intelligent Workshop Technology Co ltd
Priority to CN201910645823.2A priority Critical patent/CN110391013B/zh
Publication of CN110391013A publication Critical patent/CN110391013A/zh
Application granted granted Critical
Publication of CN110391013B publication Critical patent/CN110391013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Social Psychology (AREA)
  • Psychology (AREA)
  • Psychiatry (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Public Health (AREA)
  • Developmental Disabilities (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Child & Adolescent Psychology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明提出了一种基于语义向量构建神经网络预测心理健康的系统和装置。本发明的技术方案,基于被测用户的客观心理语义文本建立神经网络模型进行预测评估。不同于现有技术需要用户参与的不全面非客观样本,本发明利用的心理语义文本体现的是用户自身的真实情感表达,不需要用户主动参与;并且,为了保证建模样本的准确性,引入分层抽样的方法对样本进行了预处理,并且将未被分层抽样的个人心理文本作为模型输入向量集,从而保证输出的结果客观的反应用户的心理状态;采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度。

Description

一种基于语义向量构建神经网络预测心理健康的系统和装置
技术领域
本发明属于健康监测与管理技术领域,尤其涉及一种基于语义向量构建神经网络预测心理健康的系统和装置。
背景技术
随着现代社会中生活压力的日益增长,心理疾病成为一个越来越普遍的现象。常见的心理疾病包括抑郁症、焦虑症、强迫症等。这些心理疾病不仅影响患者的正常生活,严重时甚至会使患者产生自杀企图,因而引起了社会对心理疾病的关注和担忧。据世界卫生组织报告,抑郁症在全世界发病率约11%,已成为危害人类健康的第四大疾病,到2020年可能成为仅次于心脏病的第二大疾病。在我国,抑郁症发病率高达7%,而且由于发现不及时与认识不足,治疗率仅为20%。因抑郁导致的自杀死亡事件频发。
然而,当前大部分心理健康服务还停留在″被动″模式,主要通过传统问卷发放方式或用户向心理健康咨询中心咨询或到医院就诊发现心理异动个体。但由于人力物力所限,长期以来心理学研究者无法获取覆盖研究对象全体的数据,也不便对个体心理健康状态变化进行跟踪研究,难以对心理行为异动个体进行及时主动干预。
现有分析心理状态测试设备有很多,但现有技术设备大而复杂,设备、测试对象的情绪波动容易影响分析结果,且无法直观、简单地表现受试者的心理状态。心理健康测试,一般均为问卷式测试,也即是将纸件的问卷发到被评估人员手中,被评估人员完成问卷回答后,回收问卷,再由评估人员根据每份问卷的答复情况做出评估。这种测试方式的缺陷在于,不能在被评估人员作问卷填写的时候同时监测被评估人员的血压,心率等体征信息,也就不能对被评估人员作出更准确的心理健康测试分析,另一方面被评估人员需在接近睡眠状态下测试各项指标时,现有设备存在缺陷,且不具有显示器显示。
专利″一种基于互联网的心理健康评估系统″(CN201610808709.3)提出了一种基于互联网的心理健康评估系统。系统中,云端数据库用于存储已知的样本中心理测试量表的因子得分;利用RBF神经网络算法建立心理健康评估模型。RBF神经网络模型对新个体心理健康状态进行评估后,将评估结果上传至云端。该系统还是基于传统的心理测试表结果,无法对心理健康状态进行客观评估和追踪研究。
专利US2005/0236004A1公开了一种人体健康状况的监测方法,其中一个非线性的输入向量模块包含神经网络,但其同样需要新个体填写心理测量表,且不是通过文本分析的方法对心理健康状态进行评估。
CN109524085A公开了一种基于交互的认知分析方法及系统,能够分析得到用户的个人认知信息,从而为用户心理健康服务提供更加有力的帮助。通过至少一种预设交互方式输出交互输出信息与用户进行交互,可以获得用户的交互输入信息,然后对交互输入信息进行内容识别与分析,获得认知分析数据,之后,根据认知分析数据,便可以构建用户的个人认知结构模型。可见,实施本发明实施例,可以以认知心理学为基础,通过与用户进行交互,分析与用户往来的交互信息(包括输出用于与用户进行交互的输出交互信息、用户针对输出交互信息而输入的交互输入信息),获得用户的个人认知信息,从而建立用户的个人认知结构模型,基于该个人认知结构模型可以分析与解决用户的心理问题,为用户心理健康服务提供更加有力的帮助;并且,采取基于自然语言处理(Natural LanguageProcessing,NLP)技术的人机对话式交互方式,使交流更加真实自然。
然而,上述不管是哪种方案,都需要用户主动参与并且配合,检测结果的准确性很大程度上取决于用户的配合度和正确率,如果用户随意选择或故意选择错误答案、或者随意输入交互性信息,上述方案无法进行处理,也无法保证结果的准确和客观性。
发明内容
为解决上述技术问题,本发明提出了一种基于语义向量构建神经网络预测心理健康的系统和装置。本发明的技术方案,基于被测用户的客观心理语义文本建立神经网络模型进行预测评估。不同于现有技术,本发明利用的心理语义文本体现的是用户自身的真实情感表达,不需要用户主动参与;并且,为了保证建模样本的准确性,引入分层抽样的方法对样本进行了预处理,并且将未被分层抽样的个人心理文本作为模型输入向量集,从而保证输出的结果客观的反应用户的心理状态;采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度。
尤其重要的是,本发明不需要通过用户手动做题或和用户面对面接触,而是通过分析用户的心情文本或说说对用户的心理状态进行评测,这种方式不会对用户造成压力,并能获取到用户最新的真实心理状态,最后可以通过文本分析得到评估结果和相应的对策建议,这样可以使用户可以直观的了解到自己当前的心理状态,并根据建议进行自我调整或即使进行就医以便达到心理健康的状态。
本发明的技术方案具体实现如下:
一种基于语义向量构建神经网络预测心理健康的系统,所述系统包括语义文本采集模块、语义文本抽样模块、语义文本向量化模块、神经网络训练模块、神经网络评估模块以及心理测试量合成模块;
所述语义文本采集模块,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据。
其中采集被测用户的历史心理测试文本数据,主要包括采集专业心理测量表及其相关评估结果、建议等:专业心理测量数据的采集可以从心理治疗机构或医疗机构等专业机构进行收集,数据主要包括测试数据时间、心理测量表及其得分、评估结果、对策建议等;
作为本发明的第一个重要创新点,所述语义文本采集模块还要采集个人心理描述文本数据。
不同于现有技术提到的需要用户主动参与提供的″问卷调查″数据,本发明的技术方案首次利用个人心理文本进行心理健康监测。这里的个人心理文本的采集方式完全是被动的,不需要用户主动提供,因此,其不受用户是否客观回答问题、是否刻意掩盖自身状态等因素影响,结果客观。
具体而言,采集个人心理描述文本数据,主要包括采集个人信息及其历史心理文本:个人信息可以通过个人注册信息来进行获取,历史心理文本可以根据个体的个人的朋友圈、微博等进行获取;
对于寻求心理健康的用户来说,通过采集其过碎片化的文本(如微博、说说、朋友圈等等社交方式),可以得到大量的个人心理文本;
进一步的,所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;
作为本发明的第二个重要创新点,引入语义文本抽样模块对样本数据集(历史心理测试文本数据以及个人心理描述文本数据)进行分层抽样,带来的有益效果是,一方面使得后续的语义文本向量化模块要处理的数据量大大降低,另一方面同时保证样本数据集在后续用于建模时具备代表性,保证建模的准确性;
具体而言,所述分层抽样包括:
对所述历史心理测试文本数据进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Tn,n=1,2,...,N,N为类别数;
对个人心理描述文本进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Sm,m=1,2,...,M,M为类别数;
按照如下公式确定抽样比例:
对于第n类历史心理测试文本数据,抽样比例为:
Figure GDA0002523738900000031
对于第m类个人心理描述文本,抽样比例为:
Figure GDA0002523738900000041
接下来,所述语义文本向量化模块,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得第一向量序列;
抽样获得的第n类历史心理文本数据的向量化序列为VTn,抽样获得的第m类个人心理描述文本的向量化序列为VSm;
所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练;
具体包括:
利用向量化序列VTn作为输入层,利用向量化序列VSm作为输出层,进行神经网络的训练。
作为本发明的第三个创新点,将不包含在所述分层抽样数据集中的个人心理描述文本,通过所述语义文本向量化模块进行向量化处理,获得第二向量序列;
具体而言,第m类不包含在所述分层抽样数据集中的个人心理描述文本向量化处理后的向量为
Figure GDA0002523738900000042
所有的
Figure GDA0002523738900000043
(m=1,2,...,M)构成所述第二向量序列;
如前所述,个人心理文本的采集方式完全是被动的,不需要用户主动提供,因此,其不受用户是否客观回答问题、是否刻意掩盖自身状态等因素影响,结果客观,因此,该样本数据需要充分利用;在之前的分层抽样中,还有部分个人心理文本未被采样利用,在此处为了考虑全面性以及客观性,本发明将其用作输入向量,能够使得模型的预测结果更加客观全面。
如此,将所述第二向量序列输入所述训练好的神经网络,通过神经网络评估模块输出评估向量序列;
在此处,由于训练好的神经网络的输入节点为N,而所述第二向量序列的维数为M,为了使得二者匹配,需要对所述第二向量序列进行降维或者升维处理,具体而言,
如果M>N,则将所述第二向量序列进行降维处理,得到N维向量序列后,输入所述训练好的神经网络;
否则,则将所述第二向量序列进行升维处理,得到N维向量序列后,输入所述训练好的神经网络。
最后,心理测试量合成模块对所述输出评估向量序列进行合成处理,得到心理测试合成量;
判断所述心理测试合成量与预定阈值的差异度,根据所述差异度评估被测用户的心理健康。
这里就是本发明的另一个核心构思,包括:
设所述输出评估向量序列为Ss={Ss1,Ss2,......SsM};
所述第二向量序列为
Figure GDA0002523738900000051
则所述心理测试合成量为
Figure GDA0002523738900000052
其中,||2表示欧几里得范数。
所述预定阈值由如下公式计算:
Figure GDA0002523738900000053
根据发明人的大量样本测试证明,上述指标的选用,充分考虑了测试前向量以及输入输出样本的数量,能够较好的体现心理健康状态。
另一个方面,本发明还提出一种基于语义向量预测心理健康的装置,所述装置包括语义文本采集子系统、语义文本抽样子系统、语义文本向量化子系统;
其中,所述语义文本采集子系统,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据;
所述语义文本抽样子系统,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;
所述语义文本向量化子系统,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得抽样数据集向量序列;
按照如下公式确定历史心理测试文本数据以及个人心理描述文本数据的抽样比例:
对于第n类历史心理测试文本数据,抽样比例为:
Figure GDA0002523738900000054
对于第m类个人心理描述文本,抽样比例为:
Figure GDA0002523738900000055
其中,Tn为对所述历史心理测试文本数据进行分类后每个类别所占的比例,n=1,2,...,N,N为类别数;Sm为对所述对个人心理描述文本进行分类后每个类别所占的比例,m=1,2,...,M,M为类别数;
所述装置进一步包括神经网络组件集和评估结果输出级,所述神经网络组件集包括神经网络训练组件、神经网络测试组件;
将所述抽样数据集向量序列按照预定比例划分为训练集和测试集,输入所述神经网络训练组件和神经网络测试组件,直到训练得到神经网络模型符合预期指标;
所述语义文本向量化子系统将不包含在所述分层抽样数据集中的个人心理描述文本进行向量化处理,获得评估向量序列,并将所述评估向量序列输入所述神经网络模型,通过所述神经网络对个人的心理健康进行预测评估。
可见,本发明的技术方案,基于被测用户的客观心理语义文本建立神经网络模型进行预测评估。不同于现有技术,本发明利用的心理语义文本体现的是用户自身的真实情感表达,不需要用户主动参与;并且,为了保证建模样本的准确性,引入分层抽样的方法对样本进行了预处理,并且将未被分层抽样的个人心理文本作为模型输入向量集,从而保证输出的结果客观的反应用户的心理状态;采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
本发明的进一步优点和具体实施方式将结合说明书附图进一步体现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本实施例的基于语义向量构建神经网络预测心理健康的系统框架图
图2是本实施例的分层抽样示意图
图3是本实施例的神经网络结构示意图
图4是本实施例的心理测试合成量输出示意图。
图5是另一实施例的基于语义向量预测心理健康的装置图
具体实施例
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
参见图1,本实施例的一种基于语义向量构建神经网络预测心理健康的系统,所述系统包括语义文本采集模块、语义文本抽样模块、语义文本向量化模块、神经网络训练模块、神经网络评估模块以及心理测试量合成模块;
所述语义文本采集模块,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据。
其中采集被测用户的历史心理测试文本数据,主要包括采集专业心理测量表及其相关评估结果、建议等:专业心理测量数据的采集可以从心理治疗机构或医疗机构等专业机构进行收集,数据主要包括测试数据时间、心理测量表及其得分、评估结果、对策建议等;
所述语义文本采集模块还要采集个人心理描述文本数据。
在本实施例中,作为体现本发明的发明构思之一,不同于现有技术提到的需要用户主动参与提供的″问卷调查″数据,本实施例首次利用个人心理文本进行心理健康监测。这里的个人心理文本的采集方式完全是被动的,不需要用户主动提供,因此,其不受用户是否客观回答问题、是否刻意掩盖自身状态等因素影响,结果客观。
具体而言,采集个人心理描述文本数据,主要包括采集个人信息及其历史心理文本:个人信息可以通过个人注册信息来进行获取,历史心理文本可以根据个体的个人的朋友圈、微博等进行获取;
对于寻求心理健康的用户来说,通过采集其过碎片化的文本(如微博、说说、朋友圈等等社交方式),可以得到大量的个人心理文本;
进一步的,所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;
参照图2,作为体现本发明的关键技术手段的另一个方面,本实施例引入语义文本抽样模块对样本数据集(历史心理测试文本数据以及个人心理描述文本数据)进行分层抽样,带来的有益效果是,一方面使得后续的语义文本向量化模块要处理的数据量大大降低,另一方面同时保证样本数据集在后续用于建模时具备代表性,保证建模的准确性;
具体而言,所述分层抽样包括:
对所述历史心理测试文本数据进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Tn,n=1,2,...,N,N为类别数;
对个人心理描述文本进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Sm,m=1,2,...,M,M为类别数;
按照如下公式确定抽样比例:
对于第n类历史心理测试文本数据,抽样比例为:
Figure GDA0002523738900000081
对于第m类个人心理描述文本,抽样比例为:
Figure GDA0002523738900000082
接下来,所述语义文本向量化模块,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得第一向量序列;
抽样获得的第n类历史心理文本数据的向量化序列为VTn,抽样获得的第m类个人心理描述文本的向量化序列为VSm;
所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练;
具体包括:
利用向量化序列VTn作为输入层,利用向量化序列VSm作为输出层,进行神经网络的训练。
继续参照图1,作为体现本发明关键技术手段的图示,将不包含在所述分层抽样数据集中的个人心理描述文本(即未被抽样到的个人心理描述文本,在图1中通过虚线框箭头专门示出),通过所述语义文本向量化模块进行向量化处理,获得第二向量序列;
具体而言,第m类不包含在所述分层抽样数据集中的个人心理描述文本向量化处理后的向量为
Figure GDA0002523738900000083
所有的
Figure GDA0002523738900000084
(m=1,2,...,M)构成所述第二向量序列;
在本实例中,个人心理文本的采集方式完全是被动的,不需要用户主动提供,因此,其不受用户是否客观回答问题、是否刻意掩盖自身状态等因素影响,结果客观,因此,该样本数据需要充分利用;在之前的分层抽样中,还有部分个人心理文本未被采样利用,在此处为了考虑全面性以及客观性,本发明将其用作输入向量,能够使得模型的预测结果更加客观全面。
如此,将所述第二向量序列输入所述训练好的神经网络,通过神经网络评估模块输出评估向量序列;
在此处,由于训练好的神经网络的输入节点为N,而所述第二向量序列的维数为M,为了使得二者匹配,需要对所述第二向量序列进行降维或者升维处理,具体而言,
如果M>N,则将所述第二向量序列进行降维处理,得到N维向量序列后,输入所述训练好的神经网络;
否则,则将所述第二向量序列进行升维处理,得到N维向量序列后,输入所述训练好的神经网络。
所述训练好的神经网络的一个典型结构参照图3,包括N层输入层,若干中间层,以及M层输出层;
所述降维或者升维操作本身,在本领域有多种常见的处理方式,例如M>N时,可采用主成分分析法,取M层中的前N层;如果M<N,可采用比例加权法,例如将1——M层的每一层分别加上对应的权重(例如每一层占总数的比例),得到新的分层;继续上述操作,直到分层数(维数)达到N;等等;
最后,心理测试量合成模块对所述输出评估向量序列进行合成处理,得到心理测试合成量;
判断所述心理测试合成量与预定阈值的差异度,根据所述差异度评估被测用户的心理健康。
参照图4,体现了本发明的另一个核心构思即采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度,包括:
设所述输出评估向量序列为Ss={Ss1,Ss2,......SsM};
所述第二向量序列为
Figure GDA0002523738900000091
则所述心理测试合成量为
Figure GDA0002523738900000092
其中,||2表示欧几里得范数。
所述预定阈值由如下公式计算:
Figure GDA0002523738900000093
如果二者的差异越大,表明心理状态不健康程度越严重,相反,如果二者差异很小,则意味着被测用户的心理波动不大,一直输出较水平。
这种判断,基于欧几里得范数特定的向量比较性质得出,特定的向量来自于用户的客观心理描述文本,结果准确客观,根据发明人的大量样本测试证明,上述指标的选用,充分考虑了测试前向量以及输入输出样本的数量,能够较好的体现心理健康状态。
参照图5,本发明还提出一种基于语义向量预测心理健康的装置,所述装置包括语义文本采集子系统、语义文本抽样子系统、语义文本向量化子系统;
其中,所述语义文本采集子系统,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据;
所述语义文本抽样子系统,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;
所述语义文本向量化子系统,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得抽样数据集向量序列;
按照如下公式确定历史心理测试文本数据以及个人心理描述文本数据的抽样比例:
对于第n类历史心理测试文本数据,抽样比例为:
Figure GDA0002523738900000101
对于第m类个人心理描述文本,抽样比例为:
Figure GDA0002523738900000102
其中,Tn为对所述历史心理测试文本数据进行分类后每个类别所占的比例,n=1,2,...,N,N为类别数;Sm为对所述对个人心理描述文本进行分类后每个类别所占的比例,m=1,2,...,M,M为类别数;
所述装置进一步包括神经网络组件集和评估结果输出级,所述神经网络组件集包括神经网络训练组件、神经网络测试组件;
将所述抽样数据集向量序列按照预定比例划分为训练集和测试集,输入所述神经网络训练组件和神经网络测试组件,直到训练得到神经网络模型符合预期指标;
所述语义文本向量化子系统将不包含在所述分层抽样数据集中的个人心理描述文本进行向量化处理,获得评估向量序列,并将所述评估向量序列输入所述神经网络模型,通过所述神经网络对个人的心理健康进行预测评估。
对个人的心理健康进行预测评估的具体过程,和前述一种基于语义向量预测心理健康的系统的方案类似,在此不再赘述。
本发明的优选实现之一是客户端应用,也即是在代码模块中的指令集(程序代码)或者其他功能描述性材料,例如该代码模块可以驻留计算机的随机存取存储器中。直到计算机需要,指令集可以存储在另一个计算机存储器中,例如存储在硬盘驱动中或诸如光盘(最终供在CD ROM中使用)或软盘(最终供在软盘驱动中使用)之类的可移动存储器中,或者经由互联网或其他计算机网络来下载。因此,本发明可以实现为在计算机中使用的计算机程序产品。另外,尽管可以方便地在由软件选择性地激活或重新配置的通用计算机中实现所描述的各种方法,但是本领域的普通技术人员还将认识到,可以以硬件、固件或构造成执行所需要的方法步骤的更专用的设备中实现这些方法。功能描述性材料是将功能性告知给机器的信息。功能描述性材料包括但不限于计算机程序、指令、规则、事实、可计算功能的定义、对象和数据结构。
可见,本发明的技术方案,基于被测用户的客观心理语义文本建立神经网络模型进行预测评估。不同于现有技术,本发明利用的心理语义文本体现的是用户自身的真实情感表达,不需要用户主动参与;并且,为了保证建模样本的准确性,引入分层抽样的方法对样本进行了预处理,并且将未被分层抽样的个人心理文本作为模型输入向量集,从而保证输出的结果客观的反应用户的心理状态;采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度。

Claims (9)

1.一种基于语义向量构建神经网络预测心理健康的系统,所述系统包括语义文本采集模块、语义文本抽样模块、语义文本向量化模块、神经网络训练模块、神经网络评估模块以及心理测试量合成模块;
其特征在于:
所述语义文本采集模块,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据;
所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;
所述语义文本向量化模块,用于对所述分层抽样语义文本数据集中的语义文本进行向量化处理,获得第一向量序列;
所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练;
将不包含在所述分层抽样语义文本数据集中的个人心理描述文本数据,通过所述语义文本向量化模块进行向量化处理,获得第二向量序列;
将所述第二向量序列输入所述神经网络训练模块训练的神经网络,通过神经网络评估模块输出评估向量序列;
心理测试量合成模块对所述输出评估向量序列进行合成处理,得到心理测试合成量;
判断所述心理测试合成量与预定阈值的差异度,根据所述差异度评估被测用户的心理健康;
其中,将不包含在所述分层抽样语义文本数据集中的个人心理描述文本数据,通过所述语义文本向量化模块进行向量化处理,获得第二向量序列,包括:
第m类不包含在所述分层抽样语义文本数据集中的个人心理描述文本数据向量化处理后的向量为
Figure FDA0002523738890000011
所有的
Figure FDA0002523738890000012
构成所述第二向量序列;其中,m=1,2,…,M;M、N为类别数;
将所述第二向量序列输入所述训练好的神经网络,通过神经网络评估模块输出评估向量序列,具体包括:如果M>N,则将所述第二向量序列进行降维处理,得到N维向量序列后,输入所述训练好的神经网络;否则,则将所述第二向量序列进行升维处理,得到N维向量序列后,输入所述训练好的神经网络。
2.如权利要求1所述的基于语义向量构建神经网络预测心理健康的系统,其中,所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样数据集,具体包括:对所述历史心理测试文本数据进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Tn,n=1,2,...,N,N为类别数;对个人心理描述文本数据进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Sm,m=1,2,...,M,M为类别数;
按照如下公式确定抽样比例:
对于第n类历史心理测试文本数据,抽样比例为:
Figure FDA0002523738890000021
对于第m类个人心理描述文本数据,抽样比例为:
Figure FDA0002523738890000022
3.如权利要求2所述的基于语义向量构建神经网络预测心理健康的系统,其中,抽样获得的第n类历史心理文本数据的向量化序列为VTn,抽样获得的第m类个人心理描述文本数据的向量化序列为VSm;所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练,具体包括:
利用向量化序列VTn作为输入层,利用向量化序列VSm作为输出层,进行神经网络的训练。
4.如权利要求1-3任一项所述的基于语义向量构建神经网络预测心理健康的系统,其中心理测试量合成模块对所述输出评估向量序列进行合成处理,得到心理测试合成量,包括:
设所述输出评估向量序列为:Ss={Ss1,Ss2,......SsM};
所述第二向量序列为:
Figure FDA0002523738890000023
则所述心理测试合成量为:
Figure FDA0002523738890000024
其中,||2表示欧几里得范数。
5.如权利要求4所述的基于语义向量构建神经网络预测心理健康的系统,其中,判断所述心理测试合成量与预定阈值的差异度,根据所述差异度评估被测用户的心理健康,包括:
所述预定阈值由如下公式计算:
Figure FDA0002523738890000025
6.如权利要求1所述的基于语义向量构建神经网络预测心理健康的系统,其中,采集的被测用户的历史心理测试文本数据,包括:
心理测量表及其得分、测试数据来源时间、个人信息、个人历史心理文本数据、评估结果、对策建议。
7.如权利要求1所述的基于语义向量构建神经网络预测心理健康的系统,其中,采集被测用户的个人心理描述文本数据,包括:通过个人注册的社交网络信息来进行获取个人心理描述文本数据。
8.一种基于语义向量预测心理健康的装置,所述装置包括语义文本采集子系统、语义文本抽样子系统、语义文本向量化子系统;
其中,所述语义文本采集子系统,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据;
所述语义文本抽样子系统,用于对所述语义文本采集子系统采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;
所述语义文本向量化子系统,用于对所述分层抽样语义文本数据集中的语义文本进行向量化处理,获得抽样数据集向量序列;
其特征在于:
按照如下公式确定历史心理测试文本数据以及个人心理描述文本数据的抽样比例:
对于第n类历史心理测试文本数据,抽样比例为:
Figure FDA0002523738890000031
对于第m类个人心理描述文本,抽样比例为:
Figure FDA0002523738890000032
其中,Tn为对所述历史心理测试文本数据进行分类后每个类别所占的比例,n=1,2,...,N,N为类别数;Sm为对个人心理描述文本数据进行分类后每个类别所占的比例,m=1,2,...,M,M为类别数;所述装置进一步包括神经网络组件集和评估结果输出级,所述神经网络组件集包括神经网络训练组件、神经网络测试组件;
将所述抽样数据集向量序列按照预定比例划分为训练集和测试集,输入所述神经网络训练组件和神经网络测试组件,直到训练得到神经网络模型符合预期指标;
所述语义文本向量化子系统将不包含在所述分层抽样语义文本数据集中的个人心理描述文本数据进行向量化处理,获得评估向量序列,并将所述评估向量序列输入所述神经网络模型,通过所述神经网络对个人的心理健康进行预测评估。
9.一种客户端应用,运行在如权利要求8所述的一种基于语义向量预测心理健康的装置上,所述装置包含如权利要求1-7任一项所述的基于语义向量构建神经网络预测心理健康的系统。
CN201910645823.2A 2019-07-17 2019-07-17 一种基于语义向量构建神经网络预测心理健康的系统和装置 Active CN110391013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910645823.2A CN110391013B (zh) 2019-07-17 2019-07-17 一种基于语义向量构建神经网络预测心理健康的系统和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910645823.2A CN110391013B (zh) 2019-07-17 2019-07-17 一种基于语义向量构建神经网络预测心理健康的系统和装置

Publications (2)

Publication Number Publication Date
CN110391013A CN110391013A (zh) 2019-10-29
CN110391013B true CN110391013B (zh) 2020-08-14

Family

ID=68285004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910645823.2A Active CN110391013B (zh) 2019-07-17 2019-07-17 一种基于语义向量构建神经网络预测心理健康的系统和装置

Country Status (1)

Country Link
CN (1) CN110391013B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111477329B (zh) * 2020-03-31 2021-04-13 北京智能工场科技有限公司 一种基于图文结合评估心理状态的方法
CN111524578B (zh) * 2020-06-19 2023-08-11 智恩陪心(北京)科技有限公司 一种基于电子心理沙盘的心理评估装置、方法及系统
CN112086169B (zh) * 2020-09-19 2024-02-09 北京心灵力量科技有限公司 采用心理数据标签化建模的交互式心理疏导系统
CN112687374B (zh) * 2021-01-12 2023-09-15 湖南师范大学 一种基于文本和图像信息联合计算的心理危机预警方法
CN115910345B (zh) * 2022-12-22 2023-06-27 广东数业智能科技有限公司 一种心理健康测评智能预警方法及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101883A (zh) * 2018-07-09 2018-12-28 山东师范大学 一种抑郁倾向评价装置及系统
CN109242710A (zh) * 2018-08-16 2019-01-18 北京交通大学 社交网络节点影响力排序方法及系统
CN109242149A (zh) * 2018-08-13 2019-01-18 华中师范大学 一种基于教育数据挖掘的学生成绩早期预警方法及系统
CN109635207A (zh) * 2018-12-18 2019-04-16 上海海事大学 一种基于中文文本分析的社交网络用户人格预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399575A (zh) * 2018-01-24 2018-08-14 大连理工大学 一种基于社交媒体文本的大五人格预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101883A (zh) * 2018-07-09 2018-12-28 山东师范大学 一种抑郁倾向评价装置及系统
CN109242149A (zh) * 2018-08-13 2019-01-18 华中师范大学 一种基于教育数据挖掘的学生成绩早期预警方法及系统
CN109242710A (zh) * 2018-08-16 2019-01-18 北京交通大学 社交网络节点影响力排序方法及系统
CN109635207A (zh) * 2018-12-18 2019-04-16 上海海事大学 一种基于中文文本分析的社交网络用户人格预测方法

Also Published As

Publication number Publication date
CN110391013A (zh) 2019-10-29

Similar Documents

Publication Publication Date Title
CN110391013B (zh) 一种基于语义向量构建神经网络预测心理健康的系统和装置
CN110570941B (zh) 一种基于文本语义向量模型评估心理状态的系统和装置
KR101969540B1 (ko) 인지 기능 재활 훈련 방법 및 장치
Kitchenham et al. Evidence-based software engineering and systematic reviews
Harte et al. Process models of decision making
Baarda et al. Introduction to Statistics with SPSS
Beck Ethnographic decision tree modeling: A research method for counseling psychology.
KR20170137514A (ko) 심리측정 데이터 기반 개인 신용평가 장치, 방법 및 컴퓨터 프로그램
Ranyard et al. Verbal data and decision process analysis
CN110020762A (zh) 一种学校综合督导评估系统及方法
CN105893748A (zh) 基于粗糙集理论的幸福指数评价方法及系统
Stanković et al. Artificial neural network model for prediction of students’ success in learning programming
CN115251928A (zh) 一种基于深度学习的大学生心理健康评估系统
Nega et al. Data mining based hybrid intelligent system for medical application
KR20100137966A (ko) 전문가 시스템을 이용한 인터넷 중독 진단장치, 치료방안 추론장치 및 치료시스템
Saranya et al. ENHANCED PREDICTION OF STUDENT DROPOUTS USING FUZZY INFERENCE SYSTEM AND LOGISTIC REGRESSION.
Correia Using Structural Equation Modelling and Clustering to Research Users’ and Employees’ views of the Portuguese Ministry of Justice
Chaurasia et al. Detection of Parkinson's disease by using machine learning stacking and ensemble method
CN117558446A (zh) 心理健康的测评方法、装置、电子设备及存储介质
Jatmika et al. The model of local wisdom for smart wellness tourism with optimization multilayer perceptron
Ranyard et al. Verbal reports and decision process analysis
Yang [Retracted] Analysis Model of Personality and Psychological Characteristics of Network Users under High‐Pressure Working Environment
KR102422876B1 (ko) 피부 나이 진단방법 및 이를 실행시키기 위한 프로그램을 기록한 저장매체
Möser et al. Meta-analysis: An alternative to narrative reviews for synthesising social science research
US20240242732A1 (en) System and method for determining a users emotions and increasing the users emotional intelligence and self-awareness utilizing the users voice samples

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant