CN117789971A - 基于文本情感分析的心理健康智能评测系统及方法 - Google Patents
基于文本情感分析的心理健康智能评测系统及方法 Download PDFInfo
- Publication number
- CN117789971A CN117789971A CN202410178727.2A CN202410178727A CN117789971A CN 117789971 A CN117789971 A CN 117789971A CN 202410178727 A CN202410178727 A CN 202410178727A CN 117789971 A CN117789971 A CN 117789971A
- Authority
- CN
- China
- Prior art keywords
- semantic
- sequence
- evaluation
- evaluation text
- text segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 447
- 230000008451 emotion Effects 0.000 title claims abstract description 120
- 230000004630 mental health Effects 0.000 title claims abstract description 75
- 238000004458 analytical method Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims description 18
- 238000012545 processing Methods 0.000 claims abstract description 28
- 239000013598 vector Substances 0.000 claims description 200
- 238000012549 training Methods 0.000 claims description 114
- 230000011218 segmentation Effects 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 3
- 230000007935 neutral effect Effects 0.000 abstract description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000009323 psychological health Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000002996 emotional effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012854 evaluation process Methods 0.000 description 2
- 230000006996 mental state Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000010490 psychological well-being Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000011511 automated evaluation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本申请公开了一种基于文本情感分析的心理健康智能评测系统及方法,涉及智能化评测技术领域,其能够根据用户输入的评测文本,并在后端引入基于自然语言技术和人工智能的数据处理和分析算法来进行该评测文本的语义分析,以此来自动分析用户的情感倾向,从而为用户提供个性化的心理健康建议和干预方案。这样,能够有效地识别用户输入的评测文本中的情感倾向类型标签,如积极、消极、中性等,从而提高文本情感分析的准确性和效率,以便于为用户提供及时的心理健康评测服务,并给出相应的建议和引导。
Description
技术领域
本申请涉及智能化评测技术领域,尤其涉及一种基于文本情感分析的心理健康智能评测系统及方法。
背景技术
心理健康是人们生活中非常重要的一个方面,心理健康评测是一种通过评估个体的心理状态、情绪和心理健康状况来提供帮助和支持的过程,它可以帮助人们更好地了解自己的心理健康状况,发现潜在的问题,并采取适当的措施来促进心理健康的发展。
然而,传统的心理健康评测系统通常由专业的心理学家、心理咨询师或医生进行,依赖于专业人士的人工评估和解释,这不仅需要较长的时间和较高的成本,而且存在主观性和依赖性的问题。也就是说,评测结果可能受到评估者的个人偏见和解释的影响,导致结果的不一致性和不准确性。同时,也限制了评测的普及性和可及性,使得更多的人无法及时获得评估和支持。
因此,期望一种基于文本情感分析的心理健康智能评测系统及方法。
发明内容
本申请提供一种基于文本情感分析的心理健康智能评测系统及方法,其能够根据用户输入的评测文本,并在后端引入基于自然语言技术和人工智能的数据处理和分析算法来进行该评测文本的语义分析,以此来自动分析用户的情感倾向,从而为用户提供个性化的心理健康建议和干预方案。
本申请还提供了一种基于文本情感分析的心理健康智能评测系统,其包括:
评测文本输入模块,用于获取待评测用户输入的评测文本;
评测文本分段处理模块,用于对所述评测文本进行分段处理以得到评测文本段的序列;
评测文本段语义理解模块,用于对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列;
评测文本全局语义编码模块,用于计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征;
用户情感倾向检测模块,用于基于所述评测文本全局语义编码特征,确定待评测用户的情感倾向类型标签;
其中,所述评测文本全局语义编码模块,包括:
评测文本段权重计算单元,用于计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
评测文本段语义融合单元,用于基于所述语义权重值的序列,融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征向量作为所述评测文本全局语义编码特征;
其中,所述评测文本段权重计算单元,用于:以如下段权重公式计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
其中,所述段权重公式为:
;
其中,和/>为所述评测文本段语义编码特征向量的序列中第/>和第/>个评测文本段语义编码特征向量,/>是所述评测文本段语义编码特征向量的序列,/>为向量的一范数,/>为所述评测文本段语义编码特征向量的序列中向量的个数,/>为所述语义权重值的序列中各个语义权重值。
在上述基于文本情感分析的心理健康智能评测系统中,所述评测文本段语义理解模块,包括:分词单元,用于对所述评测文本段的序列中的各个评测文本段进行分词处理以将所述评测文本段的序列中的各个评测文本段转化为由多个词组成的词序列;嵌入编码单元,用于使用包含词嵌入层的评测文本段语义编码器的词嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及上下文编码单元,用于使用所述包含词嵌入层的评测文本段语义编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述评测文本段语义编码特征向量的序列。
在上述基于文本情感分析的心理健康智能评测系统中,所述评测文本段语义融合单元,用于:基于所述语义权重值的序列,对所述评测文本段语义编码特征向量的序列进行加权求和以得到所述评测文本全局语义编码特征向量。
在上述基于文本情感分析的心理健康智能评测系统中,所述用户情感倾向检测模块,用于:将所述评测文本全局语义编码特征向量通过分类器以得到分类结果,所述分类结果用于表示待评测用户的情感倾向类型标签。
在上述基于文本情感分析的心理健康智能评测系统中,还包括用于对所述包含词嵌入层的评测文本段语义编码器和所述分类器进行训练的训练模块。
在上述基于文本情感分析的心理健康智能评测系统中,所述训练模块,包括:训练评测文本输入单元,用于获取待评测用户输入的训练评测文本;训练评测文本分段处理单元,用于对所述训练评测文本进行分段处理以得到训练评测文本段的序列;训练评测文本段语义理解单元,用于对所述训练评测文本段的序列中的各个训练评测文本段进行语义编码以得到训练评测文本段语义编码特征向量的序列;训练评测文本段权重计算单元,用于计算所述训练评测文本段语义编码特征向量的序列中的各个训练评测文本段语义编码特征向量的训练语义权重值以得到训练语义权重值的序列;训练评测文本段语义融合单元,用于基于所述训练语义权重值的序列,融合所述训练评测文本段语义编码特征向量的序列以得到训练评测文本全局语义编码特征向量;训练优化单元,用于对所述训练评测文本全局语义编码特征向量进行优化以得到优化训练评测文本全局语义编码特征向量;训练分类单元,用于将所述优化训练评测文本全局语义编码特征向量通过分类器以得到分类损失函数值;训练单元,用于基于所述分类损失函数值对所述包含词嵌入层的评测文本段语义编码器和所述分类器进行训练。
本申请还提供了一种基于文本情感分析的心理健康智能评测方法,其包括:
获取待评测用户输入的评测文本;
对所述评测文本进行分段处理以得到评测文本段的序列;
对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列;
计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征;
基于所述评测文本全局语义编码特征,确定待评测用户的情感倾向类型标签;
其中,计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征,包括:
计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
基于所述语义权重值的序列,融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征向量作为所述评测文本全局语义编码特征;
其中,计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列,包括:以如下段权重公式计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
其中,所述段权重公式为:
;
其中,和/>为所述评测文本段语义编码特征向量的序列中第/>和第/>个评测文本段语义编码特征向量,/>是所述评测文本段语义编码特征向量的序列,/>为向量的一范数,/>为所述评测文本段语义编码特征向量的序列中向量的个数,/>为所述语义权重值的序列中各个语义权重值。
在上述基于文本情感分析的心理健康智能评测方法中,对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列,包括:对所述评测文本段的序列中的各个评测文本段进行分词处理以将所述评测文本段的序列中的各个评测文本段转化为由多个词组成的词序列;使用所述包含词嵌入层的评测文本段语义编码器的词嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及,使用所述包含词嵌入层的评测文本段语义编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述评测文本段语义编码特征向量的序列。
与现有技术相比,本申请提供的基于文本情感分析的心理健康智能评测系统及方法,其能够有效地识别用户输入的评测文本中的情感倾向类型标签,如积极、消极、中性等,从而提高文本情感分析的准确性和效率,以便于为用户提供及时的心理健康评测服务,并给出相应的建议和引导。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测系统的框图。
图2为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测方法的流程图。
图3为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测方法的系统架构的示意图。
图4为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测系统的应用场景图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本申请实施例做进一步详细说明。在此,本申请的示意性实施例及其说明用于解释本申请,但并不作为对本申请的限定。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅只是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
心理健康评测是一种系统性的过程,旨在评估个体的心理状态、情绪和心理健康状况,这种评测通常由专业的心理学家、心理医生或其他经过训练的专业人士进行。评测的方式可以多样化,包括问卷调查、面谈、观察和心理测试等。
心理健康评测的目的是多方面的。首先,可以帮助个体更好地了解自己的心理健康状况,包括情绪、压力水平、自我意识、人际关系等方面。其次,评测可以帮助发现潜在的心理健康问题,比如焦虑、抑郁、压力过大等。最重要的是,评测结果可以为个体提供适当的帮助和支持,包括心理咨询、心理治疗、药物治疗等,从而促进心理健康的发展。
在心理健康评测过程中,个体通常会被要求回答一系列问题,或者接受一些心理测试,以便评估其心理健康状况,这些测试可能涉及到情绪、认知能力、人格特征、压力水平等方面的评估。评测结果会被专业人士分析和解释,然后针对个体的情况提出相应的建议和治疗方案。
传统的心理健康评测系统通常由专业的心理学家、心理咨询师或医生进行,依赖于专业人士的人工评估和解释。然而,这种方法存在一些明显的缺陷:传统评测需要较长的时间和较高的成本,因为它们依赖于专业人士的人工参与,这使得评测过程对于一般大众来说不够便捷和经济。人工评估容易受到评估者个人偏见的影响,导致评测结果的主观性和依赖性。不同的评估者可能会对同一份评测结果做出不同的解释,这可能会导致结果的不一致性和不准确性。由于依赖专业人士,传统的心理健康评测系统的普及性和可及性受到了限制,这使得更多的人无法及时获得评估和支持,尤其是在人口稠密地区或资源匮乏地区。
为了克服传统心理健康评测系统的这些缺陷,一些新的方法和技术被引入,例如基于人工智能的自动化评估系统,系统可以利用大数据和机器学习技术,通过分析个体的语言、行为和其他数据来评估其心理健康状况,这种方法可以提高评测的效率和客观性,同时也可以使得心理健康评测更加普及。
本申请介绍了一种基于文本情感分析的心理健康智能评测系统,该系统可以根据用户输入的文本,分析其情感倾向和心理状态,给出相应的评分和建议。该系统利用了自然语言处理和机器学习的技术,对文本进行预处理、特征提取、分类和评估等步骤,实现了对用户心理健康的有效识别和辅助。基于文本情感分析的心理健康智能评测系统具有以下特点:
基于文本的输入方式,方便用户随时随地进行心理健康评测,无需额外的设备或人员。
基于情感分析的评测方法,能够捕捉用户的细微情感变化,反映其真实的心理状态,避免了传统问卷或测试的主观性和局限性。
基于智能的评测系统,能够根据用户的文本内容和情感倾向,给出合适的评分和建议,帮助用户提高自我认知和调节能力。
在本申请的一个实施例中,图1为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测系统的框图。如图1所示,根据本申请实施例的基于文本情感分析的心理健康智能评测系统100,包括:评测文本输入模块110,用于获取待评测用户输入的评测文本;评测文本分段处理模块120,用于对所述评测文本进行分段处理以得到评测文本段的序列;评测文本段语义理解模块130,用于对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列;评测文本全局语义编码模块140,用于计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征;用户情感倾向检测模块150,用于基于所述评测文本全局语义编码特征,确定待评测用户的情感倾向类型标签。
在所述评测文本输入模块110中,能够有效地获取用户输入的评测文本,包括文字、语音或其他形式的输入,这将为后续的评测提供必要的输入数据,使得系统能够对用户的文本进行分析和处理。在所述评测文本分段处理模块120中,能够对输入的评测文本进行合理的分段处理,确保分段后的文本能够被有效地处理和分析,通过合理的分段处理,可以更好地理解用户输入的内容,为后续的语义理解和情感倾向检测提供更准确的数据基础。在所述评测文本段语义理解模块130中,能够对所述评测文本段的序列中的各个评测文本段进行语义编码,以得到评测文本段语义编码特征向量的序列。通过对文本段进行语义编码,系统可以更好地理解每个文本段的含义和语境,为后续的全局语义编码提供准确的数据基础。在所述评测文本全局语义编码模块140中,能够计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值,并据此融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征。通过计算语义权重值并融合评测文本段语义编码特征向量的序列,系统可以更好地理解整个评测文本的语义内容,从而为情感倾向检测提供更准确的基础。在所述用户情感倾向检测模块150中,基于所述评测文本全局语义编码特征,确定用户的情感倾向类型标签,比如积极、消极或中性,通过对用户输入的文本进行情感倾向检测,系统可以帮助理解用户的情感状态和需求,从而提供更个性化的支持和建议。
随着自然语言处理和机器学习的发展,基于文本的情感分析在心理健康领域得到了广泛应用。文本情感分析是自然语言处理的一个重要分支,它旨在从文本中识别和提取用户的情感态度和情绪倾向。基于此,在本申请的技术方案中,提出了一种基于文本情感分析的心理健康智能评测系统,其能够根据用户输入的评测文本,并在后端引入基于自然语言技术和人工智能的数据处理和分析算法来进行该评测文本的语义分析,以此来自动分析用户的情感倾向,从而为用户提供个性化的心理健康建议和干预方案。这样,能够有效地识别用户输入的评测文本中的情感倾向类型标签,如积极、消极、中性等,从而提高文本情感分析的准确性和效率,以便于为用户提供及时的心理健康评测服务,并给出相应的建议和引导。
具体地,在本申请的技术方案中,首先,获取待评测用户输入的评测文本。接着,考虑到在所述评测文本中,存在着关于用户输入的大量语义信息,而所述评测文本中的不同文本段可能包含关于用户的不同情感表达和语义信息,通过分段处理可以更准确地捕捉到这些细微差别。因此,为了能够从该评测文本中提取出用户的情感倾向语义,以此来为用户提供及时的心理健康评测服务,需要将评测文本分成段落或句子以使系统对每个文本段进行独立的细粒度情感分析。具体地,在本申请的技术方案中,为了能够更细致地捕捉评测文本中的情感表达和语义信息,需要对所述评测文本进行分段处理以得到评测文本段的序列。
然后,对所述评测文本段的序列中的各个评测文本段进行语义编码,以分别提取出所述各个评测文本段中的语义编码特征信息,从而得到评测文本段语义编码特征向量的序列。应可以理解,语义编码可以帮助系统捕捉所述各个评测文本段中的语义特征信息,包括词义、句法结构、上下文关系等。同时,通过语义编码还可以提取文本段中的重要特征,例如情感词、情感强度、词性等,这些特征可以用于后续的情感分析和评估。也就是说,通过将语义信息转化为向量表示,系统可以更好地理解每个文本段的含义和情感倾向,从而有利于更准确地识别和评估评测文本的情感倾向。
在本申请的一个具体实施例中,所述评测文本段语义理解模块,包括:分词单元,用于对所述评测文本段的序列中的各个评测文本段进行分词处理以将所述评测文本段的序列中的各个评测文本段转化为由多个词组成的词序列;嵌入编码单元,用于使用包含词嵌入层的评测文本段语义编码器的词嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及,上下文编码单元,用于使用所述包含词嵌入层的评测文本段语义编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述评测文本段语义编码特征向量的序列。
通过分词单元对所述评测文本段的序列中的各个评测文本段进行分词处理,能够将文本转化为由多个词组成的词序列,这有助于更准确地理解文本的语义含义。嵌入编码单元使用所述包含词嵌入层的评测文本段语义编码器的词嵌入层将词序列中的各个词映射到词向量,这有助于将词语转化为向量表示,从而更好地进行语义分析和理解。上下文编码单元通过所述包含词嵌入层的评测文本段语义编码器对词向量的序列进行基于全局的上下文语义编码,可以更好地理解文本的整体语义信息,而不仅仅是单个词的含义。
通过对评测文本段的序列进行深层的语义理解和编码,评测系统可以更准确地捕捉文本的情感倾向,从而提高情感倾向检测的准确性和可靠性。通过对评测文本段的序列进行深层的语义编码,系统可以减少文本中的语义歧义,更好地理解用户的表达意图,从而提高系统对用户输入的理解能力。
在本申请的一个实施例中,所述评测文本全局语义编码模块,包括:评测文本段权重计算单元,用于计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;评测文本段语义融合单元,用于基于所述语义权重值的序列,融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征向量作为所述评测文本全局语义编码特征。
应可以理解,由于不同的评测文本段可能在情绪倾向检测过程中对整体的评测文本语义的贡献程度不同,因此需要区分出哪些文本段对整体的语义更重要,并对关键的文本段语义进行突出,这对于用户的情感倾向检测至关重要。基于此,在本申请的技术方案中,进一步计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列,融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征向量。也就是说,通过计算所述各个评测文本段的语义权重值,并利用该语义权重值对相应的评测文本段语义编码特征向量进行加权后,融合所述各个评测文本段的加权后语义特征信息。这样,可以突出评测文本中对情感倾向检测更重要的文本段语义,并排除一些对整体语义编码贡献较小的文本段,从而减少噪声的影响,以此更好地综合各个文本段的语义信息来进行情感倾向检测,提高情感分析的准确性。
在本申请的一个具体实施例中,所述评测文本段权重计算单元,用于:以如下段权重公式计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;其中,所述段权重公式为:
;
其中,和/>为所述评测文本段语义编码特征向量的序列中第/>和第/>个评测文本段语义编码特征向量,/>是所述评测文本段语义编码特征向量的序列,/>为向量的一范数,/>为所述评测文本段语义编码特征向量的序列中向量的个数,/>为所述语义权重值的序列中各个语义权重值。
进一步地,在本申请的一个具体实施例中,所述评测文本段语义融合单元,用于:基于所述语义权重值的序列,对所述评测文本段语义编码特征向量的序列进行加权求和以得到所述评测文本全局语义编码特征向量。
继而,再将所述评测文本全局语义编码特征向量通过分类器以得到分类结果,所述分类结果用于表示待评测用户的情感倾向类型标签。具体地,在本申请的技术方案中,所述分类器的标签为待评测用户的情感倾向类型标签,因此,在得到所述分类结果后,可以基于所述分类结果来分析用户的情感倾向,如积极、消极、中性等,从而为用户提供个性化的心理健康建议和干预方案。这样,能够有效地识别用户输入的评测文本中的情感倾向类型标签,从而提高文本情感分析的准确性和效率,以便于为用户提供及时的心理健康评测服务,并给出相应的建议和引导。
在本申请的一个具体实施例中,所述用户情感倾向检测模块,用于:将所述评测文本全局语义编码特征向量通过分类器以得到分类结果,所述分类结果用于表示待评测用户的情感倾向类型标签。
通过使用分类器对所述评测文本全局语义编码特征向量进行分类,能够更准确地确定待评测用户的情感倾向类型标签,提高了情感倾向识别的准确性和可靠性。利用分类器进行情感倾向类型标签的确定,系统实现了对用户情感倾向的自动化分类,减少了人工干预,提高了评测系统的效率和可靠性。
通过快速分类,系统能够实时地对用户的情感倾向进行分析和反馈,使得评测系统能够及时处理用户输入的情感信息,为用户提供更加及时的帮助和支持。通过分类器得到的分类结果能够更好地反映用户个体的情感倾向,从而使评测系统的结果更加个性化和精准,有助于为用户提供更符合其实际情况的评测结果和建议。
在本申请的一个实施例中,所述基于文本情感分析的心理健康智能评测系统,还包括用于对所述包含词嵌入层的评测文本段语义编码器和所述分类器进行训练的训练模块。所述训练模块,包括:训练评测文本输入单元,用于获取待评测用户输入的训练评测文本;训练评测文本分段处理单元,用于对所述训练评测文本进行分段处理以得到训练评测文本段的序列;训练评测文本段语义理解单元,用于对所述训练评测文本段的序列中的各个训练评测文本段进行语义编码以得到训练评测文本段语义编码特征向量的序列;训练评测文本段权重计算单元,用于计算所述训练评测文本段语义编码特征向量的序列中的各个训练评测文本段语义编码特征向量的训练语义权重值以得到训练语义权重值的序列;训练评测文本段语义融合单元,用于基于所述训练语义权重值的序列,融合所述训练评测文本段语义编码特征向量的序列以得到训练评测文本全局语义编码特征向量;训练优化单元,用于对所述训练评测文本全局语义编码特征向量进行优化以得到优化训练评测文本全局语义编码特征向量;训练分类单元,用于将所述优化训练评测文本全局语义编码特征向量通过分类器以得到分类损失函数值;训练单元,用于基于所述分类损失函数值对所述包含词嵌入层的评测文本段语义编码器和所述分类器进行训练。
在本申请的技术方案中,所述训练评测文本段语义编码特征向量的序列中的各个训练评测文本段语义编码特征向量表达所述训练评测文本段的编码文本语义特征,并且,在基于各个训练评测文本段语义编码特征向量的训练语义权重值融合所述训练评测文本段语义编码特征向量的序列得到所述训练评测文本全局语义编码特征向量时,为了充分利用各个训练评测文本段的编码文本语义特征,优选地通过将所述各个训练评测文本段语义编码特征向量基于训练语义权重值加权后级联以得到所述训练评测文本全局语义编码特征向量。
由此,考虑到所述训练评测文本全局语义编码特征向量的局部-全局文本语义特征表示,所述各个训练评测文本段语义编码特征向量各自的基于其局部文本语义特征分布的特征分布信息显著性会受到影响,使得当所述训练评测文本全局语义编码特征向量通过分类器进行分类时,难以稳定地聚焦于特征的显著局部分布,从而影响训练速度。
基于此,本申请在每次训练评测文本全局语义编码特征向量通过分类器进行分类回归的迭代时,对所述训练评测文本全局语义编码特征向量进行优化,表示为:以如下优化公式对所述训练评测文本全局语义编码特征向量进行优化以得到优化训练评测文本全局语义编码特征向量;其中,所述优化公式为:
;
其中,和/>分别是所述训练评测文本全局语义编码特征向量,例如记为/>的1范数和2范数的平方,/>是所述训练评测文本全局语义编码特征向量/>的长度,且/>是权重超参数,/>是所述训练评测文本全局语义编码特征向量,/>是所述优化训练评测文本全局语义编码特征向量中各个位置的特征值,/>是所述训练评测文本全局语义编码特征向量中各个位置的特征值,/>表示以2为底的对数函数。
具体地,通过基于所述训练评测文本全局语义编码特征向量的尺度和结构参数来进行其高维特征流形形状的几何注册,可以关注所述训练评测文本全局语义编码特征向量/>的特征值构成的特征集合中的具有丰富特征语义信息的特征,也就是,在分类器进行分类时的基于局部上下文信息表示不相似性的可区分的稳定兴趣特征,从而实现所述训练评测文本全局语义编码特征向量/>在分类过程中的特征信息显著性标注,提升分类器的训练速度。这样,能够有效地识别用户输入的评测文本中的情感倾向类型标签,如积极、消极、中性等,从而提高文本情感分析的准确性和效率,为用户提供个性化的心理健康建议和干预方案。
综上,基于本申请实施例的基于文本情感分析的心理健康智能评测系统100被阐明,其能够根据用户输入的评测文本,并在后端引入基于自然语言技术和人工智能的数据处理和分析算法来进行该评测文本的语义分析,以此来自动分析用户的情感倾向,从而为用户提供个性化的心理健康建议和干预方案。这样,能够有效地识别用户输入的评测文本中的情感倾向类型标签,如积极、消极、中性等,从而提高文本情感分析的准确性和效率,以便于为用户提供及时的心理健康评测服务,并给出相应的建议和引导。
如上所述,根据本申请实施例的基于文本情感分析的心理健康智能评测系统100可以实现在各种终端设备中,例如用于基于文本情感分析的心理健康智能评测的服务器等。在一个示例中,根据本申请实施例的基于文本情感分析的心理健康智能评测系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于文本情感分析的心理健康智能评测系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于文本情感分析的心理健康智能评测系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于文本情感分析的心理健康智能评测系统100与该终端设备也可以是分立的设备,并且该基于文本情感分析的心理健康智能评测系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
图2为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测方法的流程图。图3为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测方法的系统架构的示意图。如图2和图3所示,一种基于文本情感分析的心理健康智能评测方法,包括:210,获取待评测用户输入的评测文本;220,对所述评测文本进行分段处理以得到评测文本段的序列;230,对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列;240,计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征;250,基于所述评测文本全局语义编码特征,确定待评测用户的情感倾向类型标签。
在所述基于文本情感分析的心理健康智能评测方法中,对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列,包括:对所述评测文本段的序列中的各个评测文本段进行分词处理以将所述评测文本段的序列中的各个评测文本段转化为由多个词组成的词序列;使用所述包含词嵌入层的评测文本段语义编码器的词嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及,使用所述包含词嵌入层的评测文本段语义编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述评测文本段语义编码特征向量的序列。
本领域技术人员可以理解,上述基于文本情感分析的心理健康智能评测方法中的各个步骤的具体操作已经在上面参考图1的基于文本情感分析的心理健康智能评测系统的描述中得到了详细介绍,并因此,将省略其重复描述。
图4为本申请实施例中提供的一种基于文本情感分析的心理健康智能评测系统的应用场景图。如图4所示,在该应用场景中,首先,获取待评测用户输入的评测文本(例如,图4中所示意的C);然后,将获取的评测文本输入至部署有基于文本情感分析的心理健康智能评测算法的服务器(例如,图4中所示意的S)中,其中所述服务器能够基于文本情感分析的心理健康智能评测算法对所述评测文本进行处理,以确定待评测用户的情感倾向类型标签。
以上所述的具体实施例,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施例而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种基于文本情感分析的心理健康智能评测系统,其特征在于,包括:
评测文本输入模块,用于获取待评测用户输入的评测文本;
评测文本分段处理模块,用于对所述评测文本进行分段处理以得到评测文本段的序列;
评测文本段语义理解模块,用于对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列;
评测文本全局语义编码模块,用于计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征;
用户情感倾向检测模块,用于基于所述评测文本全局语义编码特征,确定待评测用户的情感倾向类型标签;
其中,所述评测文本全局语义编码模块,包括:
评测文本段权重计算单元,用于计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
评测文本段语义融合单元,用于基于所述语义权重值的序列,融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征向量作为所述评测文本全局语义编码特征;
其中,所述评测文本段权重计算单元,用于:以如下段权重公式计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
其中,所述段权重公式为:
;
其中,和/>为所述评测文本段语义编码特征向量的序列中第/>和第/>个评测文本段语义编码特征向量,/>是所述评测文本段语义编码特征向量的序列,/>为向量的一范数,为所述评测文本段语义编码特征向量的序列中向量的个数,/>为所述语义权重值的序列中各个语义权重值。
2.根据权利要求1所述的基于文本情感分析的心理健康智能评测系统,其特征在于,所述评测文本段语义理解模块,包括:
分词单元,用于对所述评测文本段的序列中的各个评测文本段进行分词处理以将所述评测文本段的序列中的各个评测文本段转化为由多个词组成的词序列;
嵌入编码单元,用于使用包含词嵌入层的评测文本段语义编码器的词嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;
上下文编码单元,用于使用所述包含词嵌入层的评测文本段语义编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述评测文本段语义编码特征向量的序列。
3.根据权利要求2所述的基于文本情感分析的心理健康智能评测系统,其特征在于,所述评测文本段语义融合单元,用于:基于所述语义权重值的序列,对所述评测文本段语义编码特征向量的序列进行加权求和以得到所述评测文本全局语义编码特征向量。
4.根据权利要求3所述的基于文本情感分析的心理健康智能评测系统,其特征在于,所述用户情感倾向检测模块,用于:将所述评测文本全局语义编码特征向量通过分类器以得到分类结果,所述分类结果用于表示待评测用户的情感倾向类型标签。
5.根据权利要求4所述的基于文本情感分析的心理健康智能评测系统,其特征在于,还包括用于对所述包含词嵌入层的评测文本段语义编码器和所述分类器进行训练的训练模块。
6.根据权利要求5所述的基于文本情感分析的心理健康智能评测系统,其特征在于,所述训练模块,包括:
训练评测文本输入单元,用于获取待评测用户输入的训练评测文本;
训练评测文本分段处理单元,用于对所述训练评测文本进行分段处理以得到训练评测文本段的序列;
训练评测文本段语义理解单元,用于对所述训练评测文本段的序列中的各个训练评测文本段进行语义编码以得到训练评测文本段语义编码特征向量的序列;
训练评测文本段权重计算单元,用于计算所述训练评测文本段语义编码特征向量的序列中的各个训练评测文本段语义编码特征向量的训练语义权重值以得到训练语义权重值的序列;
训练评测文本段语义融合单元,用于基于所述训练语义权重值的序列,融合所述训练评测文本段语义编码特征向量的序列以得到训练评测文本全局语义编码特征向量;
训练优化单元,用于对所述训练评测文本全局语义编码特征向量进行优化以得到优化训练评测文本全局语义编码特征向量;
训练分类单元,用于将所述优化训练评测文本全局语义编码特征向量通过分类器以得到分类损失函数值;
训练单元,用于基于所述分类损失函数值对所述包含词嵌入层的评测文本段语义编码器和所述分类器进行训练。
7.一种基于文本情感分析的心理健康智能评测方法,其特征在于,包括:
获取待评测用户输入的评测文本;
对所述评测文本进行分段处理以得到评测文本段的序列;
对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列;
计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征;
基于所述评测文本全局语义编码特征,确定待评测用户的情感倾向类型标签;
其中,计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到语义权重值的序列,并基于所述语义权重值的序列来融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征,包括:
计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
基于所述语义权重值的序列,融合所述评测文本段语义编码特征向量的序列以得到评测文本全局语义编码特征向量作为所述评测文本全局语义编码特征;
其中,计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列,包括:以如下段权重公式计算所述评测文本段语义编码特征向量的序列中的各个评测文本段语义编码特征向量的语义权重值以得到所述语义权重值的序列;
其中,所述段权重公式为:
;
其中,和/>为所述评测文本段语义编码特征向量的序列中第/>和第/>个评测文本段语义编码特征向量,/>是所述评测文本段语义编码特征向量的序列,/>为向量的一范数,为所述评测文本段语义编码特征向量的序列中向量的个数,/>为所述语义权重值的序列中各个语义权重值。
8.根据权利要求7所述的基于文本情感分析的心理健康智能评测方法,其特征在于,对所述评测文本段的序列中的各个评测文本段进行语义编码以得到评测文本段语义编码特征向量的序列,包括:
对所述评测文本段的序列中的各个评测文本段进行分词处理以将所述评测文本段的序列中的各个评测文本段转化为由多个词组成的词序列;
使用包含词嵌入层的评测文本段语义编码器的词嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;
使用所述包含词嵌入层的评测文本段语义编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述评测文本段语义编码特征向量的序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410178727.2A CN117789971B (zh) | 2024-02-13 | 2024-02-13 | 基于文本情感分析的心理健康智能评测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410178727.2A CN117789971B (zh) | 2024-02-13 | 2024-02-13 | 基于文本情感分析的心理健康智能评测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117789971A true CN117789971A (zh) | 2024-03-29 |
CN117789971B CN117789971B (zh) | 2024-05-24 |
Family
ID=90383852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410178727.2A Active CN117789971B (zh) | 2024-02-13 | 2024-02-13 | 基于文本情感分析的心理健康智能评测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117789971B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118136219A (zh) * | 2024-05-06 | 2024-06-04 | 吉林大学 | 医疗机构院感管理质量评估系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110570941A (zh) * | 2019-07-17 | 2019-12-13 | 北京智能工场科技有限公司 | 一种基于文本语义向量模型评估心理状态的系统和装置 |
US20210142095A1 (en) * | 2018-07-25 | 2021-05-13 | Beijing Sensetime Technology Development Co., Ltd. | Image disparity estimation |
US11194972B1 (en) * | 2021-02-19 | 2021-12-07 | Institute Of Automation, Chinese Academy Of Sciences | Semantic sentiment analysis method fusing in-depth features and time sequence models |
WO2022141861A1 (zh) * | 2020-12-31 | 2022-07-07 | 平安科技(深圳)有限公司 | 情感分类方法、装置、电子设备及存储介质 |
CN117473048A (zh) * | 2023-12-28 | 2024-01-30 | 长春职业技术学院 | 基于数据挖掘的财务异常数据监测分析系统及方法 |
-
2024
- 2024-02-13 CN CN202410178727.2A patent/CN117789971B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210142095A1 (en) * | 2018-07-25 | 2021-05-13 | Beijing Sensetime Technology Development Co., Ltd. | Image disparity estimation |
CN110570941A (zh) * | 2019-07-17 | 2019-12-13 | 北京智能工场科技有限公司 | 一种基于文本语义向量模型评估心理状态的系统和装置 |
WO2022141861A1 (zh) * | 2020-12-31 | 2022-07-07 | 平安科技(深圳)有限公司 | 情感分类方法、装置、电子设备及存储介质 |
US11194972B1 (en) * | 2021-02-19 | 2021-12-07 | Institute Of Automation, Chinese Academy Of Sciences | Semantic sentiment analysis method fusing in-depth features and time sequence models |
CN117473048A (zh) * | 2023-12-28 | 2024-01-30 | 长春职业技术学院 | 基于数据挖掘的财务异常数据监测分析系统及方法 |
Non-Patent Citations (1)
Title |
---|
毛焱颖;: "基于注意力双层LSTM的长文本情感分类方法", 重庆电子工程职业学院学报, no. 02, 20 April 2019 (2019-04-20), pages 118 - 125 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118136219A (zh) * | 2024-05-06 | 2024-06-04 | 吉林大学 | 医疗机构院感管理质量评估系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117789971B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110585B (zh) | 基于深度学习的智能阅卷实现方法及系统、计算机程序 | |
CN113780012B (zh) | 基于预训练语言模型的抑郁症访谈对话生成方法 | |
CN108121702B (zh) | 数学主观题评阅方法及系统 | |
CN108052504B (zh) | 数学主观题解答结果的结构分析方法及系统 | |
CN117789971B (zh) | 基于文本情感分析的心理健康智能评测系统及方法 | |
CN110335653A (zh) | 基于openEHR病历格式的非标准病历解析方法 | |
CN110287337A (zh) | 基于深度学习和知识图谱获取医学同义词的系统及方法 | |
CN112800766A (zh) | 基于主动学习的中文医疗实体识别标注方法及系统 | |
CN113724819B (zh) | 医疗命名实体识别模型的训练方法、装置、设备及介质 | |
CN112667776B (zh) | 一种智能教学评估与分析方法 | |
CN111145903A (zh) | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 | |
CN114756678B (zh) | 一种未知意图文本的识别方法及装置 | |
CN116842194A (zh) | 一种电力语义知识图谱系统及方法 | |
CN115545021A (zh) | 一种基于深度学习的临床术语识别方法与装置 | |
CN114118113A (zh) | 一种基于语境识别的机器翻译方法 | |
CN112749277B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN111898528B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN116628207A (zh) | 文本分类模型的训练方法和装置、电子设备及存储介质 | |
Tolami et al. | An intelligent linguistic error detection approach to automated diagnosis of Dyslexia disorder in Persian speaking children | |
CN115186683B (zh) | 一种基于跨模态翻译的属性级多模态情感分类方法 | |
CN114861663A (zh) | 一种实体关系联合抽取方法 | |
CN114743421A (zh) | 一种外语学习智慧教学综合考核系统及方法 | |
CN114626463A (zh) | 语言模型的训练方法、文本匹配方法及相关装置 | |
CN114155957A (zh) | 文本确定方法、装置、存储介质及电子设备 | |
CN115687910A (zh) | 一种数据处理方法、装置、计算机设备以及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |