CN112015874A

CN112015874A - 学生心理健康陪伴对话系统

Info

Publication number: CN112015874A
Application number: CN202010748326.8A
Authority: CN
Inventors: 王鑫
Original assignee: Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Current assignee: Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2020-12-01

Abstract

本发明提供了学生心理健康陪伴对话系统，其通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理，以此得到相应的第一字符串，并对该第一字符串进行模糊词字符串生成处理得到第二字符串，在对该第二字符串进行语言库匹配处理得到第三字符串，根据第二字符串与第三字符串之间的相似度计算结果，确定具有最大相似度的第三字符串，从而输出最终对话信息，这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生，其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串，从而提高学生心理监控陪伴对话的有效性和可靠性。

Description

学生心理健康陪伴对话系统

技术领域

本发明涉及心理咨询服务的技术领域，特别涉及学生心理健康陪伴对话系统。

背景技术

随着学业压力和就业压力的增大，学生的心理健康容易出现不稳定的情况，这需要对学生进行适应性心理健康辅导。对学生的心理健康辅导主要是通过学生心理健康陪伴对话来实现的，为了准确了解学生当前的心理健康状态需要对对内容进行快速地和精确的识别和转换，从而便于输出最终的对话内容信息。但是，现有技术针对学生心理健康陪伴对话系统只能采集得到的对话内容信息进行直接翻译识别，这会导致翻译识别的内容存在误差，从而严重地影响后续陪伴对话的有效性。

发明内容

针对现有技术存在的缺陷，本发明提供学生心理健康陪伴对话系统，其包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块，处理器模块和对话信息输出模块；其中，该语音获取模块用于获取用户发出的语音对话信息；该语音预处理模块用于对获取的该语音对话信息进行规范化处理；该语音识别转化模块用于将经过该规范化处理的该对话信息转换为第一字符串；该模糊词字符串生成子模块用于从该第一字符串获取模糊词，并根据该模糊词生成第二字符串，其中，该模糊词包括与该第一字符串中的字符组合在语义上满足预设关联度条件的词语；该语言库字符串匹配模块用于从预设语言库中获取若干组与该第二字符串对应的第三字符串；该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度；该对话信息输出模块用于根据该相似度的计算结果，输出最终对话信息；可见，该学生心理健康陪伴对话系统通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理，以此得到相应的第一字符串，并对该第一字符串进行模糊词字符串生成处理得到第二字符串，在对该第二字符串进行语言库匹配处理得到第三字符串，根据第二字符串与第三字符串之间的相似度计算结果，确定具有最大相似度的第三字符串，从而输出最终对话信息，这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生，其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串，从而提高学生心理监控陪伴对话的有效性和可靠性。

本发明提供学生心理健康陪伴对话系统，其特征在于，其包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块，处理器模块和对话信息输出模块；其中，

所述语音获取模块用于获取用户发出的语音对话信息；

所述语音预处理模块用于对获取的所述语音对话信息进行规范化处理；

所述语音识别转化模块用于将经过所述规范化处理的所述对话信息转换为第一字符串；

所述模糊词字符串生成子模块用于从所述第一字符串获取模糊词，并根据所述模糊词生成第二字符串，其中，所述模糊词包括与所述第一字符串中的字符组合在语义上满足预设关联度条件的词语；

所述语言库字符串匹配模块用于从预设语言库中获取若干组与所述第二字符串对应的第三字符串；

所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度；

所述对话信息输出模块用于根据所述相似度的计算结果，输出最终对话信息；

进一步，所述语音获取模块包括麦克风阵列子模块和语音对话信息存储子模块；其中，

所述麦克风阵列子模块包括相对于所述用户设置在不同位置的若干麦克风，所述若干麦克风共同组成用于采集所述用户发出的语音对话信息的麦克风阵列；

所述语音对话信息存储子模块用于按照所述麦克风阵列的采集时序，将所述语音对话信息依次存储为具有特定长度的若干语音对话信息序列；

进一步，所述语音预处理模块包括语音降噪子模块、语音速度调整子模块和语音停顿间隔调整子模块；其中，

所述语音降噪子模块用于过滤所述语音对话信息中的背景噪声和/或混频噪声；

所述语音速度调整子模块用于调整所述语音对话信息当前的语音速度，以使所述语音速度在预设语速范围中；

所述语音停顿间隔调整子模块用于对所述语音对话信息中大于预设停顿时间阈值的停顿间隔进行缩短处理，以使所述语音对话信息的所有停顿间隔的时长长度均小于或者等于所述预设停顿时间阈值；

进一步，所述语音识别转换模块包括语种确定子模块和语音-文本翻译转换子模块；其中，

所述语种确定子模块用于确定所述语音对话信息对应的语音语种信息；

所述语音-文本翻译转换子模块用于根据所述语音语种信息，选择合适的人工智能翻译机器算法，将所述语音对话信息转换为所述第一字符串；

进一步，所述模糊词字符串生成模块包括字符串语义确定子模块、模糊词生成子模块和模糊词组合子模块；其中，

所述字符串语义确定子模块用于对所述第一字符串进行语义解释，以此获得相应的实际语义信息；

所述模糊词生成子模块用于根据所述语义信息，生成与所述实际语义信息对应满足所述预设关联度条件的若干词语，以此作为所述模糊词；

所述模糊词组合子模块用于根据所述实际语音信息中的语义逻辑，将生成得到的所述模糊词组合形成所述第二字符串；

进一步，所述语言库字符串匹配模块包括语言库词汇摘选子模块和词汇组合子模块；其中，

所述语言库词汇摘选子模块用于按照预设心理咨询对话相关用语规则，从所述预设语言库中摘选相应的若干标准化词汇；

所述词汇组合子模块用于对若干所述标准化词汇进行组合，从而获得若干组与所述第二字符串对应的第三字符串，其中，若干组第三字符串包括至少五组第三字符串；

进一步，所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度具体包括，

所述处理器模块根据下面公式(1)，计算所述第二字符串与五组所述第三字符串中任意一者之间的相似度

在上述公式(1)中，simE_x表示第二字符串与第x组第三字符串之间的相似度，其中x∈{1,2,3,4,5}，p_xi表示第x组第三字符串中的第i个拼音数据，p_2j表示第二字符串中的第j个拼音数据，m表示第x组第三字符串中拼音数据的总数量，n表示第二字符串中拼音数据的总数量，η₁表示第二字符串的拼音数据和第x组第三字符串的拼音数据相互对比过程中的误差因子，a表示第二字符串的总长度，ω₁表示第二字符串的拼音数据与第x组第三字符串的拼音数据两者之间的比较结果对应的权重系数，h_xk表示第x组第三字符串中第k个声调数据，h_2l表示第二字符串中的第l个声调数据、e表示第z组第三字符串中声调数据的总数量，f表示第二字符串中声调数据的总数量，η₂表示第二字符串的声调数据与第x组第三字符串的声调数据相互对比过程中的误差因子，ω₂表示第二字符串的总长度，ω₁表示第二字符串的声调数据与第x组第三字符串的声调数据两者之间的比较结果对应的权重系数；

进一步，所述处理器模块还根据下面公式(2)，确定所述第二字符串与五组所述第三字符串对应的五个相似度的最大相似度值T，

T＝max{simE₁,simE₂,simE₃,simE₄,simE₅} (2)

在上述公式(2)中，T表示五个相似度simE₁、simE₂、simE₃、simE₄、simE₅中的最大相似度值，max{}表示取最大值运算；

所述处理器模块还用于将所述最大相似度值T对应的第三字符串合并到所述第一字符串中，以此形成组合字符串，并将所述组合字符串发送至所述对话信息输出模块；

所述对话信息输出模块用于根据所述组合字符串，输出最终对话信息。

相比于现有技术，该学生心理健康陪伴对话系统包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块，处理器模块和对话信息输出模块；其中，该语音获取模块用于获取用户发出的语音对话信息；该语音预处理模块用于对获取的该语音对话信息进行规范化处理；该语音识别转化模块用于将经过该规范化处理的该对话信息转换为第一字符串；该模糊词字符串生成子模块用于从该第一字符串获取模糊词，并根据该模糊词生成第二字符串，其中，该模糊词包括与该第一字符串中的字符组合在语义上满足预设关联度条件的词语；该语言库字符串匹配模块用于从预设语言库中获取若干组与该第二字符串对应的第三字符串；该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度；该对话信息输出模块用于根据该相似度的计算结果，输出最终对话信息；可见，该学生心理健康陪伴对话系统通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理，以此得到相应的第一字符串，并对该第一字符串进行模糊词字符串生成处理得到第二字符串，在对该第二字符串进行语言库匹配处理得到第三字符串，根据第二字符串与第三字符串之间的相似度计算结果，确定具有最大相似度的第三字符串，从而输出最终对话信息，这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生，其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串，从而提高学生心理监控陪伴对话的有效性和可靠性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的学生心理健康陪伴对话系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的学生心理健康陪伴对话系统的结构示意图。该学生心理健康陪伴对话系统包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块，处理器模块和对话信息输出模块；其中，

该语音获取模块用于获取用户发出的语音对话信息；

该语音预处理模块用于对获取的该语音对话信息进行规范化处理；

该语音识别转化模块用于将经过该规范化处理的该对话信息转换为第一字符串；

该模糊词字符串生成子模块用于从该第一字符串获取模糊词，并根据该模糊词生成第二字符串，其中，该模糊词包括与该第一字符串中的字符组合在语义上满足预设关联度条件的词语；

该语言库字符串匹配模块用于从预设语言库中获取若干组与该第二字符串对应的第三字符串；

该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度；

该对话信息输出模块用于根据该相似度的计算结果，输出最终对话信息。

该学生心理健康陪伴对话系统有别于现有技术的仅仅采集记录心理健康陪伴对话的语音对话信息并将该语音对话信息直接进行识别转换，其通过对该语音对话信息进行降噪等规范化处理，再将该语音对话信息识别转换为第一字符串，并对该第一字符串进行关于模糊词的转换得到第二字符串，以及根据预设语言库将该第二字符串转换为可能匹配的若干组第三字符串，最后通过计算的第二字符串与第三字符串之间的相似度结果来输出最终对话信息，这样能够有效地避免将语音对话信息直接识别转换而导致识别错误情况的发生，并且通过模糊词匹配和相似度计算的方式从预设语言库中得到与该语音对话信息之间具有最大相似度的字符串，从而最大限度保证将该语音对话信息转换为规范的语言用语，以便于后续能够快速地和准确地对语音对话信息进行分析处理。

优选地，该语音获取模块包括麦克风阵列子模块和语音对话信息存储子模块；其中，

该麦克风阵列子模块包括相对于该用户设置在不同位置的若干麦克风，该若干麦克风共同组成用于采集该用户发出的语音对话信息的麦克风阵列；

该语音对话信息存储子模块用于按照该麦克风阵列的采集时序，将该语音对话信息依次存储为具有特定长度的若干语音对话信息序列。

通过麦克风阵列采集记录用户发出的语音对话信息，能够保证采集得到的语音对话信息的真实性和避免发生采集遗漏的情况，同时还能够有效地提高采集得到的语音对话信息的立体声音效果和降低其中的噪声成分。

优选地，该语音预处理模块包括语音降噪子模块、语音速度调整子模块和语音停顿间隔调整子模块；其中，

该语音降噪子模块用于过滤该语音对话信息中的背景噪声和/或混频噪声；

该语音速度调整子模块用于调整该语音对话信息当前的语音速度，以使该语音速度在预设语速范围中；

该语音停顿间隔调整子模块用于对该语音对话信息中大于预设停顿时间阈值的停顿间隔进行缩短处理，以使该语音对话信息的所有停顿间隔的时长长度均小于或者等于该预设停顿时间阈值。

通过对该语音对话信息进行背景噪声/混频噪声的过滤剔除、语音速度的调整和语音停顿间隔的缩短，能够将该语音对话信息的语音呈现规范化程度和降低该语音对话信息中影响后续识别转换的不稳定成分因素。

优选地，该语音识别转换模块包括语种确定子模块和语音-文本翻译转换子模块；其中，

该语种确定子模块用于确定该语音对话信息对应的语音语种信息；

该语音-文本翻译转换子模块用于根据该语音语种信息，选择合适的人工智能翻译机器算法，将该语音对话信息转换为该第一字符串。

由于不同语种的语音对话信息的发音并不相同，其对应的识别转换涉及的算法也不相同，通过首先确定该语音对话信息当前的语种类型，能够保证将该语音对话信息准确地转换为对应的第一字符串，从而提高该第一字符串的准确性和降低后续对第一字符串的处理工作量。

优选地，该模糊词字符串生成模块包括字符串语义确定子模块、模糊词生成子模块和模糊词组合子模块；其中，

该字符串语义确定子模块用于对该第一字符串进行语义解释，以此获得相应的实际语义信息；

该模糊词生成子模块用于根据该语义信息，生成与该实际语义信息对应满足该预设关联度条件的若干词语，以此作为该模糊词；

该模糊词组合子模块用于根据该实际语音信息中的语义逻辑，将生成得到的该模糊词组合形成该第二字符串。

由于该第一字符串是通过语音对话信息直接识别转换得到的，这使得该第一字符串可能存在识别误差的情况，而通过模糊词-语义匹配的方式生成该第二字符串，能够保证该第二字符串能够在语义合理的情况下最大限度地匹配该语音对话信息的原意，从而有效地扩大该第二字符串的语义覆盖范围和降低后续的分析处理出错率。

优选地，该语言库字符串匹配模块包括语言库词汇摘选子模块和词汇组合子模块；其中，

该语言库词汇摘选子模块用于按照预设心理咨询对话相关用语规则，从该预设语言库中摘选相应的若干标准化词汇；

该词汇组合子模块用于对若干该标准化词汇进行组合，从而获得若干组与该第二字符串对应的第三字符串，其中，若干组第三字符串包括至少五组第三字符串。

由于该预设语言库存储有心理健康陪伴咨询对应的标准化词汇和通用词汇，通过从该预设语言库中摘选相应的词汇并形成若干组第三字符串，能够最大限度地保证该第三字符串能够与标准化对话内容相适应。

优选地，该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度具体包括，

该处理器模块根据下面公式(1)，计算该第二字符串与五组该第三字符串中任意一者之间的相似度

在上述公式(1)中，simE_x表示第二字符串与第x组第三字符串之间的相似度，其中x∈{1,2,3,4,5}，p_xi表示第x组第三字符串中的第i个拼音数据，p_2j表示第二字符串中的第j个拼音数据，m表示第x组第三字符串中拼音数据的总数量，n表示第二字符串中拼音数据的总数量，η₁表示第二字符串的拼音数据和第x组第三字符串的拼音数据相互对比过程中的误差因子，a表示第二字符串的总长度，ω₁表示第二字符串的拼音数据与第x组第三字符串的拼音数据两者之间的比较结果对应的权重系数，h_xk表示第x组第三字符串中第k个声调数据，h_2l表示第二字符串中的第l个声调数据、e表示第z组第三字符串中声调数据的总数量，f表示第二字符串中声调数据的总数量，η₂表示第二字符串的声调数据与第x组第三字符串的声调数据相互对比过程中的误差因子，ω₂表示第二字符串的总长度，ω₁表示第二字符串的声调数据与第x组第三字符串的声调数据两者之间的比较结果对应的权重系数。

优选地，该处理器模块还根据下面公式(2)，确定该第二字符串与五组该第三字符串对应的五个相似度的最大相似度值T，

T＝max{simE₁,simE₂,simE₃,simE₄,simE₅} (2)

该处理器模块还用于将该最大相似度值T对应的第三字符串合并到该第一字符串中，以此形成组合字符串，并将该组合字符串发送至该对话信息输出模块；

该对话信息输出模块用于根据该组合字符串，输出最终对话信息。

该处理器通过将语音对话信息中的模糊词进行识别筛选，再通过预设语言库中筛选与模糊词拼音数据及声调数据相似的五组字符串，以更准确的将语音对话信息识别，此外还能将五组第三字符串分别与模糊词关联的第二字符串对比，并计算与第二字符串相似度最大的一组字符串，使模糊词更加准确，从而提高了输出最终对话信息的可靠性和准确率，避免误识别语音对话信息而输出错误的对话信息，提高了用户对话的体验感。

从上述实施例的内容可知，该学生心理健康陪伴对话系统通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理，以此得到相应的第一字符串，并对该第一字符串进行模糊词字符串生成处理得到第二字符串，在对该第二字符串进行语言库匹配处理得到第三字符串，根据第二字符串与第三字符串之间的相似度计算结果，确定具有最大相似度的第三字符串，从而输出最终对话信息，这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生，其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串，从而提高学生心理监控陪伴对话的有效性和可靠性。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.学生心理健康陪伴对话系统，其特征在于，其包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块，处理器模块和对话信息输出模块；其中，

所述语音获取模块用于获取用户发出的语音对话信息；

所述对话信息输出模块用于根据所述相似度的计算结果，输出最终对话信息。

2.如权利要求1所述的学生心理健康陪伴对话系统，其特征在于：

所述语音获取模块包括麦克风阵列子模块和语音对话信息存储子模块；其中，

所述语音对话信息存储子模块用于按照所述麦克风阵列的采集时序，将所述语音对话信息依次存储为具有特定长度的若干语音对话信息序列。

3.如权利要求1所述的学生心理健康陪伴对话系统，其特征在于：

所述语音预处理模块包括语音降噪子模块、语音速度调整子模块和语音停顿间隔调整子模块；其中，

所述语音停顿间隔调整子模块用于对所述语音对话信息中大于预设停顿时间阈值的停顿间隔进行缩短处理，以使所述语音对话信息的所有停顿间隔的时长长度均小于或者等于所述预设停顿时间阈值。

4.如权利要求1所述的学生心理健康陪伴对话系统，其特征在于：

所述语音识别转换模块包括语种确定子模块和语音-文本翻译转换子模块；其中，

所述语音-文本翻译转换子模块用于根据所述语音语种信息，选择合适的人工智能翻译机器算法，将所述语音对话信息转换为所述第一字符串。

5.如权利要求1所述的学生心理健康陪伴对话系统，其特征在于：

所述模糊词字符串生成模块包括字符串语义确定子模块、模糊词生成子模块和模糊词组合子模块；其中，

所述模糊词组合子模块用于根据所述实际语音信息中的语义逻辑，将生成得到的所述模糊词组合形成所述第二字符串。

6.如权利要求1所述的学生心理健康陪伴对话系统，其特征在于：

所述语言库字符串匹配模块包括语言库词汇摘选子模块和词汇组合子模块；其中，

所述词汇组合子模块用于对若干所述标准化词汇进行组合，从而获得若干组与所述第二字符串对应的第三字符串，其中，若干组第三字符串包括至少五组第三字符串。

7.如权利要求1所述的学生心理健康陪伴对话系统，其特征在于：

所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度具体包括，

8.如权利要求7所述的学生心理健康陪伴对话系统，其特征在于：

所述处理器模块还根据下面公式(2)，确定所述第二字符串与五组所述第三字符串对应的五个相似度的最大相似度值T，

T＝max{simE₁,simE₂,simE₃,simE₄,simE₅} (2)