CN112015874A - 学生心理健康陪伴对话系统 - Google Patents
学生心理健康陪伴对话系统 Download PDFInfo
- Publication number
- CN112015874A CN112015874A CN202010748326.8A CN202010748326A CN112015874A CN 112015874 A CN112015874 A CN 112015874A CN 202010748326 A CN202010748326 A CN 202010748326A CN 112015874 A CN112015874 A CN 112015874A
- Authority
- CN
- China
- Prior art keywords
- character string
- voice
- module
- information
- submodule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004630 mental health Effects 0.000 title claims abstract description 26
- 238000006243 chemical reaction Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims abstract description 9
- 239000000126 substance Substances 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000013519 translation Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004904 shortening Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 230000009323 psychological health Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了学生心理健康陪伴对话系统,其通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理,以此得到相应的第一字符串,并对该第一字符串进行模糊词字符串生成处理得到第二字符串,在对该第二字符串进行语言库匹配处理得到第三字符串,根据第二字符串与第三字符串之间的相似度计算结果,确定具有最大相似度的第三字符串,从而输出最终对话信息,这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生,其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串,从而提高学生心理监控陪伴对话的有效性和可靠性。
Description
技术领域
本发明涉及心理咨询服务的技术领域,特别涉及学生心理健康陪伴对话系统。
背景技术
随着学业压力和就业压力的增大,学生的心理健康容易出现不稳定的情况,这需要对学生进行适应性心理健康辅导。对学生的心理健康辅导主要是通过学生心理健康陪伴对话来实现的,为了准确了解学生当前的心理健康状态需要对对内容进行快速地和精确的识别和转换,从而便于输出最终的对话内容信息。但是,现有技术针对学生心理健康陪伴对话系统只能采集得到的对话内容信息进行直接翻译识别,这会导致翻译识别的内容存在误差,从而严重地影响后续陪伴对话的有效性。
发明内容
针对现有技术存在的缺陷,本发明提供学生心理健康陪伴对话系统,其包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块,处理器模块和对话信息输出模块;其中,该语音获取模块用于获取用户发出的语音对话信息;该语音预处理模块用于对获取的该语音对话信息进行规范化处理;该语音识别转化模块用于将经过该规范化处理的该对话信息转换为第一字符串;该模糊词字符串生成子模块用于从该第一字符串获取模糊词,并根据该模糊词生成第二字符串,其中,该模糊词包括与该第一字符串中的字符组合在语义上满足预设关联度条件的词语;该语言库字符串匹配模块用于从预设语言库中获取若干组与该第二字符串对应的第三字符串;该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度;该对话信息输出模块用于根据该相似度的计算结果,输出最终对话信息;可见,该学生心理健康陪伴对话系统通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理,以此得到相应的第一字符串,并对该第一字符串进行模糊词字符串生成处理得到第二字符串,在对该第二字符串进行语言库匹配处理得到第三字符串,根据第二字符串与第三字符串之间的相似度计算结果,确定具有最大相似度的第三字符串,从而输出最终对话信息,这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生,其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串,从而提高学生心理监控陪伴对话的有效性和可靠性。
本发明提供学生心理健康陪伴对话系统,其特征在于,其包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块,处理器模块和对话信息输出模块;其中,
所述语音获取模块用于获取用户发出的语音对话信息;
所述语音预处理模块用于对获取的所述语音对话信息进行规范化处理;
所述语音识别转化模块用于将经过所述规范化处理的所述对话信息转换为第一字符串;
所述模糊词字符串生成子模块用于从所述第一字符串获取模糊词,并根据所述模糊词生成第二字符串,其中,所述模糊词包括与所述第一字符串中的字符组合在语义上满足预设关联度条件的词语;
所述语言库字符串匹配模块用于从预设语言库中获取若干组与所述第二字符串对应的第三字符串;
所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度;
所述对话信息输出模块用于根据所述相似度的计算结果,输出最终对话信息;
进一步,所述语音获取模块包括麦克风阵列子模块和语音对话信息存储子模块;其中,
所述麦克风阵列子模块包括相对于所述用户设置在不同位置的若干麦克风,所述若干麦克风共同组成用于采集所述用户发出的语音对话信息的麦克风阵列;
所述语音对话信息存储子模块用于按照所述麦克风阵列的采集时序,将所述语音对话信息依次存储为具有特定长度的若干语音对话信息序列;
进一步,所述语音预处理模块包括语音降噪子模块、语音速度调整子模块和语音停顿间隔调整子模块;其中,
所述语音降噪子模块用于过滤所述语音对话信息中的背景噪声和/或混频噪声;
所述语音速度调整子模块用于调整所述语音对话信息当前的语音速度,以使所述语音速度在预设语速范围中;
所述语音停顿间隔调整子模块用于对所述语音对话信息中大于预设停顿时间阈值的停顿间隔进行缩短处理,以使所述语音对话信息的所有停顿间隔的时长长度均小于或者等于所述预设停顿时间阈值;
进一步,所述语音识别转换模块包括语种确定子模块和语音-文本翻译转换子模块;其中,
所述语种确定子模块用于确定所述语音对话信息对应的语音语种信息;
所述语音-文本翻译转换子模块用于根据所述语音语种信息,选择合适的人工智能翻译机器算法,将所述语音对话信息转换为所述第一字符串;
进一步,所述模糊词字符串生成模块包括字符串语义确定子模块、模糊词生成子模块和模糊词组合子模块;其中,
所述字符串语义确定子模块用于对所述第一字符串进行语义解释,以此获得相应的实际语义信息;
所述模糊词生成子模块用于根据所述语义信息,生成与所述实际语义信息对应满足所述预设关联度条件的若干词语,以此作为所述模糊词;
所述模糊词组合子模块用于根据所述实际语音信息中的语义逻辑,将生成得到的所述模糊词组合形成所述第二字符串;
进一步,所述语言库字符串匹配模块包括语言库词汇摘选子模块和词汇组合子模块;其中,
所述语言库词汇摘选子模块用于按照预设心理咨询对话相关用语规则,从所述预设语言库中摘选相应的若干标准化词汇;
所述词汇组合子模块用于对若干所述标准化词汇进行组合,从而获得若干组与所述第二字符串对应的第三字符串,其中,若干组第三字符串包括至少五组第三字符串;
进一步,所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度具体包括,
所述处理器模块根据下面公式(1),计算所述第二字符串与五组所述第三字符串中任意一者之间的相似度
在上述公式(1)中,simEx表示第二字符串与第x组第三字符串之间的相似度,其中x∈{1,2,3,4,5},pxi表示第x组第三字符串中的第i个拼音数据,p2j表示第二字符串中的第j个拼音数据,m表示第x组第三字符串中拼音数据的总数量,n表示第二字符串中拼音数据的总数量,η1表示第二字符串的拼音数据和第x组第三字符串的拼音数据相互对比过程中的误差因子,a表示第二字符串的总长度,ω1表示第二字符串的拼音数据与第x组第三字符串的拼音数据两者之间的比较结果对应的权重系数,hxk表示第x组第三字符串中第k个声调数据,h2l表示第二字符串中的第l个声调数据、e表示第z组第三字符串中声调数据的总数量,f表示第二字符串中声调数据的总数量,η2表示第二字符串的声调数据与第x组第三字符串的声调数据相互对比过程中的误差因子,ω2表示第二字符串的总长度,ω1表示第二字符串的声调数据与第x组第三字符串的声调数据两者之间的比较结果对应的权重系数;
进一步,所述处理器模块还根据下面公式(2),确定所述第二字符串与五组所述第三字符串对应的五个相似度的最大相似度值T,
T=max{simE1,simE2,simE3,simE4,simE5} (2)
在上述公式(2)中,T表示五个相似度simE1、simE2、simE3、simE4、simE5中的最大相似度值,max{}表示取最大值运算;
所述处理器模块还用于将所述最大相似度值T对应的第三字符串合并到所述第一字符串中,以此形成组合字符串,并将所述组合字符串发送至所述对话信息输出模块;
所述对话信息输出模块用于根据所述组合字符串,输出最终对话信息。
相比于现有技术,该学生心理健康陪伴对话系统包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块,处理器模块和对话信息输出模块;其中,该语音获取模块用于获取用户发出的语音对话信息;该语音预处理模块用于对获取的该语音对话信息进行规范化处理;该语音识别转化模块用于将经过该规范化处理的该对话信息转换为第一字符串;该模糊词字符串生成子模块用于从该第一字符串获取模糊词,并根据该模糊词生成第二字符串,其中,该模糊词包括与该第一字符串中的字符组合在语义上满足预设关联度条件的词语;该语言库字符串匹配模块用于从预设语言库中获取若干组与该第二字符串对应的第三字符串;该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度;该对话信息输出模块用于根据该相似度的计算结果,输出最终对话信息;可见,该学生心理健康陪伴对话系统通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理,以此得到相应的第一字符串,并对该第一字符串进行模糊词字符串生成处理得到第二字符串,在对该第二字符串进行语言库匹配处理得到第三字符串,根据第二字符串与第三字符串之间的相似度计算结果,确定具有最大相似度的第三字符串,从而输出最终对话信息,这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生,其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串,从而提高学生心理监控陪伴对话的有效性和可靠性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的学生心理健康陪伴对话系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的学生心理健康陪伴对话系统的结构示意图。该学生心理健康陪伴对话系统包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块,处理器模块和对话信息输出模块;其中,
该语音获取模块用于获取用户发出的语音对话信息;
该语音预处理模块用于对获取的该语音对话信息进行规范化处理;
该语音识别转化模块用于将经过该规范化处理的该对话信息转换为第一字符串;
该模糊词字符串生成子模块用于从该第一字符串获取模糊词,并根据该模糊词生成第二字符串,其中,该模糊词包括与该第一字符串中的字符组合在语义上满足预设关联度条件的词语;
该语言库字符串匹配模块用于从预设语言库中获取若干组与该第二字符串对应的第三字符串;
该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度;
该对话信息输出模块用于根据该相似度的计算结果,输出最终对话信息。
该学生心理健康陪伴对话系统有别于现有技术的仅仅采集记录心理健康陪伴对话的语音对话信息并将该语音对话信息直接进行识别转换,其通过对该语音对话信息进行降噪等规范化处理,再将该语音对话信息识别转换为第一字符串,并对该第一字符串进行关于模糊词的转换得到第二字符串,以及根据预设语言库将该第二字符串转换为可能匹配的若干组第三字符串,最后通过计算的第二字符串与第三字符串之间的相似度结果来输出最终对话信息,这样能够有效地避免将语音对话信息直接识别转换而导致识别错误情况的发生,并且通过模糊词匹配和相似度计算的方式从预设语言库中得到与该语音对话信息之间具有最大相似度的字符串,从而最大限度保证将该语音对话信息转换为规范的语言用语,以便于后续能够快速地和准确地对语音对话信息进行分析处理。
优选地,该语音获取模块包括麦克风阵列子模块和语音对话信息存储子模块;其中,
该麦克风阵列子模块包括相对于该用户设置在不同位置的若干麦克风,该若干麦克风共同组成用于采集该用户发出的语音对话信息的麦克风阵列;
该语音对话信息存储子模块用于按照该麦克风阵列的采集时序,将该语音对话信息依次存储为具有特定长度的若干语音对话信息序列。
通过麦克风阵列采集记录用户发出的语音对话信息,能够保证采集得到的语音对话信息的真实性和避免发生采集遗漏的情况,同时还能够有效地提高采集得到的语音对话信息的立体声音效果和降低其中的噪声成分。
优选地,该语音预处理模块包括语音降噪子模块、语音速度调整子模块和语音停顿间隔调整子模块;其中,
该语音降噪子模块用于过滤该语音对话信息中的背景噪声和/或混频噪声;
该语音速度调整子模块用于调整该语音对话信息当前的语音速度,以使该语音速度在预设语速范围中;
该语音停顿间隔调整子模块用于对该语音对话信息中大于预设停顿时间阈值的停顿间隔进行缩短处理,以使该语音对话信息的所有停顿间隔的时长长度均小于或者等于该预设停顿时间阈值。
通过对该语音对话信息进行背景噪声/混频噪声的过滤剔除、语音速度的调整和语音停顿间隔的缩短,能够将该语音对话信息的语音呈现规范化程度和降低该语音对话信息中影响后续识别转换的不稳定成分因素。
优选地,该语音识别转换模块包括语种确定子模块和语音-文本翻译转换子模块;其中,
该语种确定子模块用于确定该语音对话信息对应的语音语种信息;
该语音-文本翻译转换子模块用于根据该语音语种信息,选择合适的人工智能翻译机器算法,将该语音对话信息转换为该第一字符串。
由于不同语种的语音对话信息的发音并不相同,其对应的识别转换涉及的算法也不相同,通过首先确定该语音对话信息当前的语种类型,能够保证将该语音对话信息准确地转换为对应的第一字符串,从而提高该第一字符串的准确性和降低后续对第一字符串的处理工作量。
优选地,该模糊词字符串生成模块包括字符串语义确定子模块、模糊词生成子模块和模糊词组合子模块;其中,
该字符串语义确定子模块用于对该第一字符串进行语义解释,以此获得相应的实际语义信息;
该模糊词生成子模块用于根据该语义信息,生成与该实际语义信息对应满足该预设关联度条件的若干词语,以此作为该模糊词;
该模糊词组合子模块用于根据该实际语音信息中的语义逻辑,将生成得到的该模糊词组合形成该第二字符串。
由于该第一字符串是通过语音对话信息直接识别转换得到的,这使得该第一字符串可能存在识别误差的情况,而通过模糊词-语义匹配的方式生成该第二字符串,能够保证该第二字符串能够在语义合理的情况下最大限度地匹配该语音对话信息的原意,从而有效地扩大该第二字符串的语义覆盖范围和降低后续的分析处理出错率。
优选地,该语言库字符串匹配模块包括语言库词汇摘选子模块和词汇组合子模块;其中,
该语言库词汇摘选子模块用于按照预设心理咨询对话相关用语规则,从该预设语言库中摘选相应的若干标准化词汇;
该词汇组合子模块用于对若干该标准化词汇进行组合,从而获得若干组与该第二字符串对应的第三字符串,其中,若干组第三字符串包括至少五组第三字符串。
由于该预设语言库存储有心理健康陪伴咨询对应的标准化词汇和通用词汇,通过从该预设语言库中摘选相应的词汇并形成若干组第三字符串,能够最大限度地保证该第三字符串能够与标准化对话内容相适应。
优选地,该处理器模块用于计算该第二字符串与若干组该第三字符串中任意一者之间的相似度具体包括,
该处理器模块根据下面公式(1),计算该第二字符串与五组该第三字符串中任意一者之间的相似度
在上述公式(1)中,simEx表示第二字符串与第x组第三字符串之间的相似度,其中x∈{1,2,3,4,5},pxi表示第x组第三字符串中的第i个拼音数据,p2j表示第二字符串中的第j个拼音数据,m表示第x组第三字符串中拼音数据的总数量,n表示第二字符串中拼音数据的总数量,η1表示第二字符串的拼音数据和第x组第三字符串的拼音数据相互对比过程中的误差因子,a表示第二字符串的总长度,ω1表示第二字符串的拼音数据与第x组第三字符串的拼音数据两者之间的比较结果对应的权重系数,hxk表示第x组第三字符串中第k个声调数据,h2l表示第二字符串中的第l个声调数据、e表示第z组第三字符串中声调数据的总数量,f表示第二字符串中声调数据的总数量,η2表示第二字符串的声调数据与第x组第三字符串的声调数据相互对比过程中的误差因子,ω2表示第二字符串的总长度,ω1表示第二字符串的声调数据与第x组第三字符串的声调数据两者之间的比较结果对应的权重系数。
优选地,该处理器模块还根据下面公式(2),确定该第二字符串与五组该第三字符串对应的五个相似度的最大相似度值T,
T=max{simE1,simE2,simE3,simE4,simE5} (2)
在上述公式(2)中,T表示五个相似度simE1、simE2、simE3、simE4、simE5中的最大相似度值,max{}表示取最大值运算;
该处理器模块还用于将该最大相似度值T对应的第三字符串合并到该第一字符串中,以此形成组合字符串,并将该组合字符串发送至该对话信息输出模块;
该对话信息输出模块用于根据该组合字符串,输出最终对话信息。
该处理器通过将语音对话信息中的模糊词进行识别筛选,再通过预设语言库中筛选与模糊词拼音数据及声调数据相似的五组字符串,以更准确的将语音对话信息识别,此外还能将五组第三字符串分别与模糊词关联的第二字符串对比,并计算与第二字符串相似度最大的一组字符串,使模糊词更加准确,从而提高了输出最终对话信息的可靠性和准确率,避免误识别语音对话信息而输出错误的对话信息,提高了用户对话的体验感。
从上述实施例的内容可知,该学生心理健康陪伴对话系统通过对在陪伴对话过程中采集得到的语音对话信息进行规范化处理和语音识别转换处理,以此得到相应的第一字符串,并对该第一字符串进行模糊词字符串生成处理得到第二字符串,在对该第二字符串进行语言库匹配处理得到第三字符串,根据第二字符串与第三字符串之间的相似度计算结果,确定具有最大相似度的第三字符串,从而输出最终对话信息,这样能够有效地避免由于对原始语音对话信息进行单一语音识别转换而导致识别误差的发生,其通过模糊词匹配和相似度比较的方式来确定具有最精确匹配度的字符串,从而提高学生心理监控陪伴对话的有效性和可靠性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.学生心理健康陪伴对话系统,其特征在于,其包括语音获取模块、语音预处理模块、语音识别转化模块、模糊词字符串生成子模块、语言库字符串匹配子模块,处理器模块和对话信息输出模块;其中,
所述语音获取模块用于获取用户发出的语音对话信息;
所述语音预处理模块用于对获取的所述语音对话信息进行规范化处理;
所述语音识别转化模块用于将经过所述规范化处理的所述对话信息转换为第一字符串;
所述模糊词字符串生成子模块用于从所述第一字符串获取模糊词,并根据所述模糊词生成第二字符串,其中,所述模糊词包括与所述第一字符串中的字符组合在语义上满足预设关联度条件的词语;
所述语言库字符串匹配模块用于从预设语言库中获取若干组与所述第二字符串对应的第三字符串;
所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度;
所述对话信息输出模块用于根据所述相似度的计算结果,输出最终对话信息。
2.如权利要求1所述的学生心理健康陪伴对话系统,其特征在于:
所述语音获取模块包括麦克风阵列子模块和语音对话信息存储子模块;其中,
所述麦克风阵列子模块包括相对于所述用户设置在不同位置的若干麦克风,所述若干麦克风共同组成用于采集所述用户发出的语音对话信息的麦克风阵列;
所述语音对话信息存储子模块用于按照所述麦克风阵列的采集时序,将所述语音对话信息依次存储为具有特定长度的若干语音对话信息序列。
3.如权利要求1所述的学生心理健康陪伴对话系统,其特征在于:
所述语音预处理模块包括语音降噪子模块、语音速度调整子模块和语音停顿间隔调整子模块;其中,
所述语音降噪子模块用于过滤所述语音对话信息中的背景噪声和/或混频噪声;
所述语音速度调整子模块用于调整所述语音对话信息当前的语音速度,以使所述语音速度在预设语速范围中;
所述语音停顿间隔调整子模块用于对所述语音对话信息中大于预设停顿时间阈值的停顿间隔进行缩短处理,以使所述语音对话信息的所有停顿间隔的时长长度均小于或者等于所述预设停顿时间阈值。
4.如权利要求1所述的学生心理健康陪伴对话系统,其特征在于:
所述语音识别转换模块包括语种确定子模块和语音-文本翻译转换子模块;其中,
所述语种确定子模块用于确定所述语音对话信息对应的语音语种信息;
所述语音-文本翻译转换子模块用于根据所述语音语种信息,选择合适的人工智能翻译机器算法,将所述语音对话信息转换为所述第一字符串。
5.如权利要求1所述的学生心理健康陪伴对话系统,其特征在于:
所述模糊词字符串生成模块包括字符串语义确定子模块、模糊词生成子模块和模糊词组合子模块;其中,
所述字符串语义确定子模块用于对所述第一字符串进行语义解释,以此获得相应的实际语义信息;
所述模糊词生成子模块用于根据所述语义信息,生成与所述实际语义信息对应满足所述预设关联度条件的若干词语,以此作为所述模糊词;
所述模糊词组合子模块用于根据所述实际语音信息中的语义逻辑,将生成得到的所述模糊词组合形成所述第二字符串。
6.如权利要求1所述的学生心理健康陪伴对话系统,其特征在于:
所述语言库字符串匹配模块包括语言库词汇摘选子模块和词汇组合子模块;其中,
所述语言库词汇摘选子模块用于按照预设心理咨询对话相关用语规则,从所述预设语言库中摘选相应的若干标准化词汇;
所述词汇组合子模块用于对若干所述标准化词汇进行组合,从而获得若干组与所述第二字符串对应的第三字符串,其中,若干组第三字符串包括至少五组第三字符串。
7.如权利要求1所述的学生心理健康陪伴对话系统,其特征在于:
所述处理器模块用于计算所述第二字符串与若干组所述第三字符串中任意一者之间的相似度具体包括,
所述处理器模块根据下面公式(1),计算所述第二字符串与五组所述第三字符串中任意一者之间的相似度
在上述公式(1)中,simEx表示第二字符串与第x组第三字符串之间的相似度,其中x∈{1,2,3,4,5},pxi表示第x组第三字符串中的第i个拼音数据,p2j表示第二字符串中的第j个拼音数据,m表示第x组第三字符串中拼音数据的总数量,n表示第二字符串中拼音数据的总数量,η1表示第二字符串的拼音数据和第x组第三字符串的拼音数据相互对比过程中的误差因子,a表示第二字符串的总长度,ω1表示第二字符串的拼音数据与第x组第三字符串的拼音数据两者之间的比较结果对应的权重系数,hxk表示第x组第三字符串中第k个声调数据,h2l表示第二字符串中的第l个声调数据、e表示第z组第三字符串中声调数据的总数量,f表示第二字符串中声调数据的总数量,η2表示第二字符串的声调数据与第x组第三字符串的声调数据相互对比过程中的误差因子,ω2表示第二字符串的总长度,ω1表示第二字符串的声调数据与第x组第三字符串的声调数据两者之间的比较结果对应的权重系数。
8.如权利要求7所述的学生心理健康陪伴对话系统,其特征在于:
所述处理器模块还根据下面公式(2),确定所述第二字符串与五组所述第三字符串对应的五个相似度的最大相似度值T,
T=max{simE1,simE2,simE3,simE4,simE5} (2)
在上述公式(2)中,T表示五个相似度simE1、simE2、simE3、simE4、simE5中的最大相似度值,max{}表示取最大值运算;
所述处理器模块还用于将所述最大相似度值T对应的第三字符串合并到所述第一字符串中,以此形成组合字符串,并将所述组合字符串发送至所述对话信息输出模块;
所述对话信息输出模块用于根据所述组合字符串,输出最终对话信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010748326.8A CN112015874A (zh) | 2020-07-30 | 2020-07-30 | 学生心理健康陪伴对话系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010748326.8A CN112015874A (zh) | 2020-07-30 | 2020-07-30 | 学生心理健康陪伴对话系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112015874A true CN112015874A (zh) | 2020-12-01 |
Family
ID=73499162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010748326.8A Pending CN112015874A (zh) | 2020-07-30 | 2020-07-30 | 学生心理健康陪伴对话系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112015874A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593577A (zh) * | 2021-09-06 | 2021-11-02 | 四川易海天科技有限公司 | 一种基于大数据的车载人工智能语音交互系统 |
WO2022160539A1 (zh) * | 2021-01-26 | 2022-08-04 | 浪达网络科技(浙江)有限公司 | 一种数据处理系统及数据挖掘方法 |
WO2023098586A1 (zh) * | 2021-11-30 | 2023-06-08 | 维沃移动通信有限公司 | 信息交互方法、装置及通信设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070050374A1 (en) * | 2005-09-01 | 2007-03-01 | Fang Zhao | Novel intelligent search engine |
CN102968409A (zh) * | 2012-11-23 | 2013-03-13 | 海信集团有限公司 | 智能人机交互语义分析方法及交互系统 |
CN106095988A (zh) * | 2016-06-21 | 2016-11-09 | 上海智臻智能网络科技股份有限公司 | 自动问答方法及装置 |
CN106202301A (zh) * | 2016-07-01 | 2016-12-07 | 武汉泰迪智慧科技有限公司 | 一种基于深度学习的智能应答系统 |
CN106815197A (zh) * | 2015-11-27 | 2017-06-09 | 北京国双科技有限公司 | 文本相似度的确定方法和装置 |
CN107220292A (zh) * | 2017-04-25 | 2017-09-29 | 上海庆科信息技术有限公司 | 智能对话装置、反馈式智能语音控制系统及方法 |
CN109712616A (zh) * | 2018-11-29 | 2019-05-03 | 平安科技(深圳)有限公司 | 基于数据处理的电话号码纠错方法、装置及计算机设备 |
CN110866105A (zh) * | 2019-11-15 | 2020-03-06 | 康佳集团股份有限公司 | 一种语义决策方法、移动终端及存储介质 |
CN111460175A (zh) * | 2020-04-08 | 2020-07-28 | 福州数据技术研究院有限公司 | 一种基于snomed-ct的医学名词词典构造与拓展方法 |
-
2020
- 2020-07-30 CN CN202010748326.8A patent/CN112015874A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070050374A1 (en) * | 2005-09-01 | 2007-03-01 | Fang Zhao | Novel intelligent search engine |
CN102968409A (zh) * | 2012-11-23 | 2013-03-13 | 海信集团有限公司 | 智能人机交互语义分析方法及交互系统 |
CN106815197A (zh) * | 2015-11-27 | 2017-06-09 | 北京国双科技有限公司 | 文本相似度的确定方法和装置 |
CN106095988A (zh) * | 2016-06-21 | 2016-11-09 | 上海智臻智能网络科技股份有限公司 | 自动问答方法及装置 |
CN106202301A (zh) * | 2016-07-01 | 2016-12-07 | 武汉泰迪智慧科技有限公司 | 一种基于深度学习的智能应答系统 |
CN107220292A (zh) * | 2017-04-25 | 2017-09-29 | 上海庆科信息技术有限公司 | 智能对话装置、反馈式智能语音控制系统及方法 |
CN109712616A (zh) * | 2018-11-29 | 2019-05-03 | 平安科技(深圳)有限公司 | 基于数据处理的电话号码纠错方法、装置及计算机设备 |
CN110866105A (zh) * | 2019-11-15 | 2020-03-06 | 康佳集团股份有限公司 | 一种语义决策方法、移动终端及存储介质 |
CN111460175A (zh) * | 2020-04-08 | 2020-07-28 | 福州数据技术研究院有限公司 | 一种基于snomed-ct的医学名词词典构造与拓展方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022160539A1 (zh) * | 2021-01-26 | 2022-08-04 | 浪达网络科技(浙江)有限公司 | 一种数据处理系统及数据挖掘方法 |
CN113593577A (zh) * | 2021-09-06 | 2021-11-02 | 四川易海天科技有限公司 | 一种基于大数据的车载人工智能语音交互系统 |
WO2023098586A1 (zh) * | 2021-11-30 | 2023-06-08 | 维沃移动通信有限公司 | 信息交互方法、装置及通信设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5621857A (en) | Method and system for identifying and recognizing speech | |
US9646605B2 (en) | False alarm reduction in speech recognition systems using contextual information | |
US7725318B2 (en) | System and method for improving the accuracy of audio searching | |
US5794196A (en) | Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules | |
US6836760B1 (en) | Use of semantic inference and context-free grammar with speech recognition system | |
US6490561B1 (en) | Continuous speech voice transcription | |
CN109686383B (zh) | 一种语音分析方法、装置及存储介质 | |
CN112397091A (zh) | 中文语音综合评分及诊断系统和方法 | |
CN112015874A (zh) | 学生心理健康陪伴对话系统 | |
CN109192194A (zh) | 语音数据标注方法、装置、计算机设备及存储介质 | |
US5677991A (en) | Speech recognition system using arbitration between continuous speech and isolated word modules | |
KR102186641B1 (ko) | 인공지능 기반 음성 답변 자동채점을 통한 지원자 평가방법 | |
US20210353218A1 (en) | Machine Learning Systems and Methods for Multiscale Alzheimer's Dementia Recognition Through Spontaneous Speech | |
CN112397054A (zh) | 一种电力调度语音识别方法 | |
JP4769098B2 (ja) | 音声認識信頼度推定装置、その方法、およびプログラム | |
Khan et al. | An intelligent system for spoken term detection that uses belief combination | |
Pao et al. | Combining acoustic features for improved emotion recognition in mandarin speech | |
CN113744722A (zh) | 一种用于有限句库的离线语音识别匹配装置与方法 | |
Singh et al. | Speaker Recognition Assessment in a Continuous System for Speaker Identification | |
Carofilis et al. | Improvement of accent classification models through Grad-Transfer from Spectrograms and Gradient-weighted Class Activation Mapping | |
CN115457966B (zh) | 基于改进ds证据理论多分类器融合的猪咳嗽声识别方法 | |
JP3444108B2 (ja) | 音声認識装置 | |
Decadt et al. | Transcription of out-of-vocabulary words in large vocabulary speech recognition based on phoneme-to-grapheme conversion | |
CN110867193A (zh) | 一种段落英语口语评分方法及系统 | |
Kwint et al. | How Different Elements of Audio Affect the Word Error Rate of Transcripts in Automated Medical Reporting. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201201 |
|
RJ01 | Rejection of invention patent application after publication |