CN117725187A - 一种适用于社会救助的问答系统 - Google Patents
一种适用于社会救助的问答系统 Download PDFInfo
- Publication number
- CN117725187A CN117725187A CN202410176435.5A CN202410176435A CN117725187A CN 117725187 A CN117725187 A CN 117725187A CN 202410176435 A CN202410176435 A CN 202410176435A CN 117725187 A CN117725187 A CN 117725187A
- Authority
- CN
- China
- Prior art keywords
- questioning
- task
- voice
- voice task
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002411 adverse Effects 0.000 claims abstract description 11
- 230000004044 response Effects 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 40
- 238000011156 evaluation Methods 0.000 claims description 38
- 230000036541 health Effects 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000003111 delayed effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000012502 risk assessment Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012797 qualification Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种适用于社会救助的问答系统,具体涉及智能问答技术领域,通过对提问语音任务的语音识别的响应情况进行分析,将提问语音任务的识别错误风险划分为高低风险,并在低风险情况下,通过综合分析提问语音任务的内容的清晰度、提问者的提问环境的不利影响程度和提问语音任务被识别错误的风险程度,判断提问语音任务是否有效,判断识别的提问语音任务的准确性,从而给出正确的回答;通过匹配社会救助问答知识库判断提问内容是否匹配,从而决定是否切换至人工服务,根据连续无效情况判断是否切换至人工服务,提高系统的智能性和用户满意度,提升了社会救助问答服务的准确性、实时性和用户体验。
Description
技术领域
本发明涉及智能问答技术领域,更具体地说,本发明涉及一种适用于社会救助的问答系统。
背景技术
社会救助,是指国家和社会对由于各种原因而陷入生存困境的公民,给予财物接济和生活扶助,以保障其最低生活需要的制度;公民在寻求社会救助的时候,通常会存在很多问题需要工作人员回答,目前社会救助的政策宣导、咨询仍依赖于人工问答,不仅工作量大,且重复性高;因此,传统的社会救助方式存在用户的问题不能及时获得答复,人工问答压力较大的问题。
对于公开(公告)号为CN114238715A的发明专利,其公开了一种基于社会救助的问答系统、构建方法、计算机设备及存储介质,旨在通过自动处理社会救助文本和用户问题,构建知识图谱,并利用智能化手段进行问答,以减轻人工问答压力,帮助用户更迅速获得准确的答复。
但是上述的一种基于社会救助的问答系统、构建方法、计算机设备及存储介质存在以下缺陷:
若社会救助问答系统使用文字输入,一是寻求社会救助公民中存在不会使用社会救助问答系统,例如年纪较大的公民以及文盲的公民,二是效率较慢;所以通常对社会救助问答系统增加语音问答的功能,但是若语音问答不能够正确识别提问者的需求,社会救助问答系统不能准确给出答案,会影响提问者的体验和服务质量,如果语音识别效果不佳,提问者可能需要多次重复他们的问题,或者需要更长时间才能正确理解用户的需求,这会导致整个问答过程的效率下降,尤其是对于那些寻求急需社会救助帮助的提问者而言。
为了解决上述问题,现提供一种技术方案。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种适用于社会救助的问答系统以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种适用于社会救助的问答系统,包括提问信息接入模块、提问准确判断模块、识别风险评估模块、提问有效评估模块以及答案生成判断模块;
提问语音采集模块对提问者语音进行实时采集,根据提问者语音生成提问语音任务,并将提问语音任务实时发送至提问准确判断模块;
提问准确判断模块在接收提问语音任务后,通过对提问语音任务的连贯性进行分析,评估提问语音任务对应的提问者的表达清晰程度;通过对提问语音任务的声音来源的信息熵进行分析,评估提问者的提问环境对提问语音任务识别的不利影响程度;
识别风险评估模块对近期语音识别的语音转化的响应情况进行分析,评估提问语音任务被识别错误的风险程度,将提问语音任务被识别错误的风险程度分为高风险和低风险;
在提问语音任务被识别错误的风险程度为低风险时,提问有效评估模块将提问语音任务对应的提问者的表达清晰程度、提问者的提问环境对提问语音任务识别的不利影响程度以及提问语音任务被识别错误的风险程度进行综合分析,判断提问语音任务是否有效;
在提问语音任务有效时,答案生成判断模块判断提问语音任务对应的内容是否与社会救助问答知识库匹配,根据匹配情况判断是否切换人工服务;
在提问语音任务无效时,根据提问者的提问语音任务无效的连续情况,判断是否切换人工服务。
在一个优选的实施方式中,对提问语音任务的连贯性进行分析,具体为:
获取提问语音任务对应的字,获取提问语音任务中每个字对应的时间戳,按照时间顺序将提问语音任务对应的字进行排列,计算每两个相邻的字对应的时间间隔,将每两个相邻的字对应的时间间隔标记为提问字间距;
设定提问字间距范围,将提问语音任务中不在提问字间距范围的提问字间距标记为不佳字间距;
获取提问语音任务中不佳字间距的数量,将提问语音任务中不佳字间距的数量与提问语音任务中提问字间距的数量的比值标记为不佳间距比;
获取提问语音任务对应的时间长度,获取提问语音任务对应的字的数量,将提问语音任务对应的字的数量与提问语音任务对应的时间长度的比值标记为任务语速;
计算任务语速偏差值,其表达式为:;其中,/>分别为任务语速偏差值、任务语速以及标准语速;
将不佳间距比和任务语速偏差值分别赋予权重系数,将不佳间距比和任务语速偏差值进行加权求和,计算提问语音清晰指数。
在一个优选的实施方式中,对提问语音任务的声音来源的信息熵进行分析,具体为:
将提问语音任务均等分为多个时间窗口,获取每个时间窗口的声音来源,对每个时间窗口的声音来源分析;
根据时间窗口对应的声音来源的分析结果使用信息熵计算窗口声音来源混乱值,其表达式为:;其中,/>为窗口声音来源混乱值,/>为时间窗口中编号为/>的声音来源的占比;/>为时间窗口中声音来源的数量,/>,/>均为大于1的整数;
设定窗口声音来源混乱阈值;将窗口声音来源混乱值大于窗口声音来源混乱阈值的时间窗口标记为混乱时间窗口,计算每个混乱时间窗口的混乱超出值,将提问语音任务内所有混乱时间窗口的混乱超出值的相加值与提问语音任务内对应的时间长度的比值标记为声音来源混乱指数。
在一个优选的实施方式中,混乱超出值为混乱时间窗口对应的窗口声音来源混乱值与窗口声音来源混乱阈值的差值。
在一个优选的实施方式中,对近期语音识别的语音转化的响应情况进行分析,具体为;建立提问语音任务集合,提问语音任务集合内包括最靠近实时时间的多次的提问语音任务;
获取提问语音任务集合内提问语音任务对应的任务处理时间,获取提问语音任务集合内提问语音任务对应的任务处理时间小于等于处理时间阈值的提问语音任务的数量,将提问语音任务集合内提问语音任务对应的任务处理时间小于等于处理时间阈值的提问语音任务的数量与提问语音任务集合内提问语音任务的数量的比值标记为识别延迟健康指数;
设定识别延迟健康指数阈值,将识别延迟健康指数与识别延迟健康指数阈值进行比较:
当识别延迟健康指数小于识别延迟健康指数阈值,生成高风险信号;
当识别延迟健康指数大于等于识别延迟健康指数阈值,生成低风险信号。
在一个优选的实施方式中,当生成低风险信号,提问有效评估模块将提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数进行归一化处理,将归一化处理后的提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数分别赋予预设比例系数,计算得到任务有效评估系数;
设定任务有效评估阈值,将任务有效评估系数与任务有效评估阈值进行比较:
当任务有效评估系数大于任务有效评估阈值,将提问语音任务标记为无效提问;
当任务有效评估系数小于等于任务有效评估阈值,将提问语音任务标记为有效提问。
在一个优选的实施方式中,当提问语音任务被标记为有效提问,答案生成判断模块基于语音识别技术获取提问语音任务对应的文本内容,并将提问语音任务对应的文本内容在社会救助问答知识库中检索,若检索成功,生成答案输出信号;
若检索不成功,生成人工转接信号;
当该提问语音任务被标记为无效提问,生成重新提问信号,当提问者被标记为无效提问的数量连续达到失败提问次数阈值,生成人工服务信号。
本发明一种适用于社会救助的问答系统的技术效果和优点:
1、通过对提问语音任务的内容的连贯性和对提问语音任务对应的环境的信息熵进行分析,能够全面评估提问者的表达清晰程度和提问环境的不利影响,再结合近期对提问语音任务的语音识别的响应情况进行精准分析,将提问语音任务的识别错误风险划分为高低风险,并在低风险情况下,通过综合分析提问语音任务的内容的清晰度、提问者的提问环境的不利影响程度和提问语音任务被识别错误的风险程度,判断提问语音任务是否有效,判断识别的提问语音任务的准确性,从而能更准确给出正确的回答。
2、通过匹配社会救助问答知识库,判断提问内容是否与现有知识匹配,从而决定是否切换至人工服务,系统还能灵活应对提问无效情况,根据连续无效情况判断是否切换至人工服务,提高系统的智能性和用户满意度,实现了对语音提问的全方位评估和处理,提升了社会救助问答服务的准确性、实时性和用户体验,为用户提供更便捷、智能的社会救助咨询服务。
附图说明
图1为本发明一种适用于社会救助的问答系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
图1给出了本发明一种适用于社会救助的问答系统的结构示意图,一种适用于社会救助的问答系统,包括提问信息接入模块、提问准确判断模块、识别风险评估模块、提问有效评估模块以及答案生成判断模块。
提问语音采集模块对提问者语音进行实时采集,根据提问者语音生成提问语音任务,并将提问语音任务实时发送至提问准确判断模块。
提问准确判断模块在接收提问语音任务后,通过对提问语音任务的连贯性进行分析,评估提问语音任务对应的提问者的表达清晰程度;通过对提问语音任务的声音来源的信息熵进行分析,评估提问者的提问环境对提问语音任务识别的不利影响程度。
识别风险评估模块对近期语音识别的语音转化的响应情况进行分析,评估提问语音任务被识别错误的风险程度,将提问语音任务被识别错误的风险程度分为高风险和低风险。
在提问语音任务被识别错误的风险程度为低风险时,提问有效评估模块将提问语音任务对应的提问者的表达清晰程度、提问者的提问环境对提问语音任务识别的不利影响程度以及提问语音任务被识别错误的风险程度进行综合分析,判断提问语音任务是否有效。
在提问语音任务有效时,答案生成判断模块判断提问语音任务对应的内容是否与社会救助问答知识库匹配,根据匹配情况判断是否切换人工服务。
在提问语音任务无效时,根据提问者的提问语音任务无效的连续情况,判断是否切换人工服务。
提问语音采集模块可以通过麦克风对提问者的语音进行实时采集。
麦克风可以实时获取社会救助问答系统中对需要社会救助进行提问的提问者的以语音形式表达的提问。
根据提问者语音生成提问语音任务,提问语音任务为一段提问对应的语音,提问语音任务是指提问者通过语音方式提出问题或请求的任务;它通常包含提问者在语音中表达的信息,在生成提问语音任务后,将提问语音任务实时发送至提问准确判断模块。
根据提问者的语音自动生成提问语音任务在现有技术中已经较为成熟,例如可以通过以下方法进行生成提问语音任务,具体为:
对提问者录制的语音信号进行分析,可以使用音频处理技术。
通过检测语音信号中的停顿,确定停顿的位置。停顿可以是语音单元之间的自然间隙,通常在提问者思考或组织语言的时候出现。
设置停顿的阈值,根据停顿的持续时间或语音信号的特征来判断何时认为停顿开始或结束,这个阈值可以根据实际场景和任务需求进行调整。
在停顿的位置划分语音单元,形成具有连贯性的语音单元。这可以通过在停顿处进行语音分割来实现,语音单元即为提问语音任务。
社会救助问答系统可以基于提问者以语音形式表达的提问,回答与社会救助相关的各种问题,提供提问者所需的信息和帮助,以下是社会救助问答系统能够回答的一些问题:
社会救助政策和规定:提供关于各种社会救助政策和规定的详细信息,包括资格要求、申请流程、福利项目等。
申请流程指导:引导提问者完成社会救助项目的申请流程,包括所需文件、提交方式、时间表等。
资格确认:帮助提问者了解他们是否符合特定社会救助项目的资格要求,并提供相关的资格确认信息。
福利项目介绍:提供关于各种社会救助福利项目的详细介绍,包括住房补贴、医疗援助、食品券等。
法律咨询:回答关于社会救助法规的法律问题,解释相关法规条款和政策解读。
服务地点查询:提供社会救助服务的具体地点、联系方式和办公时间等信息。
常见问题解答:提供有关社会救助的常见问题解答,以便提问者更好地理解相关政策和程序。
目标是帮助提问者更轻松地理解和参与社会救助服务。
提问准确判断模块在接收提问语音任务后,对提问语音任务的连贯性进行分析,具体为:
获取提问语音任务对应的字,获取提问语音任务中每个字对应的时间戳,按照时间顺序将提问语音任务对应的字进行排列,计算每两个相邻的字对应的时间间隔,例如提问语音任务对应的字的数量为10个,则每两个相邻的字对应的时间间隔的数量为(10-1)个。
将每两个相邻的字对应的时间间隔标记为提问字间距。
当提问字间距较小,语音识别的难度越大,识别错误的情况越容易发生,因为当语音信号中相邻字之间的停顿很短或不存在时,语音识别系统可能难以确定何时一个字的发音结束,下一个字的发音开始,这种连续性可能导致模型在解码时混淆相邻的语音单元,从而引发识别错误。
当提问字间距较大,可能导致语音信号中的停顿过于明显,识别系统可能在停顿处错误地将语音信号分割成不同的语音单元,也可能引发错误。
设定提问字间距范围,提问字间距范围是根据提问字间距的大小以及语音识别的准确性的要求标准进行设定,此处不再赘述。
当提问字间距不在提问字间距范围内,则说明提问字间距较小或提问字间距较大,都不利于对提问语音任务的语音识别。
将提问语音任务中不在提问字间距范围的提问字间距标记为不佳字间距。
获取提问语音任务中不佳字间距的数量,将提问语音任务中不佳字间距的数量与提问语音任务中提问字间距的数量的比值标记为不佳间距比,将不佳间距比标记为。
获取提问语音任务对应的时间长度,获取提问语音任务对应的字的数量,将提问语音任务对应的字的数量与提问语音任务对应的时间长度的比值标记为任务语速。
计算任务语速偏差值,其表达式为:;其中,/>分别为任务语速偏差值、任务语速以及标准语速。
标准语速是根据语音识别中对语音的最佳的识别语速进行设定的,此处不再赘述。
其中,提问语音任务对应的时间长度可以通过提问语音任务的语音信号的时域分析得到,或者通过语音识别过程中的时间戳信息计算。
将不佳间距比和任务语速偏差值分别赋予权重系数,将不佳间距比和任务语速偏差值进行加权求和,计算提问语音清晰指数,其表达式为:;其中,/>为提问语音清晰指数,/>分别为不佳间距比和任务语速偏差值的权重系数,/>均大于0。
提问语音清晰指数越大,提问语音任务对应的提问者的表达清晰程度越低,越容易出现对提问语音任务的内容识别错误的情况。
提问准确判断模块在接收提问语音任务后,对提问语音任务的声音来源的信息熵进行分析,具体为:
将提问语音任务均等分为多个时间窗口。
获取每个时间窗口的声音来源,其中,声音来源包括提问者的语音、背景噪音(周围环境中的各种噪音,如人群嘈杂声、交通噪音、风声等)、其他人的语音、设备或机器噪音、环境声音(比如雨声、风声等环境自然音)以及口头指令声音(与提问任务无关的口头指令或其他声音输入)等。
对每个时间窗口的声音来源分析,计算每个声音来源的能量、频谱分布、出现频率等特征。
分析每个时间窗口的信息熵:对于每个时间窗口,根据时间窗口对应的声音来源的分析结果使用信息熵计算窗口声音来源混乱值,其表达式为:;其中,/>为窗口声音来源混乱值,/>为时间窗口中编号为/>的声音来源的占比;/>为时间窗口中声音来源的数量,/>,/>均为大于1的整数。
窗口声音来源混乱值越大,表示该时间窗口中的声音来源越多或越不确定,对提问语音任务的语音识别可能造成的干扰也越大,识别的准确性越低。
设定窗口声音来源混乱阈值,窗口声音来源混乱阈值是根据对该时间窗口内声音来源的复杂程度的要求标准等其他实际情况进行设定,此处不再赘述。
窗口声音来源混乱值大于窗口声音来源混乱阈值,说明该时间窗口内声音来源越多或越不确定的程度较大,语音识别可能造成干扰。
将窗口声音来源混乱值大于窗口声音来源混乱阈值的时间窗口标记为混乱时间窗口,计算每个混乱时间窗口的混乱超出值,将提问语音任务内所有混乱时间窗口的混乱超出值的相加值与提问语音任务内对应的时间长度的比值标记为声音来源混乱指数,将声音来源混乱指数标记为。
混乱超出值为混乱时间窗口对应的窗口声音来源混乱值与窗口声音来源混乱阈值的差值。
声音来源混乱指数越大,提问者的提问环境对提问语音任务识别的不利影响程度越大,提问语音任务的语音识别可能造成的干扰也越大,语音识别的准确性越低。
其中,声音来源的占比可以通过对声音信号的分析来估计,具体来说,有多种方法可以用来计算每个声音来源的概率或占比,具体可以为:
频域分析:使用频谱分析方法,可以将声音信号分解成不同频率的成分。每个频率成分的能量或功率可以用来估计对应声音来源的贡献,进而计算概率。
时域分析:在时域上,声音信号的波形可以被分解成不同的成分,通过对波形的振幅、周期性等特征进行分析,可以推断各个声音来源的相对占比。
识别风险评估模块对近期语音识别的语音转化的响应情况进行分析,评估对提问语音任务识别错误的风险程度;
建立提问语音任务集合,提问语音任务集合内包括最靠近实时时间的多次的提问语音任务,其中,获取的最靠近实时时间的提问语音任务的数量是根据实际需求进行设定。
获取每个提问语音任务对应的任务处理时间,提问语音任务对应的任务处理时间为生成提问语音任务的时间点到提问语音任务转化为问题(即提问语音任务被转化为文本)的时间点之间的时间间隔,若提问语音任务对应的任务处理时间较大,对提问语音任务的准确性也有较大影响,具体为:
如果语音转换的延迟较大,系统在接收到语音信号后,需要一定的时间来进行转换处理,然后再传递给语音识别模块。因为系统不能及时理解和响应用户的语音输入。导致语音识别的准确性下降。
较长的处理时间可能导致提问者在等待过程中忘记了他们之前说过的内容或问题的上下文,这可能使系统在转化语音为文本时更难理解用户的意图,从而降低准确性。
在某些实时场景中,语音任务的准确性可能受到环境的动态变化影响。如果处理时间过长,系统可能不能及时适应这些变化,导致准确性下降。
如果用户与语音系统之间的交互涉及多轮对话,较长的处理时间可能会破坏任务的流畅性,从而造成语音识别的准确性下降。
如果任务处理时间过长,用户在语音任务发起和结果返回之间的时间内,可能会发生环境变化,例如,用户所在的环境可能由于噪音、语音质量等原因而发生变化,这可能对语音识别的准确性的不确定性产生一定影响。长时间的任务处理可能导致系统资源负载增加,这可能对语音识别的实时性和准确性产生一些影响。
获取提问语音任务集合内提问语音任务对应的任务处理时间,获取提问语音任务集合内提问语音任务对应的任务处理时间小于等于处理时间阈值的提问语音任务的数量,将提问语音任务集合内提问语音任务对应的任务处理时间小于等于处理时间阈值的提问语音任务的数量与提问语音任务集合内提问语音任务的数量的比值标记为识别延迟健康指数,将识别延迟健康指数标记为。
处理时间阈值是根据提问语音任务对应的任务处理时间的大小以及对提问语音任务对应的任务处理时间的要求标准等其他实际情况进行设定,此处不再赘述。
识别延迟健康指数越小,近期提问语音任务的处理效率越差,未来对提问语音任务对应的语音的识别的准确性的风险程度越大。
设定识别延迟健康指数阈值,将识别延迟健康指数与识别延迟健康指数阈值进行比较,将提问语音任务被识别错误的风险程度分为高风险和低风险:
当识别延迟健康指数小于识别延迟健康指数阈值,生成高风险信号。
当识别延迟健康指数大于等于识别延迟健康指数阈值,生成低风险信号。
当生成高风险信号,此时提问语音任务被识别错误的风险程度分为高风险,说明提问语音任务集合内提问语音任务对应的任务处理时间存在较大的程度较大,近期对提问语音任务的处理的效率较差,此时根据生成高风险信号,安排维修人员对设备进行检修,这里的设备可以为用于社会救助问答的设备,可以从以下方面进行检修:
硬件检查:确保设备的硬件部分正常运作。检查麦克风、扬声器、处理器、存储设备等,确保它们没有损坏或者性能下降。
网络连接:检查设备的网络连接,确保网络稳定且能够及时传输语音数据。有时候,网络问题可能导致任务处理时间延迟。
软件更新:确保设备上运行的软件是最新版本。软件更新可能包含性能优化和bug修复,有助于提高系统的整体效率。
语音处理算法优化:优化用于语音处理的算法,以提高处理速度。这可能涉及到对语音转换、语音识别等算法的调整和改进。
当生成低风险信号,此时提问语音任务被识别错误的风险程度分为低风险,说明提问语音任务集合内提问语音任务对应的任务处理时间存在较大的程度较小或没有。
其中,识别延迟健康指数阈值是根据识别延迟健康指数以及对提问语音任务集合内的提问语音任务的处理的速度的要求标准等其他实际情况进行设定,此处不再赘述。
提问有效评估模块将提问语音任务对应的提问者的表达清晰程度、提问者的提问环境对提问语音任务识别的不利影响程度以及提问语音任务被识别错误的风险程度进行综合分析,判断提问语音任务的有效性,具体为:
当生成低风险信号,提问有效评估模块将提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数进行归一化处理,将归一化处理后的提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数分别赋予预设比例系数,计算得到任务有效评估系数,其中,任务有效评估系数的表达式可为:;其中,/>为任务有效评估系数,/>分别为提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数的预设比例系数,且/>均大于0,/>小于0。
任务有效评估系数越大,提问语音任务的有效性越差。
设定任务有效评估阈值,将任务有效评估系数与任务有效评估阈值进行比较:
当任务有效评估系数大于任务有效评估阈值,将该提问语音任务标记为无效提问,此时提问语音任务的有效性较低,该提问语音任务的准确性较低,可能无法准确的识别提问者的提问或存在较大概率无法准确理解提问者的提问意图。
当任务有效评估系数小于等于任务有效评估阈值,将该提问语音任务标记为有效提问,此时提问语音任务的有效性正常,该提问语音任务的准确性较高,可以准确的识别提问者的提问。
其中,任务有效评估阈值是根据任务有效评估系数的大小以及实际中对语音任务的识别的准确性的要求标准等其他实际情况进行设定的,此处不再赘述。
当该提问语音任务被标记为有效提问,答案生成判断模块基于语音识别技术获取提问语音任务对应的文本内容,并将提问语音任务对应的文本内容在社会救助问答知识库中检索,若检索成功,生成答案输出信号,则说明提问语音任务对应的内容与社会救助问答知识库匹配,根据生成的答案输出信号,生成提问语音任务对应的回答,回答可以基于语音播报、文字以及图像等方式进行展示。
若检索不成功,生成人工转接信号,则说明提问语音任务对应的内容与社会救助问答知识库不匹配,此时可以连接人工服务,对提问者进行社会救助相关问题的回答。
当该提问语音任务被标记为无效提问,生成重新提问信号,此时提示提问者重新提问,当提问者被标记为无效提问的数量连续达到失败提问次数阈值,生成人工服务信号,此时可以连接人工服务,通过服务人员更好地对提问者进行社会救助相关问题的回答。
失败提问次数阈值是根据实际情况设定,例如可以设置为5次。
其中,社会救助问答知识库是一个包含有关社会救助相关问题和答案的数据库或知识存储系统。这个知识库可能包括各种社会救助领域的信息,例如政府福利政策、社会保障制度、医疗援助、就业援助等。这个知识库的目的是为系统提供一个基础,使其能够理解和回答用户关于社会救助的问题。确保社会救助问答知识库中的信息保持及时性。实时更新政策和法规变化,以确保系统提供的答案是最新的和准确的。
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络,或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD),或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件,或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其他的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,既可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种适用于社会救助的问答系统,其特征在于,包括提问信息接入模块、提问准确判断模块、识别风险评估模块、提问有效评估模块以及答案生成判断模块;
提问语音采集模块对提问者语音进行实时采集,根据提问者语音生成提问语音任务,并将提问语音任务实时发送至提问准确判断模块;
提问准确判断模块在接收提问语音任务后,通过对提问语音任务的连贯性进行分析,评估提问语音任务对应的提问者的表达清晰程度;通过对提问语音任务的声音来源的信息熵进行分析,评估提问者的提问环境对提问语音任务识别的不利影响程度;
识别风险评估模块对近期语音识别的语音转化的响应情况进行分析,评估提问语音任务被识别错误的风险程度,将提问语音任务被识别错误的风险程度分为高风险和低风险;
在提问语音任务被识别错误的风险程度为低风险时,提问有效评估模块将提问语音任务对应的提问者的表达清晰程度、提问者的提问环境对提问语音任务识别的不利影响程度以及提问语音任务被识别错误的风险程度进行综合分析,判断提问语音任务是否有效;
在提问语音任务有效时,答案生成判断模块判断提问语音任务对应的内容是否与社会救助问答知识库匹配,根据匹配情况判断是否切换人工服务;
在提问语音任务无效时,根据提问者的提问语音任务无效的连续情况,判断是否切换人工服务。
2.根据权利要求1所述的一种适用于社会救助的问答系统,其特征在于:对提问语音任务的连贯性进行分析,具体为:
获取提问语音任务对应的字,获取提问语音任务中每个字对应的时间戳,按照时间顺序将提问语音任务对应的字进行排列,计算每两个相邻的字对应的时间间隔,将每两个相邻的字对应的时间间隔标记为提问字间距;
设定提问字间距范围,将提问语音任务中不在提问字间距范围的提问字间距标记为不佳字间距;
获取提问语音任务中不佳字间距的数量,将提问语音任务中不佳字间距的数量与提问语音任务中提问字间距的数量的比值标记为不佳间距比;
获取提问语音任务对应的时间长度,获取提问语音任务对应的字的数量,将提问语音任务对应的字的数量与提问语音任务对应的时间长度的比值标记为任务语速;
计算任务语速偏差值,其表达式为:;其中,/>分别为任务语速偏差值、任务语速以及标准语速;
将不佳间距比和任务语速偏差值分别赋予权重系数,将不佳间距比和任务语速偏差值进行加权求和,计算提问语音清晰指数。
3.根据权利要求2所述的一种适用于社会救助的问答系统,其特征在于:对提问语音任务的声音来源的信息熵进行分析,具体为:
将提问语音任务均等分为多个时间窗口,获取每个时间窗口的声音来源,对每个时间窗口的声音来源分析;
根据时间窗口对应的声音来源的分析结果使用信息熵计算窗口声音来源混乱值,其表达式为:;其中,/>为窗口声音来源混乱值,/>为时间窗口中编号为的声音来源的占比;/>为时间窗口中声音来源的数量,/>,/>均为大于1的整数;
设定窗口声音来源混乱阈值;将窗口声音来源混乱值大于窗口声音来源混乱阈值的时间窗口标记为混乱时间窗口,计算每个混乱时间窗口的混乱超出值,将提问语音任务内所有混乱时间窗口的混乱超出值的相加值与提问语音任务内对应的时间长度的比值标记为声音来源混乱指数。
4.根据权利要求3所述的一种适用于社会救助的问答系统,其特征在于:混乱超出值为混乱时间窗口对应的窗口声音来源混乱值与窗口声音来源混乱阈值的差值。
5.根据权利要求4所述的一种适用于社会救助的问答系统,其特征在于:对近期语音识别的语音转化的响应情况进行分析,具体为;建立提问语音任务集合,提问语音任务集合内包括最靠近实时时间的多次的提问语音任务;
获取提问语音任务集合内提问语音任务对应的任务处理时间,获取提问语音任务集合内提问语音任务对应的任务处理时间小于等于处理时间阈值的提问语音任务的数量,将提问语音任务集合内提问语音任务对应的任务处理时间小于等于处理时间阈值的提问语音任务的数量与提问语音任务集合内提问语音任务的数量的比值标记为识别延迟健康指数;
设定识别延迟健康指数阈值,将识别延迟健康指数与识别延迟健康指数阈值进行比较:
当识别延迟健康指数小于识别延迟健康指数阈值,生成高风险信号;
当识别延迟健康指数大于等于识别延迟健康指数阈值,生成低风险信号。
6.根据权利要求5所述的一种适用于社会救助的问答系统,其特征在于:当生成低风险信号,提问有效评估模块将提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数进行归一化处理,将归一化处理后的提问语音清晰指数、声音来源混乱指数以及识别延迟健康指数分别赋予预设比例系数,计算得到任务有效评估系数;
设定任务有效评估阈值,将任务有效评估系数与任务有效评估阈值进行比较:
当任务有效评估系数大于任务有效评估阈值,将提问语音任务标记为无效提问;
当任务有效评估系数小于等于任务有效评估阈值,将提问语音任务标记为有效提问。
7.根据权利要求6所述的一种适用于社会救助的问答系统,其特征在于:当提问语音任务被标记为有效提问,答案生成判断模块基于语音识别技术获取提问语音任务对应的文本内容,并将提问语音任务对应的文本内容在社会救助问答知识库中检索,若检索成功,生成答案输出信号;若检索不成功,生成人工转接信号;
当该提问语音任务被标记为无效提问,生成重新提问信号,当提问者被标记为无效提问的数量连续达到失败提问次数阈值,生成人工服务信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410176435.5A CN117725187B (zh) | 2024-02-08 | 2024-02-08 | 一种适用于社会救助的问答系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410176435.5A CN117725187B (zh) | 2024-02-08 | 2024-02-08 | 一种适用于社会救助的问答系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117725187A true CN117725187A (zh) | 2024-03-19 |
CN117725187B CN117725187B (zh) | 2024-04-30 |
Family
ID=90207391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410176435.5A Active CN117725187B (zh) | 2024-02-08 | 2024-02-08 | 一种适用于社会救助的问答系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725187B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080096225A (ko) * | 2007-04-27 | 2008-10-30 | (주)이즈메이커 | 답변 가능 지수를 고려하여 실시간 답변 서비스를 제공하는방법 및 장치 |
US20140278400A1 (en) * | 2013-03-12 | 2014-09-18 | Microsoft Corporation | Search Results Using Intonation Nuances |
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
US20200257861A1 (en) * | 2019-02-13 | 2020-08-13 | Oracle International Corporation | Chatbot conducting a virtual social dialogue |
CN112395404A (zh) * | 2020-12-05 | 2021-02-23 | 中国南方电网有限责任公司 | 一种应用于电力调度的语音关键信息提取方法 |
WO2022007846A1 (zh) * | 2020-07-08 | 2022-01-13 | 华为技术有限公司 | 语音增强方法、设备、系统以及存储介质 |
CN114238715A (zh) * | 2021-12-03 | 2022-03-25 | 广西斯达数字科技有限公司 | 基于社会救助的问答系统、构建方法、计算机设备及介质 |
US20220237232A1 (en) * | 2021-01-28 | 2022-07-28 | International Business Machines Corporation | Conversation based data analysis recommendations |
CN115206308A (zh) * | 2021-04-08 | 2022-10-18 | 华为技术有限公司 | 一种人机交互的方法及电子设备 |
CN116415597A (zh) * | 2023-03-06 | 2023-07-11 | 阿里巴巴(中国)有限公司 | 语音翻译、同声传译方法 |
CN116821304A (zh) * | 2023-07-07 | 2023-09-29 | 国网青海省电力公司信息通信公司 | 基于大数据的供电所知识智能问答系统 |
CN117238321A (zh) * | 2023-11-07 | 2023-12-15 | 深圳市妙语教育科技有限公司 | 语音综合评估方法、装置、设备及存储介质 |
-
2024
- 2024-02-08 CN CN202410176435.5A patent/CN117725187B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080096225A (ko) * | 2007-04-27 | 2008-10-30 | (주)이즈메이커 | 답변 가능 지수를 고려하여 실시간 답변 서비스를 제공하는방법 및 장치 |
US20140278400A1 (en) * | 2013-03-12 | 2014-09-18 | Microsoft Corporation | Search Results Using Intonation Nuances |
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
US20200257861A1 (en) * | 2019-02-13 | 2020-08-13 | Oracle International Corporation | Chatbot conducting a virtual social dialogue |
WO2022007846A1 (zh) * | 2020-07-08 | 2022-01-13 | 华为技术有限公司 | 语音增强方法、设备、系统以及存储介质 |
CN112395404A (zh) * | 2020-12-05 | 2021-02-23 | 中国南方电网有限责任公司 | 一种应用于电力调度的语音关键信息提取方法 |
US20220237232A1 (en) * | 2021-01-28 | 2022-07-28 | International Business Machines Corporation | Conversation based data analysis recommendations |
CN115206308A (zh) * | 2021-04-08 | 2022-10-18 | 华为技术有限公司 | 一种人机交互的方法及电子设备 |
CN114238715A (zh) * | 2021-12-03 | 2022-03-25 | 广西斯达数字科技有限公司 | 基于社会救助的问答系统、构建方法、计算机设备及介质 |
CN116415597A (zh) * | 2023-03-06 | 2023-07-11 | 阿里巴巴(中国)有限公司 | 语音翻译、同声传译方法 |
CN116821304A (zh) * | 2023-07-07 | 2023-09-29 | 国网青海省电力公司信息通信公司 | 基于大数据的供电所知识智能问答系统 |
CN117238321A (zh) * | 2023-11-07 | 2023-12-15 | 深圳市妙语教育科技有限公司 | 语音综合评估方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
郑丹丹;秦会斌;: "复杂环境中多音节语音自适应端点检测的实现", 计算机仿真, no. 07, 15 July 2018 (2018-07-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117725187B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Van Kuyk et al. | An evaluation of intrusive instrumental intelligibility metrics | |
EP3160334B1 (en) | Speech-based assessment of a patient's state-of-mind | |
US20130144621A1 (en) | Systems and Methods for Assessment of Non-Native Spontaneous Speech | |
US8954320B2 (en) | System and method for noise reduction in processing speech signals by targeting speech and disregarding noise | |
US20060253285A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
US9652999B2 (en) | Computer-implemented systems and methods for estimating word accuracy for automatic speech recognition | |
CN107919137A (zh) | 远程审批方法、装置、设备及可读存储介质 | |
CN103559892A (zh) | 口语评测方法及系统 | |
CN108597538B (zh) | 语音合成系统的评测方法和系统 | |
Morrison | The impact in forensic voice comparison of lack of calibration and of mismatched conditions between the known-speaker recording and the relevant-population sample recordings | |
Bronkhorst et al. | Evaluation of context effects in sentence recognition | |
Zouhir et al. | Feature Extraction Method for Improving Speech Recognition in Noisy Environments. | |
CN116821304B (zh) | 基于大数据的供电所知识智能问答系统 | |
CN117725187B (zh) | 一种适用于社会救助的问答系统 | |
Close et al. | Non-intrusive speech intelligibility estimated by metric prediction for hearing impaired individuals for the clarity prediction challenge 1 | |
KR20200001814A (ko) | 크라우드전사장치 및 그 동작 방법 | |
CN115240696B (zh) | 一种语音识别方法及可读存储介质 | |
Wang | Detecting pronunciation errors in spoken English tests based on multifeature fusion algorithm | |
Loukina et al. | Use of automated scoring in spoken language assessments for test takers with speech impairments | |
Shirali-Shahreza et al. | Spoken captcha: A captcha system for blind users | |
Jing et al. | The speech evaluation method of English phoneme mobile learning system | |
Beerends et al. | Measuring the quality of audio devices | |
Luo | The Improving Effect of Intelligent Speech Recognition System on English Learning | |
Marshall et al. | Metrics including time-varying loudness models to assess the impact of sonic booms and other transient sounds | |
CN116434733B (zh) | 一种关于智能安全帽的ai语音交互处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |